Ollama 学习与使用指南 (Windows Linux 版)

news/2026/1/23 22:22:20/文章来源:https://www.cnblogs.com/2678066103hs/p/19524179

什么是 Ollama?

Ollama 是一个开源工具,让你能够轻松地在本地(Windows, Linux)下载、运行和管理大型语言模型(LLMs),如 Llama 3, Qwen (通义千问), Mistral 等。它将模型权重、运行环境自动封装,让你像使用 Docker 一样简单地操作 AI 模型。


快速安装

Windows 安装

Ollama 已提供原生 Windows 安装包(支持 Windows 10 及以上版本)。

  • 下载:访问官网下载链接 Download Ollama for Windows。

  • 安装:运行 .exe 文件,按照提示完成安装。

  • 验证:打开 PowerShell 或命令提示符(CMD),输入ollama

    如果显示帮助信息,说明安装成功。

    • 注意:安装后 Ollama 会作为后台服务自动运行,你会在任务栏右下角看到一个小羊驼图标。

Linux 安装

Linux 版本支持最好,且非常容易配置 GPU 加速。

  • 一键安装脚本(推荐):
curl -fsSL https://ollama.com/install.sh | sh

显卡驱动注意

  • NVIDIA:请确保已安装 CUDA 驱动。
  • AMD:请确保已安装 ROCm 驱动。
  • Ollama 会自动检测硬件,如果检测到 GPU 驱动,会自动启用 GPU 加速,无需额外配置。

验证安装

ollama -v

基础命令 (通用)

Windows (PowerShell/CMD) 和 Linux 终端下的命令完全一致。

场景 命令 示例
下载并聊天 ollama run <模型名> ollama run llama3 (如果模型不在,会自动下载)
仅下载模型 ollama pull <模型名> ollama pull qwen2
查看已有模型 ollama list ollama list
删除模型 ollama rm <模型名> ollama rm llama3
复制/重命名 ollama cp <源> <新> ollama cp llama3 my-test-model
查看详细信息 ollama show <模型名> ollama show llama3

常用模型推荐 (Library)

请根据你的电脑配置(主要是显存/内存容量)选择模型:

  • Llama 3 (8B)
    强烈推荐。Meta 最新模型,80 亿参数,性能强劲,8GB 内存即可流畅运行。
    • 命令: ollama run llama3
  • Qwen 2 (7B)
    通义千问,中文理解能力目前开源界顶流。
    • 命令: ollama run qwen2
  • Mistral (7B)
    性能优秀的通用模型。
    • 命令: ollama run mistral
  • Llama 3 (70B) / Qwen 2 (72B): 超大杯模型,需要 40GB+ 显存/内存,普通电脑慎用。


高级配置:如何让局域网访问?

默认情况下,Ollama 只监听本机 (127.0.0.1:11434)。如果你想让局域网内的其他电脑连接你的 Ollama 服务,需要修改监听地址。

Linux 设置方法

Linux 下 Ollama 通常作为 systemd 服务运行。

  1. 编辑服务配置
sudo systemctl edit ollama.service

添加环境变量:在打开的编辑器中添加以下内容:

[Service]
Environment="OLLAMA_HOST=0.0.0.0"

重启服务:保存退出后执行:

sudo systemctl daemon-reload
sudo systemctl restart ollama

Windows 设置方法

Windows 需要设置系统环境变量。

  1. 在任务栏退出 Ollama(右键右下角小羊驼图标 -> Quit)。
  2. 打开 设置 -> 系统 -> 关于 -> 高级系统设置 -> 环境变量
  3. 在“用户变量”或“系统变量”中点击 新建 :
    • 变量名: OLLAMA_HOST
    • 变量值: 0.0.0.0
  4. 点击确定保存。
  5. 重新运行 Ollama 应用程序。

模型定制 (Modelfile)

你可以通过 Modelfile 文件自定义模型的行为(例如设定固定的角色扮演)。

  • 创建文件:新建一个名为 Modelfile 的文本文件(无后缀)。
  • 编写内容
# 基于哪个模型
FROM llama3# 设定参数 (例如创造性)
PARAMETER temperature 0.8# 设定系统提示词 (角色设定)
SYSTEM """
你是一个精通Linux和Windows系统的运维专家。
请用专业、简洁的技术术语回答用户的问题。
"""

构建新模型
在终端中运行:

ollama create sysadmin-bot -f Modelfile

运行

ollama run sysadmin-bot

Python API 调用示例

Ollama 完美兼容 OpenAI 的 API 格式。确保 Ollama 正在后台运行。

安装 OpenAI 库:

pip install openai

代码示例:

from openai import OpenAI# 连接到本地 Ollama
client = OpenAI(base_url='http://localhost:11434/v1',api_key='ollama', # key 随便填
)response = client.chat.completions.create(model='llama3', # 替换为你有的模型messages=[{'role': 'system', 'content': '你是一个 Windows 助手'},{'role': 'user', 'content': '如何查看当前 IP 地址?'}]
)print(response.choices[0].message.content)

Windows 与 Linux 的配置差异与 FAQ

只有 CPU 如何优化速度?

Windows/Linux: Ollama 对 CPU (AVX2 指令集) 有很好的优化。如果内存足够,7B 或 8B 的模型在纯 CPU 上也能跑出行云流水的感觉(约 5-10 tokens/s)。

Linux 下模型存储路径在哪里?怎么改?

  • 默认路径/usr/share/ollama/.ollama/models
  • 修改方法:在 systemctl edit ollama.service 中添加环境变量 Environment="OLLAMA_MODELS=/你的/新/路径"

Windows 下模型存储路径在哪里?怎么改?

  • 默认路径C:\Users\你的用户名\.ollama\models
  • 修改方法:添加环境变量 OLLAMA_MODELS,值为你的新文件夹路径(如 D:\OllamaModels),然后重启 Ollama。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1206719.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Da】交付面板

--本篇导航--导出视频1080P转4K导出导出部分片段导出透明视频打包、工程、数据库导出有色差导出视频1080P转4K导出 需要先把项目设置改成4K分辨率进行采样,之后再交付导出。导出部分片段 可在时间线上选择导出选择的片…

MySQL 数据库与表核心管理

MySQL 数据库与表核心管理指南 作为一名 MySQL 初学者,整理了数据库和数据表的核心管理操作,涵盖创建、修改、约束等核心知识点,适合入门学习和日常查阅。 # 本文核心:MySQL 数据库 / 表的创建、管理、数据类型、约…

提示工程架构师携手Agentic AI,给智能城市来一场大升级

提示工程架构师携手Agentic AI:给智能城市来一场“认知革命”级升级 引言:智能城市的“瓶颈期”与破局点 清晨7点半,你开车经过市中心路口——红绿灯还在按固定时长切换,东向车道已经排起长队,北向却空无一人;与此同时,3公里外的园区PM2.5突然飙升,但环保监测系统还在…

案例证明法--内容学习

前言 将复杂证明分解成案例。 然后分别证明每一个案例 判断见过面和没有见过面 任意给定两个人&#xff0c;他们要么是见过面&#xff0c;要么没有见过面。如果团体中任意两个人都见过面&#xff0c;则成这个团体为俱乐部组。如果团队中任意两个人没有见过&#xff0c;则称为…

LiteFlow规则引擎使用指南

目录 一、核心概念与适用场景 二、快速开始&#xff1a;Spring Boot 集成 三、核心组件与规则语法 四、进阶特性与最佳实践 五、总结&#xff1a;何时考虑使用LiteFlow&#xff1f; LiteFlow是一款国产轻量级规则引擎和流程编排框架&#xff0c;主要用于将复杂的业务逻辑拆…

Redis Cluster 的数据分片机制

Redis Cluster 的数据分片机制&#xff0c;即基于 CRC16 算法 和 16384 个哈希槽&#xff08;Hash Slot&#xff09; 的分配方法。这是 Redis 分布式架构的核心。 核心思想 Redis Cluster 不使用一致性哈希&#xff0c;而是引入了 哈希槽 的概念&#xff0c;将整个数据集逻辑上…

提示工程架构师避坑指南:10个容易忽略的Prompt安全问题,必看!

提示工程架构师避坑指南&#xff1a;10个容易忽略的Prompt安全问题&#xff0c;必看&#xff01; 一、引言&#xff1a;Prompt是AI的“操作手册”&#xff0c;也是安全的“生命线” 在AI时代&#xff0c;**Prompt&#xff08;提示词&#xff09;**是人类与大语言模型&#xf…

多班次制造业薪酬管理难题拆解:国内主流人事系统对比与选型建议

【导读】 在实行两班倒、三班倒乃至连续作业的制造现场&#xff0c;每天都有成千上万条打卡记录、加班单、调班单、计件数据汇总到HR手上&#xff0c;并被要求精准无误地转化为每位员工的工资条——面对这样的多班次薪酬复杂度&#xff0c;仅靠Excel和传统系统显然已经难以支撑…

Java毕设项目:基于springboot的电子产品电子外设销售系统(源码+文档,讲解、调试运行,定制等)

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

【课程设计/毕业设计】基于Springboot架构的宠物咖啡馆平台管理系统【附源码、数据库、万字文档】

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

Java计算机毕设之基于springboot的宠物咖啡平台管理系统基于Springboot架构的宠物咖啡馆平台管理系统(完整前后端代码+说明文档+LW,调试定制等)

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

【毕业设计】基于springboot的电子产品电子外设销售系统(源码+文档+远程调试,全bao定制等)

博主介绍&#xff1a;✌️码农一枚 &#xff0c;专注于大学生项目实战开发、讲解和毕业&#x1f6a2;文撰写修改等。全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围&#xff1a;&am…

【Da】字幕、效果、动画

--本篇导航--加字幕、文字添加效果、转场关键帧及速度曲线安装外部插件加字幕、文字 加文本 可在达芬奇中拖入文本片段,修改和其他软件一样。默认的字幕轨道外部srt文件 可以使用剪映导出srt文件,从外部生成的srt文件…

提示架构师2024最新能力模型:10大核心能力覆盖从Prompt到Agent全流程

2024提示架构师能力模型全解析&#xff1a;从Prompt设计到Agent落地的10大核心能力 标题选项 《2024提示架构师能力模型&#xff1a;从Prompt到Agent的全流程核心能力清单》《成为顶级提示架构师&#xff1a;2024最新10大能力覆盖AI应用全生命周期》《Prompt到Agent通关指南&am…

彼得林奇如何看待公司的股东积极主义

彼得林奇如何看待公司的股东积极主义关键词&#xff1a;彼得林奇、股东积极主义、公司治理、投资策略、股东权益摘要&#xff1a;本文旨在深入探讨投资大师彼得林奇对公司股东积极主义的看法。通过对彼得林奇投资理念和相关观点的分析&#xff0c;阐述股东积极主义在公司治理和…

【2026实测】Windows系统进程优化工具 Process Lasso v17.0.2.20绿色便携版

工具简介&#xff1a;Process Lasso是一款非常好用的性能优化工具软件&#xff0c;有了它你将无需担心电脑系统卡顿、奔溃、蓝屏等现象出现。该软件占用电脑内存小&#xff0c;操作起来简单&#xff0c;用户可以轻松使用&#xff0c;通过这款软件用户可以清楚的看到电脑中运行的…

基于Springboot+Vue的宠物寄养服务系统开题报告

基于SpringbootVue的宠物寄养服务系统开题报告 一、课题研究背景与意义&#xff08;一&#xff09;研究背景 随着居民生活水平提升&#xff0c;养宠人群持续扩大&#xff0c;宠物逐渐成为家庭重要成员。然而&#xff0c;当主人因出差、旅游等原因无法照料宠物时&#xff0c;专业…

AI原生应用开发:偏见缓解的工程化解决方案

AI原生应用开发&#xff1a;偏见缓解的工程化解决方案关键词&#xff1a;AI原生应用开发、偏见缓解、工程化解决方案、数据处理、算法优化摘要&#xff1a;本文聚焦于AI原生应用开发中偏见缓解的工程化解决方案。在AI快速发展的当下&#xff0c;应用中的偏见问题愈发凸显&#…

物理AI的“左右互搏”:世界模型与VLA的闭环进化论

作者 北京五一视界数字孪生科技股份有限公司&#xff08;51WORLD&#xff09;物理AI算法工程师侯涛博士 NVIDIA 创始人兼CEO 黄仁勋在刚刚召开的瑞士达沃斯世界经济论坛2026年会上提到&#xff0c;AI技术正在取得三大突破&#xff1a;从聊天演变到干活的智能体、开源模型降低…

特价股票与公司全球数字创新网络效应的关系探讨

特价股票与公司全球数字创新网络效应的关系探讨 关键词&#xff1a;特价股票、公司全球数字创新、网络效应、股票价值、创新驱动发展 摘要&#xff1a;本文旨在深入探讨特价股票与公司全球数字创新网络效应之间的关系。首先介绍了研究的背景、目的、范围以及预期读者等内容。接…