离线轻量大模型,Ollama部署到docker方法

news/2025/10/3 18:58:44/文章来源:https://www.cnblogs.com/lidar/p/19124873

来自豆包

将Ollama部署到Docker的步骤如下:

一、安装Docker环境

  1. 启用系统功能(Windows系统):
    • 打开“控制面板” → “程序与功能” → “启用或关闭Windows功能”。
    • 勾选 Hyper-V、虚拟机平台、Linux子系统(WSL)。
    • 重启电脑使配置生效。
  2. 安装Docker Desktop:
    • 访问 Docker官网,下载并安装Docker Desktop。
    • 启动Docker Desktop,确保左下角状态显示为绿色“Running”。
  3. 验证安装:
    • 打开终端(PowerShell或CMD),输入命令:
      bash
      docker --version
    • 若显示版本号(如Docker version 28.0.0),则安装成功。

二、拉取Ollama Docker镜像

  1. 下载镜像:
    • 在终端执行命令,从Docker Hub拉取Ollama官方镜像:
      bash
      docker pull ollama/ollama
    • 若需指定版本(如旧版),可在镜像名后添加标签(如ollama/ollama:v0.1.0)。
  2. 验证镜像:
    • 输入命令查看已下载的镜像:
      bash
      docker images
    • 确认列表中包含ollama/ollama

三、运行Ollama容器

  1. 基础运行命令(仅CPU模式):
    • 启动容器并映射端口(默认11434),挂载数据卷以持久化存储模型:
      bash
      docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
      • -d:后台运行容器。
      • -v ollama:/root/.ollama:将宿主机的ollama命名卷挂载到容器内,避免模型数据丢失。
      • -p 11434:11434:将容器端口映射到宿主机,通过http://localhost:11434访问服务。
      • --name ollama:指定容器名称。
  2. GPU加速模式:
    • NVIDIA GPU:需安装NVIDIA Container Toolkit,运行命令:
      bash
      docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama
      • --gpus=all:允许容器访问宿主机所有NVIDIA GPU。
    • AMD GPU:需使用支持ROCm的Ollama镜像,运行命令:
      bash
      docker run -d --device /dev/kfd --device /dev/dri -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama:rocm
      • --device /dev/kfd --device /dev/dri:映射AMD GPU所需设备文件。

四、验证Ollama服务

  1. 检查容器状态:
    • 输入命令查看容器是否运行:
      bash
      docker ps
    • 确认列表中包含ollama容器,且状态为Up
  2. 访问服务:
    • 打开浏览器,访问http://localhost:11434
    • 若显示“Ollama is running”,则部署成功。

五、管理模型

  1. 拉取模型:
    • 进入容器交互模式:
      bash
      docker exec -it ollama bash
    • 在容器内拉取模型(如llama3):
      bash
      ollama pull llama3
    • 或直接在宿主机执行:
      bash
      docker exec -it ollama ollama pull llama3
  2. 运行模型:
    • 在容器内运行模型:
      bash
      ollama run llama3
    • 或通过API调用(需配置外部工具):
      python
      import requests
      response = requests.post("http://localhost:11434/api/generate", json={"model": "llama3", "prompt": "Hello"})
      print(response.json())

六、高级配置(可选)

  1. 自定义模型:
    • 通过Modelfile定义模型参数(如量化、提示词),示例:
      dockerfile
      FROM llama3
      PARAMETER temperature 0.8
      SYSTEM "你是一个中文助手,回答需简洁专业。"
    • 创建自定义模型:
      bash
      ollama create my_model -f Modelfile
  2. 公网访问:
    • 使用内网穿透工具(如cpolar)映射端口:
      bash
      cpolar http 11434
    • 生成公网地址后,通过浏览器访问。

常见问题解决

  • GPU支持失败:
    • 确认已安装驱动及CUDA/ROCm工具包。
    • 检查命令是否包含--gpus=all--device参数。
  • 端口冲突:
    • 修改OLLAMA_PORT环境变量或调整Docker映射端口。
  • 模型下载失败:
    • 检查网络代理或更换镜像源。
    • 确保容器内有足够存储空间。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/926212.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

flink执行图 - 教程

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

深入解析:华为Pura 80芯片细节曝光,预示着华为多款新品即将震撼登场!

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

应用拓扑讲义整理 Chapter 6. 单纯复形(Simplicial Complexes)

Chapter 6. 单纯复形 6.1 单纯复形的基本概念 6.1.1 仿射空间 Definition 6.1(仿射空间)仿射空间是一个三元组 \((E, \overrightarrow E, +)\),其中 \(E\) 是点集,\(\overrightarrow E\) 是由自由向量或转移组成的…

完整教程:华为麒麟9010、9020、9030、9040系列芯片的性能参数及其与高通芯片的对比

完整教程:华为麒麟9010、9020、9030、9040系列芯片的性能参数及其与高通芯片的对比pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; fo…

AQS(ReentrantLock)源码浅析

管程 — Java同步的设计思想 管程:指的是管理共享变量以及对共享变量的操作过程,让他们支持并发。 互斥:同一时刻只允许一个线程访问共享资源; 同步:线程之间如何通信、协作。 MESA模型 在管程的发展史上,先后出…

做网站app价格多少钱网站首页布局风格

编程笔记 html5&css&js 017 HTML样式 一、HTML样式二、CSS3小结 HTML样式是用来控制网页元素外观的一组属性和值。 一、HTML样式 可以通过以下几种方式来为HTML元素添加样式: 内联样式:直接在HTML元素的style属性中添加样式。例如:…

完整教程:【数据结构】快速排序与归并排序的实现

完整教程:【数据结构】快速排序与归并排序的实现2025-10-03 18:42 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; displa…

05. 事件处理

一、信号与槽在 QML 中,信号与槽机制是对象间通信的一种重要方式。它允许对象在其状态改变或发生特定事件时通知其他对象,并触发相应的处理函数。信号 是对象发出的通知,表明某个事件已经发生。槽 (信号处理器)是…

网站流量分析的指标有哪些wordpress京东主题

文章目录 第6章 逻辑斯谛回归与最大熵模型6.1 逻辑斯谛回归模型6.1.1 逻辑斯谛分布6.1.2 二项逻辑斯谛回归模型6.1.3 模型参数估计6.1.4 多项逻辑斯谛回归 《统计学习方法:李航》笔记 从原理到实现(基于python)-- 第3章 k邻近邻法 《统计学习…

总结问题2 软工10.3

使用纯水机发生器公式进行不断的遍历, XN是上一个种子,它遍历出XN加1就是下一个种子。Jdk SIMULATOR outer point ln的方法中,它是利用了很多的重载,来实现不同的功能。关于4则运算,答题框的生成,可以以答题框为…

如何选择网站建设流程网站展示效果图

我想用来自Java的参数调用python程序。但是我的输出是空白。代码在这里。 Python代码在这里: import sys print(sys.argv[1]) Java代码在这里: public class PrintNumber{ public static void main(String[] args){ Process proc; try { proc Runtime.g…

BPL包无法调试的问题

转 由于系统结构是Host主程序动态加载BPL包的模式。所以用到了Package的调试,但无论如何有一个包就是无法调试(加断点不起作用)。经过N久的查找,发现: 1.包Package在编译,生成的时候会自动产生DCP和BPL文件,缺省…

学院网站群建设的目标网站开发背景和意义

国产大模型开源一哥再登场,最强双语LLM「全家桶」级开源!340亿参数超越Llama2-70B 为什么说大模型训练很难? - 知乎 GitHub - jeinlee1991/chinese-llm-benchmark: 中文大模型能力评测榜单:覆盖百度文心一言、chatgpt、阿里通义千…

如何在国内做网站手机网站建设选 朗创营销

图为RUST吉祥物 大家好,我是get_local_info作者带剑书生,这里用一篇文章讲解get_local_info是怎样获得杀毒软件的病毒库时间的。 首先,先要了解get_local_info是什么? get_local_info是一个获取linux系统信息的rust三方库,并提供一些常用功能,目前版本0.2.4。详细介绍地址…

江苏省建设工程竣工备案网站wordpress发号系统

目录 1、环境 1.1 操作系统初始化配置 1.2 部署 docker引擎 1.3 部署 etcd 集群 1.4 准备签发证书环境 1.5 部署 Master 组件 1.6 部署 Worker Node 组件 1.7 部署 CNI 网络组件 1.7.1 部署 flannel 1.7.2 部署 Calico 1.7.3 node02 节点部署 1.7.4 部署 CoreDNS 1…

信息科学与数据分析:真正的区别是什么?

信息科学与数据分析:真正的区别是什么?pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "M…

awk命令一文速通

awk命令一文速通1. awk简介和基本语法格式 Awk自动地搜索输入文件,并把每一个输入行切分成字段。许多工作都是自动完成的,例如读取每个输入行、字段分割、存储管理、初始化等。在AWK中不需声明变量数据类型,它内置字…

小程序开发:开启定制化custom-tab-bar但不生效疑问,以及使用NutUI-React Taro的安装和使用

小程序开发:开启定制化custom-tab-bar但不生效疑问,以及使用NutUI-React Taro的安装和使用2025-10-03 18:28 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !import…

做影视外包的网站优化方案怎么写

长期佩戴耳机可能会出现听力下降、耳道感染等危害。 听力下降:长时间戴耳机可能会导致耳道内的声音过大,容易对耳膜造成一定的刺激,容易出现听力下降的情况。 耳道感染:长时间戴耳机,耳道长期处于封闭潮湿的情况下&a…

免费com域名网站湖北省勘察设计协会网站

我们新项目硬件设计上使用gpio口做按键,所以我就需要搞定这个驱动,本来想自己写一个gpio口的按键驱动,然后看了下内核下面的代码,已经有现成的了。Linux内核下游很多很多的现成驱动,只要你想得到的,基本都是…