Ollama本地部署deepseek-r1蒸馏版

Docker安装Ollama

  • 拉取镜像

    docker pull ollama/ollama
    

    image-20250312220212590

  • 启动-使用GPU

    docker run -d --gpus=all -p 11434:11434 --name ollama ollama/ollama
    
    1. docker run : Docker 的核心命令,用于创建并启动一个新的容器。

    2. -d : 后台模式(detached mode),容器将在后台运行,不会阻塞当前终端。

    3. --gpus=all : 启用 NVIDIA GPU 支持,指定使用所有可用的 GPU。

      --gpus:启用 GPU 支持。

      all:使用所有可用的 GPU。也可以指定特定的 GPU,例如 --gpus=gpu-0,gpu-1

    4. -p 11434:11434 : 端口映射,将容器内的端口映射到宿主机的端口。

      格式为 -p <宿主机端口>:<容器端口>

      在此命令中,将容器的 11434 端口映射到宿主机的 11434 端口,可通过 localhost:11434 访问容器内的服务。

    5. --name ollama :为容器指定名称,此处将容器命名为 ollama。如果不指定,Docker 会自动生成一个随机名称。

    6. ollama/ollama :指定使用的 Docker 镜像名称,ollama/ollama 是 Ollama 的官方镜像,从 Docker Hub 拉取,就是我们刚刚拉取的。

  • 启动-使用CPU

    docker run -d  -p 11434:11434 --name ollama ollama/ollama
    

    ​ 下面的是用GPU的image-20250312220301445

  • 查看ollama是否启动成功

    在本机浏览器中输入

    http://127.0.0.1:11434

    显示 Ollama is running 则为启动成功

    image-20250312220421385

  • 查看ollama支持的模型

    https://ollama.com/library

    在这个里面可以看到所有支持的模型,比如搜索deepseek-r1, 如下图,最后一个箭头就是在ollama中运行deepseekr1-1.5b的命令。备注:deepseekr1-1.5b是deepseekr1在qwen2.5-1.5b的蒸馏版本。

    image-20250312220800735

  • 进入ollama容器中

    docker exec -it ollama /bin/bash
    

    image-20250312220938292

  • 下载模型

    使用刚刚复制的命令

    ollama run deepseek-r1:1.5b
    

    如果之前没有,那么第一次使用会先下载模型,等待下载完毕即可使用

    image-20250312221221185

  • 在本地可以使用chatbox,或者openwebui,或者cherrystudio等等接入ollama的模型,下面以cherrystudio为例子示范一下

    image-20250312221437539

    点击管理,会自动识别出已有的大模型(比如我们刚刚下载的deepseekr1-1.5b)

    image-20250312221656010

    检查

    image-20250312221727497

    显示连接成功

    image-20250312221745610

    切换到聊天,新建聊天窗口,切换模型,开始聊天

    image-20250312221920127

    可以看到正常返回了。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/897597.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

41.HarmonyOS NEXT Layout布局组件系统详解(八):自定义样式与类

温馨提示&#xff1a;本篇博客的详细代码已发布到 git : https://gitcode.com/nutpi/HarmonyosNext 可以下载运行哦&#xff01; HarmonyOS NEXT Layout 布局组件系统详解&#xff08;八&#xff09;&#xff1a;自定义样式与类 文章目录 HarmonyOS NEXT Layout 布局组件系统详…

【Go | 从0实现简单分布式缓存】-7:增加etcd和gRPC功能

本文目录 1.序2.引入etcd缓存流程项目结构 3.gocachepb.proto4.服务注册register.go5.服务发现discover.go6.gRPC客户端client.gopeers.goclient.go 7.gRPC服务端实现server.go一些问题缓存获取流程缓存设置流程为什么要带超时的上下文&#xff1f; 1.序 GeeCache项目并没有引…

Pytorch系列教程:可视化Pytorch模型训练过程

深度学习和理解训练过程中的学习和进步机制对于优化性能、诊断欠拟合或过拟合等问题至关重要。将训练过程可视化的过程为学习的动态提供了有价值的见解&#xff0c;使我们能够做出合理的决策。训练进度必须可视化的两种方法是&#xff1a;使用Matplotlib和Tensor Board。在本文…

18 | 实现简洁架构的 Handler 层

提示&#xff1a; 所有体系课见专栏&#xff1a;Go 项目开发极速入门实战课&#xff1b;欢迎加入我的训练营&#xff1a;云原生AI实战营&#xff0c;一个助力 Go 开发者在 AI 时代建立技术竞争力的实战营&#xff1b;本节课最终源码位于 fastgo 项目的 feature/s14 分支&#x…

蓝队第三次

1.了解什么是盲注 盲注&#xff08;Blind SQL Injection&#xff09;是SQL注入的一种形式&#xff0c;攻击者无法直接通过页面回显或错误信息获取数据&#xff0c;而是通过观察页面的布尔状态&#xff08;真/假&#xff09;或时间延迟来间接推断数据库信息。例如&#xff0c;通…

sql server 2016 版本补丁说明

包信息和发布类型 Microsoft为创建和分发的 SQL Server 的所有软件更新包采用了标准化命名架构。 软件更新包是一个可执行文件&#xff08;.exe 或 .msi&#xff09;文件&#xff0c;其中包含一个或多个文件&#xff0c;这些文件可能应用于 SQL Server 安装以更正特定问题。 …

STM32之I2C硬件外设

注意&#xff1a;硬件I2C的引脚是固定的 SDA和SCL都是复用到外部引脚。 SDA发送时数据寄存器的数据在数据移位寄存器空闲的状态下进入数据移位寄存器&#xff0c;此时会置状态寄存器的TXE为1&#xff0c;表示发送寄存器为空&#xff0c;然后往数据控制寄存器中一位一位的移送数…

从青铜到王者:六大排序算法实战解析

前言 在编程的世界里,排序算法如同一颗璀璨的明珠,闪耀着智慧的光芒。它不仅是计算机科学的基础知识点,更是每一位程序员必备的技能。今天,就让我们一同走进排序算法的世界,深入探究冒泡排序、选择排序、插入排序、快速排序、归并排序、堆排序这六大经典算法的精髓所在,…

小程序配置webview

1.在微信公众平台配置业务域名 1&#xff09;包括把校验文件放在服务器根目录 2&#xff09;配置域名 2.在小程序中 新建文件 小程序新建页面&#xff1a;web-view json配置&#xff1a;{ "pageOrientation": "landscape", "renderer":&qu…

不用 Tomcat?SpringBoot 项目用啥代替?

在SpringBoot框架中&#xff0c;我们使用最多的是Tomcat&#xff0c;这是SpringBoot默认的容器技术&#xff0c;而且是内嵌式的Tomcat。 同时&#xff0c;SpringBoot也支持Undertow容器&#xff0c;我们可以很方便的用Undertow替换Tomcat&#xff0c;而Undertow的性能和内存使…

线索二叉树构造及遍历算法

线索二叉树构造以及遍历算法 线索二叉树&#xff08;中序遍历版&#xff09;构造线索二叉树构造双向线索链表遍历中序线索二叉树 线索二叉树&#xff08;中序遍历版&#xff09; 中序遍历找到对应结点的前驱&#xff08;土方法&#xff09; #mermaid-svg-eunGO5d2GhjLxCn5 {fo…

基于SpringBoot的“体育购物商城”的设计与实现(源码+数据库+文档+PPT)

基于SpringBoot的“体育购物商城”的设计与实现&#xff08;源码数据库文档PPT) 开发语言&#xff1a;Java 数据库&#xff1a;MySQL 技术&#xff1a;SpringBoot 工具&#xff1a;IDEA/Ecilpse、Navicat、Maven 系统展示 系统总体模块设计 前台用户登录界面 系统首页界面…

数据篇| App爬虫入门(一)

App 的爬取相比 Web 端爬取更加容易,反爬虫能力没有那么强,而且数据大多是以 JSON 形式传输的,解析更加简单。在 Web 端,我们可以通过浏览器的开发者工具监听到各个网络请求和响应过程,在 App 端如果想要查看这些内容就需要借助抓包软件。常见抓包软件有: ‌工具名称‌‌…

go context学习

1.Context接口2.emptyCtx3.Deadline()方法4.Done()方法5.Err方法6.Value方法&#xff08;&#xff09;7.contex应用场景8.其他context方法 1.Context接口 Context接口只有四个方法&#xff0c;以下是context源码。 type Context interface {Deadline() (deadline time.Time, …

在VMware Workstation Pro上轻松部署CentOS7 Linux虚拟机

首先我们需要下载VM虚拟机和Centos7的镜像 下载并安装VMware Workstation Pro 访问VMware Workstation Pro官网下载 https://www.vmware.com/ 第二步&#xff1a;下载centos7镜像 访问centos官网下载 https://www.centos.org/ 开始部署Centos7 点击创建新的虚拟机 这里是Cen…

Jsoup 解析商品信息时需要注意哪些细节?

在使用Jsoup解析商品信息时&#xff0c;需要注意以下细节和最佳实践&#xff0c;以确保爬虫的稳定性和数据的准确性&#xff1a; 1. 检查HTML文档的合法性 在解析之前&#xff0c;需要确认所解析的文档是否是一份合法正确的HTML文档。如果HTML结构不完整或存在错误&#xff0…

Android AudioFlinger(五)—— 揭开AudioMixer面纱

前言&#xff1a; 在 Android 音频系统中&#xff0c;AudioMixer 是音频框架中一个关键的组件&#xff0c;用于处理多路音频流的混音操作。它主要存在于音频回放路径中&#xff0c;是 AudioFlinger 服务的一部分。 上一节我们讲threadloop的时候&#xff0c;提到了一个函数pr…

go的”ambiguous import in multiple modules”

执行“go mod tidy”报如下错误&#xff1a; go mod tidy -compat1.17 go: finding module for package github.com/gomooon/goredis go: found github.com/gomooon/goredis in github.com/gomooon/goredis v0.3.5 go: github.com/gomooon/core importsgithub.com/gomooon/gor…

从0开始的操作系统手搓教程27:下一步,实现我们的用户进程

目录 第一步&#xff1a;添加用户进程虚拟空间 准备冲向我们的特权级3&#xff08;用户特权级&#xff09; 讨论下我们创建用户线程的基本步骤 更加详细的分析代码 用户进程的视图 说一说BSS段 继续看process.c中的函数 添加用户线程激活 现在&#xff0c;我们做好了TSS…

Java线程池深度解析,从源码到面试热点

Java线程池深度解析&#xff0c;从源码到面试热点 一、线程池的核心价值与设计哲学 在开始讨论多线程编程之前&#xff0c;可以先思考一个问题&#xff1f;多线程编程的原理是什么&#xff1f; 我们知道&#xff0c;现在的CUP是多核CPU&#xff0c;假设你的机器是4核的&#x…