在 Open WebUI+Ollama 上运行 DeepSeek-R1-70B 实现调用

在 Open WebUI + Ollama 上运行 DeepSeek-R1-70B 实现调用

您可以使用 Open WebUI 结合 Ollama 来运行 DeepSeek-R1-70B 模型,并通过 Web 界面进行交互。以下是完整的部署步骤。


1. 安装 Ollama

Ollama 是一个本地化的大模型管理工具,它可以在本地运行 DeepSeek-R1-70B

1.1 下载并安装 Ollama
  • Ubuntu / Debian
curl -fsSL https://ollama.com/install.sh | sh
  • MacOS(Apple Silicon / Intel)
brew install ollama
  • Windows
    参考官方安装指南:Ollama 官网
1.2 确保 Ollama 运行正常

运行以下命令,检查 Ollama 是否安装成功:

ollama -v

如果安装成功,将返回 Ollama 的版本号。


 2. 下载 DeepSeek-R1-70B 模型

在终端中运行以下命令,下载 DeepSeek-R1-70B 模型:

ollama pull deepseek-r1:70b

注意:

  • DeepSeek-R1-70B 需要较高的显存(>=70GB),建议使用 A100 80GB 或 H100 80GB 级别的 GPU 运行。
  • 如果显存不足,可以使用 deepseek-r1:7b 版本:
ollama pull deepseek-r1:7b

3. 运行 DeepSeek-R1-70B

启动 DeepSeek-R1-70B:

ollama run deepseek-r1:70b

如果您希望它 以 API 方式运行,可以执行:

ollama serve

默认情况下,Ollama API 监听 http://localhost:11434 端口。


4. 安装 Open WebUI

4.1 启动 Open WebUI

运行以下 Docker 命令:

docker run -d \-p 3000:8080 \--add-host=host.docker.internal:host-gateway \-v open-webui:/app/backend/data \--name open-webui \--restart always \ghcr.io/open-webui/open-webui:main
  • 这样 Open WebUI 就会运行在 http://localhost:3000
4.2 连接 Ollama
  1. 进入 http://localhost:3000。
  2. 登录管理员账户(首次使用会提示创建账户)。
  3. 在左下角点击 “管理员面板” > 选择 “模型管理”。
  4. 在 “添加新模型” 处:
    1. 模型名称:deepseek-r1:70b
    2. API 地址:http://host.docker.internal:11434
  5. 选择 “Ollama 兼容” 模型类型。
  6. 点击 “验证连接”,如果测试成功,说明模型已正确接入。
  7. 保存配置,返回主页,即可在 Web 界面调用 DeepSeek-R1-70B。

 5. 进行 DeepSeek-R1-70B 调用

在 Open WebUI 界面:

  • 选择 deepseek-r1:70b
  • 输入您的问题
  • 点击 发送
  • 享受 DeepSeek-R1-70B 的智能回答 

总结

  1. 安装 Ollama 并下载 deepseek-r1:70b
  2. 运行 Ollama API (ollama serve)。
  3. 安装 Open WebUI 并连接 Ollama。
  4. 在 Web 界面中使用 DeepSeek-R1-70B 进行推理。

进阶优化

使用 Docker Compose 启动 Open WebUI + Ollama

version: "3"
services:ollama:image: ollama/ollamacontainer_name: ollamaports:- "11434:11434"restart: alwaysopen-webui:image: ghcr.io/open-webui/open-webui:maincontainer_name: open-webuiports:- "3000:8080"depends_on:- ollamaenvironment:- OLLAMA_BASE_URL=http://ollama:11434restart: always

然后运行:

docker compose up -d

启用 Web 访问

ollama serve --host 0.0.0.0

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/69321.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

免费地理位置信息查询接口

地理位置信息查询接口V1 1. 接口简介 本接口用于查询指定经纬度的地理位置信息,包括省、市、区、街道等详细信息。 报文编码格式:UTF-8接口分组:交通地理创建者:何生最后编辑人:何生更新时间:2025-01-16…

使用 Axios 进行高效的数据交互

一、前言 1. 项目背景与目标 Axios 的重要性: Axios 是一个基于 Promise 的 HTTP 客户端,用于浏览器和 Node.js,简化了与服务器的通信。Axios 提供了丰富的功能,如拦截器、并发请求管理、取消请求等。2. 环境搭建 开发工具准备: 推荐使用 VSCode 或 WebStorm。安装必要的…

「vue3-element-admin」告别 vite-plugin-svg-icons!用 @unocss/preset-icons 加载本地 SVG 图标

🚀 作者主页: 有来技术 🔥 开源项目: youlai-mall ︱vue3-element-admin︱youlai-boot︱vue-uniapp-template 🌺 仓库主页: GitCode︱ Gitee ︱ Github 💖 欢迎点赞 👍 收藏 ⭐评论 …

C#中深度解析BinaryFormatter序列化生成的二进制文件

C#中深度解析BinaryFormatter序列化生成的二进制文件 BinaryFormatter序列化时,对象必须有 可序列化特性[Serializable] 一.新建窗体测试程序BinaryDeepAnalysisDemo,将默认的Form1重命名为FormBinaryDeepAnalysis 二.新建测试类Test Test.cs源程序如下: using System; us…

Python进阶-在Ubuntu上部署Flask应用

随着云计算和容器化技术的普及,Linux 服务器已成为部署 Web 应用程序的主流平台之一。Python 作为一种简单易用的编程语言,适用于开发各种应用程序。本文将详细介绍如何在 Ubuntu 服务器上部署 Python 应用,包括环境准备、应用发布、配置反向…

mysql8 用C++源码角度看客户端发起sql网络请求,并处理sql命令

MySQL 8 的 C 源码中,处理网络请求和 SQL 命令的流程涉及多个函数和类。以下是关键的函数和类,以及它们的作用: 1. do_command 函数 do_command 函数是 MySQL 服务器中处理客户端命令的核心函数。它从客户端读取一个命令并执行。这个函数在…

深度学习在医疗影像分析中的应用

引言 随着人工智能技术的快速发展,深度学习在各个领域都展现出了巨大的潜力。特别是在医疗影像分析中,深度学习的应用不仅提高了诊断的准确性,还大大缩短了医生的工作时间,提升了医疗服务的质量。本文将详细介绍深度学习在医疗影像…

计算机领域QPM、TPM分别是什么并发指标,还有其他类似指标吗?

在计算机领域,QPM和TPM是两种不同的并发指标,它们分别用于衡量系统处理请求的能力和吞吐量。 QPM(每分钟请求数) QPM(Query Per Minute)表示每分钟系统能够处理的请求数量。它通常用于衡量系统在单位时间…

python基础入门:3.2字典(Dict)与集合(Set)

Python高效数据管理:字典与集合深度剖析 # 快速导航 config {"数据结构": "字典", "特性": ["键值对", "快速查找"]} unique_nums {1, 2, 3, 5, 8} # 集合自动去重一、字典核心操作全解 1. 键值对基础操作 …

celery

🔥 太棒了!兄弟,你的学习欲望真的让我佩服得五体投地!🚀 既然你已经完全掌握 background_tasks 了,那我们就来深入解析 Celery!🌱🚀 1. Celery 解决了什么问题&#xff…

【安当产品应用案例100集】036-视频监控机房权限管理新突破:安当windows操作系统登录双因素认证解决方案

一、机房管理痛点:权限失控下的数据泄露风险 在智慧城市与数字化转型浪潮下,视频监控系统已成为能源、金融、司法等行业的核心安防设施。然而,传统机房管理模式中,值班人员通过单一密码即可解锁监控画面的操作漏洞,正…

Unity抖音云启动测试:如何用cmd命令行启动exe

相关资料:弹幕云启动(原“玩法云启动能力”)_直播小玩法_抖音开放平台 1,操作方法 在做云启动的时候,接完发现需要命令行模拟云环境测试启动,所以研究了下。 首先进入cmd命令,CD进入对应包的文件…

< OS 有关 > 利用 google-drive-ocamlfuse 工具,在 Ubuntu 24 系统上 加载 Google DRIVE 网盘

Created by Dave On 8Feb.2025 起因: 想下载 StableDiffusion,清理系统文件时把 i/o 搞到 100%,已经删除到 apt 缓存,还差 89MB,只能另想办法。 在网上找能不能挂在 Google 网盘,百度网盘,或 …

【LITS游戏——暴力DFS+剪枝优化】

题目 代码 #include <bits/stdc.h> using namespace std; using pll pair<int, int>; #define x first #define y second const int N 51; pll d[4][4][4] {{{{0, 0}, {1, 0}, {2, 0}, {2, 1}}, {{0, 0}, {1, 0}, {1, -1}, {1, -2}}, {{0, 0}, {0, 1}, {1, 1},…

Redisson全面解析:从使用方法到工作原理的深度探索

文章目录 写在文章开头详解Redisson基本数据类型基础配置字符串操作列表操作映射集阻塞队列延迟队列更多关于Redisson详解Redisson 中的原子类详解redisson中的发布订阅模型小结参考写在文章开头 Redisson是基于原生redis操作指令上进一步的封装,屏蔽了redis数据结构的实现细…

Chrome 浏览器:互联网时代的浏览利器

Chrome 浏览器&#xff1a;互联网时代的浏览利器 引言 在互联网时代&#xff0c;浏览器已经成为我们日常生活中不可或缺的工具。作为全球最受欢迎的浏览器之一&#xff0c;Chrome 浏览器凭借其出色的性能、丰富的扩展程序和简洁的界面&#xff0c;赢得了广大用户的喜爱。本文…

网络爬虫技术如何影响网络安全的

随着网络的发展和网络爬虫技术的普及&#xff0c;一些人收集某些需要的信息&#xff0c;会使用网络爬虫进行数据抓取。网络爬虫一方面会消耗网络系统的网络资源&#xff0c;同时可能会造成核心数据被窃取&#xff0c;因此对企业来讲如何反爬虫显得非常重要。 一、什么是网络爬…

用Python进行websocket接口测试

这篇文章主要介绍了用Python进行websocket接口测试&#xff0c;帮助大家更好的理解和使用python&#xff0c;感兴趣的朋友可以了解下 我们在做接口测试时&#xff0c;除了常见的http接口&#xff0c;还有一种比较多见&#xff0c;就是socket接口&#xff0c;今天讲解下怎么用P…

SSM开发(十一) mybatis关联关系多表查询(嵌套查询,举例说明)

目录 一、背景介绍 二、一对一查询(嵌套查询) 三、一对多查询(嵌套查询) 四、嵌套查询效率评估 注:关联查询则是指在一个查询中涉及到多个表的联合查询 一、背景介绍 当对数据库的操作涉及到多张表,这在面向对象语言如Java中就涉及到了对象与对象之间的关联关系。针对多…

xcode常见设置

1、如何使用cmake构建archs为$(ARCHS_STANDARD)的xcode项目 在cmake中使用如下指令 set(CMAKE_OSX_ARCHITECTURES "$(ARCHS_STANDARD)") cmake - nomadli的博客 | nomadli Blog