免费在腾讯云Cloud Studio部署DeepSeek-R1大模型

2024年2月2日,腾讯云宣布DeepSeek-R1大模型正式支持一键部署至腾讯云HAI(高性能应用服务)。开发者仅需3分钟即可完成部署并调用模型,大幅简化了传统部署流程中买卡、装驱动、配网络、配存储、装环境、装框架、下载模型等繁琐步骤。通过腾讯云HAI,开发者只需两步即可轻松调用DeepSeek-R1大模型,显著提升了开发效率。

fb3f4304d620250208232304

国内云端AI算力平台对比

在国内云端AI算力平台中,百度飞桨AI Studio仅支持部署运行PaddlePaddle深度学习框架,而腾讯Cloud Studio则没有这一限制,且每月免费提供10000分钟的使用时长,支持随用随开、即时关闭,成为轻量化部署DeepSeek-R1的理想平台。此外,有传闻称腾讯可能是DeepSeek背后的重要股东,进一步凸显了双方合作的深度。

主流云端算力平台免费配额对比

目前,提供免费配额的主流云端算力平台包括Google Colab、Amazon SageMaker Studio Lab、Kaggle、Gradient、阿里云天池、百度AI Studio和腾讯Cloud Studio等。以下是各平台的主要特点:

  1. Google Colab:无总计使用时间限制,单次连续使用时间不超过12小时,提供多种GPU选项。

  2. Amazon SageMaker Studio Lab:提供Tesla T4 GPU(16GB显存),持久化存储空间15GB,每天运行时间不超过8小时,单次使用限制4小时。

  3. Kaggle:提供16GB显存的P100 GPU,每周总运行时间不超过40小时,单次限制6小时,持久化存储空间20GB。

  4. Gradient:提供8vCPU、30GB RAM和Quadro M4000 GPU(8GB显存),持久化存储空间仅5GB。

  5. Azure 100/Student:Microsoft Azure学生账户提供100美元赠金,可用于购买GPU算力资源,支持16GB或更大显存的Tesla T4 GPU及50GB持久化存储空间。

  6. 阿里云天池:提供总计60小时GPU使用时间,显存16GB,单次连续使用时间不超过8小时。

  7. 百度AI Studio:提供多种GPU选项,但仅支持PaddlePaddle框架,吸引力有限。

腾讯Cloud Studio的优势

腾讯Cloud Studio在免费配额方面表现尤为突出,按月赠送体验时长(配额),非常良心。Cloud Studio提供两类工作空间:

  1. 通用工作空间:免费版规格为1核处理器、2G存储(突发可使用内存)、4G系统空间,不消耗配额。额外资源使用月度3000分钟体验时长兑换。

  2. 高性能工作空间(HAI):每月赠送10000分钟体验时长,可兑换免费基础型高性能工作空间的使用(T4 16GB显存、32GB内存)。多个空间同时运行会叠加计时,体验时长用完后自动关机。

DeepSeek-R1:14B模型部署实战

腾讯 Cloud Studio 免费基础型使用 HAI 基础型高性能工作空间,默认免费搭配 80GB 云硬盘,包括 30GB 系统盘和 不到 50GB 的数据盘,结合免费的 HAI 基础型 GPU 资源 16GB 的显存,最高可以部署、运行 deepseek-R1 14B,相比本地部署一般都是 7B、8B 的版本,性能、体验更好,10000 分钟/月体验时长可以完成不少零碎的推理任务。

1. 登录腾讯Cloud Studio

访问 腾讯Cloud Studio官网并登录您的账号。

进入控制台,选择高性能工作空间(HAI),创建一个新的实例,选择 DeepSeek R1,就可以直接 部署好完整的 deepseek r1:7b。如果需要部署 14b,则可删除已有的 7b,加载运行 14b 模型即可。这里示例选择 olama,默认预置的 llama3 可在部署完成后删除。

fe245c62cb20250208233328

等待实例启动,部署完成之后显示“运行中”的提示。部署失败(显示“失效”)的原因多由于资源有限, 过于火爆导致缺少库存,可以删除后再重新部署,一般多尝试几次都可以部署成功。

356b7f188620250208233754

2. 删除预置模型(可选)

腾讯Cloud Studio默认预置了一些模型(如deepseek-r1:1.5b,deepseek-r1:7b),如果您不需要这些模型,可以通过以下命令删除:

ollama list # 查看已安装的模型deepseek-r1:1.5b # 删除1.5b模型deepseek-r1:1.5b # 删除7b模型

326562389720250208234345

3. 下载并运行DeepSeek-R1:14B模型

打开 终端(快捷键 Ctrl+~),输入以下命令下载并运行DeepSeek-R1:14B模型: 

ollama run deepseek-r1:14b

53fc6b409320250208234028

1b0901136f20250208234028

9286de80ab20250208234705

等待模 型下载完成。下载速度取决于网络带宽,腾讯Cloud Studio提供最高100Mbps的带宽,通常可以在几分钟内完成。

54106914e820250208234738

下载完成后,模型 会自动运行,并进入交互式对话模式。

6dde04e5d320250209005538

4. 常用命令

以下是一些常用的命令,帮助您更好地管理模型和会话:

  • 退出对话
    /bye
  • 清除上下文
    /clear
  • 查看GPU信息
    nvidia-smi
  • 查看存储空间
    df -h
  • 查看内存使用情况
    free -m
5. 内网穿透与WebUI接入

腾讯Cloud Studio不支持Docker,且未配置公网IP,需通过内网穿透工具(如Cloudflared)将DeepSeek发布至公网,以便接入WebUI。以下是具体步骤:

安装内网 穿透工具:使用Cloudflared或其他内网穿透工具(如Ngrok),本次使用Cloudflared,因为超级简单,缺点就是网速有点慢,但是不影响使用。

 安装Cloudflared,执行命令:

## 下载安装包wget https://ghfast.top/https://github.com/cloudflare/cloudflared/releases/latest/download/cloudflared-linux-amd64.deb## 安装dpkg -i cloudflared-linux-amd64.deb## 查看是否安装成功cloudflared -v

6a161591d520250209003607

75076ed9ca20250209003607

查看 ollama  的端口号:

netstat -ntlp

 如果出现-bash: netstat: command not found错误时,需要安装netstat工 具:

sudo apt update # 更新软件包列表sudo apt install net-tools # 安装 net-tools 工具包

d8b2dfd63020250209001901

65fd4e60e320250209002031

内网穿透:

cloudflared tunnel --url http://127.0.0.1:8434

58c7904b0820250209003942

439233694620250209003959

配置WebUI:将生 成的公网URL配置到WebUI中,即可通过浏览器访问DeepSeek-R1。

 9b50d2017e20250209005347

58d7402c8320250209005347

6. 注意事项
  • 实例创建失败:由于DeepSeek-R1模型火爆,腾讯的计算资源可能有限。如果创建实例失败,建议多次尝试或更换时间重新部署。

  • 存储空间管理:腾讯Cloud Studio提供80GB持久化存储空间(包括30GB系统盘和50GB数据盘),请定期清理不必要的文件以避免超额收费。

  • 网络流量:每月免费提供500GB公网流量,超出部分按0.8元/GB计费,请合理使用。


7. 性能优化
  • 多GPU支持:如果您有更高配置的硬件,可以尝试部署70B模型,以获得更强的性能。

  • 批量任务处理:通过脚本自动化调用DeepSeek-R1,提高任务处理效率。

  • 上下文管理:使用/clear命令定期清除上下文,避免模型输出偏差。


总结

腾讯Cloud Studio凭借其免费配额、高性能工作空间和极简部署流程,成为国内云端AI算力平台的佼佼者。对于开发者而言,腾讯云HAI与DeepSeek-R1的结合不仅降低了部署门槛,还显著提升了开发效率,是轻量化AI模型部署的理想选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/70841.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C++高并发服务器WebServer】-17:阻塞/非阻塞和同步/异步、五种IO模型、Web服务器

本文目录 一、阻塞/非阻塞、同步/异步1.1 辨析1.2 异步io接口 二、五种IO模型2.1 阻塞 blocking 模型2.2 非阻塞 NIO 模型2.3 IO多路复用2.4 信号驱动Signal-driven2.5 异步 三、Web Sever 网页服务器3.1 HTTP的请求响应步骤3.2 HTTP请求与响应报文格式3.3 HTTP请求方法3.4 HTT…

力扣LeetCode: 5 最长回文子串

题目: 给你一个字符串 s,找到 s 中最长的回文子串。 示例 1: 输入:s "babad" 输出:"bab" 解释:"aba" 同样是符合题意的答案。示例 2: 输入:s &qu…

【MySQL例题】我在广州学Mysql 系列——有关数据备份与还原的示例

ℹ️大家好,我是练小杰,今天周二,明天就是元宵节了呀!!😆 俗话说“众里寻他千百度。蓦然回首,那人却在,灯火阑珊处。” 本文主要对数据库备份与还原的知识点例题学习~~ 前情回顾&…

自动化xpath定位元素(附几款浏览器xpath插件)

在 Web 自动化测试、数据采集、前端调试中,XPath 仍然是不可或缺的技能。虽然 CSS 选择器越来越强大,但面对复杂 DOM 结构时,XPath 仍然更具灵活性。因此,掌握 XPath,不仅能提高自动化测试的稳定性,还能在爬…

【并发控制、更新、版本控制】.NET开源ORM框架 SqlSugar 系列

系列文章目录 🎀🎀🎀 .NET开源 ORM 框架 SqlSugar 系列 🎀🎀🎀 文章目录 系列文章目录一、并发累计(累加)1.1 单条批量累计1.2 批量更新并且字段11.3 批量更新并且字段list中对应的…

结合实际讲NR系列2—— SIB1

这是在基站抓取的sib1的一条信令 L3MessageContent BCCH-DL-SCH-Messagemessagec1systemInformationBlockType1cellSelectionInfoq-RxLevMin: -64q-QualMin: -19cellAccessRelatedInfoplmn-IdentityListPLMN-IdentityInfoplmn-IdentityListPLMN-IdentitymccMCC-MNC-Digit: 4MC…

数据存储和操作:数据管理的基石

在数据管理的庞大体系中,数据存储和操作是确保数据可用性和完整性的关键环节。它不仅涉及数据的物理存储,还包括数据的管理、维护和优化。今天,让我们深入《DAMA数据管理知识体系指南(第二版)》的第六章,一…

Redis 数据类型 Hash 哈希

在 Redis 中,哈希类型是指值本⾝⼜是⼀个键值对结构,形如 key "key",value { { field1, value1 }, ..., {fieldN, valueN } },Redis String 和 Hash 类型⼆者的关系可以⽤下图来表⽰。 Hash 数据类型的特点 键值对集合…

LLaMA-Factory 安装linux部署conda笔记

第一行代码是我导入https://github.com/hiyouga/LLaMA-Factory.git到我的项目那里的,试过网上随便搜索过相同,估计没更新,安装了几次都运行失败,克隆了最新的就安装成功了。 方法1没虚拟环境:不知道成不成功&#xff…

【干活分享】2025年可以免费问答的一些GPT网站-deepseek等免费gpt

2025年已经到来,大家也都陆续回归到忙碌的工作中。在新的一年里,如何更高效地完成工作任务,提升工作效率,是很多人关心的问题。今天,就为大家分享一些实用性很强的GPT网站,帮助大家在工作中事半功倍。 Dee…

Repo命令使用

repo 命令与 git 类似&#xff0c;但它主要用于管理多个 Git 仓库的操作。以下是等效的 repo 命令&#xff1a; 1. 获取新仓库代码 克隆仓库 repo init -u <manifest_url> -b <branch_name> repo sync repo init&#xff1a;初始化 repo&#xff0c;指定远程清单…

【生产变更】- Oracle RAC添加配置ipv6地址

【生产变更】- Oracle RAC添加配置ipv6地址 一、概述二、环境检查及备份2.1 检查并备份系统层面IP配置2.2 检查并备份监听配置2.3 检查并备份网卡配置2.4 检查并备份/etc/hosts三、集群层面配置3.1 检查集群配置3.2 停止集群组件3.3 Bond0网卡设置3.4 /etc/hosts文件配置3.5 重…

docker部署superset并连接华为MRS hive数据库

下载构建源码 这个项目实现了汉化和开箱即用&#xff0c;感谢大佬 GitHub - lutinglt/superset-zh: Superset 汉化, Superset 中文版 替换国内apt源 查看debian版本&#xff0c;不同版本替换apt源的内容不同 cat /etc/debian_version我这里是11.9版本 apt源文件sources.li…

qt 事件的传递顺序

在 Qt 中&#xff0c;事件的传递顺序遵循以下基本规则&#xff1a; 事件的产生&#xff1a;当用户与界面交互时&#xff0c;操作&#xff08;如鼠标点击、键盘输入等&#xff09;会生成相应的事件&#xff08;如 QMouseEvent、QKeyEvent 等&#xff09;。 事件的传递顺序&…

AJAX XML技术详解

AJAX XML技术详解 引言 随着互联网技术的不断发展,前端与后端之间的交互需求日益增长。AJAX(Asynchronous JavaScript and XML)技术应运而生,成为实现前后端分离、提高页面响应速度的关键技术之一。本文将详细介绍AJAX XML技术,包括其原理、应用场景、优缺点等内容。 A…

mybatis 是否支持延迟加载?延迟加载的原理是什么?

1. MyBatis 是否支持延迟加载&#xff1f; 是的&#xff0c;MyBatis 支持延迟加载。延迟加载的主要功能是推迟数据加载的时机&#xff0c;直到真正需要时再去加载。这种方式能提高性能&#xff0c;尤其是在处理关系型数据时&#xff0c;可以避免不必要的数据库查询。 具体来说…

全面理解-c++中的异常处理机制

C 的异常处理机制是一种用于处理程序运行时错误的结构化方法&#xff0c;通过分离正常逻辑与错误处理代码&#xff0c;提高代码的可读性和可维护性。以下是其核心组成部分和工作原理的详细说明&#xff1a; 1. 异常处理的三大关键字 1.1 try 块 作用&#xff1a;包裹可能抛出异…

支持向量机原理

支持向量机&#xff08;简称SVM&#xff09;虽然诞生只有短短的二十多年&#xff0c;但是自一诞生便由于它良好的分类性能席卷了机器学习领域。如果不考虑集成学习的算法&#xff0c;不考虑特定的训练数据集&#xff0c;尤其在分类任务中表现突出。在分类算法中的表现SVM说是排…

zy.21

PHP(续) PHP代码执行漏洞 1.PHP中代码漏洞的概念 代码执行漏洞就是在代码中若存在eval、assert等能将所接收的参数作为代码去执行,并且拼接的内容可被访问者控制,也就是把传入的参数给拼接进去了,造成了额外的代码执行,也就造成了代码执行漏洞。&#xff08;大概原理&#x…

LSTM 学习笔记 之pytorch调包每个参数的解释

0、 LSTM 原理 整理优秀的文章 LSTM入门例子&#xff1a;根据前9年的数据预测后3年的客流&#xff08;PyTorch实现&#xff09; [干货]深入浅出LSTM及其Python代码实现 整理视频 李毅宏手撕LSTM [双语字幕]吴恩达深度学习deeplearning.ai 1 Pytorch 代码 这里直接调用了nn.l…