DeepSeek-R1 模型现已在亚马逊云科技上提供

2025年3月10日更新—DeepSeek-R1现已作为完全托管的无服务器模型在Amazon Bedrock上提供。

2025年2月5日更新—DeepSeek-R1 Distill Llama 和 Qwen模型现已在Amazon Bedrock Marketplace和Amazon SageMaker JumpStart中提供。

在最近的Amazon re:Invent大会上,亚马逊 CEO安迪·贾西分享了公司在开发近1000个生成式 AI 应用程序过程中获得的重要经验。基于这一大规模 AI 部署的实践,贾西提出了三个关键观察,这些观察塑造了亚马逊在企业 AI 实施方面的策略。

首先,随着生成式 AI 应用程序的规模扩大,计算成本变得至关重要。人们对更高的性价比有着极大的需求。其次,构建一个真正出色的生成式 AI 应用程序其实非常困难。第三,当我们让开发者自由选择他们想要使用的工具时,模型的多样性就显现出来。这一点并不让我们感到意外,因为我们一再吸取同样的教训:永远不会有一个工具能够统治整个 AI 领域。

正如安迪所强调的,亚马逊提供的广泛而深入的模型系列使客户能够选择最适合其独特需求的精准能力。通过密切关注客户需求和技术发展,亚马逊云科技定期扩展我们精选的模型库,既包括成熟行业宠儿,也囊括前景广阔的新兴模型。这种高性能和差异化模型产品的持续扩展,帮助客户保持在 AI 创新最前沿。

这让我们将目光转向中国的 AI 初创公司深度求索(DeepSeek)。深度求索于 2024 年 12 月发布了 DeepSeek-V3,随后在 2025 年 1 月 20 日推出了DeepSeek-R1、拥有 6710 亿参数的 DeepSeek-R1-Zero,以及参数范围在15亿至 700 亿之间的DeepSeek-R1-Distill模型。2025年1月 27日,他们又增加了基于视觉的Janus-Pro-7B模型。这些模型均公开可用,据报道,其性价比比同类模型高出90%至95%。据深度求索表示,其模型因其推理能力而脱颖而出,这得益于通过强化学习等创新训练方法实现的突破。

如今,您可以在AmazonBedrock和Amazon SageMaker AI中部署 DeepSeek-R1 模型。Amazon Bedrock最适合希望通过API快速集成预训练基础模型的团队。Amazon SageMaker AI则非常适合希望进行高级定制、训练和部署,并能够访问底层基础设施的组织。此外,您还可以使用Amazon Trainium和AmazonInferentia,通过Amazon Elastic Compute Cloud(Amazon EC2或Amazon SageMaker AI经济高效地部署DeepSeek-R1-Distill模型。

通过 亚马逊云科技,您可以使用DeepSeek-R1模型以最小的基础设施投资构建、试验并负责任地扩展生成式 AI 项目,得益于其强大的成本效益。您还可以基于 亚马逊云科技专为安全设计的服务,自信地推动生成式AI创新。我们强烈建议将DeepSeek-R1模型的部署与Amazon Bedrock Guardrails集成,为您的生成式AI应用程序增加一层保护,该功能可供Amazon Bedrock和Amazon SageMaker AI客户共同使用。

现在,您可以通过以下几种方式在 亚马逊云科技 上部署DeepSeek-R1模型:  
1. 通过Amazon Bedrock Marketplace获取DeepSeek-R1模型,  
2. 通过Amazon SageMaker JumpStart获取DeepSeek-R1模型,  
3. 通过Amazon Bedrock自定义模型导入功能获取DeepSeek-R1-Distill模型,  
4. 通过Amazon EC2 Trn1实例获取DeepSeek-R1-Distill模型。  

让我为您详细介绍在 亚马逊云科技上开始使用DeepSeek-R1模型的各种路径。无论您是构建首个 AI 应用程序还是扩展现有解决方案,这些方法都可以根据团队的技能和需求提供灵活的起点。

1. Amazon Bedrock Marketplace中的DeepSeek-R1模型
Amazon Bedrock Marketplace提供了超过 100 个流行、新兴和专业的基础模型(FMs),同时与当前行业领先的模型一起供选择。您可以轻松地在单一目录中发现模型,订阅模型,然后在托管的端点上部署模型。  

要访问Amazon Bedrock Marketplace中的DeepSeek-R1模型,请进入Amazon Bedrock控制台,在“基础模型”部分选择“模型目录”。您可以通过搜索或按模型提供商筛选快速找到DeepSeek模型。

 在查看模型详细信息页面(包括模型的功能和实施指南)后,您可以直接部署模型,只需提供端点名称、选择实例数量并选择实例类型即可。

您还可以配置高级选项,以自定义DeepSeek-R1模型的安全性和基础设施设置,包括VPC网络、服务角色权限和加密设置。对于生产部署,您应审查这些设置,以确保其符合您组织的安全性和合规性要求。

通过Amazon Bedrock Guardrails,您可以独立评估用户输入和模型输出。您可以通过生成式AI应用程序中过滤不良和有害内容,根据自定义的策略集控制用户与DeepSeek-R1之间的交互。Amazon Bedrock Marketplace中的DeepSeek-R1模型只能与Bedrock的ApplyGuardrail API结合使用,以评估用户输入和模型响应,适用于Amazon Bedrock之外的自定义和第三方基础模型(FMs)。了解更多信息,请阅读[使用 Amazon Bedrock Guardrails 实施模型无关的安全措施](https://Amazon.amazon.com/cn/blogs/machine-learning/implement-model-independent-safety-measures-with-amazon-bedrock-guardrails/)。

Amazon Bedrock Guardrails还可以与其他Bedrock工具集成,包括Amazon Bedrock Agents和 Amazon Bedrock Knowledge Bases,以构建更安全、更符合负责任AI政策的生成式AI应用程序。了解更多信息,请访问[亚马逊云科技负责任AI页面](https://Amazon.amazon.com/cn/machine-learning/responsible-ai/)。

2025年2月1日更新 — 您可以使用Bedrock的Playground功能,了解模型对各种输入的响应方式,并优化提示词以获取最佳结果。

在使用DeepSeek-R1模型与Bedrock的Playground或InvokeModel API时,请使用DeepSeek的聊天模板以获得最佳效果。例如:

<|begin_of_sentence|><|User|>content for inference<|Assistant|>.

2. Amazon SageMaker JumpStart中的DeepSeek-R1模型  
Amazon SageMaker JumpStart是一个机器学习(ML)中心,提供基础模型(FMs)、内置算法和预构建的ML 解决方案,只需点击几下即可部署。要在SageMaker JumpStart中部署DeepSeek-R1模型,您可以在SageMaker Unified Studio、SageMaker Studio或SageMaker AI控制台中发现该模型,或通过SageMaker Python SDK以编程方式查找。

在Amazon SageMaker AI控制台中,打开SageMaker Studio,选择JumpStart,然后在“所有公共模型”页面中搜索“DeepSeek-R1”。

 选择模型后,点击“部署”即可使用默认设置创建端点。当端点状态变为“InService”(服务中)时,您可以通过向其端点发送请求来进行推理。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/75272.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STP --- 生成树协议

协议信息 配置 BPDU Protocol identifier&#xff1a;协议标识 Version&#xff1a;协议版本&#xff1a;STP 为 0&#xff0c;RSTP 为 2&#xff0c;MSTP 为 3 type&#xff1a; BPDU 类型 Flag&#xff1a; 标志位 Root ID&#xff1a; 根桥 ID&#xff0c;由两字节的优…

Ansible playbook-ansible剧本

一.playbook介绍 便于功能的重复使用 本质上就是文本文件&#xff0c;一般都是以.yml结尾的文本文件。 1.遵循YAML语法 1.要求同级别代码要有相同缩进&#xff0c;建议4个空格。【同级别代码是同一逻辑的代码】 在计算机看来空格和Tob键是两个不同的字符。 2.一个键对应一…

python的基础入门

初识Python 什么是Python Python是1门程序设计语言。在开发者眼里&#xff0c;语言可以分为3类&#xff1a; 自然语言&#xff1a;人能听懂的语言&#xff0c;例如汉语&#xff0c;英语&#xff0c;法语等等。机器语言&#xff1a;机器能听懂的语言&#xff0c;机器只能听懂0…

MD编辑器中的段落缩进怎么操作

在 Markdown&#xff08;MD&#xff09;编辑器中&#xff0c;段落的缩进通常可以通过 HTML 空格符、Markdown 列表缩进、代码块缩进等方式 实现。以下是几种常见的段落缩进方法&#xff1a; 1. 使用全角空格 ( ) 在一些 Markdown 编辑器&#xff08;如 Typora&#xff09;中&…

8.neo4j图数据库python操作

使用图数据库的原因 图数据库使用neo4j的原因&#xff1a;neo4j使用率高&#xff0c;模板好找&#xff0c;报错能查。 红楼梦人物关系图地址 GraphNavigator neo4j学习手册 https://www.w3cschool.cn/neo4j/neo4j_need_for_graph_databses.html CQL代表的是Cypher查询语言…

[Lc6_记忆化搜索] 扫雷游戏 | 理解 递归vs记忆化搜索vs dp

目录 ⭕1.扫雷游戏 题解 1.记忆化搜索 解法一&#xff1a;递归 解法二&#xff1a;记忆化搜索 解法三&#xff1a;动态规划 ⭕1.扫雷游戏 (暴力模拟&#xff09; 链接&#xff1a;529. 扫雷游戏 让我们一起来玩扫雷游戏&#xff01; 给你一个大小为 m x n 二维字符矩阵…

云原生周刊:Kubernetes v1.33 要来了

开源项目推荐 Tekton Tekton 是一个开源的 K8s 原生 CI/CD 系统&#xff0c;它为构建、测试和部署自动化工作流提供了强大而灵活的框架。Tekton 提供了一套标准化的 API 和自定义资源&#xff08;CRDs&#xff09;&#xff0c;使得开发者能够在 K8s 集群中定义和管理 CI/CD 管…

服务新增节点、迁移笔记

文章目录 基础配置部分基础配置-hosts基础配置-jdk包准备基础配置-jdk环境变量配置基础配置-skywalking包 基础配置-apollo配置。 # 文件夹及配置基础配置-tomcat基础配置-nginx基础配置部分-磁盘挂载(这个也差点漏掉)。 防火墙部分防火墙部分-数据库及脚本防火墙部分-redis防火…

第十一章:Python PIL库-图像处理

一、PIL库简介 PIL&#xff08;Python Imaging Library&#xff09;是一个功能强大的图像处理库&#xff0c;它提供了丰富的图像处理功能&#xff0c;包括图像的打开、处理和保存等操作。PIL支持多种图像文件格式&#xff0c;如JPEG、PNG、BMP等&#xff0c;并且可以完成对图像…

【编译、链接与构建详解】Makefile 与 CMakeLists 的作用

【编译、链接与构建详解】Makefile 与 CMakeLists 的作用 前言源代码&#xff08;.c、.cpp&#xff09;编译编译的本质编辑的结果编译器&#xff08;GCC、G、NVCC 等&#xff09; 目标文件&#xff08;.o&#xff09;什么是 .o 目标文件为什么单个 .o 目标文件不能直接执行&…

Ubuntu / Debian 创建快捷方式启动提权

简述 在 Linux 系统中&#xff0c;.desktop 文件是 桌面入口文件&#xff0c;用于在桌面环境&#xff08;如 GNOME、KDE&#xff09;中定义应用程序的启动方式、图标、名称等信息。当你执行 touch idea.desktop 时&#xff0c;实际上创建了一个空的 .desktop 文件&#xff08;…

ISIS报文

IS-IS 报文 目录 IS-IS 报文 一、报文类型与功能 二、报文结构解析 三、核心功能特性 四、典型应用场景 五、抓包数据分析 六、总结 IS-IS&#xff08;中间系统到中间系统&#xff09;协议报文是用于链路状态路由协议中网络设备间交换路由信息的关键载体&#xff0c;其设…

beikeshop多商户跨境电商独立站最新版v1.6.0版本源码

一.介绍 beikeshop跨境电商独立站最新版V1.6.0源码 多商户 多商家 多语言 多币结算 本博主亲测搭建代码全开源质量相对来说很稳定的 二.服务器环境 系统&#xff1a;CentOS、 环境&#xff1a;PHP7.4 Nginx 1.21 MySQL 5.6 常见插件&#xff1a;fileinfo &#xff1b; re…

Redis批量操作详解

一、原生批量命令&#xff08;MSET&#xff09; 适用场景&#xff1a;所有键的过期时间相同或无过期设置&#xff0c;且无需条件判断。 方法&#xff1a; 将多个SET命令合并为MSET命令&#xff0c;但需要注意MSET的局限性&#xff08;无法设置过期时间&#xff0c;且所有键值对…

Spring Boot 集成实战:AI 工具如何自动生成完整微服务模块

在数字化转型的浪潮中&#xff0c;开发效率和质量是企业竞争力的关键要素。飞算 JavaAI 作为一款创新的 AI 工具&#xff0c;能在 Spring Boot 开发中&#xff0c;自动生成完整微服务模块&#xff0c;极大提升开发效率。下面&#xff0c;我们就详细介绍如何借助飞算 JavaAI&…

算法 | 2024最新算法:斑翠鸟优化算法原理,公式,应用,算法改进研究综述,matlab代码

基于斑翠鸟优化算法的原理、应用及改进研究综述 一、算法原理 斑翠鸟优化算法(Pied Kingfisher Optimizer, PKO)是2024年由Bouaouda等人提出的一种新型仿生智能优化算法,其灵感来源于斑翠鸟的捕食行为与共生关系。算法通过模拟斑翠鸟的栖息悬停、潜水捕鱼及与其他生物的共生…

RabbitMQ高级特性--重试特性

目录 1.重试配置 2.配置交换机&队列 3.发送消息 4.消费消息 5. 运行程序观察结果 6. 手动确认 注意&#xff1a; 在消息传递过程中, 可能会遇到各种问题, 如网络故障, 服务不可用, 资源不足等, 这些问题可能导致消息处理失败. 为了解决这些问题, RabbitMQ 提供了重试机制, …

Vue 组件通信 - 中央事件总线

Vue 渐进式JavaScript 框架 基于Vue2的学习笔记 - Vue组件通信 - 中央事件总线 目录 中央事件总线 图示 准备工作 设置页面元素 创建组件 总结 中央事件总线 使用vue的监听和触发来实现中央事件总线方式。 on监听 emit触发&#xff0c;组件按钮绑定点击事件&#xff0c…

5.0 WPF的基础介绍1-Grid,Stack,button

WPF: Window Presentation Foundation. WPF与WinForms的对比如下&#xff1a; 特性WinFormsWPF技术基础基于传统的GDI&#xff08;图形设备接口&#xff09;基于DirectX&#xff0c;支持硬件加速的矢量渲染UI设计方式拖拽控件事件驱动代码&#xff08;简单但局限&#xff09;…

QT软件设计可考虑回答

在Qt应用中是否引入抽象类需要根据具体场景权衡&#xff0c;以下是分层建议&#xff1a; 建议采用抽象类的3个典型场景&#xff1a; 传感器系统抽象&#xff08;强推荐&#xff09; class AbstractSensor { public:virtual ~AbstractSensor() default;virtual QVector<L…