亚马逊云科技全面托管DeepSeek-R1模型现已上线

文章目录

      • 亚马逊云科技全面托管DeepSeek-R1模型现已上线
      • 在Amazon Bedrock中开始使用DeepSeek-R1模型
      • DeepSeek-R1现已可用

亚马逊云科技全面托管DeepSeek-R1模型现已上线

亚马逊云科技提供众多免费云产品,可以访问:亚马逊云科技

截至1月30日,DeepSeek-R1模型通过Amazon Bedrock Marketplace和Amazon Bedrock Custom Model Import在Amazon Bedrock中正式可用。此后,数千名客户已在Amazon Bedrock中部署了这些模型。客户们非常看重其强大的防护措施和全面的工具支持,以确保AI的安全部署。今天,我们通过扩展选项范围,包括全新的无服务器解决方案,进一步简化了在Amazon Bedrock中使用DeepSeek的流程。

完全托管的DeepSeek-R1模型现已在Amazon Bedrock中全面可用。亚马逊网络服务(亚马逊云科技)是首家以完全托管形式提供DeepSeek-R1模型的云服务提供商(CSP)。可以在亚马逊云科技上使用DeepSeek加速创新并交付切实的商业价值,而无需管理基础设施的复杂性。通过Amazon Bedrock的完全托管服务,只需使用单个API即可为生成式AI应用程序提供DeepSeek-R1的功能支持,并享受其丰富的功能和工具带来的优势。

根据DeepSeek的说法,他们的模型在MIT许可下公开可用,具备强大的推理、编码和自然语言理解能力。这些能力支持智能决策、软件开发、数学问题解决、科学分析、数据洞察以及全面的知识管理系统。

与所有AI解决方案一样,在生产环境中实施时需谨慎考虑数据隐私要求,检查输出中的偏差,并监控结果。在实施像DeepSeek-R1这样的公开模型时,请考虑以下几点:

数据安全 – 可以利用Amazon Bedrock的企业级安全、监控和成本控制功能,这些功能对于负责任地大规模部署AI至关重要,同时可以完全掌控数据。用户的输入和模型输出不会与任何模型提供商共享。可以默认使用这些关键安全功能,包括静态和传输中的数据加密、细粒度访问控制、安全连接选项,并在与Amazon Bedrock中的DeepSeek-R1模型通信时下载各种合规性认证。

负责任的AI – 可以通过Amazon Bedrock Guardrails根据应用需求和负责任的AI政策实施定制的防护措施。这包括内容过滤、敏感信息过滤以及可定制的安全控制等关键功能,通过上下文 grounding 和自动化推理检查防止幻觉(hallucination)。这意味着可以通过定义的政策集控制用户与Bedrock中DeepSeek-R1模型的交互,过滤掉不受欢迎和有害的内容。

模型评估 – 可以通过Amazon Bedrock model evaluation tools在几步之内评估和比较模型,以确定适合用例的最佳模型(包括DeepSeek-R1)。可以选择使用预定义指标(如准确性、鲁棒性和毒性)进行自动评估,或者选择基于主观或自定义指标(如相关性、风格和品牌声音一致性)的人工评估流程。模型评估提供内置的精选数据集,也可以引入自己的数据集。

我们强烈推荐将Amazon Bedrock Guardrails和Amazon Bedrock model evaluation features与DeepSeek-R1模型集成,以为生成式AI应用程序提供强大的保护。欲了解更多信息,请访问Protect your DeepSeek model deployments with Amazon Bedrock Guardrails和Evaluate the performance of Amazon Bedrock resources。

在Amazon Bedrock中开始使用DeepSeek-R1模型

如果是DeepSeek-R1模型的新用户,请前往Amazon Bedrock console,在左侧导航栏中选择“Bedrock configurations”下的“Model access”。要访问完全托管的DeepSeek-R1模型,请在DeepSeek中为DeepSeek-R1请求访问权限。随后,将在Amazon Bedrock中获得对该模型的访问权限。

  1. 访问DeepSeek-R1模型

接下来,要在Amazon Bedrock中测试DeepSeek-R1模型,请在左侧菜单栏中选择“Playgrounds”下的“Chat/Text”。然后在左上角选择“Select model”,选择“DeepSeek”作为类别,“DeepSeek-R1”作为模型,然后点击“Apply”。

  1. 选择DeepSeek-R1模型

使用选定的DeepSeek-R1模型,我运行了以下提示示例:

一个家庭有5000美元用于明年度假的储蓄。他们可以将钱存入年利率2%的储蓄账户,或者存入年利率4%的定期存款,但在这之前无法动用资金。如果他们在一年中需要1000美元的紧急支出,他们应如何在两种选择之间分配资金,以最大化他们的度假基金?

这个提示需要复杂的思维链,并产生非常精确的推理结果。

  1. 在Chat Playground中测试DeepSeek-R1

要了解更多关于提示使用建议的信息,请参阅DeepSeek-R1 model prompt guide。

通过选择“View API request”,还可以使用Amazon Command Line Interface (Amazon CLI)和Amazon SDK中的代码示例访问模型。可以使用“us.deepseek.r1-v1:0”作为模型ID。

以下是Amazon CLI命令示例:

aws bedrock-runtime invoke-model \--model-id us.deepseek.r1-v1:0 \--body "{\"prompt\": \"<|begin_of_sentence|><|User|>Type_Your_Prompt_Here<|Assistant|><think>\n\", \"max_tokens\": 512, \"temperature\": 0.5, \"top_p\": 0.9}" \--cli-binary-format raw-in-base64-out \--region us-west-2 \invoke-model-output.txt

该模型同时支持InvokeModel和Converse API。以下Python代码示例展示了如何使用Amazon Bedrock Converse API向DeepSeek-R1模型发送文本消息以进行文本生成。欲了解更多信息,请访问DeepSeek model inference parameters and responses。

import boto3
from botocore.exceptions import ClientError# 在想使用的亚马逊云科技区域创建一个Bedrock Runtime客户端。
client = boto3.client("bedrock-runtime", region_name="us-west-2")# 设置模型ID,例如DeepSeek-R1模型。
model_id = "us.deepseek.r1-v1:0"# 开始与用户消息的对话。
user_message = "Type_Your_Prompt_Here"
conversation = [{"role": "user","content": [{"text": user_message}],}
]try:# 使用基本推理配置将消息发送到模型。response = client.converse(modelId=model_id,messages=conversation,inferenceConfig={"maxTokens": 512, "temperature": 0.5, "topP": 0.9},)# 提取并打印响应文本。response_text = response["output"]["message"]["content"][0]["text"]print(response_text)except (ClientError, Exception) as e:print(f"ERROR: Can't invoke '{model_id}'. Reason: {e}")exit(1)

要为DeepSeek-R1模型启用Amazon Bedrock Guardrails,在左侧导航栏中选择“Safeguards”下的“Guardrails”,通过配置所需数量的过滤器创建防护栏。例如,如果过滤“politics”这个词,防护栏将识别提示中的这个词并显示被阻止的消息。

可以使用不同的输入测试防护栏,以评估其性能。可以通过设置禁止主题、词语过滤器、敏感信息过滤器和阻止消息来调整防护栏,直到满足需求。

要了解更多关于Amazon Bedrock Guardrails的信息,请访问Stop harmful content in models using Amazon Bedrock Guardrails或亚马逊云科技机器学习博客频道上关于Amazon Bedrock Guardrails的其他深入博客文章。

以下是展示如何利用Amazon Bedrock中完全托管的DeepSeek-R1模型的演示演练:

DeepSeek-R1现已可用

DeepSeek-R1现已在Amazon Bedrock中以完全托管形式提供,支持美国东部(弗吉尼亚北部)、美国东部(俄亥俄州)和美国西部(俄勒冈州)亚马逊云科技区域,通过跨区域推理提供服务。请查看完整的区域列表以获取未来更新。欲了解更多信息,请查看DeepSeek in Amazon Bedrock product page和Amazon Bedrock pricing page。

立即在Amazon Bedrock console中试用DeepSeek-R1模型,并通过Amazon re:Post for Amazon Bedrock或常用的亚马逊云科技支持联系方式发送反馈。

— Channy

2025年3月10日更新 — 修复了模型选择和模型ID的截图。

2025年3月13日更新 — 添加了DeepSeek-R1 model prompt guide和DeepSeek model inference parameters and responses的指南链接。

亚马逊云科技的免费云产品,助您零成本开启云计算之旅,探索无限可能!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/74397.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

IO模型种类

文章目录 同步阻塞 I/O&#xff08;Blocking I/O&#xff0c;BIO&#xff09;同步非阻塞 I/O&#xff08;Non-blocking I/O&#xff0c;NIO&#xff09;I/O 多路复用&#xff08;I/O Multiplexing&#xff09;信号驱动 I/O&#xff08;Signal-driven I/O&#xff09;异步 I/O&a…

C语言入门教程100讲(40)文件定位

文章目录 1. 什么是文件定位?2. 文件指针3. 文件定位函数3.1 `fseek` 函数3.2 `ftell` 函数3.3 `rewind` 函数4. 示例代码代码解析:输出结果:5. 常见问题问题 1:`fseek` 的 `offset` 参数可以为负数吗?问题 2:如何判断文件定位是否成功?问题 3:`rewind` 和 `fseek(file…

el-table折叠懒加载支持排序

el-table折叠懒加载支持排序 因为el-table懒加载的子节点是通过缓存实现的&#xff0c;如果想在展开的情况下直接刷新对应子节点数据&#xff0c;要操作el-table组件自身数据&#xff0c;否则不会更新 以排序功能为例 maps: new Map() //用于存储子节点懒加载的数据// 加载子…

Off-Road-Freespace-Detection配置pytorch2.0.0

一、概述 在github上进行开源代码搜索&#xff0c;发现了Off-Road-Freespace-Detection&#xff08;链接如下所示&#xff09;。这是对越野环境可通行区域的检测&#xff0c;在经过测试之后&#xff0c;发现对自己有益。 GitHub - chaytonmin/Off-Road-Freespace-Detection: O…

ChatGPT降低论文AIGC重复率的提示词合集(高效降重方法)

&#x1f4a1; 问题&#xff1a;写完毕业论文后&#xff0c;查AIGC率过高&#xff0c;手动降重后仍然很高&#xff0c;该怎么办&#xff1f; &#x1f4cc; 解决方案&#xff1a; 1️⃣ 先查AIGC率&#xff08;找出AI生成的部分&#xff09; 2️⃣ 用ChatGPT优化&#xff08;使…

【Spring 新特性全解析】

Spring 新特性全解析 引言 在当今 Java 企业级开发领域&#xff0c;Spring 框架无疑是中流砥柱般的存在。它以其强大的功能、高度的可扩展性和便捷的开发体验&#xff0c;赢得了广大开发者的青睐。随着技术的不断演进&#xff0c;Spring 也在持续更新迭代&#xff0c;带来了一…

System.arraycopy 在音视频处理中的应用

在音视频开发领域&#xff0c;我们经常需要处理大量的数据&#xff0c;例如音频 PCM 数据的传输、视频帧的缓存等。在这些场景下&#xff0c;数据的复制与传输往往直接影响到应用的性能。Java 提供的 System.arraycopy 方法&#xff0c;在音视频处理代码中出现频率非常高。本文…

fastapi+angular评论和回复

说明&#xff1a;fastapiangular评论和回复 效果图: step1:sql show databases; DROP TABLE users; SHOW CREATE TABLE db_school.users; show tables; use db_school; SELECT * FROM db_school.jewelry_categories; CREATE DATABASE db_school; select *from users -- 用户…

C++11QT复习 (三)

文章目录 [toc]Day5-2 文件IO&#xff08;2025.03.24&#xff09;1. 缓冲区与刷新1.1 常见的缓冲刷新方式 2. 文件读写操作2.1 读取文件2.2 写入文件2.3 追加模式写入2.3 完整代码 3. 文件定位操作4. 字符串IO5. 配置文件解析示例6. 完整代码7. 二进制文件操作总结 Day5-2 文件…

Redis Sentinel 详解

Redis Sentinel 详解 1. 什么是 Redis Sentinel&#xff1f;有什么用&#xff1f; Redis Sentinel&#xff08;哨兵&#xff09; 是 Redis 官方提供的高可用性解决方案&#xff0c;主要用于监控、通知和自动故障转移。当 Redis 主节点&#xff08;master&#xff09;发生故障…

AI日报 - 2025年3月25日

&#x1f31f; 今日概览&#xff08;60秒速览&#xff09; ▎&#x1f916; AGI突破 | Nebula&#xff08;Google Gemini 2.0 Pro&#xff09;破解复杂数学谜题 编码与推理能力再上新台阶 ▎&#x1f4bc; 商业动向 | Sesame AI开源10亿参数语音模型CSM-1B 语音AI进入普惠时代 …

AI医疗革命:英伟达GTC 2025医疗健康与生命科学会议全分析

AI医疗革命:英伟达GTC 2025医疗健康与生命科学会议全分析 一、GTC 2025:AI 医疗的算力与生态双突破 1.1 黄仁勋演讲核心:从训练到推理的代际跨越 在科技界瞩目的英伟达 GTC 2025 大会上,英伟达 CEO 黄仁勋的主题演讲成为全场焦点,为 AI 医疗领域带来了极具变革性的消息。…

【机器学习/大模型/八股文 面经 (一)】

1. PPO算法中使用GAE的好处以及参数γ和λ的作用是什么? 参考答案: GAE(Generalized Advantage Estimation) 的优势在于通过指数加权多步TD误差,平衡优势估计的偏差与方差,提升策略优化的稳定性。γ(折扣因子):控制未来奖励的衰减程度,值越大表示更关注长期收益。λ…

03 Python 基础:数据类型、运算符与流程控制解析

文章目录 一、数据类型 内置的六大类数字类型整数类型 int浮点数 float布尔 bool字符串 str 变量命名 二、数字类型的相互转换显式类型的转换整数&#xff0c;浮点数&#xff0c;复数 之间的显式转换 隐式类型的转换 三、标识符算术运算符比较运算符逻辑运算符位运算符赋值运算…

视频知识库初步设想

将视频字幕提取出来作为知识库来源定位,下一步设想:把视频上的图片信息也精简出来作为定位。 下面是测试例子: 入参: {"model":"deepseek-ai/DeepSeek-R1-Distill-Llama-8B","messages":[{"role":"system","cont…

数据库原理13

1.关系模式设计不当引起的问题&#xff1a;数据冗余&#xff1b;更新异常&#xff1b;插入异常&#xff1b;删除异常 2.外码可以是单个属性&#xff0c;也可以是属性组 3.动态SQL是SQL标准提供的一种语句运行机制 4.若一个模式分解保持函数依赖&#xff0c;则该分解一定具有…

初级:异常处理面试题深度解析

一、引言 在Java开发中&#xff0c;异常处理是确保程序健壮性和稳定性的重要机制。面试官通过相关问题考察候选人对异常处理的理解和运用能力&#xff0c;以及在实际开发中处理异常的经验。本文将深入剖析常见的异常处理面试题&#xff0c;结合实际开发场景&#xff0c;帮助读…

Apache Spark - 用于大规模数据分析的统一引擎

Apache Spark - 用于大规模数据分析的统一引擎 下载运行示例和 Shell使用 Spark Connect 在 Anywhere 上运行 Spark 客户端应用程序 在集群上启动从这里去哪里使用 Spark Shell 进行交互式分析基本有关数据集作的更多信息缓存 自包含应用程序从这里去哪里 Apache Spark 是用于大…

餐饮管理系统的设计与实现(代码+数据库+LW)

摘 要 互联网发展至今&#xff0c;无论是其理论还是技术都已经成熟&#xff0c;而且它广泛参与在社会中的方方面面。它让信息都可以通过网络传播&#xff0c;搭配信息管理工具可以很好地为人们提供服务。针对信息管理混乱&#xff0c;出错率高&#xff0c;信息安全性差&#…

【C#】Winform调用NModbus实现Modbus TCP 主站通讯

一、前言 Modbus是一种串行通信协议&#xff0c;是工业领域全球最流行的协议之一。 1.1 环境 系统&#xff1a;Win11 工具&#xff1a;Visual Studio 2022 .Net 版本&#xff1a;.Net Framework4.6.0 依赖库&#xff1a;NModbus 3.0.81 1.2 协议类型 Modbus RTU&#xff1a;一…