如何使用 DeepSeek R1 构建开源 ChatGPT Operator 替代方案

开源大型语言模型(LLMs)的兴起使得创建 AI 驱动的工具比以往任何时候都更容易,这些工具可以与 OpenAI 的 ChatGPT Operator 等专有解决方案相媲美。在这些开源模型中,DeepSeek R1 以其强大的推理能力、自由的可访问性和适应性而脱颖而出。通过将 DeepSeek R1 与 Browser Use 等工具相结合,您可以构建一个强大的、完全开源的 ChatGPT Operator 替代品,而无需花费数百美元进行高级订阅。

本文将指导您完成设置 DeepSeek R1 和浏览器使用的过程,以创建能够执行复杂任务的 AI 代理,包括 Web 自动化、推理和自然语言交互。

无论您是初学者还是经验丰富的开发人员,本分步指南都将帮助您入门。

什么是 ChatGPT Operator,为什么需要开源替代品?

ChatGPT Operator 是 OpenAI 提供的一项高级功能,允许用户创建能够执行复杂任务的高级 AI 代理,例如推理、Web 自动化和多步骤问题解决。

ChatGPT Operator 每月收费 200 美元,这使得个人、小型企业或预算有限的组织更难获得。

为什么需要开源替代方案?

虽然 ChatGPT Operator 功能强大,但它有几个限制,使开源替代方案具有吸引力:

  • 成本: 每月 200 美元的订阅费对于许多用户来说可能令人望而却步。

  • 数据隐私:使用专有 API 需要将数据发送到外部服务器,这可能不符合隐私政策或法规要求。

  • 有限的定制:专有解决方案通常会限制微调或特定于任务的优化,从而限制它们对专业用例的适应性。

通过选择 DeepSeek R1Browser Use 等开源工具,您可以克服这些挑战并解锁以下几个好处:

  • 节省成本:DeepSeek R1 和 Browser Use 都是完全免费和开源的,无需订阅费用。

  • 完全控制:在本地或您自己的服务器上托管工具可确保完全的数据隐私和安全

  • 可定制性:您可以针对特定任务微调模型,将其与其他工具集成,并修改系统以满足您的独特要求。

开源方法不仅可以减少对专有平台的依赖,还可以让您能够构建针对您的需求量身定制的解决方案,同时保持对成本和数据的控制。

关键组件:DeepSeek R1 和浏览器使用

DeepSeek R1

DeepSeek R1 是一个针对推理任务优化的开源LLM软件。它在思维链问题解决、编码辅助和自然语言理解方面表现出色。它有多种尺寸(例如 1.5B、7B 参数)可供选择,使其能够适应不同的硬件功能。

浏览器使用

Browser Use 是一种开源工具,它使 AI 代理能够执行基于浏览器的任务,例如 Web 抓取、表单填写和自动导航。它提供了一个用户友好的界面,可以与 DeepSeek R1 LLMs 等集成以增强功能。

第 1 步:设置您的环境

硬件要求

  • 对于较小版本的 DeepSeek R1(例如,1.5B 参数),CPU 或中端 GPU (8GB VRAM) 就足够了。

  • 较大的版本需要高端 GPU(例如 NVIDIA A100 或 RTX 4090)。

操作系统

建议使用 Linux 或 macOS 以便于设置。Windows 用户可以使用 WSL (Windows Subsystem for Linux)。

Python 环境

创建 Python 虚拟环境以隔离依赖项:

暂时无法在飞书文档外展示此内容

安装所需的库:

暂时无法在飞书文档外展示此内容

第 2 步:使用 API 运行 DeepSeek 或使用 Ollama 在本地运行

DeepSeek API 使用

要与 DeepSeek API 交互,请按照以下更新的步骤作:

获取 API 密钥

在 DeepSeek 平台上注册并从 “API Keys” 部分生成 API 密钥。请妥善保存此密钥,因为它不会再次显示。

进行第一次 API 调用

DeepSeek API 与 OpenAI 的 API 格式兼容,因此很容易与现有的 OpenAI SDK 或软件集成。下面是一个 Python 实现的示例:

暂时无法在飞书文档外展示此内容

示例: 如果您更喜欢使用 cURL,请按以下步骤发出请求:

暂时无法在飞书文档外展示此内容

型号选择

  • 为 DeepSeek-R1 指定 model=“deepseek-reasoner”。

  • model=“deepseek-chat” 用于通用聊天任务。

对于与 OpenAI 兼容的配置,也可以将 base_url 设置为 https://api.deepseek.com/v1,但 /v1 路径与模型版本无关。

使用 Ollama 在本地运行 DeepSeek

Ollama 简化了在本地计算机上运行 DeepSeek-R1 等大型语言模型的过程。以下是正确设置和使用它的方法:

  1. 安装 Ollama

从其官方网站下载并安装 Ollama。

  1. 拉取所需的模型

使用以下命令下载 DeepSeek-R1 的特定版本:

暂时无法在飞书文档外展示此内容

  1. 在本地运行模型

下载后,使用以下命令运行模型:

暂时无法在飞书文档外展示此内容

这将启动一个交互式会话,您可以在其中直接与模型交互。

型号变体

DeepSeek 提供了几个基于 Qwen 和 Llama 架构的提炼版本,针对不同的用例进行了优化:

DeepSeek-R1-Distill-Qwen-7B

暂时无法在飞书文档外展示此内容

DeepSeek-R1-Distill-Llama-70B:

暂时无法在飞书文档外展示此内容

硬件注意事项

  • 1.5B 或 7B 等较小的型号可以在消费级 GPU 甚至 CPU 上运行。

  • 较大的型号(例如 70B)需要具有大量 VRAM 的高端 GPU(例如 NVIDIA A100 或 RTX 4090)。

  1. 通过 API 进行交互式聊天

Ollama 提供了一个 API,用于将本地运行的模型集成到您的应用程序中:

暂时无法在飞书文档外展示此内容

第 3 步:安装 Browser Use

Browser Use 使您的 AI 代理能够与 Web 浏览器交互。请执行以下步骤:

  1. 安装

从 GitHub 克隆 Browser Use 存储库:

暂时无法在飞书文档外展示此内容

  1. 配置

设置浏览器使用 WebUI:

暂时无法在飞书文档外展示此内容

在浏览器中打开 WebUI 以配置代理设置。您可以指定:

  • LLM模型(例如 DeepSeek R1)

  • 浏览器设置(例如,窗口大小)

第 4 步:结合使用 DeepSeek R1 和浏览器

要创建集成这两种工具的功能性 AI 代理,请执行以下作:

代理配置

修改 Browser Use 中的代理设置,使其与 DeepSeek R1 连接:

暂时无法在飞书文档外展示此内容

运行代理

启动 DeepSeek R1 和浏览器使用:

暂时无法在飞书文档外展示此内容

一旦这两项服务都运行起来,代理就可以自主执行填写表单、抓取数据或导航网站等任务。

第 5 步:及时工程以获得更好的结果

要优化 AI 代理的性能,请使用提示工程技术。例如:

通用提示模板

暂时无法在飞书文档外展示此内容

此结构可确保清晰度并提高任务执行准确性。以下是一些您可以通过运行来尝试的演示:

暂时无法在飞书文档外展示此内容

示例 1

提示:在 Google Docs 中写一封信给我爸爸,感谢他所做的一切,并将文档保存为 PDF。

示例 2

提示:查找往 北京 的 kayak.com 航班,时间从 2024.12.25 到 02.02.2025。

示例 3

提示:阅读我的简历并找到ML工作,将它们保存到一个文件中,然后在新的标签页中开始申请它们,如果你需要帮助,就问我。


结论

通过将 DeepSeek R1 与浏览器使用相结合,您可以构建一个功能齐全的 ChatGPT Operator 替代方案,该替代方案免费、开源且高度可定制。这种设置不仅可以节省成本,还可以让您完全控制数据隐私和系统行为。

无论您是自动化 Web 任务、构建对话代理,还是尝试使用 Retrieval-Augmented Generation 等高级 AI 功能,本指南都提供了您入门所需的一切。立即拥抱开源的力量,创建您自己的智能助手!

Deepseek API 直接调用教程

如果 API Key 有了之后,我们就可以调用它了,通过 Apifox 集成 Deepseek API,可快速完成 API 调试。

第一步:填写 API Key

获得 API 密钥后,你可以在 API 文档中开始使用它,无需编写代码:

  1. 访问由 Apifox 创建的 DeepSeek 在线 API 文档

  1. 打开 Apifox 桌面:点击页面上的「Run in Apifox」,在弹出的窗口中点击「在桌面上打开」,引导你进入 Apifox 的桌面版本(如果你尚未下载该应用程序,则需要先下载)。

下载最新版 Apifox

  1. 输入你的 API 密钥:打开文档后,在 Apifox 中选择一个接口,点击「Auth」,选择「Bearer Token」。然后复制之前创建的令牌,将其粘贴「Token」上密钥保存在本地,因此不存在泄露风险。

还有一种方法设置 API Key,在项目右上角的 “环境管理” 中,点击“正式环境”,这个环境变量的值就是上面创建的 Deepseek API 的 API Key,添加完成后保存即可。

第二步:调用 API

  1. 点击“发送”即可调用 API。如果调用成功,API 响应将显示在下面的页面中。

  1. 修改 Body 中的 messages 里的信息,你就可以实现不同的对话。

  1. 如果要实现流式输出,可以将 stream 的值改为 true

💡

通过指定 model='deepseek-chat' 即可调用 DeepSeek-V3。 通过指定 model='deepseek-reasoner',即可调用 DeepSeek-R1。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/70355.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用Docker Desktop部署GitLab

1. 环境准备 确保Windows 10/11系统支持虚拟化技术(需在BIOS中开启Intel VT-x/AMD-V)内存建议≥8GB,存储空间≥100GB 2. 安装Docker Desktop 访问Docker官网下载安装包安装时勾选"Use WSL 2 instead of Hyper-V"(推荐…

【复习】Java集合

集合概念 集合与数组 数组是固定长度;集合是动态长度的数据结构,需要动态增加或删除元素 数组可以包含基本数据类型和对象;集合只能包含对象 数组可以直接访问元素;集合需要通过迭代器访问元素 线程安全的集合? …

vue3 文件类型传Form Data数据格式给后端

在 Vue 3 中,如果你想将文件(例如上传的 Excel 文件)以 FormData 格式发送到后端,可以通过以下步骤实现。这种方式通常用于处理文件上传,因为它可以将文件和其他数据一起发送到服务器。 首先,创建一个 Vue…

使用 INFINI Console 配置集群监控 Webhook 通知指南

在集群管理中,监控关键指标如CPU、内存、磁盘、JVM等是至关重要的。对于Easysearch及ES生态系统,还需要关注集群本身的指标,例如搜索延迟、集群状态、节点移除等。INFINI Console不仅提供了默认的监控指标,还支持用户自定义监控项…

WPF的页面设计和实用功能实现

目录 一、TextBlock和TextBox 1. 在TextBlock中实时显示当前时间 二、ListView 1.ListView显示数据 三、ComboBox 1. ComboBox和CheckBox组合实现下拉框多选 四、Button 1. 设计Button按钮的边框为圆角,并对指针悬停时的颜色进行设置 一、TextBlock和TextBox…

二级公共基础之数据结构与算法篇(八)排序技术

目录 前言 一、交换类排序 1.冒泡排序法 1. 冒泡排序的思想 2. 冒泡排序的实现步骤 3. 示例 4. 冒泡排序的特点 2.快速排序 1. 快速排序的核心思想 2. 快速排序的实现步骤 3. 示例代码(C语言) 4. 快速排序的特点 二、插入类排序 1. 简单插入排序 1.简单插入排…

记录一次 ALG 的处理过程

前几天朋友找我帮忙,说碰到很大困难了,实际上,不过如此 现象是这样的: FreeSWITCH mod_unimrcp 工作不正常 FS 和 mrcp-server 两边同时抓包,看到的是: sip 流程正常 FS TCP 连接到 mccp-server 失败&…

【Linux网络编程】IP协议格式,解包步骤

目录 解析步骤 1.版本字段(大小:4比特位) 2.首部长度(大小:4比特位)(单位:4字节) 🍜细节解释: 3.服务类型(大小:8比特…

CSDN文章质量分查询系统【赠python爬虫、提分攻略】

CSDN文章质量分查询系统 https://www.csdn.net/qc 点击链接-----> CSDN文章质量分查询系统 <------点击链接 点击链接-----> https://www.csdn.net/qc <------点击链接 点击链接-----> CSDN文章质量分查询系统 <------点击链接 点击链…

HTML应用指南:利用GET请求获取全国泸溪河门店位置信息

随着新零售业态的快速发展,门店位置信息的获取变得越来越重要。作为新兴烘焙品牌之一,泸溪河自2013年在南京创立以来,一直坚持“健康美味,香飘世界”的企业使命,以匠人精神打造新中式糕点。为了更好地理解和利用这些数据,本篇文章将深入探讨GET请求的实际应用,并展示如何…

如何在 React 中测试高阶组件?

在 React 中测试高阶组件可以采用多种策略&#xff0c;以下是常见的测试方法&#xff1a; 1. 测试高阶组件返回的组件 高阶组件本身是一个函数&#xff0c;它返回一个新的组件。因此&#xff0c;可以通过测试这个返回的组件来间接测试高阶组件的功能。通常使用 Jest 作为测试…

R语言Stan贝叶斯空间条件自回归CAR模型分析死亡率多维度数据可视化

全文链接&#xff1a;https://tecdat.cn/?p40424 在空间数据分析领域&#xff0c;准确的模型和有效的工具对于研究人员至关重要。本文为区域数据的贝叶斯模型分析提供了一套完整的工作流程&#xff0c;基于Stan这一先进的贝叶斯建模平台构建&#xff0c;帮助客户为空间分析带来…

Casbin 权限管理介绍及在 Go 语言中的使用入门

引言 在现代软件开发过程中&#xff0c;权限管理是一个至关重要的环节&#xff0c;它关系到系统的安全性和用户体验。Casbin 是一个强大的访问控制库&#xff0c;支持多种访问控制模型&#xff0c;如 ACL&#xff08;访问控制列表&#xff09;、RBAC&#xff08;基于角色的访问…

快速入门——第三方组件element-ui

学习自哔哩哔哩上的“刘老师教编程”&#xff0c;具体学习的网站为&#xff1a;10.第三方组件element-ui_哔哩哔哩_bilibili&#xff0c;以下是看课后做的笔记&#xff0c;仅供参考。 第一节 组件间的传值 组件可以有内部Data提供数据&#xff0c;也可由父组件通过prop方式传…

【算法通关村 Day7】递归与二叉树遍历

递归与二叉树遍历青铜挑战 理解递归 递归算法是指一个方法在其执行过程中调用自身。它通常用于将一个问题分解为更小的子问题&#xff0c;通过重复调用相同的方法来解决这些子问题&#xff0c;直到达到基准情况&#xff08;终止条件&#xff09;。 递归算法通常包括两个主要…

朴素贝叶斯法

文章目录 贝叶斯定理朴素贝叶斯法的学习与分类条件独立假设朴素贝叶斯的后验概率最大化准则朴素贝叶斯的基本公式 朴素贝叶斯法的参数估计极大似然估计 贝叶斯定理 前置知识&#xff1a;条件概率、全概率、贝叶斯公式 推荐视频&#xff0c;看完视频后搜索博客了解先验概率、后…

《A++ 敏捷开发》- 20 从 AI 到最佳设计

“我们现在推行AIGC&#xff0c;服务端不需要UI交互设计的用AI自动产出代码&#xff0c;你建议的结对编程、TDD等是否还适用&#xff1f;” 这两年AI确实很火&#xff0c;是报纸、杂志的热门话题。例如&#xff0c;HBR杂志从2024年9月至2025年二月份3期&#xff0c;里面有接近一…

GO系列-IO 文件操作

os io 判断文件是否存在 func fileExist(filePath string) (bool, error) {_, err : os.Stat(filePath)if err nil {return true, nil}if os.IsNotExist(err) {return false, nil}return false, &CheckFileExistError{filePath} } 读取文件内容 func readFileContext(…

rs485协议、电路详解(保姆级)

起源 RS-485即Recommended Standard 485 协议的简写。1983年被电子工业协会(EIA)批准为一种通讯接口标准. 数据在通信双方之间传输&#xff0c;本质是传输物理的电平&#xff0c;比方说传输5V的电压 -1V的电压信号&#xff0c;这些物理信号在传输过程中会受到很多干扰&#x…

JavaWeb-Tomcat服务器

文章目录 Web服务器存在的意义关于Web服务器软件Tomcat服务器简介安装Tomcat服务器Tomcat服务器源文件解析配置Tomcat的环境变量启动Tomcat服务器一个最简单的webapp(不涉及Java) Web服务器存在的意义 我们之前介绍过Web服务器进行通信的原理, 但是我们当时忘记了一点, 服务器…