AI智能体技术突破:引领科技新浪潮

AI智能体技术突破:引领科技新浪潮

    • 基于大模型的 AI Agent 工作流
    • 基于大模型的 AI Agent 工作流效果
    • AI Agent 的四种设计模式
      • Reflection 反思设计模式
      • Tool use 工具使用设计模式
      • Planning 规划设计模式
      • Multiagent collaboration 多智能体协作设计模式

在这里插入图片描述

吴恩达在红杉美国 AI 峰会上分享了他对 AI Agent 智能体的看法,主要包括以下 3点:基于大模型的 AI Agent 工作流、AI Agent 工作流效果、AI Agent 的四种设计模式。

基于大模型的 AI Agent 工作流

我很期待与大家分享我在 AI Agent 智能体中看到的令人兴奋的趋势,我认为每个 AI 从业者都应该关注这个趋势。

目前,我们使用大语言模型的主要方式是一种非智能体工作流程,即您输入一个提示词,大模型就生成一个回答。这有点像让一个人坐下来一次性从头到尾编写一篇文章,而不允许使用退格键,尽管这样做很难,但大模型的表现出奇地出色。

相比之下,AI Agent 智能体工作流程看起来是这样的(如下图右边所示):一个 AI 大模型,我们让它写一份论文大纲。需要上网查资料吗?如果需要,就联网。然后写初稿、读初稿,并思考哪些部分需要修改。继续修改初稿并推进。
在这里插入图片描述
很多人没有意识到,这种做法可以带来显著的改进效果。我自己在使用这些代理工作流程时也感到非常惊讶,它们工作得如此之好。

总之,这种有迭代反思的做法会带来显著的改进效果。

基于大模型的 AI Agent 工作流效果

比如:给定一个非空整数列表,返回位于偶数位置的所有奇数元素的和。大模型生成的答案是像这样的代码片段(如下图所示):

在这里插入图片描述

事实证明,如果你使用 GPT-3.5,在零样本提示的条件下,GPT-3.5 的准确率是 48%。GPT-4 要好得多,达到了 67%。但如果你采用的是 AI Agent 智能体工作流,并将其打包,GPT-3.5 实际上能表现更好,甚至比 GPT-4 还好。

如果你围绕 GPT-4 构建这样的工作流,GPT-4 也能表现得很好。注意,处于AI Agent 智能体工作流中的 GPT-3.5 实际上优于 GPT-4。这是一个信号

在这里插入图片描述
解释一下上图:Reflection、Tool Use、Planning、Multiagent 是吴恩达提到的四种 Agent 设计模式,后续会详细介绍。

其实基于 Agent 的工作流程才符合人类的习惯,毕竟对于一段复杂的程序,没有一个程序员是从头写到尾的,一般都是先能跑通,然后不断优化重构,补充异常处理,持续迭代优化的过程。

AI Agent 的四种设计模式

Reflection 反思设计模式

很好理解,如果你让大模型写一段代码,它会立马给你一个反馈。这时候你可以将它输出的代码片段再输入回去,让大模型仔细检查它写的代码的准确性、结构规范性等,并且给出评论。

然后再将这些反馈结果输入给大模型,它可能会输出一个比第一版更好的代码。

在这里插入图片描述
我之前描述的是一个单一的编码 AI Agent 智能体 ,你提示它与自己进行交互。这个想法的一种自然延伸是,不是单一的代码 AI Agent 智能体 ,而是有两个AI Agent 智能体,一个是编码 AI Agent 智能体 ,另一个是评审 AI Agent 智能体 。它们可以基于同一个语言模型,但你以不同的方式对它们进行提示,对一个说“你是专业编码者,编写代码”,对另一个说"你是专业代码评审员,评审这段代码"。这种工作流程实际上非常容易实现,我认为它是一种通用技术,可以为很多工作流程带来显著的大语言模型性能提升。

Tool use 工具使用设计模式

相信大家使用 Copliot,或者月之暗面的 Kimi Chat,你给出 Prompt 提示词,它首先会检索互联网上的内容,基于检索到的内容进行总结分析,给出结论。

这个其实就是大模型使用「网页搜索」工具的例子。

再比如:你问大模型,今天的天气如何?这个时候大模型会调用天气预报工具得到今天的的天气状况。

在这里插入图片描述

Planning 规划设计模式

在我进行的一些现场演示中,有些演示会失败,AI Agent 智能体会重新规划路径。我经历过很多这样的时刻。其中一个例子是从 HuggingGPT 论文中改编的,输入的是:请生成一张图片,一个女孩在看书,她的姿态和图像中的男孩一样,再使用你的声音描述这张新图片。

在这里插入图片描述
今天有了 AI Agent 智能体,你可以确定第一件要做的事是确定男孩的姿态,提取姿态。接下来需要找到一个姿态图像模型,遵循指令生成一张女孩的图像。然后使用图像 - 文本模型得到描述。最后使用文本转语音模型读出描述。

Multiagent collaboration 多智能体协作设计模式

多智能体协作,这部分很很有趣,比你想象的好很多,类似于之前大火的 AI 斯坦福小镇。
在这里插入图片描述
吴恩达举的例子是开源项目 ChatDev,你可以让一个大模型扮演不同的角色,比如:公司CEO、设计师、产品经理或测试人员,这些 Agents 会相互协作,共同开发一个 App 或者复杂程序。

虽然不是每次都能成功,但有时确实非常惊艳!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/821716.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Flink CDC在阿里云DataWorks数据集成应用实践

摘要:本文整理自阿里云 DataWorks 数据集成团队的高级技术专家 王明亚(云时)老师在 Flink Forward Asia 2023 中数据集成专场的分享。内容主要为以下四部分: 阿里云 DataWorks 数据集成介绍基于 Flink CDC 数据集成新版引擎架构和…

【鸿蒙开发】生命周期

1. UIAbility组件生命周期 UIAbility的生命周期包括Create、Foreground、Background、Destroy四个状态。 UIAbility生命周期状态 1.1 Create状态 Create状态为在应用加载过程中,UIAbility实例创建完成时触发,系统会调用onCreate()回调。可以在该回调中…

会议室预约小程序开源版开发

会议室预约小程序开源版开发 支持设置免费预约和付费预约、积分兑换商城、积分签到等 会议室类目,提供多种类型和设施的会议室选择,满足不同会议需求。 预约日历,展示会议室预约情况,方便用户选择空闲时段。 预约记录&#xff0…

秋招复习笔记——八股文部分:网络基础

TCP/IP 网络模型 应用层 最上层的,也是我们能直接接触到的就是应用层(Application Layer),我们电脑或手机使用的应用软件都是在应用层实现。那么,当两个不同设备的应用需要通信的时候,应用就把应用数据传…

java绘图在ubuntu报错

把JRT网站部署到ubuntu桌面系统上,开始没测试绘图部分功能,只试了连PostGreSql部分正常。后面试了生成位图部分发现报错。 报下面错误: (ColorModel.java:220)\n\tat java.desktop/java.awt.image.BufferedImage.(BufferedImage.java:286)\n…

windows Webrtc +VS2019 (M124)下载编译以及调通测试demo

下载depot tools 设置梯子 git config --global http.proxy 127.0.0.1:10000 git config --global https.proxy 127.0.0.1:10000 下载 $ git clone https://chromium.googlesource.com/chromium/tools/depot_tools.git 设置depot_tools目录为环境变量 下载webrtc # 设置系统代…

2024年4月最新版GPT

2024年4月最新版ChatGPT/GPT4, 附上最新的使用教程。 随着人工智能技术的不断发展,ChatGPT和GPT4已经成为了人们日常生活中不可或缺的助手。2024年4月,OpenAI公司推出了最新版本的GPT4,带来了更加强大的功能和更加友好的用户体验。本文将为大家带来最新版GPT4的实用…

微软提供用于测试框架的SDK

微软发布了 MSTest SDK。 MSTest SDK基于 MSBuild Project SDK 系统构建并基于MSTest 运行程序,旨在为开发人员提供更好的使用 Microsoft 单元测试框架 MSTest 进行测试的体验。 微软表示, 4 月 11 日发布的MSTest SDK通过合理的默认设置和灵活的选项使…

安全中级-环境安装(手动nginx以及自动安装php,mysql)

为了方便大家跟bilibili课程,出了第一节环境 bilibili搜凌晨五点的星可以观看相关的教程 一、环境 ubentu 二、nginx手动安装 2.1第一步 wget https://nginx.org/download/nginx-1.24.0.tar.gz 2.2下载好安装包以后解压 tar -zxvf nginx-1.21.6.tar.gz2.3安…

Keepalived+LVS+nginx搭建nginx高可用集群

一、简介 nginx是一款非常优秀的反向代理工具,支持请求分发,负载均衡,以及缓存等等非常实用的功能。在请求处理上,nginx采用的是epoll模型,这是一种基于事件监听的模型,因而其具备非常高效的请求处理效率…

IDEA: Unable to resolve table ‘xxx‘

描述: 在 IDEA 连接到数据库后,SQL 语句提示 Unable to resolve table 表名,且其它字段也飘红报错。 解决: 右键点击数据库,选择 Tools -> Manage Shown Schemas... 勾选你所使用的数据库即可: 1、2、3…

ShardingSphere:强大的分布式数据库中间件【图文】

ShardingSphere的诞生 ShardingSphere的结构 Sharding-JDBC :它提供了一个轻量级的 Java 框架,在 Java 的 JDBC 层提供额外的服务。使用客户端直连数据库,以 jar 包形式提供服务,无需额外部署和依赖,可理解为增强版的 JDBC 驱动&…

模板小细节与了解STL

1、模板小细节 1、在C中&#xff0c;已经写好了有关swap函数来供我们使用&#xff1a; 2、编译器也会偷懒&#xff0c;除非我们给强制要求&#xff1a; 通过调试我们可以看到&#xff0c;编译器不会主动去找模板&#xff0c;这时候我们要在add后加<>即可让Add使用模板函…

免费的 ChatGPT、GPT4.0、GPTs、Midjourney-AI绘画(国内版)

&#x1f525;博客主页&#xff1a;只恨天高 ❤️感谢大家点赞&#x1f44d;收藏⭐评论✍️ ChatGPT3.5、GPT4.0、GPTs、AI绘画相信对大家应该不感到陌生吧&#xff1f;简单来说&#xff0c;GPT-4技术比之前的GPT-3.5相对来说更加智能&#xff0c;会根据用户的要求生成多种内容…

鸿蒙原生应用元服务-访问控制(权限)开发场景与权限声明

一、场景介绍 应用的APL&#xff08;Ability Privilege Level&#xff09;等级分为normal、system_basic和system_core三个等级&#xff0c;默认情况下&#xff0c;应用的APL等级都为normal等级。权限类型分为system_grant和user_grant两种类型。 二、配置文件权限声明 应用需要…

Docker 入门介绍及简单使用

Docker 的简单介绍 中文官网&#xff1a;Docker中文网 官网 英文官网&#xff1a;Docker: Accelerated Container Application Development Docker 是一个开源的应用容器引擎&#xff0c;它允许开发者打包应用及其依赖包到一个可移植的容器中&#xff0c;然后发布到任何流行的 …

(十二)C++自制植物大战僵尸游戏多用户存档实现(一)

植物大战僵尸游戏开发教程专栏地址http://t.csdnimg.cn/8UFMs 游戏存档 游戏存档允许玩家保存游戏进度&#xff0c;以便在之后的时间继续游戏。通过存档&#xff0c;玩家可以暂停游戏并在需要时重新开始&#xff0c;而不必从头开始或重新完成已经完成的任务。游戏通常提供多个…

HarmonyOS开发实战:【亲子拼图游戏】

概述 本篇Codelab是基于TS扩展的声明式开发范式编程语言编写的一个分布式益智拼图游戏&#xff0c;可以两台设备同时开启一局拼图游戏&#xff0c;每次点击九宫格内的图片&#xff0c;都会同步更新两台设备的图片位置。效果图如下&#xff1a; 说明&#xff1a; 本示例涉及使…

OWASP发布10大开源软件风险清单

3月20日&#xff0c;xz-utils 项目被爆植入后门震惊了整个开源社区&#xff0c;2021 年 Apache Log4j 漏洞事件依旧历历在目。倘若该后门未被及时发现&#xff0c;那么将很有可能成为影响最大的软件供应链漏洞之一。近几年爆发的一系列供应链漏洞和风险&#xff0c;使得“加强开…

对桥接模式的理解

目录 一、背景二、桥接模式的demo1、类型A&#xff08;形状类型&#xff09;2、类型B&#xff08;颜色类型&#xff09;3、需求&#xff1a;类型A要使用类型B&#xff08;如&#xff1a;红色的方形&#xff09;4、Spring的方式 一、背景 在《对装饰器模式的理解》中&#xff0…