AI 中的 CoT 是什么?一文详解思维链

文章目录

      • CoT 的组成
      • CoT 的作用
      • CoT 的推理结构变体
      • CoT 的特点
      • CoT 的适用场景
      • 总结

在人工智能领域,尤其是自然语言处理和机器学习中,有一种名为思维链(Chain of Thought,CoT)的技术,它正逐渐改变着我们对 AI 模型推理能力的认知。CoT 由 Google 在 2022 年的论文《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》中首次提出,其核心思想是让大模型逐步参与将一个复杂问题分解为一步一步的子问题并依次进行求解,通过显式输出中间逐步的推理步骤来增强大模型的算数、常识和推理的质量。

CoT 的组成

一个完整的包含 CoT 的提示词一般由以下三部分组成:

  • 指令(Instruction) :用于描述问题并且告知大模型的输出格式,让模型明确知道需要做什么。
  • 逻辑依据(Rationale) :指 CoT 的中间推理过程,可以包含问题的解决方案、中间推理步骤以及与问题相关的任何外部知识,是模型思考过程的具体体现。
  • 示例(Exemplars) :以少样本的方式为大模型提供输入输出对的基本格式,每个示例都包含问题、推理过程与答案,帮助模型更好地理解和学习如何进行推理。

根据是否包含示例,可将 CoT 分为 Zero-Shot-CoT 与 Few-Shot-CoT。Zero-Shot-CoT 仅在指令中添加一行经典的 “Let’s think step by step”,无需提供具体示例,即可唤醒大模型的推理能力;而 Few-Shot-CoT 则在示例中详细描述了解题步骤,让模型照猫画虎得到推理能力。

CoT 的作用

  • 提升模型推理能力 :CoT 将复杂问题分解为多个子问题,使模型能够逐步解决,从而更好地应对复杂任务,显著提高了大语言模型在复杂推理任务上的性能,如在数学推理任务 GSM8K 上,PaLM-540B 的准确率从 17% 提升至 58%。
  • 增强模型的可解释性 :显式输出的中间推理步骤为人们提供了一个观察模型思考过程的窗口,方便使用者了解模型是如何得出答案的,也便于发现模型可能存在的错误,进而提高了大模型推理的可解释性和可信度。
  • 具有广泛的适用性 :CoT 能用在数学应用题、常识推理和符号操作等多种任务上,几乎涵盖任何人类通过语言能解决的问题,并且支持任何语言模型使用,只需将其加在 few-shot 的样例中即可生效,无需重新训练模型。

CoT 的推理结构变体

  • PoT(Program of Thought) :对思维链中大模型有可能出错的一些计算问题,让大模型生成编程语言在解释器中运行,将复杂计算与模型的文本生成解耦,从而提高计算的准确性和可靠性。
  • Tab-CoT(Tabular Chain of Thought) :迫使大模型在每一步的推理中记录一个 “∣步数∣子问题∣过程∣结果∣” 的推理表格,并从生成的表格中提取答案,增强大模型的推理能力。
  • ToT(Tree of Thought) :将 CoT 的链式结构扩展为树形结构,让大模型在解决子问题时生成多个不同的答案选择,通过建立的树形结构展望未来确定下一步的决策,并通过追溯来纠正历史决策。
  • GoT(Graph of Thought) :基于 ToT 的思想,将 Tree 拓展为 Graph,其核心在于一个 “控制器”,控制器处理对图的操作以及图状态推理,将任务分解为相互连接的节点 - 边关系,并维护大模型在生成的图上的推理过程。

CoT 的特点

  • 以人类解决问题的方式为灵感 :CoT 模仿人类解题时的思考模式,通过一系列连贯的逻辑推导来促进系统地解决问题,使 AI 模型更接近人类的思维方式。
  • 涌现性 :当模型参数量达到百亿级别时,CoT 才能显著生效,发挥出其在提升模型推理能力方面的作用。

CoT 的适用场景

  • 数学应用题 :对于复杂的数学问题,CoT 可以帮助模型逐步分解问题,进行算术推理,从而得到正确的答案。
  • 常识推理 :在涉及常识的问答中,CoT 能够让模型展示出其推理过程,更好地运用常识进行推理和判断。
  • 符号操作 :如代码生成等任务,CoT 可引导模型按照逻辑步骤生成正确的代码。
  • 其他需要逻辑推理的任务 :如逻辑谜题解答、数据解读等,只要是可以将问题分解为多个步骤并通过逻辑推理解决的场景,CoT 都有其用武之地。

总结

CoT 作为一种简单而有效的方法,为提高 AI 模型的推理能力和可解释性提供了一种新的思路和解决方案。它通过引入中间推理步骤,使模型能够更像人类一样逐步思考和解决问题,在各种复杂任务中展现出了巨大的潜力和价值。随着研究的不断深入,CoT 将不断进化和完善,并与其他技术相结合,进一步推动 AI 模型的发展和应用,为我们带来更强大、更智能的人工智能系统。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/77495.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Vue3集成Element Plus完整指南:从安装到主题定制上

一、Element Plus简介 Element Plus是一套基于Vue 3.0的桌面端组件库,由饿了么前端团队开源维护。它提供了丰富的UI组件,能够帮助开发者快速构建企业级中后台产品。 1. 安装与卸载 bash 复制 下载 # 安装最新版本 npm install element-plus -S# 卸…

Java29:Spring MVC

一:Springmvc简介 1.简介: Spring Web MVC 是基于Servlet API构建的原始Web框架,从一开始就包含在Spring Framework中。正式名称“Spring Web MVC” 来自其源模块名称(spring-webmvc)但它通常被称为“Spring Mvc” …

VLC搭建本机的rtsp直播推流和拉流

媒体---流---捕获设备,选择摄像头,点击串流 x下一步 选择rtsp,点击添加 看到了端口,并设置路径: 选择Video -H 264 mp3(TS) 点击下一个, 点击流,就开始推流了 拉流,观看端&#x…

云点数据读写

一、常见点云数据格式 LAS/LAZ格式 LAS是点云数据的行业标准格式 LAZ是LAS的压缩版本 支持地理参考信息、颜色、强度等属性 PCD格式(Point Cloud Data) PCL(Point Cloud Library)开发的格式 支持ASCII和二进制存储 包含头部信息和数据部分 PLY格式(Polygon File Format…

[RHEL8] 指定rpm软件包的更高版本模块流

背景:挂载RHEL ISO使用kickstart安装操作系统,安装包未指定安装perl,但是安装完可以查到其版本,且安装的是ISO中多个版本中的最低版本。 原因:(1)为什么没有装perl,perl -v可以看到版…

Spring 事务管理核心机制与传播行为应用

Spring 事务详解 一、Spring 事务简介 Spring 事务管理基于 AOP(面向切面编程)实现,通过 声明式事务(注解或 XML 配置)统一管理数据库操作,确保数据一致性。核心目标:保证多个数据库操作的原子…

JavaScript解密实战指南:从基础到进阶技巧

JavaScript加密技术广泛应用于数据保护、反爬虫和代码混淆,但掌握解密方法能帮助开发者突破技术壁垒。本文结合爬虫实战与安全分析场景,系统梳理JS解密的核心方法与工具。 一、基础解密方法 1. Base64解码 适用于简单编码场景,如Cookie加密…

WEMOS LOLIN32

ESP32是結合Wi-Fi和藍牙的32位元系統單晶片(SoC)與外接快閃記憶體的模組。許多廠商生產採用ESP32模組的控制板,最基本的ESP控制板包含ESP32模組、直流電壓轉換器和USB序列通訊介面IC。一款名為WEMOS LOLIN32的ESP32控制板具備3.7V鋰電池插座。…

俄罗斯方块-简单开发版

一、需求分析 实现了一个经典的俄罗斯方块小游戏,主要满足以下需求: 1.图形界面 使用 pygame 库创建一个可视化的游戏窗口,展示游戏的各种元素,如游戏区域、方块、分数等信息。 2.游戏逻辑 实现方块的生成、移动、旋转、下落和锁…

使用安全继电器的急停电路设计

使用安全继电器的急停电路设计 一,急停回路的设计1,如何将急停接到线路当中?2,急停开关 如何接到安全继电器中 一,急停回路的设计 急停是每一个设备必不可少的部分,因为关乎安全,所以说所以说他…

【读书笔记·VLSI电路设计方法解密】问题64:什么是芯片的功耗分析

低功耗设计是一种针对VLSI芯片功耗持续攀升问题的设计策略。随着工艺尺寸微缩,单颗芯片可集成更多元件,导致功耗相应增长。更严峻的是,现代芯片工作频率较二十年前大幅提升,而功耗与频率呈正比关系。因此,芯片功耗突破…

在 Debian 10.x 安装和配置 Samba

1. 更新系统 sudo apt update sudo apt upgrade -y2. 安装 Samba sudo apt install samba -y3. 配置 Samba 备份默认配置文件 sudo cp /etc/samba/smb.conf /etc/samba/smb.conf.bak编辑配置文件 sudo nano /etc/samba/smb.conf示例配置(共享目录) …

修改PointLIO项目

添加key_frame_info.msg消息 新建.msg文件,内容填写为: # Cloud Info Header header # cloud messages sensor_msgs/PointCloud2 key_frame_cloud_ori sensor_msgs/PointCloud2 key_frame_cloud_transed sensor_msgs/PointCloud2 key_frame_poses其中k…

关于隔离1

1.隔离的目的: 在隔离电源设计中,输入与输出之间没有直接电气连接,提供绝缘高阻态,防止电流回路。这意味着输入与输出之间呈现为绝缘的高阻态,从而确保了无电流回路的形成。 隔离与可靠保护有关。电隔离是一种电路设…

【java实现+4种变体完整例子】排序算法中【插入排序】的详细解析,包含基础实现、常见变体的完整代码示例,以及各变体的对比表格

以下是插入排序的详细解析,包含基础实现、常见变体的完整代码示例,以及各变体的对比表格: 一、插入排序基础实现 原理 将元素逐个插入到已排序序列的合适位置,逐步构建有序序列。 代码示例 public class InsertionSort {void…

清醒思考的艺术

成为穿越暴风雨后的幸存者 系统性错误是指系统性的偏离理性,偏离最理想的、合乎逻辑的、理智的思考和行为。 “系统”一词很重要,因为我们经常错误地走向同一方向。 幸存偏误 幸存偏误会扭曲概率,系统性的高估了成功概率。一旦混淆选择标准和…

DSA数据结构与算法 6

查找技术(Searching Techniques) 查找简介 在计算机科学中,“查找”指的是在某个集合或序列中寻找特定元素的过程。这个过程可以是成功的,也可以是失败的: 若目标元素存在于集合中,我们称之为“查找成功”…

FastAPI:现代高性能Python Web框架的技术解析与实践指南

一、FastAPI的诞生背景与技术定位 在数字化转型的浪潮中,API(应用程序接口)作为连接服务与数据的核心枢纽,其性能与开发效率直接影响业务迭代速度。传统Python框架如Django和Flask虽功能丰富,但在高并发场景下面临性能瓶颈,且缺乏对异步编程的原生支持。FastAPI应运而生…

VuePress 使用教程:从入门到精通

VuePress 使用教程:从入门到精通 VuePress 是一个以 Vue 驱动的静态网站生成器,它为技术文档和技术博客的编写提供了优雅而高效的解决方案。无论你是个人开发者、团队负责人还是开源项目维护者,VuePress 都能帮助你轻松地创建和管理你的文档…

1.Vue自动化工具安装(Vue-cli)

目录 1.node.js 安装: 2 npm 安装 3 安装Vue-cli 4总结: 一般情况下,单文件组件,我们运行在 自动化工具vue-CLI中,可以帮我们编译单文件组件。所以我们在学习时一般需要在系统中先搭建vue-CLI工具 下面就是一些我…