上下文学习思维链COTPrompt工程

一、上下文学习

上下文学习强调在学习过程中考虑问题所处的上下文环境。

1.1 上下文学习的分类

  • 零样本(Zero-Shot)上下文学习
  • 单样本(One-Shot)上下文学习
  • 少样本(Few-Shot)上下文学习

1.2 示例选择方法

两个主要依据是相似性和多样性

  • 直接检索:然后选取排名靠前的K个示例。
  • 聚类检索:把所有示例划分为K个簇,从每个簇中选取最为相似的示例,获取K个示例。
  • 迭代检索:下一个示例的选择依赖于当前的问题和已选择的示例。

1.3 性能影响因素

  • 预训练数据:领域丰富度、任务多样性、训练数据的分布
  • 预训练规模:模型参数规模
  • 演示示例:示例的数量和顺序

二、思维链

2.1 两种任务类型

(1)System-1任务

  • 依靠直觉和经验进行瞬间判断。
  • 随着规模(参数量、训练数据、算力)变大,模型性能显著提升。

(2)System-2任务

  • 运用逻辑分析、计算和有意识的思考来解决。
  • 模型会出现“Flat Scaling Curves”现象——即模型规模增长未带来预期性能提升。

2.2 思维链的定义

在提示中嵌入一系列中间推理步骤,引导大模型模拟人类解决问题时的思考过程,以提升模型处理System-2任务的能力

2.3 思维链的分类

在标准COT方法上,出现了许多扩展方法,这些方法按照其推理方式的不同,可以归纳为三种模式:按部就班、三思而行、集思广益

按部就班模式

强调逻辑的连贯性和步骤的顺序性

代表方法:

  • COT:手工构造(费时费力例子,作为示例放入Prompt,引导模型一步一步推理。
  • Zero-Shot COT:无需手工标注,只需提供简单的提示,如“Let's think step by step”,引导模型自行生成一条推理链。

魔法咒语:Let's think step by step.

  • Auto COT:聚类算法自动筛选相关样本,Zero-Shot生成思维链内容作为示例,引导大语言模型生成针对用户问题的推理链和答案。

不足:

  • 局部:在思维过程中不会探索不同的后续内容,即树的分支。
  • 全局:顺序链式输出,不存在回溯的过程。

三思后行模式

强调审慎和灵活

代表方法:

  • Tree of Thoughts(TOT):将推理过程构造为一棵思维树,允许模型在不确定时进行回溯重新选择。TOT从拆解、衍生、评估、搜索四个角度构造思维树。

  • Graph of Thoughts(GOT)

集思广益模式

强调观点和方法的多样性。

代表方法:

  • Self-Consistency:引入多样性的推理路径,从中提取并选择最一致的答案。

  • Universal Self-Consistency:利用LLMs自身选择最一致答案,支持更多种任务,无需答案提取过程。


三、Prompt工程

3.1 Prompt规范

编写规范的Prompt是与大语言模型进行有效沟通的基础。一个标准规范的Prompt通常由任务说明、上下文、问题、输出格式这几个部分中的一个或几个来组成。

3.2 Prompt技巧

  • 复杂问题拆解
  • 追问
  • 适时使用COT
  • 善用心理暗示:角色扮演or情景代入

3.3 Prompt工程应用

可以通过精心设计的Prompt激活大语言模型的内在潜力,而不需要对模型进行微调。Prompt已经在垂域任务、数据增强、智能代理等多个领域发挥出卓越性能。

(1)自然语言接口

  • Text to SQL
  • 代码生成

(2)大模型支撑的数据合成

  • Self-Instruct

(3)大模型增强的搜索引擎

(4)大模型赋能智能体

经典的智能体通常由大语言模型和四大模块组成,分别是:配置模块(Profile)、记忆模块(Memory)、计划模块(Planning)、行动模块(Action)。

单智能体仅包含一个智能体,交互相对简单,适用于简单任务。Prompt设计主要用于引导模型执行特定任务,且围绕单个上下文。

多智能体包含多个智能体,每个智能体都设定有角色和任务,交互复杂度高。他们协调、合作、竞争,以实现共同或各自目标。

(5)大模型驱动的具身智能

大语言模型是AGI的智慧引擎,机器人是大语言模型走向真实世界的物理载体。


四、参考

bilibili:浙江大学-大模型原理与技术

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/72220.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

node.js-WebScoket心跳机制(服务器定时发送数据,检测连接状态,重连)

1.WebScoket心跳机制是? 基于上一篇文章,WebScoket在浏览器和服务器间完成一次握手,两者间创建持久性连接,并进行双向数据连接。node.js-node.js作为服务器,前端使用WebSocket(单个TCP连接上进行全双工通讯…

若依RuoYi-Cloud-Plus微服务版(完整版)前后端部署

一.目标 在浏览器上成功登录进入 二.源码下载 后端源码:前往Gitee下载页面(https://gitee.com/dromara/RuoYi-Cloud-Plus)下载解压到工作目录。 前端源码: 前往Gitee下载页面(https://gitee.com/JavaLionLi/plus-ui)下载解压到工作目录。 文档地址&a…

Nginx 多协议代理功能(Nginx Multi Protocol Proxy Function)

前言 Nginx 作为高性能的反向代理和负载均衡工具,广泛应用于 HTTP 和 HTTPS 协议的代理。但你知道吗?Nginx 还可以代理其他协议,比如 TCP 和 UDP!这些功能让它在多协议支持方面表现出色,可以用于数据库代理、流媒体服…

MistralAI挑战DeepSeek:开源模型能否颠覆行业巨头

在2025年,世界移动通信大会的展台上,MistralAI的创始人ArthurMensch对着镜头,露出了温和的笑容。不过他随后讲出的话,就仿佛一颗重磅炸弹,在AI领域引发了巨大的动荡——他们即将推出的开源模型,据传能够超越…

代码随想录第五十二天| 101.孤岛的总面积 102.沉没孤岛 103.水流问题 104.建造最大岛屿

孤岛的总面积 题目描述 给定一个由 1(陆地)和 0(水)组成的矩阵,岛屿指的是由水平或垂直方向上相邻的陆地单元格组成的区域,且完全被水域单元格包围。孤岛是那些位于矩阵内部、所有单元格都不接触边缘的岛…

八叉树地图的原理与实现

八叉树与体素图 八叉树地图 八叉树地图是可变分辨率的三维栅格地图,可以自由调整分辨率,如下所示: 根据点云的数量或密度决定每个叶子方块是否被占据 体素图 体素就是固定分辨率的三维栅格地图,如下所示: 根据点云…

最节省服务器,手搓电子证书查询系统

用户预算150元,想要一个最简单证书查询系统。前台能查询证书、后台管理员能登录能修改密码,证书能够手动输入修改删除、批量导入导出删除数据、查询搜索。能够兼容苹果、安卓、PC三端浏览器,最后帮忙部署到云服务器上。 用户预算不多&#xf…

什么是全栈?

🤟致敬读者 🟩感谢阅读🟦笑口常开🟪生日快乐⬛早点下班 📘博主相关 🟧博主信息🟨博客首页🟫专栏推荐🟥活动信息 📃文章前言 🔷文章均为学习工…

作物移栽机器人的结构设计的介绍

作物移栽机器人的结构设计是一个复杂的机械与电子结合的系统工程,单纯用代码来实现整个结构设计是不现实的,因为结构设计更多涉及到机械结构、硬件选型等物理层面的内容。不过,我们可以通过代码来模拟作物移栽机器人的部分功能,例…

【文献阅读】SPRec:用自我博弈打破大语言模型推荐的“同质化”困境

📜研究背景 在如今的信息洪流中,推荐系统已经成为了我们生活中的“贴心小助手”,无论是看电影、听音乐还是购物,推荐系统都在努力为我们提供个性化的内容。但这些看似贴心的推荐背后,其实隐藏着一个严重的问题——同质…

使用1Panel一键搭建WordPress网站的详细教程(全)

嘿,各位想搭建自己网站的朋友们!今天我要跟大家分享我用1Panel搭建WordPress网站的全过程。说实话,我之前对服务器运维一窍不通,但通过这次尝试,我发现原来建站可以这么简单!下面是我的亲身经历和一些小技巧…

本地fake server,

C# 制作的系统级tcp 重定向,整个系统只要有访问指定url,返回自定义内容到访问端。不局限在浏览器单一方面。 再者请理解这个图的含金量,服务器down机都可以模拟。 用途那就太多了,当然很多用途都不正当。嘿嘿 如果你很想要源代…

设计模式之美

UML建模 统一建模语言(UML)是用来设计软件的可视化建模语言。它的语言特点是简单 统一 图形化 能表达软件设计中的动态与静态信息。 UML的分类 动态结构图: 类图 对象图 组件图 部署图 动态行为图: 状态图 活动图 时序图 协作…

【openGauss】物理备份恢复

文章目录 1. gs_backup(1)备份(2)恢复(3)手动恢复的办法 2. gs_basebackup(1)备份(2)恢复① 伪造数据目录丢失② 恢复 3. gs_probackup(1&#xf…

一文了解JVM的垃圾回收

Java堆内存结构 java堆内存是垃圾回收器管理的主要区域,也被称为GC堆。 为了方便垃圾回收,堆内存被分为新生代、老年代和永久代。 新创建的对象的内存会在新生代中分配,达到一定存活时长后会移入老年代,而永久代存储的是类的元数…

SQL子查询与MyBatis映射

文章目录 前言1. 数据库表结构2. MyBatis Mapper XML3. Java 实体类4. 技术点解析5. 执行效果6. 优化建议 前言 提示:这里可以添加本文要记录的大概内容: 以下是一个结合 SQL 别名、子查询、MyBatis 字段映射和代码复用的完整案例,以用户管…

基于SpringBoot的“校园周边美食探索及分享平台”的设计与实现(源码+数据库+文档+PPT)

基于SpringBoot的“校园周边美食探索及分享平台”的设计与实现(源码数据库文档PPT) 开发语言:Java 数据库:MySQL 技术:SpringBoot 工具:IDEA/Ecilpse、Navicat、Maven 系统展示 校园周边美食探索及分享平台结构图…

时间复杂度(Time Complexity)

时间复杂度 1. 什么是时间复杂度? 时间复杂度(Time Complexity)是计算算法执行时间随输入规模(n)增长的变化趋势。它衡量算法的效率,通常使用大 O 记号(Big-O notation)表示&#…

树莓派:更新源

发行版本 Debian 一直维护着至少三个发行版本:“稳定版(stable)”,“测试版(testing)”和“不稳定版(unstable)”。 发行版目录 下一代 Debian 正式发行版的代号为 bullseye — 发布…

K8s 1.27.1 实战系列(八)Service

一、Service介绍 1、Service 的作用与核心功能 Service 是 Kubernetes 中用于抽象一组 Pod 并提供稳定访问入口的资源。它解决了以下问题: ​Pod IP 不固定:Pod 可能因故障、扩缩容或更新导致 IP 变化,Service 通过 ClusterIP(虚拟 IP)提供固定访问地址。​负载均衡:自动…