LLM学习笔记DAY8

news/2025/10/21 2:52:56/文章来源:https://www.cnblogs.com/szhAC/p/19154001

📘今日学习总结

大语言模型提示技术学习笔记

1 提示工程

1.1 提示设计关键要素

五大核心要素:

  • 任务描述:清晰明确的任务指令,包含目标、限制条件、数据格式等
  • 上下文信息:提供背景知识,帮助模型突破知识局限
  • 输入数据:具体的查询内容或问题
  • 提示策略:问题分解、多步思考等策略
  • 输出格式:期望的回答格式和结构

1.2 任务描述设计要点

  • 需要详尽清晰,包含关键信息
  • 示例:DeepSeek-V3的摘要生成任务
  • 应明确字数限制、内容要求、格式规范

1.3 上下文信息的作用

  • 提供时效性信息(如最新政治动态)
  • 突破模型知识截止时间的限制
  • 确保回答的准确性和时效性

1.4 上下文学习示例

  • 通过示例让模型学习解题模式和格式
  • 数学问题中的分步推理展示
  • 格式规范的示范作用

1.5 提示策略类型

  • 角色扮演:赋予模型特定身份(如律师)
  • 多专家思考:模拟多个专家共同思考
  • 分步推理:将复杂问题分解为子问题

2 上下文学习

2.1 基本概念

  • 定义:通过任务描述和上下文示例组成的自然语言提示来指导模型
  • 数学表示:LLM(任务描述, 示例, 输入) → 答案

2.2 关键影响因素

2.2.1 示例选择策略

  • 基于相关度:k近邻相似度检索
  • 基于集合多样性:MMR、DPP算法选择代表性示例
  • 基于大语言模型:直接生成相关示例

2.2.2 示例顺序影响

  • 模型倾向于关注提示末端的示例
  • 基于相关度排序:相似度高的靠近测试样本
  • 基于任务性能优化:通过置信度评估最佳顺序

2.2.3 示例数目

  • 数量增加通常提升性能,但存在边际效应
  • 需要平衡效果与计算成本

2.3 工作机制

2.3.1 任务识别

  • 模型利用预训练阶段学习的先验知识
  • 识别任务类型并应用相应解决模式
  • 小规模模型即具备此能力

2.3.2 任务学习

  • 从示例中学习新的输入输出映射
  • 注意力机制可视为隐式的梯度下降
  • 大规模模型具备更强的任务学习能力

2.3.3 训练影响

  • MetaICL:通过多任务训练增强上下文学习能力
  • 预训练数据:多样性、长程依赖关系的重要性
  • 专门训练:可以显著提升上下文学习效果

3 思维链提示

3.1 基本概念

格式:<输入,思维链,输出>
作用:通过中间推理步骤建立输入与输出的联系

3.2 提示类型

  • 少样本思维链:通过示例教会模型生成推理步骤
  • 零样本思维链:使用“让我们一步步思考”触发推理

3.3 改进方法

3.3.1 基于采样的方法

  • Self-Consistency:生成多条推理路径,投票选择最终答案
  • 解决单一思维链错误传播问题

3.3.2 基于验证的方法

  • DIVERSE:训练打分模型验证中间步骤
  • 识别和标记错误推理步骤

3.3.3 结构改进

  • 思维树(ToT):支持回溯的多路径推理
  • 思维图(GoT):更复杂的拓扑结构,支持聚合操作

3.4 能力来源分析

  • 信息聚焦/过滤:提取与推理相关的关键信息
  • 组合函数学习:通过上下文学习生成单步解

3.4.1 关键组件

  • 符号:问题中的数字、实体等具体元素
  • 模式:推理的模板和结构
  • 实验表明模式一致性比符号准确性更重要

3.4.2 增强方法

  • 数据增强:复杂化、多样化、具体化
  • 强化学习:设计合适的奖励函数
  • 验证器选择:基于规则vs基于模型

4 检索增强生成

4.1 基本概念

动机:解决模型幻觉、时效性、专业深度知识缺乏等问题
三阶段流程

  1. 文档检索:从信息源检索相关文档
  2. 提示构造:将检索文档加入输入提示
  3. 模型生成:基于增强提示生成回答

4.2 检索优化策略

4.2.1 检索数据源优化

  • 检索单元:观点 > 句子 > 文档
  • 平衡召回率与检索时延

4.2.2 查询优化

  • 查询扩展:添加补充信息,分解复杂查询
  • 查询重写:突出关键信息,消除歧义
  • 假设查询:用初始回答作为伪查询

4.2.3 提示优化策略

  • 文档重排序:按相关度过滤和排序
  • 上下文压缩:自动摘要、信息抽取、词元选择

4.2.4 过程优化策略

  • 迭代检索:多次检索,结合思维链
  • 自适应检索:模型自主决定检索时机和方式
  • Self-RAG:学习检索、生成和评估的完整流程

4.3 关键思考

4.3.1 检索必要性

  • 无关信息可能带来负面影响
  • 模型已掌握的知识不需要检索
  • 需要智能判断检索时机

4.3.2 成本优化

  • 代理模型方法:用小模型判断检索需求
  • SlimPLM:效果优于直接使用大模型
  • 大小模型知识差距主要体现在长尾知识

4.3.3 实验效果

  • 合理的检索增强能显著提升效果
  • 自适应检索在多个数据集上表现优异
  • 成本控制是关键考量因素

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/941741.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

软件工程第二次团队作业——构建一个智能体

这个作业属于哪个课程 软件工程这个作业要求在哪里 作业要求这个作业的目标 构建一个AI智能体,不仅能通过自然语言交流(会说),更能理解指令意图,并自动调用工具、访问数据或执行代码来完成任务(会做),最终在一…

VoxelNeXt 用于 3D 对象检测和跟踪的完全稀疏 VoxelNet(CVPR 2023) - MKT

VoxelNeXt 用于 3D 对象检测和跟踪的完全稀疏 VoxelNet(CVPR 2023) https://github.com/dvlab-research/VoxelNeXt

CityNav:包含地理信息的语言目标空中导航数据集 - MKT

CityNav:包含地理信息的语言目标空中导航数据集https://water-cookie.github.io/city-nav-proj/

Grounded-SAM 使用文本提示检测和分割所有内容 - MKT

Grounded-SAM 使用文本提示检测和分割所有内容https://github.com/IDEA-Research/Grounded-Segment-Anything?tab=readme-ov-file#install-without-docker

Linux权限维持-后门

Linux权限维持-后门 参考文章 Linux权限维持-后门 - 0xMouise - 博客园 1.找到ssh warpper后门需要修改的文件,flag在被修改的文件注释中。 SSH wrapper(包装器):通常指一个替代或拦截 sshd / ssh 的可执行文件或脚…

mysql数据库查询参考

mysql -uroot -p123456先进入数据库看一下数据库名字 我们数据插入在student_db2 所以进入student_db2 然后查表名 show databases; use student_db2; show tables;1.create index Index_Score on sc (Score ASC); ASC…

视觉和语言 国防科大清华城市空间无人机导航推理!GeoNav:赋予多模态大模型地理空间推理能力,实现语言指令导向的空中目标导航 - MKT

视觉和语言 国防科大&清华城市空间无人机导航推理!GeoNav:赋予多模态大模型地理空间推理能力,实现语言指令导向的空中目标导航 arXiv-2024 | 具身智能体要上天!CITYNAV:基于地理信息的无人机视觉语言导航数…

Python理论题目集

Python理论题目集 单选题题目ID 题目类型 题目内容 选项 答案 解析 知识点 标签 分类1 单选题 在Python中,下列哪个数据类型是不可变的? [列表, 字典, 元组, 集合] C 元组是不可变类型,一旦创建就不能修改。列表、字…

基于yakit的dvwa靶场暴力破解和代码执行漏洞

环境部署https://blog.csdn.net/2302_82189125/article/details/135834194 1.Brute Force lowresultmedium同样的插入方法 high爆破成功 但是有一个问题需要考虑,为什么要使用热加载,又为什么热加载要那样设置,而且…

[Tool] [HTTP] curl 命令行工具:基础与进阶用法

[Tool] [HTTP] curl 命令行工具:基础与进阶用法$(".postTitle2").removeClass("postTitle2").addClass("singleposttitle");目录curl 命令行工具:基础与进阶用法01 背景与简介1.1 核心…

sourcetree 克隆项目仓库地址,输入账号密码后提示:这是一个无效的源路径/URL

1.克隆项目 一个正确的项目链接会自动弹出让你输入账号和密码。(若勾选了“Remember password”),点击“Login” 2.错误提示:这是一个无效的源路径/URL 原因1:账号和密码输入错误 win10系统:如果勾选了记住密码,…

视觉和语言-港科大 NMPC 控制下的高效自主导航!SkyVLN:城市环境无人机视觉语言导航与非线性模型预测控制 - MKT

视觉和语言-港科大 NMPC 控制下的高效自主导航!SkyVLN:城市环境无人机视觉语言导航与非线性模型预测控制任务示例:无人机需要根据自然语言指令和第一人称视角的视觉感知完成导航任务。 示例任务包括“经过交叉口后左…

北航高低无人机协同导航方案:高空掌全局+低空查细节 - MKT

北航高低无人机协同导航方案:高空掌全局+低空查细节https://www.qbitai.com/2025/07/313729.html

20251020 之所思 - 人生如梦

20251020 之所思做的很好的四件事:1. 老板要看软件组织架构的调整,好在上周已经提前准备好,今天只需要介绍就好。提前预判,提前准备,有备无患。2. 今天有很多很多事情,没有时间准备软件周会的agenda,软件的周会…

以太坊账⼾模型的理解,合约账⼾、EOA账⼾认识

以太坊账⼾模型的理解,合约账⼾、EOA账⼾认识 以太坊使用账户模型(Account Model)而非比特币的UTXO模型。以太坊有两种类型的账户: 1. 外部账户(EOA - Externally Owned Account)特点:由私钥控制 可以发送交易 没有相…

Luogu P12376「LAOI-12」Calculate 题解 [ 蓝 ] [ 贪心 ] [ 线性 DP ] [ 前缀和优化 ] [ 范德蒙德卷积 ]

Calculate:简单计数 DP。 先考虑 \(\sum_{i = 1}^{p - 1}(a_{i + 1} - a_i)^2\) 的最大值怎么求。利用调整法可以得到结论:每次走当前未选的最大值、最小值交替选一定最优。还有另一种理解方式:注意到两数之差的平方…

Conda、pip以及虚拟环境在Jupyter中的打开方法

在Python开发中,Conda和pip是两种常用的包管理工具,它们各有优势,适用于不同的场景。同时,虚拟环境是隔离不同项目依赖的有效手段。在使用Jupyter Notebook时,如何在特定的虚拟环境中打开它,也是开发者需要掌握的…

方格图路径计数 dp 的反射路径优化

很拗口的名字,其情景是这样的: 我们有一个点 \(B(n,m)\),需要求原点 \(A\) 到这个点的路径条数(限制只能向右、上走)。 平凡的题目做法很简单,我们一共走 \(n+m\) 步,其中 \(n\) 步向右,方案数 \(\binom {n + …

[Tool] fzf 模糊搜索神器基础功能和操作

[Tool] fzf 模糊搜索神器基础功能和操作$(".postTitle2").removeClass("postTitle2").addClass("singleposttitle");目录01 背景1.1 简介1.2 官网02 安装03 使用3.0 默认3.1 管道3.2 命…