救命!我的大模型突然变聪明了!只因我把问题说了两遍,准确率直接起飞76%!程序员必备的免费午餐技巧

"说两遍"这个在人类沟通中略显烦人的习惯,对AI居然有奇效。

最近Google Research发布了一篇很有意思的论文,标题简单到让人怀疑是不是写错了:“Prompt Repetition Improves Non-Reasoning LLMs”(重复Prompt提升非推理LLM性能)。

研究人员在Gemini、GPT-4o、Claude、DeepSeek等主流模型上做了大量测试,得出了一个让人哭笑不得的结论:把同一句话说两遍,模型准确率最高能提升76%,而且还不增加延迟。

这到底是怎么回事?

一个"反常识"的发现

事情要从Transformer架构的一个根本特性说起。

当前几乎所有的大语言模型都是"因果语言模型"(Causal Language Model)。这意味着它们处理文本的方式是严格从左到右的——当模型正在处理你句子中的第5个词时,它能看到第1-4个词,但完全不知道第6个词以后的内容,因为它还没"读"到那里。

这个限制导致了一个很微妙的问题:信息的顺序至关重要。

举个例子,如果你输入<上下文><问题>和<问题><上下文>,模型可能会给出完全不同的答案。因为在后一种情况下,模型先读到问题,却还不知道这个问题应该关联什么上下文。

Google Research的研究人员想到一个办法:把整个输入复制一遍。

原来你是这样问的:

请根据以下内容回答问题:<你的内容>

问题:<你的问题>

现在变成这样:

请根据以下内容回答问题:<你的内容>

问题:<你的问题>

请根据以下内容回答问题:<你的内容>

问题:<你的问题>

就这么简单。

数据说话:47胜0负

研究人员设计了7个基准测试,包括ARC、OpenBookQA、GSM8K、MMLU-Pro等,测试了7个模型:Gemini 2.0 Flash Lite、GPT-4o-mini、Claude 3.7 Sonnet、DeepSeek V3等等。

结果:在70场对比中,重复Prompt赢了47场,平了23场,输了0场。

图1:在要求模型不使用推理时,主流LLM在各类基准测试上,重复Prompt与基线的准确率对比。星号表示根据McNemar检验具有统计学意义的胜利(p值<0.1)。重复Prompt在70次测试中赢了47场,0负。

最夸张的是一个叫"NameIndex"的测试。模型被要求从50个名字的列表中找出第25个名字:

单次Prompt准确率:21.33%

重复Prompt准确率:97.33%

提升了76个百分点。

为什么会有这么大的差异?因为在单次处理时,模型读到第25个名字时可能早就忘了前面数到哪了。但在第二次处理时,模型已经"记住"了整个列表,自然能准确找到目标。

零成本:免费的午餐

你可能会问:复制一遍输入不会增加成本和延迟吗?

答案是:几乎不会。

LLM的处理分为两个阶段:

预填充(Prefill):处理输入prompt。这个阶段GPU可以高度并行处理,速度很快。

生成(Decoding):逐个token生成答案。这个阶段是串行的,比较慢。

重复Prompt只增加了预填充阶段的工作量,而现代GPU处理预填充的效率极高。研究人员发现,重复Prompt没有增加生成的token数量,也没有增加首token响应时间。

唯一的例外是Anthropic的模型(Claude Haiku和Sonnet)在极长输入时,预填充阶段会遇到瓶颈。但对于绝大多数日常使用场景,这个technique几乎是免费的。

重要提醒:只对"非推理"任务有效

研究人员还发现了一个关键限制:这个方法对推理任务几乎无效。

图4:在要求模型"逐步思考"时,重复Prompt与基线的准确率对比。星号表示具有统计学意义的胜利。重复Prompt在28次测试中赢了5场,负1场。

当他们把重复Prompt和"思维链"(Chain of Thought)结合使用时,效果消失了——变成了5胜1负22平,基本原地踏步。

原因很有意思:推理模型自己在"思考"的时候,其实已经做了一种隐式的重复。当模型展示推理过程时,它通常会在生成的内容中先复述一遍问题,然后才开始解答。所以对推理模型来说,你再重复Prompt就变成画蛇添足了。

重复Prompt的最佳场景是:

需要快速、直接答案的任务

从长文档中提取特定信息

需要精确检索的任务

分类、实体提取、简单问答

不适合的场景:

需要复杂推理的问题

需要展示推理过程的任务

已经启用"思维链"的场景

思考

这个研究让我想起了Prompt Engineering领域的一个趋势:我们总是把事情搞得太复杂。

过去几年,我们发明了CoT、Self-Consistency、Tree of Thoughts、Emotional Prompting等各种花哨的技巧。但Google Research告诉我们,有时候最简单的办法反而最有效。

当然,这并不意味着要抛弃其他技巧。重复Prompt是一个"免费的午餐",你可以和任何其他技巧叠加使用。但它提醒我们:在追求复杂解决方案之前,先试试最朴素的办法。

研究人员预测,未来我们可能会看到推理引擎在后台自动重复用户的prompt,或者专门训练模型来内化这种重复策略。

在那之前,如果你正在为模型不听话、信息提取不准确而烦恼,记住这个技巧:再说一遍。

学AI大模型的正确顺序,千万不要搞错了

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1190260.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MyTV-Android:老旧电视重获新生的终极直播方案

MyTV-Android&#xff1a;老旧电视重获新生的终极直播方案 【免费下载链接】mytv-android 使用Android原生开发的电视直播软件 项目地址: https://gitcode.com/gh_mirrors/my/mytv-android 还在为家中运行安卓4.x系统的老旧电视无法安装现代直播软件而烦恼吗&#xff1f…

Zotero文献翻译神器:3分钟快速上手与实战技巧大全

Zotero文献翻译神器&#xff1a;3分钟快速上手与实战技巧大全 【免费下载链接】zotero-pdf-translate 支持将PDF、EPub、网页内容、元数据、注释和笔记翻译为目标语言&#xff0c;并且兼容20多种翻译服务。 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-pdf-translat…

FF14跳过动画终极指南:简单快速的完整配置教程

FF14跳过动画终极指南&#xff1a;简单快速的完整配置教程 【免费下载链接】FFXIV_ACT_CutsceneSkip 项目地址: https://gitcode.com/gh_mirrors/ff/FFXIV_ACT_CutsceneSkip 还在为FF14副本中那些重复播放的过场动画感到烦恼吗&#xff1f;&#x1f914; 每天刷本时看着…

5步搞定键盘固件刷写:QMK Toolbox新手速成手册

5步搞定键盘固件刷写&#xff1a;QMK Toolbox新手速成手册 【免费下载链接】qmk_toolbox A Toolbox companion for QMK Firmware 项目地址: https://gitcode.com/gh_mirrors/qm/qmk_toolbox 还在为机械键盘固件刷写而烦恼吗&#xff1f;QMK Toolbox作为QMK固件的黄金搭档…

Windows Cleaner终极指南:免费开源工具彻底解决C盘空间危机

Windows Cleaner终极指南&#xff1a;免费开源工具彻底解决C盘空间危机 【免费下载链接】WindowsCleaner Windows Cleaner——专治C盘爆红及各种不服&#xff01; 项目地址: https://gitcode.com/gh_mirrors/wi/WindowsCleaner 还在为Windows系统C盘红色警告而焦虑吗&am…

亲测好用MBA必看!9款AI论文写作软件深度测评

亲测好用MBA必看&#xff01;9款AI论文写作软件深度测评 为什么需要一份靠谱的AI论文写作工具榜单 在当前学术研究日益数字化、智能化的背景下&#xff0c;MBA学生和研究者对高效、精准的写作辅助工具需求愈发迫切。面对繁重的论文撰写任务&#xff0c;传统写作方式已难以满足效…

ZjuThesis使用指南:快速掌握学术论文排版技巧

ZjuThesis使用指南&#xff1a;快速掌握学术论文排版技巧 【免费下载链接】zjuthesis Zhejiang University Graduation Thesis LaTeX Template 项目地址: https://gitcode.com/gh_mirrors/zj/zjuthesis 在学术写作过程中&#xff0c;格式排版往往是耗时最多的环节。ZjuT…

程序员必看!大模型不是“超级程序员“,而是“超级鹦鹉“:揭秘LLM编程开发的5大真相

这段时间&#xff0c;我习惯和 GPT 一起改文章。 一般第一版出来时&#xff0c;我其实有点惊喜&#xff1a; 结构顺、语气稳&#xff0c;甚至比我预想得更像「真人写的」。 但越往后改&#xff0c;越不对劲。 我不断加要求&#xff1a; 更严谨、更克制、更像我、别有 AI 腔……

Pale Moon浏览器:(定制优化火狐浏览器),性能与兼容性兼得

在浏览器市场竞争激烈的今天&#xff0c;基于Chromium内核的浏览器几乎一统天下。然而&#xff0c;Pale Moon​ 浏览器坚持基于Firefox源码进行独立开发&#xff0c;通过针对现代处理器的深度优化&#xff0c;在性能方面展现了独特优势。 获取地址&#xff1a;点击获取 一、浏…

安装数据库

安装数据库1.rpm -qa|grep mysql 检查mysql安装包 2.rpm -e --nodeps 包名 删除mysql指定的包名 如:rpm -e --nodeps mysql-libs-5.1.71-1.el6.i686 3.yum remove mysql * 删除在线安装点包 4.yum install mysql 安装…

抖音下载神器:永久保存你心动的每一刻

抖音下载神器&#xff1a;永久保存你心动的每一刻 【免费下载链接】douyin-downloader 项目地址: https://gitcode.com/GitHub_Trending/do/douyin-downloader 还记得那个让你反复回味的抖音视频吗&#xff1f;那个让你笑出眼泪的搞笑片段&#xff0c;那个触动心弦的情…

Bypass Paywalls Clean:3分钟学会免费阅读付费内容的高效方法

Bypass Paywalls Clean&#xff1a;3分钟学会免费阅读付费内容的高效方法 【免费下载链接】bypass-paywalls-chrome-clean 项目地址: https://gitcode.com/GitHub_Trending/by/bypass-paywalls-chrome-clean 还在为优质文章的付费墙限制而苦恼吗&#xff1f;想要轻松解…

AppleRa1n终极指南:轻松解决iOS设备激活锁难题

AppleRa1n终极指南&#xff1a;轻松解决iOS设备激活锁难题 【免费下载链接】applera1n icloud bypass for ios 15-16 项目地址: https://gitcode.com/gh_mirrors/ap/applera1n 当你面对一部被iCloud激活锁困住的iOS设备时&#xff0c;是否感到束手无策&#xff1f;Apple…

优质特殊防爆扳手工具推荐榜适配多高危场景 - 优质品牌商家

优质特殊防爆扳手工具推荐榜适配多高危场景据《2026年中国防爆工具行业发展白皮书》数据显示,2024年我国防爆工具市场规模突破18.7亿元,年复合增长率达12.5%。其中,特殊防爆扳手工具因适配军工设备维护、石油化工特…

网易云音乐直链解析:3步打造个人永久音乐库

网易云音乐直链解析&#xff1a;3步打造个人永久音乐库 【免费下载链接】netease-cloud-music-api 网易云音乐直链解析 API 项目地址: https://gitcode.com/gh_mirrors/ne/netease-cloud-music-api 你是否曾经因为网易云音乐链接失效而苦恼&#xff1f;精心收藏的音乐资…

MGWR多尺度地理加权回归技术:空间异质性的革命性解析框架

MGWR多尺度地理加权回归技术&#xff1a;空间异质性的革命性解析框架 【免费下载链接】mgwr 项目地址: https://gitcode.com/gh_mirrors/mg/mgwr 多尺度地理加权回归&#xff08;MGWR&#xff09;作为空间计量经济学的前沿技术&#xff0c;通过引入变量特异性带宽参数&…

一篇解析小红书旅游攻略,本地商家的客流增量指南 - Redbook_CD

“出发前先翻小红书”早已成为当代年轻人的旅游标配。数据显示,小红书旅行兴趣月活用户已达2.3亿,超80%的年轻人出行前会在此搜索攻略,平台月均旅行相关搜索更是高达24亿次。对年轻人而言,小红书攻略不再是简单的“…

告别窗口遮挡:Topit让你的Mac工作效率翻倍

告别窗口遮挡&#xff1a;Topit让你的Mac工作效率翻倍 【免费下载链接】Topit Pin any window to the top of your screen / 在Mac上将你的任何窗口强制置顶 项目地址: https://gitcode.com/gh_mirrors/to/Topit 你是否曾经在编写代码时&#xff0c;文档窗口总是被编辑器…

飞算 JavaAI 修复器 无限 tokens 赋能 80% 开发 Bug 极速扫清

Java 开发进程里&#xff0c;最令人挫败的时刻莫过于&#xff1a;代码逻辑刚梳理完毕&#xff0c;运行后控制台却瞬间被红色报错刷屏。一个不起眼的语法疏漏、一处深藏不露的逻辑漏洞&#xff0c;或是棘手的依赖冲突、SQL 语法错误&#xff0c;都足以让开发者陷入困境 —— 新手…

手机号查QQ号三步快速指南:轻松找回失联好友的实用技巧

手机号查QQ号三步快速指南&#xff1a;轻松找回失联好友的实用技巧 【免费下载链接】phone2qq 项目地址: https://gitcode.com/gh_mirrors/ph/phone2qq 还在为忘记QQ号而烦恼吗&#xff1f;想找回多年不联系的老同学&#xff1f;phone2qq项目为你提供了一个简单实用的解…