学校网站注重服务平台建设泰州东方医院有限公司
学校网站注重服务平台建设,泰州东方医院有限公司,wordpress做过的大型网站吗,中国建筑官网一测二测成绩多少算及格理想情况下#xff0c;生成式 AI 的落地应用需要提供真实且高质量的响应。SELF-RAG 正是为解决此问题而被创建的。 背景介绍 有趣的是#xff0c;RAG的发展轨迹与提示工程#xff08;prompt engineering#xff09;非常相似。RAG 最初是一个简单而有效的概念#xff0c;其…理想情况下生成式 AI 的落地应用需要提供真实且高质量的响应。SELF-RAG 正是为解决此问题而被创建的。 背景介绍 有趣的是RAG的发展轨迹与提示工程prompt engineering非常相似。RAG 最初是一个简单而有效的概念其核心是在提示prompt中注入相关的背景信息。 RAG 的主要目标是充分利用大语言模型 (LLM) 的语境学习能力ICL。 目前RAG 正被赋予更复杂的机制与更高的效率。并非所有情况下都默认进行检索系统会先经过一个筛选流程来判断 LLM 是否可以独立完成用户请求。 效率和准确性之间的权衡始终存在。以效率为代价的准确性会损害用户体验和实际的应用价值而牺牲准确性的效率会导致结果的误导性与不准确性。 对用户输入进行筛选以此决定是直接依靠 LLM 进行推断inference还是通过 RAG 注入提示这一过程需要一个参照物。在 SELF-RAG 的情况下它是利用基于自反机制self-reflection微调过的LLM 来做参照的。 RAG 筛选的原理可以有多种实现形式。最重要的是一个决策参照用以判断是直接从 LLM 推断问题答案还是使用 RAG。并且在使用 RAG 的情况下能进一步评估响应的质量和正确性。 基于生成式 AI 的应用程序还可以更广泛地考虑筛选流程... 除了直接推断或 RAG 之外还有其他人机协作、网络搜索、多 LLM 协调等选项。
深入了解 SELF-RAG
SELF-RAG 框架可以训练出一个通用的语言模型使其能够按需自适应地检索段落。
该模型会借助被称为 “自反令牌”reflection tokens的特殊标记来生成和反思所检索的段落以及自身生成的内容。
自反令牌
自反令牌分为 “检索” 和 “批判” 两类分别表示检索需求和生成质量。
SELF-RAG 使用自反令牌来确定是否需要检索并对所生成内容的质量进行自我评估。
生成自反令牌使得语言模型在推理阶段具备可控性让其能够根据不同的任务需求调整自身行为表现。
研究表明SELF-RAG 显着优于标准的大语言模型 (LLMs) 和 RAG 方法。
SELF-RAG 的运作步骤 大语言模型LLM在检索到的段落指导下生成文本。 通过学习生成特殊标记的方式来批判输出结果。 这些自反令牌标示了检索的需求或是确认输出结果的相关性、论据支持、或完整性。 相比之下常见的 RAG 方法不加区别地检索段落无法确保所引用来源的可靠性。 考虑到下图... SELF-RAG 学习检索、批判和生成文本段落以提升整体生成质量、真实性和可验证性。 延伸思考
额外的推断与成本
SELF-RAG 会在推断方面引入更多的开销。参考上图这种自反式的 RAG 方法会引入更多的推断点。
首先会执行一次推断然后并行执行三次推断。接着对这三个结果进行比较并选出一个“优胜者”用于 RAG 推断。
超出领域范围
同样在上图中可以看出对于领域外的查询会被识别出来请求不会通过检索来处理而是直接发送到 LLM 推断。
Agentic RAG
再参考下面这张图一个问题值得思考...
随着 RAG 过程复杂性的增加我们是否正在接近这样一个点基于智能体agent的 RAG 方法将会是最优选择这种方法在 LlamaIndex 中被称为“Agentic RAG”Agentic RAG。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/88677.shtml
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!