综述速读|086.04.24.Retrieval-Augmented Generation for AI-Generated Content A Survey

论文题目:Retrieval-Augmented Generation for AI-Generated Content: A Survey
论文地址:https://arxiv.org/abs/2402.19473
bib引用:

@misc{zhao2024retrievalaugmentedgenerationaigeneratedcontent,title={Retrieval-Augmented Generation for AI-Generated Content: A Survey}, author={Penghao Zhao and Hailin Zhang and Qinhan Yu and Zhengren Wang and Yunteng Geng and Fangcheng Fu and Ling Yang and Wentao Zhang and Jie Jiang and Bin Cui},year={2024},eprint={2402.19473},archivePrefix={arXiv},primaryClass={cs.CV},url={https://arxiv.org/abs/2402.19473}, 
}

InShort

在这里插入图片描述
本文对RAG进行了全面综述,涵盖其基础、增强方法、应用、基准测试、局限与未来方向。

  1. RAG概述
    • 背景:AIGC借助模型算法创新、基础模型扩展和优质数据实现发展,但面临知识更新、长尾数据处理等问题。RAG通过引入检索过程,利用可检索知识作为非参数化记忆,解决这些问题,其应用已拓展到多种模态。
    • 贡献:系统梳理RAG基础范式,探究增强方法,展示其在多模态和任务中的应用,讨论局限并提出未来方向,为研究和实践提供参考。
    • 相关工作:已有相关研究存在局限,本文旨在提供全面系统的RAG综述,涵盖基础、增强和应用等方面。
  2. RAG基础
    • 生成器:常用生成器包括Transformer模型、LSTM、扩散模型和GAN,不同模型适用于不同生成场景。
    • 检索器:检索方法分为稀疏检索、密集检索和其他方法。稀疏检索基于词项匹配,密集检索使用密集嵌入向量,其他方法如基于编辑距离、知识图搜索和命名实体识别等。
    • 基础范式:分为查询式RAG(如REALM、SELF - RAG)、潜在表示式RAG(如FiD、RETRO)、基于logit的RAG(如kNN - LM、TRIME)和推测式RAG(如REST、GPTCache),每种范式在不同模态和任务中各有应用。
  3. RAG增强方法
    • 输入增强:通过查询变换(如Query2doc、HyDE)和数据增强(如Make - An - Audio、LESS)提升检索效果。
    • 检索器增强:采用递归检索(如ReACT、RATP)、块优化(如LlamaIndex、RAPTOR)、检索器微调(如REPLUG、APICoder)、混合检索(如RAP - Gen、BlendedRAG)、重排序(如Re2G、AceCoder)和检索变换(如FILCO、FiD - Light)等方法。
    • 生成器增强:运用提示工程(如LLMLingua、ReMoDiffuse)、解码调整(如InferFix、SYNCHROMESH)和生成器微调(如RETRO、APICoder)提升生成质量。
    • 结果增强:通过输出重写(如SARGAM、Ring)改进生成结果,使其更符合下游任务需求。
    • 流程增强:包括自适应检索(如FLARE、Self - RAG)和迭代RAG(如RepoCoder、ITER - RETGEN),优化RAG整体流程。
  4. RAG应用
    • 文本领域:在问答、事实验证、常识推理、人机对话、神经机器翻译、事件提取和文本摘要等任务中广泛应用,如FiD、REALM用于问答,CONCRETE用于事实验证。
    • 代码领域:涵盖代码生成、总结、补全、自动程序修复、文本到SQL和代码语义解析等任务,不同任务采用不同的RAG范式和方法,如SKCODER用于代码生成,Re2Com用于代码总结。
    • 多模态领域:在知识、图像、视频、音频、3D和科学等领域均有应用,如在知识领域用于知识库问答和知识增强开放域问答;在图像领域用于图像生成和图像字幕;在视频领域用于视频字幕和视频问答对话等。
  5. RAG基准测试:多个基准测试从不同维度评估RAG系统,如噪声鲁棒性、负样本拒绝、信息整合、反事实鲁棒性、忠实度、答案相关性和上下文相关性等。
  6. RAG局限与展望
    • 现存局限:存在检索结果有噪声、额外开销大、检索器与生成器存在差距、系统复杂度增加和上下文过长等问题。
    • 未来方向:包括设计新的增强方法、构建灵活的RAG管道、拓展应用领域、实现高效部署和处理、整合长尾和实时知识以及与其他技术结合等。
评估维度评估指标评估基准测试示例
噪声鲁棒性测试LLMs能否从噪声文档中提取必要信息Chen等人提出的RAG基准测试
负样本拒绝评估LLMs在检索内容不足时能否拒绝响应Chen等人提出的RAG基准测试
信息整合检查LLMs能否整合多个检索内容获取知识并响应Chen等人提出的RAG基准测试
反事实鲁棒性判断LLMs能否识别检索内容中的反事实错误Chen等人提出的RAG基准测试
忠实度基于检索内容评估事实准确性RAGAS、ARES、TruLens
答案相关性确定结果是否回答了查询RAGAS、ARES、TruLens
上下文相关性评估检索内容的相关性和简洁性RAGAS、ARES、TruLens

关键问题

  1. RAG的基础范式有哪些,它们是如何增强生成过程的?
    • RAG的基础范式有查询式RAG、潜在表示式RAG、基于logit的RAG和推测式RAG。查询式RAG将检索信息与用户查询整合作为生成器输入;潜在表示式RAG把检索对象作为潜在表示融入生成模型;基于logit的RAG在解码过程中通过logits整合检索信息;推测式RAG利用检索替代部分生成过程以节省资源和加速响应。这些范式从不同角度增强生成过程,提升生成内容的质量和效率。
  2. RAG在不同模态中的应用有何特点?
    • 在文本模态中,广泛应用于多种自然语言处理任务,通过检索相关文本信息辅助生成;代码模态结合检索和生成技术,提升代码相关任务的性能;知识模态利用结构化知识(如知识图谱和表格)进行检索增强;图像模态借助检索提高图像生成和描述的质量;视频模态用于视频字幕生成和视频问答对话等,增强对视频内容的理解和描述;音频模态在音频生成和字幕任务中发挥作用;3D模态应用于3D资产生成;科学领域用于药物发现、生物医学信息增强和数学应用等。不同模态根据自身特点和需求,采用不同的RAG方法和技术,以实现更好的效果。
  3. RAG目前面临哪些挑战,未来有哪些发展方向?
    • RAG目前面临检索结果有噪声、额外开销大、检索器与生成器存在差距、系统复杂度增加和上下文过长等挑战。未来发展方向包括设计新的增强方法,以更好地发挥RAG的潜力;构建灵活的RAG管道,适应复杂任务;拓展应用领域,设计领域特定的RAG技术;实现高效部署和处理,降低检索开销和系统复杂度;整合长尾和实时知识,使RAG能够处理动态信息;与其他技术结合,如微调、强化学习等,进一步提升AIGC的效果 。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/73919.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring Cache:简化缓存管理的抽象框架

Spring Cache Spring Cache是Spring框架提供的缓存抽象层,通过注解和自动化配置,简化应用中对缓存的操作,支持多种缓存实现(如Redis、Ehcache、Caffeine)。 1. 核心特性 声明式缓存:通过注解(…

求矩阵某列的和

设计函数sum_column( int A[E1(n)][E2(n)], int j ),E1(n)和E2(n)分别为用宏定义的行数和列数,j为列号。在该函数中,设计指针ptr&A[0][j],通过*ptr及ptrptrE2(n)访问第j列元素,从而求得第j列元素的和。在主函数中定…

IM腾讯Trtc与vod云点播:实现合流录制并上传,根据参数返回视频地址

全文目录,一步到位 1.前言简介1.1 专栏传送门1.1.1 文档传送门 2. java基础使用2.1 准备工作2.1.1 云控制台获取(密钥和密钥secret)2.1.2 找到trtc控制台2.1.3 vod云点播控制台 2.2 使用准备的数据进行操作2.2.0 引入依赖2.2.1 创建TrtcUtils工具类2.2.2 TrtcReqDTO 录制请求dt…

蓝桥杯 数三角

问题描述 小明在二维坐标系中放置了 n 个点,他想从中选出一个包含三个点的子集,使得这三个点能够组成一个三角形。 由于这样的方案太多了,他决定只选择那些可以组成等腰三角形的方案。 请帮他计算出一共有多少种选法可以组成等腰三角形。 …

【Kafka】从理论到实践的深度解析

在当今数字化转型的时代,企业面临着数据量呈指数级增长、业务系统愈发复杂的挑战。在这样的背景下,高效的数据传输与处理技术成为了关键。Kafka,作为一款分布式消息队列系统,凭借其卓越的性能和丰富的特性,在众多企业的…

Linux课程学习一

一.fopen与fclose函数 linux中fopen函数直接用man fopen 去查看 函数原型 FILE * fopen(constchar *path , cost char *mode) /* * description : 打开一个文件 * param ‐ path : 指定文件路径,如:"./test.txt",也可以直接由文件名 * param …

【区块链安全 | 第十篇】智能合约概述

部分内容与前文互补。 文章目录 一个简单的智能合约子货币(Subcurrency)示例区块链基础交易区块预编译合约 一个简单的智能合约 我们从一个基础示例开始,该示例用于设置变量的值,并允许其他合约访问它。 // SPDX-License-Identi…

XML标签格式转换为YOLO TXT格式

针对的是多边形&#xff08;<polygon>&#xff09;来描述对象的边界&#xff0c;而不是传统的矩形框&#xff08;<bndbox>&#xff09; import xml.etree.ElementTree as ET import os from pathlib import Path# 解析VOC格式的XML文件&#xff0c;提取目标框的标…

大唐杯02 DTM.PX4.016

01 5G关键技术概述 回传压力大&#xff1a;核心网向基站回传压力大 02 5G关键技术介绍01

CSS3学习教程,从入门到精通, CSS3 盒子模型的详细语法知识点及案例代码(23)

CSS3 盒子模型的详细语法知识点及案例代码 CSS3 盒子模型完整指南 一、盒子模型基础 每个 HTML 元素都被视为一个矩形盒子&#xff0c;由以下部分组成&#xff1a; 内容区 (Content)内边距 (Padding)边框 (Border)外边距 (Margin) 二、语法知识点详解 1. 盒子的宽和高 sel…

《Linux运维实战:Ubuntu 22.04修改root用户默认名并禁止登录》

总结&#xff1a;整理不易&#xff0c;如果对你有帮助&#xff0c;可否点赞关注一下&#xff1f; 更多详细内容请参考&#xff1a;Linux运维实战总结 一、背景信息 由于安全方面的考虑&#xff0c;先要求Ubuntu 22.04系统重的root用户禁止登录&#xff0c;并修改用户名root为ad…

docker-compose自定义网络,解决docker-compose网段路由冲突

问题排查 先route一波查看一下路由表 容器路由19和堡垒机路由冲突 解决方案 更改docker网段更改docker生成容器的网段 > 基本操作 docker network ls &#xff1a;查看docker网络列表 docker network inspect <network id/name>&#xff1a;查看某个docker网络详情…

前端 - ts - - declare声明类型

在使用typeScript的项目中 需要声明属性类型 单独的局部属性 可以直接在当前文件中声明 全局属性需要在项目根目录下新建.d.ts文件 vite会自动识别.d.ts类型文件 在该文件中使用declare声明类型有三种写法 1、在某种类型的文件中声明 2、声明window上的属性类型 3、全局声明…

[Mac]利用Hexo+Github Pages搭建个人博客

由于我这台Mac基本没啥环境&#xff0c;因此需要从零开始配置&#xff0c;供各位参考。 注意⚠️&#xff1a;MacBook (M4)使用/bin/zsh作为默认Shell&#xff0c;其对应的配置文件为~/.zshrc 参考文档&#xff1a; HEXO系列教程 | 使用GitHub部署静态博客HEXO | 小白向教程 文…

运维面试题(十一)

1.如果一个硬盘 IO 时阻塞了&#xff0c;会发生什么情况&#xff1f; 进程/线程挂起&#xff1a;发起I/O操作的进程或线程会被操作系统置为阻塞状态&#xff08;等待状态&#xff09;&#xff0c;直到I/O完成。CPU资源释放&#xff1a;阻塞的线程会让出CPU&#xff0c;操作系统…

sql2022 复制 事务级别发布后无法删除

Cannot execute as the database principal because the principal "dbo" does not exist, this type of principal cannot be impersonated, or you do not have permission. 用SA用户登录执行下列语句 USE [xxxxx] GO EXEC dbo.sp_changedbowner loginame Nsa, …

合规+增效 正也科技携智能营销产品出席中睿论坛

正也科技作为医药数字化领域的标杆企业&#xff0c;受邀参展第二届中睿医健产业企业家年会暨第十三届中睿医药新春论坛&#xff0c;本次论坛以“合力启新程”为主题&#xff0c;吸引了800多位医药健康企业的董事长、总经理参与&#xff0c;并通过主论坛、分论坛、路演等形式探讨…

ubuntu 安装 postgresql

在 Ubuntu 系统中安装 PostgreSQL 的步骤如下&#xff1a; 步骤 1&#xff1a;更新软件包列表 sudo apt update步骤 2&#xff1a;安装 PostgreSQL Ubuntu 默认仓库包含 PostgreSQL&#xff0c;直接安装&#xff1a; sudo apt install postgresql postgresql-contrib -ypost…

智能巡检机器人:2025年企业安全运维的“数字哨兵“

文章目录 一、2025年&#xff0c;为什么企业需要智能巡检机器人&#xff1f;二、2025年智能巡检机器人的六大核心价值三、2025行业落地实景1. 电网系统——"巡线鹰"集群作战2. 化工园区——"防爆卫士"全天候守护3. 数据中心——"冷血侦探"精准运…

K8S学习之基础五十一:k8s部署jenkins

k8s部署jenkins 创建nfs共享目录&#xff0c; mkdir -p /data/v2 echo /data/v2 *(rw,no_root_squash) > /etc/exports exportfs -arv创建pv、pvc vi pv.yaml apiVersion: v1 kind: PersistentVolume metadata:name: jenkins-k8s-pv spec:capacity:storage: 1GiaccessMod…