论文笔记:How Can Recommender Systems Benefit from Large Language Models: A Survey - 详解

news/2025/9/26 22:47:11/文章来源:https://www.cnblogs.com/lxjshuju/p/19114444

文献核心观点

这篇综述系统性地探讨了大语言模型(Large Language Models, LLMs)如何赋能推荐体系(Recommender Systems, RS),并提出了一个四象限分类框架来组织现有研究。
在这里插入图片描述

其核心观点是:

大语言模型可以通过四种主要范式(象限)融入推荐框架:直接作为推荐器、作为推荐器的增强模块、利用LLM生成的数据进行训练、以及作为推荐过程的控制器。每种范式在模型规模、任务形式和性能表现上各有特点。


一、核心框架:四象限分类法

文献的核心贡献是提出了一个二维四象限图(Figure 4),横轴为“是否在推荐任务上微调”,纵轴为 “是否使用LLM生成的中间结果”
在这里插入图片描述

四个象限及其含义:

象限是否微调是否使用LLM中间结果核心思想
Q1LLM作为增强模块:LLM生成用户画像、物品描述、上下文等中间信息,输入给传统推荐模型。
Q2LLM生成数据用于训练:用LLM生成合成数据(如用户评论、交互理由)来扩充训练集,提升传统模型性能。
Q3LLM作为控制器调度、组合或解释传统推荐模型的结果。就是:LLM不直接推荐,而
Q4LLM直接作为推荐器:零样本/少样本推荐,直接用LLM(如ChatGPT)预测用户偏好。

下面我们通过具体实例来说明每个象限的观点。


二、各象限观点解析与实例说明

象限 Q4:LLM 直接作为推荐器(Zero-shot / Few-shot Recommendation)

观点:利用LLM强大的语言理解和生成能力,无需微调即可进行推荐,尤其适用于冷启动场景。

实例说明

  • 模型Chat-REC(文献中提及,利用ChatGPT)
  • 场景:用户说:“我想看一部类似《星际穿越》的科幻电影,最好有时间旅行和哲学思考。”
  • 过程
    1. 将用户查询和候选电影列表(含标题、简介)构造为自然语言提示(Prompt)。
    2. 输入给ChatGPT:“基于以下电影简介,哪部最符合用户‘喜欢《星际穿越》风格’的偏好?”
    3. ChatGPT分析语义相似性,输出推荐结果,如《盗梦空间》。
  • 优势:无需训练数据,可解释性强。
  • 挑战:计算成本高,可能产生幻觉(hallucination),难以处理大规模候选集。

文献支持:图4中Chat-REC位于Q4,使用>100B的LLM(如ChatGPT),击败了MF等传统基线。


象限 Q1:LLM 作为推荐器的增强模块(LLM as Enhancer)

观点:LLM不直接推荐,而是为传统推荐模型提供高质量的语义特征,如用户画像、物品嵌入、上下文表示。

实例说明

文献支持ZESRec位于Q1,利用LLM生成中间表示,提升传统模型性能。


象限 Q2:利用LLM生成的数据进行训练(LLM as Data Generator)

观点:用LLM生成高质量的合成资料(如用户评论、交互理由、负样本),用于增强传统推荐模型的训练。

实例说明

  • 模型MINT(可能指某项利用LLM生成训练数据的工作)
  • 场景:音乐推荐系统缺乏用户对歌曲的详细反馈。
  • 过程
    1. 用LLM生成合成用户评论:“这首歌旋律优美,但节奏偏慢,适合下午茶时间。”
    2. 将这些评论作为辅助信息,训练一个能理解用户情感偏好的推荐模型。
    3. 模型在真实数据上训练时,能更好地区分“旋律”和“节奏”等细粒度偏好。
  • 优势:缓解内容稀疏疑问,提升模型泛化能力。
  • 挑战:生成数据的质量和真实性难以保证,可能导致模型学到错误模式。

文献支持:Q2象限强调“LLM生成数据用于训练”,如生成用户行为理由来辅助学习。


象限 Q3:LLM 作为推荐过程的控制器(LLM as Controller)

观点作为“大脑”调度多个推荐模块,实现复杂决策。就是:LLM不生成特征也不直接推荐,而

实例说明

文献支持InteRecAgent位于Q3,LLM作为控制器协调多个推荐组件。


三、总结:本文的核心贡献与价值

贡献维度具体内容
统一框架提出四象限分类法,系统梳理LLM与RS的融合路径,避免研究碎片化。
技术洞察揭示了LLM在推荐中的角色演变:从“工具”到“核心”再到“大脑”。
发展轨迹图中箭头暗示研究趋势:从Q4(直接推荐)向Q1/Q3(增强与控制)演进,追求效率与可控性。
挑战指明强调幻觉、成本、评估难题,为未来研究指明方向。

四、未来方向

  1. 高效微调(如LoRA、Adapter)降低LLM应用成本。
  2. 多模态LLM:结合图像、音频的LLM用于视频、电商推荐。
  3. 可信赖推荐:减少幻觉,提升推荐的公平性与可解释性。
  4. LLM-native RS:设计专为推荐任务优化的轻量级LLM。

结语

这篇综述不仅是对LLM+RS领域的“全景图”,更提出了一个范式级的分类框架。它揭示了LLM正从“辅助工具”转变为推荐系统的“认知核心”。未来,随着LLM能力的提升和成本的降低,我们或将看到以LLM为中心的智能推荐代理(Intelligent Recommendation Agent),真正建立个性化、可解释、多轮交互的推荐体验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/918859.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Service :微服务通信、负载、故障难题的解决方案 - 指南

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

newDay04

1.做了一些关于方法的小练习,比如说判断数据是否存在,截取数组的一部分数据等,学到了伪造索引的思想,背单词 2.作业还有好些没写,其他课程也该复习巩固了 3.午觉睡太久了,直接干到晚上了

5.WPF控件---ComboBox - 实践

5.WPF控件---ComboBox - 实践pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco"…

深圳网站优化网站建设网站 宣传平台

AspectJ1 简介AspectJ:Java社区里最完整最流行的AOP框架。在Spring2.0以上版本中,可以使用基于AspectJ注解或基于XML配置的AOP。2 在Spring中启用AspectJ注解支持导入JAR包springsource.net.sf.cglib-2.2.0.jarspringsource.org.aopalliance-1.0.0.jarsp…

python+springboot+uniapp基于微信小程序的任务打卡框架

python+springboot+uniapp基于微信小程序的任务打卡框架pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas&…

SQLserver 通过本地方式改SA密码

1. 以本地管理员身份打开命令提示符(CMD)或 PowerShell按下 Win + R,输入 cmd 或 powershell,右键选择「以管理员身份运行」。2. 使用 sqlcmd 本地连接 SQL Server 如果是默认实例(通常为 MSSQLSERVER),直接连接…

源码网站程序一手货源怎么找

摘要: 过于一周发生太多事情,林林总总,有些事情为了避免重蹈覆辙,要进行回溯复盘。 主要集中于做事方式,做事方法,更多的是集中于失败的做事方式。 在认知层面,要通过做事的结果,来反向推导做…

2_2025.9.26_2

题目:[https://codeforces.com/problemset/problem/2140/E2] ac代码:[https://codeforces.com/contest/2140/submission/340632254] 思路: 根据easy version的状压dp做法,利用二分答案的思想,再套差分一个个求

k8s部署Prometheus实战

k8s部署Prometheus实战本文来自博客园,作者:尹正杰,转载请注明原文链接:https://www.cnblogs.com/yinzhengjie/p/19114433,个人微信: "JasonYin2020"(添加时请备注来源及意图备注,有偿付费) 当你的才…

AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型

AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生…

javaEE初阶————多线程进阶(1) - 教程

javaEE初阶————多线程进阶(1) - 教程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "…

Ubuntu Linux 常用命令

Ubuntu Linux 常用命令更新软件包 sudo apt update sudo apt upgrade 查看CPU占用情况 sudo apt-get install htop 删除程序 如果你知道要删除软件的具体名称,可以使用 sudo apt-get remove --purge 软件名称 sudo …

软工9.26

今天学了很多,了解到了double类型数值在进行运算时精度的问题,还有包装类型。

漂亮的蓝色网站足球直播在线直播观看免费cctv5

在Python中&#xff0c;你可以编写一个函数来判断一个数是否为素数。素数是指只有1和它本身两个正因数&#xff08;不包括1本身&#xff09;的自然数。以下是一个简单的示例代码&#xff1a; python复制代码 def is_prime(n): if n < 1: return False if n < 3: return …

购物网站开发的背景济宁网站建设 企业谷

文章目录1. 下载2. 启动1. 下载 https://github.com/MicrosoftArchive/redis/releases 2. 启动 进入redis的bin目录双击redis-server.exe

网络安全周报:AI监控工具与关键基础设施漏洞警报

本期网络安全周报汇总了2024年11月17日至24日的关键事件,涵盖美军网络AI监控工具试点、水务系统关键漏洞警告、能源威胁分析中心启动等13个重要新闻,呈现全球网络安全最新动态与威胁态势。2024年11月17日 — 11月24日…

云主机建多个网站电器企业网站建站

武装部三维电子沙盘-行动路径规划分析平台是一款集成了大数据、云计算、虚拟现实、物联网、AI等先进技术的综合性系统。它真实模拟地形、地貌、地物&#xff0c;结合地理空间专业数据、执勤兵力部署、基干民兵信息、普通民兵信息、潜力资源信息、军队相关专业数据、兵要地志数据…

做网站 中文字体是用什么asp商业网站源码

项目开发总结报告&#xff08;GB8567——88&#xff09;1引言1.1编写目的说明编写这份项目开发总结报告的目的&#xff0c;指出预期的阅读范围。1.2背景说明&#xff1a;a&#xff0e; 本项目的名称和所开发出来的软件系统的名称&#xff1b;b&#xff0e; 此软件的任务提出者、…

重链抗体(IgG2、IgG3)与传统抗体的核心区别:从结构到功能的全方位解析

在骆驼科动物(如单峰驼、羊驼)的免疫系统中,同时存在两类功能与结构差异显著的抗体 —— 传统抗体(以 IgG1 为代表)与重链抗体(IgG2、IgG3)。二者的区别不仅体现在分子结构的 “有无轻链” 这一核心特征上,更延…

9.26总结

1.今天复习了算法运用了顺序运算 2.明天用链式运算从新解决 3.收获很大