推荐大模型系列-NoteLLM: A Retrievable Large Language Model for Note Recommendation(一) - 指南

news/2026/1/18 14:38:14/文章来源:https://www.cnblogs.com/gccbuaa/p/19498480

目录

一、摘要

二、介绍

三、相关工作

I2I 推荐技术概述

内容驱动的I2I推荐

大语言模型(LLMs)的应用潜力

大语言模型在推荐架构中的应用

从文本生成话题标签/分类

四、问题定义

问题定义

任务描述


一、摘要

人们乐于在在线社区中分享包含个人体验的“笔记”,因此推荐符合用户兴趣的笔记已成为一项关键任务。现有在线方法仅将笔记输入基于BERT的模型生成嵌入以评估相似性,但可能未充分利用某些重要线索,例如代表笔记核心概念的标签(hashtags)或分类。实际上,学习生成标签/分类可增强笔记嵌入,两者均将关键信息压缩为有限内容。此外,大型语言模型(LLMs)在自然语言理解上显著优于BERT,引入LLMs至笔记推荐具有广阔前景。

本文提出一种名为NoteLLM的新型统一框架,利用LLMs克服笔记间(I2I)推荐疑问。具体而言,利用“笔记压缩提示”将笔记压缩为单个特殊标记,并采用对比学习方法学习潜在相关笔记的嵌入。此外,NoteLLM通过指令微调自动生成笔记摘要及标签/分类。真实场景的广泛验证表明,相比在线基线方法,该方案显著有效,并在小红书推荐系统中实现重大改进。

二、介绍

否具备相关内容至关重要。实际上,大家发现生成话题标签/类别与生成笔记嵌入类似。两者都将笔记的关键信息压缩到有限的内容中。因此,学习生成话题标签/类别有可能提高嵌入的质量。此外,大型语言模型(Large Language Models,LLMs)最近在自然语言处理[10, 24, 42, 54]和推荐环境[1, 2, 34, 59]方面展现出了强大的能力。然而,目前很少有研究探讨LLMs在I2I推荐中的应用。利用LLMs改进I2I笔记推荐具有相当大的潜力。就是以用户生成内容(UGC)为核心,致力于给出更真实、个性化的用户体验,小红书(Xi-aohongshu)和Lemon8等社交媒体在用户中广受欢迎。这些平台鼓励用户分享产品评价、旅行博客和生活经历等内容,这些内容也被称为“笔记”。通过根据用户偏好提供更个性化的笔记,笔记推荐在提升用户参与度方面发挥着至关重要的作用[16, 34, 48, 64]。物到物(Item-to-item,I2I)笔记推荐是一种从数百万级的笔记库中检索用户可能感兴趣的笔记的经典方法[19, 65]。给定一条目标笔记,I2I方法会根据内容[65]或协同信号[19]选择相关笔记。现有的在线I2I笔记推荐方法通常将整篇笔记内容输入基于BERT的模型[3]以生成笔记嵌入,并根据嵌入相似度推荐相关笔记[11, 36]。然而,这些方法仅将话题标签/类别视为笔记内容的一个组成部分,未能充分利用其潜力。如图1所示,话题标签/类别(例如#新加坡)代表了笔记的核心思想,对于判断两条笔记

通过受上述见解启发,本文提出了一种名为NoteLLM的统一多任务方法。NoteLLM基于LLMs,从I2I笔记推荐和话题标签/类别生成任务中学习,旨在利用学习提取浓缩概念来增强I2I笔记推荐能力。具体而言,我们首先为每个笔记样本构建一个统一的笔记压缩提示,接着通过预训练的LLMs(例如LLaMA 2 [42])进行解码,这些模型利用特殊标记来压缩笔记内容并同时生成话题标签/类别。为了构建相关笔记对,我们根据用户行为统计所有笔记对的共现分数,并为每个笔记形成共现分数集。我们选择共现分数最高的笔记作为给定笔记的相关笔记。此外,为了为每个样本推荐相关笔记,生成-对比学习(Generative-Contrastive Learning,GCL)利用压缩标记作为每个笔记的嵌入,接着训练LLMs从批量负样本中识别出相关笔记。同时,我们采用协同监督微调(Collaborative Supervised Fine-tuning,CSFT)技巧来训练模型为每个笔记生成话题标签/类别。由于I2I笔记推荐任务和话题标签/类别生成任务所学习的压缩标记都旨在提取笔记内容的核心概念,因此CSFT能够有效增强笔记嵌入。

本文的贡献如下:

  • 据大家所知,我们的NoteLLM框架是首个利用LLMs克服I2I推荐任务的框架。它揭示了引入LLMs是增强I2I推荐体系的一种实用且具有前景的策略。
  • 有益的。就是我们提出了一个多任务框架,借助学习I2I推荐任务和话题标签/类别生成任务来增强笔记嵌入。我们证明了学习生成压缩概念对I2I推荐任务
  • 在小红书的离线实验和在线工业场景中进行的广泛验证表明,我们提出的技术框架在笔记推荐方面是实用的。

三、相关工作

I2I 推荐工艺概述

I2I(Item-to-Item)推荐是一种基于目标物品从大规模物品池中推荐排序列表的关键技术。其实现方式包括预构建I2I索引或在线通过近似k近邻手段检索相关物品。传统I2I推荐通常仅依赖用户行为的协同信号,但这类方式因缺乏用户-物品交互数据而无法处理冷启动物品挑战。

内容驱动的I2I推荐

为消除冷启动问题,大量研究转向基于内容的I2I推荐。文本驱动的I2I推荐系统凭借物品的文本内容衡量相似性。早期途径采用基于词项的稀疏向量匹配机制,而深度学习工艺则通过神经网络更高效地表征文本信息。后续研究将文本转化为同一潜在空间的嵌入向量,通过嵌入相似度衡量关系。

大语言模型(LLMs)的应用潜力

近期,大语言模型因其卓越能力受到广泛关注,但在I2I推荐领域的应用尚未充分探索。现有研究多将LLMs仅视为生成嵌入向量的编码器,未能发挥其生成能力的全部潜力。NoteLLM创新性地利用LLMs生成标签/类别,以增强物品嵌入表征。

大语言模型在推荐系统中的应用

近年来,大语言模型(LLMs)取得了显著进展,许多研究将其引入推荐任务。LLMs与推荐架构的结合主要有三种手段。

数据增强方法
通过LLMs丰富世界知识的特性生成更突出且多样化的材料,优于原始数据。但这类途径需持续预处理测试数据以匹配增强后的训练数据,且高度依赖LLM生成的质量。

直接推荐手段
设计特殊提示词或通过监督微调引导LLMs回答推荐问题。由于上下文长度限制,这类手段通常仅用于重排序阶段,处理数十个候选计划。

嵌入编码方法
将LLMs作为编码器生成项目表征嵌入。虽然能有效提取信息,但放弃了LLMs的生成能力。NoteLLM创新地在召回阶段使用LLMs,并通过学习标签生成优化嵌入生成能力。

从文本生成话题标签/分类

话题标签和分类作为社交媒体上的标注机制,能够简化特定主题内容的识别,并帮助用户查找相关主题内容。从文本生成这些标签可为未标注的笔记创建标识符,或根据用户偏好推荐选项。该领域主要存在三种途径:抽取式、分类式和生成式方式。

抽取式方法从文本中识别关键短语作为话题标签或分类,但无法获取原文中未出现的标签。分类式方法将任务视为文本分类问题,但由于人工生成标签的多样性和自由形式特性,可能导致结果欠佳。

生成式技巧直接根据输入文本生成话题标签/分类,但这些方法仅局限于解决标签生成任务。在NoteLLM中,大语言模型(LLM)通过多任务学习,同时执行I2I推荐和标签/分类生成。由于这两项任务的相似性,学习生成标签/分类也能提升I2I推荐的效果。

四、问题定义

问题定义

本节介绍问题定义。假设笔记池为N = {₁, ₂, ..., ₘ},其中 表示笔记数量。每条笔记包含标题、标签、类别和内容,第 条笔记记为 = (, , , ),其中 分别代表标题、标签、类别和内容。

任务描述

笔记间推荐任务(I2I)
给定目标笔记,基于大语言模型(LLM)的检索器需从笔记池N {}中筛选出与目标笔记最相似的条笔记并进行排序。

标签生成任务
利用 LLM 根据标题 和内容 生成对应的标签

类别生成任务
利用 LLM 根据标题、标签 和内容 生成对应的类别


本篇内容就到这里,下篇会详细讲解方法论。

下篇文章:推荐大模型系列-NoteLLM: A Retrievable Large Language Model for Note Recommendation(二)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1178484.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2026年1月板材品牌实力排行榜:十大品牌权威对比 - 品牌推荐

在消费升级与健康意识觉醒的双重驱动下,2026年的家居板材市场已进入以科技、环保与综合性能为核心竞争力的新阶段。板材作为家居空间的基石,其环保等级、物理性能与品牌综合服务能力,直接决定了居住环境的健康度与家…

未来城市轨道交通的核心竞争力

目录 🎯 核心竞争力的三大构成与获得路径 🔍 核心竞争力详解与获得之道 1. 智慧化:从自动化到自主化的效能革命 2. 绿色化:从节能降耗到近零排放的必然选择 3. 融合化:从独立线路到网络生态的价值倍增 &#x1f…

python 爬虫可视化上海市松江区二手房价格分析预测系统的设计与分析

目录摘要关键词开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!摘要 上海市松江区作为上海的重要城区之一,其二手房市场受到地理位置、交通设施、教育资源等多重因素影响。本研究…

AI智能证件照制作工坊权限管理:多用户隔离部署教程

AI智能证件照制作工坊权限管理:多用户隔离部署教程 1. 引言 1.1 学习目标 本文将详细介绍如何在生产环境中为 AI 智能证件照制作工坊 实现多用户权限隔离与安全部署,确保多个用户或租户在共享同一服务实例时,彼此的数据、配置和操作完全隔…

2026年板材品牌十大品牌成熟度分析:基于智能制造与全链服务能力的综合调研发布 - 品牌推荐

2026年,家居环境的健康与品质已成为消费者决策的核心要素,板材作为家装的基石,其环保等级、物理性能与品牌综合服务能力,直接决定了最终居住体验与长期价值。本文基于技术研发、产品矩阵、环保认证与市场口碑四大维…

避坑指南:Qwen3-VL-8B-Instruct部署常见问题全解析

避坑指南:Qwen3-VL-8B-Instruct部署常见问题全解析 1. 引言:为什么选择 Qwen3-VL-8B-Instruct-GGUF? 随着多模态大模型在视觉理解、图文生成和指令执行等任务中的广泛应用,如何将高性能模型轻量化并部署到边缘设备成为工程落地的…

2026年1月板材品牌实力排行榜:基于环保标准与市场口碑的十大品牌权威对比 - 品牌推荐

在健康人居与品质生活成为核心诉求的当下,板材作为家居空间的基石,其环保等级、物理性能与美学表现直接决定了居住体验的品质高度。面对市场上琳琅满目的品牌与层出不穷的环保概念,消费者与设计师的选材决策变得日益…

YOLOv8性能优化实战:CPU推理提速50%的参数详解

YOLOv8性能优化实战:CPU推理提速50%的参数详解 1. 引言:工业级目标检测的性能挑战 在边缘计算和工业视觉场景中,实时性是目标检测系统的核心指标。尽管YOLOv8凭借其高精度与快速推理能力成为主流选择,但在无GPU支持的纯CPU环境下…

论城市轨道交通未来核心竞争力的构建:从网络扩张到系统智能的范式跃迁

目录 摘要 1. 引言:重新定义轨道交通的竞争维度 2. 未来核心竞争力的四维内涵与互锁机制 2.1 数字化智能:驱动系统进化的“中枢神经” 2.2 绿色化可持续:保障系统永续的“循环系统” 2.3 融合化网络:提升系统效能的“骨骼血脉…

使用声波进行定位的技术综述

一、引言 在定位技术领域,GNSS(GPS/北斗)、Wi‑Fi、蓝牙、UWB 已成为主流方案。但在 室内、地下、隧道、水下、高干扰环境 等场景中,电磁波定位往往失效或精度急剧下降。声波(Acoustic / Ultrasonic)由于其 传播…

python中国汽车驾驶体验评价与推荐平台 爬虫可视化

目录中国汽车驾驶体验评价与推荐平台爬虫与可视化摘要开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!中国汽车驾驶体验评价与推荐平台爬虫与可视化摘要 平台通过Python爬虫技术抓取主流汽车…

python个性化英语学习辅助系统

目录个性化英语学习辅助系统摘要开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!个性化英语学习辅助系统摘要 开发一个基于Python的个性化英语学习辅助系统,旨在通过智能化技术提…

Vue3 响应式系统——ref 和 reactive

一、Vue3 响应式系统概述 Vue3 响应式包 @vue/reactivity,核心由三部分构成: 数据 (Proxy Object) —— 依赖收集 Track —— 触发更新 Trigger —— Effect 执行更新核心目标:拦截读取和设置操作 收集依赖 在数…

使用 perf + FlameGraph 生成火焰图(Flame Graph)笔记

使用 perf FlameGraph 生成火焰图(Flame Graph)笔记使用 perf FlameGraph 生成火焰图(Flame Graph)笔记一、什么是火焰图(Flame Graph)火焰图的核心含义二、整体流程概览三、准备环境1️⃣ 安装 perf2️⃣…

深度测评10个AI论文写作软件,研究生高效写作必备!

深度测评10个AI论文写作软件,研究生高效写作必备! AI 工具如何助力论文写作?这些功能你不可不知 在当今学术研究日益激烈的环境下,研究生们面临着越来越高的论文写作要求。无论是开题报告、文献综述,还是实验分析和结论…

基于深度学习和熔池图像对的焊缝熔透状态识别【附代码】

✅ 博主简介:擅长数据搜集与处理、建模仿真、程序设计、仿真代码、论文写作与指导,毕业论文、期刊论文经验交流。✅成品或者定制,扫描文章底部微信二维码。(1) 双棱镜单摄像机被动立体视觉系统的设计与熔池图像采集熔化极气体保护焊接过程中&…

导入自己的听歌时长数据,统计每周听歌总时长,输出音乐风格偏好分析。

1. 实际应用场景描述场景某音乐爱好者使用音乐平台听歌,并导出自己的听歌记录(日期、歌曲名、歌手、音乐风格、听歌时长)。他希望:- 统计每周听歌总时长- 分析音乐风格偏好- 根据数据调整歌单,发现更多喜欢的音乐痛点-…

python基于Web技术的智能养老管理系统

目录基于Web技术的智能养老管理系统摘要开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!基于Web技术的智能养老管理系统摘要 随着人口老龄化加剧,传统养老模式面临资源分配不均、…

python基于大数据文化产业发展智能分析系统

目录基于大数据文化产业发展智能分析系统的摘要开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!基于大数据文化产业发展智能分析系统的摘要 随着文化产业的快速发展,大数据技术成…

MySQL面试中,锁机制必问的5大问题!

文章目录MySQL中有哪几种锁?引言:为什么我们要聊锁?第一部分:MySQL中的锁类型1. 表级锁(Table Lock)示例:MyISAM 表的表级锁配置建议2. 行级锁(Row Lock)示例&#xff1a…