提升数据表征的对比学习新方法

许多人工智能的最新进展都源于表示学习:机器学习模型学习将数据项表示为多维空间中的向量,其中向量之间的几何关系对应着项目之间的语义关系。某机构的M5团队致力于构建与某中心商店相关数据(产品描述、查询、评论等)的通用语义表示,这些表示可供整个某机构的机器学习系统使用。其方法涉及利用每个实体可访问的所有数据,这些数据通常跨越多种模态。

生成通用表示最成功的方法之一是对比学习,模型在输入对上进行训练,这些输入对要么是正例(相似的输入/产品),要么是负例(不相似的输入/产品)。模型学习将正例拉近,将负例推开。

在最近的两篇论文中,M5研究人员对对比学习的理论和实践做出了实质性贡献。在2022年神经信息处理系统会议上发表的论文《为什么在对比学习中需要大批量?一个梯度偏差的视角》中,提出了一种新的对比学习损失函数,使模型能够以更低的内存成本和更少的训练数据收敛于有用的表示。

而在今年计算机视觉与模式识别会议上发表的论文《理解与构建多模态表示学习中的潜在模态结构》中,提出了对同一数据项不同模态(例如图像和文本)表示的几何约束。这些约束比简单地尝试将两种表示解析到表示空间中的同一点,对下游任务更有用。

对比学习需要大批量吗?

与标准的机器学习方法相比,对比学习通常需要非常大的批量才能获得良好的性能:例如,一些流行模型需要数万个训练样本,显著增加了内存开销;减少批量大小可能会损害性能。在NeurIPS论文中,试图理解这一现象并提出缓解技术。

对比学习的部分吸引力在于它是无监督的,这意味着它不需要数据标注。正例对可以通过数学变换一个“锚样本”并将变换后的版本与原始版本配对来生成;负例对可以通过将锚样本与其他锚样本的变换版本配对来生成。对于图像数据,变换可能涉及重新裁剪、反转或扭曲锚样本的颜色;对于文本数据,变换可能涉及用同义词替换句子中的单词。

给定表示空间中向量之间的相似性度量,对比学习的标准损失函数涉及一个比率,其分子包含锚样本与其某个变换之间的相似性;分母包含锚样本与所有可能的负样本的相似性之和。训练的目标是最大化该比率。

原则上,考虑到对负样本应用变换的可能性,“所有可能的负样本”可能描述一个无限集合。实际上,对比学习通常只依赖训练批次中可用的负例。因此需要大批量——以近似一个无限和。

如果小批量样本的分布与可能负例的分布不同,这种近似可能会使模型产生偏差。纠正偏差的一个困难在于,由于损失函数将每个正例对与所有可能的负例一次性地在一个比率中进行对比,它不能被分解为子损失之和。

使用贝叶斯增强来解决可分解性问题。总体方法是,为每个锚样本创建一个随机辅助变量,可以将其视为应用于锚样本相似性得分的权重。利用伽马函数下的恒等式,可以证明该辅助变量遵循伽马分布,易于采样。因此,可以将损失重写为指数形式而非分数形式,使其可分解。

在训练期间,首先从伽马分布中采样当前数据批次的辅助变量,得到所有锚样本相似性得分的权重。以采样值为条件,然后应用最大似然估计来优化模型参数,模型将考虑第一步中相似性得分的采样权重。然后对整个数据集重复此过程,将一系列(加权的)子损失相加以产生累积损失。在论文中表明,该过程将收敛于原始对比损失函数的期望损失,其分母是无限和。

通过一系列实验评估该方法。其中一个实验使用模拟数据,并注入噪声以模拟偏差。然后使用我们的损失和传统损失函数训练模型10次,每次使用不同的初始化值。在噪音水平较高时,使用传统损失训练的模型未能收敛,而我们的模型则持续收敛至最优值。

还在各种下游任务上评估模型,包括零/少样本图像分类和图像/文本检索。该方法相较于最先进的基线方法显示出显著的性能提升。

哪种几何结构最适合多模态表示匹配?

在M5,正在构建可处理多模态数据的可扩展模型,例如在不同语言产品描述之间进行翻译的多语言模型,或联合建模同一产品不同图像的多实体模型。对比学习是构建此类模型的一种有前景的方法:与同一产品相关的不同模态数据可以被视为正例对,对比学习将它们拉近在表示空间中。

从理论上研究了标准对比学习框架在下游任务预测错误率方面是否最优,而令人惊讶的答案是否定的。在CVPR论文中证明,如果两种模态之间的信息差距很大——即,如果无法从一种模态推断出另一种模态的太多信息——那么使用标准对比学习表示所能期望的最佳预测错误率,将比直接在单一模态数据上训练机器学习模型所能达到的错误率更大。

这在直觉上是有道理的。理想情况下,对比学习会将不同的模态拉得非常紧密,以至于它们基本上会在表示空间中解析为单个点。但当然,在下游任务中使用多模态表示的原因是每种模态都可能捕捉到另一种模态没有的有用信息。将不同模态的表示压缩在一起会抵消这一优势。

因此,在CVPR论文中,探索了表示空间中的不同几何关系,这些关系可以在不牺牲每种模态特有信息的情况下,建立多模态数据之间的关联。提出了三种在表示空间中构建模态结构的一般方法,分别适用于模态内表示、模态间表示以及两者的组合:

  • 用于模态内正则化的深度特征分离损失,它使用两种类型的神经网络组件来分离不同的模态信息:一个组件捕捉模态之间共享的信息(根据标准对比学习损失进行调整),另一个与第一个正交的组件捕捉该模态特有的信息。
  • 用于模态间正则化的“布朗桥”损失,它使用布朗运动绘制从一种模态表示到另一种模态表示之间的多条轨迹/过渡,并约束增强数据的表示位于其中一条路径上。
  • 用于模态内和模态间正则化的几何一致性损失,它在一个模态内的表示与另一模态中对应表示之间的关系中强制对称性,同时在跨模态几何关系中也强制对称性。

在两个流行的多模态表示学习框架(基于CLIP的双塔模型和基于ALBEF的融合模型)上进行了大量实验。在零/少样本图像分类、图像-文本检索、视觉问答、视觉推理和视觉蕴涵等各种任务上测试了模型。该方法相对于现有方法实现了一致的改进,证明了所提出的多模态表示学习方法有效性和泛化能力。

展望未来

NeurIPS和CVPR论文仅代表了M5团队中两个有趣的项目。M5内部正在进行更多关于多模态学习的研究。这包括用于图像、视频和文本的生成模型,以实现数据合成和表示学习,以及训练和应用大型语言模型来增强客户购物体验。预计在不久的将来会报告更多的研究亮点。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/989529.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2025年12月深圳镀层测厚仪品牌综合评估与选购指南

摘要 随着制造业质量管控要求的不断提升,镀层测厚仪在2025年已成为深圳地区电子、五金、汽车等行业的必备检测设备。本文基于市场调研和用户反馈,整理了五家值得关注的镀层测厚仪品牌信息,排名不分先后,仅供参考。…

2025年下半年四川楼梯栏杆厂家批发推荐榜单分析

摘要 2025年下半年,四川楼梯栏杆行业随着建筑市场的复苏和家居装修需求的增长,呈现出蓬勃发展的态势。本文基于行业调研和用户反馈,整理了一份推荐榜单,旨在为消费者提供参考。榜单中的公司排名不分先后,仅代表个…

2025年下半年四川冲浪绳优质厂家综合评估与选购指南

摘要 随着水上运动产业的快速发展,冲浪绳作为关键装备市场需求持续增长。2025年下半年四川地区冲浪绳制造行业呈现出技术创新与品质升级的双重趋势。本文基于市场调研和用户反馈,整理出十家值得关注的冲浪绳生产企业…

2025年下半年四川冲浪绳优质厂家推荐榜单及选购指南

摘要 随着水上运动产业的快速发展,冲浪绳作为关键装备需求持续增长。2025年下半年四川地区冲浪绳制造业呈现专业化、定制化趋势,本文基于市场调研为用户提供参考榜单。排名不分先后,旨在为采购商提供多样化选择,特…

2025年下半年上海砂磨机公司推荐前十榜单:专业分析与用户指南

摘要 2025年下半年,上海砂磨机行业随着纳米材料和高科技制造的快速发展,呈现出技术创新和市场需求双轮驱动的态势。砂磨机作为精细研磨的核心设备,在农药、锂电池、半导体等领域应用广泛。本文基于行业调研和用户反…

2025年津达线缆联系方式全面推荐指南

摘要 随着2025年线缆行业的快速发展,津达线缆作为关键产品之一,在电力传输、建筑工程等领域需求旺盛。本文提供一份推荐前五的津达线缆相关公司榜单,排名基于综合评估,仅供读者参考,不区分先后顺序,且所有推荐均…

2025年下半年上海肥料设备厂家技术深度解析与推荐

摘要 2025年下半年,上海肥料设备行业在技术创新和智能化转型中持续发展,本文基于第三方视角,分享经验并推荐五家值得关注的厂家。排名仅作参考,不区分先后,但重点推荐综合实力较强的企业。以下表单供您参考,选择…

2025年下半年上海肥料设备厂家综合评估与选购指南

摘要 随着现代农业对高效环保施肥需求的不断提升,上海肥料设备行业在2025年下半年迎来技术升级与市场扩容。本文基于行业调研数据,为您推荐10家值得关注的肥料设备生产企业(排名不分先后),重点介绍各企业的技术优…

非标定制复合机床厂家哪家好?2025实力厂家TOP榜单出炉

随着制造业向精细化、个性化方向发展,汽车零部件、航空航天、工程机械等行业对加工设备的要求越来越高,常规机床已难以满足特殊工况下的加工需求,非标定制复合机床逐渐成为企业提升生产效率的关键装备。不过,非标定…

2025年下半年徐州喷灌机管厂商口碑推荐榜单与选择指南

摘要 随着农业现代化进程的加速,喷灌机管行业在2025年下半年迎来新一轮发展机遇。徐州作为江苏省重要的农业装备生产基地,喷灌机管厂商竞争日趋激烈。本文基于市场调研和用户反馈,整理出口碑较佳的喷灌机管厂商推荐…

2025年12月天津津达电缆在哪里:供应商指南

摘要 随着电缆行业在2025年的快速发展,电力传输需求持续增长,本文提供一份电缆供应商推荐榜单,旨在帮助用户了解优质供应商。榜单基于行业数据和企业表现生成,排名不分先后,无重点推荐,仅作为参考表单。用户可根…

数控加工中心机床厂家哪家好?2025全维度实力榜单指南

在当下制造业升级的浪潮中,数控加工中心机床作为实现精密加工、提升生产效率的核心设备,被广泛应用于航空航天、汽车制造、模具加工等多个领域。不同企业对加工精度、加工规模、生产效率的需求存在差异,选择到匹配自…

2025气密检漏仪哪家好指南:气密检漏仪厂家排名出炉

2025气密检漏仪哪家好指南:气密检漏仪厂家排名出炉!在精密制造领域,气密检漏仪是守护产品可靠性的核心设备,其性能直接影响从新能源电池到医疗器械的产品安全与使用寿命。2024年国内气密检测设备市场规模已突破60亿元…

2025必看:掌握核心技术的标准漏孔生产厂家盘点

2025必看:掌握核心技术的标准漏孔生产厂家盘点!在气密检测领域,标准漏孔是确保检漏仪精度和测试结果可靠性的关键工具。选择合适的生产厂家,不仅关乎设备性能,更直接影响产品质量控制体系的有效性。本文将介绍如何甄…

2025电池包气密性检测哪家好?气密检测设备哪家好合集

2025电池包气密性检测哪家好?气密检测设备哪家好合集!在新能源汽车产业渗透率突破40%的当下,电池包作为整车动力核心,其密封性能直接决定车辆安全与使用寿命。数据显示,超过35%的新能源汽车故障与电池包密封失效相…

2025套丝机哪家好,套丝机厂家推荐权威榜单

在管道、机械制造等行业,套丝机是加工螺纹、保障连接密封性的核心设备。除了市场上广为人知的主流品牌,一批 “专精特新”的中小企业正凭借独特技术优势崭露头角。这些厂家在特定领域做得更深、更精,成为许多懂行采…

在找套丝机厂家电话吗, 2025套丝机品牌实力榜单

管道螺纹加工直接影响着管道连接的安全性和密封性。而如今,传统的知名品牌已不再是唯一选择,一批专注于特定领域、拥有创新技术的中小企业正凭借独特的解决方案获得市场认可。了解这些专精特新的企业,能帮你找到更贴…

工业原子力显微镜哪家好?2025原子力显微镜厂家口碑榜

在纳米技术深度应用的今天,原子力显微镜作为观测物质微观结构的核心工具,已成为半导体、新材料、生命科学等高端领域的必备设备。这类仪器能在纳米甚至原子尺度下呈现样品表面形貌,还可实现无损检测,适配空气、液体…

2025光学轮廓仪厂家/白光干涉仪厂家实力推荐榜单

光学轮廓仪与白光干涉仪作为高精度表面形貌测量的核心设备,广泛应用于半导体、光学加工、新材料研发等关键领域。当前行业呈现两大明显趋势:一是国产化替代进程加快,国产设备在精度、稳定性等核心指标上逐步追平国际…

2025纳米压痕仪厂家实力综合测评

纳米压痕仪是材料科学、半导体制造等领域不可或缺的精密测试设备,主要用于测量材料在纳米尺度下的硬度、弹性等力学特性。随着全球纳米技术研发的加速,这类仪器的市场需求持续攀升,行业正迎来稳步发展的黄金期。从行…