【SDRS】面向多模态情感分析的情感感知解纠缠表征转移

abstract

多模态情感分析(MSA)旨在利用多模态的互补信息对用户生成的视频进行情感理解。现有的方法主要集中在设计复杂的特征融合策略来整合单独提取的多模态表示,忽略了与情感无关的信息的干扰。在本文中,我们提出将单模表征分解为情感特定特征和情感独立特征,并将前者融合到MSA任务中。具体来说,我们设计了一个新的情感感知解纠缠表示转换框架,称为SDRS,由两个部分组成。交互式情感感知表征解纠缠旨在利用新开发的交叉注意自编码器,通过考虑其他模态的语境影响,提取每个非语言模态的情感特异性特征表征。注意跨模态表征转移试图利用投射后的非语言情感特异性表征在潜在表征空间中转移文本表征。最后利用变换后的表示对预训练的语言模型进行微调,用于多模态情感分析。在CMU-MOSI、CMU-MOSEI和CH-SIMS三个公共基准数据集上进行了大量实验。结果表明,所提出的SDRS框架不仅可以获得仅基于多模态标签的最新结果,而且优于额外需要每个模态标签的方法。

intro

随着移动设备和社交网络的快速发展和广泛使用,人们开始对多模式交互特征进行建模[4,6]。近年来,基于模型的融合技术得到了发展[2 - 4,7],如张量融合[8]、记忆融合[9]和多模态自适应门融合[10]。为了减轻异质性问题,研究人员试图独立学习模态不变表征和模态特定表征[11 - 16]。这些方法主要学习如何利用各种模态的互补性和冗余性来表示多模态数据。

然而,在现有的MSA方法中,不同模态的特征通常是独立提取的,或者作为模态不变和模态特定的特征,这两种方法都没有考虑到与情感无关的信息可能产生的干扰。此外,单模态情绪可能受到来自其他模态的信息的影响,如图1所示。为了有效区分情感特定特征和情感独立特征,从本质上有必要探索来自不同模态的交互信息[17-21]。尽管有些方法考虑了每个模态内部的差异,但模态之间的解耦特征是孤立地完成的[11,14,22]。这些方法往往只考虑特征融合过程中多模态信息的相互影响,而忽略了特征解耦过程中多模态信息的相互影响,即忽略了多模态交互在去除与情感无关的信息干扰中的作用。

基于这些观察结果,我们建议通过考虑其他模态的影响,将单模态表征分解为情感特定特征和情感独立特征。具体而言,我们设计了一种新的情感感知解纠缠表征转移框架(SDRS),该框架由两个主要部分组成:交互式情感感知表征解纠缠(ISRD)和注意跨模态表征转移(ACRS)。

ISRD的目标是通过交叉注意自动编码器(CAAE)来学习特定于情感的特征表示。CAAE使用由堆叠的交叉注意层组成的转换器式编码器和解码器,在提取情感特定特征时考虑其他模态的信息,从而在多模态环境中捕获单个模态的真实表达情感。

我们设计了一种新的对比损失来区分情感特定和情感独立的特征,有助于减轻模式的异质性。在ISRD的实现过程中,我们采用一种从粗到细的策略来训练CAAE,即首先训练粗粒度CAAE来学习特定极性的表征,然后使用这些表征来指导细粒度CAAE学习特定情感的表征。

基于文本语义对情感分析的重要影响,ACRS旨在利用非语言情感特定表征来转移原始文本表征,这些非语言情感特定表征首先被投射到文本表征空间中。通过这种转换操作,可以最大限度地减少原始语义的变化,并可以探索非语言模式对情感的影响。这也使得下游语言模型更容易对融合词嵌入进行微调。我们在三个公共基准数据集上进行了广泛的实验:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/81932.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Sui 上线两周年,掀起增长「海啸」

两年前的 5 月 3 日,Sui 的主网正式发布,将在开发网和测试网上验证过的下一代技术承诺变为现实。这一新兴网络旨在优化现有区块链技术,结合高性能计算环境与安全性、可验证性及韧性。 随着 Sui 迎来两周年,这股浪潮已成长为「海啸…

深入理解 mapper-locations

mybatis-plus.mapper-locations: classpath*:/mapper/**/*.xml 是 MyBatis/MyBatis-Plus 在 Spring Boot 配置文件(如 application.yml 或 application.properties)中的一项关键配置,用于指定 MyBatis Mapper XML 文件的存放路径。以下是详细…

电容的作用

使用多个电容是从电容的实际等效模型去考虑的(也就是从SI,信号完整性方面)。只考虑一个实际电容时,它的阻抗曲线是一个类似于倒三角形的形状,只在谐振频率点(与等效串联电感形成)处的阻抗最小。因此相当于只在这一个频率点处及附近…

移植的本质是什么

有断时间我就在想,为什么freertos,lvgl等等的移植都是把库文件放进来,直接点击编译,然后把bug都处理完成就移植成功了,为什么呢? 明明我一个函数都没调用,为什么会有一堆错误,莫名其…

广告场景下的检索平台技术

检索方向概述 数据检索领域技术选型大体分为SQL事务数据库、NoSQL数据库、分析型数据库三个类型。 SQL数据库的设计思路是采用关系模型组织数据,注重读写操作的一致性,注重数据的绝对安全。为了实现这一思路,SQL数据库往往会牺牲部分性能&…

高频PCB设计如何选择PCB层数?

以四层板为例,可以第一层和第二层画信号,作为信号层。 第三层可以走电源,然后第四层走GND 但是更可以第一层和第三层画信号。第二层可以走电源,然后第四层走GND 用中间的电源层以及地层可以起到屏蔽的作用,有效降低寄…

[Linux_69] 数据链路层 | Mac帧格式 | 局域网转发 | MTU MSS

目录 0.引入 1.以太网帧格式 2.重谈局域网转发的原理(基于协议) 小结 3.认识MTU 3.1MTU对IP协议的影响 3.2MTU对UDP协议的影响 3.3MTU对于TCP协议的影响 0.引入 在去年的这篇文章中,我们有对网络进行过一个概述[Linux#47][网络] 网络协议 | TCP/IP模型 | 以…

vue2 provide 后 inject 数据不是响应式的,不实时更新

今天用 provide 后&#xff0c;inject 获取数据时不是实时更新的&#xff0c;获取的不是更新后的值 祖父组件 <div style"text-align: left !important;"><button click"change">更改</button> </div>data() {return {name: ini…

洛谷---P1629 邮递员送信

题目描述 有一个邮递员要送东西&#xff0c;邮局在节点 1。他总共要送 n−1 样东西&#xff0c;其目的地分别是节点 2 到节点 n。由于这个城市的交通比较繁忙&#xff0c;因此所有的道路都是单行的&#xff0c;共有 m 条道路。这个邮递员每次只能带一样东西&#xff0c;并且运…

2025年LangChain(V0.3)开发与综合案例

LangChain是什么&#xff1f; 在实际企业开发中&#xff0c;大模型应用往往比简单的问答要复杂得多。如果只是简单地向大模型提问并获取回答&#xff0c;那么大模型的许多强大功能都没有被充分利用。 要开始使用LangChain&#xff0c;首先需要安装相关的库&#xff1a; pip …

十分钟了解 @MapperScan

MapperScan 是 MyBatis 和 MyBatis-Plus 提供的一个 Spring Boot 注解&#xff0c;用于自动扫描并注册 Mapper 接口&#xff0c;使其能够被 Spring 容器管理&#xff0c;并与对应的 XML 或注解 SQL 绑定。它的核心作用是简化 MyBatis Mapper 接口的配置&#xff0c;避免手动逐个…

深度解析 MindTorch:无缝迁移 PyTorch 到 MindSpore 的高效工具

在深度学习领域&#xff0c;框架的选择往往取决于开发者的习惯、硬件支持以及项目需求。PyTorch 作为当前最受欢迎的深度学习框架之一&#xff0c;以其动态图机制和简洁的 API 设计深受开发者喜爱。然而&#xff0c;随着昇腾硬件的崛起&#xff0c;如何高效地利用昇腾的强大计算…

[250506] Auto-cpufreq 2.6 版本发布:带来增强的 TUI 监控及多项改进

目录 Auto-cpufreq 2.6 版本发布&#xff1a;带来增强的 TUI 监控及多项改进 Auto-cpufreq 2.6 版本发布&#xff1a;带来增强的 TUI 监控及多项改进 Auto-cpufreq&#xff0c;一款适用于 Linux 的免费开源自动 CPU 速度与功耗优化器&#xff0c;已发布其最新版本 2.6。该工具…

Linux 更改内存交换 swap 为 zram 压缩,减小磁盘写入

1、查看当前 swap 的方式 swapon --show 我这里是默认的 swap 文件&#xff0c;大小为 2G。 2、安装 zram Ubuntu 下&#xff1a; sudo apt install zram-tools安装后默认会启动&#xff1a; 3、关闭默认的 swap 文件 sudo swapoff /swapfile 其次是关闭 /etc/fstab 中的 …

ORCAD打印pdf

1 笔记本电脑绑定了打印机&#xff0c;要改成这个

C++中指针使用详解(4)指针的高级应用汇总

C 中指针的高级应用非常丰富&#xff0c;掌握这些内容能让你写出更高性能、更底层控制力强的代码。下面是应用模块梳理和例子讲解。 目录预览 函数指针与回调机制指针数组 vs 数组指针指针与类成员函数&#xff08;成员函数指针&#xff09;智能指针&#xff08;unique_ptr, s…

图像处理软件imgPro—调参救星!

推荐一款图像处理软件imgPro&#xff0c;该软件是逛B站时偶然间发现&#xff0c;虽然up主是新号&#xff0c;但是视频中看起来非常实用&#xff01; 核心是多种算法高效调参&#xff0c;亮点是自动生成源码&#xff01;这您受得了吗&#xff1f;调试之后&#xff0c;直接复制代…

DOM基础学习

一、DOM文档对象模型 通常将DOM看作一颗“树”&#xff0c;DOM将整个文档看作一颗“家谱树 ” 二、对象 用户定义的对象内建对象&#xff08;Array、Date、Math&#xff09;宿主对象 三、节点 node 元素节点&#xff08;element node&#xff09;文本节点&#xff08;text…

初识人工智能、机器学习、深度学习和大模型

文章目录 1. 前言2. 相关概念3. 层级关系4. 应用场景对比4. 实际案例 初识人工智能、机器学习、深度学习和大模型 1. 前言 之前经常听人说AI、机器学习&#xff0c;深度学习之类的词汇&#xff0c;总是傻傻的不了解他们的区别&#xff0c;近来有空&#xff0c;来通俗说说个人看…

n8n系列(1)初识n8n:工作流自动化平台概述

1. 引言 随着各类自动化工具的涌现,n8n作为一款开源的工作流自动化平台,凭借其灵活性、可扩展性和强大的集成能力,正在获得越来越多技术团队的青睐。 本文作为n8n系列的开篇,将带您全面了解这个强大的自动化平台,探索其起源、特性以及与其他工具的差异,帮助您判断n8n是否…