1. 假新闻检测 - 《Modality Perception Learning-Based Determinative Factor Discovery ...》

前言

本文阅读论文《Modality Perception Learning-Based Determinative Factor Discovery for MultimodalFake News Detection》。虚假新闻通常依赖夸张的语言风格、篡改的图像、不一致的多模态上下文等特征。虚假新闻检测应遵循“逻辑与”原则,即便大部分内容合理,只要存在少量不合理内容,即可判定为虚假。

核心内容细节
问题现有方法关注于多模态的一致性和设计复杂的特征提取器,而忽略了模态间的语义差异。例如下图中,文本与图像在表面上一致,但隐含夸张文本与篡改图像。
方法首先利用CLIP预训练编码器与模态特定编码器,分别提取模态一致与模态特定特征,然后进行多层次跨模态融合,最后根据模态异质性分数动态加权不同特征。
贡献设计双重编码模块,融合CLIP编码与模态特定编码;引入可学习的记忆信息,增强特征表示能力;构建多层次跨模态融合模块,深入理解模态间复杂关联;提出模态感知学习模块,根据模态分布差异自适应加权特征。


文章目录

  • 前言
  • 一、现有方法
  • 二、本文方法
  • 总结

一、现有方法

分类方法
单模态基于文本的检测:关注假新闻的语言特征,如夸张、煽动性。
基于视觉的检测:关注图像是否被篡改、是否具有误导性。
多模态多模态信息融合方法:分别提取文本和图像特征,再进行融合。
模态相似性度量方法:通过衡量文本与图像之间的语义一致性来辅助检测。
基于图神经网络与外部知识的方法:引入知识图谱或社交网络信息增强表示。

二、本文方法

  1. 对于某一特征,用 CNN 提取模态特定的特征,用 CLIP 提取一致特征,然后拼接。其中,文本编码器是 CNN + 池化,图像编码器是 ResNet-50;
  2. 引入可学习的记忆向量以提取不同模态特征真假模式,并进一步与提取的特征拼接;
  3. 使用多头自注意力增强每个模态自身的特征表示;
  4. 模仿人类先看图片辅助理解文字的习惯,以图像特征作为 Q,文本特征作为 K 和 V,通过跨模态注意力让图像信息增强文本信息f t v f_{tv}ftv。然后,模仿人类反复对照图文、捕捉深层线索的行为,进一步增强文本信息,同时使用视觉增强的文本特征作为 Q 增强原始图像特征;
  5. 用VAE将文本特征和图像特征分别映射到潜在空间,然后计算二者的 KL 散度,并用 sigmoid 将其映射到 0-1 区间。h hh越大,图文越不一致,将h hh作为多模态融合特征权重,1 − h 1-h1h作为单模态特征权重;
  6. 将加权后的四个特征拼接起来,并送入一个全连接层分类器进行真假二分类。

总结

文章的动机有点以结果为导向。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1125934.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java Web 网上购物商城系统系统源码-SpringBoot2+Vue3+MyBatis-Plus+MySQL8.0【含文档】

💡实话实说:CSDN上做毕设辅导的都是专业技术服务,大家都要生活,这个很正常。我和其他人不同的是,我有自己的项目库存,不需要找别人拿货再加价,所以能给到超低价格。摘要 随着互联网技术的快速发…

vscode下载/常用插件分享及如何链接Ubuntu

这里做一个大佬们分享的整合: Vscode下载及常用插件分享: VSCode安装配置使用教程(最新版超详细保姆级含插件)一文就够了_vscode使用教程-CSDN博客 用Vscode连接Ubuntu: Vscode连接Ubuntu!看这一篇就够…

idea不能使用低版本插件问题解决

idea升级之后,插件无法在高版本使用,开发者也不维护了下载插件 https://plugins.jetbrains.com/search?excludeTagsinternal&productsidea修改插件版本范围 将下载的zip压缩包解压,找到插件源代码的jar包里面的jar包和zip包的版本号是一样的,在bin中,根据版本号比较好找编…

MCU+AT到OpenCPU:嵌入式通信技术迭代的必然性(完结篇)

上一篇在充分理解了OpenCPU的技术优势与架构潜力后,一个现实而关键的问题摆在工程师及企业面前:如何在实际工程中,将现有的MCUAT模组架构,安全、平滑地演进至OpenCPU平台?第六章:迁移与融合策略——从MCUAT…

基于Python+Django+SSM美妆产品网络评价数据采集与分析(源码+LW+调试文档+讲解等)/美妆产品评价分析/网络评价数据采集/美妆数据采集/美妆评价分析/美妆产品网络数据/美妆产品评价数据

博主介绍 💗博主介绍:✌全栈领域优质创作者,专注于Java、小程序、Python技术领域和计算机毕业项目实战✌💗 👇🏻 精彩专栏 推荐订阅👇🏻 2025-2026年最新1000个热门Java毕业设计选题…

MCU+AT架构的演进:向OpenCPU转型的必然性(完结篇)

上一篇在充分理解了OpenCPU的技术优势与架构潜力后,一个现实而关键的问题摆在工程师及企业面前:如何在实际工程中,将现有的MCUAT模组架构,安全、平滑地演进至OpenCPU平台?第六章:迁移与融合策略——从MCUAT…

深度实战:AirCloud与excloud扩展库集成下的核心功能应用解析!

随着边缘侧业务复杂度的提升,单一平台能力已难以满足多样化场景需求。AirCloud平台在设备管理、状态同步与远程控制方面表现优异,而excloud扩展库则通过模块化设计补足了功能延展的短板。二者集成后,形成了“基础扩展”的技术合力。聚焦于Air…

快速上手iPerf:新手网络测试环境搭建详解!

快速上手iPerf的关键,在于高效搭建网络测试环境。这款工具的环境搭建流程简洁明了:先在服务端运行监听命令,再在客户端指定目标地址发起测试,即可获取网络带宽、延迟等数据。本文针对新手需求,详细拆解iPerf环境搭建的…

大规模语言模型在精准医疗方案生成中的应用

大规模语言模型在精准医疗方案生成中的应用 关键词:大规模语言模型、精准医疗方案、医疗数据处理、模型应用、医学知识推理 摘要:本文聚焦于大规模语言模型在精准医疗方案生成中的应用。首先介绍了研究的背景、目的、预期读者、文档结构及相关术语。详细阐述了大规模语言模型…

【更新至2024年】1996-2024年各省公路里程数据

【更新至2024年】1996-2024年各省公路里程数据 1、时间:1996-2024年 2、来源:国家统计局、统计年鉴 3、指标:公路里程(万公里) 4、范围:31省 5、指标解释:公路里程指报告期末公路的实际长度…

【更新至2024年】1996-2024年各省铁路营业里程数据

【更新至2024年】1996-2024年各省铁路营业里程数据 1、时间:1996-2024年 2、来源:国家统计局、统计年鉴 3、指标:铁路营业里程 4、范围:31省 5、指标解释:铁路营业里程又称营业长度,指投入客货运输正式…

【项目中的经验总结】

知识点一:多电源域下 Dummy Gate 的连接问题 1. 背景说明 在 MOS 管版图中,dummy gate 常用于满足工艺对栅极密度、对称性和边缘效应的要求。 Dummy gate 虽不参与功能,但仍具有栅氧层及栅-源 / 栅-漏寄生电容,不能视为“完全无效…

Node.js用readableLength轻松控流

💓 博客主页:瑕疵的CSDN主页 📝 Gitee主页:瑕疵的gitee主页 ⏩ 文章专栏:《热点资讯》 Node.js流控新境界:利用readableLength实现高效背压管理目录Node.js流控新境界:利用readableLength实现高…

从C到汇编:参数传递的内存地址探秘

在编程的世界里,了解程序如何在内存中布局和操作是每个程序员的基本功。今天我们来深入探讨一个关于参数传递的经典问题:在C语言中,如何找到一个函数参数在内存中的确切地址。 背景介绍 假设我们有一个C语言函数caller,它调用另一个函数swap_add,并传递两个参数arg1和ar…

[特殊字符]_Web框架性能终极对决:谁才是真正的速度王者[20260107173025]

作为一名拥有10年开发经验的全栈工程师,我经历过无数Web框架的兴衰更替。从早期的jQuery时代到现在的Rust高性能框架,我见证了Web开发技术的飞速发展。今天我要分享一个让我震惊的性能对比测试,这个测试结果彻底改变了我对Web框架性能的认知。…

深入探讨Clang-Tidy与Bazel的整合

在现代软件开发中,代码质量和可维护性是至关重要的。Clang-Tidy作为一个强大的静态分析工具,可以帮助开发者发现并修复代码中的潜在问题。然而,当Clang-Tidy与构建工具Bazel结合使用时,可能会遇到一些有趣的挑战。本文将通过一个实例,探讨如何正确配置和使用Clang-Tidy来分…

Python设计模式:享元模式详解

享元模式的核心思想享元模式(Flyweight Pattern)通过共享对象减少内存占用,适用于存在大量重复对象的场景。其核心是将对象的内在状态(可共享)与外在状态(不可共享)分离,通过共享内在…

[特殊字符]_安全性能平衡术:如何在保证安全的前提下提升性能[20260107173816]

作为一名经历过多次安全事件的工程师,我深知在Web应用开发中安全与性能的平衡是多么重要。最近,我参与了一个金融级应用的开发,这个项目让我重新思考了安全机制对性能的影响。今天我要分享的是如何在保证安全的前提下提升Web应用性能的经验。…

什么是M-LAG

文章目录为什么需要M-LAG如何实现M-LAG组网M-LAG是如何工作的如何应用M-LAG技术M-LAG(Multichassis Link Aggregation Group)提供一种跨设备链路聚合的技术。M-LAG通过将两台接入交换机以同一个状态和用户侧设备或服务器进行跨设备的链路聚合&#xff0c…

线性规划:库存切割问题

原文:towardsdatascience.com/linear-programming-the-stock-cutting-problem-dc6ba3bf3de1 本文深入探讨了线性规划如何解决一个称为“库存切割”的具体问题。在深入探讨本系列中的线性规划细节之前,我想提供一个具体的例子。本文将使用未在本文中定义的…