Misinformation Detection using Large Language Models with Explainability

news/2025/12/9 14:55:06/文章来源:https://www.cnblogs.com/xyc-blog/p/19326623

摘要

  1. 研究背景:网络平台虚假信息快速传播,破坏个体信任并阻碍理性决策,传统检测方法存在局限性。

  2. 核心方法:提出可解释且计算高效的检测流程,采用基于 Transformer 的预训练语言模型(PLMs),对 RoBERTa 和 DistilBERT 进行两步优化:

    • 第一步:冻结模型骨干网络,仅训练分类头。

    • 第二步:逐步解冻骨干网络层,同时应用分层学习率衰减(LLRD)。

  3. 实验设计:在两个真实世界基准数据集(COVID Fake News、FakeNewsNet GossipCop)上测试,采用统一的数据预处理和分层划分方案。

  4. 可解释性实现:整合两种解释方法保障透明度:

    • 局部可解释性:通过 LIME(局部可解释模型无关解释)提供 token 级推理依据。

    • 全局可解释性:借助 SHAP(SHapley 可加性解释)实现全局特征归因。

  5. 关键发现:DistilBERT 的检测准确率与 RoBERTa 相当,但所需计算资源显著更少。

  6. 核心贡献

    • 定量证明轻量级 PLM 在大幅降低计算成本的同时,能维持虚假信息检测任务性能。

    • 提出可解释的检测流程,在不影响性能的前提下,获取可靠的局部和全局推理依据。

  7. 研究结论:结合规范微调与可解释性的 PLMs,可成为可扩展、可信的虚假信息检测有效框架。

核心贡献

  1. 轻量化且具竞争力的建模:在 COVID 虚假新闻数据集上,紧凑型预训练语言模型(PLM)DistilBERT 准确率与 RoBERTa 相当,且大幅降低计算成本 —— 训练日志显示其每轮训练时间约 397 秒,在 2041 个测试样本上推理吞吐量约 71.8 样本 / 秒、延迟约 13.9 毫秒 / 样本,为实时部署与边缘部署提供可行路径。

  2. 含分层学习率衰减(LLRD)的两阶段微调:采用 “先冻结骨干网络稳定任务适配,再逐步解冻网络层并实施分层学习率衰减” 的训练方案,缓解灾难性遗忘问题,提升模型收敛效果。

  3. 内置可解释性:整合 LIME(局部 token 级理据)与 SHAP(全局归因),为模型决策提供可信、人类可理解的依据,满足高风险场景下负责任 AI 的关键需求。

  4. 全面评估:除准确率外,还报告精确率、召回率、F1 值、AUROC 及效率指标(参数数量、每轮训练时间、推理延迟、吞吐量),实现与更强基准模型的全方位对比。

方法

  1. 数据收集与预处理
    • 选用两个数据集:COVID Fake News 数据集、FakeNewsNet GossipCop 数据集(含真实 / 虚假新闻实例);

    • 清洗文本(去除超链接、特殊字符、表情符号、HTML 标签块),并将文本统一转为小写以标准化格式,适配基于 Transformer 的语言模型训练。

  2. 模型选择

    • 测试 4 种主流 Transformer 模型:DistilBERT、RoBERTa、社交媒体语言适配版 BERTweetbase、DeBERTa-v3-small;

    • 通过对比确定最优模型架构,平衡准确率、计算效率与可解释性。

  3. 两阶段训练策略

    • 针对 RoBERTa(高容量)和 DistilBERT(轻量型)两种模型,均搭配任务专属分类头(公式:$),避免过拟合的同时最大化性能;

      • 阶段 1(特征提取):冻结预训练 Transformer 模型骨干,仅训练自定义分类头(含注意力机制、 dropout 层、密集层、softmax 输出层),保障语言表征通用性,适配二分类错误信息检测任务;

      • 阶段 2(分层学习率衰减微调):逐步解冻所有 Transformer 层,对靠近输入嵌入的低层用较小学习率、靠近分类头的高层用较大学习率,实现模型对新数据的适配,同时防止 “灾难性遗忘”。

  4. 可解释性集成

    • 局部可解释性:用 LIME 方法识别输入文本中影响最终预测的特定词元 / 短语;

    • 全局可解释性:用 SHAP 方法计算并可视化全数据集中各特征的输入贡献;

    • 两种方法结合,确保模型输出清晰、易懂、可靠,满足事实核查人员与学者的解读需求。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/994956.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

降ai率工具哪个好?五款实用工具推荐解析

在当前内容创作与学术写作领域,控制AIGC生成比例(即“降AI率”)成为保障内容原创性与合规性的重要需求。一款优质的降AI率工具不仅能有效降低AI生成内容占比,还能结合文献支持与查重功能,为用户提供可靠的写作辅助…

Entity 查询:解决可观测性系统中实体检索与跨域联合查询的痛点

阿里云 Entity 查询应运而生,支持全文检索、字段限定、逻辑组合、跨域联合查询,结合 SPL 实现从‘定位’到‘分析’的一站式闭环,真正让可观测数据‘找得到、看得懂、用得上’。作者:路遥 点击此处,查看视频演示!…

降ai率免费网站推荐:高效AI论文工具实用指南

在数字化写作日益普及的当下,降ai率免费网站成为许多用户的实用选择。这类平台通过优化算法与内容处理逻辑,帮助用户在借助AI工具辅助写作时,降低文本被检测为AI生成的概率,同时提供免费的基础功能,满足学术、办公…

stress-ng安装测试

stress-ng安装点击查看代码 #!/bin/bash #set -euo pipefail # 严格模式:遇到错误立即退出、未定义变量报错、管道失败触发退出 if ! command -v stress-ng >/dev/null 2>&1; thenecho "安装stress-n…

2025年口碑好的力位移监控油压机/智能油压机用户好评厂家排行

2025年口碑好的力位移监控油压机/智能油压机用户好评厂家排行行业背景与市场趋势随着工业4.0和智能制造技术的快速发展,力位移监控油压机和智能油压机作为精密制造领域的关键设备,正经历着前所未有的技术革新和市场扩…

降ai率免费工具:提升原创度的实用选择与推荐

在数字化创作日益普及的当下,AI生成内容的识别与原创度提升成为许多用户关注的焦点。降AI率免费工具作为一类实用工具,旨在帮助用户通过技术手段降低文本中AI生成的痕迹,提升内容的原创属性,适用于学生、科研人员、…

智能燃气表

智能燃气表如有侵权请联系删除

VS Code——Live Server的简介、安装与使用

基本概念: Live Server:一个具有实时加载功能的小型服务器,可以使用它来破解html/css/javascript,但是不能用于部署最终站点。也就是说我们可以在项目中实时用live-server作为一个实时服务器实时查看开发的网页或项…

江苏省劳动争议纠纷律所推荐:专业法律服务机构盘点

在劳动关系日益复杂的当下,劳动争议纠纷时有发生,涉及劳动合同、薪酬福利、工伤赔偿等多个方面。选择一家专业的律师事务所,能够有效维护自身合法权益。本文将围绕江苏省劳动争议纠纷领域,推荐几家综合实力较强的法…

2025年钢轨探伤设备定制厂家权威推荐榜单:钢材探伤仪‌/钢锭探伤仪‌/钢轨探伤仪源头厂家精选

在保障铁路运输安全的核心技术中,钢轨探伤是至关重要的一环。行业数据显示,超高速在线探伤系统的检测速度已突破3200米/分钟,而微小缺陷的检测分辨率可达到0.1毫米。随着我国高速铁路网持续扩大及“智慧工务”的深入…

行业背景:为何漏水维修的选择关乎建筑资产价值?

随着中国城市化进程加速,既有建筑存量已超600亿平方米(数据来源:住建部2024年统计),建筑渗漏问题成为困扰业主的“隐形资产杀手”中国建筑防水协会2025年调研显示,65%的住宅存在不同程度渗漏,工业厂房渗漏率更达3…

大模型自动攻击评测系统深度解析

大模型自动攻击评测系统深度解析 在人工智能技术快速发展的背景下,大模型安全治理已成为保障AI应用合规性与可靠性的重要环节。博特智能作为国内领先的人工智能安全企业,通过其大模型自动攻击评测系统"博特谛听…

HC32串口溢出错误OverrunError(USART_ORE)

说明 SDK版本 2.2.0 芯片:HC32F460 小华单片机串口接收寄存器的数据未被读取时再接收到新数据时会发生ORE错误。 状态寄存器的RXNE标志位表示接收数据寄存器不为空,串口根据此标志位的状态决定接收数据时是否发生ORE…

散修带你入门鸿蒙应用开发基础第三节:流程控制 - 鸿蒙

ArkTS基础第三节:流程控制 炼气三重天 【学习目标】掌握 if-else(分支)、switch-case(固定值匹配)的语法与场景差异,能处理嵌套逻辑 明确 for(已知次数)、for...of(简洁遍历)、while/do-while(条件驱动)的…

2025年如何选择靠谱的广东市场全屋定制制造商?

在选择广东市场全屋定制制造商时,了解品牌的整体特点和市场定位非常关键。许多品牌致力于推出环保产品,符合严格的环境标准,并积极响应消费者对健康家居的需求。对品牌进行初步评估时,可以关注其生产流程的透明度和…

sumutrapdf usage - ENGINEER

sumutrapdf usage Time is like a fleeting show!

2025雅思机构全景对比:四家主流机构适配不同需求!

在雅思备考的赛道上,选择适配自身需求的培训机构是提升效率、稳妥出分的关键。面对市面上琳琅满目的雅思培训选项,考生往往陷入纠结 —— 是偏爱科技赋能的线上学习,还是依赖线下沉浸式授课?是需要单纯的语言提升课…

江苏省刑事律所推荐:如何选择专业法律服务机构

在江苏省,刑事法律事务涉及复杂的法律程序与案件细节,选择专业的律所提供支持至关重要。无论是个人面临刑事纠纷还是企业需要法律风险防控,律所的专业能力、案件处理经验及客户口碑都是重要的考量因素。以下将从法律…

2025年12月减持节税服务机构推荐:专业评测榜与口碑评价深度分析报告

在当前资本市场环境下,上市公司股东、PE/VC机构及高净值个人面临减持股份时的税务筹划需求日益增长。这类用户通常具有明确的节税目标,同时高度关注合规风险与政策变动。典型场景包括:上市公司原始股东在锁定期满后…

2025年上海知名的衣柜全屋定制品牌厂家推荐:全屋定制公司哪

本榜单依托上海本地市场调研与真实业主口碑,围绕环保透明、高性价比、源头工厂保障核心维度筛选标杆企业,为业主精准匹配适配的定制服务伙伴。 TOP1 推荐:曼海莲全案木作 推荐指数:★★★★★ 口碑评分:上海高性…