结合基于标签置信度的特征选择方法用于部分多标签学习-简介版

假设

  1. 部分多标签学习(PML)假设:假设样本的标签集合中存在伪正标签,即某些标签可能是错误的。目标是从候选标签集中识别出真实标签。
  2. 特征与标签的关系假设:假设不同的标签对应的特征子空间可能是不同的,而不是所有标签共享相同的特征空间。

技术路线

论文提出了一种新的基于标签置信度的特征选择方法(LCFS-PML),其核心技术路线包括:

  1. 计算标签置信度:通过以下两个指标评估标签是否可靠:
    • 同标签样本的平均距离 d avg d_{\text{avg}} davg):同一标签的样本之间的平均距离,距离越小说明标签越可靠。
    • 到聚类中心的距离 d C d_C dC):样本到该标签的聚类中心的距离,距离越小说明标签置信度越高。
  2. 特征与标签的联合优化
    • 在每个标签的独特特征子空间中计算标签置信度,并去除低置信度的伪标签。
    • 通过优化特征子空间来进一步提升标签置信度,使特征和标签相互优化。
  3. 交替优化策略
    • 先优化特征子空间:去除冗余和歧义特征,提高分类能力。
    • 再优化标签置信度:基于优化后的特征重新计算标签置信度,并筛选掉伪正标签。
    • 不断循环迭代,直到达到收敛。

创新点

  1. 引入标签置信度评估方法
    • 结合 同标签样本的平均距离样本到聚类中心的距离,更准确地评估标签的真实性。
  2. 提出基于标签的特征选择策略
    • 不是所有标签共享相同的特征空间,而是为每个标签建立单独的最优特征子空间,提高了学习的精度。
  3. 采用特征-标签交替优化策略
    • 在特征优化和标签优化之间形成一个闭环,使两个过程相互促进,提高模型的稳定性和鲁棒性。

数学公式

  1. 标签置信度计算
    • 同标签样本的平均距离

d avg , i , l = 1 K ∑ j = 1 K d ( f i l , f j l ) d_{\text{avg}, i, l} = \frac{1}{K} \sum_{j=1}^{K} d(f_i^l, f_j^l) davg,i,l=K1j=1Kd(fil,fjl)
其中, f i l f_i^l fil 表示第 i i i 个样本在标签 l l l 对应的特征子空间中的表示, K K K 为最近邻样本数量。

  • 到聚类中心的距离

d C , i , l = min ⁡ c ∈ C l d ( f i l , c ) d_{C, i, l} = \min_{c \in C_l} d(f_i^l, c) dC,i,l=cClmind(fil,c)
其中, C l C_l Cl 是标签 l l l 的聚类中心集合。

  • 标签置信度公式

T i , l = exp ⁡ ( − ( 1 + λ ) ⋅ d avg ⋅ d C λ d avg + d C ) T_{i, l} = \exp\left( \frac{-(1 + \lambda) \cdot d_{\text{avg}} \cdot d_C}{\lambda d_{\text{avg}} + d_C} \right) Ti,l=exp(λdavg+dC(1+λ)davgdC)
其中, λ \lambda λ 是一个权重参数,用于平衡两种距离的影响。

  1. 优化目标函数
    • 联合优化特征和标签

min ⁡ W , S ∥ X ( W + S ) − L ∥ F 2 + α ∥ X W − L ∗ ∥ F 2 + β ∥ W ∥ 2 , 1 + γ ∥ S ∥ 1 \min_{\mathbf{W}, \mathbf{S}} \| \mathbf{X} (\mathbf{W} + \mathbf{S}) - \mathbf{L} \|_F^2 + \alpha \| \mathbf{X} \mathbf{W} - \mathbf{L}^* \|_F^2 + \beta \| \mathbf{W} \|_{2,1} + \gamma \| \mathbf{S} \|_1 W,SminX(W+S)LF2+αXWLF2+βW2,1+γS1
其中:
- W \mathbf{W} W 是特征-标签映射矩阵。
- S \mathbf{S} S 是用于去除冗余特征的稀疏矩阵。
- L \mathbf{L} L 是原始带噪声的标签矩阵,而 L ∗ \mathbf{L}^* L 是经过优化的真实标签矩阵。
- α , β , γ \alpha, \beta, \gamma α,β,γ 是超参数,用于平衡不同损失项的影响。


技术实现细节

  1. 初始化

    • 计算完整特征空间中的标签置信度矩阵 T T T
    • 设定特征选择比例 p p p,用于筛选出每个标签的关键特征子集。
  2. 交替优化过程

    • 优化特征选择矩阵 W W W
      • 通过梯度下降法优化 W W W,确保其稀疏性,降低特征冗余度。
    • 优化噪声标签矩阵 S S S
      • 采用 交替方向乘子法(ADMM) 解决优化问题,使 S S S 具有良好的稀疏性。
    • 更新标签置信度矩阵 T T T
      • 计算每个标签的最佳特征子空间,并在该子空间中重新评估标签置信度。
  3. 迭代收敛

    • 不断重复上述步骤,直到目标函数的损失值收敛。

实验与结论

  • 数据集:在多个真实世界数据集(如 Music_emotion, Mirflickr, YeastBP)和合成数据集上进行实验。

  • 对比方法

    • LSNRFS:基于标签-特征相关性的特征选择方法。
    • PML-FSSO:采用低维子空间来进行特征选择。
    • PML-LD:通过重构标签分布进行部分多标签预测。
    • PAMB:将 PML 问题转化为多个二分类问题进行优化。
    • ML-KNN:基于 K 近邻的方法进行多标签分类。
  • 实验结果

    • 在多个数据集上,LCFS-PML 的性能优于现有方法
      • Micro-F1、AP(平均精度)提高显著,表明分类质量更优。
      • HL(汉明损失)降低,说明减少了错误分类。
      • One-error 降低,表明该方法能更准确地预测最可能的正确标签。
  • 消融实验分析

    • 去除标签置信度计算后(LCFS-A),模型性能显著下降,说明标签置信度是关键因素。
    • 去除标签-特征映射后(LCFS-B),优化过程不稳定,验证了特征子空间优化的重要性。
  • 收敛性分析

    • 目标函数的损失值在 20-30 次迭代后趋于稳定,表明优化过程收敛快速。
  • 计算复杂度

    • 时间复杂度 约为 O ( n 2 d + n d l + l 2 d ) O(n^2d + ndl + l^2d) O(n2d+ndl+l2d),其中 n n n 是样本数, d d d 是特征维度, l l l 是标签数。

总结

  1. LCFS-PML 能够有效去除伪正标签,提高分类性能。
  2. 采用特征-标签交替优化策略,使特征子空间和标签置信度相互提升。
  3. 实验表明该方法优于已有 PML 方法,特别适用于高维数据和噪声标签数据。
  4. 计算复杂度较合理,收敛速度较快,适用于大规模数据集。

此方法为部分多标签学习提供了一种新的解决方案,在未来研究中可以拓展到更多实际应用,如文本分类、基因分析、图像标注等领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/73767.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Lora微LLAMA模型实战

引言 本文介绍如何复现Alpaca-lora,即基于alpaca数据集用lora方法微调Llama模型。 环境准备 实验环境用的是lanyun,新用户点击注册可以送算力。 下载huggingface上的模型是一个令人头疼的问题,但在lanyun上可以通过在终端运行source /etc…

Maven常见问题汇总

Maven刷新,本地仓库无法更新 现象 This failure was cached in the local repository and resolution is not reattempted until the update interval of aliyunmaven has elapsed or updates are forced原因 因为上一次尝试下载,发现对应的仓库没有这个maven配置…

什么是站群服务器?站群服务器应该怎么选?

站群服务器是专门用于托管和管理多个网站的服务器。通常用于SEO优化、内容分发、广告推广等场景,用户可以通过一个服务器管理多个站点,提升效率并降低成本。选择站群服务器时,需根据业务需求、性能要求、IP资源等因素进行综合考虑。 什么是站…

分享一个项目中遇到的一个算法题

需求背景: 需求是用户要创建一个任务计划在未来执行,要求在创建任务计划的时候判断选择的时间是否符合要求,否则不允许创建,创建的任务类型有两种,一种是单次,任务只执行一次;另一种是周期&…

【LInux进程六】命令行参数和环境变量

【LInux进程六】命令行参数和环境变量 1.main函数的两个参数2.利用main函数实现一个简单的计算器3.环境变量之一:PATH4.修改PATH5.在命令行解释器bash中查看所有环境变量6.用自己写的程序查看环境变量7.main函数的第三个参数8.本地的环境变量和环境变量9.环境变量具…

时间轴版本-2.0

文章简述 这是本人自己封装的时间轴2.0版本的代码,用到了TypeScriptJavaScript 这篇文章只有代码和具体的使用方式,如果想看具体的讲解可以参考本人写的时间轴1.0版本的,在1.0版本中可能计算时间线的逻辑略有不同,但是大致的计算…

大语言模型的压缩技术

尽管人们对越来越大的语言模型一直很感兴趣,但MistralAI 向我们表明,规模只是相对而言的,而对边缘计算日益增长的兴趣促使我们使用小型语言获得不错的结果。压缩技术提供了一种替代方法。在本文中,我将解释这些技术,并…

大华HTTP协议在智联视频超融合平台中的接入方法

一. 大华HTTP协议介绍 大华HTTP协议是大华股份(Dahua Technology)为其安防监控设备开发的一套基于HTTP/HTTPS的通信协议,主要用于设备与客户端(如PC、手机、服务器)之间的数据交互。该协议支持设备管理、视频流获取、…

Linux内核实时机制28 - RT调度器11 - RT 组调度

Linux内核实时机制28 - RT调度器11 - RT 组调度 相关数据结构 内核中通过static int sched_rt_runtime_exceeded(struct rt_rq *rt_rq)函数来判断实时任务运行时间是否超出带宽限制,判断这个运行队列rt_rq的运行时间是否超过了额定的运行时间。而“运行时间”和“额定时间”都…

java,poi,提取ppt文件中的文字内容

注意&#xff0c;不涉及图片处理。 先上pom依赖&#xff1a; <!-- 处理PPTX文件 --><dependency><groupId>org.apache.poi</groupId><artifactId>poi-ooxml</artifactId><version>5.2.3</version></dependency><!--…

7、vue3做了什么

大佬认为有何优点&#xff1a; 组合式api----逻辑集中、对ts有更好的支持RFC–开放了一个讨论机制&#xff0c;可以看到每一个api的提案&#xff0c;方便源码维护&#xff0c;功能扩展&#xff0c;大家一起讨论 官方rfc响应式独立&#xff0c;new Proxy&#xff0c;天生自带来…

多人在线聊天系统,创建群,视频,语音,自带带授权码

多人在线聊天系统&#xff0c;创建群&#xff0c;视频&#xff0c;语音 带授权码&#xff0c;授权码限制 10 个网站&#xff0c;需要下载研究吧 在线聊天&#xff0c;创建群&#xff0c;表情&#xff0c;图片&#xff0c;文件&#xff0c;视频&#xff0c;语音&#xff0c;自…

数据结构概览

关键点&#xff1a; 数据结构是组织和存储数据的方式&#xff0c;帮助高效访问和操作数据。常见类型包括数组、链表、栈、队列、树和图&#xff0c;每种都有特定用途。代码示例和实际应用场景将帮助初学者理解这些概念。 什么是数据结构&#xff1f; 数据结构就像你整理书架或…

Android studio点击运行按钮在build\intermediates\apk\debug目录下生成的apk在真机上安装失败,提示test only

Android studio点击运行按钮在build\intermediates\apk\debug目录下生成的apk在真机上安装失败&#xff0c;提示test only DeepSeek R1 思考 15 秒 思考过程 针对Android Studio生成的APK在真机安装时提示“test only”的问题&#xff0c;以下是详细解决方案&#xff1a; 1.…

NFC 碰一碰发视频源码搭建,支持OEM

一、引言 NFC&#xff08;Near Field Communication&#xff09;近场通信技术&#xff0c;以其便捷、快速的数据交互特性&#xff0c;正广泛应用于各个领域。其中&#xff0c;NFC 碰一碰发视频这一应用场景&#xff0c;为用户带来了新颖且高效的视频分享体验。想象一下&#x…

Python基础语法全解析:从入门到实践

Python作为一门简洁高效、功能强大的编程语言&#xff0c;凭借其易读性和丰富的生态系统&#xff0c;已成为编程领域的“明星语言”。本文将系统讲解Python的核心语法&#xff0c;涵盖变量、数据类型、控制结构、函数、模块等核心概念&#xff0c;帮助读者快速掌握编程基础。 一…

TypeScript中的类型断言(type assertion),如何使用类型断言进行类型转换?

一、什么是类型断言&#xff1f; 类型断言&#xff08;Type Assertion&#xff09;是 TypeScript 中一种显式指定变量类型的方式&#xff0c;它告诉编译器&#xff1a;“我比编译器更清楚这个值的类型”。​这不是运行时类型转换&#xff0c;而是编译阶段的类型声明辅助机制。…

分区表和分表

分区表&#xff08;Partitioning&#xff09; 定义 分区表是将单个表的数据按照某种规则&#xff08;如范围、列表、哈希等&#xff09;划分为多个逻辑部分&#xff0c;每个部分称为一个分区。数据仍然存储在一个物理表中&#xff0c;但逻辑上被分割为多个分区。 特点 逻辑…

C++从入门到入土(八)——多态的原理

目录 前言 多态的原理 动态绑定与静态绑定 虚函数表 小结 前言 在前面的文章中&#xff0c;我们介绍了C三大特性之一的多态&#xff0c;我们主要介绍了多态的构成条件&#xff0c;但是对于多态的原理我们探讨的是不够深入的&#xff0c;下面这这一篇文章&#xff0c;我们将…

用Maven创建只有POM文件的项目

使用 mvn 创建一个仅包含 pom.xml 文件的父项目&#xff0c;可以借助 maven-archetype-quickstart 原型&#xff0c;然后移除不必要的文件&#xff0c;或者直接通过命令生成最简的 pom.xml 文件。以下是具体操作步骤&#xff1a; 一、方法一&#xff1a;使用原型创建后清理 1…