YOLO26改进 - C2PSA | C2PSA融合TSSA(Token Statistics Self-Attention)令牌统计自注意力,优化遮挡目标感知

#  前言

本文介绍了Token Statistics Self-Attention(TSSA)机制,并将其集成到YOLO26中。传统自注意力计算复杂度高,TSSA进行了范式转变,基于token统计特征实现高效注意力交互。它通过“算法展开”推导得出,以“最大编码率降低”为目标,实现特征学习。TSSA包含动态分组和低秩投影优化两步创新,具备线性复杂度。我们将TSSA代码集成到YOLO26的C2PSA模块中。实验表明,改进后的YOLO26在目标检测任务中表现良好,验证了TSSA机制的有效性。 

 

> **文章目录: [YOLO26改进大全:卷积层、轻量化、注意力机制、损失函数、Backbone、SPPF、Neck、检测头全方位优化汇总](https://blog.csdn.net/yolochangeworld/article/details/156995579)**

> **专栏链接:  [YOLO26改进专栏](https://blog.csdn.net/yolochangeworld/category_13118063.html)**

@[TOC]

# 介绍

![image-20251225215051611](https://i-blog.csdnimg.cn/img_convert/33f92d22504e56560151fa7f20d672fe.png) 

 

## 摘要

 

注意力算子可以说是 Transformer 架构的关键特征,该架构在多种任务中都表现出了最先进的性能。然而,Transformer 的注意力算子通常会带来巨大的计算负担,其计算复杂度随 Token 数量呈二次方增长。在这项工作中,我们提出了一种新型的 Transformer 注意力算子,其计算复杂度随 Token 数量呈线性增长。我们将之前的研究成果进行了扩展,之前的研究表明,通过“白盒”架构设计可以自然地构建出 Transformer 风格的架构,即网络的每一层都被设计为实现最大编码率降低目标($MCR^{2}$)的一个增量优化步骤。具体来说,我们推导了 $MCR^{2}$ 目标的一种新颖变分形式,并展示了基于该变分目标进行展开梯度下降所得到的架构,导出了一种新的注意力模块,称为 **Token 统计自注意力(Token Statistics Self-Attention,TSSA)**。TSSA 具有线性的计算和内存复杂度,并且与计算 Token 之间成对相似度的典型注意力架构截然不同。在视觉、语言和长序列任务上的实验表明,只需简单地用 TSSA 替换标准自注意力(我们将这种架构称为 **Token 统计 Transformer,即 TOST**),就能获得与传统 Transformer 相当的性能,同时计算效率更高且更具可解释性。我们的结果还在一定程度上质疑了“成对相似度风格的注意力机制是 Transformer 架构成功的关键”这一传统观念。代码将在 https://github.com/RobinWu218/ToST 开源。

# 文章链接

 **论文地址:**[论文地址](https://arxiv.org/abs/2412.17810)

**代码地址:**[代码地址](https://github.com/RobinWu218/ToST/blob/main/tost_vision/tost.py)

 

# 基本原理

 TSSA(Token Statistics Self-Attention)的核心创新是彻底抛弃传统自注意力的“成对相似度计算”,转而基于token的统计特征实现高效注意力交互 :

### 1. 从“逐对对比”到“统计聚合”的范式转变
传统自注意力需要计算所有token两两之间的相似度(如缩放点积),导致复杂度随token数量呈平方增长。TSSA跳出这一框架,认为注意力的本质是“基于数据关联的特征优化”,而这种关联无需逐对计算——只需捕捉token群体的统计规律(即“二阶矩”,可理解为token特征的分布集中程度),就能实现类似的特征聚合效果。

### 2. 基于“白盒设计”的目标导向优化
TSSA并非经验性设计,而是通过“算法展开”的白盒思路推导得出:以“最大编码率降低(MCR²)”为核心目标,先将该目标转化为更易计算的变分形式,再把优化过程拆分成网络的逐层操作。每一层的作用都是增量优化这个目标——让同一组内的token特征更集中(压缩),同时让所有token的整体特征更分散(扩展),最终实现 discriminative 特征学习。

### 3. 数据驱动的低秩投影与动态分组
TSSA的核心操作包含两步关键创新:
- 动态分组:通过计算token与不同子空间的匹配度,用软聚类(类似概率分配)将token分到K个组,无需人工定义分组规则,完全由数据自动决定。
- 低秩投影优化:对每个组,基于token特征的统计信息构建“重要性权重”,保留组内特征中“能量集中”(即多数token共同拥有)的方向,抑制冗余或噪声方向。这一过程不依赖任何成对相似度,仅通过矩阵投影和统计计算完成,天然具备线性复杂度。

#  

# YOLO26引入代码

 在根目录下的`ultralytics/nn/`目录,新建一个`   C2PSA`目录,然后新建一个以 `  C2PSA_TSSA`为文件名的py文件, 把代码拷贝进去。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1202022.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

微信小程序开发公司哪家比较好?最新测评报告给你答案

在数字化转型成为必选题的今天,微信小程序已成为企业线上引流、服务客户、促成交易的关键工具。然而,面对市场上众多的小程序开发公司,许多企业主和项目负责人都会感到困惑:微信小程序开发公司哪家比较好? 选择时…

100dB 深度消回音 + AI 智能降噪!WX-0813 语音处理模组,重塑全场景音频通话体验

WX0813AI降噪回音消除模组在智能门禁、远程会议、车载通信等多元化音频场景中,回声干扰、环境噪音嘈杂、设备适配复杂等问题,往往成为制约产品体验的关键瓶颈。WX-0813 AI 降噪回音消除模组的横空出世,以 “超强声学处理 高集成设计 广泛适…

YOLO26改进 - SPPF模块 | SPPELAN 空间金字塔池化与增强局部注意力:替代SPPF增强多尺度上下文捕获,提升检测精度

前言 本文介绍了可编程梯度信息(PGI)和通用高效层聚合网络(GELAN),以及SPPELAN模块在YOLO26中的结合应用。针对深度网络数据传输中的信息丢失问题,提出PGI概念以提供完整输入信息计算目标函数,获得可靠梯度更新…

【毕业设计】基于springboot的食品安全管理系统(源码+文档+远程调试,全bao定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

YOLO26改进 - SPPF模块 | 替代SPPF, Mona多认知视觉适配器:打破全参数微调的性能枷锁:即插即用的提点神器 | CVPR 2025

前言 本文介绍了新型视觉适配器微调方法Mona,并将其集成到YOLO26中。传统全参数微调成本高、存储负担重且有过拟合风险,现有PEFT方法性能落后。Mona仅调整5%以内的骨干网络参数,在多个视觉任务中超越全参数微调。其核心亮点包括参数效率高、…

2026全国学历提升机构TOP10盘点:选课攻略+避坑指南

2026全国学历提升机构TOP10盘点:选课攻略+避坑指南一、全国性头部机构:品牌与实力双保障 在学历提升的赛道上,全国性的大型机构凭借深厚的品牌底蕴、广泛的资源网络和成熟的教学体系,成为众多考生的首选。它们不仅…

微信小程序商城怎么开通?来自程序员的实用教程

大家好,我是专注小程序开发超过8年的老司机。这些年亲眼看着微信生态从萌芽到爆发,现在小程序日活已经突破5亿(数据来源:腾讯2023年财报),电商类小程序年均增长率超过60%。可以说,如果你还没把生意搬到小程序上…

Java毕设项目推荐-基于SpringBoot的在线食品安全信息平台系统基于springboot的食品安全管理系统【附源码+文档,调试定制服务】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

ffmpeg 二叉树代码测试及分析 - 详解

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

Java毕设选题推荐:基于springboot的企业智慧知识产权资产运营平台企业内部知识产权管理系统【附源码、mysql、文档、调试+代码讲解+全bao等】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

2026执业药师考试培训前十机构测评:通关攻略与避坑指南

2026执业药师考试培训前十机构测评:通关攻略与避坑指南一、引言:为什么选择专业机构备考执业药师? 在医药行业中,执业药师资格证的重要性不言而喻,它就像是一块 “黄金敲门砖”,为从业者开启了更广阔的职业发展大…

Java毕设项目推荐-基于springboot高校学生就业信息推送系统springboot的面向大学生的职业兴趣评估与就业指导平台【附源码+文档,调试定制服务】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

亿可达×飞书:一键搞定定时群通知,告别人工重复提醒

有没有过这样的职场日常? 每天下午临近下班,都要特意定个闹钟提醒自己:“别忘了发例会通知”“记得同步今日工作小结到飞书群”;每周一早上,总要专门抽5分钟,在部门群推送本周任务清单;甚至节假…

Java毕设选题推荐:基于springboot大学生就业服务平台springboot的面向大学生的职业兴趣评估与就业指导平台【附源码、mysql、文档、调试+代码讲解+全bao等】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

Langchain 快速入门(一)

简介 langchain专门用于构建LLM大语言模型,其中提供了大量的prompt模板,和组件,通过chain(链)的方式将流程连接起来,操作简单,开发便捷。 环境配置 安装langchain框架 pip install langchain langchain-community…

2026最新版!微信小程序SaaS模板平台前十排名报告

2026年,小程序已成为商业经营的“标配”,但平台选择却愈发令人困惑。市场上工具繁多,宣传各异,企业主和创业者面临三大核心痛点: 第一,价格迷雾——低价入门后是否隐藏持续费用?第二,增长天花板——发展壮大后…

深入解析:Rust 练习册 :Matching Brackets与栈数据结构

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

2026 年 AI PPT 工具深度评测:拒绝 “科技与狠活”,寻找真正能解决职场痛点的生产力工具

在 2026 年,AI PPT 已然成为职场效率的关键变量。不同的 AI PPT 工具带来的效率提升有天壤之别,这就形成了一条“效率分水岭”,站在分水岭两侧的职场人,工作效率和成果有着显著差异。经过深度实测,并结合本土化场景评估…

2026年专业深度测评:淘宝代运营公司排名前五权威榜单

2026年专业深度测评:淘宝代运营公司排名前五权威榜单 随着电商行业竞争进入存量精细化运营阶段,品牌方对专业、高效、数据驱动的淘宝代运营服务需求持续攀升。为帮助品牌方精准决策,本测评基于行业公开数据、服务案…

Java毕设项目:基于springboot的食品安全管理系统(源码+文档,讲解、调试运行,定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…