YOLO26创新改进 | 全网独家创新篇、小目标检测专属 | AAAI 2025 | 引入HS-FPN中的HFP和SDP创新点,从频域增强小目标特征,淘汰FPN进行升级,助力YOLO26有效涨点

一、本文介绍

🔥本文给大家介绍HFP和SDP创新点优化YOLO26模型!HS-FPN通过高频感知模块(HFP)从频域增强小目标特征,并利用空间依赖感知模块(SDP)捕获相邻像素间的空间依赖。实验表明,HS-FPN在AI-TOD和DOT Amini10等小目标检测数据集上,相较于FPN显著提升了检测性能,展现出竞争优势。电脑阅读更舒服!

🔥欢迎订阅我的专栏、带你学习使用最新-最前沿-独家YOLO26创新改进!🔥

YOLO26专栏改进目录:全新YOLO26改进专栏包含卷积、主干网络、各种注意力机制、检测头、损失函数、Neck改进、小目标检测、二次创新模块、多种组合创新改进、全网独家创新等创新点改进

全新YOLO26专栏订阅链接:全新YOLO26创新改进高效涨点+永久更新中(至少500+改进)+高效跑实验发论文

本文目录

一、本文介绍

二、HFP和SDP模块介绍

HFP和SDP网络结构图:

HFP和SDP的作用:

三、HFP和SDP核心代码

四、手把手教你添加模块和修改task.py文件

1.首先在ultralytics/nn/newsAddmodules创建一个.py文件

2.在ultralytics/nn/newsAddmodules/__init__.py中引用

3.修改tasks.py文件

五、创建涨点yaml文件

🚀参考版本1 :yolo26_HFP_SDP.yaml

🚀参考版本 2: yolo26_HFP_SDP_HSFPN_P234.yaml

🚀参考版本 3: yolo26_HFP_SDP_HSFPN_P2345.yaml

🚀参考版本 4: yolo26_C3k2_HFP.yaml

六、训练演示,正常运行

 

二、HFP和SDP模块介绍

摘要:特征金字塔网络 (FPN) 的引入显著提高了目标检测的性能。然而,在检测微小目标方面仍然存在巨大的挑战,因为它们的特征在特征图中仅占很小的比例。虽然 FPN 整合了多尺度特征,但它并没有直接增强或丰富微小目标的特征。此外,FPN 缺乏空间感知能力。为了解决这些问题,我们提出了一种新颖的高频和空间感知特征金字塔网络 (HS-FPN),它具有两个创新模块。首先,我们设计了一个高频感知模块 (HFP),它通过高通滤波器生成高频响应。这些高频响应用作空间和通道的掩码权重,以丰富和突出原始特征图中微小目标的特征。其次,我们开发了一个空间依赖感知模块 (SDP),以捕获 FPN 缺乏的空间依赖性。我们的实验表明,基于 HS-FPN 的检测器在 AI-TOD 数据集上对于微小目标检测表现出优于当前最佳模型的竞争优势。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1179031.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RAG做出来容易,做好难?一文教你优化表格数据检索,建议收藏学习

文章指出RAG技术实现简单但优化困难,特别是在处理文档表格数据时。针对表格数据,作者建议将其作为结构化数据处理:一方面可以将表格数据提取为markdown格式进行语义召回,另一方面可以保存到关系数据库中使用SQL查询。通过结合SQL查…

多智能体协作模式:让AI智能体“组队干活“,突破单一能力边界(附完整代码)

文章介绍了多智能体协作模式,通过多个专业智能体分工合作,突破单一智能体的能力边界,解决复杂任务。详细阐述了多智能体协作的定义、6种典型协作形式、6种通信结构、4个实现要点,并通过实际案例对比展示了多智能体协作在效率和效果…

一个期望小问题

求 \(n\) 阶排列的置换环数量和。 GF,Stirling 数可以算,但是可以用期望的眼光看待。 一个点 \(i\) 所在环长度是 \(k\) 的概率是 \(1/n\),其是环上最小值的概率是 \(1/k\),环的数量可以看成 \(\sum [i 为环上最小…

AI产品经理学习路线非常详细,想成为AI产品经理?面试20+人后,我建议你照着这份指南准备

文章从AI产品总监视角,解析AI产品经理的分类(模型层与应用型)及必备能力:AI原生思维(接受不确定性、提示即交互、数据飞轮)、技术边界理解、交互设计、数据评估闭环,以及场景解构能力。强调AI产…

智能体持久性记忆实战:从0到1构建双路记忆堆栈

本文介绍如何为智能体构建持久性记忆系统,通过双路记忆堆栈(情节记忆语义记忆)解决智能体健忘问题。情节记忆使用向量数据库存储对话历史,语义记忆使用图数据库存储结构化事实。文章详细展示了实现方法、代码构建及实际应用&#…

一个很恶心但是能让你六周吃透大模型的方法_大模型学习路线(2025最新)从零基础入门到精通

本文提供了2025年大模型(LLM)的系统学习路线,分为五个阶段:基础准备(数学、编程、深度学习)、核心技术(Transformer、预训练、NLP)、实战项目(基础和领域特定)、高级技能(API应用、架构实践、微调部署)以及持续学习(前沿跟踪、社区交流、实践创新)。配套…

大厂AI产品经理全岗位解析:大模型、AI+、产品AI+三大方向技能要求与职业路径

文章解析了大厂三类AI产品经理岗位:1)大模型产品经理,负责数据提供、模型测评和策略制定;2)AI产品经理,挖掘LLM在各行业应用,需掌握大模型原理;3)产品AI功能经理,专注AI功能交互设计&#xff0c…

将魔法指令中的打印显示出来

将魔法指令中的打印显示出来 from xbot import print xbot.app.logging.trace print

童年:是梦中的真,是真中的梦,是回忆时含泪的微笑

我是一个普普通通的80后。我们这一代人啊,都带着关于童年的深深记忆,那是遥远而又温暖的时光,是梦中的真,是真中的梦,是回忆时含泪的微笑。没能享受到什么时代红利,倒是赶上了一波高房价。有句经典的话说:&…

2026必备!研究生必用TOP10 AI论文写作软件深度测评

2026必备!研究生必用TOP10 AI论文写作软件深度测评 2026年研究生AI论文写作工具测评:为何需要这份榜单? 随着人工智能技术的不断进步,AI写作工具已成为研究生学术研究中不可或缺的辅助工具。然而,面对市场上琳琅满目的…

大模型学习全攻略:从零基础到AI专家的系统路线,【2026首发】AI大模型学习路线:适合新手和大学生

本文提供了从入门到高级的大模型学习完整路线,涵盖Python编程、数学基础、机器学习、深度学习等基础知识,以及自然语言处理、计算机视觉等进阶内容,并提供实战案例和学习资源,帮助小白和程序员系统掌握大模型技术,实现…

【开题答辩全过程】以 基于Python的旅游网站数据爬虫研究为例,包含答辩的问题和答案

个人简介一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。感谢大家的…

为什么99%的程序员都在“假装“学大模型?6周实战指南让你脱颖而出

文章揭示了大模型学习领域的普遍问题:许多人简历上有经验但技术细节不清。针对简历关难过、面试被秒杀、学习没方向等痛点,推出6周大模型求职急救营,提供工业级实战项目、面试导向课程设计、1v1个性化指导、独享算力资源及持续求职支持。通过…

【开题答辩全过程】以 基于Android的家庭理财系统设计与实现为例,包含答辩的问题和答案

个人简介一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等开发项目包括大数据、深度学习、网站、小程序、安卓、算法。平常会做一些项目定制化开发、代码讲解、答辩教学、文档编写、也懂一些降重方面的技巧。感谢大家的…

LLM智能体时代来临:2026大模型核心技能与职业发展路径,建议收藏

LLM智能体时代来临:2025大模型核心技能与职业发展路径,建议收藏 本文详细解析了2025年大模型技术的发展趋势和就业市场需求,介绍了LLM从静态提示词到企业级智能平台的四个演进阶段,分析了三大核心技能要求:RAG私有知识…

软件打包自解压方法

你是不是也遇到过这种困扰?把文件打包成 7Z 压缩包发给别人,对方却不会解压,要么找不到合适的解压软件,要么对着压缩包手足无措;自己想给压缩包加个专属设置,普通打包工具又满足不了需求。今天给大家安利一款超实…

大模型从“瞎聊”到“干活”:指令微调核心逻辑全拆解

大模型从“瞎聊”到“干活”:指令微调核心逻辑全拆解指令微调破局,让大模型从 “瞎聊” 变 “能干” 大家好,我是七七!刚入门大模型时,我总被一个问题困扰:明明Llama 2、Qwen这些模型能聊天说地,可一让它干具体…

为什么不推荐使用@Transactional声明事务

在日常 Spring 开发中,我们经常看到如下代码:java体验AI代码助手代码解读复制代码Transactional public void saveUser(User user) { userRepository.save(user); log.info("User saved"); } 只需一个注解 Transactional,开发者就可…

程序员必看:Ralph Loop革命性解决大模型任务中断问题,收藏学习!

Ralph Loop是一种创新的AI Agent持续迭代机制,通过外部化循环和Stop Hook拦截技术,解决了传统Agent易因自我评估不可靠而"半途而废"的问题。它强制Agent在满足客观完成条件前持续工作,显著提升了任务持续性和自主性,使A…

万字详解模式(Schema):如何利用 Schema 实现PostgreSQL中开发/测试/生产环境隔离

文章目录一、Schema 基础概念与核心特性1.1 什么是 Schema?1.2 Schema 与 Database 的区别1.3 替代方案对比1.4 Schema 隔离实施 checklist二、环境隔离的典型需求与挑战2.1 核心需求2.2 传统方案的缺陷三、基于 Schema 的环境隔离架构设计3.1 命名规范3.2 用户与角…