【中国科学院光电研究所-张建林组-AAAI26】追踪不稳定目标:基于外观引导的运动建模在无人机拍摄视频中实现稳健的多目标跟踪


文章:Tracking the Unstable: Appearance-Guided Motion Modeling for Robust Multi-Object Tracking in UAV-Captured Videos

代码:暂无

单位:中国科学院光电研究所


一、问题背景:无人机跟踪为啥总“掉链子”?

无人机拍摄场景有两个核心痛点,让传统跟踪算法难以应对:

  • 视角多变+运动复杂:无人机飞行时视角频繁切换(近拍变远拍、左拍变右拍),且与地面目标的相对运动剧烈,导致目标外观和位置变化极大;

  • 传统方法“各自为战”:现有算法大多分开处理“目标外观”和“运动轨迹”信息,忽略了两者的内在关联。一旦目标突然位移或外观模糊,就容易出现跟踪断裂、身份认错的问题。

这些问题最终导致跟踪准确率低、轨迹碎片化,严重影响无人机在安防监控、交通疏导等场景的应用效果。

二、方法创新:AMOT算法的两大“独门绝技”

研究团队提出的AMOT算法,基于联合检测与嵌入(JDE)架构,核心创新在于两个“即插即用”的模块,完美解决了传统方法的缺陷:

1. 外观-运动一致性矩阵(AMC):让匹配更靠谱

AMC矩阵不再分开看“外观”和“运动”,而是通过双向空间距离计算,将两者深度融合:

  • 先通过目标外观特征(ReID嵌入)生成响应图,预测目标在相邻帧的位置;

  • 再计算“正向距离”(上一帧轨迹预测位置到当前帧检测位置)和“反向距离”(当前帧检测预测位置到上一帧轨迹位置);

  • 只有双向距离都小时,才判定为可靠匹配,大幅减少误匹配情况。

2. 运动感知轨迹延续模块(MTC):让跟踪不中断

针对目标被遮挡、漏检导致的轨迹断裂问题,MTC模块能“复活”失联轨迹:

  • 为每个轨迹维护近期状态缓存,若轨迹暂时无匹配检测,就标记为候选;

  • 同时用卡尔曼滤波(运动模型)和外观特征(响应图)分别预测候选轨迹的当前位置;

  • 若两个预测位置距离小于阈值,就判定目标仍在画面中,激活轨迹继续跟踪。

更实用的是,这两个模块无需额外训练,能直接集成到现有JDE类跟踪器中,兼容性拉满。

三、实验结果:三大 benchmark 全面领先

研究团队在VisDrone2019、UAVDT、VT-MOT-UAV三大无人机跟踪基准数据集上做了充分测试,结果惊艳:

  • VisDrone2019:IDF1(身份一致性指标)达61.4%,MOTA(整体跟踪准确率)达46.0%,超越MM-Tracker等主流算法;

  • UAVDT:IDF1高达74.7%,MOTA达55.1%,在鸟瞰视角场景中表现突出;

  • VT-MOT-UAV:面对复杂光照和杂乱背景,仍实现52.7%的IDF1和31.8%的MOTA,优于SORT、FairMOT等经典算法。

更关键的是,AMOT保持36.4 FPS的实时推理速度,完全满足无人机实时跟踪的需求。 ablation实验还证明,AMC和MTC模块联合使用时,能让身份切换次数大幅减少,轨迹连续性显著提升。

四、优势与局限:理性看待这项新技术

核心优势

  1. 鲁棒性强:能应对无人机视角多变、目标大幅位移的复杂场景,身份识别更稳定;

  2. 即插即用:无需重新训练,可快速集成到现有跟踪器,降低应用成本;

  3. 实时高效:在保证精度的同时,推理速度满足实际应用需求;

  4. 通用性好:在不同数据集、不同跟踪器上都能带来性能提升。

现存局限

  1. 依赖ReID特征质量:若目标外观极度相似(如多辆同款白色汽车),仍可能出现匹配误差;

  2. 阈值设置敏感:AMC的尺度因子σ和MTC的距离阈值λ需根据场景微调,缺乏自适应机制;

  3. 复杂遮挡应对有限:若目标长时间被严重遮挡,轨迹仍可能断裂。

五、一句话总结

AMOT通过融合外观与运动信息的AMC矩阵和轨迹复活MTC模块,解决了无人机多目标跟踪中“匹配不准”“轨迹断裂”的核心痛点,为实时、稳健的无人机监控提供了高效解决方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1177724.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue3+python +django 的茶文化交流平台

目录茶文化交流平台摘要开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!茶文化交流平台摘要 茶文化交流平台基于Vue3、Python和Django技术栈开发,旨在为茶文化爱好者提供一个集知…

Java微服务连接同个MySQL实例报错“Too many connections”

多个微服务连接同个Mysql实例,结合数据库本身的连接池,就容易报错 Too many connections 即当前所有可用的连接都已被使用,新的客户端连接无法建立。 首先你要看两点: (1)SHOW VARIABLES LIKE max_connections; (2)有多少微服务节点以及每个微服务节点数据库连接池…

2026年市场上评价好的船用减压阀公司口碑排行,船用疏水阀/船舶配件/船用舷侧阀/船用安全阀,船用减压阀直销厂家口碑排行 - 品牌推荐师

评测背景 随着全球航运业向绿色化、智能化转型,船用减压阀作为船舶流体控制系统的核心部件,其性能稳定性、环境适应性及合规性直接影响船舶运行安全与能效。市场对高可靠性、定制化及全生命周期服务的需求日益凸显。…

2104.25万,深圳市气象局数字孪生(CIM)创新应用项目

2026 年 1 月 13 日, 深圳市气象局深圳市气象局数字孪生(CIM)创新应用项目意向公开。一、项目信息:项目名称:深圳市气象局数字孪生(CIM)创新应用项目预算金额:2104.25万元采购人&…

2026年市场评价好的实心钢棒定制加工怎么选择,不锈钢带/不锈钢冷轧板/不锈钢天沟,实心钢棒生产厂家怎么选择 - 品牌推荐师

实心钢棒市场格局与采购趋势分析 在制造业高端化转型背景下,实心钢棒作为工业基础材料,其定制加工需求持续攀升。从船舶制造到高铁基建,从高空作业设备到精密机械,下游行业对材料强度、耐腐蚀性及加工精度提出更高…

spring webflux响应式编程学习

spring webflux响应式编程学习函数式编程的优点: 例子:当我们有大量的数据要进行比较的时候,并且我们要求出里面的最小值,这个时候我们就需要使用线程池的技术,将数据拆分成几份,然后放到线程池中,再进行比较,…

1.17-1.23日博客之星投票,每日可投

帮忙给100号FE_Jinger投上一票 投票地址:100号FE_Jinger 记录以下个人第一次(或许是最后一次)入围Top300,无论结果如何,已经很满足了 也是对自己去年2025年创作一年的肯定与鼓励 FE_Jinger加油!战斗战斗! 朋…

【信号去噪】基于雪橇犬算法SDO优化变分模态分解SDO-VMD数字信号去噪(优化K值 alpha值 综合指标 适应度函数包络熵)附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室👇 关注我领取海量matlab电子书和数学建模资料 &#x1f34…

【含文档+PPT+源码】基于SpringBoot+Vue的智能机场交通管理系统

项目介绍本课程演示的是一款 基于SpringBootVue的智能机场交通管理系统,主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的 Java 学习者。1.包含:项目源码、项目文档、数据库脚本、软件工具等所有资料2.带你从零开始部署运行本套系统3.该项…

AI Coding学习——dw|ali(持续更新)

dw技术文章《Cursor 在前端需求开发工作流中的应用》,并从AI Coding小白和前端开发者两个角度,梳理出一套清晰、实用的AI辅助开发工作流。 得物 一、核心转变:从“魔法许愿机”到“超级导航仪” 许多开发者(尤其是AI新手&#xf…

【语音识别】哼唱识别系统附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室👇 关注我领取海量matlab电子书和数学建模资料 &#x1f34…

深度洞察与未来前瞻:医学影像自动诊断系统行业分析 (2025年总结版.上) - 实践

深度洞察与未来前瞻:医学影像自动诊断系统行业分析 (2025年总结版.上) - 实践2026-01-18 09:44 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow…

2026年国产时序数据库盘点:格局嬗变下的多模态融合新锐

2026年国产时序数据库盘点:格局嬗变下的多模态融合新锐摘要:进入2026年,在“数字中国”与工业物联网浪潮的强劲推动下,国产时序数据库市场持续繁荣,竞争格局日趋清晰。本文将对当前主流的国产时序数据库进行梳理盘点&a…

口碑引领方向:2026柠檬酸颗粒污泥直销厂家优选,国内柠檬酸颗粒污泥供应商口碑排行技术实力与市场口碑领航者 - 品牌推荐师

行业背景与榜单价值 随着环保政策持续收紧及工业废水处理需求激增,柠檬酸颗粒污泥作为高效厌氧生物载体,在制药、化工、造纸等高污染行业的应用价值日益凸显。然而,市场上厂家技术水平参差不齐,产品质量差异显著,…

贴广告的ChatGPT,一夜之间让全球网友破了防,未来会不会使用之前先刷30秒广告?

编辑|泽南、杨文这一天终于还是来了。周六凌晨,OpenAI 的一则公告引起轩然大波:他们计划在 ChatGPT 里加广告了。对此,网友们感到很受伤。有人表示,现在大家用大模型的一个重要原因就是能够避免广告,更好地…

2026年南京、镇江靠谱的阁楼货架厂家厂家排名 - 工业品牌热点

2026年实体产业仓储升级需求爆发,智能仓储设备已成为企业提升空间利用率、优化作业流程的核心支撑。无论是解决垂直空间浪费的阁楼货架、适配中小件存储的中型货架,还是承载重型货物的钢平台货架,优质厂家的产品实力…

基于VUE的残疾人就业系统[VUE]-计算机毕业设计源码+LW文档

摘要:残疾人就业是社会公平与和谐发展的重要体现,然而当前残疾人就业面临着信息不对称、就业渠道有限等诸多问题。本文旨在设计并实现一个基于VUE的残疾人就业系统,以改善这一现状。该系统采用前后端分离架构,前端运用VUE框架及相…

最基础数据的视频数据获取方法-轮廓及空间信息

先把这条“轮廓采集”链路从头到尾像把电路板翻过来查走线一样,梳一遍:输入是什么,在哪一步融合,产出哪些东西,最后怎么变成 类型_轮廓编码(VecIU64)。(主要在 D455相机类.ixx 这条链)。 0. 先定一句“口径” 这套实现里,“彩色为主、深度为辅”的真实含义更像: 深度…

基于VUE的宠物商城管理系统[VUE]-计算机毕业设计源码+LW文档

摘要:随着宠物市场的不断扩大和电子商务的迅速发展,宠物商城管理系统具有重要的商业价值和应用前景。本文介绍了一个基于VUE框架的宠物商城管理系统的设计与实现过程。系统采用了前后端分离的架构,前端使用VUE相关技术实现高效的交互界面&…

【程序源代码】旅游小程序(2026年最新含源码)

关键字:旅游小程序(2026年最新含源码) (一)系统介绍 1.1 系统介绍 旅游小程序(2026年最新含源码) 包含:首页,智能助手AI、行程管理、个人管理四个主要模块。分为…