Ocean: Object-aware Anchor-free Tracking

领域Object tracking
It aims to infer the location of an arbitrary target in a video sequence, given only its location in the first frame

问题/现象

  1. Anchor-based Siamese trackers have achieved remarkable advancements in accuracy, yet the further improvement is restricted by the lagged tracking robustness.
    Anchor-based Siamese trackers精确度还行但鲁棒性不行

  2. In prior Siamese tracking approaches, the classification confidence is estimated by the feature sampled from a fixed regular region in the feature map. This sampled feature depicts a fixed local region of the image, and it is not scalable to the change of object scale. As a result, the classification confidence is not reliable in distinguishing the target object from complex background.
    分类置信度是通过从固定的局部区域得到的特征估计出来的,所以当物体尺度变化的时候它并不会改变。所以当要从复杂的背景区分目标物体时,这个分类器是不可靠的。

  3. regression network in anchor-based methods is only trained on the positive anchor boxes. This mechanism makes it difficult to refine the anchors whose overlap with the target objects are small.

    This will cause tracking failures especially when the classification results are not reliable. The regression network is incapable of rectifying this weak prediction because it is previously unseen in the training set.

    原因是因为anchor-based methods的回归网络仅在正样本(当框和目标物体的重合超过一个标准时,称这个框为正样本)上训练(训练集中只有分类正确的时候,offset是什么。没有分类错误的样本)。这使得它很难去refine anchorsanchor和目标物体的重叠很少时(因为这个时候的框为负样本,previously unseen in the training set.,先前/训练时没见过这样的)。也就是当前面分类错误的时候,后面的回归网络也没有修正这个不准确的预测的能力

can we design a bounding-box regressor with the capability of rectifying inaccurate predictions?

YES!
在这里插入图片描述

这篇文章提出的跟踪器哈哈:Object-aware Anchor-Free Networks(Ocean)
(对应上述问题123)

  1. consists of two components: an object-aware classification network and a bounding-box regression network.(anchor free的)

  2. The classification is in charge of determining whether a region belongs to foreground or background
    分类器分出前景和背景(分类只采样距离中心近的点为正样本)(同时使用了object-aware featureregular-region feature。与之前anchor free方法,如FCOS不同的是增加了一个object-aware feature,且FCOS分类和回归都是计算所有落在GT内的点;)
    introduce a feature alignment module to learn an object-aware feature from predicted bounding boxes. The object-aware feature can further contribute to the classification of target objects and background.
    同时引进一个特征对齐的模块来学习 object-aware feature,使得更好的实现背景和目标物体之间的区分,也获得了一个全局的外观描述。
    实现:将卷积核的固定采样位置对齐到预测的回归box(图2c)。回归box是通过bounding-box regression network得来的哦。对于classification map上的每个位置(dx, dy),都有一个对应的回归预测框M=(mx, my, mw, mh)mx, my表示中心,mw, mh表示宽高。目标就是从候选框M中采样特征来预测(dx, dy)的分类得分。

  3. regression aims to predict the distances from each pixel within the target objects to the four sides of the groundtruth bounding boxes.
    回归用来预测目标物体中的每个像素点到真实锚框的四条边的距离。(训练时候的样本是all the pixels in the groundtruth bounding box)

Since each pixel in the groundtruth box is well trained, the regression network is able to localize the target object even when only a small region is identified as the foreground.
就算只有很小一块区域被分类为前景,由于each pixel in the groundtruth box is well trained,所以该回归有修正前面不太正确的预测的可能性

(这样理解:anchor-based一个框是一个样本,这里一个像素是一个样本。前面的训练集是正确的框怎么偏移到groundtruth,后面的是每个像素到框的距离。那么当框和目标物体重叠很小但被预测为正确的框的时候。对于anchor-based,因为实际上它是负样本,所以没见过,没训练过。但对于anchor free的,即使预测为前景实际也为前景的部分很小,那也还是有实际为前景且被正确预测为前进的像素点存在的,训练的时候见过,所以有纠正预测的可能)

在这里插入图片描述

  • 回归的时候所有位于groundtruth box内的像素都被标注为正样本
  • 对于Regular-region classification,靠近目标中心点的一小部分区域内的像素为正样本
  • 对于Object-aware classificationthe IoU of predicted box and groundtruth box被用作标签。

more details are provided in this paper:Ocean: Object-aware Anchor-free Tracking

补充(超简版):

  • anchor-based methodsVSanchor free methods
    • anchor-based :
      • 相比于anchor free,它使用预定义的anchor框来匹配真实的目标框
      • 过程:生成 anchor boxes,判断每个 anchor box foreground还是background(二分类),对anchor box进行微调(这部分就是前文提到的refine),使得 positive anchor 和真实框(Ground Truth Box)更加接近(使用regression
    • anchor free:
      • Different from anchor-based methods which estimate the offsets of anchor boxes, anchor-free mechanisms predict the location of objects in a direct way.
      • 基于角点的/中心点的/全卷积的
  • 目标跟踪VS目标检测
    • 目标检测是事先针对特定目标的,比如人头检测、动物检测,目标跟踪则是对于任意目标的跟踪,即事先是不知道跟踪的具体目标的。(但是检测器也可以根据人们需要检测的目标进行初始化,这样好像又有点像跟踪器了->基于检测的目标跟踪。而且感觉基于检测的的目标跟踪有点 杀鸡用牛刀 了吧,因为根本不需进行目标识别,不需要每一帧都去检测,就只是目标跟踪就好了)
    • 理想的跟踪器应该不需要每一帧都暴力检测目标所在的位置,而是可以充分利用帧间信息,目标周围的环境信息,甚至根据周边环境推测得到的三维信息等,更加高效的确定目标所在的位置
    • 再想象一个场景:一个被设计用来检测行人的目标检测器,如果将其应用到马路场景上,检测器将会检测到马路上的大量行人。如果只想跟踪某个行人,那么检测器的结果并不是人们想要的。但这时跟踪器就完全不一样了,给跟踪器指定初始跟踪行人后,它将可以在后续的过程中只跟踪指定的行人

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/81301.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[Java] 方法和数组

目录 1. 方法 1.2 什么是方法 1.2 方法的定义 1.3 方法的调用 1.4 方法的重载 1.5 递归 2. 一维数组 2.1 什么是数组 2.2 数组的创建 2.3 数组的初始化 2.4 遍历数组 2.5 引用数据类型 2.6 关于null 2.7 数组转字符串 2.8 数组元素的查找 2.9 数组的排序 2.10…

全局异常处理:如何优雅地统一管理业务异常

在软件开发中,异常处理是保证系统健壮性的重要环节。一个良好的异常处理机制不仅能提高代码的可维护性,还能为使用者提供清晰的错误反馈。本文将介绍如何通过全局异常处理和业务异常统一处理来编写更加优雅的代码。 一、传统异常处理的痛点 1.1 典型问…

PHP 编程:现代 Web 开发的基石与演进

引言 PHP(Hypertext Preprocessor)自1995年诞生以来,已成为全球最流行的服务器端脚本语言之一。尽管近年来Node.js、Python等语言在特定领域崭露头角,但PHP仍占据着超过78%的网站市场份额(W3Techs数据)。本…

MCU程序加密保护(一)闪存读写保护法 加密与解密

MCU(微控制器单元)的加密方法可以从硬件、软件和通信协议三个层面来理解。以下是常见的MCU加密手段,按类型分类说明: 针对目前 STM32 系列微控制器在程序加密保护方面手段单一、保护效果有限的问题,本文介绍并分析了四…

汽车装配又又又升级,ethernetip转profinet进阶跃迁指南

1. 场景描述:汽车装配线中,使用EtherNet/IP协议的机器人与使用PROFINET协议的PLC进行数据交互。 2. 连接设备:EtherNet/IP机器人控制器(如ABB、FANUC)与PROFINET PLC(如西门子S7-1500)。 3. 连…

RFID系统:技术解析与应用全景

一、技术架构与运行逻辑 RFID(Radio Frequency Identification)系统通过无线电波实现非接触式数据交互,其核心由三部分组成: 电子标签(Tag): 无源标签:依赖读写器电磁场供电&…

25、DeepSeek-R1论文笔记

DeepSeek-R1论文笔记 1、研究背景与核心目标2、核心模型与技术路线3、蒸馏技术与小模型优化4、训练过程简介5、COT思维链(Chain of Thought)6、强化学习算法(GRPO)7、冷启动**1. 冷启动的目的****2. 冷启动的实现步骤****3. 冷启动…

开源项目实战学习之YOLO11:12.2 ultralytics-models-sam-decoders.py源码分析

👉 点击关注不迷路 👉 点击关注不迷路 👉 另外,前些天发现了一个巨牛的AI人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。感兴趣的可以点击相关跳转链接。 点击跳转到网站。 ultralytics-models-sam 1.sam-modules-decoders.pyblocks.py: 定义模型中的各…

Raft 协议:分布式一致性算法的核心思想

引言 在分布式系统中,数据一致性是核心挑战。Raft 协议作为一种易于理解的一致性算法,被广泛应用于 etcd、Consul 等系统中。 一、Raft 核心概念 1.1 角色与任期(Term) • 领导者(Leader):处…

基于DWT的音频水印算法

基于离散小波变换(DWT)的音频水印算法是一种结合信号处理与信息隐藏的技术,旨在将版权信息或标识隐蔽地嵌入音频信号中,同时保证不可感知性和鲁棒性。以下是该算法的核心步骤及关键技术点: ​1. 算法基本原理​ ​DWT…

低空经济发展现状与前景

低空经济发展现状与前景 一、低空经济的定义与范畴 低空经济是以民用有人驾驶和无人驾驶航空器为主体,以载人、载货及其他作业等多场景低空飞行活动为牵引,辐射带动商业活动或公共服务领域融合发展的一种综合性新经济形态。其涵盖的低空空域通常为距离…

售前工作.工作流程和工具

第一部分 售前解决方案及技术建议书的制作 售前解决方案编写的标准操作步骤SOP: 售前解决方案写作方法_哔哩哔哩_bilibili 第二部分 投标过程关键活动--商务标技术方案 1. 按项目管理--售前销售项目立项 销售活动和销售线索的跟踪流程和工具 1)拿到标书&#xff…

DeerFlow试用

github拉取代码 配置.env和conf.yaml 注意设置大模型的url和模型名称、api_key 先启动根目录下的server,端口如果有冲突直接在default变量赋值时修改; 再启动前端,先build再run dev; 根据前端完成时的地址访问界面&#xff1…

python + streamlink 下载 vimeo 短视频

1. 起因, 目的: 看到一个视频,很喜欢,想下载。https://player.vimeo.com/video/937787642 2. 先看效果 能下载。 3. 过程: 因为我自己没头绪。先看一下别人的例子, 问一下 ai 或是 google问了几个来回,原来是流式…

JavaScript【6】事件

1.概述: 在 JavaScript 中,事件(Event)是浏览器或 DOM(文档对象模型)与 JavaScript 代码之间交互的一种机制。它代表了在浏览器环境中发生的特定行为或者动作,比如用户点击鼠标、敲击键盘、页面…

【Java ee初阶】HTTP(2)

一、HTTP的方法 方法 说明 支持的HTTP协议版本 GET 获取资源 1.0、1.1 POST 传输实体主体 1.0、1.1 PUT 传输文件 1.0、1.1 HEAD 获得报文首部 1.0、1.1 DELETE 删除文件 1.0、1.1 OPTIONS 询问支持的方法 1.1 TRACE 追踪路径 1.1 CONNECT 要求用隧道…

文件名是 ‪E:\20250512_191204.mp4, EV软件录屏,未保存直接关机损坏, 如何修复?

去github上下载untrunc 工具就能修复 https://github.com/anthwlock/untrunc/releases 如果访问不了 本机的 hosts文件设置 140.82.112.3 github.com 199.232.69.194 github.global.ssl.fastly.net 就能访问了 实在不行,从这里下载,传上去了 https://do…

腾讯 CodeBuddy 杀入 AI 编程赛道,能否撼动海外工具霸主地位?

在 AI 编程助手领域,海外的 Cursor 等工具风头正劲,如今腾讯带着 CodeBuddy 隆重登场,国产 AI 编程助手能否借其之力崛起?让我们一探究竟。 官网: 腾讯云代码助手 CodeBuddy - AI 时代的智能编程伙伴 实战安装教程 …

PySide6 GUI 学习笔记——常用类及控件使用方法(常用类颜色常量QColorConstants)

文章目录 一、概述二、颜色常量表标准 Qt 颜色SVG 颜色(部分) 三、Python 代码示例四、代码说明五、版本兼容性六、延伸阅读 一、概述 QColorConstants 是 Qt for Python 提供的一个预定义颜色常量集合,包含标准Qt颜色和SVG规范颜色。这些常…

MATLAB 自然语言处理入门教程

文章目录 前言环境配置一、MATLAB NLP 工具箱概述二、核心功能与 API1. 文本数据准备2. 特征提取3. 文本分类(传统机器学习)4. 深度学习文本分类(LSTM) 三、实战案例:情感分析四、高级应用1. 命名实体识别(…