(论文阅读22/100)Learning a Deep Compact Image Representation for Visual Tracking

news/2024/9/8 4:31:46/

文献阅读笔记

简介

题目

Learning a Deep Compact Image Representation for Visual Tracking

作者

N Wang, DY Yeung

原文链接

Learning a Deep Compact Image Representation for Visual Tracking (neurips.cc)

关键词

Object tracking、DLT、SDAE

研究问题

tracking the trajectory of a moving object in a video with possibly very complex background

在尽可能复杂背景的视频中跟踪目标的移动轨迹

研究方法

DLT:deep learning tracker

试图结合生成性跟踪器和判别性跟踪器的思想,开发一个鲁棒的判别性跟踪器。

更强调无监督的特征学习问题;

Specifically, by using auxiliary natural images, we train a stacked denoising autoencoder (SDAE) offline to learn generic image features that are more robust against variations.

通过使用辅助的自然图像,我们离线训练一个堆叠的去噪自编码器,以学习对变化更稳定的通用图像特征。

This is then followed by knowledge transfer from offline training to the online tracking process.

随后是知识转移从线下培训到线上跟踪的过程。

Online tracking involves a classification neural network which is constructed from the encoder part of the trained autoencoder as a feature extractor and an additional classification layer.

在线跟踪涉及一个分类神经网络,该网络由训练好的自编码器的编码器部分作为特征提取器和一个额外的分类层构建而成。

Both the feature extractor and the classifier can be further tuned to adapt to appearance changes of the moving object.

特征提取器和分类器都可以进行进一步的调整以适应移动对象的外观变化。

研究结论

相比其他跟踪器,在保持低计算成本和实时性的情况下更准确

创新不足

it would be an interesting direction to investigate a shift-variant CNN.

目前的跟踪器中的分类层只是一个线性分类器。将其扩展到更强大的分类器中,就像在其他判别跟踪器中一样,可能会为进一步的性能提升提供更大的空间。

额外知识

生成式和判别式方法:

生成式:假设被跟踪的对象可以用某种生成式过程来描述,因此跟踪相当于在可能无限多的候选对象中找到最可能的候选对象。关键是开发更加稳定的图像表示。灵感来源于robust estimation and sparse coding,such as the alternating direction method of multipliers (ADMM) and accelerated gradient methods。Some popular generative trackers include incremental visual tracking (IVT) , which represents the tracked object based on principal component analysis (PCA), and the l1 tracker (L1T)。

判别式:,判别式方法将跟踪视为一个二分类问题,学习将被跟踪对象与其背景明确区分开来。Some representative trackers in this category are the online AdaBoost (OAB) tracker [6], multiple instance learning (MIL) tracker [3], and structured output tracker (Struck).

对比:由于使用了更丰富的图像表示,生成式跟踪器通常在较不复杂的环境下产生更准确的结果,而判别式跟踪器由于明确地将背景考虑在内,因此对强遮挡和变化具有更强的鲁棒性。

The particle filter framework:粒子滤波框架

一种基于序列观测值估计动力系统潜在状态变量的序贯蒙特卡洛重要性采样方法。它通过一组粒子来近似后验状态分布,而不仅仅是像模式这样的单点。对于视觉跟踪而言,这一特性使得跟踪器更容易从错误的跟踪结果中恢复

Kalman filter卡尔曼滤波:

比较先进的跟踪器:MTT, CT , VTD , MIL, a latest variant of L1T, TLD, and IVT.


http://www.ppmy.cn/news/1212881.html

相关文章

JUL日志

文章目录 JUL日志JUL日志讲解Properties配置文件编写日志配置文件Lombok快速开启日志Mybatis日志系统 JUL日志 如果使用System.out.println来打印信息,项目中存在大量的控制台输出语句,会显得很凌乱,而且日志的粒度是不够细的,假…

前端开发引入element plus与windi css

背景 前端开发有很多流行框架,像React 、angular、vue等等,本文主要讲vue 给新手用的教程,其实官网已经写的很清楚,这里再啰嗦只是为了给新手提供一个更加简单明了的参考手册。 一、打开element plus官网选则如图所示模块安装命令…

Redis五种数据类型及命令操作(二)

🎈个人公众号:🎈 :✨✨✨ 可为编程✨ 🍟🍟 🔑个人信条:🔑 知足知不足 有为有不为 为与不为皆为可为🌵 🍉本篇简介:🍉 本篇记录Redis五种数据类型及命令操作,如…

C语言进阶

数组 在基础篇说过,数组实际上是构造类型之一,是连续存放的。 一维数组 定义 定义格式:[存储类型] 数据类型 数组名标识符[下标]; 下面分模块来介绍一下数组的定义部分的内容。 1、初始化和元素引用: 可以看到数组是连续存储…

英文字符大小写转换函数

C语言标准库中提供了许多函数可以实现将字符串转为大小写。你可以使用以下函数进行转换&#xff1a; #include<ctype.h> int toupper(int c)&#xff1a;将一个小写字符转换为大写字符。 int tolower(int c)&#xff1a;将一个大写字符转换为小写字符。#include<stri…

进阶SQL——数据表中多列按照指定格式拼接,并将多行内容合并为map拼接

示例&#xff1a; str_to_map(concat_ws(,,collect_set(concat_ws(:,modelname,score)))) as score_map, 这条语句是一个Spark SQL的语句&#xff0c;用于将字符串转换为Map类型。下面是对这条语句的详细解释和教程&#xff1a; 1. collect_set(concat_ws(:,modelname,scor…

c++类对象内存模型(一)

C对象模型可以概括为以下2部分&#xff1a; 1. 语言中直接支持面向对象程序设计的部分&#xff0c;主要涉及如构造函数、析构函数、虚函数、继承&#xff08;单继承、多继承、虚继承&#xff09;、多态等等。 2. 对于各种支持的底层实现机制。在c语言中&#xff0c;“数据”和…

【MySQL系列】第二章 · SQL(上)

写在前面 Hello大家好&#xff0c; 我是【麟-小白】&#xff0c;一位软件工程专业的学生&#xff0c;喜好计算机知识。希望大家能够一起学习进步呀&#xff01;本人是一名在读大学生&#xff0c;专业水平有限&#xff0c;如发现错误或不足之处&#xff0c;请多多指正&#xff0…

近期的一些思考

1.对于程序员这个职业 &#xff0c;完全没有必要通过打工听人安排而活着&#xff0c;而是反过来通过在公司工作提高自己的技能&#xff0c;让自己可以更为独立和自由地生活。 2.没什么技术含量的工作&#xff0c;就像在学生时代那样交作业就好了。想尽一切方法提高交作业的效率…

关于安卓刷机,小米手机,各种安卓手机,理念+实践,如:小米8

关于安卓刷机&#xff1a; 比刚买的时候 更加流畅&#xff0c;调节性能 狂暴模式&#xff0c;且无任何冗余软件和垃圾。 作为普通人&#xff0c;就是刷自己想要的系统&#xff0c;比如开发版。打开Root权限&#xff0c;第三方Rec TWRP&#xff0c;面具Magisk&#xff0c;LSPo…

HDMI之编码篇

概述 HDMI 2.0b(含)以下版本,采用3个Channel方式输出。传输又分为3三种周期,视频数据,数据岛以及控制周期。视频传输采用8/10编码。数据岛采用4/10编码(TERC4)。控制周期采用2/10。编码都拓展成了10bits。 上图中,Pixel component(e.g.B)->D[7:0]表示视频数据周期…

如何在ModelScope社区魔搭下载所需的模型

本篇文章介绍如何在ModelScope社区下载所需的模型。 若您需要在ModelScope平台上有感兴趣的模型并希望能下载至本地&#xff0c;则ModelScope提供了多种下载模型的方式。 使用Library下载模型 若该模型已集成至ModelScope的Library中&#xff0c;则您只需要几行代码即可加载…

吃透 Spring 系列—AOP部分

目录 ◆ AOP 简介 - AOP的概念 - AOP思想的实现方案 - 模拟AOP的基础代码 - AOP相关概念 ◆ 基于xml配置的AOP - xml方式AOP快速入门 - xml方式AOP配置详解 - xml方式AOP原理剖析 ◆ 基于注解配置的AOP - 注解方式AOP基本使用 - 注解方式AOP配置详解 - 注解…

【Phoenix】目录结构

当我们通过 mix phx.new 命令生成一个新的Phoenix应用时&#xff0c;它会创建以下目录结构&#xff1a; ├── _build ├── assets ├── config ├── deps ├── lib │├── hello │├── hello.ex │├── hello_web │└── hello_web.ex ├── priv └── …

OTA包添加自定义内容

起因 新开一条线&#xff0c;需要上传的OTA包里加点内容&#xff0c;好让后台校验它是否是当前这条线(短期最小改动)。 开整 之前看过ota包结构&#xff0c;整包和差分包里都有一个payload_properties.txt文件&#xff0c;所以最简单的就是给这个txt文件里追加点自定义内容&…

python list 嵌套 list 合并

以下是“Python中把嵌套的列表合并成一个列表方法总结”的完整攻略。 方法总结 在Python中&#xff0c;可以使用以下三种方法将嵌套的列表合并成一个列表。 1.1 使用推导式 使用列表推导式可以将嵌套的列表合并成一个列表。示例如&#xff1a; nested_list [[1, 2], [3, 4]…

无人机航迹规划:五种最新智能优化算法(GRO、SWO、COA、LSO、KOA)求解无人机路径规划MATLAB

一、五种算法&#xff08;GRO、SWO、COA、LSO、KOA&#xff09;简介 1、淘金优化算法GRO 淘金优化算法&#xff08;Gold rush optimizer&#xff0c;GRO&#xff09;由Kamran Zolf于2023年提出&#xff0c;其灵感来自淘金热&#xff0c;模拟淘金者进行黄金勘探行为。VRPTW&am…

Leetcode 2931. Maximum Spending After Buying Items

Leetcode 2931. Maximum Spending After Buying Items 1. 解题思路2. 代码实现 题目链接&#xff1a;2931. Maximum Spending After Buying Items 1. 解题思路 这一题其实算是一道脑筋急转弯的题目…… 文中给出了行数不超过10行的限定等等其实全是套路&#xff0c;诱导人往…

通过结构间比值比较迭代次数

( A, B )---3-30-2---( 1, 0 )( 0, 1 ) 让网络的输入只有3个节点&#xff0c;A有5个点&#xff0c;B全是0&#xff0c;排列组合。让A,B训练集分别有3&#xff0c;4&#xff0c;5&#xff0c;6张图片&#xff0c;统计迭代次数并排序。 先比较图片数量是3和4的情况 n4 迭代次数…

02:2440---时钟体系

目录 一:时钟控制 1:基本概念 2:时钟结构图 3:结构图分析 4:总线 5:寄存器 A:FCLK--MPLLCON B:HCLK和PCLK--CLKDIVN C:注意 二:上电复位 1:上电复位 2:时钟选择 三:代码 一:时钟控制 1:基本概念 S3C2440A中的时钟控制逻辑可以产生所需的时钟信号&#xff0c;包括C…