(论文阅读13/100)R-CNN minus R

news/2024/4/15 13:51:56

文献阅读笔记

简介

题目

R-CNN minus R

作者

Karel Lenc Andrea Vedaldi

原文链接

https://arxiv.org/pdf/1506.06981.pdf

关键词

Null

研究问题

proposal generation在基于CNN的探测器中的作用,以确定它是否是一个必要的建模组件。

R-CNN留下几个有趣的问题

第一个问题是CNN是否包含足够的几何信息来定位对象,或者后者是否必须由外部机制(如区域建议生成)进行补充。

第二个问题是R-CNN管道是否可以简化

第三个问题是R-CNN是否可以加速。

通过认识到卷积特征可以在不同区域之间共享,而不是重新计算,空间金字塔池(spp)中的速度已经大大加快了。然而,SPP无法生成非常精确的区域

研究方法

通过设计和评估一个检测器来实现这一点,该检测器使用一个小的区域生成方案,每个图像都是常量。结合SPP,这将产生一个优秀的和快速的检测器,不需要用CNN本身以外的算法处理图像。还通过将几个学习步骤集成到一个算法中,以及通过提出一些加速检测的改进,简化了基于CNN的检测器的训练。

Simplifying and streamlining R-CNN:

放弃候选区域:与基于边界检测的cnn相结合

放弃支持向量机采用softmax

研究结论

尽管在卷积层而不是全连接层中,当前CNN确实包含大量用于精确目标检测的几何信息。这一发现开启了建立完全依赖CNN的最先进的目标探测器的可能性,消除了区域建议生成方案,如选择性搜索,并导致集成、简单和更快的探测器。

创新不足

当前的方案可能会错过图像中的小对象。

额外知识

性能检测器基于手工制作的图像表示(如SIFT、HOG和Fisher矢量)和结构化输出回归(从滑动窗口到可变形零件模型)的组合。

GT boxes、放弃候选区域那块没看懂(码住)


http://www.ppmy.cn/news/1195450.html

相关文章

线性代数 第五章 特征值与特征向量

一、特征值定义 二、特征值求法 定义法;;相似。 三、特征向量求法 定义法;基础解系法;;相似。 四、特征值性质 不同特征值的特征向量线性无关k重特征值至多有k个线性无关的特征向量 五、相似的定义 若&#xff…

软件设计模式原则(二)开闭原则

继续讲解第二个重要的设计模式原则——开闭原则~ 一.定义 开闭原则,在面向对象编程领域中,规定“软件中的对象(类,模块,函数等等)应该对于扩展是开放的,但是对于修改是封闭的”,这意…

c语言从入门到实战——VS2022实用调试技巧

VS实用调试技巧 前言1. 什么是bug2. 什么是调试(debug)3. Debug和Release4. VS调试快捷键4.1 环境准备4.2 调试快捷键 5. 监视和内存观察5.1 监视5.2 内存 6. 调试举例17. 调试举例28. 编程常见错误归类8.1 编译型错误8.2 链接型错误8.3 运行时错误 前言…

学习c++的第四天

目录 运算符 算术运算符 关系运算符 逻辑运算符 位运算符 赋值运算符 杂项运算符 运算符优先级 运算符 算术运算符 算术运算符是 C 中用于执行基本算术操作的运算符。 加法运算符 ():将两个操作数相加。例如,A B 将得到 30,因为 …

Android 12.0 系统system模块开启禁用adb push和adb pull传输文件功能

1.使用场景 在进行12.0的系统定制化开发中,在一些产品中由于一些开发的功能比较重要,防止技术点外泄在出货产品中,禁用 adb pull 和adb push等命令 来获取系统system下的jar 和apk 等文件,所以需要禁用这些命令,接下来实现这些功能 2.系统system模块开启禁用adb push和ad…

恭喜@BLG电子竞技俱乐部 成功晋级2023全球总决赛四强! #BLG晋级半决赛##BLG战胜GEN#

在英雄联盟全球总决赛淘汰赛的舞台上,一场激动人心的对决展现在观众面前。BLG战队与GEN战队,两支队伍都展现出了高水平的竞技实力,他们用精准的操作和独特的策略,为观众带来了一场视觉盛宴。 比赛开始,双方都展现出了…

git reflog 恢复git reset --hard 回退的内容

首先使用 git reflog 查看处理的历史,历史是由新到旧排列的,找到回退前的commit的id,找的过程可以只关注HEAD的部分,HEAD括号中的值越大越旧,越小越新。 找到后执行以下命令 git reset --hard 你的commit_id 然后…

【算法挑战】移掉 K 位数字(含解析、源码)

402. 移掉 K 位数字 https://leetcode-cn.com/problems/remove-k-digits/ 题目描述 给定一个以字符串表示的非负整数 num,移除这个数中的 k 位数字,使得剩下的数字最小。注意:num 的长度小于 10002 且 ≥ k。 num 不会包含任何前导零。 示例 1 :输入:…

VUE2和VUE3思维导图知识体系总结大对比

VUE2知识体系 VUE3知识体系 思维导图原件下载地址

NEWSTART2022 web week1

01HTTP flag{f1cb35f5-05de-4559-8f99-28e1f11df403} 02Head?Header! 或者xxf头:localhost 03我真的会谢 这个题目比之前有意思多了 可知是vim缓存,利用vim缓存知识: 使用vim时会创建临时缓存文件,关闭vim时缓存文件则会被删除。vim异常…

submit使用share buffer传参问题及解决办法

有个程序,因为处理逻辑复杂,时间长,所以启用了job。 本来是直接把耗时的核心函数 in background。 但是这种情况有个麻烦,不方便检查报错信息,只能用SM58监控。 所以改为了open job submit program。因为可以sm37查看…

修改c盘用户名后的注意

文章目录 修改C盘及相关配置形成原因修改用户名和文件夹名解决软件双击无法打开问题修改其它相关注册表修改环境变量的内容 修改C盘及相关配置 形成原因 曾修改过文件夹,具体哪个文件夹,待会会有所参透 由于我感觉自己的用户文件夹不是太好看&#xff…

抛弃繁琐、提高效率:低代码工具助你飞速开发 | 开源专题 No.42

supabase/supabase Stars: 56.9k License: Apache-2.0 Supabase 是一个开源的 Firebase 替代品,使用企业级开源工具构建了 Firebase 的功能。其主要功能包括: 托管 Postgres 数据库身份验证和授权自动生成 API (支持 REST 和 GraphQL)实时订阅函数 (包…

只用C语言解决环形链表的约瑟夫问题

事情起因与我的老师把答卷发错了,大家都把C学完了而我刚学到数据结构还在吃奶的阶段,就让我遇到他了,所以这次只靠C语言的知识不用链表来解决,等我学成C归来再把它做一次 链接:环形链表的约瑟夫问题__牛客网 来源&…

react_13

React Router //-dom代表给浏览器应用使用的 npm install react-router-dom 目前版本是 "react-router-dom": "^6.18.0" 使用 新建文件 src/router/MyRouter.tsx import { Navigate, RouteObject, useRoutes } from "react-router-dom"; imp…

【whisper】在python中调用whisper提取字幕或翻译字幕到文本

最近在做视频处理相关的业务。其中有需要将视频提取字幕的需求,在我们实现过程中分为两步:先将音频分离,然后就用到了whisper来进行语音识别或者翻译。本文将详细介绍一下whisper的基本使用以及在python中调用whisper的两种方式。 一、whispe…

小程序使用echarts(超详细教程)

小程序使用echarts第一步就是先引用到小程序里面,可以直接从这里下载 文件很多,我们值下载 ec-canvas 就好,下载完成后,直接放在pages同级目录下 index.js 在我们需要的页面的 js 文件顶部引入 // pages/index/index.js impor…

java 数据结构 ArrayList源码底层 LinkedList 底层源码 迭代器底层

文章目录 数据结构总结ArrayList源码底层LinkedList底层源码 迭代器底层 数据结构 对于数据结构我这边只告诉你右边框框里的 栈的特点:后进先出,先进后出,入栈也成为压栈,出栈也成为弹栈 栈就像一个弹夹 队列先进先出后进后出 队列像排队 链表查询满 但是增删快(相对于数组而…

[AUTOSAR][诊断管理][ECU][$85] 设置DTC功能

文章目录 一、简介功能描述应用场景服务请求请求格式请求实例关闭DTC监控(OFF)开启DTC监控(ON)服务响应正响应格式正响应实例负响应NRC支持三、 示例代码85_ctl_dtc_set.c一、简介 功能描述 根据ISO14119-1标准中所述,诊断服务85服务主要用于开启或者停止DTC状态位的更新功能…

紫光同创FPGA编写的8画面分割器演示

适用于板卡型号: 紫光同创PGL50H开发平台(盘古50K开发板) 图(1) 盘古50K开发板 TOP 层逻辑框 图(2) TOP层逻辑框 video_copy_ux 将输入的一路RGB888信号复制成8份,每份画面内容相同,各路颜色有些差异: 第…
最新文章