(三)目标检测中的几种框【anchor,bbox,先验框,网格单元,ROI,proposal,DenseBox】

news/2024/2/28 18:33:28

文章目录

    • bbox(bounding box)
    • anchor
      • 怎么确定候选框中是否包含目标?
      • 怎么筛选Anchor?
    • grid cell(网格单元)

bbox(bounding box)

  Bbox是BoundingBox(边界框)的缩写,指的是目标检测中用于表示物体位置和大小的有向矩形框。通常情况下爱,对于一张图像中的每个目标物体,在训练集中都会预先标注一个对应的Bbox,即表表示该物体在图像中的位置和大小。
  在模型预测时,通过对图像中多个位置或尺度的Bbox进行检测,可以识别出图像中包含的目标物体。
  在目标检测算法中,Bbox与Anchor框紧密相关,因为Anchor框通常作为预定义的候选框用于捕获可能包含目标的区域。而在Anchor框生成的候选框中,通过进一步筛选和调整,可以得到最终的目标BBox。
  因此,Bbox通常也被称为检测框,因为它是表示目标位置和大小的一种重要方式。

anchor

  Anchor是由Bbox筛选得到的。
  Anchor和BBox在目标检测中的作用不同。
  Anchor通常是一组预定的候选框,用来在输入图像上确定可能包含目标物体的位置。具体地说,通常在图像上生成一系列大小和长宽比不同的Anchor框,然后与目标物体进行匹配和调整,最终得到包含目标的候选框。
 更具体的说,模型通过比较Anchor和真实目标框之间的IOU(交并比)来确定哪些Anchor框包含目标,以及如何调整Anchor框来更高的拟合目标。因此Anchor框可以被视为候选框,因为它们是用来找到可能包含目标的区域的。

怎么确定候选框中是否包含目标?

  一般首先通常根据训练集中目标物体的大小和形状等信息进行预先设置。可以通过聚类技术(K-means聚类)来确定Anchor框的数量和大小。(聚类过程:可以先将训练集中所有目标物体的边界框进行聚类,得到若干个聚类中心,并将这些聚类中心作为Anchor框;)然后,在训练过程中,模型会根据Anchor框预测目标物体的位置和置信度,从而实现检测功能。
  一般来说,在检测过程中,如果一个Anchor框的置信度得到比较高(通常超过一个设定的阈值),则认为该框内包含目标物体。

怎么筛选Anchor?

  由于同一个目标物体可能会被多个Anchor框检测到,因此需要进行非极大值抑制(NMS)处理,去除重复检测结果,从而得到最终的检测结果。

grid cell(网格单元)


http://www.ppmy.cn/news/464798.html

相关文章

夏普打印机SHARP MX-2018UC 发生错误,错误代码:H3-00 解决办法

打印机型号:夏普打印机SHARP MX-2018UC 开机屏幕提示错误:发生错误,错误代码:H3-00 解决办法:连续按键 p*c*,出现英文,按14,按复印键,点击yes,重启机器。 问…

嵌入式设计及Linux驱动开发指南——基于ARM9处理器

嵌入式设计及Linux驱动开发指南——基于ARM9处理器 读书笔记 第一章嵌入式系统基础 1、 嵌入式系统定义: “嵌入式系统是用来控制或者监视机器、装置、工厂等大规模系统的设备。” ——电气工程师协会   “嵌入到对象体系中的专用计算机系统” ——…

盘点CES2015上的TV大咖:4K显示百花齐发

4K电视对于现在的消费者来说已经不再是个陌生的名词,从OLED到SUHD到被灵活分割的各种像素,2015年的CES充满了最前沿的电视技术。本届 CES 展上,各大厂商相继推出了多款电视,下面就让我们盘点一下出现在CES上的电视新品&#xff1a…

算法预测“排尿”、打游戏治中风...科技如何应对老龄化危机?

硅谷Live / 实地探访 / 热点探秘 / 深度探讨 近年来,不论是人口老龄化问题突出的欧美日韩,还是马上迎来老龄化挑战的经济大国中国,全世界都不能再忽视人口老龄化带来的社会问题。 以美国为例:美国健康局人口普查局 2018 的数据显示…

常见编程/框架介绍

文章大纲 一、C/C二、C#三、cocos2d-x四、go语言五、Hadoop六、HBase七、PHP八、python九、Spark十、Storm十一、Unity3D十二、Java十三、Android十四、Object-C与swift十五、.NET十六、R语言 一、C/C 1. 简介 C语言是目前世界上流行、使用最广泛的高级程序设计语言。C语言对操…

linux基础指令及文件说明(附实例题目 非常详细)

linux基础指令及文件说明 目录计算机基础知识linux基础文件介绍及指令远程连接 修改密码破解密码 文件相关时间命令FHS、目录shell 文本编辑vim用户和组文件压缩和解压文件权限磁盘分区综合实验: 目录 计算机基础知识 计算机由哪些硬件组成: 输入设备&…

liunx基础知识篇 偏指令

计算机由哪些硬件组成: 输入设备:键盘,鼠标,触摸屏,扫描仪,麦克风 输出设备:显示屏,打印机,音响 存储器:内存 运算器 控制器 计算机的种类:pc&…

Cocos Creator3D:制作可任意拉伸的 UI 图像

推荐:将 NSDT场景编辑器 加入你的3D工具链 3D工具集: NSDT简石数字孪生 制作可任意拉伸的 UI 图像 UI 系统核心的设计原则是能够自动适应各种不同的设备屏幕尺寸,因此我们在制作 UI 时需要正确设置每个控件元素的尺寸(size&#…

RTTHREAD 软件包目录(实时更新)

RTTHREAD 软件包目录 ai 包名作者license备注elapackwuhanstudioMIT嵌入式线性代数库,兼容 matlablibannwuhanstudioMIT轻量级 ANN 库,可以训练,保存和导入模型naxoswuhanstudioLGPL-3.0C Constraint Programming 库nnomJianjia MaApache-2…

【手把手教你】使用pyfinance进行证券收益分析

pyfinance简介 在查找如何使用Python实现滚动回归时,发现一个很有用的量化金融包——pyfinance。顾名思义,pyfinance是为投资管理和证券收益分析而构建的Python分析包,主要是对面向定量金融的现有包进行补充,如pyfolio和pandas等。…

基于百度指数的股票收益率多因子模型研究

基于百度指数的股票收益率多因子模型研究 导语数据获取基于qdata获取百度指数基于efiance获取股票数据数据集合并运行数据获取 数据处理可视化分析各百度指数间相关性分析话题热度时间及股票收益率总览话题热度分布相关话题热度与股票股价及收益率的关系图 多因子模型的搭建CAP…

人工智能基础(高中版)教材补充和资源分享之二 机器人学矩阵

关于书中对应各章节的要点,稍晚些时候补充,这里先给出汤晓鸥教授和陈玉琨教授的一些点评,我个人读后收获非常大。 .参考:https://www.ithome.com/html/it/345470.htm .参考:http://epaper.oeeee.com/epaper/H/html/201…

如何制作启动卡

一、Linux下SD卡设备 示例:插上读卡器,在linux下找到sd卡及读卡器设备: rootwsl-VirtualBox:~# cat /proc/partitionsSD卡的设备文件节点是:/dev/sdb 二、删除sd卡分区 rootwsl-VirtualBox:~# sudo fdisk /dev/sdb输入&#…

高效处理大地测量数据的神器:FaultResampler——基于数据质量和断层平面位置优化故障滑动反演分辨率的解析与实践

大家好,我是一名热衷于科研和技术分享的作者。近期在进行大地测量数据处理的工作中,我发现了一个非常有趣且实用的工具——FaultResampler。本文将深入解析FaultResampler的工作原理,并通过实例代码详细介绍如何使用它来优化故障滑动反演的分…

5.3.4 因特网的路由协议(四)BGP协议

5.3.4 因特网的路由协议(四)BGP协议 我们学习的RIP协议(5.3.2 因特网的路由协议(二)基于距离向量算法的RIP协议)和OSPF协议(5.3.3 因特网的路由协议(三)OSPF协议&#x…

tplink8620变无线打印服务器,TP-Link TL-WDR8620 V2 无线路由器无线设备接入控制设置【图文】...

越洋帮路由网原创:文章是关于"TP-Link TL-WDR8620 V2 无线路由器无线设备接入控制设置【图文】"的相关知识分享,希望可以帮到大家。 - 素材来源网络 编辑:小易。 1、进入设置界面 登录路由器管理界面,点击“应用管理”,…

海思hi35xx 开发学习(3):视频输入

视频输入(VI)模块实现的功能:通过 MIPI Rx(含 MIPI 接口、LVDS 接口和 HISPI 接口),SLVS-EC,BT.1120,BT.656,BT.601,DC 等接口接收视频数据。VI 将接收到的数据存入到指定的内存区域…

支持APP的打印服务器,TP-LINK双频无线路由器打印服务器客户端软件

TP-LINK双频无线路由器打印服务器客户端软件是一款双频无线路由器的USB口可以共享打印机查询软件,满足局域网主机的打印需求,然后在路由器管理界面菜单“网络共享”-“打印服务器”中将打印服务器状态确认为“在线”。 软件说明 1、适用TL-WDR3300 V1.0、…

tplink android管理软件,tplink手机app下载

tplink手机版是tplink官方为用户打造的手机端路由器管理软件,用户可以使用手机快速对路由器进行设置,还能用过tplink id对路由器进行远程管理,获取路由器实时信息,保护路由器安全。欢迎来试用软件。 tplinkapp简介: 用…

***wr学姐的小调查***

wr学姐的小调查 原题链接https://nuoyanli.com/contest/25/problem/E 一个简单的结构体 4个数据记录姓名出生年月日 然后排序输出 注意是生日相同时输出靠后的学长学姐先输出 为了这一条件我使用的是新加入一个结构体记录姓名的输入顺序。 #include<cstdio> #include&l…
最新文章