基于机器视觉的乳液泵缺陷检测方法研究

Valencia ·

更新时间:2024-09-21

· 864 次阅读

样本分布 数据增强 队伍方案 Faster-RCNN+FPN+Multi-stage traing method+Scale Normalization for training+cascade RCNN Faster-RCNN+FPN+DCN+ROI Align+anchor(5:1)+OHEM(batch级别)+Soft-NMS+投票平均 Faster-RCNN+FPN+kmeans+ROIAlign+Soft-NMS Faster-RCNN+FPN+Coco预训练+multi-train/test Faster-RCNN+FPN+ROI Align+Soft-NMS+box-voting+multi scale+box stacking+Soft-NMS Faster-RCNN+FPN+DCN+Contextual ROI Pooling+OHEM+Soft-nms Faster-RCNN+FPN+Dilate convolution+dual path aggregation for object detection+MLRP+SWA+HFE Faster-RCNN+FPN+Dilation/deformable+roi align+focal loss+rcf-net+SWA(同类模型融合)/DCN+G-R-CNN(不同类模型的融合) Baseline

Faster-RCNN+FPN+Dilation/DCN+ROI Align+Coco预训练+Focal Loss+Soft-NMS+投票平均+OHEM(batch级别)

1 Faster-RCNN

(1)输入测试图像；

(2)将整张图片输入CNN，进行特征提取；

(3)用RPN生成建议窗口(proposals)，每张图片生成300个建议窗口；

(4)把建议窗口映射到CNN的最后一层卷积feature map上；

(5)通过RoI pooling层使每个RoI生成固定尺寸的feature map；

(6)利用Softmax Loss(探测分类概率) 和Smooth L1 Loss(探测边框回归)对分类概率和边框回归(Bounding box regression)联合训练.
在这里插入图片描述

1.1 Conv layers

包含了conv，pooling，relu三种层

1.1.1 VGG

Conv layers部分共有13个conv层，13个relu层，4个pooling层。这里有一个非常容易被忽略但是又无比重要的信息，在Conv layers中：

所有的conv层都是： kernel_size=3kernel\_size=3kernel_size=3 ， pad=1pad=1pad=1 ，stride=1stride=1stride=1 所有的pooling层都是： kernel_size=2kernel\_size=2kernel_size=2 ， pad=0pad=0pad=0 ， stride=2stride=2stride=2 Conv layers中的conv层不改变输入和输出矩阵大小
在这里插入图片描述

1.2 Region Proposal Networks(RPN)

在这里插入图片描述

遍历Conv layers计算获得的feature maps，为每一个点都配备这9种anchors作为初始的检测框，检测框不准确，还需要精修。

在原文中使用的是ZFmodel中，其Conv Layers中最后的conv5层num_output=256，对应生成256张特征图，相当于一张feature map每个点用256-D的特征表示。由于输入图像M=800，N=600，且Conv Layers做了4次Pooling，feature map的长宽为[M/16, N/16]=[50, 38] 在conv5之后，做了rpn_conv/3x3卷积，num_output=256，相当于每个点使用了周围3x3的空间信息，同时256-d不变，如图3红框，同时对应图4中的红框中的3x3卷积假设一共有k个anchor，而每个anhcor要分foreground和background，所以cls=2k scores；而每个anchor都有[x, y, w, h]对应4个偏移量，所以reg=4k coordinates

在这里插入图片描述

第一个支路：18表示2∗92*92∗9，foreground和background，9个锚框 caffe的数据结构：blob=[batch_size, channel，height，width] reshape前在caffe blob中的存储形式为[1, 18, H, W] reshape后在caffe blob中的存储形式为[1, 2, 9*H, W]，单独“腾空”出来一个维度以便softmax分类经过softmax后再reshape恢复原状第二个支路：36表示4∗94*94∗9，[x, y, w, h]对应4个偏移量，9个锚框

其实RPN就是在原图尺度上，设置了密密麻麻的候选Anchor。然后用cnn去判断哪些Anchor是里面有目标的foreground anchor，哪些是没目标的backgroud，仅仅是个二分类。

anchor

原图800x600，VGG下采样16倍，feature map每个点设置9个Anchor：
在这里插入图片描述
其中ceil()表示向上取整，是因为VGG输出的feature map size= 50*38。

1.3 bounding box regression

绿色框为飞机的Ground Truth(GT)，红色为提取的foreground anchors，即便红色的框被分类器识别为飞机，但是由于红色的框定位不准，这张图相当于没有正确的检测出飞机。所以我们希望采用一种方法对红色的框进行微调，使得foreground anchors和GT更加接近。
在这里插入图片描述
对于窗口一般使用四维向量 (x,y,w,h)(x, y, w, h)(x,y,w,h)表示，分别表示窗口的中心点坐标和宽高。红色的框A代表原始的Foreground Anchors，绿色的框G代表目标的GT，我们的目标是寻找一种关系，使得输入原始的anchor A经过映射得到一个跟真实窗口G更接近的回归窗口G’。

给定：anchorA=(Ax,Ay,Aw,Ah)anchor A=(A_{x}, A_{y}, A_{w}, A_{h})anchorA=(Ax,Ay,Aw,Ah) 和 GT=[Gx,Gy,Gw,Gh]GT=[G_{x}, G_{y}, G_{w}, G_{h}]GT=[Gx,Gy,Gw,Gh]

寻找一种变换F，使得：F(Ax,Ay,Aw,Ah)=(Gx′,Gy′,Gw′,Gh′)F(A_{x}, A_{y}, A_{w}, A_{h})=(G_{x}^{'}, G_{y}^{'}, G_{w}^{'}, G_{h}^{'})F(Ax,Ay,Aw,Ah)=(Gx′,Gy′,Gw′,Gh′)，其中(Gx′,Gy′,Gw′,Gh′)≈(Gx,Gy,Gw,Gh)(G_{x}^{'}, G_{y}^{'}, G_{w}^{'}, G_{h}^{'})≈(G_{x}, G_{y}, G_{w}, G_{h})(Gx′,Gy′,Gw′,Gh′)≈(Gx,Gy,Gw,Gh)
在这里插入图片描述

平移(Δx,Δy)(\Delta x,\Delta y)(Δx,Δy)

水平方向：Δx=Awdx(A)⇀Gx′=Ax+Δx\Delta x=A_{w}d_{x}(A)\rightharpoonup G^{'}_{x}=A_{x}+\Delta xΔx=Awdx(A)⇀Gx′=Ax+Δx 竖直方向：Δy=Awdy(A)⇀Gy′=Ay+Δy\Delta y=A_{w}d_{y}(A)\rightharpoonup G^{'}_{y}=A_{y}+\Delta yΔy=Awdy(A)⇀Gy′=Ay+Δy

尺度缩放

宽度：Gw′=Awe(dw(A))G^{'}_{w}=A_{w}e^{(d_{w}(A))}Gw′=Awe(dw(A)) 高度：Gh′=Ahe(dh(A))G^{'}_{h}=A_{h}e^{(d_{h}(A))}Gh′=Ahe(dh(A))

当Anchor与Ground Truth 相差较少时（RCNN设置Iou是0.6），可以认为变换是一种线性变换，所以可以用线性回归对建模进行微调。

FPN
作者：爱弹ukulele的程序猿

检测方法机器视觉方法

1024 个赞

编辑举报

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

Laravel 中使用简单的方法跟踪用户是否在线(推荐)

Serwa 2020-03-20

874

微信推送功能实现方式图文详解

Mangena 2021-04-28

635

CentOS 7下安装Nginx服务器

Scarlett 2020-10-16

589

docker网卡的IP地址修改方法总结

Rae 2023-07-22

1847

docker命令中必须加上sudo的问题解决方法

Rhoda 2023-07-22

1038

Elasticsearch/Kibana密码设置方法

Hester 2023-07-22

1081

docker查询日志并输出到文件的方法

Grace 2023-07-22

1029

docker容器/etc/hosts文件修改方法

Vanna 2023-07-22

1279

docker容器连接宿主机redis与mysql的配置方法

Peony 2023-07-22

1975

Docker镜像之不同服务器间迁移方法大全

Dorothy 2023-07-22

1993

docker容器使用内存大小限制方法

Dulcea 2023-07-22

493

在Linux中列出Systemd下所有正在运行的服务的方法指南

Zandra 2023-07-22

507

一文详解Python中多进程和进程池的使用方法

Serafina 2023-07-24

338

VMware克隆虚拟机并重新设置IP和主机名的实现方法

Kathy 2023-08-08

194

使用nginx.exe时闪退的原因和解决方法

Olivia 2023-08-08

694

阿里云服务IIS搭建Web网站外网无法访问的解决方法

Elina 2023-08-08

897

ssh报错nokeyalg的解决方法(关于低版本连接高版本ssh)

Jacinthe 2023-08-08

339

在没有Docker缓存的情况下构建镜像的方法分享

Viridis 2023-08-08

1779

docker-compose中启动镜像失败的几种解决方法

Hana 2023-08-08

725

Windows服务器默认IE浏览器无法下载文件的解决方法

Cybill 2023-08-08

1355

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。
软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座