当前位置:首页>编程日记>正文

Yolo(1)Yolo v1

目录

一、基础理论

优缺点

二、过程

1、对每张图像打格

2、损失函数

2-1、损失函数介绍

2-2、参数介绍 

2-3、注意事项


一、基础理论

步骤1:生成备选框。

步骤2:从备选框中找出物体边框。

Yolo(1)Yolo v1 配图01  

Yolo(1)Yolo v1 配图02

根据像素的突变,进行图像分割,分出不同物体,画出不同颜色的区域,得到备选框(proposal)我们需要寻找的物体也在备选框中,我们需要把它从备选框中找出来

Yolo(1)Yolo v1 配图03

优缺点

Yolo(1)Yolo v1 配图04

二、过程

1、对每张图像打格

图像打格过程中,物体中心落在哪个格子,那个格子就负责预测哪个物体

 Yolo(1)Yolo v1 配图05

Yolo(1)Yolo v1 配图06

Yolo(1)Yolo v1 配图07

Yolo(1)Yolo v1 配图08预测框。(Yolo v1预测2个边框,多预测几个边框,留下最好的那个)

Yolo(1)Yolo v1 配图09置信度(判断是否靠谱)(考虑两方面:(1)是某物体的概率;(2)重合的比例))

Yolo(1)Yolo v1 配图10是某物体的概率。 (最后结果在0~1之间) 

Yolo(1)Yolo v1 配图11交并比重合部分越高,交并比越大) 

得到的Bounding Box五维数据:x、y、w、h、confidence。(横、纵坐标、宽、高、置信度)

Yolo(1)Yolo v1 配图12 (B不一定得是2)

 以上的五个数据分别为:width * height * (5维 * Box数量B + Confidence)

2、损失函数

由于上面有3个物体,所以获取3个中心:

Yolo(1)Yolo v1 配图13

2-1、损失函数介绍

损失函数坐标损失(Coordinate loss)、置信度损失(Confidence loss)、分类损失(Classification loss)

Yolo(1)Yolo v1 配图14

Yolo(1)Yolo v1 配图15

Yolo(1)Yolo v1 配图16   

上述4个式子分别计算:坐标、 大小、物体、背景、分类概率的loss

(这里)误差 = 预测 - 真实

2-2、参数介绍 

Yolo(1)Yolo v1 配图17

Yolo(1)Yolo v1 配图18

Yolo(1)Yolo v1 配图19(IoU:交并比)

 object:学习物体: Yolo(1)Yolo v1 配图20

no object:学习背景Yolo(1)Yolo v1 配图21

2-3、注意事项

注:

1、(2)式用根号压缩物体的原因:

        小物体和大物体的差距过大,尽可能压缩减小差距。(不压缩的话,loss会被大物体严重影响)

2、(4)式noobject(背景)原因:

        增强泛化能力。除了要学习物体的信息,我们还需要学习背景信息(有时候背景中可能有和原物体比较像的物体,但不是原物体,为了加以区分)(学习非物体的东西,提高泛化能力)。

3、(4)式加Yolo(1)Yolo v1 配图22的原因:

        为了减小背景的权重,因为背景通常更大,实际物体更小,所以背景会产生更多的损失。这样会导致网络去学习产生大loss的因素,即侧重于学习背景,而忽略掉学习物体的特征,这不是我们想要的。


http://www.coolblog.cn/news/017284b09f7d78e1.html

相关文章:

  • asp多表查询并显示_SpringBoot系列(五):SpringBoot整合Mybatis实现多表关联查询
  • s7day2学习记录
  • 【求锤得锤的故事】Redis锁从面试连环炮聊到神仙打架。
  • 矿Spring入门Demo
  • 拼音怎么写_老师:不会写的字用圈代替,看到孩子试卷,网友:人才
  • Linux 实时流量监测(iptraf中文图解)
  • Win10 + Python + GPU版MXNet + VS2015 + RTools + R配置
  • 美颜
  • shell访问php文件夹,Shell获取某目录下所有文件夹的名称
  • 如何优雅的实现 Spring Boot 接口参数加密解密?
  • LeCun亲授的深度学习入门课:从飞行器的发明到卷积神经网络
  • Mac原生Terminal快速登录ssh
  • java受保护的数据与_Javascript类定义语法,私有成员、受保护成员、静态成员等介绍...
  • mysql commit 机制_1024MySQL事物提交机制
  • 支撑微博千亿调用的轻量级RPC框架:Motan
  • jquery 使用小技巧
  • 2019-9
  • 法拉利虚拟学院2010 服务器,法拉利虚拟学院2010
  • vscode pylint 错误_将实际未错误的py库添加到pylint白名单
  • 科学计算工具NumPy(3):ndarray的元素处理
  • 工程师在工作电脑存 64G 不雅文件,被公司开除后索赔 41 万,结果…
  • linux批量创建用户和密码
  • newinsets用法java_Java XYPlot.setInsets方法代碼示例
  • js常用阻止冒泡事件
  • 气泡图在开源监控工具中的应用效果
  • 各类型土地利用图例_划重点!国土空间总体规划——土地利用
  • php 启动服务器监听
  • dubbo简单示例
  • 【设计模式】 模式PK:策略模式VS状态模式
  • [iptables]Redhat 7.2下使用iptables实现NAT
  • Ubuntu13.10:[3]如何开启SSH SERVER服务
  • CSS小技巧——CSS滚动条美化
  • JS实现-页面数据无限加载
  • 阿里巴巴分布式服务框架 Dubbo
  • 最新DOS大全
  • Django View(视图系统)
  • 阿里大鱼.net core 发送短信
  • 程序员入错行怎么办?
  • 两张超级大表join优化
  • 第九天函数
  • Linux软件安装-----apache安装
  • HDU 5988 最小费用流
  • Sorenson Capital:值得投资的 5 种 AI 技术
  • 《看透springmvc源码分析与实践》读书笔记一
  • 正式开课!如何学习相机模型与标定?(单目+双目+鱼眼+深度相机)
  • Arm芯片的新革命在缓缓上演
  • nagios自写插件—check_file
  • python3 错误 Max retries exceeded with url 解决方法
  • 行为模式之Template Method模式
  • 通过Spark进行ALS离线和Stream实时推荐