inverted_residual
创始人
2025-05-31 12:50:46
0

1. 线性BottleNect

线性瓶颈是在 MobileNetV2: Inverted Residuals 中引入的。

线性瓶颈块是不包含最后一个激活的瓶颈块。

在论文的第 3.2 节中,他们详细介绍了为什么在输出之前存在非线性会损害性能。

简而言之:非线性函数 Line ReLU 将所有 < 0 设置为 0会破坏信息。根据经验表明,当输入的通道小于输出的通道时删除最后的激活函数是正确的。所以只要删除 BottleNeck 中的 nn.ReLU 即可。

首先说明一下ReLU6,卷积之后通常会接一个ReLU非线性激活,在Mobile v1里面使用ReLU6,ReLU6就是普通的ReLU但是限制最大输出值为6(对输出值做clip),这是为了在移动端设备float16的低精度的时候,也能有很好的数值分辨率,如果对ReLU的激活范围不加限制,输出范围为0到正无穷,如果激活值非常大,分布在一个很大的范围内,则低精度的float16无法很好地精确描述如此大范围的数值,带来精度损失。

本文提出,最后输出的ReLU6去掉,直接线性输出,理由是:ReLU变换后保留非0区域对应于一个线性变换,仅当输入低维时ReLU能保留所有完整信息。

在看MobileNet v1的时候,我就疑问为什么没有把后面的ReLU去掉,因为Xception已经实验证明了Depthwise卷积后再加ReLU效果会变差,作者猜想可能是Depthwise输出太浅了应用ReLU会带来信息丢失,而MobileNet还引用了Xception的论文,但是在Depthwise卷积后面还是加了ReLU。在MobileNet v2这个ReLU终于去掉了(非紧邻,最后的ReLU),并用了大量的篇幅来说明为什么要去掉(各种很复杂的证明,你不会想自己推一遍的= =,从理论上说明了去掉ReLU的合理性)。

总之,结论就是最后那个ReLU要去掉,效果更好。

参考:
https://blog.csdn.net/deephub/article/details/124684557#t3

相关内容

热门资讯

基于springboot教师人... 基于springboot教师人事档案管理系统【源码+论文】 开发语言:Jav...
编写软件界面的方式 本文重点解决如下问题:编写软件的界面有哪几种方式?通常情形下࿰...
keil调试专题篇 调试的前提是需要连接调试器比如STLINK。 然后点击菜单或者快捷图标均可进入调试模式。 如果前面...
GO语言小锤硬磕十三、数组与切... 数组用来保存一组相同类型的数据,go语言数组也分一维数组和多维数组。 直接上代码看一下...
三级数据库备考--数据库应用系... 1.数据库应用系统设计包括概念设计、逻辑设计、物理设计3个步骤,每个步骤的设计活动按照...
prometheus数据持久化... https://segmentfault.com/a/1190000015710814 promet...
孩子用什么样的灯对眼睛没有伤害... 现代社会高速发展,越来越多的人开始重视身体健康,尤其是很多家长ÿ...
微软Bing GPT支持AI绘... 我想要一张图片:大象、珊瑚、火山、云朵我想要一张图片:亚特兰蒂斯...
最新!5月IPO受理数创今年新... IPO市场新动态。5月30日,共有4家IPO企业获得受理,其中创业板打破今年“0受理”现象,迎来首批...
Stable diffusio... Stable Diffusion是对Latent Diffusion模型的改进,主要在以下方面进行了...
Linux命令_lsof 网... 官方描述         一个打开的文件可以是一个常规文件、一个目录、一个块特殊文件、一个字符特殊...
树状数组(区间维护/单点修改) 1,定义 数组数组用于维护区间信息,简洁的几行的代码可以单点操作/区间查...
Junit4 + Mockit... ​ 实战代码案例: 1,引入依赖 org.spr...
Linux 增加用户 user... 在Linux中增加用户是用useradd指令指令基本选项useradd [option] usern...
2023年全国最新安全员精选真... 百分百题库提供安全员考试试题、建筑安全员考试预测题、建筑安全员ABC考试真题、安全员证考试题库等&#...
将 ChatGPT 与 实时聊... 人工智能技术是聊天营销人员的福音,而ChatGPT是这场革命的突破性新成员。人工智能工...
网络安全文章汇总导航(持续更新... 网络安全文章汇总导航(持续更新)1.基础篇(已完结...
8万字城市大脑综合运行管理平台... 本资料来源公开网络,仅供个人学习,请勿商用,如有侵权请联系...
SGCF:Simplifyin... 一、前言 1、摘要 传统模型在使用大型图上的非线性激活进行训练时面临困难。此外,由于图...
136. 只出现一次的数字 总结 异或位运算方法 给你一个非空整数 nums ,除了某个元素只出现一次以外&#x...