inverted_residual

创始人

2025-05-31 12:50:46

0次

1. 线性BottleNect

线性瓶颈是在 MobileNetV2: Inverted Residuals 中引入的。

线性瓶颈块是不包含最后一个激活的瓶颈块。

在论文的第 3.2 节中，他们详细介绍了为什么在输出之前存在非线性会损害性能。

简而言之：非线性函数 Line ReLU 将所有 < 0 设置为 0会破坏信息。根据经验表明，当输入的通道小于输出的通道时删除最后的激活函数是正确的。所以只要删除 BottleNeck 中的 nn.ReLU 即可。

首先说明一下ReLU6，卷积之后通常会接一个ReLU非线性激活，在Mobile v1里面使用ReLU6，ReLU6就是普通的ReLU但是限制最大输出值为6（对输出值做clip），这是为了在移动端设备float16的低精度的时候，也能有很好的数值分辨率，如果对ReLU的激活范围不加限制，输出范围为0到正无穷，如果激活值非常大，分布在一个很大的范围内，则低精度的float16无法很好地精确描述如此大范围的数值，带来精度损失。

本文提出，最后输出的ReLU6去掉，直接线性输出，理由是：ReLU变换后保留非0区域对应于一个线性变换，仅当输入低维时ReLU能保留所有完整信息。

在看MobileNet v1的时候，我就疑问为什么没有把后面的ReLU去掉，因为Xception已经实验证明了Depthwise卷积后再加ReLU效果会变差，作者猜想可能是Depthwise输出太浅了应用ReLU会带来信息丢失，而MobileNet还引用了Xception的论文，但是在Depthwise卷积后面还是加了ReLU。在MobileNet v2这个ReLU终于去掉了（非紧邻，最后的ReLU），并用了大量的篇幅来说明为什么要去掉（各种很复杂的证明，你不会想自己推一遍的= =，从理论上说明了去掉ReLU的合理性）。

总之，结论就是最后那个ReLU要去掉，效果更好。

参考：
https://blog.csdn.net/deephub/article/details/124684557#t3

词库加载错误:未能找到文件“E:\highferrum_mysql\Configuration\Dict_Stopwords.txt”。

上一篇：Apache DophinScheduler 定时调度Python脚本

下一篇：2023系统分析师-企业信息化战略与实施

相关内容

热门资讯

教育部：推动有条件的地方优化学... 11月11日消息，在教育部今天举行的新闻发布会上，教育部基础教育司相关负责人介绍，将进一步提高学前教...

习近平向意大利总统马塔雷拉赠送... 11月11日消息，2024年11月8日晚，国家主席习近平在北京人民大会堂向意大利总统马塔雷拉赠送嫦娥...

Sora概念股震荡走强，昆仑万... 11月11日消息，昆仑万维涨超10%，易点天下此前涨停，新华网、开普云、万兴科技、因赛集团涨超5%，...

信创概念反复活跃，三六零、中兴... 11月11日消息，信创概念反复活跃，三六零、中兴通讯、云赛智联、用友网络、金桥信息等多股涨停，麒麟信...

光伏板块反复走强，爱旭股份2连... 11月11日消息，光伏板块反复走强，爱旭股份2连板，迈为股份、英杰电气涨超10%，晶盛机电、帝尔激光...

财经调查丨大量“工艺皮”冒充新... （央视财经《财经调查》）总台《财经调查》栏目接到群众举报，反映陈皮市场存在年份虚标、产地及工艺造假等...

持续保障和改善民生，让老百姓收... 本文来源：时代周报作者：迟雨中央经济工作会议12月10日至11日在北京举行。会议明确了明年经济工作...

亏损1.2亿，再换 CEO，知... 订阅快刀财经 ▲ 做您的私人商学院大润发换帅，盒马前高管接任。作者：程信来源：赢销力（ID：yin...

哇，狠心拒绝了金主... 图：Andrea Ucini去上普拉提课。我之前买的50节课全部用完，该续费了。这回再充50节课，小...

14.5亿借款再展期，新希望败... 从“白衣骑士”变“债主”，新希望为何没能治好兴源环境？作者 | 于婞编辑丨高岩来源 | 野马财经六年...