inverted_residual
创始人
2025-05-31 12:50:46
0

1. 线性BottleNect

线性瓶颈是在 MobileNetV2: Inverted Residuals 中引入的。

线性瓶颈块是不包含最后一个激活的瓶颈块。

在论文的第 3.2 节中,他们详细介绍了为什么在输出之前存在非线性会损害性能。

简而言之:非线性函数 Line ReLU 将所有 < 0 设置为 0会破坏信息。根据经验表明,当输入的通道小于输出的通道时删除最后的激活函数是正确的。所以只要删除 BottleNeck 中的 nn.ReLU 即可。

首先说明一下ReLU6,卷积之后通常会接一个ReLU非线性激活,在Mobile v1里面使用ReLU6,ReLU6就是普通的ReLU但是限制最大输出值为6(对输出值做clip),这是为了在移动端设备float16的低精度的时候,也能有很好的数值分辨率,如果对ReLU的激活范围不加限制,输出范围为0到正无穷,如果激活值非常大,分布在一个很大的范围内,则低精度的float16无法很好地精确描述如此大范围的数值,带来精度损失。

本文提出,最后输出的ReLU6去掉,直接线性输出,理由是:ReLU变换后保留非0区域对应于一个线性变换,仅当输入低维时ReLU能保留所有完整信息。

在看MobileNet v1的时候,我就疑问为什么没有把后面的ReLU去掉,因为Xception已经实验证明了Depthwise卷积后再加ReLU效果会变差,作者猜想可能是Depthwise输出太浅了应用ReLU会带来信息丢失,而MobileNet还引用了Xception的论文,但是在Depthwise卷积后面还是加了ReLU。在MobileNet v2这个ReLU终于去掉了(非紧邻,最后的ReLU),并用了大量的篇幅来说明为什么要去掉(各种很复杂的证明,你不会想自己推一遍的= =,从理论上说明了去掉ReLU的合理性)。

总之,结论就是最后那个ReLU要去掉,效果更好。

参考:
https://blog.csdn.net/deephub/article/details/124684557#t3

相关内容

热门资讯

教育部:推动有条件的地方优化学... 11月11日消息,在教育部今天举行的新闻发布会上,教育部基础教育司相关负责人介绍,将进一步提高学前教...
习近平向意大利总统马塔雷拉赠送... 11月11日消息,2024年11月8日晚,国家主席习近平在北京人民大会堂向意大利总统马塔雷拉赠送嫦娥...
Sora概念股震荡走强,昆仑万... 11月11日消息,昆仑万维涨超10%,易点天下此前涨停,新华网、开普云、万兴科技、因赛集团涨超5%,...
信创概念反复活跃,三六零、中兴... 11月11日消息,信创概念反复活跃,三六零、中兴通讯、云赛智联、用友网络、金桥信息等多股涨停,麒麟信...
光伏板块反复走强,爱旭股份2连... 11月11日消息,光伏板块反复走强,爱旭股份2连板,迈为股份、英杰电气涨超10%,晶盛机电、帝尔激光...
财经调查丨大量“工艺皮”冒充新... (央视财经《财经调查》)总台《财经调查》栏目接到群众举报,反映陈皮市场存在年份虚标、产地及工艺造假等...
持续保障和改善民生,让老百姓收... 本文来源:时代周报 作者:迟雨中央经济工作会议12月10日至11日在北京举行。会议明确了明年经济工作...
亏损1.2亿,再换 CEO,知... 订阅 快刀财经 ▲ 做您的私人商学院大润发换帅,盒马前高管接任。作者:程信来源:赢销力(ID:yin...
哇,狠心拒绝了金主... 图:Andrea Ucini去上普拉提课。我之前买的50节课全部用完,该续费了。这回再充50节课,小...
14.5亿借款再展期,新希望败... 从“白衣骑士”变“债主”,新希望为何没能治好兴源环境?作者 | 于婞编辑丨高岩来源 | 野马财经六年...