其他分享
首页 > 其他分享> > [图像分类]论文笔记VovNet(专注GPU计算、能耗高效的网络结构)

[图像分类]论文笔记VovNet(专注GPU计算、能耗高效的网络结构)

作者:互联网

[图像分类]论文笔记VovNet(专注GPU计算、能耗高效的网络结构)

李志伟 李志伟 公众号:lizhiwei  

论文链接:An Energy and GPU-Computation Efficient Backbone Network for Real-Time Object Detection

 

1. 简介

2. 高效网络设计要素 Factors of Efficient Network Design

根据shuffleNet v2,减小flops和model size并不能保证GPU运算时间的减少。比如,shuffleNet v2和mobileNet v2有类似的计算量(FLOPS),但是前者比后者快, squeezeNet虽然比VGG少了50倍的参数量,但是它比VGG能耗更多。那么哪些是影响GPU运算效率和能耗的因素呢?

2.1. Memory Access Cost (MAC)

2.2. GPU-Computation Efficiency

3. Proposed Method

3.1. Rethinking Dense Connection

3.2. One-Shot Aggregation

4. Experiments

实验1: VoVNet vs. DenseNet. 对比不同backbone下的目标检测模型性能(PASCALVOC)

 

 

另外,PeleeNet是通过把dense block拆分为更小的dense block实现flops减少的。由此,可以推断把dense block分解为小片段的计算并不利于GPU运算。

实验2:Ablation study on 1×1 conv bottleneck.

结论2:可以看出,1x1 bottleneck增加了GPU Inference时间,降低了mAP,尽管它减少了参数数量和计算量。

因为1x1 bottleneck增加网路层数,要求更多的激活层,因为增加了内存占用。

实验3: GPU-Computation Efficiency.

# 这里的能耗计算不知道怎么进行的

实验室4:基于RefineDet架构比较VoVNet、ResNet和DenseNet

结论4:从COCO数据集测试结果看,相比于ResNet,VoVnet在Inference速度,内存占用,能耗,GPU使用率和准确率上都占据优势。尽管很多时候,VoVNet需要更多的计算量以及参数量。

实验5:Mask R-CNN from scratch
我们通过替换Mask R-CNN的backbone,也发现VoVNet在Inference速度和准确率上优于ResNet.

标签:能耗,VoVNet,DenseNet,feature,计算,GPU,网络结构,VovNet
来源: https://www.cnblogs.com/shuimuqingyang/p/14273963.html