行业报告 AI展会数据标注标注供求

主页 > 机器学习 > 正文

国防科大、旷视提出首个在ARM上实时运行的通用

今天跟大家分享一篇前天新出的论文《ThunderNet: Towards Real-time Generic Object Detection》，来自国防科大与旷视的研究团队（孙剑老师在列）提出了较早的能够在移动端ARM芯片实时运行的两阶段通用目标检测ThunderNet（寓意像Thunder雷一样快^_^），并称该算法后续将开源！

以下是作者信息：

论文地址：

https://arxiv.org/pdf/1903.11752v1.pdf

一作为来自国防科大的Zheng Qin和旷视的Zeming Li。

提出问题

目标检测的算法有很多，但要在移动平台，比如手机上的ARM CPU实时还比较难，主流的state-of-the-art目标检测算法无法实时，而一些号称可以跑起来的算法距离state-of-the-art的精度差距太大。

作者希望设计速度快而精度高的算法，满足移动端的部署需求。

下图是该文提出的ThunderNet算法的三个版本与目前轻量级检测网络在COCO test-dev数据集上的精度和计算量的比较图，可见ThunderNet在精度达到或超过之前轻量级检测网络的同时，降低了计算量。

以上均为在CPU上单线程运行结果，MobileNet-SSD运行在骁龙820，MobileNet/MobileNetV2-SSDLite运行在骁龙810，Pelee运行在Intel i7-6700K (4.0 GHz),ThunderNet运行在骁龙845。

算法思想

作者是在经典的两阶段目标检测算法的基础上做的改进。

网络结构如下：

作者分两个方向做了5点改进：

一、改进速度。

1. 使用轻量级、面向目标检测任务设计的骨干网Snet。

网络参数如下：

2. 压缩RPN网络部分，降低候选目标区域生成的时间。

3. R-CNN子网络使用1024维的全连接层，提高速度。

二、改进特征表示的鉴别性。

1. 设计了上下文增强模块CEM结构，它可以有效结合三个尺度的特征图，编码更多的上下文信息，增大感受野，生成更具鉴别性的特征。

2. 设计了空间注意力模块SAM结构，它可以利用RPN中学习到的信息，从上下文增强模块提精特征图的特征分布。

实验结果

作者在VOC 2007 test数据集上的实验结果如下，与现有其他算法相比，在保持高精度同时，计算量也处于较低水平。

下图是在COCO test-dev数据集上与其他算法的比较，同样达到了计算量小精度高的目标。

以下是一些检测结果示例：

在运行速度方面，该算法能到达到与MobileNet-SSD相当的精度，此时在ARM上运行24.1fps，x86上运行47.3fps。使用SNet146骨干网的ThunderNet精度超过YOLOv2，而计算量仅为其1/37。

期待作者早日放出代码！

声明：本文版权归原作者所有，文章收集于网络，为传播信息而发，如有侵权，请联系小编及时处理，谢谢！

微信公众号

时间:2019-04-01 19:19 来源: 转发量:次

声明：本站部分作品是由网友自主投稿和发布、编辑整理上传，对此类作品本站仅提供交流平台，转载的目的在于传递更多信息及用于网络分享，并不代表本站赞同其观点和对其真实性负责，不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品，请与我们取得联系，我们会及时修改或删除。

上一篇：不是码农，也能看懂的“机器学习”原理
下一篇：小样本学习（Few-shot Learning）综述

相关文章：

网友评论：

发表评论

最新评论 进入详细评论页>>

最新文章

SEM推广服务

热门文章

热点图文

Copyright©2005-2026 Sykv.com 可思数据版权所有京ICP备14056871号

关于我们免责声明广告合作版权声明联系我们原创投稿网站地图

可思数据数据标注行业联盟

扫码入群

微信公众号