prelu 21秒看尽ImageNet屠榜模型 60+模型架构同台献艺

栏目:国内 2021-10-04 05:07:42
分享到:

机器的心脏报告

参与:唱歌和思考

60+车型架构,历年十几款SOTA车型,这21秒向你展示了图像识别的发展史。

ImageNet是计算机视觉领域常用的数据集之一。它在图像分类、目标分割和目标检测中有着不可动摇的地位。imagenet最初是由李菲菲等人在2009年于CVPR发表的论文《ImageNet:一个大规模分层图像数据库》中发表的。多年来,ImageNet的相关论文对行业产生了很大的影响。截至目前,谷歌学术显示该论文被引用12224次。本文在ImageNet成立10周年之际获得2019大会经典论文奖。

ImageNet本身就是一组海量的带标签的图像数据。从2007年到2009年,通过众包进行标记。ImageNet拥有超过1500万张图片,只有70万张汽车图片和2567个类别。如此海量的标注错误率极低且免费的数据集,已经成为图像处理领域研究者最早接触到的数据集之一。

毫不夸张地说,ImageNet是图像处理算法的试金石。从2010年开始,ImageNet每年都会举办一次挑战。2017年后的比赛将由Kaggle社区主办。自从Hinton和其他团队在2012年提出AlexNet以来,每年都有无数的模型希望在ImageNet排名中获得一席之地。

近日,PaperWithCode网站发布了一段21秒的视频,总结了十年前ImageNet发布的这些年来,在排名中取得一定成绩的机型。

如上图,13-19年分类任务的SOTA效应演化,13-15年提出了许多有较大改进的方法,如Inception结构、残差模块等。

排行榜地址:https://www . papers with code . com/sota/image-classing-on-imagenet

机器的心脏是根据视频和网站内容组织的。以下是一些著名的模型,发布时间,Top-1精度,参数数量,以及相关论文链接。出版时获得的SOTA车型名称用红色字体标注。

这是一堆熟悉的模型

参数

提交日期:2012年9月

第一名的准确率:62.5%

参数数量:60M

地址:https://papers . nips . cc/paper/4824-imagenet-classing-with-deep-卷积-neural-networks.pdf。

AlexNet架构示意图。

ZFNet

提交日期:2013/11年

最高准确率:64%

论文地址:https://arxiv.org/pdf/1311.2901v3.pdf

《盗梦空间》V1

提交日期:2014年9月

最高准确率:69.8%

参数数量:5M

论文地址:https://arxiv.org/pdf/1409.4842v1.pdf

VGG-19

提交日期:2014年9月

最高准确率:74%

参数数量:144米

论文地址:https://arxiv.org/pdf/1409.1556v6.pdf

预流网络

提交日期:2015年2月

Top-1准确率:75.73%

论文地址:https://arxiv.org/pdf/1502.01852v1.pdf

盗梦空间V3

提交日期:2015年12月

Top-1准确率:78.8%

参数数量:23.8米

论文地址:https://arxiv.org/pdf/1512.00567v3.pdf

盗梦空间V3 .

ResNet 152

提交日期:2015年12月

Top-1准确率:78.6%

论文地址:https://arxiv.org/pdf/1512.03385v1.pdf

ResNet的基本模块。

V2

提交日期:2016年2月

Top-1的准确率:80.1%

论文地址:https://arxiv.org/pdf/1602.07261v2.pdf

DenseNet-264

提交日期:2016年8月

最高准确率:79.2%

论文地址:https://arxiv.org/pdf/1608.06993v5.pdf

增长率为4的DenseNet架构。

ResNeXt-101 64×4

提交日期:2016/11年

Top-1的准确率:80.9%

参数数量:83.6米

论文地址:https://arxiv.org/pdf/1611.05431v2.pdf

波利尼西亚人

提交日期:2016/11年

Top-1的准确率:81.3%

参数数量:92M

论文地址:https://arxiv.org/pdf/1611.05725v2.pdf

DPN-131

提交日期:2017年7月

Top-1的准确率:81.5%

参数数量:80M

论文地址:https://arxiv.org/pdf/1707.01629v2.pdf

NASNET-A

提交日期:2017年7月

Top-1的准确率:82.7%

参数数量:89M

论文地址:https://arxiv.org/pdf/1707.07012v4.pdf

与左边的模型相比,神经架构搜索法得到的模型减少了参数数量,提高了效果。

PNASNet-5

提交日期:2017/12年

Top-1的准确率:82.9%

参数数量:86.1米

论文地址:https://arxiv.org/pdf/1712.00559v3.pdf

MobileNetV2

拟议时间:2018/1

Top-1准确率:74.7%

参数数量:6.9M

论文地址:https://arxiv.org/pdf/1801.04381v4.pdf

阿米巴网

拟议时间:2018/2

Top-1的准确率:83.9%

参数数量:469米

论文地址:https://arxiv.org/pdf/1802.01548v7.pdf

ResNeXt-101 32×48d

提交日期:2018年5月

Top-1的准确率:85.4%

参数数量:829米

论文地址:https://arxiv.org/pdf/1805.00932v1.pdf

V2 2×

提交日期:2018年7月

最高准确率:75.4%

参数数量:7.4M

论文地址:https://arxiv.org/pdf/1807.11164v1.pdf

效率网

提交日期:2019年5月

最高准确率:84.4%

参数数量:66M

论文地址:https://arxiv.org/pdf/1905.11946v2.pdf

效率网论文中体系结构的比较。a)基线模型;B)- d)分别是图像宽度、深度和分辨率的扫描结构;e)本文提出的网络结构可以集成所有扫描架构。

FixResNeXt-101 32×48d

提交日期:2019年6月

Top-1的准确率:86.4%

参数数量:829米

论文地址:https://arxiv.org/pdf/1906.06423v2.pdf

你发现了一些模式?

从吐邦模型来看,SOTA的模型参数在逐年增加。从60M参数的AlexNet到829M 32× 48 d的FIXRESNEXT-101,型号一年比一年大。

但是,也有一些意想不到的情况。比如DenseNet获得了2017 CVPR最佳论文,但DenseNet并没有达到SOTA的效果。此外,众所周知的ResNet,也只是接近2015年的SOTA车型事件v3。然而,未能获得SOTA并不意味着这些模型不好。它们给后续工作很大的启发。

值得注意的是,自2018年以来,降低模型参数的研究逐渐增多。可以看到有MobileNet、ShuffleNet等。,但遗憾的是牺牲了很多性能。今年最著名的小型化模型是谷歌提出的EfficientNet,虽然只有66M的参数,但已经接近目前的SOTA评分。

这里可以看到对模型架构的理解

机器之心还推出了很多博客和论文,这些都是了解这些模型架构的好资源。以下是一些概述文章,非常适合全面了解架构的演变:

图像研究的未来

从近年来图像研究领域的论文选题来看,有几个主要的研究方向值得关注。

首先,在算法领域,对抗网络生成的研究呈现井喷趋势。越来越多的研究者尝试使用GAN进行图像研究,如图像识别、样本攻防、高清图像生成、图像风格转换、直接生成新图像等。有学者尝试用GAN进行目标检测。

其次,在任务领域,从静态图像到动态视频图像,从2D图像到三维图像和三维数据的研究较多。近年来,视频领域对图像分类、目标分割和检测算法的研究有了更多的尝试,实现了行人检测和人体姿态跟踪等应用。同时,研究人员尝试使用深度学习模型来探索3D建模的性能。

最后,在模型方面,有很多关于模型参数约简和模型压缩的研究。许多学者研究了在不影响模型性能的情况下对模型进行剪枝和压缩的技术,希望将性能优异的模型部署在移动终端或物联网设备上,实现本地化的模型推理。