IPU 云端AI芯片的格局可能被微软、阿里、IPU改变

栏目：历史 2021-09-20 06:57:08

分享到:

微软亚洲研究院的NNFusion和阿里巴巴云的HALO开源项目都希望从AI编译的角度避免重复性的工作，让用户在GPU和其他AI加速器之间，尤其是GPU和IPU之间，尽可能顺利地迁移。

也就是说，NNFusion和HALO上跨AI框架，不仅可以集成TensorFlow生成的模型，还可以集成PyTorch或其他框架生成的模型。向下的用户只能通过NNFusion或者HALO的接口在不同的AI芯片上训练或者推理。

这种调度框架不仅可以降低迁移的难度和成本，还可以提高性能。根据OSDI 2020年发布的研究成果，研究人员对NVIDIA和AMD以及Graphcore IPU的GPU进行了各种测试，GPUs的训练模型提升了3倍。

当然，这样的好处仍然需要开源社区和硬件提供商的密切合作，比如Graphcore与微软亚洲研究院和阿里巴巴云的合作。

增加迁入IPU的便利性

—

“我们与阿里巴巴云HALO和微软NNFusion紧密合作。这两个项目支持的最重要的平台是GPU和IPU。”陆涛说，“目前在阿里巴巴云HALO的GitHub中已经有了一个完整的IPU的支持代码odla_PopArt，下载开源代码已经可以在IPU使用了。”

没有主流机器学习框架的支持，可以方便地使用IPU。Graphcore最近发布了本月针对IPU和白杨SDK 1.4的PyTorch产品版本。PyTorch是AI研究员社区中最热门的机器学习框架，它与TensorFlow是两个世界。

PyTorch对IPU的支持引起了机器学习大神Yann LeCun的注意。这种支持之所以受到广泛关注，是因为它对IPU的广泛应用具有积极意义。

Graphcore中国工程总工程师、AI算法科学家陈进说:“在PyTorch的代码中，我们引入了一个轻量级的接口，叫做PopTorch。通过这个接口，用户可以基于他们当前的PyTorch模型进行轻量级封装，然后可以在IPU和CPU上无缝运行这个模型。”

它还可以更好地与HALO和NNFusion开源社区合作。陈进告诉雷锋。“不同的框架有不同的中间呈现格式，即IR。我们希望将不同的IR格式转换为我们通用的PopART计算图表，这也是兼容性最关键的一点。”

据悉，IPU支持TensorFlow，就像TPU一样，通过TensorFlow XLA后端访问TensorFlow框架，相当于把一个TensorFlow计算图转换成XLA计算图，然后通过访问XLA计算图下沉到PopART的计算图中，然后通过编译生成可以在IPU执行的二进制文件。

金炜认为，“每个层次图的转化是一个非常关键的因素，需要一些定制化的工作，因为一些通用的算子也是基于IPU开发的，这是我们的特殊工作。”

除了增加对不同AI框架和AI框架中用户定义操作符的支持，增强对模型覆盖的支持，降低迁移成本。

陈进介绍，对于训练模型的迁移，如果是迁移一个不太复杂的模型，一个开发人员一周就可以完成，而一个比较复杂的模型需要两周。如果是迁移推理模型，通常只需要1-2天就可以完成。

IPU正在挑战图形处理器。

云芯片市场或发生变化

—

在AI时代，软硬件融合的重要性更加突出。陆涛说:“AI处理器公司大致可以分为三类。一个是在讲PPT的公司，一个是有芯片的公司，一个是真正接近或者有软件的公司。”

软件有进步的Graphcore，硬件的性能是否也能给用户足够的切换动力？本月，Graphcore发布了基于MK2 IPU的IPU-M2000的几个模型的训练Benchmark，包括典型CV模型ResNet、基于包卷积的ResNeXt、EfficientNet、语音模型、BERT-Large等自然语言处理模型，以及MCMC等传统机器学习模型。

有一些大的改进。例如，与A100 GPU相比，IPU-M2000的ResNet50吞吐量可提升2.6倍，ResNeXt101可提升3.6倍，EfficientNet可提升18倍，Deep Voice 3可提升13倍。

值得一提的是，IPU-POD64次列车的BERT-Large比一辆DGX-A100快5.3倍，比三辆DGX-A100快1.8倍。一辆IPU-POD64和三辆DGX-A100的动力和价格基本相同。

强调IPU培养BERT-Large不仅仅是因为它是继NVIDIA GPU和谷歌TPU之后发布的第三款可以培养这种模式的AI芯片，更是因为BERT-Large模式对当前芯片落地的意义。

陆涛说:“今天，BERT-Large模型是工业和研究的一个很好的基准，在未来至少一年内，它将是一个在线模型水平。”

不过这个成绩目前还不是MLPerf发布的成绩，正式成绩还需要等Graphcore明年上半年正式参加MLPerf性能测试。Graphcore最近宣布，它已经加入了MLCommons，这是MLPerf的管理组织。

“我认为我们加入MLCommons并提交MLPerf表明，IPU将处于GPU的核心领域和GPU的前沿PK，这表明IPU不仅可以做GPU做不到的事情，还可以在GPU最擅长的领域实现更好的TCO。同等甚至更好的表现。”陆涛说。

微软亚洲研究院、阿里巴巴云和Graphcore都在将GPU一起推向IPU。什么时候会破？

陈兆棠陈兆棠不贪不腐出身名家的他为何变得嗜杀成性最终死于非命

自古以来，人们对清官有着非同一般的向往，希望有这样的官员来治理地方。但是官员诚实就够了吗？其实，评判官员，这只是其中的一部分。有一个官员从不贪污，但在他的管理下，当地人民很悲惨。当革命军逮捕并枪毙他时，无数人为他鼓掌

·21-09-20
梅花图片手绘谁说肖战不在乎晒手绘梅花照片复出营业谁又懂那句“梅花香自苦寒来”

肖恩肖终于回来做生意了！4月10日，肖恩·肖分享了一张手绘照片。一朵梅花刚刚开了。鲜艳的红花非常显眼，而梅花被黑色的圆形背景包围着。整体风格略显黑暗。其实早在4月4日，肖恩肖也发表了状态，但当时在全民哀悼的日子里

·21-09-20
福田药业首届福田生物医药创新论坛召开

5月17日，首届福田生物医药创新论坛在深圳福田生物医药R&D公共服务平台隆重举行。本次论坛由广东省生物医药创新技术协会主办，姬伯医药子公司深圳市博瑞医药科技有限公司、湾区新药交易所承办。旨在汇聚粤港澳大湾区创新

·21-09-20
初恋是什么感觉再次见到初恋是什么感觉

大概每个人心里都有一段美好的初恋，但结果大部分都死了，充满了遗憾或自责，却很少有人能真正走到一起。如果多年后你再次遇到你的初恋，你会有什么感觉？很难想象会是什么样的场景。脑子里遇到这个问题，首先想到的就是和初恋

·21-09-20
buffx 上线两周销售额超100万的新型功能食品

序介绍 “养生”成为时下年轻人的高频词汇，花式朋克养生法层出不穷。“把枸杞泡在保温杯里，戒掉可乐和油腻”，“熬最深的夜，敷最贵的面膜”不再是父母的习惯，更是年轻人的标配。易观发布的《90后保健的秘密2019》调查数

·21-09-20
异世之吾为道祖网络小说中的6本一举封神作品九大天君斗天最后一本你看过吗

网络小说中有六部作品一举封神，九王斗天。你看过最后一部吗？在网络小说中，很多网络作者用自己的一部小说封神。这样的作品往往可以让作者在短时间内成名，并获得无数粉丝，吸引数百万美元。哪些网络作者在用自己的小说一举

·21-09-20
603267 拟IPO企业实控人新增股份之股份支付认定

文本/吴彤108 实际控制人特别是参与股权激励的新增股份是否需要进行股份支付，是IPO申请项目中需要特别关注的问题。本文对中国证监会的相关规定和七个案例进行了分析。在实践中，有些情况下，实际控制人新增的股份被视为股

·21-09-20
榆中即将修建的公路甘肃这8个公路项目将要建设

修整:道路和桥梁网络近日，甘肃省交通投资管理有限公司发布《G22青兰高速公路长清大桥至延川子段改扩建等8个公路项目工程可行性研究报告编制招标公告》，意味着该项目已进入决策阶段。项目概述: G22青兰高速公路长清

·21-09-20