IPU 云端AI芯片的格局可能被微软、阿里、IPU改变

栏目:历史 2021-09-20 06:57:08
分享到:

微软亚洲研究院的NNFusion和阿里巴巴云的HALO开源项目都希望从AI编译的角度避免重复性的工作,让用户在GPU和其他AI加速器之间,尤其是GPU和IPU之间,尽可能顺利地迁移。

也就是说,NNFusion和HALO上跨AI框架,不仅可以集成TensorFlow生成的模型,还可以集成PyTorch或其他框架生成的模型。向下的用户只能通过NNFusion或者HALO的接口在不同的AI芯片上训练或者推理。

这种调度框架不仅可以降低迁移的难度和成本,还可以提高性能。根据OSDI 2020年发布的研究成果,研究人员对NVIDIA和AMD以及Graphcore IPU的GPU进行了各种测试,GPUs的训练模型提升了3倍。

当然,这样的好处仍然需要开源社区和硬件提供商的密切合作,比如Graphcore与微软亚洲研究院和阿里巴巴云的合作。

增加迁入IPU的便利性

“我们与阿里巴巴云HALO和微软NNFusion紧密合作。这两个项目支持的最重要的平台是GPU和IPU。”陆涛说,“目前在阿里巴巴云HALO的GitHub中已经有了一个完整的IPU的支持代码odla_PopArt,下载开源代码已经可以在IPU使用了。”

没有主流机器学习框架的支持,可以方便地使用IPU。Graphcore最近发布了本月针对IPU和白杨SDK 1.4的PyTorch产品版本。PyTorch是AI研究员社区中最热门的机器学习框架,它与TensorFlow是两个世界。

PyTorch对IPU的支持引起了机器学习大神Yann LeCun的注意。这种支持之所以受到广泛关注,是因为它对IPU的广泛应用具有积极意义。

Graphcore中国工程总工程师、AI算法科学家陈进说:“在PyTorch的代码中,我们引入了一个轻量级的接口,叫做PopTorch。通过这个接口,用户可以基于他们当前的PyTorch模型进行轻量级封装,然后可以在IPU和CPU上无缝运行这个模型。”

它还可以更好地与HALO和NNFusion开源社区合作。陈进告诉雷锋。“不同的框架有不同的中间呈现格式,即IR。我们希望将不同的IR格式转换为我们通用的PopART计算图表,这也是兼容性最关键的一点。”

据悉,IPU支持TensorFlow,就像TPU一样,通过TensorFlow XLA后端访问TensorFlow框架,相当于把一个TensorFlow计算图转换成XLA计算图,然后通过访问XLA计算图下沉到PopART的计算图中,然后通过编译生成可以在IPU执行的二进制文件。

金炜认为,“每个层次图的转化是一个非常关键的因素,需要一些定制化的工作,因为一些通用的算子也是基于IPU开发的,这是我们的特殊工作。”

除了增加对不同AI框架和AI框架中用户定义操作符的支持,增强对模型覆盖的支持,降低迁移成本。

陈进介绍,对于训练模型的迁移,如果是迁移一个不太复杂的模型,一个开发人员一周就可以完成,而一个比较复杂的模型需要两周。如果是迁移推理模型,通常只需要1-2天就可以完成。

IPU正在挑战图形处理器。

云芯片市场或发生变化

在AI时代,软硬件融合的重要性更加突出。陆涛说:“AI处理器公司大致可以分为三类。一个是在讲PPT的公司,一个是有芯片的公司,一个是真正接近或者有软件的公司。”

软件有进步的Graphcore,硬件的性能是否也能给用户足够的切换动力?本月,Graphcore发布了基于MK2 IPU的IPU-M2000的几个模型的训练Benchmark,包括典型CV模型ResNet、基于包卷积的ResNeXt、EfficientNet、语音模型、BERT-Large等自然语言处理模型,以及MCMC等传统机器学习模型。

有一些大的改进。例如,与A100 GPU相比,IPU-M2000的ResNet50吞吐量可提升2.6倍,ResNeXt101可提升3.6倍,EfficientNet可提升18倍,Deep Voice 3可提升13倍。

值得一提的是,IPU-POD64次列车的BERT-Large比一辆DGX-A100快5.3倍,比三辆DGX-A100快1.8倍。一辆IPU-POD64和三辆DGX-A100的动力和价格基本相同。

强调IPU培养BERT-Large不仅仅是因为它是继NVIDIA GPU和谷歌TPU之后发布的第三款可以培养这种模式的AI芯片,更是因为BERT-Large模式对当前芯片落地的意义。

陆涛说:“今天,BERT-Large模型是工业和研究的一个很好的基准,在未来至少一年内,它将是一个在线模型水平。”

不过这个成绩目前还不是MLPerf发布的成绩,正式成绩还需要等Graphcore明年上半年正式参加MLPerf性能测试。Graphcore最近宣布,它已经加入了MLCommons,这是MLPerf的管理组织。

“我认为我们加入MLCommons并提交MLPerf表明,IPU将处于GPU的核心领域和GPU的前沿PK,这表明IPU不仅可以做GPU做不到的事情,还可以在GPU最擅长的领域实现更好的TCO。同等甚至更好的表现。”陆涛说。

微软亚洲研究院、阿里巴巴云和Graphcore都在将GPU一起推向IPU。什么时候会破?

  • 陈兆棠 陈兆棠不贪不腐 出身名家的他为何变得嗜杀成性 最终死于非命

    自古以来,人们对清官有着非同一般的向往,希望有这样的官员来治理地方。但是官员诚实就够了吗?其实,评判官员,这只是其中的一部分。有一个官员从不贪污,但在他的管理下,当地人民很悲惨。当革命军逮捕并枪毙他时,无数人为他鼓掌

    ·21-09-20

  • 梅花图片手绘 谁说肖战不在乎 晒手绘梅花照片复出营业 谁又懂那句“梅花香自苦寒来”

    肖恩肖终于回来做生意了!4月10日,肖恩·肖分享了一张手绘照片。一朵梅花刚刚开了。鲜艳的红花非常显眼,而梅花被黑色的圆形背景包围着。整体风格略显黑暗。 其实早在4月4日,肖恩肖也发表了状态,但当时在全民哀悼的日子里

    ·21-09-20

  • 福田药业 首届福田生物医药创新论坛召开

    5月17日,首届福田生物医药创新论坛在深圳福田生物医药R&D公共服务平台隆重举行。本次论坛由广东省生物医药创新技术协会主办,姬伯医药子公司深圳市博瑞医药科技有限公司、湾区新药交易所承办。旨在汇聚粤港澳大湾区创新

    ·21-09-20

  • 初恋是什么感觉 再次见到初恋是什么感觉

    大概每个人心里都有一段美好的初恋,但结果大部分都死了,充满了遗憾或自责,却很少有人能真正走到一起。如果多年后你再次遇到你的初恋,你会有什么感觉? 很难想象会是什么样的场景。脑子里遇到这个问题,首先想到的就是和初恋

    ·21-09-20

  • buffx 上线两周销售额超100万的新型功能食品

    序 介绍 “养生”成为时下年轻人的高频词汇,花式朋克养生法层出不穷。“把枸杞泡在保温杯里,戒掉可乐和油腻”,“熬最深的夜,敷最贵的面膜”不再是父母的习惯,更是年轻人的标配。 易观发布的《90后保健的秘密2019》调查数

    ·21-09-20

  • 异世之吾为道祖 网络小说中的6本一举封神作品 九大天君斗天 最后一本你看过吗

    网络小说中有六部作品一举封神,九王斗天。你看过最后一部吗? 在网络小说中,很多网络作者用自己的一部小说封神。这样的作品往往可以让作者在短时间内成名,并获得无数粉丝,吸引数百万美元。哪些网络作者在用自己的小说一举

    ·21-09-20

  • 603267 拟IPO企业实控人新增股份之股份支付认定

    文本/吴彤108 实际控制人特别是参与股权激励的新增股份是否需要进行股份支付,是IPO申请项目中需要特别关注的问题。本文对中国证监会的相关规定和七个案例进行了分析。在实践中,有些情况下,实际控制人新增的股份被视为股

    ·21-09-20

  • 榆中即将修建的公路 甘肃这8个公路项目将要建设

    修整:道路和桥梁网络 近日,甘肃省交通投资管理有限公司发布《G22青兰高速公路长清大桥至延川子段改扩建等8个公路项目工程可行性研究报告编制招标公告》,意味着该项目已进入决策阶段。 项目概述: G22青兰高速公路长清

    ·21-09-20