基于昇腾910：华为再发两款业界最强AI产品

时间：2019-09-19 13:24|来源：|编辑：z0011 网友评论

　　9月19日午间消息(蒋均牧)紧随第一天的全球最快AI训练集群Atlas 900，华为在其年度全联接大会(HC 2019)上再发两款基于昇腾910处理器的“最强”产品。
　　其一是业界最强AI训练卡Atlas 300，可提供256 TFLOPS的算力，是当前业界主流训练卡的2倍，每秒训练的图片数量从965张提升到1802张。它支持100G RoCE直出高速接口，可实现梯度参数和数据集并行传输，最高可降低70%的梯度同步时延，支撑集群训练时间缩短到秒级。
<iframe class="lyad" width="300" height="250" frameborder="0" scrolling="no" marginheight="0" src="http://same.eastmoney.com/s?z=eastmoney&c=18&op=1" ipadsrc="http://same.eastmoney.com/s?z=eastmoney&c=1409&op=1"></iframe>
　　其二是业界最强AI训练服务器Atlas 800,4U空间集成了8颗昇腾910 AI处理器，可提供2 PFLOPS的超强算力，算力密度是业界同类产品的2.5倍。Atlas 800仅重75千克，重量不到业界同类产品的一半，内置32个硬件解码器，每秒可完成16384张1080P图片解码，是业界主流产品处理能力的25倍，而且可以与训练并行处理。它还支持风冷和液冷散热，可满足企业数据中心和集群高密部署两类场景，单机能效比为业界同类产品的1.8倍。在华为松山湖的数据中心中已经部署了采用全液冷散热的Atlas 800，单机柜的散热能力高达5万瓦。实际上Atlas 900就是基于Atlas 800组建的。
　　华为现已完成了Atlas全系列产品布局，覆盖云、边、端全场景，面向训练和推理提供强劲算力。基于统一的达芬奇架构和全场景AI计算框架，可实现云边端协同，加速全行业的智能化再造，华为公司高级副总裁、Cloud&AI产品与服务总裁侯金龙表示。
　　另据C114了解，华为8月23日正式发布了算力最强的昇腾910。这款芯片基于达芬奇架构，半精度(FP16)算力达到256 Tera-FLOPS、整数精度(INT8)算力达到512 Tera-OPS，达到规格算力所需功耗仅310W、明显低于设计规格的350W；在典型的ResNet50网络的训练中，昇腾910与MindSpore配合，与现有主流训练单卡配合TensorFlow相比显示出接近2倍的性能提升。

TAG

相关阅读：

外资垄断75%！海上风电变压器受制于人，国家能源安全底线不容失守2026-03-11 14:14

初高中生成绩不理想考不上理想的学校怎么办、如何根据自身优势择校？2026-03-05 15:21

恒基兆业地产集团庆祝成立50周年，深耕内地共谱新章2026-02-04 13:16

南京先进制造产业专项母基金公布子基金遴选结果2026-01-19 17:41

40万债权击穿10亿资产酒企？徽酒集团双轮酒业二次破产背后的博弈2026-01-08 17:22

南京市创投集团合作子基金投资企业壁仞科技成功登陆港交所2026-01-07 19:40

「山谷奇技，声乐造艺」全新宝珀北京王府中環旗舰店盛大启航2025-12-30 10:57

宝珀“大音乐家-四音四锤双旋律大小自鸣”超复杂功能腕表2025-12-30 10:57

南京先进制造产业专项母基金子基金遴选结果揭晓2025-12-29 18:57

兑现“好房子”承诺：解读九牧的“场景答案”2025-12-29 12:32