您好,欢迎来到中国产经网!
当前位置: 首页 > 产经聚焦

基于昇腾910:华为再发两款业界最强AI产品

时间:2019-09-19 13:24|来源:|编辑:z0011 网友评论

  9月19日午间消息(蒋均牧)紧随第一天的全球最快AI训练集群Atlas 900,华为在其年度全联接大会(HC 2019)上再发两款基于昇腾910处理器的“最强”产品。

  其一是业界最强AI训练卡Atlas 300,可提供256 TFLOPS的算力,是当前业界主流训练卡的2倍,每秒训练的图片数量从965张提升到1802张。它支持100G RoCE直出高速接口,可实现梯度参数和数据集并行传输,最高可降低70%的梯度同步时延,支撑集群训练时间缩短到秒级。

<iframe class="lyad" width="300" height="250" frameborder="0" scrolling="no" marginheight="0" src="http://same.eastmoney.com/s?z=eastmoney&c=18&op=1" ipadsrc="http://same.eastmoney.com/s?z=eastmoney&c=1409&op=1"></iframe>

  其二是业界最强AI训练服务器Atlas 800,4U空间集成了8颗昇腾910 AI处理器,可提供2 PFLOPS的超强算力,算力密度是业界同类产品的2.5倍。Atlas 800仅重75千克,重量不到业界同类产品的一半,内置32个硬件解码器,每秒可完成16384张1080P图片解码,是业界主流产品处理能力的25倍,而且可以与训练并行处理。它还支持风冷和液冷散热,可满足企业数据中心和集群高密部署两类场景,单机能效比为业界同类产品的1.8倍。在华为松山湖的数据中心中已经部署了采用全液冷散热的Atlas 800,单机柜的散热能力高达5万瓦。实际上Atlas 900就是基于Atlas 800组建的。

  华为现已完成了Atlas全系列产品布局,覆盖云、边、端全场景,面向训练和推理提供强劲算力。基于统一的达芬奇架构和全场景AI计算框架,可实现云边端协同,加速全行业的智能化再造,华为公司高级副总裁、Cloud&AI产品与服务总裁侯金龙表示。

  另据C114了解,华为8月23日正式发布了算力最强的昇腾910。这款芯片基于达芬奇架构,半精度(FP16)算力达到256 Tera-FLOPS、整数精度(INT8)算力达到512 Tera-OPS,达到规格算力所需功耗仅310W、明显低于设计规格的350W;在典型的ResNet50网络的训练中,昇腾910与MindSpore配合,与现有主流训练单卡配合TensorFlow相比显示出接近2倍的性能提升。


TAG
780*90 广告位
370宽 广告位
滚动播报
370宽 广告位
370宽 广告位
370宽 广告位

网站简介 - 网站声明 - 广告服务 - 合作伙伴 - 联系我们

商务合作 QQ:2713090406

未经本站书面特别授权,请勿转载或建立镜像

不良信息举报中心 网络110报警服务 中国互联网协会 经营性网站备案信息 中国文明网传播文明

Copyright © 2021 中国产经网 Twsp.net 版权所有,并保留所有权利 | Powered by twsp.net