计算机视觉应用背后 对深度学习框架有怎样的挑战
TechWeb报道7月19日消息,现今伴随人工智能在技术上的不断突破,一些领域如计算机视觉,已开始与各个行业进行了深度融合。例如保险行业已通过人脸识别这种新时代的认证方式,来对用户身份信息进行识别与审核。
而在计算机视觉背后,是以深度学习为依托进行的展开,目前深度学习较为成熟分别是人脸识别、物体检测、物体跟踪等方面的应用。而在应用的背后,深度学习计算的优化亦成为了重中之重,毕竟深度学习的模型是迅速迭代的,开发者要针对每一个模型尝试不同的模型和算法,从而对其参数和网络结构进行调整。
但大模型的训练要耗费上数天乃至数月的时间,所以若想实现模型的快速迭代,高效的训练和推理的方式显得尤为重要。因此模型优化虽然费时费力,但却是个高回报的投入。
深度学习框架的现状与挑战
众所周知,深度学习对人工智能的发展起着至关重要的影响,但深度学习也是一项极具挑战的工作。其一是深度学习领域以大规模标注数据为支撑进行的展开,必须要以数据为前提才能利用现有的统计学模型。
其二是需要先进的网络模型的创新,记得在2015年,微软夺冠ImageNet计算机视觉识别挑战时,曾揭开过152层的神经网络模型,比VGG网络深8倍,并使用“残差学习”理论来指导神经网络结构的设计。但如此深的模型,自然也对系统提出了很高要求。
虽然目前硬件和网络的发展极为迅速,GPU、芯片等硬件的发展也提供了比以往更为强大的计算能力,同时网络连接也为深度学习带来了全新的发展机遇。但遗憾的是,系统方面所出现的瓶颈问题却尚未得到解决,如何将不同模型高效地映射到相应的硬件上并定制优化,是深度学习目前面临的挑战之一。
对于微软而言,其愿景是让每个人都能用上人工智能,解放从业者不必要的工作量,因此若想让人工智能变得更为大众化,系统优化上的工作自然落在了微软的肩上。
深度学习优化三大挑战
在此前一次媒体交流的活动中,微软亚洲研究院资深研究员伍鸣曾指出,目前深度学习计算的优化主要面临三大挑战:扩展性、局部计算以及内存的使用效率。
扩展性方面,微软通过远程直接数据存取(RDMA)以及NVLink(英伟达开发并推出的一种总线及其通信协议)等高速的网络硬件能力,设计出了一个讨巧的零拷贝通信机制,让计算能力能够线性增加。也为深度学习开发人员带来更大的想象空间。

此外优化算法是求解目标函数中极为重要的一环,需要设计并行与分布式优化算法。但开发者通常更关注于神经网络结构和算法的本身,并不擅长指导其在分布式环境中去具体执行,为此微软开发了一套能够实现自动优化的系统软件,能够自动把模型做分布式的执行。
利用RDMA优化分布式的深度学习训练,微软有效提高了多机训练的吞吐量和收敛速度,在不同应用类型下,取得了2-8倍的加速效果。
在局部计算方面,目前很多深度学习模型背后有着大规模的数据流图,在这其中有很多非常小的算子组成,这些算子在GPU上启动执行时都存在着内存开销。为了减少这些系统开销避免影响计算效率,微软设计了一个能自动内核融合的方式。
在个标准循环神经网络LSTM模型的例子,微软通过把整个模型所有的算子融合成一个内核函数,从而基本消除了所有框架本身的额外开销。跟原始的TensorFlow相比快了10倍之多,而与TensorFlow开发的编译优化系统XLA相比,也有很大程度的提升。
最后在内存使用效率上,如GPU或者定制硬件加速器,这些硬件的内存资源有限,很可能限制模型的规模。微软的解决方法是利用模型量化和压缩去减小它的体积,或是如果模型很大,可以将其放在host内存中,使数据分段地传输到GPU里,但对于不同的模型任务或应用,需要挑选最合适的方法。同时也对TensorFlow做了一些改进,将接口更为便捷的开放给开发者进行尝试,以此来实现不同的压缩和量化方法。
微软的意图很明显,就是将技术更好的对外进行输送,帮助开发者、企业能够更聚焦在自家业务方面,而不是去关注底层系统到底是如何运行的。
通过这些巨头的不断努力,或许终有一天大多深度学习框架都将具备互通统一特性,就好比当年的数据库,最早数据库有很多类型,但最后伴随Relational algebra(关系代数)为基础的数据库的诞生,让所有数据库模型都成为一种统一的模型。而在人工智能方面,从系统角度来看,这必然是未来的大趋势之一。
正如微软印度公司人工智能部门总经理桑达尔·斯理尼万森所说,微软要让所有个人和机构都使用上人工智能。未来即使是非人工智能或是机器学习方面的专家,也能将最新的人工智能技术融入到自家所研发的产品当中。

- AMD助力微软Windows 11 为用户带来强大、可靠的计算能力2021-10-09 16:20
- 游戏玩家为之疯狂!Chinajoy2021 AMD展台那些火爆的瞬间2021-08-02 15:39
- 全场最佳 AMD Chinajoy2021展台圆满收官2021-08-02 15:38
- AMD 锐龙5000G系列处理器正式亮相Chinajoy20212021-08-02 11:50
- 极速制胜 制霸游戏 AMD携多款游戏神器扬威Chinajoy2021-08-02 11:44
- 央视《新闻联播》头条聚焦铁建重工,聚力攻克“卡脖子”技术难题2021-03-22 11:08
- 刚刚!我又上央视新闻联播头条了!2021-03-22 11:04
- 中国电科(3月1日-3月7日)要闻回顾 | 资讯轻阅读2021-03-22 10:47
- 我国将建第一个国家公园:为何是三江源2021-03-22 10:43
- 美国硅谷上演“大逃亡”:郊区成科技精英避难所2021-03-22 10:41

- 21:03京东科技赋能中原企业,80家企业已成功入驻产业园
- 18:36首次上榜《财富》中国500强,盈峰集团的产业赋能牛在哪?
- 10:08孙宇晨的而立之年:争议未远,传奇已立
- 15:27北京金海汇成投资有限公司谈资产配置
- 12:17寻找自然受益型经济10万亿美元的商机 ——第一财经第十四度携手达沃斯举办
- 12:43燃情“苏超”!苏州队VS扬州队精彩上演!雪中飞助力苏州队3:0夺得首胜!
- 17:23卷不赢的618,中国商家在东南亚集体“回血”
- 13:57“基于北斗与遥感的数字应用产业互联关键技术及应用”科技成果评价会在京成功
- 13:39三贯穿定基调,五纵横拓图,六点连线筑生态——燕京510以全域营销战略登顶
- 10:05由新者胜 至行者达 第三届中国企业碳中和表现榜正式发布
- 09:53相关专家领导赴四川嘉好变频供水设备科技有限公司考察调研
- 21:20甘露特钠胶囊多地断供?谁来续上患者的记忆
- 08:59站酷×北京邮政×微博强强联手!“玩具杂货铺”玩转儿童节艺术营销
- 14:13再破圈!央视端午晚会新松大负载机器人“执手”专业舞者柔美共舞,人机“无间
- 12:30盼星星,盼月亮,就盼九期一
- 09:26双线狂欢引爆510盛夏:狮王“世界风味”VS燕京9號“社区烟火”
- 14:35如何借力抖音7亿日活?京东(郑州)基地手把手教电商企业数字化转型
- 16:35150+项专利死磕滤芯,云米引领家庭饮水进入矿泉时代
- 10:35必有人,重写爱与浪漫 宝珀Ladybird贝蒂女士系列
- 10:34宝珀Ladybird贝蒂女士系列钻石舞会炫彩腕表 焕新演绎尊贵皇家紫色
- 10:36HTX携手HTX DAO共庆BTC披萨节,开启Web3全球化共识新篇章
- 10:08化学工业出版社一行到访外研在线 调研出版数字化转型路径
- 21:31BTC披萨节遇上TRUMP晚宴,HTX送出百万USDT狂欢福利
- 16:09HTX“火星计划特别版”新晋候选人出炉,用户太空之旅进入冲刺阶段
- 13:502025第四届石油石化装备产业科技大会暨科技创新成果展览会成功召开
- 19:352025第四届石油石化装备产业科技大会暨科技创新成果展览会成功召开
- 13:49恩捷李晓明:加速领跑全球锂电隔膜赛道
- 15:17HTX披萨狂欢节用户红包活动开启:联动七大加密项目限时送200,000
- 09:352025燕京啤酒510 BigDay启幕,解码全域营销新范式
- 09:24恩捷股份:恒捷远 PE-MBR 膜组器如何实现成本 “大瘦身”


