百度大脑3.0技术详解:语义化拥有多大的能量?
7月4日召开的百度AI开发者大会(Baidu Create 2018)上,百度高级副总裁、AI技术平台体系(AIG)总负责人王海峰发布百度大脑3.0,并指出,百度大脑3.0的核心是“多模态深度语义理解”,包括数据的语义,知识的语义,以及图像、视频、声音、语音等各方面的理解。
多模态深度语义理解如何在技术上实现?拥有多大的能量?它将如何被应用来改变我们的生活?
7月4日下午,在百度大脑论坛中,百度大脑3.0的核心技术一一“亮相”,为开发者们带来一场技术盛宴。
从“看清听清”到“看懂听懂”
“多模态深度语义理解能让机器听清、看清,更能深入理解它背后的含义,深度地理解真实世界,进而更好地支撑各种应用。”王海峰表示。
视觉语义化可以让机器从看清到看懂视频,并提炼出结构化语义知识。百度视觉技术部、人脸技术部、增强现实技术部总监吴中勤介绍,视觉语义化技术首先识别人、物体和场景,同时捕捉它们之间的行为和关系,通过时序化、数字化、结构化的方式形成语义知识,最终结合领域和场景进行智慧推理,落地行业应用。比如在零售领域,它可以准确判断每个人的动作、行为,真正实现顾客拿起商品就走。未来,视觉语义化技术还可进一步延展,它结合新型的传感器和AI芯片,可以在感知层面和计算层面得到大幅提升;结合手机可以带给用户更佳地使用体验。未来,百度视觉语义化技术将在百度AI开放平台中开放给开发者使用。
百度语音技术部总监高亮表示,百度基于远场的语音语义一体化技术取得重大突破,为业界提供更顶尖的远场语音技术。语音语义一体化将远场交互中高频Query识别准确率提升10个点,并保持普通Query识别率不降;多语种混合声学建模基于Deep Peak2大幅提升中英文混合Query识别准确率,相对错误率比业界最好竞品降低20%;新升级的TTS技术业界首创传统拼接技术与Wavenet技术融合方案,保证合成质量的同时大大降低成本,让大规模应用落地成为现实。
此外,百度重磅发布远场语音技术低成本解决方案“度小云”,它基于Deep Peak V2语音识别技术、语音语义一体化技术及LSTM-VAD深度学习语音切分技术,实现业界领先的五级唤醒技术,并拥有基于Wavenet的精致音库,支持远场优化的音频通信技术。未来开发者可以平等便捷地一站式获取百度远场语音能力。
想要让机器像人一样拥有智能,将语言变成知识必不可缺。百度AI技术平台体系执行总监吴甜表示,百度自然语言处理技术经过多年的发展,已形成全面、前沿的格局。百度知识图谱已发展为复杂、多元、全面的多元语义知识图谱,包含实体图谱、行业图谱、事件图谱、关注点图谱、多媒体图谱,其中实体图谱已经能够覆盖通用需求中90%的实体及其属性。
在阅读理解技术上,百度大脑已经阅读了千亿量级的文章,相当于6万个中国国家图书馆的藏书,并由此积累了亿级实体、千亿事实的知识,并通过“学习”真实应用每天产生的知识不断优化。在对话理解方面,百度理解与交互技术平台UNIT升级至2.0,进一步增强冷启动能力,支持像人类一样在对话当中学习,同时开放了第一个工业级对话系统开源框架,降低搭建门槛,让开发者无缝对接云端。百度将持续开源新的技术,提供更灵活便捷的方案,推动自然语言理解技术的创新与发展。
数据、算法、算力是影响人工智能技术发展的重要因素。主论坛中,王海峰表示百度大脑3.0首次将芯片纳入技术体系,带动百度大脑算力爆发式增长。百度自主研发的中国第一款云端全功能AI芯片“昆仑”也在会上首次亮相。未来,AI芯片将与百度自主研发的PaddlePaddle深度学习框架相结合,推动AI行业生态快速发展。
百度在2016年正式开源的PaddlePaddle,是最适合中国开发者的深度学习框架。主论坛中,王海峰发布PaddlePaddle3.0,下午,百度AI技术生态部总经理喻友平对此进行了详细解读。PaddlePaddle3.0包括完整的核心框架,以及AI Studio、AutoDL、EasyDL等可以让开发者平等便捷获取顶尖AI能力的平台。PaddlePaddle3.0核心框架对服务器版本以及移动端版本进行了全面优化,PaddlePaddle Fluid提供丰富的满足常见主流模型搭建需求的API,支持广泛的模型搭建,训练Runtime可以满足各类型的模型训练需求;PaddlePaddle Serving可灵活适配多种预测引擎;PaddlePaddle Mobile集成百度移动端预测的实践经验,提供多平台支持。
PaddlePaddle3.0中,AutoDL备受关注。百度大数据(北京)实验室主任浣军介绍,AutoDL能更高效自动搜索神经网络结构,开发者无需特殊硬件设备可以快速得到高质量模型。AutoDL提供多种能力,支持设计全新深度学习网络结构,以及优化现有深度学习网络结构及参数,同时能够适配特定任务场景。
海量数据爆发式增长,发掘数据价值成为众多行业的普遍需求。百度大数据部总监郭谢表示,百度已形成从数据到数据工程、数据科学、数据产品再到行业方案的大数据产品技术栈,基于大数据特性,从生产资料和生产工具两方面促进产业发展。为了最大程度保证数据安全,百度正式发布大数据众智开放平台“点石”,基于全球领先的百度AI技术,全方位保障数据安全,并逐步开放工具能力,为行业数据安全赋能。
现场,百度启动了多项大赛。百度之星开发者大赛将如期回归,此外还有基于PaddlePaddle的中国高校计算机大赛人工智能创意赛、KG-知识抽取赛、交通预测赛、无人车系列大赛,以及商家招牌的分类与检测、人工智能加速器应用与设计等大数据比赛。百度方面表示,欢迎各路高手挑战,通过大赛携手推动整个AI产业的发展。
业内人士对此表示,百度推动技术落地的同时也在不断反哺技术升级,如今百度大脑升级至3.0,也标志着百度AI技术的一次跨越式升级。正如王海峰在开场中所强调,“百度AI能力的核心是百度大脑,百度大脑3.0是百度AI能力的集大成者。”。基于百度大脑持续突破的技术实力,百度有能力把顶尖的AI技术提供给中国开发者、企业,更让每个开发者和企业都能平等获取顶尖AI能力,继而让AI在中国遍地开花。
- AMD助力微软Windows 11 为用户带来强大、可靠的计算能力2021-10-09 16:20
- 游戏玩家为之疯狂!Chinajoy2021 AMD展台那些火爆的瞬间2021-08-02 15:39
- 全场最佳 AMD Chinajoy2021展台圆满收官2021-08-02 15:38
- AMD 锐龙5000G系列处理器正式亮相Chinajoy20212021-08-02 11:50
- 极速制胜 制霸游戏 AMD携多款游戏神器扬威Chinajoy2021-08-02 11:44
- 央视《新闻联播》头条聚焦铁建重工,聚力攻克“卡脖子”技术难题2021-03-22 11:08
- 刚刚!我又上央视新闻联播头条了!2021-03-22 11:04
- 中国电科(3月1日-3月7日)要闻回顾 | 资讯轻阅读2021-03-22 10:47
- 我国将建第一个国家公园:为何是三江源2021-03-22 10:43
- 美国硅谷上演“大逃亡”:郊区成科技精英避难所2021-03-22 10:41
- 18:23周大生经典十万份黄金好礼大放送,点燃蛇年春节喜气氛围
- 11:13JJ斗地主拒绝赌博,引领棋牌游戏新风尚
- 10:37行业唯一!海尔智家获最具投资价值奖
- 10:24周大生黄金珠宝嘉年华即将盛大开启,十万份黄金好礼贺蛇年春节
- 09:28惠达卫浴与京东深化合作,开启2025健康卫浴新生活
- 19:08预见2025:HTX的全球化蓝图与战略突破
- 18:22惠达卫浴与京东深化合作,开启2025健康卫浴新生活
- 18:08“陆地航母”上线,人类距离打飞的上班还有多久?
- 17:54亚马逊最大规模电动卡车订单落地:豪购超200辆奔驰eActros
- 15:36百利好推出全新交易产品,开拓财富新篇章
- 21:10七座商务车都有哪些?上汽大通 MAXUS G90亮点解析
- 21:05云米电器质量怎么样,云米燃气热水器AI Super2:智享未来,温暖每一
- 20:51CR450动车组样车正式发布,标志着中国高铁技术新突破
- 20:03IP+文旅还能怎么玩?酷乐潮玩全国文旅首店给出了答案
- 18:09周大生大师艺术珠宝以璀璨黄金诠释印象派艺术
- 15:58CES新物种(下):中国原创,世界领先——通用软体机器人技术赋能全球生产
- 10:38CES 2025观察:海信空调的新风,继续吹向AI风口
- 16:22周大生经典在传承中创新,精心打造东方文化精品珠宝
- 15:59智能驱动,豫见未来——“热AI在郑州·百度品牌之夜”圆满落幕
- 15:49驰援西藏,周大生捐款助力日喀则抗震救灾
- 15:21CES 2025 现场直击 | 万勋科技携通用软体机器人惊艳首秀,多元化
- 16:33CES新物种(中):类人肌体,过人能力——通用软体机器人技术,加速机器人
- 15:35百利好解锁投资新机遇,全新交易产品正式上线!
- 19:52周大生国家宝藏系列青花新品匠心传承千古瓷韵
- 14:55CES新物种(上):机器人变软——通用化、可商用的软体机器人亮相CES
- 12:28中国首家鱼子酱体验店 卡露伽鱼子酱旗舰店落户浙江衢州水亭门
- 10:38商聚荷城 合创未来 第二届贵港市荷商大会在城区胜利召开
- 17:23蛇年贺岁启新程,与周大生经典共赴宋韵风华
- 09:56燕京啤酒率先拉开春节营销大幕,官宣国民闺女关晓彤为品牌代言人
- 16:42周大生新年珠宝璀璨亮相,共度2025年的美好时光