数据不完美 再智能的AI也会被“逼疯”
如果说人工智能是一辆飞奔的豪华跑车,那么数据就是提供强劲动力的燃料,这种能源不仅要充沛,还要确保质量。否则,就会产生瑕疵影响跑车的速度和行进轨道,甚至会引发AI的“生命危险”。
日常生活中,数据的类型大体可分为结构化数据、非结构化数据、半结构化数据。一个数据从产生到落地要经过收集、传输、分析、检索、挖掘等阶段。分析让大量的数据有了价值,机器要学会像人一样学习、思考、推理、交流,进而与应用场景相结合,从规律中预测未来。不过,要让机器像人一样去“看”数据,恐怕穷尽一生也无法分析完。
举个例子,计算机在进行视觉训练时,如果用1万把椅子的照片让其学习,人的固有思维会先记住椅子外观的关键组成部分,比如椅背和椅子腿。而对于机器学习来说,它们或许会找到一些新的特征,并对这些特征进行归纳来识别出一把新的椅子。这一过程中,需要有海量、不同的椅子照片供给计算机去学习。
如果深究技术层面,数据分析所用的map-reduce算法可将数据分解为多个部分,利用hadoop集群对每一部分的数据进行分析,之后将效果汇总经过多轮计算筛选出结果。解析过程中,对每轮结果的优化又会引入Spark这种快速通用的计算引擎。如果强调实时数据处理,也会用到storm等计算框架。
然而,就像柴油注入汽油车会出问题,也不是任何数据对人工智能都有积极作用,不少案例已经可以证明这一点。例如,有些聊天机器人在网络上学习了负面评论,就会变得“尖酸刻薄”甚至引发了种族歧视问题。可见,数据的开源性固然重要,但如何找到有质量的数据对AI发展有着决定性的影响,尤其是在受到高度监管的行业。
人工智能的负面影响不仅在于学习偏差,还可能被黑客利用成为新型网络攻击的武器,甚至出现伦理问题。如果数据本身是有瑕疵的,那么不管是有意还是无意,人工智能系统都会基于这样的数据进行训练,带来的后果可想而知。举个例子,一个信用卡审核系统要是用有偏差的数据构建解决方案,就会对某一类的申请人给初带有偏见性的结论。往坏处想,这或许就是马斯克眼中“AI毁灭人类”的开端。
如今,小到Alexa、Siri这些虚拟机器人对人类语言理解的错误判断,大到自动驾驶在道路测试时发生的交通事故,都在印证着人工智能在利用数据进行训练时仍有相当大的上升空间。也就是说,人们除了要在数据合规的基础上,开放更多的数据源,还要借助区块链等新技术或手段为这些数据建立完善的审核机制。
互联网时代的快节奏让数据也跑在快车道上,松懈不得。以城市交通治理为例,每天在城市道路上都在发生着堵车或者事故,如果做不到对数据的实时分析就难以立刻找到有效的疏通办法,而在上下班高峰期时的交通堵塞往往因为某一个信号灯故障就会引发。
再比如,工业互联网时代产生的数据量比传统信息化要多数千倍甚至数万倍,并且是实时采集、高频度、高密度的,动态数据模型随时可变,甚至良品率的细微变化都会带来数据模型重建。这样一来,如果做不到工业数据实时更新,智能制造就无从谈起。
总的来说,即使人工智能有一天真的成为“类人”,仍然离不开人类将其引导上一条正路。无论是伦理还是情感问题,都要基于数据进行判断,而要是数据的质量无法保障,再智能的AI都会被“逼疯”。

- AMD助力微软Windows 11 为用户带来强大、可靠的计算能力2021-10-09 16:20
- 游戏玩家为之疯狂!Chinajoy2021 AMD展台那些火爆的瞬间2021-08-02 15:39
- 全场最佳 AMD Chinajoy2021展台圆满收官2021-08-02 15:38
- AMD 锐龙5000G系列处理器正式亮相Chinajoy20212021-08-02 11:50
- 极速制胜 制霸游戏 AMD携多款游戏神器扬威Chinajoy2021-08-02 11:44
- 央视《新闻联播》头条聚焦铁建重工,聚力攻克“卡脖子”技术难题2021-03-22 11:08
- 刚刚!我又上央视新闻联播头条了!2021-03-22 11:04
- 中国电科(3月1日-3月7日)要闻回顾 | 资讯轻阅读2021-03-22 10:47
- 我国将建第一个国家公园:为何是三江源2021-03-22 10:43
- 美国硅谷上演“大逃亡”:郊区成科技精英避难所2021-03-22 10:41

- 14:26入选上海智库报告文库,第一财经研究院“小巨人”调研专著出版
- 21:03京东科技赋能中原企业,80家企业已成功入驻产业园
- 18:36首次上榜《财富》中国500强,盈峰集团的产业赋能牛在哪?
- 10:08孙宇晨的而立之年:争议未远,传奇已立
- 15:27北京金海汇成投资有限公司谈资产配置
- 12:17寻找自然受益型经济10万亿美元的商机 ——第一财经第十四度携手达沃斯举办
- 12:43燃情“苏超”!苏州队VS扬州队精彩上演!雪中飞助力苏州队3:0夺得首胜!
- 17:23卷不赢的618,中国商家在东南亚集体“回血”
- 13:57“基于北斗与遥感的数字应用产业互联关键技术及应用”科技成果评价会在京成功
- 13:39三贯穿定基调,五纵横拓图,六点连线筑生态——燕京510以全域营销战略登顶
- 10:05由新者胜 至行者达 第三届中国企业碳中和表现榜正式发布
- 09:53相关专家领导赴四川嘉好变频供水设备科技有限公司考察调研
- 21:20甘露特钠胶囊多地断供?谁来续上患者的记忆
- 08:59站酷×北京邮政×微博强强联手!“玩具杂货铺”玩转儿童节艺术营销
- 14:13再破圈!央视端午晚会新松大负载机器人“执手”专业舞者柔美共舞,人机“无间
- 12:30盼星星,盼月亮,就盼九期一
- 09:26双线狂欢引爆510盛夏:狮王“世界风味”VS燕京9號“社区烟火”
- 14:35如何借力抖音7亿日活?京东(郑州)基地手把手教电商企业数字化转型
- 16:35150+项专利死磕滤芯,云米引领家庭饮水进入矿泉时代
- 10:35必有人,重写爱与浪漫 宝珀Ladybird贝蒂女士系列
- 10:34宝珀Ladybird贝蒂女士系列钻石舞会炫彩腕表 焕新演绎尊贵皇家紫色
- 10:36HTX携手HTX DAO共庆BTC披萨节,开启Web3全球化共识新篇章
- 10:08化学工业出版社一行到访外研在线 调研出版数字化转型路径
- 21:31BTC披萨节遇上TRUMP晚宴,HTX送出百万USDT狂欢福利
- 16:09HTX“火星计划特别版”新晋候选人出炉,用户太空之旅进入冲刺阶段
- 13:502025第四届石油石化装备产业科技大会暨科技创新成果展览会成功召开
- 19:352025第四届石油石化装备产业科技大会暨科技创新成果展览会成功召开
- 13:49恩捷李晓明:加速领跑全球锂电隔膜赛道
- 15:17HTX披萨狂欢节用户红包活动开启:联动七大加密项目限时送200,000
- 09:352025燕京啤酒510 BigDay启幕,解码全域营销新范式


