数据不完美 再智能的AI也会被“逼疯”
如果说人工智能是一辆飞奔的豪华跑车,那么数据就是提供强劲动力的燃料,这种能源不仅要充沛,还要确保质量。否则,就会产生瑕疵影响跑车的速度和行进轨道,甚至会引发AI的“生命危险”。
日常生活中,数据的类型大体可分为结构化数据、非结构化数据、半结构化数据。一个数据从产生到落地要经过收集、传输、分析、检索、挖掘等阶段。分析让大量的数据有了价值,机器要学会像人一样学习、思考、推理、交流,进而与应用场景相结合,从规律中预测未来。不过,要让机器像人一样去“看”数据,恐怕穷尽一生也无法分析完。
举个例子,计算机在进行视觉训练时,如果用1万把椅子的照片让其学习,人的固有思维会先记住椅子外观的关键组成部分,比如椅背和椅子腿。而对于机器学习来说,它们或许会找到一些新的特征,并对这些特征进行归纳来识别出一把新的椅子。这一过程中,需要有海量、不同的椅子照片供给计算机去学习。
如果深究技术层面,数据分析所用的map-reduce算法可将数据分解为多个部分,利用hadoop集群对每一部分的数据进行分析,之后将效果汇总经过多轮计算筛选出结果。解析过程中,对每轮结果的优化又会引入Spark这种快速通用的计算引擎。如果强调实时数据处理,也会用到storm等计算框架。
然而,就像柴油注入汽油车会出问题,也不是任何数据对人工智能都有积极作用,不少案例已经可以证明这一点。例如,有些聊天机器人在网络上学习了负面评论,就会变得“尖酸刻薄”甚至引发了种族歧视问题。可见,数据的开源性固然重要,但如何找到有质量的数据对AI发展有着决定性的影响,尤其是在受到高度监管的行业。
人工智能的负面影响不仅在于学习偏差,还可能被黑客利用成为新型网络攻击的武器,甚至出现伦理问题。如果数据本身是有瑕疵的,那么不管是有意还是无意,人工智能系统都会基于这样的数据进行训练,带来的后果可想而知。举个例子,一个信用卡审核系统要是用有偏差的数据构建解决方案,就会对某一类的申请人给初带有偏见性的结论。往坏处想,这或许就是马斯克眼中“AI毁灭人类”的开端。
如今,小到Alexa、Siri这些虚拟机器人对人类语言理解的错误判断,大到自动驾驶在道路测试时发生的交通事故,都在印证着人工智能在利用数据进行训练时仍有相当大的上升空间。也就是说,人们除了要在数据合规的基础上,开放更多的数据源,还要借助区块链等新技术或手段为这些数据建立完善的审核机制。
互联网时代的快节奏让数据也跑在快车道上,松懈不得。以城市交通治理为例,每天在城市道路上都在发生着堵车或者事故,如果做不到对数据的实时分析就难以立刻找到有效的疏通办法,而在上下班高峰期时的交通堵塞往往因为某一个信号灯故障就会引发。
再比如,工业互联网时代产生的数据量比传统信息化要多数千倍甚至数万倍,并且是实时采集、高频度、高密度的,动态数据模型随时可变,甚至良品率的细微变化都会带来数据模型重建。这样一来,如果做不到工业数据实时更新,智能制造就无从谈起。
总的来说,即使人工智能有一天真的成为“类人”,仍然离不开人类将其引导上一条正路。无论是伦理还是情感问题,都要基于数据进行判断,而要是数据的质量无法保障,再智能的AI都会被“逼疯”。

- AMD助力微软Windows 11 为用户带来强大、可靠的计算能力2021-10-09 16:20
- 游戏玩家为之疯狂!Chinajoy2021 AMD展台那些火爆的瞬间2021-08-02 15:39
- 全场最佳 AMD Chinajoy2021展台圆满收官2021-08-02 15:38
- AMD 锐龙5000G系列处理器正式亮相Chinajoy20212021-08-02 11:50
- 极速制胜 制霸游戏 AMD携多款游戏神器扬威Chinajoy2021-08-02 11:44
- 央视《新闻联播》头条聚焦铁建重工,聚力攻克“卡脖子”技术难题2021-03-22 11:08
- 刚刚!我又上央视新闻联播头条了!2021-03-22 11:04
- 中国电科(3月1日-3月7日)要闻回顾 | 资讯轻阅读2021-03-22 10:47
- 我国将建第一个国家公园:为何是三江源2021-03-22 10:43
- 美国硅谷上演“大逃亡”:郊区成科技精英避难所2021-03-22 10:41

- 18:09东方药林药业有限公司:秉持长期主义,稳步推进全球化市场布局
- 17:54广东康力医药:立足本土放眼全球,打造走向世界的中国健康名片
- 14:15从KS到CES Asia:纵深视觉科技全栈方案引爆光场显示市场
- 10:32康力医药:聚焦大众健康需求,打造一体化全链条服务生态
- 09:38华创农食相融,筑牢乡村粮食安全屏障
- 09:23东方药林小毛巾:天然竹琨选材,打造洗护好产品
- 14:52华创聚力创新,引领智慧人居新潮流
- 14:50康力医药:扎根行业三十载,书写民族健康品牌成长答卷
- 14:30东方药林:布局长远战略,绘就抗衰事业发展新图景
- 16:55东方药林:聚焦抗衰赛道,创新驱动企业高质量发展
- 10:27当行业需要“判断者”:张红梅以专业视角参与宠物科技领域重要评审工作
- 09:52华创政企携手,共建多元人居新生态
- 18:09华创践行担当,以初心赋能民生安居
- 18:03聚焦核心单品与场景创新:水井坊以消费者驱动破局存量时代
- 14:16华创精耕品质,打造宜居生活新标杆
- 20:38深耕供应链:从环境日看水井坊的绿色转型路径
- 20:38聚焦终端精细化运营,水井坊多维举措赋能渠道生态
- 14:41建筑工程专家王晗获聘元培工匠专家谷客座教授及高级智库专家
- 14:26清晨生物深耕文化保护,打造道养文化主题景区新地标
- 13:47中国氢储能产业加速落地: 邹昊参与推动新能源储能示范工程建设
- 15:22数智健康新机遇:大健康AI趋势与清晨生物HiLife平台新布局
- 15:05清晨生物全新品牌“清晨HiLife”——定义数智化健康发展新未来
- 14:47清晨Hilife健康伙伴“辰宝”上线啦! 不止是AI,更是懂你的智能助
- 14:27广州易萃享:数智赋能羊城家庭,打造全家健康守护首选品牌
- 09:14广州易萃享:扎根广州立足华南,树立区域精准营养行业标杆
- 08:59易萃享健康:数智技术打破壁垒,实现全民健康管理零门槛
- 09:29易萃享健康:全周期健康守护,打造家庭健康管理超级管家
- 17:36东方药林OMF2026全球抗衰领航者峰会举行,灵犀AI重磅发布
- 11:48易萃享:AI 科技深度赋能,让精准养生融入现代日常生活
- 10:45易萃享:千日匠心打磨,开创精准营养个性化全新赛道



