每天可审数亿张图片 AI解放人工鉴黄师|鉴黄师|深度学习|色情图片
随着AI(人工智能)的发展,人工鉴黄师逐渐从鉴黄行业里被“解放”出来。
“AI鉴黄师每天可审核数亿张图片,识别准确率高于99.5%。”阿里安全部高级算法专家威视向第一财经记者举例称,如果一天要审核4亿张图片,单纯由人工来审,一人一天审1万张,需要4万人,而AI鉴黄只需将其中20万张可疑的图片筛出来,由人工再审一道,只需要20人即可。
传统的人工鉴黄师通过一双肉眼鉴别色情图片和视频。听起来像是“福利”,但实际上并不轻松。如今,伴随着互联网上社交媒体、直播、短视频的发展,每天光上传的图片就超过10亿张,发文数量超过5亿条,不少色情、暴力等内容充斥其中。
2015年10月,阿里巴巴“绿网”上线,用人工智能识别网络上包括色情、暴力在内的违规信息,阿里AI鉴黄师应运而生。通过人工智能、深度学习和大数据样本等技术,阿里巴巴的AI鉴黄师训练识别千万张正常图片与色情图片,最终生成一个智能鉴黄模型。
第一财经记者了解到,阿里的鉴黄AI做的色情图片检测,从原理上来说,就是一个典型的图像分类问题。当前的解决方案是标注样本后,使用深度学习技术训练一个人工神经网络。具体步骤包括明确分类标准→收集样本→样本打标→模型训练,四个步骤。其中前三个步骤主要由人工完成。
“我们要做的就是拿图片去‘喂养’它,让它不断学习,变得越来越聪明。”威视表示,最初在获取样本时,阿里筛选了近2000个网站、6000多万张色情图片,经过去重,标注1300多万张高质量的色情图片。之所以严格把握样本打标的过程,是因为深度学习,对高质量的标注数据有很高的要求。数据标志质量越高,最后模型的精度就会越高。
由人类经过千挑万选建立起来的高质量“色情图片”数据库,最后交由模型训练。威视表示,GPU机器单机单卡的情况下训练时间要近一个月,后来阿里团队更换了网络结构并实现了多机多卡训练,将千万级别样本的训练时间控制在一周左右。
不仅仅在识图领域,威视告诉记者,AI鉴黄还覆盖到了语音、视频等多媒体领域,目前已经可以识别中文、英文、日文、俄文等语言,还可以识别中国多省份方言,无语义的呻吟声也能识别。
这离不开阿里在AI领域的布局。
2017年底,阿里云总裁胡晓明首次全面揭幕了阿里产业AI布局和生态:以阿里云为基础,从家居、零售、出行、金融和智能城市、智能工业六大方面展开的产业布局,以及从视觉、语音、算法到芯片构建的立体合作伙伴生态。
在学术和开发者方面,在阿里的体系中,已经有2所大数据国家工程实验室,天池平台聚集了11万+数据开发者,AUCP(阿里云大学合作计划)计划让大数据、AI相关课程部署到了307所中国大学。
第一财经记者了解到,在时间分配上,阿里很多科学家都是三三制,跟业务的紧密沟通占到三分之一的工作时间,还有三分之一是用来带领团队,另外三分之一用来跟踪全球最新、最前沿的技术发展趋势,为团队规划研发方向。

- 12家科技企业ESG观察,谁领先,谁落后?2023-06-20 06:22
- OpenAI再获百亿融资 估值近300亿美元2023-06-20 06:20
- 大厂战投疑遭重击,中国托拉斯时代终结 | 2022-01-21 17:35
- 仅凭两款单品年GMV达千万,新锐食品品牌怪力食厂从植物蛋白破圈 | 2022-01-21 17:35
- 扩张、亏损、关店,集合店KK的第二次救赎 | 2022-01-21 17:35
- 虚假宣传、诱导付费,陌生人社交App困于“荷尔蒙” | 2022-01-21 17:35
- 2022,AI上市“大年”? | 2022-01-21 17:35
- 小马智行瞄准车规级量产,推出第六代自动驾驶软硬件系统 | 2022-01-21 17:35
- Forrester最新报告:阿里云首次挺进全球容器领导者象限 | 2022-01-21 17:35
- 数策指今纸巾宝获A+轮融资,希投投资领投 | 2022-01-21 17:35

- 10:39LeadeRobot具身智能应用标杆:柔韧自动充电机器人加速智能化出行体
- 10:10再获权威认可!数势科技上榜IDC中国AI Agent应用市场全景图报告
- 11:53京东商家成长白皮书揭秘:卖河南铁棍山药,半年营收增100倍
- 10:02LeadeRobot具身智能应用标杆:无人机X柔韧具身智能,空中精准作业
- 10:27恩捷李晓明:多方举措齐上阵,全力助推新能源领域蓬勃发展
- 09:59JJ斗地主:严守准则,全力阻止任何赌博活动!
- 09:47品质优先x交互跃迁:双轮驱动下的HUD千亿市场确定性增长
- 14:19恩捷李晓明:以合作与创新为驱动,积极助力新能源产业迈向新征程
- 09:18JJ斗地主:秉持底线,严格禁止各类赌博活动!
- 18:21TRON x HTX DAO 2025 香港之夜盛大举行:坚守行业建设,
- 11:24美的 X 站酷 | 一场关于集团IP设计生态的破圈实验
- 11:20美的 X 站酷 | 一场关于集团IP设计生态的破圈实验
- 11:19美的 X 站酷 | 一场关于集团IP设计生态的破圈实验
- 17:56“区块链奥特曼”单挑“金融哥斯拉”:孙宇晨要做Web3守夜人
- 15:52解密福布斯选择标准:为什么是孙宇晨?——从云栖湖畔到加密帝国,新一代中国
- 15:55恩捷李晓明:多维度发力,逐鹿新能源材料领域新征程
- 15:11中国首部《癌因性厌食诊疗专家共识》发布,美适亚甲地孕酮口服混悬液获推荐
- 11:28恩捷李晓明:湖南恩捷亮相高峰论坛,展现固态电池领域实力与发展决心
- 10:57JJ 斗地主:以禁止赌博为原则,打造纯净游戏平台
- 10:01苏州稻香村牡丹鲜花饼焕新上市 颜值、口味全面升级!
- 16:27推出新一期股票激励计划,舍得酒业凝聚发展共识,着眼长远
- 08:45中创碳投发布《亚洲地区主要商业银行气候相关信息披露洞察(2024)》
- 08:33周大生经典“哇!故宫的二十四节气”绘就玉兰与春意的永恒诗篇
- 17:51寿山福海公建民营机构样板受瞩目,政企合作共促养老产业高质量发展
- 17:50寿山福海公建民营机构样板受瞩目,政企合作共促养老产业高质量发展
- 17:36复兴正当时!沱牌特级T68引领沱牌加快成为“名酒典范”
- 15:07恩捷李晓明:凭创新实力闪耀“2024新经济企业TOP500”榜单
- 16:55梵高《野玫瑰》与周大生梵高Van Gogh系列:艺术与情感的传承与升华
- 10:48JJ 斗地主:严守禁止赌博准则,全方位打造棋牌游戏健康新局面
- 16:15东方药林受邀参加“2025共筑满意消费3·15企业直播联盟”活动


