自动驾驶技术、智能服务工作台、CT影像分析诊断系统……近年来,人工智能(AI)技术应用让人们的工作效率大大提升,而这背后离不开人工智能训练师的默默奉献。
日前,人力资源社会保障部与国家市场监管总局、国家统计局联合向社会发布了16个新职业,人工智能训练师名列其中。阿里巴巴集团调研数据显示,预计到2022年,人工智能训练师国内外相关从业人数有望达到500万,大量人才缺口亟待满足。
助力AI智慧成长
在北京市房山区互联网金融安全示范产业园内,一节为自动驾驶系统量身定制的“课程”正在进行。通过数据标注工具,24岁的人工智能训练师刘雪将图片中一辆巴士用矩形框圈出,并给这个框打上“巴士”的标签,然后继续在图像上标记其他车辆、交通标志及自行车等物体。
“这些打好标签的图片、文字和声音等数据将会成为自动驾驶系统的学习材料,帮助人工智能算法学习识别道路中影响车辆行驶的实体。”作为人工智能训练师,刘雪并没有参与自动驾驶系统的开发工作,但后期大量的数据标注为系统运行打下了坚实基础。
“相较于人工智能开发者,人工智能训练师的工作更加偏向产品的实际使用过程。”海南省区块链产业研究院专委副主任、海南大学教授段玉聪介绍说,人工智能训练师利用智能训练软件,对实际使用中的AI产品进行数据库管理、算法参数设置、人机交互设计、性能测试跟踪及其他辅助作业。
换言之,设计之初的AI产品就像刚入学的孩子,人工智能训练师需要根据产品预设的不同落地场景“因材施教”,通过不断地培养和训练帮助AI产品“长大成人”,让其有足够的智慧应对实际应用场景中的各种问题。
除了训练和培养AI,人工智能训练师前期还需要对AI学习的材料进行加工,即通过数据筛选得到结构化的核心知识和关键数据,以特定的数据标注规则将数据“喂”给AI并进行“训练”,同时根据其反馈不断调整参数优化算法,让AI更好地为人类服务。
高效服务抗击疫情
新冠肺炎疫情期间,人工智能训练师和AI技术在防疫抗疫、生活出行等方面展现了高效的服务能力。
在抗疫前线,AI技术被大规模应用在病人CT影像的分析诊断中。基于先期大量确诊病例和疑似病例的影像特征数据,人工智能训练师帮助人工智能系统学习分辨新冠肺炎案例与流感等其他患者CT影像特征的区别,从而实现快速分诊,有效阻断了传染源和降低交叉感染风险。
数坤科技首席执行官马春娥表示,该诊断系统已在全国近百家医院上线使用,敏感性超过95%。未来将通过人工智能跨学科、多模态的综合学习,对复阳病例、无症状感染者、新冠肺炎合并其他基础性疾病等特殊人群进一步研究,为精准防治提供科学支撑。
重庆市沙坪坝区则通过智能外呼系统进行“无接触式”防疫摸排,向居民了解是否有发热等不适症状、是否从外返回复工等问题。基于疫情信息和预先学习,系统可在在最短时间内自动识别出疑似患者和需要接受隔离检疫的人员。“16.8万份数据若由人工分析需要半个月,AI只用了约4小时。”沙坪坝区政法委办公室主任刘毅介绍,智能外呼系统每分钟可拨打3500个电话,大大提高了摸排效率。
在人工智能训练师的帮助下,智能外呼系统还顺利接入各大铁路航空票务系统,让全国230万受疫情影响旅客的票务出行问题得到及时解决。此外,阿里巴巴客户体验事业群的人工智能训练师仅用22小时便实现健康智能服务工作台落地,满足了不断增长的在线健康问诊需求,服务效率大大提升。
人才缺口亟待满足
“我被分配在‘3D语义分割’小组给图片信息做标注。”去年,在外打工的小陈回到贵州老家接受企业培训,开启了人工智能训练师的生涯。小陈说,虽然自己对“人工智能”毫无概念,但好在学过的计算机知识派上用场,感觉这活儿不难。
随着AI产业的发展,越来越多的业务人员“跨界”当起了人工智能训练师。阿里人工智能训练专家王智宇介绍说,业务人员转型人工智能训练师的核心竞争力就是其对业务的理解能力。“我们可以教会他智能训练和数据分析的思路,但无法教会他对业务本身的理解能力。”
针对不断扩大的人才缺口,整个AI行业都开始着手培养自己的人工智能训练师。不过在国内近50万人工智能训练师从业者中,从事数据标注等简单任务的人员却占了绝大多数。而在分析提炼专业领域特征,训练和评测人工智能产品相关算法、功能和性能,以及设计人工智能产品的交互流程和应用解决方案等方面具有相关知识和从业经验的人员却是“凤毛麟角”。
“人工智能训练师需要不断学习,提升自己的综合素质。”段玉聪分析称,AI行业在短期内对数据标注员仍有大量需求,但随着无监督自我学习算法的兴起,AI对数据的依赖性将减轻,人工智能训练师的工作重点也将发生变化,偏向AI算法测试等技术型人才缺口将更加突出。
专家表示,如果人工智能训练师能系统地积累经验,把感性经验总结为理性的认识,通过不断持续练习,总结出更深层的原理,进一步提升创造性,在职场上会更有竞争力。