祝恒书:智能招聘,用AI遇见最AI的你_风闻
青贝克智慧工场-2021-07-07 10:55
编者按:6月25日,数字时代的招聘进化峰会在北京香格里拉饭店成功举办。本次峰会由中国人力资源开发研究会指导,中国人力资源开发研究会智能分会主办。百度人才智库(TIC)主任、中国人力资源开发研究会智能分会常务理事祝恒书博士以《用AI遇见最AI的你:百度智能招聘技术与应用实践》为题做了主旨发言,现场400余人参加了会议,座无虚席、气氛热烈,同时有1万余人通过在线直播观看了会议。以下为演讲实录:
祝恒书:非常感谢中人会智能分会举办的“数字时代的招聘进化峰会”,能够让我和大家分享一下百度过去几年在智能招聘上积累的一些应用和实践。
我今天的演讲主题是《用AI遇见最AI的你》,事实上这是百度在2018年智慧校招项目上的一个宣传标语,我们希望能够通过用AI技术来帮助百度招到AI领域最优秀的人才。
百度为什么会成为一家人工智能企业?
首先和大家再重新介绍一下百度,大家可能都知道百度是一家搜索引擎公司,或是一家移动互联网企业,但事实上,今年3月百度在港股二次上市的招股书上,百度被正式定义为一家拥有强大互联网基础的领先AI公司。为什么这么说?
首先百度拥有大量用户粘性非常强的移动互联网产品,比如百度地图、百度APP、百度贴吧、百度网盘以及一些其他生态的产品,像爱奇艺等等。这些产品帮助百度积累了大量的用户和数据基础,比如说百度APP的日活用户超过了2.3亿,百度搜索每天响应来自于全球的数十亿次搜索请求,百度地图每天响应超过了1200亿次的位置服务请求。基于这些强大的互联网基础,百度从很早就开始布局AI业务,也非常荣幸的在2019年入选了由《哈佛商业评论》评选的全球AI 公司5强榜单,评委将百度称为是一家全球领先的人工智能平台型公司,也是AI领域投入最早、技术最强、布局最完整的企业。
AI是如何赋能企业智能化转型的?
说到百度AI就不得不提到百度大脑,百度大脑是百度人工智能的一个集大成者。百度大脑是百度面向其生态合作伙伴,以及全球开发者提供的一个开放的AI云平台。百度大脑目前包括了基础层、感知层、认知层、应用层和平台层等不同层面的能力,贯穿其中的是百度的AI安全能力。
以基础层为例,百度大脑覆盖了我们经常说的AI时代的三大驱动力,简称ABC,A就是算法,B是大数据,C是算力。
具体来说,在AI算法领域,百度积累了大量人工智能的算法,包括自然语言处理、语音识别、知识图谱、数据挖掘等,有了这些算法基础、数据基础和算力基础后,百度就可以向生态合作伙伴以及全球的开发者提供各种各样的开放AI能力。
目前从最底层的开源深度学习平台飞桨,到各种场景化的定制服务等等,百度已经向生态合作伙伴开放了数百种AI能力,开发者们可以基于百度的AI开放能力进行快速的产品开发,从而赋能其商业发展和企业数智化转型。
去年,我们正式发布了百度大脑智能招聘解决方案,这也是全球第一个真正的智能招聘综合AI解决方案。目前该解决方案集成了简历筛选、人才评估、人岗匹配等一系列开放智能招聘AI能力。
为什么百度要做智能招聘这个方向呢?事实上,这与百度自身的人才价值观是一脉相承的。百度一直强调“招最好的人,让优秀的人脱颖而出”。因此,百度希望用一些领先的技术手段去找到那些最适合百度的优秀人才。
从市场的角度来看,随着大数据、人工智能时代的到来,出现了非常多像百度一样的轻资产型公司,对于这样的公司来说,人才就是其最核心的竞争力和最宝贵的财富,但对于优秀人才的招募也是非常困难的。
从供给侧来看,整个就业市场是非常巨大的。根据官方数据显示,全国就业人口大概有7.7亿人,其中超过七成会在三年内更换工作,而七成中又有超过三成会在一年内更换工作,但即便有如此巨大的就业市场,招聘工作仍然非常费时费力。为什么这么说?
大家都知道招聘中一个词叫招聘漏斗,从一开始的寻找(sourcing) 、筛选(screening)到最后发offer阶段,其过程是一个漏斗结构。从数据来看,高科技企业的招聘漏斗比例通常是超过100:1,什么意思?也就是说要招聘一个岗位,可能要筛掉超过100份简历,最终才发出一个offer,而且还有可能被候选人拒绝。所以这是非常费时费力的工作。但传统的招聘手段又非常依赖于招聘专员和用人经理本身的专业能力,所以也存在着很多弊端,包括主观经验导向等等,这会让很多优秀的人才成为沧海遗珠。
百度作为一家AI企业,希望通过技术的手段去赋能传统的招聘,实现大数据、智能化的转型,实现客观、科学的人才招聘方式。
在招智能招聘方向上,百度最早从2015年开始布局相关的技术积累。依托于百度自身强大的自然语言处理、机器学习等算法基础,我们开发了一系列面向智能招聘的核心AI能力,包括岗位预测、技能抽取、简历解析,甚至是智能JD生成技术。同时还开发了简历画像、人才搜索、人岗匹配等场景化的定制AI能力。
祝恒书
智能招聘的三类应用场景
目前,百度的智能招聘可以服务于企业招聘、猎头招聘、校园招聘等不同的应用场景。接下来还将结合具体的三类招聘应用场景,讲一下百度智能招聘的相关技术。
首先第一个场景是智能化的简历评估与筛选,这是招聘漏斗中从寻找(sourcing) 到筛选(screening)的第一个阶段,此阶段往往是招聘筛选比例最高的一个阶段,也是最耗时耗力的一个阶段。
在此阶段,我们要如何快速的从大量的简历中筛选出优秀的候选人呢?
随着现代信息化技术的不断发展,以及大数据、人工智能的时代到来,岗位的专业技能会越来越细分、越来越专精,比如AI就可能细分成自然语言处理、数据挖掘、机器学习等不同的领域,这对于招聘专员本身的专业能力要求会非常高。因此整个简历筛选过程就变得非常费时费力,而传统的招聘专员该如何来做?恐怕通常只能用一些硬性的规则去筛选。
比如校招,要看候选人的毕业学校是不是985、211?候选人的GPA(Grade Point Average,学习成绩)怎么样?如果是社招,要看候选人是否来自大企业?这样的形式从大概率来讲是没有问题的,但会埋没许多优秀的人才,同时也不符合我们常说的“不拘一格降人才”的价值观。
那百度想做的是什么?即便这是大海捞针的工作,百度也希望做到大规模精细化的人才招聘,避免在人才的大海中出现沧海遗珠。因此,百度想通过技术的手段来帮助招聘专员进行快速的、智能的、精确的简历筛选。
为此,百度构建了全球最大的中文招聘类知识图谱,这是干什么用的?核心是帮助企业在招聘工作中去构建不同的职位、不同的技能、不同的角色、不同岗位间的关联性。
我们基于百度自身的丰富互联网数据以及招聘数据,构建出了具有丰富实体和关系的招聘知识图谱,包括岗位、领域、资格、技能、薪酬等实体,以及像同义词、上下位、属于等实体关系。
在构建知识图谱的过程中,存在着非常多的技术挑战。举例来说,因为知识图谱的构建是一个大规模的工作,且存在大量噪声数据。因此我们也设计了许多人工智能算法来解决这些问题,比如我们最近提出了一种基于深度学习的实体关系补全模型,从而实现了招聘实体关系的精准预测,相关的成果也发表在了AI领域的顶级学术会议和期刊上。
基于这个招聘知识图谱,我们下一步就可以构建一个智能化的简历画像模型,去帮助企业进行快速的人才筛选。那该怎么做呢?
有了知识图谱以后,就可以对简历中的关键信息、多维度信息进行快速的、精准的、有效的抽取,然后再通过企业招聘工作中积累的历史评测结果,就可以构建一个有监督机器学习模型对每一份简历进行打分,根据打分结果,对简历进行快速的筛选。
智能化的简历筛选模型,最后会取得什么样的效果?我们在百度内部做过一个测试,针对一批岗位通过AI算法推荐了100份简历,最终有81份简历发送了offer,效果非常好。相比于传统招聘,智能简历筛选的效率超过了40倍。
第二个应用场景是如何通过智能方法进行有效的简历分发和岗位推荐。用专业名词来说就是智能化的人岗匹配。具体来说,当有通过第一步的简历筛选后,我们积累了很多优秀的简历,以及成千上万的岗位信息,我们希望进行多对多的、精准的人岗匹配,实现智能化的给人推岗和给岗推人。
举个例子,比如我们要招一位数据挖掘方向的人才,但在招聘要求中或许只写了精通数据挖掘这一个宽泛的要求。事实上,在候选人的简历中,通常不会直接写精通数据挖掘,所以直接的关键词匹配很难做到精准。因为真正懂数据挖掘的人可能会写在一些大数据分析领域有过竞赛、有过得奖,或者发表过相关论文,参与过相关项目。这些内容实际上就是与数据挖掘在语义层面构建了匹配。因此百度提出的全球首创的基于深度学习的人岗匹配模型,可以实现对招聘要求和候选人经历进行语义层面的深度匹配。这个模型也发表在学界的顶级会议和期刊上,目前已经成为了学界和业界在智能招聘领域的标志性模型。
我们把提出的深度学习模型在许多真实招聘数据集上进行了测试,均取得了远超于经典机器学习算法的效果。同时深度学习模型还可以提供可解释性的人岗匹配,比如可以告诉你在招聘过程中中最需要关注、最重要的岗位要求是什么?以及候选人简历上的工作经验中哪些能力、哪些经验和相关的工作与岗位要求存在语义匹配。这样就可以帮助招聘专员进行非常有效的高可解释性的匹配。
相关的人岗匹配模型也在百度大脑的智能招聘平台上线,可以实现一对多和多对多的匹配,同时人岗匹配的算法也在百度内部和外部的招聘场景中得到广泛的应用。
比如百度的内推系统和百度招聘平台,都用到了相关算法。不管是社招还是校招,只要候选人上传了自己的简历,就会从百度发布的上千个岗位中推荐出最合适的三个岗位,通过历史数据回测来看,通过机器推荐的三个岗位进行投递的候选人,入职率要远高于自主投递。
第三个场景是百度智能化的笔试和面试评估场景。大家都知道在进入Gate阶段的时候,需要对候选人进行能力评估和评测。而对候选人评估最有效的方法就是笔试和面试,笔试多在校招场景下。但传统的笔试和面试都存在弊端,为什么这么说?
笔试是针对大规模候选人场景设置的,因此通常只能针对某一类特定的岗位进行通用化设置。比如说企业今年要校招,有几十万候选人,通常只能做到算法类是一套题目,运维类是一套题目,软件工程师的题目可能稍微再细分一下,比如Java是一类,前端是一类等等。即便这样依然不能做到真正精细化的评测。
随着信息化时代的到来,招聘对于人才技能的要求越来越专精,例如数据挖掘可能细分到关联规则分析、预测建模、机器学习等,其中机器学习有会包括有监督学习和非监督学习,还有深度学习等等不同的细分能力。同时,即便是同样做人工智能算法,你用的是TensorFlow,我用的是PaddlePaddle(飞桨),每个人在技术上不尽相同。我们希望能够对候选人进行个性化评测,实现千人千面、万人万面但又不失公平的一种笔试评测。
同样,面试场景又非常依赖于面试官本身的专业素质,不同的面试官可能对候选人的关注点也是不同的,有的面试官可能重点考察候选人的岗位要求,有的面试官可能更关注候选人本身的项目经历,而我们更希望能够通过智能化的方法给面试官一些参考性的意见或决策支持。
我们希望实现真正的智能化、个性化、千人千面、万人万面的候选人评估和评测。基于此背景,百度构建了全新的、个性化的面试笔试问题推荐算法,其中推荐算法依赖于百度自己积累的评测结果及海量的互联网大数据。本质上我们是构建了一个用于智能面试、笔试评测的技能知识图谱,它会告诉我们在这次面试中最需要评估的技能是什么,以及他们的重要性是什么?
有了这样的知识图谱,再结合智能化的推荐系统算法,就可以实现个性化的面试、笔试评测的问题推荐。
相关的算法已经在百度的智慧校招项目中得到了广泛的应用。从2018年开始,百度面向校园候选人提供了智能笔试龙虎榜这一产品。也就是在正式招聘笔试开始前,百度校招官网给候选人提供了一个智能笔试的机会。学生可以先上传一份自己的简历,然后根据推荐的岗位进行投递,这时算法会自动化生成10道个性化的笔试题目,每个人的问题都不一样。当候选人完成试卷以后,得分能够排在周榜前三名或总榜前50名就可以直通面试免笔试。通过历史回测数据来看,通过智能笔试入选的候选人,在后续的offer转化率、面试官评价等方面都取得了比传统笔试要好的效果。
同时经过面试官的反馈,通过智能化、个性化的笔试使得候选人很难再进行简历造假。为什么?因为一旦候选人在简历中写了他不擅长的内容,那么AI就会考察其相关的能力,这样就会得到比较低的评分。如果候选人在简历中写的比较宽泛,那么考察就会非常宽泛,同样候选人也不占优势。因此这个智能评测平台会帮助招聘官进行更有效的人才评估。
AI可能会取代你现有的工作
但也会给你推荐最合适的工作
基于刚才介绍的不同场景化技术,百度提供了许多智能招聘的产品,除了百度大脑的智能招聘解决方案,还开发了百度云智学院才智中心,这也是全球第一个集AI+招聘+评测为一体的智能云服务平台,希望通过这个平台去赋能企业人才招聘全面智能化。同时我们还打造了百度百聘的智能机器人——求职精灵,这个主要是面向C端蓝领的招聘产品,通过算法给不同的蓝领候选人推荐合适岗位。
智能招聘技术除了在招聘场景本身得到应用外,还可以把相关的技术延伸到其他领域进行人才评估,比如说对优秀的学术型人才进行评估。今年百度人才智库(TIC)联合百度学术、天津大学、中科大发布了全球AI华人新星百强榜,榜单是从全球范围内筛选毕业时间不早于2020年的优秀华人学者,设置了自然语言处理、数据挖掘、机器学习和计算机视觉四大方向,每个方向选出最优秀的25名候选人。榜单的主要评测标准是基于我们开发的学术水平、学术影响力、学术潜力等智能评测技术。
百度智能招聘技术得到了国内外许多主流媒体的广泛报道。其中一个国外媒体报道称:“AI Could Take Your Job, But Baidu’s Newest AI Can Also Help Your Find One”。什么意思呢?翻译成中文就是现在大家现在都在鼓吹AI威胁论,说AI会取代大家的工作,但百度的AI技术可以帮助大家找到最合适的工作。我认为这是非常好的AI技术实践理念,也非常符合百度作为一个高科技企业的企业社会责任。
谢谢大家。
(请关注青贝克公号:kingmaker798)