简历评估方法和装置与流程

文档序号:12034604阅读:343来源:国知局
简历评估方法和装置与流程

本发明涉及数据处理领域,具体而言,涉及一种简历评估方法和装置。



背景技术:

在现有技术的招聘过程中,很多招聘网站通过社交网络、可得行为数据等各方面对应聘者的完整形象进行刻画,从各个方面对应聘者进行了解,从而希望帮助招聘方找到合适的人才。例如,作为大数据招聘平台的“寻英网”,以大数据算法实现人才与企业职位的精准匹配,并具有“职位需求一键同步至主流招聘网站”等实用功能;“寻英网”的特点包括:(1)全量数据,形成多维度立体的用户求职图像。寻英网通过高科技获取求职者的社交信息、求职者在论坛上发布的言论以及发表的论文等全方面数据,将一个人由过去的平面图片拓展到一个人的电影故事,从而形成多维度立体的用户求职图像。(2)个性化,多维度动态分析人才和企业的发展规律,优化双向匹配引擎。寻英网以两千万人的职业发展路径为数据源,通过分析,形成职位晋升图谱,如职位晋升路径、职位关联关系等。

与上述应用功能类似的应用还包括“人才雷达”,“人才雷达”通过每个人在网络上留下的大量的数据,如生活轨迹、社交言行等个人信息,从中剥离出他的兴趣图谱、性格画像和能力评估。

因此,已有方案主要使用社交数据、行为数据等来进行求职人员和职位的匹配,然而使用社交数据、行为数据进行求职人员和职位的匹配存在如下问题:

(1)应用目标过于复杂

现有技术大多的应用场景集中在对合适人的匹配,落脚点在人的属性,为了实现这个目标需要对人的行为、社交数据进行分析,全面的对人进行评价和刻画,以至于大大提升对数据全面性和数据多样性的要求。

(2)数据的可得性和全面性受到局限

现有技术为达到寻找到合适的员工的目的需要搜集多方面的数据,所以对数据的可得性和数据的全面性有很高的要求,同时也大大的局限了技术的准确性。

针对现有技术中通过对目标人物的行为、社交数据进行全面分析来评价目标应聘者,导致评估难度大的问题,目前尚未提出有效的解决方案。



技术实现要素:

本发明实施例提供了一种简历评估方法和装置,以至少解决现有技术中对应聘者进行评估通过对应聘者的行为、社交数据进行全面分析来评价应聘者,而应聘者的行为、社交数据复杂多变且获取难度高,从而导致评价的估难度大的技术问题。

根据本发明实施例的一个方面,提供了一种简历评估方法,包括:获取历史招聘数据集合,其中,历史招聘数据集合至少包括:简历文本数据;从历史招聘数据集合中抽取数据,其中,数据至少包括:一个或多个属性在职位上对应的招聘结果,一个或多个属性是简历文本数据中用于表征应聘者特征的参数,招聘结果至少包括:一个或多个属性在职位上的出现次数、和/或一个或多个属性在职位上录取次数;通过训练抽取到的数据构建简历评估模型。

根据本发明实施例的一个方面,还提供了一种简历评估方法,包括:输入待评估简历;获取待评估简历的简历评估结果,其中,简历评估结果是根据简历评估模型做出的,简历评估模型是根据从历史招聘数据集合中抽取数据建立的。

根据本发明实施例的另一方面,还提供了一种简历评估装置,包括:获取模块,用于获取历史招聘数据集合,其中,历史招聘数据集合至少包括:简历文本数据;抽取模块,用于从历史招聘数据集合中抽取数据,其中,数据至少包括:一个或多个属性在职位上对应的招聘结果,一个或多个属性是简历文本数据中用于表征应聘者特征的参数,招聘结果至少包括:一个或多个属性在职位上的出现次数、和/或一个或多个参数在职位上录取次数;构建模块,用于通过训练抽取到的数据构建简历评估模型;评估模块,用于使用简历评估模型对接收到的简历进行简历评估。

根据本发明实施例的一个方面,还提供了一种简历评估装置,包括:第一输入模块,用于输入待评估简历;获取模块,用于获取待评估简历的简历评估结果,其中,简历评估结果是根据简历评估模型做出的,简历评估模型是根据从历史招聘数据集合中抽取数据建立的。

容易注意到的是,采用在历史招聘数据集合中抽取的数据进行简历评估模型的建立,用于构建对某一职位的先验认知,使得对应聘者的分析能够着眼于对应聘者综合实力与职位的匹配程度的挖掘,即,为不同公司的不同职位寻找到合适的简历,这样能够免去对每个应聘者的行为、社交数据进行分析,减少招聘的复杂程度,从而免去了搜集应聘者在各个社交平台上行为数据的繁琐工作,从而进一步的减少在招聘过程 中付出的代价,效果和代价比方面具有更好的表现。

由此,本发明提供的上述方案解决了现有技术中对应聘者进行评估通过对应聘者的行为、社交数据进行全面分析来评价应聘者,而应聘者的行为、社交数据复杂多变且获取难度高,从而导致评价的估难度大的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是根据本发明实施例1的一种简历评估方法的计算机终端的硬件结构框图;

图2是根据本发明实施例1的一种可选的简历评估方法的流程图;

图3是根据本发明实施例1的一种可选的简历评估方法的流程图;

图4是根据本发明实施例2的简历评估方法的流程图;

图5是根据本发明实施例2的一种可选的简历评估方法的示意图;

图6是根据本发明实施例3的一种可选的简历评估装置的结构示意图;

图7是根据本发明实施例3的一种可选的简历评估装置的结构示意图;

图8是根据本发明实施例3的一种可选的简历评估装置的结构示意图;

图9是根据本发明实施例3的一种可选的简历评估装置的结构示意图;

图10是根据本发明实施例3的一种可选的简历评估装置的结构示意图;

图11是根据本发明实施例3的一种可选的简历评估装置的结构示意图;

图12是根据本发明实施例3的一种可选的简历评估装置的结构示意图;

图13是根据本发明实施例4的一种简历评估装置的结构示意图;

图14是根据本发明实施例4的一种可选的简历评估装置的结构示意图;

图15是根据本发明实施例4的一种可选的简历评估装置的结构示意图;以及

图16是根据本发明实施例的一种计算机终端的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

以下的实施例可以应用到可以应用到普通的终端中,例如计算机。当然以下的实施例也可以应用到服务器当中,服务器也可以理解为由一个或多个计算机组成的设备。因此,下面所示出的计算机的结构也适用于服务器。当移动终端计算能力逐步增强,以下实施例也可以在移动终端中实施。当然,下述实施例中的步骤或者模块可以在分别在不同的服务器或者终端或者移动终端中进行,这些服务器或者终端或者移动终端之间进行必要的数据交互即可。

实施例1

根据本发明实施例,还提供了一种简历评估方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例1所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例,图1是本发明实施例1的一种简历评估方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。

存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的简历评估方法对应的程序指令/模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的漏洞检测方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(networkinterfacecontroller,nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(radiofrequency,rf)模块,其用于通过无线方式与互联网进行通讯。

在上述运行环境下,本申请提供了如图2所示的简历评估方法。图2是根据本发明实施例1的简历评估方法的流程图。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

在本实施例中以下步骤中使用了数据集合,一个或多个数据被进行相同或类似的处理,或者作为某个动作或者步骤的依据均可以认为是一个数据集合。

步骤s21,获取历史招聘数据集合,其中,该历史招聘数据集合至少包括:简历文本数据。

在上述步骤中,作为可选的实施方式,历史招聘数据集合的来源可以是目标招聘方的历史招聘数据集合,例如:目标招聘方在预设时间内(如上一个招聘季)参加招聘的人员的信息,以及参加招聘并获取该目标招聘单位职位的人员的信息。获取历史招聘数据集合的方法可以是通过网站自身的数据库来获取历史招聘数据集合。

在一种可选的实施例中,通过数据库获取目标招聘方的近五年的历史招聘数据作为该数据集合,由于招聘方的招聘准则会随着时间的变化而变化,例如,招聘方对学历的要求可能升高,或对应聘者的工作经验更加重视,因此,获取近两年的全部历史招聘数据作为数据集合以及前五年至前三年的部分招聘数据作为数据集合。

步骤s23,从历史招聘数据集合中抽取数据,其中,抽取的该数据至少包括:一个或多个属性在职位上对应的招聘结果,一个或多个属性是简历文本数据中用于表征应聘者特征的参数;作为一个可选的实施方式,招聘结果可以包括:一个或多个属性在职位上的出现次数、和/或一个或多个属性在职位上录取次数。当然,招聘结果页可以包括除这两部分内容之外的其他内容,然后有利于人员招聘的信息都可以统计在招聘结果中。

在上述步骤中,上述用于表征应聘者特征的参数的属性可以是应聘者的学历、专业、工作经验等参数。

步骤s25,通过训练抽取到的数据构建简历评估模型。

在一种可选的实施例中,可以采用gdbt算法对抽取到的数据进行训练,得到构建简历评估模型,在采用gdbt算法对抽取到的数据进行训练时,可以首先采用上述步骤抽取的历史招聘数据集合构建一个或多个维度上的决策树,最终模型的输出结果为多个决策树得到的结果的累积值。

此处需要说明的是,对抽取到的数据进行训练的算法可以是上述gdbt算法,但不限于此。对抽取到的数据进行训练的目的在于使构建的简历评估模型学习抽取到的数据,从而使当简历评估模型再次接收到相同或相似的数据时能够得到同样或相近的输出结果,因此训练需要大量的数据,以使在使用简历评估模型对简历进行评估时,应聘者的简历能够落在用于训练的数据之中,也就是说,对于用于训练的数据的数据量本申请不做具体限定,但在一种优选的情况下,抽取到的用于训练的数据量越大、数据的覆盖范围越广,构建的简历评估模型准确程度越高。

步骤s27,可选的,本申请上述实施例提供的简历评估方法还可以包括如下步骤:使用简历评估模型对接收到的简历进行简历评估。

在一种可选的实施例中,将接收到的简历输入至构建的简历模型中,得到模型的 输出结果。在另一个可选的实施例中,可以将模型的输出结果与应聘者预期的职位进行匹配,如果匹配成功则进行提示。提示的方式也有很多种,例如,可以将应聘者的名字使用的不同的颜色来标识不同的匹配度。

此处需要说明的是,由于步骤s23中抽取的数据包括一个或多个属性在职位上对应的招聘结果,而一个或多个属性是简历文本数据中用于表征应聘者特征的参数,因此可以知晓,在步骤s27中当对抽取的数据进行训练从而构建简历评估模型时,并未使用招聘者的行为、社交数据,从而避免了行为、社交数据复杂多变且获取难度高影响简历评估效率的情况发生。还需要说明的是,本申请实施例上述方案在使用了简历中的数据,这些数据是容易获取到的,并且还使用了应聘者的参数(属性)与招聘结果的对应关系,鉴于简历中的数据真实度比较高,因此,不仅不会因为不使用行为、社交数据而引起评估的准确率低,还会由于使用了历史招聘结果中应聘者参数与招聘结果的关系提高简历评估的准确度。

容易注意到的是,通过上述步骤s21至步骤s27,采用在历史招聘数据集合中抽取的数据进行简历评估模型的建立,用于构建对某一职位的先验认知,使得对应聘者的分析能够着眼于对应聘者综合实力与职位的匹配程度的挖掘,即,为不同公司的不同职位寻找到合适的简历,这样能够免去对每个应聘者的行为、社交数据进行分析,减少招聘的复杂程度,从而免去了搜集应聘者在各个社交平台上行为数据的繁琐工作,从而进一步的减少在招聘过程中付出的代价,效果和代价比方面具有更好的表现。

由此,本发明上述实施例提供的方案解决了现有技术中对应聘者进行评估通过对应聘者的行为、社交数据进行全面分析来评价应聘者,而应聘者的行为、社交数据复杂多变且获取难度高,从而导致评价的估难度大的技术问题。

根据本申请上述实施例,步骤s23中从历史招聘数据集合中抽取数据,抽取数据时可以从全部的历史招聘数据集合中进行抽取,但是,作为一个可选的实施例,可以首先对数据进行过滤或者清洗,去除掉认为有可能产生影响的数据。例如,上述步骤s23可以包括如下步骤:

步骤s231,对历史招聘数据集合进行清洗,其中,该数据清洗主要用来将评估不通过的简历从历史招聘数据集合之中屏蔽。

在上述步骤中,对历史招聘数据集合进行清洗的目的在于发现并清除历史招聘数据集合中包括的噪音数据。

步骤s233,从清洗后的历史招聘数据集合中抽取数据。

通过上述两个步骤,可以使抽取的数据更加准确,使建立的简历评估模型更加符 合要求。

对于评估不通过的简历可能有很多类型,例如,评估不通过的简历包括以下至少之一:

由于人员编制headcount导致评估不通过的简历、没有进行简历评估而直接进行面试并且面试未通过的简历、简历重复投递导致评估不通过的简历。

在上述步骤中,headcount可以用于表征招聘方的人力资源在某一职位上针对该职位当前的需求、未来发展的需求以及企业整体规划,对这一职位预定的员工数量,和/或招聘人员数量。

在一种可选的实施例中,应聘者甲符合招聘方的招聘条件,但由于人力资源部门对于应聘者甲所应聘的职位具有预先的人员数量规划,如果聘用应聘者甲,可能会引起员工冗余的现象,因此并不聘用应聘者甲,应聘者甲的简历即为由于编制headcount导致评估不通过的简历。

在另一种可选的实施例中,由于任意原因应聘者乙的简历并未经过评估,而直接参与了招聘方在某一职位上的面试,但面试并未通过,则应聘者乙的简历也被认为是评估不通过的简历。

在又一种可选的实施例中,应聘者丙反复向应聘方的某一职位重复使用不同的方式投递自己的简历,例如,通过不同的招聘网站向同一招聘方的同一职位多次重复投递个人简历,应聘者的简历也被认为是不通过评估的简历。

当然也可以根据招聘单位的实际需要来设置哪些类型的建立是评估不通过的简历。

根据本申请上述实施例,步骤s25中是通过训练抽取到的数据构建简历评估模型。在该步骤中可以将所有的抽取到的数据均应用到建立简历评估模型上,该简历评估模型的检验可以使用真实接收到的简历来进行检验。这种处理方法需要使用真实应聘者的简历来进行检验,有可能将合适的应聘者错误的筛除。作为另一种可选的实施方式,可以将抽取的数据分为两部分,一部分用来进行生成简历评估模型,一部分用来对生成的简历评估模型进行测试,在这种实施例中,步骤s25可以包括如下步骤:

步骤s251,将抽取到的数据分为训练样本数据和测试样本数据。

在上述步骤中,上述训练样本数据包括多个数据,用于通过训练构建简历评估模型,测试样本数据同样包含多个数据,用于验证上述简历评估模型是否准确。

在一种可选的实施例中,训练样本数据和测试样本数据可以是历史招聘数据集合 中的多个维度上的数据。

此处需要说明的是,为了确保简历评估模型的准确性,抽取的数据中被分为训练样本数据的数据是在任意维度上均是多样化的,以确保任意维度上的多种数据都能经过训练,使得简历评估模型能够学习任意维度上的多种数据。

此处还需要说明的是,由于训练样本数据用于构成简历评估模型,测试样本数据用于检验简历评估模型的准确程度,因此,训练样本数据和测试样本数据均为已经知晓招聘结果的历史招聘数据集合。

步骤s253,使用训练样本数据进行训练生成待检验的简历评估模型。下面以一个可选的实施例进行说明。

在该可选的实施例中,假定预先需要招聘的是数据库维护岗位,已经应聘成功的该职位的人员有6名,先使用这6名人员的简历用于训练:

人员1:a学校、a专业、b公司、b职位;

人员2:b学校、a专业、c公司、b职位;

人员3:a学校、b专业、a公司、a职位;

人员4:c学校、b专业、b公司、a职位;

人员5:a学校、a专业、c公司、b职位;

人员6:c学校、b专业、c公司、a职位。

由此可以获得数据维护岗人员的特征:

学校:a学校在6个数据中出现过3次,占比为0.5;b学校在6个数据中出现过1次,占比为0.17;c学校出过两次,占比为0.33;其他学校没有出现过,占比为0。

专业:a专业出现过3次,占比为0.5;b专业出现过3次,占比为0.5;其他专业没有出现过,占比为0。

公司:a公司出现过1次,占比为0.17;b公司出现过2次,占比为0.33;c公司出现过3次,占比为0.5;其他公司没有出现过,占比为0。

职位:a职位出现过3次,占比为0.5;b职位出现过3次,占比为0.5;其他职位占比为0。

在已经应聘成功的该职位的6名人员的简历中,出现过3个不同的学校,3个不同的公司,而仅仅出现过2个不同的专业和职位,因此,从简历筛选的角度来讲,专 业和职位比学校和公司更重要,其重要程度为学校和公司的1.5倍。因此,在进行训练的过程中学校、公司、专业、职位的权重分别为:0.2、0.2、0.3、0.3。

通过上述数值来计算人员的得分:

人员1:a学校、a专业、b公司、b职位;

可以计算得到人员1在各个属性上得分分别为0.5*0.2、0.3*0.5、0.2*0.33、0.3*0.5,即为0.1、0.15、0.066和0.15;

人员2:b学校、a专业、c公司、b职位;

可以计算得到人员2在各个属性上得分分别为0.2*0.17、0.3*0.5、0.2*0.5和0.3*0.5,即为0.034、0.15、0.1和0.15;

人员3:a学校、b专业、a公司、a职位;

可以计算得到人员3在各个属性上得分分别为0.2*0.5、0.3*0.5、0.2*0.17和0.3*0.5,即为0.10.150.0340.15;

人员4:c学校、b专业、b公司、a职位;

可以计算得到人员4在各个属性上得分分别为0.2*0.33、0.3*0.5、0.2*0.33和0.3*0.5,即为0.066、0.15、0.066和0.15;

人员5:a学校、a专业、c公司、b职位

可以计算得到人员5在各个属性上得分分别为0.2*0.5、0.3*0.5、0.2*0.5和0.3*0.5,即为0.1、0.15、0.1和0.15;

人员6:c学校、b专业、c公司、a职位

可以计算得到人员6在各个属性上得分分别为0.2*0.33、0.3*0.5、0.2*0.5和0.3*0.5,即为0.066、0.15、0.1和0.15。

这样就可以得到6个向量,如果使用比较简单的算法,可以对每个人员求和(当然,也可以采用其他的方式来进行向量计算),人员1得分0.466,人员2得分0.434,人员3得分0.434,人员4得分0.433,人员5得分0.5,人员6得分0.466。这其中得分范围为[0.433,0.5],如果低于0.433则认为这个简历是不符合这个职位的。

此处需要说明的是,上述实施例仅以说明为目的,训练数据只有6个,当训练数据更为广泛的,得分的区间范围将更加合理。

上述仅仅是一个职位的得分,还可以使用同样的方式得出多个职位的得分,或多 个公司中多个不同职位的得分,然后,将求职简历中的多个属性进行计算,落入了哪个职位的范围,则可以认为该人员符合该职位的要求。

此处需要说明的是,上述实施例提供的方法可用于对训练样本数据进行训练得到简历评估模型,但得到简历评估模型的方法并不仅限于此,任何能够通过训练样本数据获得简历评估模型的算法都能够应用于上述步骤,例如,gbdt算法等。

步骤s255,使用测试样本数据对待检验的简历评估模型进行检验,在检验通过的情况下确认待检验的简历评估模型为准确的简历评估模型。

在得到待检验的简历评估模型后,由于训练样本数据的取值并不一定全面,或训练样本数据中存在噪声数据等原因的影响,使得待检验的简历评估模型的准确度并不一定较高,因此,需要通过向待检验的招聘数据模型输入测试样本数据来验证待检验的简历评估模型是否准确。

此处还需要说明的是,训练样本数据中包含的数据量的多少与简历评估模型的准确程度成正比。

通过上述步骤,可以使用已有的数据来对生成的简历评估模型进行验证,从而避免了使用真实招聘数据进行验证而导致的可能错误筛除简历的问题。

为了便于进行计算,对于上述的数据可以进行向量化处理。即,根据本申请上述实施例,生成待检验的简历评估模型的训练样本数据可以是:进行向量抽取并对向量抽取后的数据进行特征整理后得到的数据;和/或,检测待检验的简历评估模型的测试样本数据可以是:进行向量抽取并对向量抽取后的数据进行特征整理后得到的数据。

在对训练样本数据和/或测试样本数据进行向量抽取可以是对训练样本数据和/或测试样本数据在一个或者多个维度上的数据进行提取。在对训练样本数据和/或测试样本数据进行向量抽取后进行特征整理可以是将训练样本数据和/或测试样本数据中形式、格式、显示方式等不同但表征的意义相同的数据进行统一处理。上述步骤的目的在于统一数据形式,解决了由于数据多样化导致的同一数据具有多种形式,不易通过算法进行训练的技术问题。

根据本申请上述实施例,上述步骤s255中使用了测试样本数据对待检验的简历评估模型进行检验,并确认待检验的简历评估模型为准确的简历评估模型。确认是否为准确的简历评估模型的方式有多种,例如,可以将认为实际结果与简历评估模型输出的结果完全一致,才认为准确的模型。作为另一个可选的实施例,步骤s255可以包括:

步骤s2551,将测试样本数据输入至待检验的简历评估模型中进行检验,并输出 检验结果。

步骤s2553,如果检验结果与测试样本数据对应的招聘结果误差在预定范围内,则确认待检验的简历评估模型为准确的简历评估模型。

在上述步骤中,允许存在一定的误差,这种误差的存在可能是由于抽取数据的数量不足够导致的,但是该误差的存在并不影响对招聘结果的判断,也在可以接受的范围之内。

在一种可选的实施例中,将测试样本数据中的多个数据分别输入至待检验的简历评估模型中,仍以上述招聘的岗位是数据库维护岗位为例,测试样本数据中的3名已经知晓应聘结果的成员进行测试:

测试人员1:a学校、c专业、c公司、b职位、未被录取;

测试人员2:d学校、a专业、b公司、a职位、未被录取;

测试人员3:b学校、a专业、a公司、a职位、成功录取。

采用上述实施例中得到的学校、公司、专业、职位的权重:0.2、0.2、0.3、0.3,计算测试样本数据的测试结果:

测试人员1:a学校、c专业、c公司、b职位;

可以计算得到测试人员1在各个属性上得分分别为0.5*0.2、0.3*0、0.2*0.5、0.3*0.5,即为0.1、0、0.1和0.15。

测试人员2:d学校、a专业、b公司、a职位;

可以计算得到测试人员2在各个属性上得分分别为0*0.2、0.3*0.5、0.2*0.33、0.3*0.5,即为0、0.15、0.066和0.15。

测试人员3:b学校、a专业、d公司、a职位;

可以计算得到测试人员3在各个属性上得分分别为0.2*0.17、0.3*0.5、0.2*0、0.3*0.5,即为0.034、0.15、0和0.15。

对上述3个测试样本数据在不同维度上的得分进行计算,得到测试人员1的得分为0.35,测试人员2的得分为0.366,测试人员3的得分为0.434,仅有测试人员3落入符合该职位的评分取值范围内,因此,由上述简历评估模型得到的结果为测试人员1未被录取,测试人员2未被录取,测试人员3被录取,与实际结果相同,因此可以认为上述简历评估模型具有较高的准确度。

此处需要说明的是,当测试结果与测试样本数据的结果不相同时,将该测试样本数据作为训练样本数据,对简历评估模型进行训练,直至能够得到与测试样本数据的结果相同的测试结果。

根据本申请上述实施例,进行向量抽取包括:步骤s2555.对应聘者的一个或多个属性进行向量抽取,其中,一个或多个属性包括以下至少之一:公司名称、职位名称、学校名称、专业名称;

对向量抽取后的数据进行特征整理包括:步骤s2557,对一个或多个属性进行归一化处理。

归一化的处理方式有很多种,在一个可选的实施例中根据公司名称、职位名称、学校名称、专业名称的性质的不同,提供了几个不同的归一化方式,这几种归一化方式可以分别单独使用,也可以结合使用。归一化的方式并不限于此,其他的归一化方式也可以取得相同的效果。

公司名称归一化处理

对公司名称进行归一化处理包括:构建行业词表和地名词表;按照行业词表和地名词表中的行业名词和地名名词提取公司名称,得到公司名称的归一化结果。

在一种可选的实施例中,由于公司名称大致是由公司地点、公司名、公司行业、通用词四部分组成,例如:淘宝(中国)软件有限公司,在此基础上,构建了行业词表和地名词表对公司的名称进行提取。

在另一种可选的实施例中,在公司名称由地名和行业词构成的情况下,例如:中国建筑工程那总公司等。对于上述没有明显公司名提取的公司,提取地名和公司行业以对公司名称进行归一化。

在又一种可选的实施例中,还需要构建公司英文名称和公司中文名称的映射词表,以及子公司与子公司所属的母公司的映射词表,在出现英文名称的公司的情况下,从公司英文名称和公司中文名称的映射词表中查找与上述英文名称对应的中文名称,得到公司名称的归一化结果,例如,将公司名称为alibab的公司名称归一化为阿里巴巴;在公司名称为子公司的公司名称的情况下,在子公司与子公司所属的母公司的映射词表中查找上述子公司所属的母公司,以得到公司名称归一化的结果,例如,将公司名称为淘宝的公司名称归一化为阿里巴巴。

职位名称进行归一化处理

对职位名称进行归一化处理包括:确认在历史招聘数据集合中,出现次数大于预 设次数的职位描述为正确的职位名称;通过编辑距离构建简历文本数据中的职位描述与正确的职位名称之间的映射词表;通过正则表达式对简历文本数据中的职位描述在映射词表中进行匹配,得到职位名称的归一化结果。

在一种可选的实施例中,在上述预设次数可以为2000次的示例中,将出现次数大于2000次的职位描述确认为准确的职位描述,例如,在应聘软件开发工程师这一职务的简历中,将该职务描述为软件开发工程师的次数大于2000,而将该职务描述成为软件设计工程师、软件工程师等为同一职务但出现次数并未超过2000次,则确认该职务准确的名称为软件开发工程师,并将所有职务名称为软件设计工程师、软件工程师的职务的名称归一化为软件开发工程师,如果软件开发工程师和软件设计工程师这两个职务名称均超过2000,在确认软件开发工程师和软件设计工程师为同一职务的情况下,确认出现次数最多的名称为该职务的名称。

在另一种可选的实施例中,将所有职务名称为软件设计工程师、软件工程师的职务的名称归一化为软件开发工程师,首先通过编辑距离构建简历文本数据中,软件设计工程师、软件工程师等其他表征软件开发工程师这一职务的名称与软件开发工程师之间的映射词表,即,将所有用于表征软件开发工程师这一职务的名称均映射到软件开发工程师这一职务上;通过正则表达式对简历文本数据中的职位描述在映射词表中进行匹配,从而得到归一化的结果。

学校名称进行归一化处理

对学校名称进行归一化处理包括:将简历文本数据中的学校名称根据出现的此处按照由大至小的顺序排列,并获取预设排名的学校名称,得到基础词典;对学校名称进行去噪处理,并通过正则匹配将去噪得到的学校名称与基础字典中的学校名称进行匹配,以得到归一化后的学校名称;使用同义词表,根据预设规则构造学校名称对应的简写,将出现学校名称对应的简写的名称记录为学校名称;将学校名称中包含预设第一后缀词语的学校名称归一化为相应的第一后缀词语,其中,预设的第一后缀词语至少包括:职业技术学院、网络学院、成教、自考和专升本;去掉学校名称中包含的第二后缀词语,以生成归一化后的学校名称,其中,第二后缀词语用于表征学校的分支机构;去掉学校名称中的前缀,以生成归一化后的学校名称。

在一种可选的实施例中,将简历文本数据中出现的所有学校名称按照出现的次数由高至低排列,并获取出现次数排名在前1000名的学校名称构成基础词典,在构成基础词典的基础上,对学校名称进行去噪处理,在对学校名称进行去噪处理后,在基础词典中与学校名称进行匹配,以得到学校名称的归一化结果。

在另一种可选的实施例中,对学校名称进行去噪处理是通过正则匹配,弃掉学校名称中的造成数据,例如,将卡尔斯鲁尔大学(德国)处理为卡尔斯鲁尔大学;将厦门海洋学院(招统否是y招统否是)处理为厦门海洋学院,以消除噪音对学校名称进行归一化处理时的影响。

在又一种可选的实施例中,将学校名称中包含预设第一后缀词语的学校名称归一化为相应的第一后缀词语,例如,将厦门市兴才职业技术学院归一化为职业技术学院;去掉学校名称中包含的用于表征学校的分支机构的第二后缀词语,例如,将江苏科技大学经济管理学院归一化为江苏科技大学;去掉学校名称中的前缀,例如,将江苏省南京大学金陵学院归一化为南京大学金陵学院。

此处需要说明的是,还可以建立世界名校的名称表。如果存在任意学校名称出现频率很低,则首先需要确认该学校名称是否为世界名校,确认的方法可以是在世界名校的名称表中查找该学校名称。

专业名称进行归一化处理

对专业名称进行归一化处理包括:构建专业分类表,并通过专业分类表进行贝叶斯模型训练;根据训练后的贝叶斯模型对简历文本数据中的专业进行分类。

此处需要说明的是,上述实施例中的对应聘者的简历文本数据的jd文本与简历文本的匹配,可以基于tfidf和word2vec算法或基于这两个算法演进的方法对文本的相似性进行量化。

图3示出了在一种应用场景的应用步骤,图3是根据本发明实施例1的一种可选的简历评估方法的流程图。如图3所示,下面对本申请上述实施例的一种应用场景下的示例进行详细描述如下:

s31:导入历史招聘数据集合。

获取一个或多个招聘方的历史招聘数据集合,上述历史数据至少包括简历文本数据。

s32:对历史招聘数据集合进行数据清洗。

在上述步骤中,对历史招聘数据集合进行数据清洗可以是从历史招聘数据集合中屏蔽评估不通过的简历,其中,评估不通过的简历可以是由于人员编制headcount导致评估不通过的简历、没有进行简历评估而直接进行面试并且面试未通过的简历、简历重复投递导致评估不通过的简历。

s33:将历史招聘数据集合分成训练样本数据和测试样本数据。

s34:对训练样本数据进行向量抽取。

在上述步骤中,对训练样本数据进行向量抽取可以是抽取训练样本数据中的应聘者的一个或多个属性,一个或多个属性包括如下之一:公司名称、职位名称、学校名称、专业名称。

s35:对抽取的向量进行特征整理。

在上述步骤中,对抽取的向量进行特征整可以是对应聘者的一个或多个属性进行归一化处理。

s36:对训练样本数据进行模型训练。

在上述步骤中,可以采用gdbt算法对训练样本数据进行训练,得到待检验的简历评估模型,但得到简历评估模型的训练算法不限于此。

s37:对测试样本数据进行特征整理。

s38:通过对训练样本数据进行模型训练待得到验证简历评估模型。

s39:输出测试结果。

将测试样本数据输入至待检验简历评估模型,如果输出的结果与测试样本数据的招聘结果相同,则可以认为待检验的简历评估模型为准确的简历评估模型。

实施例2

本申请实施例还提供了如图4所示的简历评估方法。图4是根据本发明实施例2的简历评估方法的流程图。

步骤s41,输入待评估简历。

在上述步骤中,上述预设的简历评估模型可以是本申请实施例1中的任意一个简历评估模型。

步骤s43,获取待评估简历的简历评估结果,其中,简历评估结果是根据简历评估模型做出的,简历评估模型是根据从历史招聘数据集合中抽取数据建立的。

此处需要说明的是,本申请上述实施例中出现的预设的简历评估模型可以是实施例1中的任意一个简历评估模型,也可以是除实施例1以外的其他简历评估模型,任意使用历史招聘数据而非社交数据得到的简历评估模型均能应用于本实施例。

容易注意到的是,采用在历史招聘数据集合中抽取的数据进行简历评估模型的建立,用于构建对某一职位的先验认知,使得对应聘者的分析能够着眼于对应聘者综合实力与职位的匹配程度的挖掘,即,为不同公司的不同职位寻找到合适的简历,这样能够免去对每个应聘者的行为、社交数据进行分析,减少招聘的复杂程度,从而免去了搜集应聘者在各个社交平台上行为数据的繁琐工作,从而进一步的减少在招聘过程中付出的代价,效果和代价比方面具有更好的表现。因此,采用上述简历评估模型进行简历评估,能够方案解决现有技术中对应聘者进行评估通过对应聘者的行为、社交数据进行全面分析来评价应聘者,而应聘者的行为、社交数据复杂多变且获取难度高,从而导致评价的估难度大的技术问题。

在本申请上述实施例中,步骤s43,上述方法还包括:

步骤s45,输入历史招聘数据集合,其中,历史招聘集合中的数据至少包括:一个或多个属性在职位上对应的招聘结果,一个或多个属性是简历文本数据中用于表征应聘者特征的参数,招聘结果至少包括:一个或多个属性在职位上的出现次数、和/或一个或多个属性在职位上录取次数。

在本申请上述实施例中,步骤s43,在获取待评估简历的简历评估结果之后,上述方法还包括:

步骤s451,在预设区域显示待评估对象的简历评估结果。

在本申请上述步骤中,在得到简历评估结果后,可以根据预设的显示内容显示建立评估结果。

在一种可选的实施例中,以简历评估模型为实施例1中提出的简历评估模型为示例,在用户向预设的简历评估系统(其中,该简历评估系统使用预设的简历评估模型)输入自身简历,或者按着简历评估系统提供的表格填写自身简历后,简历评估系统使用简历评估模型对用户的简历进行评估后,得到上述用户的评估结果,并将用户的简历评估结果显示于用户所示用的显示终端上,同时,通过对用户简历的评估,简历评估系统还能够得到用户所适合的职位,因此简历评估系统在显示用户的简历评估结果的同时,还可以显示为用户推荐的适合职位。

在另一种可选的实施例中,仍以简历评估模型为实施例1中提出的简历评估模型为示例,在人力管理人员向预设的简历评估系统输入一份或多份求职者的简历后,简历评价系统对求职者的简历依次或按预设顺序进行评估,得到评估结果并显示与人力管理人员的显示终端上,例如,可以将符合职位、不符合职位的求职者名单按照不同的颜色或位置显示,人力管理人员也可以通过点击求职者的姓名或其他操作对求职者 的具体简历进行查看。同时,简历评估系统也可以在简历数据库中查找符合该职位的求职者为人力管理人员进行推荐。

此处需要说明的是,根据预设的显示内容显示简历评估结果的显示方式不限于上述实施例的任何一种显示方式。

图5是根据本申请实施例2的一种可选的简历评估方法的示意图,下面结合图5所示的示例,在本申请实施例1提供的简历评估方法的基础上对上述实施例2提供的方法进行进一步说明。

首先,需要说明的是,该方法可以包括两个阶段,第一个阶段为预备阶段,即服务器获取历史招聘数据,并使用学习方法对历史招聘数据进行训练,来得到简历评估模型,该第一阶段在历史招聘数据不发生变动的情况下仅进行一次,或按照固定周次来更新简历评估模型;第二个阶段是工作阶段,即用户使用简历评估模型来进行评估的阶段,而这一阶段的是重复性、多次发生的。

在一种可选的实施例中,用户通过预设的简历评估系统向服务器输入历史招聘数据,服务器接收用户输入的历史招聘数据后,使用机器学习方法通过对历史招聘数据进行训练得到简历评估模型,上述过程可以是本申请简历评估方法的第一阶段。在服务器生成简历评估模型后,用户可以使用简历评估模型对简历进行评估,该过程可以是本申请简历评估方法中的第二阶段,用户将新的待评估的简历输入至简历评估模型,服务器对新的简历进行评估,得到新的简历的评估结果,用户接收服务器评估得到的新的简历的评估结果,并可以对新的简历的评估结果进行显示等操作。

此处需要说明的是,该实施例中的上述机器学习方法可以是本申请实施例1中的任意一种构建简历评估模型的方法。

实施例3

根据本发明实施例,还提供了一种用于实施上述简历评估方法的简历评估装置,如图6所示,该装置包括:获取模块60、抽取模块62、构建模块64和评估模块66

获取模块60用于获取历史招聘数据集合,其中,历史招聘数据集合至少包括:简历文本数据。

在上述模块涉及的历史招聘数据集合中,历史招聘数据集合的来源可以是目标招聘方的历史招聘数据集合,例如:目标招聘方在预设时间内(如上一个招聘季,或者上两个招聘季)参加招聘的人员的信息,以及参加招聘并获取该目标招聘单位职位的人员的信息。获取历史招聘数据集合的方法可以是通过网站自身的数据库来获取历史 招聘数据集合。

在一种可选的实施例中,通过数据库获取目标招聘方的近五年的历史招聘数据集合,由于招聘方的招聘准则会随着时间的变化而变化,例如,招聘方对学历的要求可能升高,或对应聘者的工作经验更加重视,因此,获取近两年的全部历史招聘数据集合以及前五年至前三年的部分招聘数据。

抽取模块62用于从历史招聘数据集合中抽取数据,其中,抽取的该数据至少包括:一个或多个属性在职位上对应的招聘结果,一个或多个属性是简历文本数据中用于表征应聘者特征的参数;作为一个可选的实施方式,招聘结果可以包括:一个或多个属性在职位上的出现次数、和/或一个或多个属性在职位上录取次数。当然,招聘结果页可以包括除这两部分内容之外的其他内容,然后有利于人员招聘的信息都可以统计在招聘结果中。

构建模块64用于通过训练抽取到的数据构建简历评估模型。

评估模块66用于使用简历评估模型对接收到的简历进行简历评估。

在一种可选的实施例中,将接收到的简历输入至构建的简历模型中,得到模型的输出结果。在另一个可选的实施例中,可以将模型的输出结果与应聘者预期的职位进行匹配,如果匹配成功则进行提示。提示的方式也有很多种,例如,可以将应聘者的名字使用的不同的颜色来标识不同的匹配度。

此处需要说明的是,通过上述模块,采用在历史招聘数据集合中抽取的数据进行简历评估模型的建立,用于构建对某一职位的先验认知,使得对应聘者的分析能够着眼于对应聘者综合实力与职位的匹配程度的挖掘,即为不同公司的不同职位寻找到合适的简历,这样能够免去对每个应聘者的行为、社交数据进行分析,减少招聘的复杂程度,从而免去了搜集应聘者在各个社交平台上行为数据的繁琐工作,从而减少在招聘过程中付出的代价,效果和代价比方面具有更好的表现。

根据本申请上述实施例,结合图7所示,上述抽取模块62可以包括:

清洗模块70,用于对历史招聘数据集合进行清洗,其中,该数据清洗主要用来将评估不通过的简历从历史招聘数据集合之中屏蔽。

第一抽取子模块72,用于从清洗后的历史招聘数据集合中抽取数据。

根据本申请上述实施例,评估不通过的简历包括以下至少之一:由于人员编制headcount导致评估不通过的简历、没有进行简历评估而直接进行面试并且面试不同的简历、简历重复投递导致评估不通过的简历。对于评估不通过的简历在实施例1中 已经进行了说明,在此不再赘述。

根据本申请上述实施例,结合图8所示,上述构建模块64是通过训练抽取到的数据构建简历评估模型。在该模块中可以将所有的抽取到的数据均应用到建立简历评估模型上,该简历评估模型的检验可以使用真实接收到的简历来进行检验。这种处理方法需要使用真实应聘者的简历来进行检验,有可能将合适的应聘者错误的筛除。作为另一种可选的实施方式,可以将抽取的数据分为两部分,一部分用来进行生成简历评估模型,一部分用来对生成的简历评估模型进行测试,在这种实施例中上述构建模块44可以包括:

分类模块80,用于将抽取到的数据分为训练样本数据和测试样本数据。

生成模块82,用于使用训练样本数据进行训练生成待检验的简历评估模型。

具体的例子与实施例1基本相同,假定预先需要招聘的是数据库维护岗位,已经应聘成功的该职位的人员有6名,先使用这6名人员的简历用于训练:

人员1:a学校、a专业、b公司、b职位;

人员2:b学校、a专业、c公司、b职位;

人员3:a学校、b专业、a公司、a职位;

人员4:c学校、b专业、b公司、a职位;

人员5:a学校、a专业、c公司、b职位;

人员6:c学校、b专业、c公司、a职位。

由此可以获得数据维护岗人员的特征:

通过上述数值来计算人员的得分:

人员1:a学校、a专业、b公司、b职位;

可以计算得到人员1在各个属性上得分分别为0.5*0.2、0.3*0.5、0.2*0.33、0.3*0.5,即为0.1、0.15、0.066和0.15;

人员2:b学校、a专业、c公司、b职位;

可以计算得到人员2在各个属性上得分分别为0.2*0.17、0.3*0.5、0.2*0.5和0.3*0.5,即为0.034、0.15、0.1和0.15;

人员3:a学校、b专业、a公司、a职位;

可以计算得到人员3在各个属性上得分分别为0.2*0.5、0.3*0.5、0.2*0.17和0.3*0.5,即为0.10.150.0340.15;

人员4:c学校、b专业、b公司、a职位;

可以计算得到人员4在各个属性上得分分别为0.2*0.33、0.3*0.5、0.2*0.33和0.3*0.5,即为0.066、0.15、0.066和0.15;

人员5:a学校、a专业、c公司、b职位;

可以计算得到人员5在各个属性上得分分别为0.2*0.5、0.3*0.5、0.2*0.5和0.3*0.5,即为0.1、0.15、0.1和0.15;

人员6:c学校、b专业、c公司、a职位;

可以计算得到人员6在各个属性上得分分别为0.2*0.33、0.3*0.5、0.2*0.5和0.3*0.5,即为0.066、0.15、0.1和0.15。

这样就可以得到6个向量,如果使用比较简单的算法,可以对每个人员求和,人员1得分0.466,人员2得分0.434,人员3得分0.434,人员4得分0.433,人员5得分0.5,人员6得分0.466。这其中得分范围为[0.433,0.5],如果低于0.433则认为这个简历是不符合这个职位的。

与实施例1中的例子不同的是,在这个岗位的招聘中,还可以考虑人员的年龄,如果人员的年龄在预定范围内,则可以增加分数。例如,这个岗位是一个经验很重要的岗位,那么,年龄超过40岁,可以增加0.07分。

此处需要说明的是,上述实施例提供的方法可用于对训练样本数据进行训练得到简历评估模型,但得到简历评估模型的方法并不仅限于此,任何能够通过训练样本数据获得简历评估模型的算法都能够应用于上述步骤,例如,gbdt算法等。

确认模块74,用于使用测试样本数据对待检验的简历评估模型进行检验,在检验通过的情况下确认待检验的简历评估模型为准确的简历评估模型。

根据本申请上述实施例,结合图9所示,上述分类模块80包括:

第二抽取子模块90,用于进行向量抽取。

整理模块92,用于对进行向量抽取后的数据进行特征整理,以得到训练样本数据和/或测试样本数据。

在对训练样本数据和/或测试样本数据进行向量抽取可以是对训练样本数据和/或 测试样本数据在一个或者多个维度上的数据进行提取。在对训练样本数据和/或测试样本数据进行向量抽取后进行特征整理可以是将训练样本数据和/或测试样本数据中形式、格式、显示方式等不同但表征的意义相同的数据进行统一处理。上述步骤的目的在于统一数据形式,解决了由于数据多样化导致的同一数据具有多种形式,不易通过算法进行训练的技术问题。

根据本申请上述实施例,结合图10所示,上述确认模块84用于进行确认。确认是否为准确的简历评估模型的方式有多种,例如,可以将认为实际结果与简历评估模型输出的结果完全一致,才认为准确的模型。作为另一个可选的实施例,上述确认模块84可以包括:

检验模块100,用于将测试样本数据输入至待检验的简历评估模型中进行检验,并输出检验结果。

确认子模块102,如果检验结果与测试样本数据对应的招聘结果误差在预定范围内,则确认待检验的简历评估模型为准确的简历评估模型。

在上述步骤中,允许存在一定的误差,这种误差的存在可能是由于抽取数据的数量不足够导致的,但是该误差的存在并不影响对招聘结果的判断,也在可以接受的范围之内。

在一种可选的实施例中,将测试样本数据中的多个数据分别输入至待检验的简历评估模型中,仍以上述招聘的岗位是数据库维护岗位为例,测试样本数据中的3名已经知晓应聘结果的成员进行测试:

测试人员1:a学校、c专业、c公司、b职位、未被录取;

测试人员2:d学校、a专业、b公司、a职位、未被录取;

测试人员3:b学校、a专业、a公司、a职位、成功录取。

采用上述实施例中得到的学校、公司、专业、职位的权重:0.2、0.2、0.3、0.3,计算测试样本数据的测试结果:

测试人员1:a学校、c专业、c公司、b职位;

可以计算得到测试人员1在各个属性上得分分别为0.5*0.2、0.3*0、0.2*0.5、0.3*0.5,即为0.1、0、0.1和0.15。

测试人员2:d学校、a专业、b公司、a职位;

可以计算得到测试人员2在各个属性上得分分别为0*0.2、0.3*0.5、0.2*0.33、 0.3*0.5,即为0、0.15、0.066和0.15。

测试人员3:b学校、a专业、d公司、a职位;

可以计算得到测试人员3在各个属性上得分分别为0.2*0.17、0.3*0.5、0.2*0、0.3*0.5,即为0.034、0.15、0和0.15。

对上述3个测试样本数据在不同维度上的得分进行计算,得到测试人员1的得分为0.35,测试人员2的得分为0.366,测试人员3的得分为0.434,仅有测试人员3落入符合该职位的评分取值范围内,因此,由上述简历评估模型得到的结果为测试人员1未被录取,测试人员2未被录取,测试人员3被录取,与实际结果相同,因此可以认为上述简历评估模型具有较高的准确度。

作为另一个可选实施方式,在当时招聘的时候,没有考虑年龄的问题,而此时如果考虑年龄的问题,测试人员2是可以加分的,此时测试人员2的得分为0.366+0.07=0.4336,按照这种方式,测试人员2是应该被录取的,但是实际是没有录取。这种误差是由于招聘需要发生改变而导致的,是在可接受的范围之内的。

此处需要说明的是,当测试结果与测试样本数据的结果不相同时,将该测试样本数据作为训练样本数据,对简历评估模型进行训练,直至能够得到与测试样本数据的结果相同的测试结果。

根据本申请上述实施例,结合图11所示,上述第二抽取子模块90用于对应聘者的一个或多个属性进行向量抽取,其中,一个或多个属性包括以下至少之一:公司名称、职位名称、学校名称、专业名称;上述整理模块92包括:归一化模块112,用于对一个或多个属性进行归一化处理。

根据本申请上述实施例,结合图12所示,归一化模块112可以包括以下至少之一:

第一子归一化模块120,用于构建行业词表和地名词表;按照行业词表和地名词表中的行业名词和地名名词提取公司名称,得到公司名称的归一化结果,以对公司名称进行归一化处理。

第二子归一化模块122,用于确认在历史招聘数据集合中,出现次数大于预设次数的职位描述为正确的职位名称;通过编辑距离构建简历文本数据中的职位描述与正确的职位名称之间的映射词表;通过正则表达式对简历文本数据中的职位描述在映射词表中进行匹配,得到职位名称的归一化结果,以对职位名称进行归一化处理。

第三子归一化模块124,用于将简历文本数据中的学校名称根据出现的此处按照由大至小的顺序排列,并获取预设排名的学校名称,得到基础词典;对学校名称进行 去噪处理,并通过正则匹配将去噪得到的学校名称与基础字典中的学校名称进行匹配,以得到归一化后的学校名称;使用同义词表,根据预设规则构造学校名称对应的简写,将出现学校名称对应的简写的名称记录为学校名称;将学校名称中包含预设第一后缀词语的学校名称归一化为相应的第一后缀词语,其中,预设的第一后缀词语至少包括:职业技术学院、网络学院、成教、自考和专升本;去掉学校名称中包含的第二后缀词语,以生成归一化后的学校名称,其中,第二后缀词语用于表征学校的分支机构;去掉学校名称中的前缀,以生成归一化后的学校名称,以对学校名称进行归一化处理。

第四子归一化模块126,用于构建专业分类表,并通过专业分类表进行贝叶斯模型训练;根据训练后的贝叶斯模型对简历文本数据中的专业进行分类,以对专业名称进行归一化处理。

需要说明的是,上述归一化的处理,在实施例1中已经进行了详细的说明,在此不再赘述。

实施例4

根据本发明实施例,还提供了一种用于实施实施例2中的简历评估方法的简历评估装置,如图13所示,该装置包括:第一输入模块130和获取模块132。

第一输入模块130,用于输入待评估简历;获取模块132,用于获取待评估简历的简历评估结果,其中,简历评估结果是根据简历评估模型做出的,简历评估模型是根据从历史招聘数据集合中抽取数据建立的。

此处需要说明的是,上述第一输入模块130获取模块132对应于实施例2中的步骤s41至步骤s43,此模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

在本申请上述实施例中,结合图14所示,上述装置还包括:第二输入模块140。

第二输入模块140,用于输入历史招聘数据集合,其中,所述历史招聘集合中的数据至少包括:一个或多个属性在职位上对应的招聘结果,所述一个或多个属性是所述简历文本数据中用于表征应聘者特征的参数,所述招聘结果至少包括:所述一个或多个属性在所述职位上的出现次数、和/或所述一个或多个属性在所述职位上录取次数。

此处需要说明的是,上述第二输入模块140对应于实施例2中的步骤s45,此模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10 中。

在本申请上述实施例中,结合图15所示,上述装置还包括:显示模块150,用于在预设区域显示所述待评估对象的简历评估结果。

此处需要说明的是,上述显示模块150对应于实施例2中的步骤s451,此模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。

实施例5

本发明的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选的,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。

可选的,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。

在本实施例中,上述计算机终端可以执行简历评估方法中以下步骤的程序代码:获取历史招聘数据集合,其中,历史招聘数据集合至少包括:简历文本数据;从历史招聘数据集合中抽取数据,其中,数据至少包括:一个或多个属性在职位上对应的招聘结果,一个或多个属性是简历文本数据中用于表征应聘者特征的参数,招聘结果至少包括:一个或多个属性在职位上的出现次数、和/或一个或多个参数在职位上录取次数;通过训练抽取到的数据构建简历评估模型;使用简历评估模型对接收到的简历进行简历评估。

可选的,图16是根据本发明实施例的一种计算机终端的结构框图。如图16所示,该计算机终端a可以包括:一个或多个(图中仅示出一个)处理器1601、存储器1603、以及传输装置1605。

其中,存储器可用于存储软件程序以及模块,如本发明实施例中的简历评估方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的简历评估方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端a。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取历史招聘数据集合,其中,历史招聘数据集合至少包括:简历文本数据;从历史招聘数据集合中抽取数据,其中,数据至少包括:一个或多个属性在职位上对应的招聘结果,一个或多个属性是简历文本数据中用于表征应聘者特征的参数,招聘结果至少包括:一个或多个属性在职位上的出现次数、和/或一个或多个参数在职位上录取次数;通过训练抽取到的数据构建简历评估模型;使用简历评估模型对接收到的简历进行简历评估。

可选的,上述处理器还可以执行如下步骤的程序代码:对历史招聘数据集合进行清洗,其中,数据清洗包括:评估不通过的简历从历史招聘数据集合之中屏蔽:从清洗后的历史招聘数据集合中抽取数据。

可选的,上述处理器还可以执行如下步骤的程序代码:由于人员编制headcount导致评估不通过的简历、没有进行简历评估而直接进行面试并且面试不同的简历、简历重复投递导致评估不通过的简历。

可选的,上述处理器还可以执行如下步骤的程序代码:将抽取到的数据分为训练样本数据和测试样本数据;使用训练样本数据进行训练生成待检验的简历评估模型;使用测试样本数据对待检验的简历评估模型进行检验,在检验通过的情况下确认待检验的简历评估模型为准确的简历评估模型。

可选的,上述处理器还可以执行如下步骤的程序代码:生成待检验的简历评估模型的训练样本数据是:进行向量抽取并对向量抽取后的数据进行特征整理后得到的数据;和/或,检测待检验的简历评估模型的测试样本数据是:进行向量抽取并对向量抽取后的数据进行特征整理后得到的数据。

可选的,上述处理器还可以执行如下步骤的程序代码:将测试样本数据输入至待检验的简历评估模型中进行检验,并输出检验结果;如果检验结果与测试样本数据对应的招聘结果误差在预定范围内,则确认待检验的简历评估模型为准确的简历评估模型。

可选的,上述处理器还可以执行如下步骤的程序代码:进行向量抽取包括:对应聘者的一个或多个属性进行向量抽取,其中,一个或多个属性包括以下至少之一:公司名称、职位名称、学校名称、专业名称;对向量抽取后的数据进行特征整理包括:对一个或多个属性进行归一化处理。

可选的,上述处理器还可以执行如下步骤的程序代码:对公司名称进行归一化处理包括:构建行业词表和地名词表;按照行业词表和地名词表中的行业名词和地名名 词提取公司名称,得到公司名称的归一化结果;对职位名称进行归一化处理包括:确认在历史招聘数据集合中,出现次数大于预设次数的职位描述为正确的职位名称;通过编辑距离构建简历文本数据中的职位描述与正确的职位名称之间的映射词表;通过正则表达式对简历文本数据中的职位描述在映射词表中进行匹配,得到职位名称的归一化结果;对学校名称进行归一化处理包括:将简历文本数据中的学校名称根据出现的此处按照由大至小的顺序排列,并获取预设排名的学校名称,得到基础词典;对学校名称进行去噪处理,并通过正则匹配将去噪得到的学校名称与基础字典中的学校名称进行匹配,以得到归一化后的学校名称;使用同义词表,根据预设规则构造学校名称对应的简写,将出现学校名称对应的简写的名称记录为学校名称;将学校名称中包含预设第一后缀词语的学校名称归一化为相应的第一后缀词语,其中,预设的第一后缀词语至少包括:职业技术学院、网络学院、成教、自考和专升本;去掉学校名称中包含的第二后缀词语,以生成归一化后的学校名称,其中,第二后缀词语用于表征学校的分支机构;去掉学校名称中的前缀,以生成归一化后的学校名称;对专业名称进行归一化处理包括:构建专业分类表,并通过专业分类表进行贝叶斯模型训练;根据训练后的贝叶斯模型对简历文本数据中的专业进行分类。

本领域普通技术人员可以理解,计算机终端也可以是智能手机(如android手机、ios手机等)、平板电脑、掌声电脑以及移动互联网设备(mobileinternetdevices,mid)、pad等终端设备。图16其并不对上述电子装置的结构造成限定。例如,计算机终端a还可包括比图16中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图16所示不同的配置。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(read-onlymemory,rom)、随机存取器(randomaccessmemory,ram)、磁盘或光盘等。

实施例6

本发明的实施例还提供了一种存储介质。可选的,在本实施例中,上述存储介质可以用于保存上述实施例1所提供的简历评估方法所执行的程序代码。

可选的,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。

可选的,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取历史招聘数据集合,其中,历史招聘数据集合至少包括:简历文本数据;从历史 招聘数据集合中抽取数据,其中,数据至少包括:一个或多个属性在职位上对应的招聘结果,一个或多个属性是简历文本数据中用于表征应聘者特征的参数,招聘结果至少包括:一个或多个属性在职位上的出现次数、和/或一个或多个参数在职位上录取次数;通过训练抽取到的数据构建简历评估模型;使用简历评估模型对接收到的简历进行简历评估。

可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:处理器还可以执行如下步骤的程序代码:对历史招聘数据集合进行清洗,其中,数据清洗包括:评估不通过的简历从历史招聘数据集合之中屏蔽:从清洗后的历史招聘数据集合中抽取数据。

可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:由于人员编制headcount导致评估不通过的简历、没有进行简历评估而直接进行面试并且面试不同的简历、简历重复投递导致评估不通过的简历。

可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:将抽取到的数据分为训练样本数据和测试样本数据;使用训练样本数据进行训练生成待检验的简历评估模型;使用测试样本数据对待检验的简历评估模型进行检验,在检验通过的情况下确认待检验的简历评估模型为准确的简历评估模型。

可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:生成待检验的简历评估模型的训练样本数据是:进行向量抽取并对向量抽取后的数据进行特征整理后得到的数据;和/或,检测待检验的简历评估模型的测试样本数据是:进行向量抽取并对向量抽取后的数据进行特征整理后得到的数据。

可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:将测试样本数据输入至待检验的简历评估模型中进行检验,并输出检验结果;如果检验结果与测试样本数据对应的招聘结果误差在预定范围内,则确认待检验的简历评估模型为准确的简历评估模型。

可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:进行向量抽取包括:对应聘者的一个或多个属性进行向量抽取,其中,一个或多个属性包括以下至少之一:公司名称、职位名称、学校名称、专业名称;对向量抽取后的数据进行特征整理包括:对一个或多个属性进行归一化处理。

可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:对公司名称进行归一化处理包括:构建行业词表和地名词表;按照行业词表和地名词表中的行业名词和地名名词提取公司名称,得到公司名称的归一化结果;对职位名称进行归一 化处理包括:确认在历史招聘数据集合中,出现次数大于预设次数的职位描述为正确的职位名称;通过编辑距离构建简历文本数据中的职位描述与正确的职位名称之间的映射词表;通过正则表达式对简历文本数据中的职位描述在映射词表中进行匹配,得到职位名称的归一化结果;对学校名称进行归一化处理包括:将简历文本数据中的学校名称根据出现的此处按照由大至小的顺序排列,并获取预设排名的学校名称,得到基础词典;对学校名称进行去噪处理,并通过正则匹配将去噪得到的学校名称与基础字典中的学校名称进行匹配,以得到归一化后的学校名称;使用同义词表,根据预设规则构造学校名称对应的简写,将出现学校名称对应的简写的名称记录为学校名称;将学校名称中包含预设第一后缀词语的学校名称归一化为相应的第一后缀词语,其中,预设的第一后缀词语至少包括:职业技术学院、网络学院、成教、自考和专升本;去掉学校名称中包含的第二后缀词语,以生成归一化后的学校名称,其中,第二后缀词语用于表征学校的分支机构;去掉学校名称中的前缀,以生成归一化后的学校名称;对专业名称进行归一化处理包括:构建专业分类表,并通过专业分类表进行贝叶斯模型训练;根据训练后的贝叶斯模型对简历文本数据中的专业进行分类。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时, 可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1