一种人力对象数据匹配方法及系统与流程

文档序号:13004713阅读:285来源:国知局
一种人力对象数据匹配方法及系统与流程

本发明涉及数据匹配技术领域,尤其涉及一种人力对象数据匹配方法及系统。



背景技术:

在招聘的过程中,招聘方通过筛选简历,找到匹配招聘岗位要求的求职者。求职者和招聘方的快速准确匹配有利于提高效率。目前一般是通过自动筛选加人工识别的方式进行求职简历的筛选。其中,自动筛选是通过对年龄、性别、薪资等必要条件进行范围设定,从而可根据这些设定条件对简历进行自动识别。而人工识别需要通过人工的方式对求职者和招聘岗位进行包括行业、岗位和技能等的综合评价。当有大量的简历需要进行筛选时,这种人工识别方法效率低且主观性强,容易出现错误匹配结果。



技术实现要素:

本发明实施例提供一种人力对象数据匹配方法及系统,以解决现有技术主要通过人工筛选简历,使得效率低的问题。

第一方面,提供一种人力对象数据匹配方法,包括:获取招聘项对应的一求职简历;提取所述求职简历包含的求职信息和所述招聘项限定的信息,其中,所述求职信息至少包括:行业、行业从业时间、岗位、岗位从业时间、技能和技能掌握时间,所述招聘项限定的信息至少包括:行业、岗位和技能;根据所述求职简历包含的求职信息和所述招聘项限定的信息,获取所述求职简历与所述招聘项的行业匹配度、岗位匹配度和技能匹配度;根据所述求职简历与所述招聘项的行业匹配度、岗位匹配度和技能匹配度,通过logistic二分类模型,获取所述求职简历与所述招聘项的匹配度;根据所述匹配度,确定所述求职简历与所述招聘项是否匹配。

第二方面,提供一种人力对象数据匹配系统,包括:第一获取模块,用于获取招聘项对应的一求职简历;提取模块,用于提取所述求职简历包含的求职信息和所述招聘项限定的信息,其中,所述求职信息至少包括:行业、行业从业时间、岗位、岗位从业时间、技能和技能掌握时间,所述招聘项限定的信息至少包括:行业、岗位和技能;第二获取模块,用于根据所述求职简历包含的求职信息和所述招聘项限定的信息,获取所述求职简历与所述招聘项的行业匹配度、岗位匹配度和技能匹配度;第三获取模块,用于根据所述求职简历与所述招聘项的行业匹配度、岗位匹配度和技能匹配度,通过logistic二分类模型,获取所述求职简历与所述招聘项的匹配度;确定模块,用于根据所述匹配度,确定所述求职简历与所述招聘项是否匹配。

这样,本发明实施例中,通过提取求职简历包含的求职信息,可自动获取求职简历与招聘项的行业匹配度、岗位匹配度和技能匹配度,再根据这三个匹配度,通过logistic二分类模型,可自动获取求职简历与招聘项的匹配度,从而可根据匹配度自动判别求职简历与招聘项是否匹配,从而可对求职简历进行筛选,以提高人力对象匹配的效率和准确率。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例的人力对象数据匹配方法的流程图;

图2是本发明实施例的获取求职简历与招聘项的行业匹配度、岗位匹配度和技能匹配度的步骤的流程图;

图3是本发明实施例的获取求职简历包含的每一行业和招聘项限定的行业的第一匹配度的步骤的流程图;

图4是本发明实施例的获取行业匹配度的步骤的流程图;

图5是本发明实施例的获取求职简历包含的每一岗位和招聘项限定的岗位的第二匹配度的步骤的流程图;

图6是本发明实施例的获取岗位匹配度的步骤的流程图;

图7是本发明实施例的获取技能匹配度的步骤的流程图;

图8是本发明实施例的确定求职简历与招聘项是否匹配的步骤的流程图;

图9是本发明实施例的人力对象数据匹配系统的结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供一种人力对象数据匹配方法。如图1所示,该方包括如下的步骤:

步骤s10:获取招聘项对应的一求职简历。

招聘项指的是招聘的工作。每一招聘项表示一个招聘的工作。例如,招聘项为招聘英语翻译人员。

步骤s20:提取求职简历包含的求职信息和招聘项限定的信息。

对于求职简历包含的求职信息的提取可通过提取简历中的关键字识别。求职信息至少包括:行业、行业从业时间、岗位、岗位从业时间、技能和技能掌握时间。

招聘项限定的信息是招聘方预设的。招聘项限定的信息至少包括:行业、岗位和技能。

行业一般是指按生产同类产品或具有相同工艺过程或提供同类劳动服务划分的经济活动类别,例如,稻谷种植行业、电气安装行业、环境卫生管理行业等等。

岗位一般是指在一个特定的企业组织中、在一个特定的时间内、由一个特定的人所担负的一个或数个任务所组成,例如,企业董事长、营养配餐员、飞机装配工等等。

技能一般是指从事某种工作所需要的能力。例如,计算机技能、英语技能、驾驶技能等等。

本实施例中,根据求职者的经历,一份求职简历包含的求职信息中可以包括至少一个行业、至少一个岗位和至少一项技能。一个招聘项包括一个行业、一个岗位和至少一项技能。

步骤s30:根据求职简历包含的求职信息和招聘项限定的信息,获取求职简历与招聘项的行业匹配度、岗位匹配度和技能匹配度。

通过比对求职简历包含的求职信息和招聘项限定的信息,根据与行业相关的信息的比对结果,可以获取行业匹配度;根据与岗位相关的信息的比对结果,可以获取岗位匹配度;根据与技能相关的信息的比对结构结果,可以获取技能匹配度。

步骤s40:根据求职简历与招聘项的行业匹配度、岗位匹配度和技能匹配度,通过logistic二分类模型,获取求职简历与招聘项的匹配度。

在步骤s30获取了行业匹配度、岗位匹配度和技能匹配度的基础上,对这三种匹配度通过logistic二分类模型进行综合评估,可得到求职简历与招聘项的匹配度。

步骤s50:根据匹配度,确定求职简历与招聘项是否匹配。

根据步骤s40获得的匹配度,可根据该匹配度确定求职简历与招聘项是否匹配,从而对简历进行筛选,留下满足匹配度的简历。

具体的,如图2所示,步骤s30按照如下的过程进行:

步骤s31:根据求职简历包含的每一行业和招聘项限定的行业,获取求职简历包含的每一行业和招聘项限定的行业的第一匹配度。

该步骤是比较求职简历包含的行业与招聘项限定的行业是否匹配。如图3所示,该步骤可具体包括如下的过程:

步骤s311:获取预设的行业列表。

行业列表包括多个行业,并且按照行业类别的范围从大到小的顺序逐级分类。每一级行业类别由每一级行业代码表示,行业的行业代码由每一级行业代码组成。该行业列表一般采用公知的标准,例如《国民经济行业分类与代码(gb_t_4754-2011)》。

步骤s312:根据求职简历包含的行业,从行业列表中获取求职简历包含的行业对应的第一行业代码。

例如,当采用《国民经济行业分类与代码(gb_t_4754-2011)》时,求职简历包含的行业为稻谷种植行业,则从行业列表中获取稻谷种植行业对应的第一行业代码为a0111。

步骤s313:根据招聘项限定的行业,从行业列表中获取招聘项限定的行业对应的第二行业代码。

例如,当采用《国民经济行业分类与代码(gb_t_4754-2011)》时,求职简历包含的行业为小麦种植行业,则从行业列表中获取小麦种植行业对应的第二行业代码为a0112。

步骤s314:比较第一行业代码包含的每级行业代码和第二行业代码包含的每级行业代码。

在比较的过程中,可能会出现下面三种情况,则分别通过不同的步骤进行处理,具体如下:

步骤s315:当第一行业代码包含的每级行业代码和第二行业代码包含的每级行业代码均相同,获取求职简历包含的行业和招聘项限定的行业的第一匹配度为1。

步骤s316:当第一行业代码包含的第一级行业代码和第二行业代码包含的第一级行业代码不同,获取求职简历包含的行业和招聘项限定的行业的第一匹配度为a1。

该a1通过预设得到,一般根据选择的不同的行业列表有不同的取值。

步骤s317:当第一行业代码包含的前m级行业代码和第二行业代码包含的前m级行业代码均相同,并且第一行业代码包含的第m+1级行业代码和第二行业代码包含的第m+1级行业代码不相同,则按照第m+1级的行业匹配规则获取求职简历包含的行业和招聘项限定的行业的第一匹配度。

其中,第m+1级的行业匹配规则为:

p1=a1+a2+…+am+am+1×(1-|rm+1-dm+1|/cm+1)。

p1表示第一匹配度。am表示第m级的行业系数。该第m级的行业系数为预设的系数,随着类别行业代码的级别而不同,具体可结合采用的行业列表预先设定。cm+1表示第m+1级行业分类的类别的数量。rm+1表示第一行业代码包含的第m+1级行业代码,dm+1表示第二行业代码包含的第m+1级行业代码。

下面以《国民经济行业分类与代码(gb_t_4754-2011)》对本步骤的具体的计算过程进行举例说明。

《国民经济行业分类与代码(gb_t_4754-2011)》中,第一级行业类别的范围最大,第一级行业代码由字母表示,如a、b、c等。第二级行业类别的范围比第一级行业类别的范围小,第二级行业代码由两位数字组成的代码表示,如,01、02、03等。第三级行业类别的范围比第二级行业类别的范围小,第三级行业代码由一位数字表示,其位于第二级行业代码的两位数字之后,则第二级行业代码和第三级行业代码形成的三位数字如,011、012、013等。第四级行业类别的范围比第三级行业类别的范围小,第四级行业代码由一位数字表示,其位于第三级行业代码的一位数字之后,则第二级行业代码、第三级行业代码和第四级行业代码形成的四位数字如0111、0112、0113等。应当理解的是本实施例中第一级行业代码至第四级行业代码依次排列形成的数组即为行业代码。例如,《国民经济行业分类与代码(gb_t_4754-2011)》中,a0141表示蔬菜种植行业,a0152表示葡萄种植行业,a0161表示坚果种植行业。本实施例中,a1=0.5,a2=0.2,a3=0.2,a4=0.1。

(1)比较第一行业代码与第二行业代码包含的第一级行业代码是否相同。

例如,求职简历包含的行业为基金会行业,其对应的第一行业代码包含的第一级行业代码为a(公共管理、社会保障和社会组织)。招聘项要求的行业为体育经济人,其对应的第二行业代码包含的第一级行业代码为r(文化、体育和娱乐业)。这两者的第一级行业代码不同,则第一匹配度为a1,即0.5。

例如,求职简历包含的行业为彩票活动行业,其对应的第一行业代码包含的第一级行业代码为r(文化、体育和娱乐业)。招聘项要求的行业为体育经济人,其对应的第二行业代码包含的第一级行业代码为r(文化、体育和娱乐业)。这两者的第一级行业代码相同,则进行比较这两者的第二级行业代码的步骤。

(2)当第一行业代码与第二行业代码包含的第一级行业代码相同,则比较第一行业代码与第二行业代码包含的第二级行业代码是否相同。

例如,求职简历包含的行业为体育组织行业,招聘项要求的行业为体育经济人,这两者的第一级行业代码均为r,因此,比较第一行业代码与第二行业代码包含的第二级行业代码是否相同。体育组织行业对应的第一行业代码包含的第二级行业代码为88(体育)。体育经济人对应的第二行业代码包含的第二级行业代码为89(娱乐业)。这两者的第二级行业代码不同。预设的第一级的行业系数a1=0.5,第二级的行业系数a2=0.2。第一级行业代码包含的第二级行业分类为:新闻和出版业(85)、广播、电视、电影和影视录音制作业(86)、文化艺术业(87)、体育(88)和娱乐业(89),则第二级行业分类的类别的数量c2=5。第一行业代码包含的第二级行业代码r2=88。第二行业代码包含的第二级行业代码d2=89。第一匹配度为p1=0.5+0.2×(1-|88-89|/5)=0.66。

例如,求职简历包含的行业为彩票活动行业,招聘项要求的行业为体育经济人,这两者的第一级行业代码均为r,因此,比较第一行业代码与第二行业代码包含的第二级行业代码是否相同。彩票活动行业对应的第一行业代码包含的第二级行业代码为89(娱乐业)。体育经济人对应的第二行业代码包含的第二级行业代码为89(娱乐业)。这两者的第二级行业代码相同,则进行比较这两者的第三级行业代码的步骤。

(3)当第一行业代码与第二行业代码包含的前两级行业代码相同,则比较第一行业代码与第二行业代码包含的第三级行业代码是否相同。

例如,求职简历包含的行业为彩票活动行业,招聘项要求的行业为体育经济人,这两者的第一级行业代码均为r,第二级行业代码均为89,因此,比较第一行业代码与第二行业代码包含的第三级行业代码是否相同。彩票活动行业对应的第一行业代码包含的第三级行业代码为(89)3(文化、娱乐、体育经济代理)。体育经济人对应的第二行业代码包含的第三级行业代码为(89)4(文化、娱乐、体育经济代理)。这两者的第三级行业代码不同。预设的第一级的行业系数a1=0.5,第二级的行业系数a2=0.2,第三级的行业系数a3=0.2。第三级行业分类为:室内娱乐活动(891)、游乐园(892)、彩票活动(893)、文化、娱乐、体育经济代理(894)和其他娱乐业(899),则第二级行业分类的类别的数量c3=5。第一行业代码包含的第三级行业代码r3=3。第二行业代码包含的第三级行业代码d3=4。第一匹配度为p1=0.5+0.2+0.2×(1-|3-4|/5)=0.86。

例如,求职简历包含的行业为文化娱乐经济人,招聘项要求的行业为体育经济人,这两者的第一级行业代码均为r,第二级行业代码均为89,因此,比较第一行业代码与第二行业代码包含的第三级行业代码是否相同。文化娱乐经济人对应的第二行业代码包含的第三级行业代码为(89)4(文化、娱乐、体育经济代理)。体育经济人对应的第二行业代码包含的第三级行业代码为(89)4(文化、娱乐、体育经济代理)。这两者的第三级行业代码相同,则进行比较这两者的第四级行业代码的步骤。

(4)当第一行业代码与第二行业代码包含的前三级行业代码相同,则比较第一行业代码与第二行业代码包含的第四级行业代码是否相同。

例如,求职简历包含的行业为文化娱乐经济人,招聘项要求的行业为体育经济人,这两者的第一级行业代码均为r,第二级行业代码均为89,第三级行业代码均为4,因此,比较第一行业代码与第二行业代码包含的第四级行业代码是否相同。文化娱乐经济人对应的第二行业代码包含的第四级行业代码为(894)1。体育经济人对应的第二行业代码包含的第四级行业代码为(894)2。这两者的第四级行业代码不同。预设的第一级的行业系数a1=0.5,第二级的行业系数a2=0.2,第三级的行业系数a3=0.2,第四级的行业系数a4=0.1。第四级行业分类为:文化娱乐经济人(8941)、体育经济人(8942)和其他文化艺术经济代理(8949),则第四级行业分类的类别的数量c4=3。第一行业代码包含的第四级行业代码r4=1。第二行业代码包含的第四级行业代码d4=2。第一匹配度为p1=0.5+0.2+0.2+0.1×(1-|1-2|/3)=0.97。

例如,求职简历包含的行业为体育经济人,招聘项要求的行业为体育经济人,这两者的第一级行业代码均为r,第二级行业代码均为89,第三级行业代码均为4,第四级行业代码均为1。这两者的每一级行业代码均相同,则第一匹配度为1。

本实施例中,行业列表只分了四级,因此该步骤结束。

通过上述的具体步骤,最终可根据求职简历包含的行业和招聘项限定的行业,获得两者的不同的第一匹配度。

步骤s32:根据求职简历包含的每一行业从业时间和求职简历包含的每一行业对应的第一匹配度,获取求职简历包含的每一行业对应的第一经验值。

具体的,根据求职简历包含的行业从业时间和求职简历包含的行业对应的第一匹配度,按照第一经验规则获取第一经验值。

该第一经验规则如下:

e1表示第一经验值,y1表示求职信息的行业从业时间。例如,行业从业时间可以采用年为单位,最小步长为1月。当超过p个月,但不足p+1个月时,记为p个月,然后将其换算为以年记的数值。

例如行业从业时间为12.5个月,则记为12个月,以年为单位,该行业从业时间y1为1。第一匹配度p1为0.5,则第一经验值为:

步骤s33:根据每一第一匹配度和每一第一经验值,获取行业匹配度。

如图4所示,该步骤具体包括如下的过程:

步骤s3301:根据求职简历包含的每一行业和招聘项限定的行业的第一匹配度、求职简历包含的每一行业对应的第一经验值,按照行业子匹配度规则获取每一行业子匹配度。

其中,行业子匹配度规则为:imdi=p1i×e1i。

imdi表示每一行业子匹配度,i=1,2,3,……,n,n表示求职简历包含的行业的数量。

例如,求职简历包含的行业的数量为3。行业1对应的第一匹配度为1,第一经验值为1,行业子匹配度为1;行业2对应的第一匹配度为0.5,第一经验值为1.46,行业子匹配度为0.73行业3对应的第一匹配度为0.66,第一经验值为1.32,行业子匹配度为0.87。

步骤s3302:根据每一行业子匹配度,按照行业匹配度规则获取行业匹配度。

其中,行业匹配度规则为:

imd=1-(1-imd1)×(1-imd2)×…×(1-imdn)。

其中,imd表示行业匹配度。

例如,步骤s3301得到的行业子匹配度分别为:1、0.73和0.87,则行业匹配度imd=1-(1-1)×(1-0.73)×(1-0.87)=1。

步骤s34:根据求职简历包含的每一岗位和招聘项限定的岗位,获取求职简历包含的每一岗位和招聘项限定的岗位的第二匹配度。

该步骤是比较求职简历包含的岗位与招聘项限定的岗位是否匹配。如图5所示,该步骤可具体包括如下的过程:

步骤s341:获取预设的岗位列表。

岗位列表包括多个岗位,并且按照岗位的类别从大到小的顺序逐级分类。每一级岗位类别由每一级岗位代码表示,岗位的岗位代码由每一级岗位代码组成。该岗位列表一般采用公知的标准,例如《劳动力市场职业分类与代码(lb501-2002)》。

步骤s342:根据求职简历包含的岗位,从岗位列表中获取求职简历包含的岗位对应的第一岗位代码。

例如,当采用《劳动力市场职业分类与代码(lb501-2002)》时,求职简历包含的岗位为演员,则从岗位列表中获取演员对应的第一岗位代码为2100300。

步骤s343:根据招聘项限定的岗位,从岗位门类列表中获取招聘项限定的岗位对应的第二岗位代码。

例如,当采用《劳动力市场职业分类与代码(lb501-2002)》时,招聘项限定的岗位为乐器演奏员,则从岗位列表中获取乐器演奏员对应的第二岗位代码为2100400。

步骤s344:比较第一岗位代码包含的每级岗位代码和第二岗位代码包含的每级岗位代码。

在比较的过程中,可能会出现下面三种情况,则分别通过不同的步骤进行处理,具体如下:

步骤s345:当第一岗位代码包含的每级岗位代码和第二岗位代码包含的每级岗位代码均相同,获取求职简历包含的岗位和招聘项限定的岗位的第二匹配度为1。

步骤s346:当第一岗位代码包含的第一级岗位代码和第二岗位代码包含的第一级岗位代码不同,获取求职简历包含的岗位和招聘项限定的岗位的第二匹配度为f1。

步骤s347:当第一岗位代码包含的前n级岗位代码和第二岗位代码包含的前n级岗位代码均相同,并且第一岗位代码包含的第n+1级岗位代码和第二岗位代码包含的第n+1级岗位代码不相同,则按照第n+1级的岗位匹配规则获取求职简历包含的岗位和招聘项限定的岗位的第二匹配度。

其中,第n+1级的岗位匹配规则为:

p2=f1+f2+……+fn+fn+1×(1-|rn+1-dn+1|/gn+1)。

p2表示第二匹配度,fn分别表示第n级的岗位系数,gn+1表示第n+1级岗位分类的类别的数量,rn+1表示第一岗位代码包含的第n+1级岗位代码,dn+1表示第二岗位代码包含的第n+1级岗位代码。

下面以《劳动力市场职业分类与代码(lb501-2002)》对本步骤的具体的计算过程进行举例说明。

《劳动力市场职业分类与代码(lb501-2002)》中,第一级岗位类别的范围最大,第一级岗位代码由一位数字表示,如1、2、3等。第二级岗位类别的范围比第一级岗位类别的范围小,第二级岗位代码由两位数字组成的代码表示,其位于第一级岗位代码的一位数字之后,则第一级岗位代码和第二级岗位代码形成三位数字,如105、201、203等。第三级岗位类别的范围比第二级岗位类别的范围小,第三级岗位代码由两位数字表示,其位于第二级岗位代码的两位数字之后,则第一级岗位代码、第二级岗位代码和第三级岗位代码形成五位数字,如20232、20301、20501等。第四级岗位类别的范围比第三级岗位类别的范围小,第四级岗位代码由两位数字表示,其位于第三级岗位代码的两位数字之后,则第一级岗位代码、第二级岗位代码、第三级岗位代码和第四级岗位代码形成七位数字,如2049900、2050100、2060600等。应当理解的是本实施例中第一级岗位代码至第四级岗位代码依次排列形成的数组即为岗位代码。例如,《劳动力市场职业分类与代码(lb501-2002)》中,2060400表示审计师,2070200表示保险业务人员,2090300表示中学教师。在本实施例的列表中,为了方便起见,每一级岗位代码都用7个数字表示,在该级之后的位置的数据用0表示。该实施例中,f1=0.5,f2=0.25,f3=0.15,f4=0.1。

(1)比较第一岗位代码与第二岗位代码包含的第一级岗位代码是否相同。

例如,求职简历包含的岗位为演员,其对应的第一岗位代码包含的第一级岗位代码为2(表中记为2000000)。招聘项要求的岗位为行政业务人员,其对应的第二岗位代码包含的第一级岗位代码为3(表中记为3000000)。这两者的第一级岗位代码不同,则第一匹配度为f1,即0.5。

例如,求职简历包含的岗位为演员,其对应的第一岗位代码包含的第一级岗位代码为2(表中记为2000000)。招聘项要求的岗位为小学教师,其对应的第二岗位代码包含的第一级岗位代码为2(表中记为2000000)。这两者的第一级岗位代码相同,则进行比较这两者的第二级岗位代码的步骤。

(2)当第一岗位代码与第二岗位代码包含的第一级岗位代码相同,则比较第一岗位代码与第二岗位代码包含的第二级岗位代码是否相同。

例如,求职简历包含的岗位为演员,招聘项要求的岗位为小学教师,这两者的第一级岗位代码均为2,因此,比较第一岗位代码与第二岗位代码包含的第二级岗位代码是否相同。演员对应的第一岗位代码包含的第二级岗位代码为10(表中记为2100000)。小学教师对应的第二岗位代码包含的第二级岗位代码为09(表中记为2090000)。这两者的第二级岗位代码不同。预设的第一级的岗位系数f1=0.5,第二级的岗位系数f2=0.25。第二级岗位分类为:科研人员(2010000)、工程技术人员(2020000)、农业技术人员(2030000)、飞机船舶技术人员(2040000)、卫生专业技术人员(2050000)、经济业务人员(2060000)、金融业务人员(2070000)、法律专业人员(2080000)、教学人员(2090000)、文学艺术工作者(2100000)、体育工作者(2110000)和新闻出版文化工作者(2120000),则第二级岗位分类的类别的数量g2=12。第一岗位代码包含的第二级岗位代码r2=10。第二岗位代码包含的第二级岗位代码d2=09。第二匹配度为p2=0.5+0.25×(1-|10-9|/12)=0.73。

例如,求职简历包含的岗位为演员,招聘项要求的岗位为乐器演奏员,这两者的第一级岗位代码均为2,因此,比较第一岗位代码与第二岗位代码包含的第二级岗位代码是否相同。演员对应的第一岗位代码包含的第二级岗位代码为10(表中记为2100000)。乐器演奏员对应的第二岗位代码包含的第二级岗位代码为10(表中记为2100000)。这两者的第二级岗位代码相同,则进行比较这两者的第三级岗位代码的步骤。

(3)当第一岗位代码与第二岗位代码包含的前两级岗位代码相同,则比较第一岗位代码与第二岗位代码包含的第三级岗位代码是否相同。

例如,求职简历包含的岗位为演员,招聘项要求的岗位为乐器演奏员,这两者的第一级岗位代码均为2,第二级岗位代码均为10,因此,比较第一岗位代码与第二岗位代码包含的第三级岗位代码是否相同。演员对应的第一岗位代码包含的第三级岗位代码为03(表中记为2100300)。乐器演奏员对应的第二岗位代码包含的第三级岗位代码为04(表中记为2104000)。这两者的第三级岗位代码不同。预设的第一级的岗位系数f1=0.5,第二级的岗位系数f2=0.25,第三级的岗位系数f3=0.15。第三级岗位分类为:文艺创作和评论人员(2100100)、编导和音乐指挥人员(2100200)、演员(2100300)、乐器演奏员(2100400)、影视制作及舞台专业人员(2100500)、美术专业人员(2100600)、工美装饰服装广告设计人员(2100700)和其他文学艺术工作者(2109900),则第三级岗位分类的类别的数量g3=8。第一岗位代码包含的第三级岗位代码r3=03。第二岗位代码包含的第三级岗位代码d3=04。第二匹配度为p2==0.5+0.25+0.15×(1-|3-4|/8)=0.88。

例如,求职简历包含的岗位为服装设计师,招聘项要求的岗位为广告设计人员,这两者的第一级岗位代码均为2,第二级岗位代码均为10,因此,比较第一岗位代码与第二岗位代码包含的第三级岗位代码是否相同。这两者对应的第三级岗位代码均为07(表中记为2100700)。因此,这两者的前三级岗位代码均相同,则进行比较这两者的第四级岗位代码的步骤。

(4)当第一岗位代码与第二岗位代码包含的前三级岗位代码相同,则比较第一岗位代码与第二岗位代码包含的第四级岗位代码是否相同。

例如,求职简历包含的岗位为服装设计师,招聘项要求的岗位为室内装饰设计人员,这两者的第一级岗位代码均为2,第二级岗位代码均为10,第三级岗位代码均为07,因此,比较第一岗位代码与第二岗位代码包含的第四级岗位代码是否相同。服装设计师对应的第一岗位代码包含的第四级岗位代码为05。室内装饰设计人员对应的第二岗位代码包含的第四级岗位代码为06。这两者的第四级岗位代码不同。预设的第一级的岗位系数f1=0.5,第二级的岗位系数f2=0.25,第三级的岗位系数f3=0.15,第四级的岗位系数f4=0.1。第四级岗位分类为:装潢美术设计人员(2100704)、服装设计师(2100705)、室内装饰设计人员(2100706)和广告设计人员(2100708),则第四级岗位分类的类别的数量g4=4。第一岗位代码包含的第四级岗位代码r4=05。第二岗位代码包含的第四级岗位代码d4=06。第二匹配度为p2=0.5+0.25+0.15+0.1×(1-|5-6|/4)=0.98。

例如,求职简历包含的岗位为服装设计师,招聘项要求的岗位为服装设计师,这两者的每一级岗位代码均相同,则第一匹配度为1。

本实施例中,岗位列表只分了四级,因此该步骤结束。

通过上述的具体步骤,最终可根据求职简历包含的岗位和招聘项限定的岗位,获得两者的不同的第一匹配度。

步骤s35:根据求职简历包含的每一岗位从业时间和求职简历包含的每一岗位对应的第二匹配度,获取求职简历包含的每一岗位对应的第二经验值。

具体的,根据求职简历包含的岗位从业时间和求职简历包含的岗位对应的第二匹配度,按照第二经验规则获取第二经验值。

其中,第二经验规则如下:

e2表示第二经验值,y2表示求职简历包含的岗位从业时间。例如,岗位从业时间以年为单位,最小步长为1月。当超过s个月,但不足s+1个月时,记为s个月,然后将其换算为以年记的数值。

例如岗位从业时间为12.5个月,则记为12个月,以年为单位,该岗位从业时间y2为1。第二匹配度p2为0.5,则第二经验值为:

步骤s36:根据每一第二匹配度和每一第二经验值,获取岗位匹配度。

如图6所示,该步骤具体包括如下的过程:

步骤s3601:根据求职简历包含的每一岗位和招聘项限定的岗位的第二匹配度、求职简历包含的每一岗位对应的第二经验值,按照岗位子匹配度规则获取每一岗位子匹配度。

其中,岗位子匹配度规则为pmdj=p2j×e2j。

pmdj表示每一岗位子匹配度,j=1,2,3,……,m,m表示求职简历包含的岗位的数量。

例如,求职简历包含的岗位的数量为3。岗位1对应的第二匹配度为0.7,岗位从业时间为2.1年,则第二经验值为1.33,岗位子匹配度为0.93;岗位2对应的第二匹配度为0.5,岗位从业时间为1年,则第二经验值为1.46,岗位子匹配度为0.73,岗位3对应的第二匹配度为0.8,岗位从业时间为0.5年,则第二经验值为1.03,岗位子匹配度为0.9。

步骤s3602:根据每一岗位子匹配度,按照岗位匹配度规则获取岗位匹配度。

其中,岗位匹配度规则为:

pmd=1-(1-pmd1)×(1-pmd2)×…×(1-pmdm)。

其中,pmd表示岗位匹配度。

例如,步骤s3601得到的岗位子匹配度分别为:0.93、0.73和0.9,则岗位匹配度imd=1-(1-0.93)×(1-0.73)×(1-0.9)=0.99。

步骤s37:获取求职简历包含的技能中与招聘项限定的技能匹配的每一第一技能。

求职简历包含的技能可能包括招聘项限定的技能以外的技能。通过该步骤可将这些技能排除。

步骤s38:根据求职简历包含的每一第一技能的技能掌握时间,以及每一第一技能的权重,获取技能匹配度。

如图7所示,该步骤具体包括如下的过程:

步骤s3801:根据求职简历包含的每一第一技能的技能掌握时间,按照第三经验规则获取求职简历包含的每一第一技能的经验值。

其中,第三经验规则为k=1,2,3,……,t。

t表示第一技能的数量。slk表示每一第一技能的经验值。y3表示第一技能的技能掌握时间。例如,第一技能的技能掌握时间以年为单位,最小步长为1月。当超过q个月,但不足q+1个月时,记为q个月,然后将其换算为以年记的数值。例如,第一技能的技能掌握时间为12.5个月,则记为12个月,以年为单位,该第一技能的技能掌握时间y3为1,则:

步骤s3802:根据每一第一技能的经验值和每一第一技能的权重,按照技能匹配度规则获取技能匹配度。

其中,技能匹配度规则为:

smd表示技能匹配度,wk表示每一第一技能的权重。

通过上述的步骤,可以获得求职简历与招聘项的行业匹配度、岗位匹配度和技能匹配度。

具体的,步骤s40中,logistic二分类模型如下:

m表示匹配度,k0、k1、k2和k3表示模型参数。该模型参数可通过大量的历史样本数据,采用梯度下降算法获得:

在已经匹配的数据库中,抽取z组样本数据,如下所示:

……

将上述的样本数据代入logistic二分类模型中,得到如下z个方程:

……

通过梯度下降法求解上述的logistic二分类模型的模型参数{k0,k1,k2,k3}。

具体的,设:

则模型参数k的迭代求解公式如下:

k=k-α·xt·error

其中α为预设的学习率,xt为x的转置矩阵。

通过上述的过程,可得到具体的模型参数。

具体的,如图8所示,步骤s50包括如下的过程:

步骤s51:将匹配度与匹配区间进行对比。

本实施例的匹配区间为[0.2,0.8]。

若匹配度小于匹配区间的下限阈值,例如匹配度m<0.2,则进行步骤s52;若匹配度大于匹配区间的上限阈值,例如匹配度m>0.8,则进行步骤s53;若匹配度位于匹配区间内,例如0.2≤m≤0.8,则进行步骤s54。

步骤s52:确定求职简历与招聘项不匹配。

当求职简历与招聘项不匹配时,可排除该求职简历。

步骤s53:确定求职简历与招聘项匹配。

当求职简历与招聘项匹配时,可选择该求职简历,例如,通知该求职简历的求职者面试。

步骤s54:将求职简历通过人工的方式与招聘项进行匹配。

当匹配度位于匹配区间内,则通过本方法尚不能准确判别该求职简历是否与招聘项匹配,此时,仍需借助人工的方式对这些简历进行匹配筛选。

综上,本发明实施例的方法通过提取求职简历包含的求职信息,可自动获取求职简历与招聘项的行业匹配度、岗位匹配度和技能匹配度,再根据这三个匹配度,通过logistic二分类模型,可自动获取求职简历与招聘项的匹配度,从而可根据匹配度自动判别求职简历与招聘项是否匹配,从而可对求职简历进行筛选,以提高人力对象匹配的效率和准确率。

本发明实施例还公开了一种人力对象数据匹配系统。如图9所示,该系统包括:

第一获取模块901,用于获取招聘项对应的一求职简历。

提取模块902,用于提取求职简历包含的求职信息和招聘项限定的信息。

其中,求职信息至少包括:行业、行业从业时间、岗位、岗位从业时间、技能和技能掌握时间,招聘项限定的信息至少包括:行业、岗位和技能。

第二获取模块903,用于根据求职简历包含的求职信息和招聘项限定的信息,获取求职简历与招聘项的行业匹配度、岗位匹配度和技能匹配度。

第三获取模块904,用于根据求职简历与招聘项的行业匹配度、岗位匹配度和技能匹配度,通过logistic二分类模型,获取求职简历与招聘项的匹配度。

确定模块905,用于根据匹配度,确定求职简历与招聘项是否匹配。

综上,本发明实施例的系统通过提取求职简历包含的求职信息,可自动获取求职简历与招聘项的行业匹配度、岗位匹配度和技能匹配度,再根据这三个匹配度,通过logistic二分类模型,可自动获取求职简历与招聘项的匹配度,从而可根据匹配度自动判别求职简历与招聘项是否匹配,从而可对求职简历进行筛选,以提高人力对象匹配的效率和准确率。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者移动终端不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者移动终端所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1