一种电子简历的筛选方法与流程

文档序号:11199188阅读:441来源:国知局
一种电子简历的筛选方法与流程

本发明信息处理领域,尤其涉及一种电子简历的筛选方法。



背景技术:

随着网络的发展,大多求职者都通过网络投递简历,一份简历可以轻松投递到多家招聘方,因此无论是招聘网站还是招聘方,往往会收到大量简历。在面对大量简历时,人工筛选无疑是效率极低的,因此,出现了智能匹配简历和招聘信息(包括招聘职位以及其他招聘要求,例如工作地点要求、学历要求等)的方法。

目前,简历和招聘信息的匹配方法多为将简历中的关键词与招聘信息中的关键字进行关键字匹配。但是,现有匹配的精准度并不高,仅仅通过简单的关键词匹配,尤其对于工作经历的分析而言,很难获得精确的匹配度。

因此,现有技术有待进一步的提高。



技术实现要素:

本发明提供了一种电子简历的筛选方法,为人力资源工作者提供一种简历初步筛选的方法,解决现有技术中电子简历处理量大的,效率低的问题。

本发明提供了一种电子简历的筛选方法,所述方法包括:

获取简历模板中每个预标注项所设置的标准词语,并将所述标准词语作为第一词语;

获取待筛选简历中每个预标注项所填的文字信息,对所述文字信息中文字进行分词,将分词后得到的词语作为第二词语;

对各个所述第一词语进行概念拆分得到包含若干个概念的第一概念集合,对各个所述第二词语进行概念拆分得到包含若干个概念的第二概念集合;

计算简历模板与待筛选简历相对应位置第一概念集合中的第一概念与第二概念集合中的第二概念之间的概念相似度,所述第一概念为所述第一概念集合中的任一概念,所述第二概念为所述第二概念集合中的任一概念;

将计算得到的各概念相似度中的最大值作为所述第一词语与所述第二词语之间的词语相似度;

根据所述词语相似度判断所述待筛选简历是否符合要求,若符合要求,则将对应的待筛选简历存入信息库中做下一步的筛选。

可选的,所述计算所述第一概念集合中的第一概念与所述第二概念集合中的第二概念之间的概念相似度包括:

计算所述第一概念的第一独立义原与第二概念的第一独立义原之间的第一相似度;

计算所述第一概念的第二独立义原与第二概念的第二独立义原之间的第二相似度,所述第二独立义原为语义表达式中除所述第一独立义原以外的所有其他独立义原;

计算所述第一概念的关系义原与第二概念的关系义原之间的第三相似度;

计算所述第一概念的符号义原与第二概念的符号义原之间的第四相似度;

根据所述第一相似度、第二相似度、第三相似度、第四相似度计算所述第一概念与所述第二概念之间的概念相似度。

可选的,所述计算所述第一概念的第一独立义原与第二概念的第一独立义原之间的第一相似度包括:

按照如下公式计算所述第一相似度sim1(v1,v2):

其中,所述(d+α)表示两个义原,d是和在义原层次体系中的路径长度,α为常数参数。

可选的,计算所述第一概念的第二独立义原与第二概念的第二独立义原之间的第二相似度包括:

1)将第一概念与第二概念的语义表达式的所有独立义原任意配对,计算两两独立义原相似度;

2)将相似度取值最大的一对归为一组;

3)对剩余的独立义原两两执行步骤2),直至所有独立义原都完成分组;

4)对各组的相似度计算平均值作为所述第二相似度。

可选的,所述根据所述第一相似度、第二相似度、第三相似度、第四相似度计算所述第一概念与所述第二概念之间的概念相似度包括:

按照如下公式计算所述概念相似度sim(si,tj):

可选的,所述预标注项包括:专业选项、工作经历选项和工作地点选项。

可选的,在计算简历模板与待筛选简历相对应位置第一概念集合中的第一概念与第二概念集合中的第二概念之间的概念相似度步骤还包括:

判断排列在前预定个数的预标注项中第一词语与第二词语之间的词语相似度是否低于预设相似度阈值,若低于,则放弃本份简历其他相对应预标注项中对应第一词语与第二词语之间词语相似度的计算。

可选的,在计算简历模板与待筛选简历相对应位置第一概念集合中的第一概念与第二概念集合中的第二概念之间的概念相似度步骤之后还包括:

按照预设每个预标注项所占的权重,对计算出的各个词语相似度进行加权处理,得到最终的匹配值,并根据所述匹配值判断待筛选简历是否符合要求。

本发明提供了一种电子简历的筛选方法,获取简历模板中每个预标注项所设置的标准词语,并将所述标准词语作为第一词语;获取待筛选简历中每个预标注项所填的文字信息,对所述文字信息中文字进行分词,将分词后得到的词语作为第二词语;分别对第一词语和第二词语进行概念拆分后,根据拆分后得到的概念集合计算两者之间的词语相似度,根据所述词语相似度判断所述待筛选简历是否符合要求,若符合要求,则将对应的待筛选简历存入信息库中做下一步的筛选。则本发明中,在进行信息匹配时要对词语进行拆分,形成概念集合,而概念集合中的概念可以最大程度的涵盖词语的本质含义,所以从概念的层面对词语进行匹配,可以有效的提高简历筛选的精确度。

附图说明

图1为本发明所提供的一种电子简历的筛选方法步骤流程示意图。

具体实施方式

为了使本领域的技术人员更好的理解本发明的技术方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。

在hownet中,对实词的概念描述由以下三种形式的描述式组成:

(1)独立义原描述式:由“基本义原”或“(具体词)”表示;

(2)关系义原描述式:由“关系义原=基本义原”或“关系义原=(具体词)”或者“(关系义原=具体词)”来表示,其中关系义原是指包含“eventrole|动态角色”和“eventfeatures|动态属性”这两类的义原;

(3)符号义原描述式:由“关系符号基本义原”或者“关系符号(具体词)”表示,其中关系符号包括“#、%、$、*、+、&、@、?、!”,其各自代表的关系不再赘述。

在实际应用中,每一个概念由多个义原组成,义原是最基本的、不易于再分割的意义的最小单位。例如:“人”虽然是一个非常复杂的概念,它可以是多种属性的集合体,但也可以把它看作为一个义原。

所有的概念都可以分解成各种各样的义原。同时也应该有一个有限的义原集合,其中的义原组合成一个无限的概念集合。中文中的字(包括单纯词)是有限的,并且它可以被用来表达各种各样的单纯的或复杂的概念,以及表达概念与概念之间、概念的属性与属性之间的关系。

通过对义原和概念的定义,就可以对两个词语的相似度进行计算,基于上述原理,本发明提了一种电子简历的筛选方法,如图1所示,包括:

101、获取简历模板中每个预标注项所设置的标准词语,并将所述标准词语作为第一词语;获取待筛选简历中每个预标注项所填的文字信息,对所述文字信息中文字进行分词,将分词后得到的词语作为第二词语;

102、对各个所述第一词语进行概念拆分得到包含若干个概念的第一概念集合,对各个所述第二词语进行概念拆分得到包含若干个概念的第二概念集合;

103、计算简历模板与待筛选简历相对应位置第一概念集合中的第一概念与第二概念集合中的第二概念之间的概念相似度,所述第一概念为所述第一概念集合中的任一概念,所述第二概念为所述第二概念集合中的任一概念;

104、将计算得到的各概念相似度中的最大值作为所述第一词语与所述第二词语之间的词语相似度;

105、根据所述词语相似度判断所述待筛选简历是否符合要求,若符合要求,则将对应的待筛选简历存入信息库中做下一步的筛选。

本发明的上述步骤中,需要预先设置一个简历模板,在简历模块中设置好预标注项,所述简历模板为应聘者通过网站可以直接根据模板进行填写自己的简历,不仅可以达到招聘方模块化处理简历,而且还可以自定义简历模板,最大可能的获取到想得到的求职者信息,因此电子简历设置模板有很多好处。

上述预标注项可以为招聘方比较硬性要求,且填空项相对单一的必填项。比如:专业选项、工作经历选项和工作地点选项,或者其他招聘方要求一定要满足的要素。

当设置好上述预标注项后,便可以通过上述方法进行简历筛选,下面以其具体实施方式为例,对上述方法进行更加详细的说明。

获取简历模板预标注项的标准词语,将标准词语作为第一词语。可以想到的是,上述标准词语不一定是一个词语,可以是多个。

获取待筛选简历预标注项上的文字信息,对文字信息进行分词,获取分词后得到的多个词语,并将多个词语作为第二词语。

分别对第一词语和第二词语进行概念拆分得到包含若干个概念的第一概念集合,对各个所述第二词语进行概念拆分得到包含若干个概念的第二概念集合;具体的,可以想到,每个第一词语对应一个第一概念集合,每个第二词语对应一个第二概念集合。

上述步骤中分别得到每个第一词语对应的第一概念集合和每个第二词语对应的第二概念集合,因此分别将预标志项上的第一词语和第二词语进行匹配处理。

具体的,通过对义原和概念的定义,就可以对两个词语的相似度进行计算,例如对于词语x1和词语x2,如果x1有n个概念[s1,s2,…,sn],x2有m个概念[t1,t2,…,tm],x1和x2的相似度sim(x1,x2)为各个概念的相似度的最大值:

因此,为了计算得到x1和x2的相似度sim(x1,x2),则需要计算每两个概念之间的相似度。

计算两个概念之间的相似度则需要通过多个方面来综合计算:

(1)第一独立义原描述式:

因为所有的概念都最终归结于用义原来表示,所以义原的相似度计算是概念相似度的基础。由于所有的义原根据上下位关系构成树状的义原层次体系,可以简单的通过语义距离计算相似度。

用sim1(v1,v2)表示两个概念的这部分相似度,具体就是两个义原的相似度,具体计算公式如下:

其中(d+α)表示两个义原,d是和在义原层次体系中的路径长度。α是一个可调节的参数,在基于hownet的词汇语义相似度计算方法中可以设定α的取值,例如:α=0.5。

(2)其他独立义原描述式:语义表达式中除第一独立义原以外的所有其他独立义原,用sim2(v1,v2)表示两个概念的这部分相似度,具体计算步骤如下:

a、先把两个表达式的所有独立义原任意配对,计算两两义原相似度;

b、取值最大的一对归为一组;

c、对剩下的独立义原两两相似度执行第b步。如此反复,直到所有都完成分组。任何义原与空值的相似度定义为常数δ,例如:δ=0.2;

d、最后求平均值。

(3)关系义原描述式:语义表达式中所有的关系义原,用sim3(v1,v2)表示两个概念的这部分相似度,把关系义原相同的表达式分为一组,计算相似度,最后求平均值。

(4)符号义原描述式:语义表达式中所有的符号义原,用sim4(v1,v2)表示两个概念的这部分相似度,把关系符号相同的表达式分为一组,计算相似度,最后求平均值。

综上所述,两个概念的相似度计算方法如公式(3)所示。

经过上述步骤计算后,可以得到任意一个第一词语和第二词语之间的词语相似度。

由于本发明中为依次对简历模板上的第一词语和待筛选简历上相对应的第二词语进行词语相似度计算,因此为了简便计算的同时,还可以得到很好的匹配效果,在计算简历模板与待筛选简历相对应位置第一概念集合中的第一概念与第二概念集合中的第二概念之间的概念相似度步骤还包括:

判断排列在前预定个数的预标注项中第一词语与第二词语之间的词语相似度是否低于预设相似度阈值,若低于,则放弃本份简历其他相对应预标注项中对应第一词语与第二词语之间词语相似度的计算。

先对预定个数的相对应预标注项中第一词语和第二词语的词语相似度与预设相似度阈值进行判断,若均低于预设相似度阈值,则放弃对本份简历其他对应项的词语相似度的计算。

上述预定个数可以设置为2个或者3个,或者其他个数,若前3个对应预标注项的相似度均低于预设相似度阈值,则判定本份简历不符合要求,放弃对其项匹配的计算,从而简化了计算。

当任何一个第一词语和任何一个第二词语之间的词语相似度均计算完成,可以通过将全部的词语相似度相加,通过所述词语相似度相加的值判断本份简历的相似度是否达到要求。

较佳的,还可以通过加权的方式进行相似度是否达到要求的判断;先对每个预标注项按照招聘的要求设置权重,当计算出词语相似度,则按照预设每个预标注项所占的权重,对计算出的各个词语相似度进行加权处理,得到最终的匹配值,并根据所述匹配值判断待筛选简历是否符合要求。

本发明提供了一种电子简历的筛选方法,获取简历模板中每个预标注项所设置的标准词语,并将所述标准词语作为第一词语;获取待筛选简历中每个预标注项所填的文字信息,对所述文字信息中文字进行分词,将分词后得到的词语作为第二词语;分别对第一词语和第二词语进行概念拆分后,根据拆分后得到的概念集合计算两者之间的词语相似度,根据所述词语相似度判断所述待筛选简历是否符合要求,若符合要求,则将对应的待筛选简历存入信息库中做下一步的筛选。则本发明中,在进行信息匹配时要对词语进行拆分,形成概念集合,而概念集合中的概念可以最大程度的涵盖词语的本质含义,所以从概念的层面对词语进行匹配,可以有效的提高简历筛选的精确度。

以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1