本发明涉及人才推荐,特别涉及一种基于多维度画像的高层次人才推荐方法、系统及介质。
背景技术:
1、目前,随着人工智能技术的发展和应用,高层次人才推荐已经逐渐从传统的人工筛选向智能化推荐转变。然而,现有的高层次人才推荐方法和系统仍然存在着一定的局限性和不足。第一,推荐结果不够准确:传统的算法模型主要是基于人才的职位和简历信息进行推荐,没有考虑用户的地理位置和行业背景等因素,导致推荐结果不够准确。第二,用户画像不够精细:传统的人才画像技术主要基于用户填写的信息,而往往存在填写不全或者填写不真实的情况,导致用户画像不够精细。
技术实现思路
1、本发明要解决的技术问题,在于提供一种基于多维度画像的高层次人才推荐方法、系统及介质,通过综合考虑用户、职位和地理区域画像等多种因素,建立了不同的算法推荐模型,提高高层次人才招聘的匹配度。
2、第一方面,本发明提供了一种基于多维度画像的高层次人才推荐方法,包括:
3、数据获取过程:针对结构化网页进行用户数据、职位数据以及地理区域数据采集,所述用户数据包括用户的个人信息、职业背景、技能水平、教育背景,所述职位数据包括职位名称、职位描述、薪资待遇、所属行业、所在地,所述地理区域数据包括各地区的行业分布、各行业的薪资范围;然后对采集的数据进行预处理,提取目标信息;
4、画像建立过程:基于处理后的数据建立多维度用户画像、职位画像和地理区域画像,所述多维度用户画像包括基础维度、科研维度以及学术维度;
5、推荐模型构建过程:采用聚类算法和相似度算法构建基于用户画像的推荐模型,用于找到与目标用户最相似的聚类簇,将其划分到该聚类簇中,根据这个聚类簇中其它人才的就业职位,计算职位得分;构建基于职位画像的推荐模型,用于将职位画像与学术维度和科研维度进行相似度计算;构建基于地理区域画像的推荐模型,用于用户求职区域的地理区域画像与其他区域的地理区域画像进行进行相似度计算;
6、职位推荐过程:对于指定的用户,根据其多维度用户画像通过基于用户画像的推荐模型,得到职位得分;然后根据基于职位画像的推荐模型以及基于地理区域画像的推荐模型分别计算得分,然后与职位得分进行加权计算,根据最后的得分得到职位推荐列表。
7、进一步地,所述基于用户画像的推荐模型使用k-means算法进行用户聚类,然后使用simrank进行相似度的计算,具体包括如下步骤:
8、步骤a1、对于指定的用户,将其对应的多维度用户画像进行向量化后,从数据集中随机选取一个样本作为初始聚类中心;
9、步骤a2、计算每个样本与当前聚类中心的最短距离,用d(x)表示;接着计算每个样本被选为下一个聚类中心的概率其中,x代表一个样本,x代表数据集;
10、步骤a3、按照轮盘法选择出下一个聚类中心,重复步骤a2直到选择出共k个聚类中心;
11、步骤a4、针对数据集中每个样本x,计算它到k个聚类中心的距离并将其分到距离最小的聚类中心所对应的类中;
12、步骤a5、聚类完成后,当一个目标用户填写相关信息后,找到与目标用户最相似的聚类簇,将其划分到该聚类簇中,根据这个聚类簇中其它人才的就业情况,通过simrank算法计算职位得分,公式如下:
13、
14、其中,c为常数,i(a)代表与节点a相连的邻居节点的集合,可以视为用户a具有的所有基本特征,|i(a)|代表与节点a相邻的邻居节点的数目,sim(a,b)代表两个用户节点的相似度,sim(ii(a),ij(b))中i和j代表a节点第i个特征与b节点第j个特征的相似度。
15、进一步地,推荐模型构建过程中,基于职位画像的推荐模型公式如下:
16、
17、其中,n为根据招聘职位需求条件,衡量人才价值的字段,设置的共同指标数量,h={h1,h2,h3,...,hn}表示学术特征向量,r={r1,r2,r3,…,rn}表示职位特征向量,sim(h,r)表示职位和学术的相似度;
18、基于地理区域画像的推荐模型公式如下:
19、
20、其中,g={g1,g2,g3,…,gm}表示求职区域的地理特征向量,e={e1,e2,e3,…,em}表示其他区域的地理特征向量,m代表地理位置的共同指标,sim(g,e)表示两地理区域的相似度。
21、进一步地,所述多维度用户画像中,基础维度包括姓名、头像、职称、机构、联系方式、邮箱、个人学术主页、教育经历、工作经历、个人简介;科研维度包括研究兴趣和研究领域;学术维度包括被引频次、发文数、发表期刊数、h指数、g指数、学术影响力。
22、第二方面,本发明提供了一种基于多维度画像的高层次人才推荐系统,包括:
23、数据获取模块:针对结构化网页进行用户数据、职位数据以及地理区域数据采集,所述用户数据包括用户的个人信息、职业背景、技能水平、教育背景,所述职位数据包括职位名称、职位描述、薪资待遇、所属行业、所在地,所述地理区域数据包括各地区的行业分布、各行业的薪资范围;然后对采集的数据进行预处理,提取目标信息;
24、画像建立模块:基于处理后的数据建立多维度用户画像、职位画像和地理区域画像,所述多维度用户画像包括基础维度、科研维度以及学术维度;
25、推荐模型构建模块:采用聚类算法和相似度算法构建基于用户画像的推荐模型,用于找到与目标用户最相似的聚类簇,将其划分到该聚类簇中,根据这个聚类簇中其它人才的就业职位,计算职位得分;构建基于职位画像的推荐模型,用于将职位画像与学术维度和科研维度进行相似度计算;构建基于地理区域画像的推荐模型,用于用户求职区域的地理区域画像与其他区域的地理区域画像进行进行相似度计算;
26、职位推荐模块:对于指定的用户,根据其多维度用户画像通过基于用户画像的推荐模型,得到职位得分;然后根据基于职位画像的推荐模型以及基于地理区域画像的推荐模型分别计算得分,然后与职位得分进行加权计算,根据最后的得分得到职位推荐列表。
27、进一步地,所述推荐模型构建模块中,基于用户画像的推荐模型使用k-means算法进行用户聚类,然后使用simrank进行相似度的计算,具体包括如下步骤:
28、步骤a1、对于指定的用户,将其对应的多维度用户画像进行向量化后,从数据集中随机选取一个样本作为初始聚类中心;
29、步骤a2、计算每个样本与当前聚类中心的最短距离,用d(x)表示;接着计算每个样本被选为下一个聚类中心的概率其中,x代表一个样本,x代表数据集;
30、步骤a3、按照轮盘法选择出下一个聚类中心,重复步骤a2直到选择出共k个聚类中心;
31、步骤a4、针对数据集中每个样本x,计算它到k个聚类中心的距离并将其分到距离最小的聚类中心所对应的类中;
32、步骤a5、聚类完成后,当一个目标用户填写相关信息后,找到与目标用户最相似的聚类簇,将其划分到该聚类簇中,根据这个聚类簇中其它人才的就业情况,通过simrank算法计算职位得分,公式如下:
33、
34、其中,c为常数,i(a)代表与节点a相连的邻居节点的集合,可以视为用户a具有的所有基本特征,|i(a)|代表与节点a相邻的邻居节点的数目,sim(a,b)代表两个用户节点的相似度,sim(ii(a),ij(b))中i和j代表a节点第i个特征与b节点第j个特征的相似度。
35、进一步地,推荐模型构建模块中,基于职位画像的推荐模型公式如下:
36、
37、其中,n为根据招聘职位需求条件,衡量人才价值的字段,设置的共同指标数量,h={h1,h2,h3,…,hn}表示学术特征向量,r={r1,r2,r3,…,rn}表示职位特征向量,sim(h,r)表示职位和学术的相似度;
38、基于地理区域画像的推荐模型公式如下:
39、
40、其中,g={g1,g2,g3,…,gm}表示求职区域的地理特征向量,e={e1,e2,e3,…,em}表示其他区域的地理特征向量,m代表地理位置的共同指标,sim(g,e)表示两地理区域的相似度。
41、进一步地,所述画像建立模块中,多维度用户画像的基础维度包括姓名、头像、职称、机构、联系方式、邮箱、个人学术主页、教育经历、工作经历、个人简介;科研维度包括研究兴趣和研究领域;学术维度包括被引频次、发文数、发表期刊数、h指数、g指数、学术影响力。
42、第三方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述的方法。
43、本发明实施例中提供的方案,至少具有如下优点:
44、1、提高高层次人才招聘的匹配度:通过综合考虑用户、职位和地理区域画像等多种因素,建立了不同的算法推荐模型,能够提高高层次人才招聘的匹配度。
45、2、提高招聘效率和准确度:通过采用自动化推荐系统,实现了高效快捷的招聘过程,减少了招聘人员的人力资源投入,从而提高了招聘效率和准确度。
46、3、降低人力资源成本:通过自动化推荐系统,减少了人力资源投入,从而降低了人力资源成本。
47、4、实现个性化推荐:通过采用机器学习算法,建立了个性化推荐模型,能够实现针对每个用户的个性化推荐,提高了推荐的准确度。
48、上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。