一种人物画像与职位匹配的方法及系统的制作方法_4

文档序号:9844417阅读:来源:国知局
职位的匹配度。
[0062]综上,本实施例的系统优于现有技术,解决了现有技术中一方面割裂了条件之间的关联,另一方面由于自然语言的复杂性,当遇到相同含义的不同表述时,匹配效果不佳等问题。
[0063]综上所述,本发明应用数据挖掘和自然语义分析的相关方法,将人物的历史行为和历史职位数据整理成用若干个特征项表征的统一规格,并运用深度学习的方法,将人物画像标签与历史职位描述联系在一起,得到两者之间的深层次关联;随后综合历史职位和当前职位的职位描述和其它属性,训练模型,并在模型的基础上进行聚类分析,得到职位的若干个类别及其数学特征;最终将通过这个模型,运用回归模型和分类算法,提高人物画像和职位描述的匹配精度和匹配速度。
[0064]这里本发明的描述和应用都只是说明性和示意性的,并非是想要将本发明的范围限制在上述实施例中。这里所披露的实施例的变形和改变是完全可能的,对于那些本领域的普通技术人员来说,实施例的替换和等效的各种部件均是公知的。本领域技术人员还应该清楚的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部件来实现,以及在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形和改变。
【主权项】
1.一种人物画像与职位匹配的方法,其特征在于,包括下列步骤: 51、对职位信息预处理的步骤:对职位信息进行预处理,得到经预处理的历史职位词语序列和经预处理的当前职位词语序列; 52、职位特征标注的步骤:对所述的经预处理的历史职位词语序列进行处理,得到已标注的历史职位信息和历史职位分类模型;以及,对所述的经预处理的当前职位词语序列进行处理,得到已标注的当前职位信息和当前职位分类模型; 53、关联提取的步骤:根据已有的人物画像信息和上述得到的历史职位分类模型,提取人物画像与历史职位特征的关联; 54、模型训练的步骤:根据上述得到的已标注的历史职位信息、历史职位分类模型、已标注的当前职位信息以及当前职位分类模型,获取历史职位特征与当前职位特征的关联; 55、结果输出的步骤:根据已有的人物画像信息以及上述得到的人物画像与历史职位特征的关联、历史职位特征与当前职位特征的关联、已标注的当前职位信息,获取人物画像与当前职位的匹配度。2.如权利要求1所述的人物画像与职位匹配的方法,其特征在于,步骤SI中所述的对职位信息进行预处理包括:输入职位的各项数据;将所述职位的各项数据中的中文文本进行分词后进行文本清洗操作,非中文文本的职位信息则根据数据类型按照特征处理流程进行清洗操作。3.如权利要求1所述的人物画像与职位匹配的方法,其特征在于,步骤S2中所述的对经预处理的历史职位词语序列进行处理包括:生成文档的向量表示; 使用机器学习方法,将历史职位聚类并标注特征或类别;使用机器学习方法,训练历史职位分类模型。4.如权利要求3所述的人物画像与职位匹配的方法,其特征在于,设总共m个职位的所有文本包含的词语总数为s,每个职位的文本信息为一个文档D,一个包含d个词语的文档D的词语序列为[wl,w2,…,wd],每个文档的s值各不相同; 生成文档的向量表示具体包括:通过向量空间模型将每个文档转化为具有同等长度8的向量,此时整体信息为一个m*s的矩阵S,每一行代表一个文档向量,每一列即每个维度表示一个词语的特定统计量;再将维度从s缩减到q,即矩阵S转化为m*q的矩阵Q,其中每一维度在数学意义上代表一个复合特征; 使用机器学习方法,将历史职位聚类并标注特征或类别具体包括:视每个文档向量为向量空间中的散点进行聚类分析,将散点划分为k个类别,每个行向量标注一个类别; 使用机器学习方法,训练历史职位分类模型具体包括:已标注了k个类别的m*q矩阵Q做训练数据,训练得到历史职位分类模型。5.如权利要求1所述的人物画像与职位匹配的方法,其特征在于,步骤S2中所述的对经预处理的当前职位词语序列进行处理包括:生成文档的向量表示;使用机器学习方法,将当前职位聚类并标注特征或类别;使用机器学习方法,训练当前职位分类模型。6.如权利要求1所述的人物画像与职位匹配的方法,其特征在于,步骤S3中通过数据挖掘和深度学习方法提取所述的人物画像与历史职位特征的关联。7.如权利要求6所述的人物画像与职位匹配的方法,其特征在于,假设人物画像信息用一个n*p矩阵P表示,代表有η种人物类型,用P种特征来表示;历史职位分类模型在数学意义上可简单抽象成一个k*q矩阵C,其余历史职位信息用k行矩阵X表示;人物画像与历史职位的n*k关系矩阵R,R^表示第i种人物画像与第j种历史职位类型的关联频度; 所述人物画像与历史职位特征的关联,具体为人物画像特征与历史职位特征之间的关联矩阵1] = <^04(:)+如(?71?)+0,其中€函数和8函数是对矩阵的变换函数,矩阵8是偏置矩阵,α、β、γ分别是各线性加权项的权重参数。8.如权利要求1所述的人物画像与职位匹配的方法,其特征在于,步骤S4中具体使用机器学习、深度学习方法和训练模型方法,将历史职位特征与当前职位特征的关联。9.如权利要求1所述的人物画像与职位匹配的方法,其特征在于,步骤S5中具体包括:用矩阵P代表人物画像,用矩阵U代表人物画像与历史职位特征的关联,用矩阵V代表历史职位特征与当前职位特征的关联,用矩阵Y代表已标注的当前职位信息; 人物画像与当前职位的匹配度W = f(P*g(U)*h(V)+B,Y),f函数用来计算两个矩阵各行向量两两之间的相似度,g函数和h函数是对矩阵的变换函数,矩阵B是偏置矩阵。10.一种人物画像与职位匹配的系统,其特征在于,包括: 职位信息预处理模块,用于对职位信息进行预处理,得到经预处理的历史职位词语序列和经预处理的当前职位词语序列; 职位特征标注模块,用于对所述的经预处理的历史职位词语序列进行处理,得到已标注的历史职位信息和历史职位分类模型;以及,对所述的经预处理的当前职位词语序列进行处理,得到已标注的当前职位信息和当前职位分类模型; 关联提取模块,用于根据已有的人物画像信息和上述得到的历史职位分类模型,提取人物画像与历史职位特征的关联; 模型训练模块,用于根据上述得到的已标注的历史职位信息、历史职位分类模型、已标注的当前职位信息以及当前职位分类模型,获取历史职位特征与当前职位特征的关联;结果输出模块,用于根据已有的人物画像信息以及上述得到的人物画像与历史职位特征的关联、历史职位特征与当前职位特征的关联、已标注的当前职位信息,获取人物画像与当前职位的匹配度。
【专利摘要】本发明提供了一种人物画像与职位匹配的方法及系统,目的是保留住并利用到职位描述的语义信息,挖掘出人物画像与职位之间更深层次的关联,有效提高人物画像和职位的匹配精度和匹配速度。方法包括下:对职位信息预处理的步骤;职位特征标注的步骤;关联提取的步骤;模型训练的步骤;结果输出的步骤。系统包括:职位信息预处理模块;职位特征标注模块;关联提取模块;模型训练模块;结果输出模块。本发明有效地利用了职位描述的语义信息,能够挖掘出人物画像和职位要求中的复合属性,从而提取其中更深层次的关联,有效地提高了人物画像和职位的匹配精度和匹配速度。
【IPC分类】G06K9/62
【公开号】CN105608477
【申请号】CN201610111030
【发明人】吕云
【申请人】吕云
【公开日】2016年5月25日
【申请日】2016年3月1日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1