一种基于职业轨迹数据的职位变迁预测方法与流程

文档序号:12366009阅读:527来源:国知局
一种基于职业轨迹数据的职位变迁预测方法与流程

本发明属于数据挖掘分析领域,特别一种基于职业轨迹数据的职位变迁预测方法。



背景技术:

近年来,基于用户职业轨迹预测用户职位变迁受到了越来越多研究人员的关注。所谓职位变迁预测,通常是指根据用户的历史职业轨迹数据为基础,结合用户的个体特征信息,若用户存在职业的变迁行为,可以对用户下一个职位的情况进行预测。其中,历史职业轨迹数据主要来源于用户在职业社交网络中所补充完善的数据。通过对历史职业轨迹数据挖掘,构建用户职位变迁的时空模型,发现职位变迁影响因素,借助现有算法可以准确的预测用户职位变迁情况。

通过对用户历史职业轨迹数据的观察,其中不难发现,用户职位变迁蕴含着丰富的时空规律。举例来说,中高层次的职位,对于下一个职位级别不会低于当前职位级别;不同的学历背景,对于职位的级别会产生影响,高学历,会拥有较高级别的职位;工作经验,同样会对职位级别造成影响。



技术实现要素:

为了解决在用户职业变迁时对于所获得职位情况的问题,本发明提供一种基于历史职业轨迹数据的职位变迁预测方法,该方法以用户职业数据为基础,发现职位变迁影响因素,结合现有的决策树方法,对职位变迁进行预测。

为实现上述目的,本发明采取的技术方案为:

一种基于职业轨迹数据的职位变迁预测方法,其特征在于,包括以下骤:

S1、在数据库中提取简历,获取用户的历史职业轨迹数据;

S2、通过对大规模用户职业轨迹数据进行统计分类对比,发现用户职位变迁时空特征,构建用户职位变迁时空模型;

S3、从用户职位变迁时空模型中,提取并量化用户职位变迁的影响因素;

S4、根据职位变迁影响因素定义与量化,结合用户的职位变迁数据,通过决策树算法训练职位变迁预测模型。

S5、以S4中职位变迁预测模型为基础,根据用户的当前职位P,预测用户职业变迁后的职位P’。

进一步地,一种基于职业轨迹数据的职位变迁预测方法S1中历史职业轨迹数据包含用户的教育背景情况、历史职位变迁、工作时间长度等数据信息;所述的历史职位变迁包括所在公司的规模,所在职位的级别。

进一步地,一种基于职业轨迹数据的职位变迁预测方法S1中时空特征包括时间上用户职位变迁的特征和职位上用户职位变迁的特征。

进一步地,一种基于职业轨迹数据的职位变迁预测方法S2包含子步骤:S21:首先对分析用户职位变迁在时间上的变化情况以及用户工作的时间跨度,发现时间上特征;S22:然后对不同公司,不同职位和不同教育背景用户的职位变化进行统计和度量,研究变化规律,发现空间上特征;S23:最后从时间上和空间上对一个用户职位上变化描述,通过数据拟合,发现用户职位变化规律。

进一步地,一种基于职业轨迹数据的职位变迁预测方法中用户职位变迁空间模型表示为用户职位变迁各种信息:包括用户职业轨迹数据中的时间信息,职位信息,公司信息以及个人教育背景用于描述用户职位变迁信息。

进一步地,一种基于职业轨迹数据的职位变迁预测方法S3中所述影响因素包含:

公司因素其中no.代表公司员工数量;

职位因素其中po代表用户职位的级别;

教育因素EF=∑De,其中De表示学历,De的量化定义为:

时间因素DF=离职时间-入职时间;

职位累积因素

进一步地,一种基于职业轨迹数据的职位变迁预测方法中S4所述职位变迁预测模型包括三部分,分别为输入端,预测部分和输出端,输入端为用户的职位变迁数据,预测端为提取数据中影响因素,根据训练的模型通过计算处理对职位进行预测,输出端为用户的下一个职位信息。

进一步地,一种基于职业轨迹数据的职位变迁预测方法中S3中所述影响因素包含:即从每一位用户i的职位变迁数据中分别提取上述影响因素,构成一个一位向量Vi={CFi,PFi,EFi,DFi,PAi},将Vi与下一个职位Pi一一对应,通过决策树算法训练职位变迁预测模型。

本发明具有以下有益效果:

在该方法中,更加全面的利用了用户历史的职业数据,发现了包括公司、职位、教育、时间、职位累积等多种职位变迁影响因素,从而获得的更高的预测准确率。

附图说明

图1为本发明基于职业轨迹数据的职位变迁预测方法流程图;

图2为本发明基于职业轨迹数据的职位变迁预测方法时间特征职位变化分布图;

图3为本发明基于职业轨迹数据的职位变迁预测方法空间特征职位变化分布图;

图4为本发明基于职业轨迹数据的职位变迁预测方法时间空间特征职位变化拟合示意图;

图5为本发明基于职业轨迹数据的职位变迁预测方法职位预测示意图;

图6为本发明基于职业轨迹数据的职位变迁预测方法不同职位预预测准确统计图。

具体实施方式

为了使本发明的目的及优点更加清楚明白,以下结合实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

S1、在数据库中提取简历,获取用户的历史职业轨迹数据。

历史职业轨迹数据包含用户的教育背景情况、历史职位变迁、工作时间长度等数据信息;历史职位变迁包括所在公司的规模,所在职位的级别。将这些职业轨迹根据用户个人信息和职位划分为职位变迁的数据片段,即从一个职位到另一个职位。

在本实施例中,共10418位用户的历史职业轨迹数据,划分为46673条数据片段。

S2、通过对大规模用户职业轨迹数据进行统计分类对比,发现用户职位变迁时空特征,构建用户职位变迁时空模型。

对S1中职位变迁片段进行研究分析,统计不同职位之间变化规律,以及在公司,时间,学历不同条件下职位变化的规律。综合规律,提出职位变化的时空特征,构建职位变化时空模型,具体为:

S21:首先对分析用户职位变迁在时间上的变化情况以及用户工作的时间跨度,发现时间上特征,如图2所示;

S22:然后对不同公司,不同职位和不同教育背景用户的职位变化进行统计和度量,研究变化规律,发现空间上特征,如图3所示;

S23:最后从时间上和空间上对一个用户职位上变化描述,通过数据拟合,发现用户职位变化规律,如图4所示,说明时间和空间共同影响职位变化情况。

以上所示图例均为S1中大量数据的统计拟合分析所得。

S3、从用户职位变迁时空模型中,提取并量化用户职位变迁的影响因素。

本实施例中根据公司员工数量对公司因素进行量化,根据职位级别对职位因素进行量化,根据学位情况对教育因素进行度量,根据工作时间对时间因素进行度量,根据历史上职位和时间两个因素对职位累积因素进行度量:

公司因素其中no.代表公司员工数量;

职位因素其中po代表用户职位的级别;

教育因素EF=∑De,其中De表示学历,De的量化定义为:

时间因素DF=离职时间-入职时间;

职位累积因素

S4、根据职位变迁影响因素定义与量化,结合用户的职位变迁数据,通过决策树算法训练职位变迁预测模型。

职位变迁预测模型包括三部分,分别为输入端,预测部分和输出端,输入端为用户的职位变迁数据,预测端为提取数据中影响因素,根据训练的模型通过计算处理对职位进行预测,输出端为用户的下一个职位信息。根据职位变迁影响因素,结合用户的历史职位数据,将这些因素数据作为训练输入端,采用决策树算法训练数据,生成职位变迁预测模型本实施例中从每一位用户i的职位变迁数据中分别提取上述影响因素,构成一个一位向量Vi={CFi,PFi,EFi,DFi,PAi},将Vi与下一个职位Pi一一对应,通过决策树算法训练职位变迁预测模型。

本实施例使用了S1中80%的数据作为训练数据,进行预测模型训练生成。

S5、以S4中职位变迁预测模型为基础,根据用户的当前职位,预测用户职业变迁后的职位。

输入用户的历史职业轨迹数据,当前公司、职位、教育背景、工作时间,通过预测模型进行预测计算,生成下一个职位情况,如图5所示。对于预测生成的职位仍旧采用S3中定义,用于对不同预测职位做准确性判断,本实施例使用剩余20%的步骤1中的数据用于预测,不同职位预测准确性结果如图6所示,在本实施例中职位预测准确率可达74%。

以上所述仅是本发明的实施过程,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1