基于数据深度挖掘的人才评价方法、系统及存储介质与流程

文档序号:34187658发布日期:2023-05-17 14:03阅读:47来源:国知局
基于数据深度挖掘的人才评价方法、系统及存储介质与流程

本发明属于人才评价的,具体涉及一种基于数据深度挖掘的人才评价方法、系统及存储介质。


背景技术:

1、人才是企业的宝贵财富,企业的快速健康发展离不开人才的支持。科学有效开展人才评价,挖掘人力资源,将合适的人才应用在合适的工作上,是快速提升企业发展和效率的重要措施。有些国际化大企业成立的人才评价部门,重点分析人才的各方面信息和优势,挖掘人才,做到人尽其用。人才评价的本质是,从评价对象获取关键的信息,采用合适的算法进行分析并形成相应的分析报告。随着社会的快速发展,每个人才肩负的角色越来越多,人才的综合评价也日趋多样化。部分企业开展了形式多样的人才评价方式,但仍无法真实反映人才的真正水平,原因在于:

2、1、目前每位人才身上的“标签”越来越多,有的机构为了能全面评价人才能力,设置了三四十个维度,在综合分析时,不仅造成计算量庞大,而且无法突出各个指标的重要程度;2、大量的评价“标签”采用文字、字母等非数据格式记录,且可能存在数据丢失的情况,无法直接进行数据分析,需要对数据进行有效的清洗;3、现有技术中有采用将人力评价指标经过简单赋分后直接相加求合并进行排名的方法,但由于不同指标的重要程度无法体现,结果失真较大;4、有些技术为了体现不同指标的重要程度,采取加权平均数的方法进行分析,但无法避免人为主观性强的缺陷,造成不同指标之间相同隐含信息的重叠。

3、本质上而言,现有方法仍是将数据进行简单的预处理和简单计算,无法有效提取数据内部的隐含信息,更无法深度挖掘人才的各方面情况,颗粒度不够。


技术实现思路

1、本发明的针对现有技术的缺点与不足,提供一种基于数据深度挖掘的人才评价方法、系统及存储介质,通过对人力数据进行挖掘分析,按照指标提取人力数据并进行数据处理,再通过客观权重法对指标进行赋权,并计算指标的相关系数,构建相关系数矩阵,最后通过计算综合得分,生成分析报告,实现了客观性、全面性的人力评价。

2、为了达到上述目的,本发明采用以下技术方案:

3、一方面,本发明提供一种基于数据深度挖掘的人才评价方法,所述方法包括下述步骤:

4、s1、使用爬虫软件从人力系统中按指标获取待评价对象的人力数据表;

5、s2、对待评价对象的人力数据表进行清洗与整理,获得标准化矩阵;

6、s3、利用客观权重法对标准化矩阵中指标进行赋权,并计算其相关系数,得到相关系数矩阵;

7、s4、计算相关系数矩阵的特征根和特征向量,并计算各个特征根的贡献率及累计贡献率,当前h个特征根的累计贡献率大于设定贡献率阈值时,停止计算并将前h个特征根作为主成分;

8、s5、计算各个待评价对象的综合得分,并对主成分进行分析,获得专题指标,判断专题指标的得分并进行排名,生成分析报告。

9、作为优选的技术方案,所述爬虫软件从人力系统获取m个待评价对象的人力数据,每个人力数据包括n个指标x,构成待评价对象的人力数据表,表示为:

10、

11、其中,amn表示第m个待评价对象的第n个指标的取值。

12、作为优选的技术方案,所述获得规范人力数据表,具体为:

13、首先进行数据清洗:对数值格式数据中的无效数据进行清除、缺失数据进行填充、异常数据进行更换,对非数值格式数据进行转换,得到全数值型数据;

14、再对清洗后的数据进行标准化变换,得到标准化矩阵zm×n;

15、所述转换公式为:

16、

17、

18、

19、所述标准化矩阵表示为:

20、

21、其中,aij表示清洗后数据中第i个待评价对象的第j个指标的取值,表示第j个指标的平均值,sj表示第j个指标的样本标准差,zij表示标准化矩阵中第i个待评价对象的第j个指标的取值。

22、作为优选的技术方案,利用客观权重法中的熵权法对标准化矩阵中指标进行赋权,并计算其相关系数,得到相关系数矩阵,具体为:

23、首先计算标准化矩阵中各指标的熵值,公式为:

24、

25、其中,ej表示第j个指标的熵值;

26、接着根据熵值,计算标准化矩阵中各指标的差异性系数,公式为:

27、

28、其中,fj表示第j个指标的差异性系数;

29、最后计算标准化矩阵中各指标的权重,公式为:

30、

31、其中,wj表示第j个指标的客观权重;

32、计算得到各指标权重后,计算标准化矩阵的相关系数,得到相关系数矩阵r,表示为:

33、

34、其中,z表示指标赋权后的标准化矩阵;zt是z的转置矩阵;rij表示相关系数矩阵中第i个待评价对象的第j个指标的相关系数,公式为:

35、

36、其中,zki表示标准化矩阵z中第k个待评价对象的第i个指标的取值,zkj表示标准化矩阵z中第k个待评价对象的第j个指标的取值。

37、作为优选的技术方案,所述计算相关系数矩阵的特征根和特征向量,具体为:

38、根据相关系数矩阵r列特征方程,并求解相关系数矩阵r的特征根,公式为:

39、|r-λi|=0

40、其中,i表示单位矩阵,λ表示特征根集;

41、将特征根集中的特征根按照从大到小的顺序进行排列,并满足:λ1≥λ2≥…n≥0,再求解每一特征根对应的标准正交化特征向量η;所述标准正交化特征向量的每一个元素作为每一个指标数据的计算系数,用于计算每一主成分的评分以及确定每一主成分代表的指标数据。

42、作为优选的技术方案,所述特征根贡献率的计算公式为:

43、

44、所述累计贡献率的计算公式为:

45、

46、当前h个特征根的累计贡献率大于设定的贡献率阈值时,并将前h个特征根作为主成分。

47、作为优选的技术方案,所述计算各个待评价对象的综合得分,具体为:

48、得到前h个主成分后,将标准化矩阵带入到变换方程中,求得前h个主成分中每一主成分的得分,再乘以本身的贡献率,最后将前h个主成分得分及贡献率的乘积求和,得到某一待评价对象的综合得分,公式为:

49、

50、其中,mi表示第i个待评价对象的综合得分,yk表示第k个主成分的得分,计算式为ηkj为第k个主成分的标准正交化特征向量的第j个元素。

51、作为优选的技术方案,所述变换方程通过选取前h个主成分进行分析,根据前h个主成分的相关系数得到,公式为:

52、

53、其中,x1~xn表示变换前的指标,m1~mh表示变换后的指标,由贡献率从高到低排序获得;pij表示为第i个主成分对应的标准正交化特征向量ηi的每一元素。

54、另一方面,本发明提供一种基于数据深度挖掘的人才评价系统,包括数据获取模块、数据标准化模块、系数计算模块、贡献计算模块及报告生成模块;

55、所述数据获取模块用于使用爬虫软件从人力系统中按指标获取待评价对象的人力数据表;

56、所述数据标准化模块用于对待评价对象的人力数据表进行清洗与整理,获得标准化矩阵;

57、所述系数计算模块用于利用客观权重法对标准化矩阵中指标进行赋权,并计算其相关系数,得到相关系数矩阵;

58、所述贡献计算模块用于计算相关系数矩阵的特征根和特征向量,并计算主成分贡献率及累计贡献率,当前h个特征根的累计贡献率大于设定贡献率阈值时,停止计算并将前h个特征根作为主成分;

59、所述报告生成模块用于计算各个待评价对象的综合得分,并对贡献率较高的主成分进行分析,获得专题指标,判断专题指标的得分并进行排名,生成分析报告。

60、还一方面,本发明提供一种计算机可读存储介质,存储有程序,所述程序被处理器执行时,实现上述的基于数据深度挖掘的人才评价方法。

61、本发明与现有技术相比,具有如下优点和有益效果:

62、本发明通过采用大数据深度挖掘的分析方法对人力数据信息进行综合评价,实现了客观性、全面性的人力评价,具体效果如下:

63、1、利用数据清洗将数据中的无效数据进行剔除,缺失数据进行填充,异常数据进行更换,非数值格式数据进行转换,得到全数值型数据,有利于保证数据的准确性和可分析性。

64、2、通过客观权重法中的熵权法,计算指标信息熵的多少,客观地对指标进行赋权,再计算指标的相关系数实现各个指标的客观分析,排除了人为因素干扰,全面消除主观性,使分析结果更加客观。

65、3、采用降维算法分析大量数据,有效降低了计算量,采用简单的线性相加算法进行降维处理,降低不重要的指标计算量,使各个指标之间的重叠而信息得以消除,避免重复分析导致计算失真,提充分体现了数据的内部信息。

66、4、利用客观权重和矩阵方程法可以实现各个质变的优劣分析,避免人工主观赋权与分析导致的结果失真,进一步丰富分析结果。

67、5、本发明方法适用于大量指标数据分析,可快速分析内部信息,适用范围广、场景多。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1