本发明属于企业管理,尤其涉及一种企业归纳系统及方法。
背景技术:
1、企业作为参保的主要对象,一直是人社行业关注的重点。现有的企业参保行为数据存在数据量大,数据特征不明显的特点,无法高效的应用在人社的各个场景中。
2、因此,如何快速高效的对企业参保行为信息进行归纳,如何借助数据挖掘、机器分析能力和数值化标签数为人社行业和企业提供服务,成为对企业精准归纳需要解决的关键问题。
技术实现思路
1、针对现有技术中的上述不足,本发明提供的一种企业归纳系统及方法,更加清楚地了解企业之间的关系并对相似企业进行查找归纳,为实现企业推荐、企业风险预警、政策仿真模拟等智能场景提供支撑。
2、为了达到以上目的,本发明采用的技术方案为:本方案提供一种企业归纳系统,包括:
3、第一处理子系统,用于自动化构建企业标签;
4、第二处理子系统,用于对构建的企业标签进行数值化处理,并基于相似度计算对参保企业进行归纳。
5、进一步地,所述第一处理子系统包括:
6、第一处理模块,用于根据企业参保规模分布,利用四分位法确定企业参保规模处于分割点位置的数值,构建企业参保规模标签;
7、第二处理模块,用于根据企业平均年龄分布,利用四分位法确定企业平均年龄处于分割点位置的数值,构建企业参保年龄标签;
8、第三处理模块,用于根据企业参保规模的时间序列构建线性回归函数,并根据线性回归函数的拟合情况,构建企业发展标签;
9、第四处理模块,用于根据企业平均参保时长分布,利用四分位法确定企业平均参保时长处于分割点位置的数值,构建企业用工稳定标签;
10、第五处理模块,用于通过企业参保人员的信息加权,构建企业人才层次标签。
11、再进一步地,所述第二处理子系统包括:
12、第六处理模块,用于对企业参保规模标签、企业参保年龄标签、企业发展标签、企业用工稳定标签以及企业人才层次标签分别进行数值化处理;
13、第七处理模块,用于根据数值化处理结果,计算目标企业与同行企业间的欧氏距离,得到欧氏距离中值最小的前n个企业;
14、第八处理模块,用于计算目标企业与前n个企业的皮尔逊相似度,完成对参保企业的归纳。
15、再进一步地,所述对企业参保规模标签进行数值化处理为:
16、
17、其中,sscale表示参保规模标签数值化后的值,n表示标签数,x1表示企业参保规模标签。
18、再进一步地,所述对企业发展标签进行数值化处理为:
19、
20、其中,sdev表示企业发展标签数值化后的值,n表示标签数,x2表示企业发展标签。
21、再进一步地,所述对企业用工稳定标签进行数值化处理为:
22、
23、其中,sstb表示企业用工稳定标签数值化后的值,n表示标签数,x3表示企业用工稳定标签。
24、再进一步地,所述对企业人才层次标签数值化处理为:
25、
26、其中,sp表示企业人才层次标签数值化后的值,i'表示企业参保人员的学历,n'表示企业参保人数,ni'表示学历对应的人数,sxl表示企业参保人员学历评分,syx表示企业参保人员毕业院校评分。
27、再进一步地,所述目标企业与同行企业间的欧氏距离为:
28、
29、其中,d(a,b)表示目标企业与同行企业间的欧氏距离,(x1,x2,...,x5)表示a企业标签,(y1,y2,...,y5)表示b企业标签,xi表示(x1,x2,...,x5),分别表示a企业的参保规模标签、参保年龄标签、发展标签、用工稳定标签和人才层次标签数值化后的值,yi表示(y1,y2,...,y5),分别表示b企业的参保规模标签、参保年龄标签、发展标签、用工稳定标签和人才层次标签数值化后的值,i=1,2,3,4,5,分别表示企业的参保规模标签、参保年龄标签、发展标签、用工稳定标签和人才层次标签。
30、再进一步地,所述皮尔逊相似度为:
31、
32、其中,ρa,b表示皮尔逊相似度,cov(·)表示协方差运算,x,y分别表示a企业标签和b企业标签,σ表示标准差,e[·]表示数学期望,μx和μy表示企业a和企业b的数学期望,和分别表示a企业标签和b企业标签的平均值。
33、本发明还提供了一种企业归纳方法,包括以下步骤:
34、s1、自动化构建企业标签;
35、s2、对构建的企业标签进行数值化处理,并基于相似度计算对参保企业进行归纳。
36、本发明的有益效果:
37、本发明通过对构建的企业标签进行数值化处理,并基于对相似度的计算,对参保企业进行归纳。本发明通过上述设计能够快速高效地寻找目标企业的相似企业并进行归纳,为实现企业推荐、企业风险预警、政策仿真模拟等智能场景提供支撑。
1.一种企业归纳系统,其特征在于,包括:
2.根据权利要求1所述的企业归纳系统,其特征在于,所述第一处理子系统包括:
3.根据权利要求2所述的企业归纳系统,其特征在于,所述第二处理子系统包括:
4.根据权利要求3所述的企业归纳系统,其特征在于,所述对企业参保规模标签进行数值化处理为:
5.根据权利要求3所述的企业归纳系统,其特征在于,所述对企业发展标签进行数值化处理为:
6.根据权利要求3所述的企业归纳系统,其特征在于,所述对企业用工稳定标签进行数值化处理为:
7.根据权利要求3所述的企业归纳系统,其特征在于,所述对企业人才层次标签数值化处理为:
8.根据权利要求3所述的企业归纳系统,其特征在于,所述目标企业与同行企业间的欧氏距离为:
9.根据权利要求8所述的企业归纳系统,其特征在于,所述皮尔逊相似度为:
10.一种如权利要求1-9任一所述的企业归纳系统的企业归纳方法,其特征在于,包括以下步骤: