
1.本公开涉及信息处理技术领域,尤其涉及一种基于预测模型的人员稳定性预测方法及装置。
背景技术:2.人员不稳定是每个企业都会面临的难题,企业人力资源管理中重要的一环就是识别人员不稳定的风险,并根据识别结果进行人员管理。
3.现有的识别方案主要基于人工实现,例如基于直属上级和同事间的评价实现,这种方案成本较高,准确度较低,难以满足实际需求。
技术实现要素:4.为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种基于预测模型的人员稳定性预测方法及装置。
5.根据本公开实施例的一个方面,提供了一种基于预测模型的人员稳定性预测方法,包括:
6.根据待评估人员的人员信息,确定特征分类为静态连续类型的第一特征数据、特征分类为静态离散类型的第二特征数据,以及特征分类为动态类型的第三特征数据;
7.针对所述第一特征数据、所述第二特征数据和所述第三特征数据中的至少之一,分别以与其特征分类匹配的数据处理方式对其进行数据处理;
8.针对所述第一特征数据、所述第二特征数据、所述第三特征数据中的至少之一,分别以与其特征分类匹配的特征向量生成方式,生成其的数据处理结果对应的特征向量;
9.根据所生成的特征向量,对所述待评估人员进行稳定性预测。
10.在一个可选示例中,所述第一特征数据的数据处理结果对应的特征向量为第一特征向量,所述第二特征数据的数据处理结果对应的特征向量为第二特征向量,所述第三特征数据的数据处理结果对应的特征向量为第三特征向量;
11.所述第一特征向量由人员评估模型中的第一子模型对所述第一特征数据的数据处理结果进行向量转化后得到,所述第二特征向量由所述人员评估模型中的第二子模型对所述第二特征数据的数据处理结果进行密集向量转化和特征向量提取后得到,所述第三特征向量由所述人员评估模型中的第三子模型对所述第三特征数据的数据处理结果进行序列整形、数据规范化和时间序列特征提取后得到。
12.在一个可选示例中,所述人员评估模型还包括隐藏层和全连接层,所述隐藏层分别与所述第一子模型、所述第二子模型、所述第三子模型连接,所述全连接层与所述隐藏层连接,所述隐藏层用于对所述第一特征向量、所述第二特征向量和所述第三特征向量进行拼接以得到拼接向量,所述全连接层用于根据所述拼接向量,生成所述待评估人员的稳定性预测结果。
13.在一个可选示例中,所述针对所述第一特征数据、所述第二特征数据和所述第三
特征数据中的至少之一,分别以与其特征分类匹配的数据处理方式对其进行数据处理,包括:
14.在所述第一特征数据中存在第一人员特征对应的数据,且所述第一人员特征对应的数据满足预设数值异常截断条件的情况下,确定所述第一人员特征对应的截断特征数值的归一化处理结果,并将所述第一人员特征对应的数据更新为所述归一化处理结果;
15.在所述第二特征数据中存在第二人员特征对应的数据,且所述第二人员特征对应的数据满足预设稀疏类别值过滤条件的情况下,将所述第二人员特征对应的数据更新为第一预设类别值;
16.在所述第三特征数据中存在第三人员特征对应的、由按照时序顺序排列的多个特征数值组成的数据的情况下,利用预设时间衰减因子,分别对所述多个特征数值进时间衰减处理,以得到所述多个特征数值对应的多个衰减数值,并将所述第三人员特征对应的数据更新为所述多个衰减数值。
17.在一个可选示例中,
18.在基于人员评估模型对所述待评估人员进行稳定性预测的情况下,所述方法还包括:
19.获取用于训练得到所述人员评估模型的多个参考人员各自的人员信息;
20.针对所述多个参考人员中的每个参考人员,根据其的人员信息,从所述第二人员特征对应的、由n个类别值组成的预设类别值集合中,选取与其匹配的类别值;
21.在所述n个类别值中的m个类别值的总选取次数与所述n个类别值的总选取次数的比值大于预设比值的情况下,将所述n个类别值中的剩余n
‑
m个类别值中的各个类别值均确定为所述第二人员特征对应的稀疏类别值;
22.所述在所述第二特征数据中存在第二人员特征对应的数据,且所述第二人员特征对应的数据满足预设稀疏类别值过滤条件的情况下,将所述第二人员特征对应的数据更新为第一预设类别值,包括:
23.在所述第二特征数据中存在所述第二人员特征对应的数据,且所述第二人员特征对应的数据为所述第二人员特征对应的任一稀疏类别值的情况下,将所述第二人员特征对应的数据更新为第一预设类别值。
24.在一个可选示例中,所述针对所述第一特征数据、所述第二特征数据和所述第三特征数据中的至少之一,分别以与其特征分类匹配的数据处理方式对其进行数据处理,包括:
25.在所述第一特征数据中缺失第四人员特征对应的数据的情况下,确定所述第四人员特征对应的最小特征数值,并将所述最小特征数值作为所述第四人员特征对应的数据添加至所述第一特征数据中;
26.在所述第二特征数据中缺失第五人员特征对应的数据的情况下,将第二预设类别值作为所述第五人员特征对应的数据添加至所述第二特征数据中;
27.在所述第三特征数据中缺失第六人员特征对应的数据的情况下,将预设特征数值作为所述第六人员特征对应的数据添加至所述第三特征数据中。
28.在一个可选示例中,
29.所述根据所生成的特征向量,对所述待评估人员进行稳定性预测,包括:
30.根据所述第一特征数据、所述第二特征数据、所述第三特征数据各自的数据处理结果对应的特征向量,确定所述待评估人员的稳定概率和不稳定概率;
31.根据所述不稳定概率与所述稳定概率的比值,对所述不稳定概率进行对数转换处理,以得到与所述不稳定概率对应的不稳定分数;
32.所述方法还包括:
33.在所述不稳定分数位于预设分数范围内的情况下,根据所述不稳定分数,对所述待评估人员进行管理;
34.在所述不稳定分数位于预设分数范围外的情况下,确定所述预设分数范围的分数极值中与所述不稳定分数最接近的分数极值,并根据所确定的分数极值,对所述待评估人员进行管理。
35.在一个可选示例中,根据所述不稳定概率与所述稳定概率的比值,对所述不稳定概率进行对数转换处理,以得到与所述不稳定概率对应的不稳定分数利用的公式为:
36.score’=score+bln(p)
‑
bln(p’)
37.其中,score’为所述不稳定分数,score为预设分数,b为预设系数,p为预设比值,p’为所述不稳定概率与所述稳定概率的比值。
38.根据本公开实施例的另一个方面,提供了一种基于预测模型的人员稳定性预测装置,包括:
39.第一确定模块,用于根据待评估人员的人员信息,确定特征分类为静态连续类型的第一特征数据、特征分类为静态离散类型的第二特征数据,以及特征分类为动态类型的第三特征数据;
40.处理模块,用于针对所述第一特征数据、所述第二特征数据和所述第三特征数据中的至少之一,分别以与其特征分类匹配的数据处理方式对其进行数据处理;
41.生成模块,用于针对所述第一特征数据、所述第二特征数据、所述第三特征数据中的至少之一,分别以与其特征分类匹配的特征向量生成方式,生成其的数据处理结果对应的特征向量;
42.预测模块,用于根据所生成的特征向量,对所述待评估人员进行稳定性预测。
43.在一个可选示例中,所述第一特征数据的数据处理结果对应的特征向量为第一特征向量,所述第二特征数据的数据处理结果对应的特征向量为第二特征向量,所述第三特征数据的数据处理结果对应的特征向量为第三特征向量;
44.所述第一特征向量由人员评估模型中的第一子模型对所述第一特征数据的数据处理结果进行向量转化后得到,所述第二特征向量由所述人员评估模型中的第二子模型对所述第二特征数据的数据处理结果进行密集向量转化和特征向量提取后得到,所述第三特征向量由所述人员评估模型中的第三子模型对所述第三特征数据的数据处理结果进行序列整形、数据规范化和时间序列特征提取后得到。
45.在一个可选示例中,所述人员评估模型还包括隐藏层和全连接层,所述隐藏层分别与所述第一子模型、所述第二子模型、所述第三子模型连接,所述全连接层与所述隐藏层连接,所述隐藏层用于对所述第一特征向量、所述第二特征向量和所述第三特征向量进行拼接以得到拼接向量,所述全连接层用于根据所述拼接向量,生成所述待评估人员的稳定性预测结果。
46.在一个可选示例中,所述处理模块,包括:
47.第一处理子模块,用于在所述第一特征数据中存在第一人员特征对应的数据,且所述第一人员特征对应的数据满足预设数值异常截断条件的情况下,确定所述第一人员特征对应的截断特征数值的归一化处理结果,并将所述第一人员特征对应的数据更新为所述归一化处理结果;
48.第二处理子模块,用于在所述第二特征数据中存在第二人员特征对应的数据,且所述第二人员特征对应的数据满足预设稀疏类别值过滤条件的情况下,将所述第二人员特征对应的数据更新为第一预设类别值;
49.第三处理子模块,用于在所述第三特征数据中存在第三人员特征对应的、由按照时序顺序排列的多个特征数值组成的数据的情况下,利用预设时间衰减因子,分别对所述多个特征数值进时间衰减处理,以得到所述多个特征数值对应的多个衰减数值,并将所述第三人员特征对应的数据更新为所述多个衰减数值。
50.在一个可选示例中,
51.所述装置还包括:
52.获取模块,用于在基于人员评估模型对所述待评估人员进行稳定性预测的情况下,获取用于训练得到所述人员评估模型的多个参考人员各自的人员信息;
53.选取模块,用于针对所述多个参考人员中的每个参考人员,根据其的人员信息,从所述第二人员特征对应的、由n个类别值组成的预设类别值集合中,选取与其匹配的类别值;
54.第二确定模块,用于在所述n个类别值中的m个类别值的总选取次数与所述n个类别值的总选取次数的比值大于预设比值的情况下,将所述n个类别值中的剩余n
‑
m个类别值中的各个类别值均确定为所述第二人员特征对应的稀疏类别值;
55.所述第二处理子模块,具体用于:
56.在所述第二特征数据中存在所述第二人员特征对应的数据,且所述第二人员特征对应的数据为所述第二人员特征对应的任一稀疏类别值的情况下,将所述第二人员特征对应的数据更新为第一预设类别值。
57.在一个可选示例中,所述处理模块,包括:
58.第四处理子模块,用于在所述第一特征数据中缺失第四人员特征对应的数据的情况下,确定所述第四人员特征对应的最小特征数值,并将所述最小特征数值作为所述第四人员特征对应的数据添加至所述第一特征数据中;
59.第五处理子模块,用于在所述第二特征数据中缺失第五人员特征对应的数据的情况下,将第二预设类别值作为所述第五人员特征对应的数据添加至所述第二特征数据中;
60.第六处理子模块,用于在所述第三特征数据中缺失第六人员特征对应的数据的情况下,将预设特征数值作为所述第六人员特征对应的数据添加至所述第三特征数据中。
61.在一个可选示例中,
62.所述预测模块,包括:
63.确定子模块,用于根据所述第一特征数据、所述第二特征数据、所述第三特征数据各自的数据处理结果对应的特征向量,确定所述待评估人员的稳定概率和不稳定概率;
64.获取子模块,用于根据所述不稳定概率与所述稳定概率的比值,对所述不稳定概
率进行对数转换处理,以得到与所述不稳定概率对应的不稳定分数;
65.所述装置还包括:
66.第一管理模块,用于在所述不稳定分数位于预设分数范围内的情况下,根据所述不稳定分数,对所述待评估人员进行管理;
67.第二管理模块,用于在所述不稳定分数位于预设分数范围外的情况下,确定所述预设分数范围的分数极值中与所述不稳定分数最接近的分数极值,并根据所确定的分数极值,对所述待评估人员进行管理。
68.在一个可选示例中,所述获取子模块根据所述不稳定概率与所述稳定概率的比值,对所述不稳定概率进行对数转换处理,以得到与所述不稳定概率对应的不稳定分数利用的公式为:
69.score’=score+bln(p)
‑
bln(p’)
70.其中,score’为所述不稳定分数,score为预设分数,b为预设系数,p为预设比值,p’为所述不稳定概率与所述稳定概率的比值。
71.根据本公开实施例的再一个方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述基于预测模型的人员稳定性预测方法。
72.根据本公开实施例的又一个方面,提供了一种电子设备,包括:
73.处理器;
74.用于存储所述处理器可执行指令的存储器;
75.所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述基于预测模型的人员稳定性预测方法。
76.本公开的实施例中,对于需要评估稳定性的任意企业员工,可以将其作为待评估人员,获取待评估人员的人员信息,并根据待评估人员的人员信息,确定特征分类为静态连续类型的第一特征数据、特征分类为静态离散类型的第二特征数据,以及特征分类为动态类型的第三特征数据,第一特征数据、第二特征数据、第三特征数据能够对待评估人员的静态连续特征、静态离散特征、动态特征进行有效地表征。接下来,可以针对第一特征数据、第二特征数据和第三特征数据中的至少之一,分别以与其特征分类匹配的数据处理方式对其进行数据处理,这样有利于保证对第一特征数据、第二特征数据和第三特征数据的数据处理效果。之后,可以针对第一特征数据、第二特征数据、第三特征数据中的至少之一,分别以与其特征分类匹配的特征向量生成方式,生成其的数据处理结果对应的特征向量,这样有利于保证生成的各特征向量的可靠性,再之后,根据所生成的特征向量来对待评估人员进行稳定性预测,能够较好地保证预测准确性。可见,本公开的实施例中,通过不同特征分类的特征数据的确定,各特征数据的数据处理,以及特征向量生成处理,能够实现对人员的稳定性识别,整个过程无需人工过多参与,成本较低,准确性较高,能够较好地满足实际需求。
77.下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
78.通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明
书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
79.图1是本公开一示例性实施例提供的基于预测模型的人员稳定性预测方法的流程示意图。
80.图2是本公开一示例性实施例中不稳定倾向的正态分布示意图。
81.图3是本公开另一示例性实施例提供的基于预测模型的人员稳定性预测方法的流程示意图。
82.图4是本公开一示例性实施例提供的基于预测模型的人员稳定性预测装置的结构示意图。
83.图5是本公开一示例性实施例提供的电子设备的结构图。
具体实施方式
84.下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的示例实施例的限制。
85.应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
86.本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
87.还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
88.还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
89.另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
90.还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
91.同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
92.以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
93.对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
94.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
95.本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电
子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
96.终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
97.示例性方法
98.图1是本公开一示例性实施例提供的基于预测模型的人员稳定性预测方法的流程示意图。图1所示的方法可以包括步骤101、步骤102、步骤103和步骤104,下面对各步骤分别进行说明。
99.步骤101,根据待评估人员的人员信息,确定特征分类为静态连续类型的第一特征数据、特征分类为静态离散类型的第二特征数据,以及特征分类为动态类型的第三特征数据。
100.这里,待评估人员可以为需要评估稳定性的任意企业员工,例如为需要评估稳定性的任意房产公司员工、需要评估稳定性的任意保险公司员工等;其中,房产公司员工可以为房产经纪人,保险公司员工可以为保险经纪人,任一企业员工的稳定性可以通过企业员工继续留在当前所在企业工作的意愿强弱或者可能性大小进行表征。为了便于理解,下文中均以待评估人员为房产经纪人的情况为例进行说明。
101.在步骤101中,可以从房产公司的后台数据库中,获取作为待评估人员的房产经纪人的人员信息,房产经纪人的人员信息中包括但不限于经纪人个人基本信息、经纪人作业行为信息,以及经纪人所在门店、团队、城市业绩信息等;其中,经纪人个人基本信息包括但不限于所在城市信息、信用分信息、招聘来源信息、职级信息、商机转化能力信息等;经纪人作为行为信息包括但不限于房源带看次数信息、房源录入数量信息、房源实勘次数信息、商机量信息等;经纪人所在门店、团队、城市业绩信息包括但不限于当月房源成交总量信息、最近一段时间中的每天的房源成交量信息等。
102.在获取作为待评估人员的房产经纪人的人员信息之后,可以基于所获取的人员信息,确定特征分类为静态连续类型的第一特征数据、特征分类为静态离散类型的第二特征数据,以及特征分类为动态类型的第三特征数据。
103.需要说明的是,总体上来说,第一特征数据和第二特征数据的特征分类均属于静态类型,那么,第一特征数据中的数据和第二特征数据中的数据在短期内均不会随时间变化,但是,个体上来说,第一特征数据的特征分类具体为静态连续类型,这表示第一特征数据中的数据理论上可以有无限多种可能,而第二特征数据的特征分类具体为静态离散类型,这表示第二特征数据中的数据只有有限种可能。另外,第三特征数据的特征分类为动态类型,那么,第三特征数据中的数据容易随着时间变化,例如,第三特征数据中的数据可能每天都会发生变化,第三特征数据也可以称为时间序列数据。
104.可选地,第一特征数据中包括但不限于信用分信息、商机转换能力信息等;第二特征数据中包括但不限于城市信息、星座信息、招聘来源信息等;第三特征数据中包括但不限于房源带看次数信息、房源录入数量信息、房源实勘次数信息等。
105.步骤102,针对第一特征数据、第二特征数据和第三特征数据中的至少之一,分别以与其特征分类匹配的数据处理方式对其进行数据处理。
106.这里,可以预先设置特征分类与数据处理方式之间的对应关系,任一特征分类对应的数据处理方式为与本特征分类匹配的数据处理方式。
107.这样,依据预先设置的对应关系,能够便捷可靠地确定出与静态连续类型匹配的第一数据处理方式、与静态离散类型匹配的第二数据处理方式,以及与动态类型匹配的第三数据处理方式。接下来,可以以第一数据处理方式对第一特征数据进行数据处理,以得到第一特征数据的数据处理结果;和/或,以第二数据处理方式对第二特征数据进行数据处理,以得到第二特征数据的数据处理结果;和/或,以第三数据处理方式对第三特征数据进行数据处理,以得到第三特征数据的数据处理结果。
108.步骤103,针对第一特征数据、第二特征数据、第三特征数据中的至少之一,分别以与其特征分类匹配的特征向量生成方式,生成其的数据处理结果对应的特征向量。
109.这里,可以预先设置特征分类与特征向量生成方式之间的对应关系,任一特征分类对应的特征向量生成方式为与本特征分类匹配的特征向量生成方式。
110.这里,依据预先设置的对应关系,能够便捷可靠地确定出与静态连续类型对应的第一特征向量生成方式、与静态离散类型对应的第二特征向量生成方式,以及与动态类型对应的第三特征向量生成方式。接下来,可以以第一特征向量生成方式,生成第一特征数据的数据处理结果对应的特征向量;和/或,以第二特征向量生成方式,生成第二特征数据的数据处理结果对应的特征向量;和/或,以第三特征向量生成方式,生成第三特征数据的数据处理结果对应的特征向量。
111.步骤104,根据所生成的特征向量,对待评估人员进行稳定性预测。
112.这里,通过根据生成的特征向量,对待评估人员进行稳定性预测,可以确定待评估人员的稳定概率(即继续留在当前所在企业工作的概率)和/或不稳定概率(即不继续留在当前所在企业工作的概率)。之后,可以基于待评估人员的稳定性预测结果,采取一些干预措施,例如,在待评估人员的稳定概率小于设定稳定概率时,可以与待评估人员沟通其需求或者为待评估人员争取更多的资源等。
113.本公开的实施例中,对于需要评估稳定性的任意企业员工,可以将其作为待评估人员,获取待评估人员的人员信息,并根据待评估人员的人员信息,确定特征分类为静态连续类型的第一特征数据、特征分类为静态离散类型的第二特征数据,以及特征分类为动态类型的第三特征数据,第一特征数据、第二特征数据、第三特征数据能够对待评估人员的静态连续特征、静态离散特征、动态特征进行有效地表征。接下来,可以针对第一特征数据、第二特征数据和第三特征数据中的至少之一,分别以与其特征分类匹配的数据处理方式对其进行数据处理,这样有利于保证对第一特征数据、第二特征数据和第三特征数据的数据处理效果。之后,可以针对第一特征数据、第二特征数据、第三特征数据中的至少之一,分别以与其特征分类匹配的特征向量生成方式,生成其的数据处理结果对应的特征向量,这样有利于保证生成的各特征向量的可靠性,再之后,根据所生成的特征向量来对待评估人员进
行稳定性预测,能够较好地保证预测准确性。可见,本公开的实施例中,通过不同特征分类的特征数据的确定,各特征数据的数据处理,以及特征向量生成处理,能够实现对人员的稳定性识别,整个过程无需人工过多参与,成本较低,准确性较高,能够较好地满足实际需求。
114.在一个可选示例中,第一特征数据的数据处理结果对应的特征向量为第一特征向量,第二特征数据的数据处理结果对应的特征向量为第二特征向量,第三特征数据的数据处理结果对应的特征向量为第三特征向量;
115.第一特征向量由人员评估模型中的第一子模型对第一特征数据的数据处理结果进行向量转化后得到,第二特征向量由人员评估模型中的第二子模型对第二特征数据的数据处理结果进行密集向量转化和特征向量提取后得到,第三特征向量由人员评估模型中的第三子模型对第三特征数据的数据处理结果进行序列整形、数据规范化和时间序列特征提取后得到。
116.可选地,人员评估模型还包括隐藏层(hidden layer)和全连接层(full connection layer),隐藏层分别与第一子模型、第二子模型、第三子模型连接,全连接层与隐藏层连接,隐藏层用于对第一特征向量、第二特征向量和第三特征向量进行拼接以得到拼接向量,全连接层用于根据拼接向量,生成待评估人员的稳定性预测结果。
117.本公开的实施例中,可以通过机器学习算法,预先训练得到一属于端到端模型的人员评估模型,人员评估模型具体可以基于多个参考人员的人员信息训练得到;其中,人员评估模型可以包括第一子模型、第二子模型、第三子模型,分别与第一子模型、第二子模型、第三子模型连接的隐藏层,以及与隐藏层连接的全连接层。
118.第一特征数据的数据处理结果可以提供给第一子模型,第一子模型可以对第一特征数据的数据处理结果进行向量转换,例如直接将第一特征数据的数据处理结果转换为dense features(即密集特征),转换得到的dense features即可作为第一特征向量,第一子模型还可以将第一特征向量输出给隐藏层。
119.第二特征数据的数据处理结果可以提供给第二子模型,第二子模型可以对第二特征数据的数据处理结果进行密集向量转化和特征向量提取,例如先通过embedding(其是一种将离散变量转换为连续变量的方式)层,将第二特征数据的数据处理结果转化为dense向量(稠密向量),再通过门循环单元(gated recurrent unit,gru)神经网络结构提取特征向量,以得到第二特征向量,第二子模型还可以将第二特征向量输出给隐藏层。
120.第三特征数据的数据处理结果可以提供给第三子模型,第三子模型可以对第三特征数据的数据处理结果进行序列整形、数据规范化和时间序列特征提取,例如,可以先进行序列整形,然后通过批标准化(batch normalization)方式,将数据规范化,之后通过长短期记忆网络(long short
‑
term memory,ltsm)网络结构进行时间序列特征的提取,以得到第三特征向量,第三子模型还可以将第三特征向量输出给隐藏层。
121.在获得第一特征向量、第二特征向量、第三特征向量之后,隐藏层可以将第一特征向量、第二特征向量、第三特征向量进行拼接,以组成一完整的特征向量,该特征向量即可作为拼接向量,隐藏层可以将拼接向量输出给全连接层。
122.全连接层中可以有若干层,利用全连接层对拼接向量进行处理,将relu作为激活函数。之后通过sigmoid函数进行二分类,得到待评估人员稳定与不稳定的概率(即上文中提及的稳定概率和不稳定概率),进而能够得到待评估人员的稳定性预测结果。
123.本公开的实施例中,针对第一特征数据、第二特征数据和第三特征数据各自的数据处理结果,可以利用通过机器学习算法训练得到的人员评估模型中的相应子模型,以合适的方式实现相应特征向量的生成。另外,利用人员评估模型中的hidden layer和全连接层,能够便捷可靠地实现稳定性预测结果的生成,并且,稳定性预测结果的客观性能够得到较好地保证,这样能够较好地避免基于人工实现人员稳定性识别时主观性强的问题,从而较好地保证识别结果的准确性和可靠性。
124.需要说明的是,步骤102的具体实施方式多样,下面进行举例介绍。
125.在一种具体实施方式中,步骤102,包括:
126.在第一特征数据中存在第一人员特征对应的数据,且第一人员特征对应的数据满足预设数值异常截断条件的情况下,确定第一人员特征对应的截断特征数值的归一化处理结果,并将第一人员特征对应的数据更新为归一化处理结果;
127.在第二特征数据中存在第二人员特征对应的数据,且第二人员特征对应的数据满足预设稀疏类别值过滤条件的情况下,将第二人员特征对应的数据更新为第一预设类别值;
128.在第三特征数据中存在第三人员特征对应的、由按照时序顺序排列的多个特征数值组成的数据的情况下,利用预设时间衰减因子,分别对多个特征数值进时间衰减处理,以得到多个特征数值对应的多个衰减数值,并将第三人员特征对应的数据更新为多个衰减数值。
129.在第一特征数据中存在第一人员特征对应的数据的情况下,可以判断第一人员特征对应的数据是否满足异常截断条件。在判断结果为满足的情况下,可以获取第一人员特征对应的截断特征数值,对第一人员特征对应的截断特征数值进行归一化处理,以得到归一化处理结果,并将第一人员特征对应的数据更新为归一化处理结果。
130.需要说明的是,目前主流的归一化处理方式有两种,分别是minmaxscaler和standardscaler;其中,minmaxscaler根据特征的最大值、最小值将数据缩放到0
‑
1区间内;standardscaler根据特征的均值和方差,将数据缩放到以0为均值的区间上。由于standardscaler对数据的异常值容忍度更强,本公开的实施例中可以采用standardscaler来进行截断特征数值的归一化处理。
131.在一个具体例子中,第一人员特征为信用分特征,则第一人员特征对应的数据具体为信用分信息,信用分信息具体可以为信用分值。
132.为了实现预设数值异常截断条件相关的判断,可以预先设定信用分特征对应的截断特征数值。假设人员评估模型具体基于10000个参考人员(每个参考人员均为一房产经纪人)的人员信息训练得到,则可以基于这10000个参考人员各自的人员信息,获取这10000个参考人员对应的10000个信用分值,并将这10000个信用分值按照从小至大的顺序进行排列,以得到一信用分值序列,接下来,可以选取该信用分值序列中排序在指定位置(例如95%位置、98%位置等)的信用分值,并将选取的该信用分值作为信用分特征对应的截断特征数值。
133.在第一特征数据中存在作为信用分特征对应的数据的一信用分值的情况下,可以将该信用分值与信用分特征对应的截断特征数值进行大小比较,在该信用分值小于或等于信用分特征对应的截断特征数值的情况下,可以判定该信用分值不满足预设数值异常截断
条件,否则,可以判定该信用分值满足预设数值异常截断条件。在该信用分值满足预设数值异常截断条件的情况下,可以对信用分特征对应的截断特征数值进行归一化处理,以得到归一化处理结果,并将该信用分值更新为归一化处理结果。
134.在第二特征数据中存在第二人员特征对应的数据的情况下,可以判断第二人员特征对应的数据是否满足预设稀疏类别值过滤条件。在判断结果为满足的情况下,可以将第二人员特征对应的数据更新为第一预设类别值。
135.可选地,在基于人员评估模型对待评估人员进行稳定性预测的情况下,该方法还包括:
136.获取用于训练得到人员评估模型的多个参考人员各自的人员信息;
137.针对多个参考人员中的每个参考人员,根据其的人员信息,从第二人员特征对应的、由n个类别值组成的预设类别值集合中,选取与其匹配的类别值;
138.在n个类别值中的m个类别值的总选取次数与n个类别值的总选取次数的比值大于预设比值的情况下,将n个类别值中的剩余n
‑
m个类别值中的各个类别值均确定为第二人员特征对应的稀疏类别值;
139.在第二特征数据中存在第二人员特征对应的数据,且第二人员特征对应的数据满足预设稀疏类别值过滤条件的情况下,将第二人员特征对应的数据更新为第一预设类别值,包括:
140.在第二特征数据中存在第二人员特征对应的数据,且第二人员特征对应的数据为第二人员特征对应的任一稀疏类别值的情况下,将第二人员特征对应的数据更新为第一预设类别值。
141.在一个具体例子中,第二人员特征为招聘来源特征,则第二人员特征对应的数据具体为招聘来源信息,招聘来源信息具体可以为一招聘来源选项(其可以呈字段形式)。
142.在获取用于训练得到人员评估模型的多个参考人员各自的人员信息,例如得到10000个参考人员各自的人员信息之后,可以针对每个参考人员,根据其的人员信息,从招聘来源特征对应的,由n个招聘来源选项组成的招聘来源选项集合中,选取与其匹配的招聘来源选项。假设n的取值具体为100,但进行招聘来源选项的选取时,大多数情况下是100个招聘来源选项中特定的5个招聘来源选项被选取,例如,总共选取了10000次,其中8000次选取的是该特定的5个招聘来源选项,8000与10000的比值为0.8,假设预设比值为0.7,显然,0.8大于0.7,这时,可以将100个招聘来源选项中剩余的95个招聘来源选项均确定为招聘来源特征对应的稀疏类别值。
143.在第二人员特征中存在作为第二人员特征对应的数据的招聘来源选项的情况下,可以判断该招聘来源选项是否为招聘来源特征对应的任一稀疏类别值。在判断结果为是的情况下,可以认为该招聘来源选项属于较为稀疏的招聘来源选项,这时,可以将该招聘来源选项更新为第一预设类别值,例如更新为其它招聘来源选项,这样相当于将所有稀疏的招聘来源选项合并为了一个新的招聘来源选项。
144.在第三特征数据中存在第三人员特征对应的、由按照时序时序排列的多个特征数值的情况下,可以获取预设时间衰减因子,时间衰减因子具体可以为0.9、0.85、0.80等,在此不再一一列举。接下来,可以利用预设时间衰减因子,分别对多个特征数据进行时间衰减处理,以得到多个特征数值对应的多个衰减数值,多个衰减数值与多个特征数值之间可以
为一一对应的关系。之后,可以将第三人员特征对应的数据由多个特征数值更新为多个衰减数值。
145.在一个具体例子中,第三人员特征为房源带看次数特征,则第三人员特征对应的数据可以由连续n天对应的n个特征数值组成,每个特征数值具体可以为一带看次数值。假设n为15,则第三人员特征对应的数据具体由15个带看次数值组成,假设这15个带看次数值中的某一带看次数值为c,该带看次数值对应的日期距离当前日期的天数为t,预设时间衰减因子为0.9,则可以计算0.9
t
*c,并将0.9
t
*c作为c这个带看次数值对应的衰减数值,按照类似的方式,可以得到另外14个带看次数值对应的14个衰减数值,从而最终得到15个衰减数值,之后,可以将第三人员特征对应的数据由15个带看次数值更新为15个衰减数值。
146.这种实施方式中,基于预设数值异常截断条件,可以准确地识别出第一特征数据中的数据存在异常的情况,再结合截断特征数值的归一化处理结果和存在异常的数据的更新处理,不仅能够保证第一特征数据的数据处理结果的准确性和可靠性,还能够使数据量纲一致,避免数据量纲不一致对于人员评估模型的运行效果造成影响。基于预设稀疏类别值过滤条件,可以准确地识别出第二特征数据中的数据属于稀疏数据的情况,通过将所有的稀疏数据进行合并,可以重新组合成新的离散特征数据,这样能够较好地解决数据存在长尾效应的问题。另外,通过利用时间衰减因子,对第三特征数据中的特征数值进行时间衰减处理,并将特征数值更新为衰减数值,能够赋予距离当前日期不同的特征数值以不同的权重,从而能够有效地保证第三特征数据的数据处理结果的可靠性。
147.在另一种具体实施方式中,步骤102,包括:
148.在第一特征数据中缺失第四人员特征对应的数据的情况下,确定第四人员特征对应的最小特征数值,并将最小特征数值作为第四人员特征对应的数据添加至第一特征数据中;
149.在第二特征数据中缺失第五人员特征对应的数据的情况下,将第二预设类别值作为第五人员特征对应的数据添加至第二特征数据中;
150.在第三特征数据中缺失第六人员特征对应的数据的情况下,将预设特征数值作为第六人员特征对应的数据添加至第三特征数据中。
151.在一个具体例子中,第一特征数据中缺失第四人员特征对应的数据,第四人员特征为信用分特征,则第一特征数据中具体缺失信用分值,这时,可以确定信用分特征对应的最小特征数值。
152.假设人员评估模型具体基于10000个参考人员的人员信息训练得到,则可以基于这10000个参考人员各自的人员信息,获取这10000个参考人员对应的10000个信用分值,并从这10000个信用分值中选取数值最小的信用分值,选取出的信用分值即可作为信用分特征对应的最小特征数值。
153.在确定信用分特征对应的最小特征数值之后,可以将所确定的最小特征数据作为第四人员特征对应的数据添加至第一特征数据中。
154.在另一个具体例子中,第二特征数据中缺失第五人员特征对应的数据,第五人员特征为招聘来源特征,则第二特征数据中具体缺失招聘来源选项,这时,可以将第二预设类别值作为第五人员特征对应的数据添加至第二特征数据中,第二预设类别值具体可以为其它招聘来源选项。
155.在再一个具体例子中,第三特征数据中缺失第六人员特征对应的数据,第六人员特征为带看次数特征,则第三特征数据中具体缺失带看次数值,这时,可以将预设特征数值作为第六人员特征对应的数据添加至第三特征数据中,预设特征数值具体可以为0。
156.这种实施方式中,对于第一特征数据存在数据缺失的情况,可以通过添加最小特征数值的方式实现数据补全,对于第二特征数据存在数据缺失的情况,可以通过添加第二预设类别值的方式实现数据补全,对于第三特征数据存在数据缺失的请,可以通过添加预设特征数值的方式实现数据补全,也即,无论是第一特征数据、第二特征数据还是第三特征数据存在数据缺失的情况,均可以采用合适的方式实现数据补全,从而较好地保证特征数据的数据处理结果的可靠性。
157.可见,本公开的实施例中,针对第一特征数据、第二特征数据和第三特征数据分别进行数据处理时,既可以从不同的处理角度进行数据处理,也可以从相同的处理角度,以不同的方式进行数据处理,以较好地保证最终的数据处理效果。
158.在一个可选示例中,步骤104,包括:
159.根据第一特征数据、第二特征数据、第三特征数据各自的数据处理结果对应的特征向量,确定待评估人员的稳定概率和不稳定概率;
160.根据不稳定概率与稳定概率的比值,对不稳定概率进行对数转换处理,以得到与不稳定概率对应的不稳定分数;
161.该方法还包括:
162.在不稳定分数位于预设分数范围内的情况下,根据不稳定分数,对待评估人员进行管理;
163.在不稳定分数位于预设分数范围外的情况下,确定预设分数范围的分数极值中与不稳定分数最接近的分数极值,并根据所确定的分数极值,对待评估人员进行管理。
164.本公开的实施例中,根据第一特征数据、第二特征数据、第三特征数据各自的数据处理结果对应的特征向量,再结合人员评估模型的使用,能够生成待评估人员的稳定性预测结果,待评估人员的稳定性预测结果中具体可以包括待评估人员的不稳定概率,通过将1与待评估人员的不稳定概率相减,即可得到待评估人员的稳定概率。
165.接下来,可以根据不稳定概率与稳定概率的比值(该比值也可以称为目标概率比),对不稳定概率进行对数转换处理,以得到与不稳定概率对应的不稳定分数。在一种具体实施方式中,根据不稳定概率与稳定概率的比值,对不稳定概率进行对数转换处理,以得到与不稳定概率对应的不稳定分数利用的公式为:
166.score’=score+bln(p)
‑
bln(p’)
167.其中,score’为不稳定分数,score为预设分数,b为预设系数,p为预设比值,p’为不稳定概率与稳定概率的比值。
168.这里,score可以为65,b可以为(
‑
4)/ln2,p可以为1/60,那么,若目标概率比为1/60,则不稳定分数为65分,并且,目标概率比每增加1倍,不稳定分数涨4分。
169.这种实施方式中,通过将目标概率值代入上述公式进行计算,能够非常便捷可靠地确定出不稳定概率对应的不稳定分数。
170.在得到不稳定分数之后,可以判断不稳定分数是否位于预设分数范围;其中,预设分数范围可以为0至100分。在判断结果为位于的情况下,可以直接根据不稳定分数,对待评
估人员进行管理,例如,可以在不稳定分数大于设定分数(例如50分、60分等)的情况下,采取一些干预措施,例如与待评估人员沟通其需求或者为待评估人员争取更多的资源等。在判断结果为不位于的情况下,由于0至100分这个预设分数范围有2个分数极值,可以确定这2个分数极值中与不稳定分数最接近的分数极值,假设不稳定分数为105分,则确定出的分数极值为100分,由于100分大于设定分数,可以采取一些干预措施,从而实现对待评估人员的管理。
171.可见,本公开的实施例中,通过对数转换逻辑的利用,再结合预设分数范围的利用,可以最终得到一位于预设分数范围内且符合正态分布的分数值,这样能够更直观地刻画人员的不稳定倾向,使不稳定倾向在人群中满足正态分布(具体可参见图2中示意的分布情况)。
172.在一个可选示例中,如图3所示,可以先获取作为待评估人员的房产经纪人的人员信息以作为原始数据,原始数据中包括但不限于经纪人个人基本信息、经纪人作业行为信息,以及经纪人所在门店、团队、城市业绩信息等。
173.接下来,可以针对原始数据进行特征筛选。可选地,在针对原始数据进行特征筛选时,从特征组成结构出发,具体可以筛选出静态信息和时间序列数据,静态信息是指短期内不会随时间变化的信息,包括但不限于所在城市信息、信用分信息、职级信息、商机转化能力信息等,时间序列数据是指每天都会产生的作业数据,包括但不限于房源带看次数信息、房源录入数量信息、房源实勘次数信息、商机量信息、成交业绩信息等;或者,在针对原始数据进行特征筛选时,从业务分类出发,具体可以筛选出经纪人基础信息、带看相关信息、房源相关信息、客源相关信息、交流相关信息、展位购买相关信息、合作成交相关信息、转化成交相关信息、作业偏好相关信息、业绩相关信息、负面信息等。
174.在筛选出静态信息和时间序列数据后,可以进行数据清洗、数据关联、宽表构建,以得到静态连续数据(其相当于上文中特征分类为静态连续类型的第一特征数据)、静态类别数据(其相当于上文中特征分类为静态离散类型的第二特征数据)、时间序列数据(其相当于上文中特征分类为动态类型的第三特征数据),以便据此进入特征工程阶段。
175.需要说明的是,原始数据中可能存在着500个左右之多的特征相关的数据,这些特征并非全部对人员评估模型有增益作用,且特征之间也会存在相关性、共线性,为了保证人员评估模型训练、部署的效率,减少无效特征的干扰,特征筛选阶段可以使用iv值、卡方检验、相关性、共线性等方法进行特征筛选,以最终仅保留近200个特征,这样,第一特征数据、第二特征数据、第三特征数据涉及的人员特征的总和可以仅为200个左右。
176.在特征工程阶段,主要的处理步骤包括以下几个方面:
177.缺失值处理:首先对特征的缺失值分析,分析其缺失、为0的比例,根据特征的类型(离散/连续)与缺失的比例,以及业务含义的不同,进行不同方式的缺失值填充。具体地,对于作业数据的缺失,可以直接填充0,也就是默认没有作业;对于信用分和其他分值类数据填充最小值;对于离散型数据,单独新增“其他”类型进行填充(对应上文中步骤102的后一种具体实施方式)。
178.异常值处理:通过对数值类特征进行探索性数据分析(exploratory data analysis,eda),发现部分特征存在异常值,由于异常值会严重影响数据归一化的结果,导致人员评估模型的区分度降低,因此可以对异常值在98%或者95%的位置进行截断,以保
留绝大部分信息的前提下,消除异常值(对应上文中步骤102的前一种具体实施方式中针对第一特征数据的相关处理)。
179.数据归一化:由于工程实践中,standardscaler的效果较好,因此可以选用standardscaler进行数据归一化。
180.低频过滤:通过对类别型特征进行eda分析,发现部分特征枚举值存在长尾效应,例如,招聘来源字段,总共有近100种枚举值,但是5个枚举值就占总样本的80%以上,剩下的枚举值十分稀疏,对于这种情况,我们将所有稀疏的枚举值进行合并,重新组合成新的离散特征(对应上文中步骤102的前一种具体实施方式中针对第二特征数据的相关处理)。
181.时间序列步长:时间序列数据的步长是一个值得考量的关键问题,如果步长设置得过长,则会损失经纪人作业的细节,必然影响人员评估模型的模型效果,如果设置得过短,比如以天为单位,会存在大量噪音数据,人员评估模型难以拟合收敛,无法抓住经纪人作业的本质规律,另外步长过短也会导致训练数据的容量太大,考虑到各类因素,最终选择以15天为一个周期(相当于上文中n的取值为15)。
182.通过特征工程阶段,可以得到经归一化处理后的静态连续数据(其相当于上文中第一特征数据的数据处理结果)、经低频过滤处理后的静态类别数据(其相当于上文中第二特征数据的数据处理结果)、经时间衰减处理后的时间序列数据(其相当于上文中第三特征数据的数据处理结果)。
183.之后,人员评估模型中的第一子模型可以将经归一化处理后的静态连续数据转换为dense features,以得到第一特征向量;人员评估模型中的第二子模型将经低频过滤处理后的静态类别数据先通过embedding层(其有利于充分挖掘离散特征间的关联性)进行转换,然后通过gru提取特征向量,以得到第二特征向量;人员评估模型中的第三子模型将经时间衰减处理后的时间序列数据先进行序列整形,然后通过batch normalization方式进行数据规范化,最后通过ltsm网络提取时间序列特征,以得到第三特征向量,第三特征向量能够有效地反映待评估人员的动态特征。
184.再之后,人员评估模型中的hidden layer通过将第一特征向量、第二特征向量、第三特征向量进行拼接,并将人员评估模型中的拼接向量提供给full connection layer,full connection layer最终可以得到待评估人员的不稳定倾向,得到的不稳定倾向后续可以用于业务调用,以便实现对待评估人员的管理。
185.可见,通过端到端模型将第一子模型、第二子模型和第三子模型进行组合并统一训练,整个人员评估模型可以被看做一个特征提取器,其可以从不同结构、不同维度的数据中提取特征,进行数据降维操作,经过层层提取,最终将原始的人员信息降成了一维,也就是最终的稳定性预测结果。
186.可选地,还可以针对人员评估模型进行调优处理,例如,通过调整网络结构、学习率、l2正则化、batch size以及迭代次数等,提升人员评估模型的区分度和泛化性能。
187.综上,本公开的实施例中,依托大数据技术,通过机器学习算法来定量化地评估稳定性,能够精准、快速、全面地评估员工的不稳定倾向,且成本低廉,还可在不同城市和行业间进行推广。
188.本公开的实施例提供的任一种基于预测模型的人员稳定性预测方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:终端设备和服务器等。或者,本公开
实施例提供的任一种基于预测模型的人员稳定性预测方法可以由处理器执行,如处理器通过调用存储器存储的相应指令来执行本公开实施例提及的任一种基于预测模型的人员稳定性预测方法。下文不再赘述。
189.示例性装置
190.图4是本公开一示例性实施例提供的基于预测模型的人员稳定性预测装置的结构示意图,图4所示的装置包括第一确定模块401、处理模块402、生成模块403和预测模块404。
191.第一确定模块401,用于根据待评估人员的人员信息,确定特征分类为静态连续类型的第一特征数据、特征分类为静态离散类型的第二特征数据,以及特征分类为动态类型的第三特征数据;
192.处理模块402,用于针对第一特征数据、第二特征数据和第三特征数据中的至少之一,分别以与其特征分类匹配的数据处理方式对其进行数据处理;
193.生成模块403,用于针对第一特征数据、第二特征数据、第三特征数据中的至少之一,分别以与其特征分类匹配的特征向量生成方式,生成其的数据处理结果对应的特征向量;
194.预测模块404,用于根据所生成的特征向量,对待评估人员进行稳定性预测。
195.在一个可选示例中,第一特征数据的数据处理结果对应的特征向量为第一特征向量,第二特征数据的数据处理结果对应的特征向量为第二特征向量,第三特征数据的数据处理结果对应的特征向量为第三特征向量;
196.第一特征向量由人员评估模型中的第一子模型对第一特征数据的数据处理结果进行向量转化后得到,第二特征向量由人员评估模型中的第二子模型对第二特征数据的数据处理结果进行密集向量转化和特征向量提取后得到,第三特征向量由人员评估模型中的第三子模型对第三特征数据的数据处理结果进行序列整形、数据规范化和时间序列特征提取后得到。
197.在一个可选示例中,人员评估模型还包括隐藏层和全连接层,隐藏层分别与第一子模型、第二子模型、第三子模型连接,全连接层与隐藏层连接,隐藏层用于对第一特征向量、第二特征向量和第三特征向量进行拼接以得到拼接向量,全连接层用于根据拼接向量,生成待评估人员的稳定性预测结果。
198.在一个可选示例中,处理模块402,包括:
199.第一处理子模块,用于在第一特征数据中存在第一人员特征对应的数据,且第一人员特征对应的数据满足预设数值异常截断条件的情况下,确定第一人员特征对应的截断特征数值的归一化处理结果,并将第一人员特征对应的数据更新为归一化处理结果;
200.第二处理子模块,用于在第二特征数据中存在第二人员特征对应的数据,且第二人员特征对应的数据满足预设稀疏类别值过滤条件的情况下,将第二人员特征对应的数据更新为第一预设类别值;
201.第三处理子模块,用于在第三特征数据中存在第三人员特征对应的、由按照时序顺序排列的多个特征数值组成的数据的情况下,利用预设时间衰减因子,分别对多个特征数值进时间衰减处理,以得到多个特征数值对应的多个衰减数值,并将第三人员特征对应的数据更新为多个衰减数值。
202.在一个可选示例中,
203.该装置还包括:
204.获取模块,用于在基于人员评估模型对待评估人员进行稳定性预测的情况下,获取用于训练得到人员评估模型的多个参考人员各自的人员信息;
205.选取模块,用于针对多个参考人员中的每个参考人员,根据其的人员信息,从第二人员特征对应的、由n个类别值组成的预设类别值集合中,选取与其匹配的类别值;
206.第二确定模块,用于在n个类别值中的m个类别值的总选取次数与n个类别值的总选取次数的比值大于预设比值的情况下,将n个类别值中的剩余n
‑
m个类别值中的各个类别值均确定为第二人员特征对应的稀疏类别值;
207.第二处理子模块,具体用于:
208.在第二特征数据中存在第二人员特征对应的数据,且第二人员特征对应的数据为第二人员特征对应的任一稀疏类别值的情况下,将第二人员特征对应的数据更新为第一预设类别值。
209.在一个可选示例中,处理模块402,包括:
210.第四处理子模块,用于在第一特征数据中缺失第四人员特征对应的数据的情况下,确定第四人员特征对应的最小特征数值,并将最小特征数值作为第四人员特征对应的数据添加至第一特征数据中;
211.第五处理子模块,用于在第二特征数据中缺失第五人员特征对应的数据的情况下,将第二预设类别值作为第五人员特征对应的数据添加至第二特征数据中;
212.第六处理子模块,用于在第三特征数据中缺失第六人员特征对应的数据的情况下,将预设特征数值作为第六人员特征对应的数据添加至第三特征数据中。
213.在一个可选示例中,
214.预测模块404,包括:
215.确定子模块,用于根据第一特征数据、第二特征数据、第三特征数据各自的数据处理结果对应的特征向量,确定待评估人员的稳定概率和不稳定概率;
216.获取子模块,用于根据不稳定概率与稳定概率的比值,对不稳定概率进行对数转换处理,以得到与不稳定概率对应的不稳定分数;
217.该装置还包括:
218.第一管理模块,用于在不稳定分数位于预设分数范围内的情况下,根据不稳定分数,对待评估人员进行管理;
219.第二管理模块,用于在不稳定分数位于预设分数范围外的情况下,确定预设分数范围的分数极值中与不稳定分数最接近的分数极值,并根据所确定的分数极值,对待评估人员进行管理。
220.在一个可选示例中,获取子模块根据不稳定概率与稳定概率的比值,对不稳定概率进行对数转换处理,以得到与不稳定概率对应的不稳定分数利用的公式为:
221.score’=score+bln(p)
‑
bln(p’)
222.其中,score’为不稳定分数,score为预设分数,b为预设系数,p为预设比值,p’为不稳定概率与稳定概率的比值。
223.示例性电子设备
224.下面,参考图5来描述根据本公开实施例的电子设备。该电子设备可以是第一设备
和第二设备中的任一个或两者、或与它们独立的单机设备,该单机设备可以与第一设备和第二设备进行通信,以从它们接收所采集到的输入信号。
225.图5图示了根据本公开实施例的电子设备500的框图。
226.如图5所示,电子设备500包括一个或多个处理器501和存储器502。
227.处理器501可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备500中的其他组件以执行期望的功能。
228.存储器502可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器501可以运行所述程序指令,以实现上文所述的本公开的各个实施例的基于预测模型的人员稳定性预测方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
229.在一个示例中,电子设备500还可以包括:输入装置503和输出装置504,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
230.例如,在电子设备500是第一设备或第二设备时,该输入装置503可以是麦克风或麦克风阵列。在电子设备500是单机设备时,该输入装置503可以是通信网络连接器,用于从第一设备和第二设备接收所采集的输入信号。
231.此外,该输入装置503还可以包括例如键盘、鼠标等等。
232.该输出装置504可以向外部输出各种信息。该输出装置504可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出装置等等。
233.当然,为了简化,图5中仅示出了该电子设备500中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备500还可以包括任何其他适当的组件。
234.示例性计算机程序产品和计算机可读存储介质
235.除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的基于预测模型的人员稳定性预测方法中的步骤。
236.所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如java、c++等,还包括常规的过程式程序设计语言,诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
237.此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的基于预测模型的人员稳定性预测方法中的步骤。
238.所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd
‑
rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
239.以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
240.本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
241.本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
242.可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
243.还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
244.提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
245.为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。