本技术实施例涉及机器学习,尤其涉及一种风险类型生成方法、装置、电子设备及计算机可读存储介质。
背景技术:
1、在车险领域中,一些存在理赔风险的案件(例如欺诈案件)通常需要相关人员进行人工核查发现,并针对案件所属风险类型确定出相应的处理方案,存在效率较低、成本较高的问题。
2、为了解决这一问题,相关技术应用了机器学习的方法,设计了一种用于识别案件是否具备风险的方案,基于这种方案,相关人员可以无需人工核查便确定一个案件是否具备风险。
3、但是,这种方案的识别结果精度不高,针对案件的风险类型的判别,仍需要相关人员进行人工识别,存在效率较低的问题。
技术实现思路
1、本技术实施例提供一种风险类型生成方法、装置、电子设备及计算机可读存储介质,以解决相关技术中需要人工识别案件风险类型导致的效率较低的问题。
2、第一方面,本技术实施例提供了一种风险类型生成方法,所述方法包括:
3、获取待处理案件信息;
4、通过第一分类模型生成针对所述待处理案件信息的风险标签;
5、在所述风险标签用于表征待处理案件存在风险的情况下,基于第二分类模型生成针对所述待处理案件的风险类型。
6、可选地,所述方法还包括:
7、获取结案案件信息集;其中,所述结案案件信息集中各结案案件信息分别对应于一样本风险标签;
8、基于所述各结案案件信息对应的样本风险标签训练二分类模型,以得到用于生成所述风险标签的第一分类模型。
9、可选地,基于所述各结案案件信息对应的样本风险标签训练二分类模型,以得到用于生成所述风险标签的第一分类模型,包括:
10、对所述结案案件信息集进行数据预处理,以得到样本信息集;其中,所述数据预处理包括数据清洗、数据去重、异常数据处理、特征选择、类别特征编码、特征衍生中的至少一种;
11、基于所述样本信息集中各样本信息对应的样本风险标签,训练二分类模型,以得到用于生成所述风险标签的第一分类模型。
12、可选地,所述方法还包括:
13、获取风险案件信息集;其中,所述风险案件信息集中各风险案件信息分别对应于一样本风险类型;
14、基于所述各风险案件信息对应的样本风险类型训练多分类模型,以得到用于生成所述风险类型的第二分类模型。
15、可选地,基于所述各风险案件信息对应的样本风险类型训练多分类模型,以得到用于生成所述风险类型的第二分类模型,包括:
16、对所述风险案件信息集进行数据预处理,以得到风险样本集;其中,所述数据预处理包括数据清洗、数据去重、异常数据处理、特征选择、类别特征编码、特征衍生中的至少一种;
17、基于所述风险样本集中各风险样本对应的样本风险类型训练多分类模型,以得到用于生成所述风险类型的第二分类模型。
18、可选地,所述风险标签表示为风险数值,所述方法还包括:
19、若所述风险数值大于预设阈值,则判定所述风险标签用于表征所述待处理案件存在风险。
20、可选地,所述方法还包括:
21、确定风险案件数量和结案案件数量;
22、计算所述风险案件数量和所述结案案件数量的比值;
23、将所述比值确定为所述预设阈值;其中,所述预设阈值用于表征历史结案案件中的整体风险率。
24、可选地,其中:所述风险类型为酒驾类型、掉包类型、摆放现场类型或者非法营运类型。
25、可选地,所述方法还包括:
26、输出所述风险类型以及针对所述待处理案件信息的核查提醒消息。
27、第二方面,本技术实施例提供了一种风险类型生成装置,所述装置包括:
28、信息获取模块,用于获取待处理案件信息;
29、风险标签生成模块,用于通过第一分类模型生成针对所述待处理案件信息的风险标签;
30、风险类型生成模块,用于在所述风险标签用于表征待处理案件存在风险的情况下,基于第二分类模型生成针对所述待处理案件的风险类型。
31、可选地,所述装置还包括:
32、结案案件信息获取模块,用于获取结案案件信息集;其中,所述结案案件信息集中各结案案件信息分别对应于一样本风险标签;
33、二分类模型训练模块,用于基于所述各结案案件信息对应的样本风险标签训练二分类模型,以得到用于生成所述风险标签的第一分类模型。
34、可选地,二分类模型训练模块基于所述各结案案件信息对应的样本风险标签训练二分类模型,以得到用于生成所述风险标签的第一分类模型,包括:
35、第一数据预处理子模块,用于对所述结案案件信息集进行数据预处理,以得到样本信息集;其中,所述数据预处理包括数据清洗、数据去重、异常数据处理、特征选择、类别特征编码、特征衍生中的至少一种;
36、二分类模型训练子模块,用于基于所述样本信息集中各样本信息对应的样本风险标签,训练二分类模型,以得到用于生成所述风险标签的第一分类模型。
37、可选地,所述装置还包括:
38、风险案件信息获取模块,获取风险案件信息集;其中,所述风险案件信息集中各风险案件信息分别对应于一样本风险类型;
39、多分类模型训练模块,用于基于所述各风险案件信息对应的样本风险类型训练多分类模型,以得到用于生成所述风险类型的第二分类模型。
40、可选地,基于所述各风险案件信息对应的样本风险类型训练多分类模型,以得到用于生成所述风险类型的第二分类模型,包括:
41、第二数据预处理子模块,用于对所述风险案件信息集进行数据预处理,以得到风险样本集;其中,所述数据预处理包括数据清洗、数据去重、异常数据处理、特征选择、类别特征编码、特征衍生中的至少一种;
42、多分类模型训练子模块,用于基于所述风险样本集中各风险样本对应的样本风险类型训练多分类模型,以得到用于生成所述风险类型的第二分类模型。
43、可选地,所述风险标签表示为风险数值,所述装置还包括:
44、风险判定模块,用于在所述风险数值大于预设阈值时,则判定所述风险标签用于表征所述待处理案件存在风险。
45、可选地,所述装置还包括:
46、案件数量确定模块,用于确定风险案件数量和结案案件数量;
47、比值计算模块,用于计算所述风险案件数量和所述结案案件数量的比值;
48、预设阈值确定模块,用于将所述比值确定为所述预设阈值;其中,所述预设阈值用于表征历史结案案件中的整体风险率。
49、可选地,其中:所述风险类型为酒驾类型、掉包类型、摆放现场类型或者非法营运类型。
50、可选地,所述装置还包括:
51、输出模块,用于输出所述风险类型以及针对所述待处理案件信息的核查提醒消息。
52、第三方面,本技术实施例还提供了一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现所述的风险类型生成方法。
53、第四方面,本技术实施例还提供了一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行所述的风险类型生成方法。
54、在本技术实施例中,包括:获取待处理案件信息;通过第一分类模型生成针对待处理案件信息的风险标签;当风险标签用于表征待处理案件存在风险时,基于第二分类模型生成针对待处理案件的风险类型。在本技术实施例中,可以通过第一分类模型先生成风险标签,由于风险标签可以表征待处理案件是否存在风险,在待处理案件存在风险时,可以进一步地基于第二分类模型生成风险类型,无需人工核查案件的风险类型,可以提升对于案件风险类型的判别效率,降低人工成本。
55、上述说明仅是本技术技术方案的概述,为了能够更清楚了解本技术的技术手段,而可依照说明书的内容予以实施,并且为了让本技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本技术的具体实施方式。