本说明书涉及计算机,尤其涉及一种模型训练的方法、装置、存储介质及电子设备。
背景技术:
1、随着信息科技的发展,市场划分的越来越细致,出现很多为用户执行业务提供支持的服务提供方,例如,提供交易平台的服务提供方。同时,隐私数据得到了广泛的关注。
2、目前,用户在服务提供方提供的平台上执行业务的过程中,可能会遇到影响执行业务的问题,比如用户在交易平台进行交易时,用户多次进行支付操作,但是一直未成功。也可能会遇到影响用户执行业务的其他用户,比如用户与商户在交易平台进行交易时,商户未按照约定将交易物品给予用户。故用户可以针对遇到的问题或者其他用户向服务提供方进行举报。服务提供方需要对用户提出的举报案件进行审理,以确定举报案件的相关业务是否存在风险,并将举报案件的相关业务的风险情况作为审理结果,告知用户。因此,如何训练模型以对举报案件进行审理是一个亟待解决的问题。
3、基于此,本说明书提供一种模型训练的方法。
技术实现思路
1、本说明书提供一种模型训练的方法、装置、存储介质及电子设备,以部分的解决现有技术存在的上述问题。
2、本说明书采用下述技术方案:
3、本说明书提供一种模型训练的方法,包括:
4、确定历史上用户请求审理的案件信息作为训练样本,并确定所述训练样本对应的提示信息;
5、将所述训练样本以及所述提示信息输入待训练的审理模型的编码层,确定输入特征;
6、将所述输入特征输入所述待训练的审理模型的预测层,确定所述训练样本的第一审理结果以及所述第一审理结果对应的审理依据;
7、将历史上审理所述训练样本后得到的结果作为第一标注,以及将所述第一标注对应的审理依据作为第二标注;
8、至少根据所述第一审理结果、所述审理依据、所述第一标注以及所述第二标注,对所述待训练的审理模型进行训练,训练完成的审理模型用户根据待审理案件的信息,确定审理结果以及所述审理结果对应的审理依据。
9、可选地,所述训练样本包括文本信息以及结构化信息,所述编码层包括第一编码层以及第二编码层;
10、将所述训练样本以及所述提示信息输入待训练的审理模型的编码层,确定输入特征,具体包括:
11、将所述训练样本中的文本信息以及所述提示信息输入待训练的审理模型的第一编码层,确定文本特征;
12、将所述结构化信息输入所述待训练的审理模型的第二编码层,确定结构化特征;
13、将所述文本特征以及所述结构化特征作为输入特征。
14、可选地,所述待训练的审理模型还包括第一融合层;
15、将所述输入特征输入所述待训练的审理模型的预测层,确定所述训练样本的第一审理结果以及所述第一审理结果对应的审理依据,具体包括:
16、将所述文本特征以及所述结构化特征输入所述第一融合层,确定多模态特征;
17、将所述多模态特征以及所述文本特征输入所述待训练的审理模型的预测层,确定所述训练样本的第一审理结果以及所述第一审理结果对应的审理依据。
18、可选地,所述待训练的审理模型还包括第二融合层以及第三融合层,所述预测层包括依据预测层以及结果预测层;
19、将所述输入特征输入所述待训练的审理模型的预测层,确定所述训练样本的第一审理结果以及所述第一审理结果对应的审理依据,具体包括:
20、确定所述提示信息中各待预测区域的位置信息,其中,所述待预测区域包括依据区域以及结果区域;
21、将所述依据区域的位置信息、所述多模态特征以及所述文本特征输入所述第二融合层,确定依据特征;
22、将所述结果区域的位置信息、所述多模态特征、所述文本特征以及所述依据特征输入所述第三融合层,确定结果特征;
23、将所述依据特征输入所述依据预测层,确定所述训练样本对应的审理依据,以及将所述结果特征输入所述结果预测层,确定所述训练样本的第一审理结果。
24、可选地,所述待训练的审理模型还包括第二融合层以及第三融合层,所述预测层包括依据预测层以及结果预测层;
25、将所述输入特征输入所述待训练的审理模型的预测层,确定所述训练样本的第一审理结果以及所述第一审理结果对应的审理依据,具体包括:
26、确定所述提示信息中各待预测区域的位置信息,其中,所述待预测区域包括依据区域以及结果区域;
27、将所述依据区域的位置信息以及所述输入特征输入所述第二融合层,确定依据特征;
28、将所述结果区域的位置信息、所述输入特征以及所述依据特征输入所述第三融合层,确定结果特征;
29、将所述依据特征输入所述依据预测层,确定所述训练样本对应的审理依据,以及将所述结果特征输入所述结果预测层,确定所述训练样本的第一审理结果。
30、可选地,至少根据所述第一审理结果、所述审理依据、所述第一标注以及所述第二标注,对所述待训练的审理模型进行训练,具体包括:
31、基于所述审理依据,进行贝叶斯推理,确定所述训练样本对应的第二审理结果;
32、以所述第一审理结果与所述第二审理结果之间的差异最小、所述第一审理结果以及所述第一标注之间的差异最小和所述审理依据以及所述第二标注之间的差异最小为目标,对所述待训练的审理模型进行训练。
33、可选地,将所述输入特征输入所述待训练的审理模型的预测层,确定所述训练样本的第一审理结果以及所述第一审理结果对应的审理依据,具体包括:
34、将所述输入特征输入所述待训练的审理模型的预测层,确定所述训练样本的第一审理结果以及所述第一审理结果对应的各审理依据;
35、基于所述审理依据,进行贝叶斯推理,确定所述训练样本对应的第二审理结果,具体包括:
36、根据所述训练样本的第二标注,从所述各审理依据中,选取审理依据,并作为推理依据;
37、基于所述推理依据,进行贝叶斯推理,确定所述训练样本对应的第二审理结果。
38、可选地,所述方法还包括:
39、确定待审理案件对应的案件信息,并确定所述案件信息对应的提示信息;
40、将所述案件信息以及所述提示信息输入训练完成的审理模型的编码层,确定输入特征;
41、将所述输入特征输入所述审理模型的预测层,确定所述待审理案件对应的审理结果以及所述审理结果对应的审理依据;
42、将所述审理结果以及所述审理依据发送给用户。
43、本说明书提供了一种模型训练的装置,包括:
44、确定模块,用于确定历史上用户请求审理的案件信息作为训练样本,并确定所述训练样本对应的提示信息;
45、特征提取模块,用于将所述训练样本以及所述提示信息输入待训练的审理模型的编码层,确定输入特征;
46、结果模块,用于将所述输入特征输入所述待训练的审理模型的预测层,确定所述训练样本的第一审理结果以及所述第一审理结果对应的审理依据;
47、获取标注模块,用于将历史上审理所述训练样本后得到的结果作为第一标注,以及将所述第一标注对应的审理依据作为第二标注;
48、训练模块,用于至少根据所述第一审理结果、所述审理依据、所述第一标注以及所述第二标注,对所述待训练的审理模型进行训练,训练完成的审理模型用户根据待审理案件的信息,确定审理结果以及所述审理结果对应的审理依据。
49、可选地,所述训练样本包括文本信息以及结构化信息,所述编码层包括第一编码层以及第二编码层;
50、所述特征提取模块具体用于,将所述训练样本中的文本信息以及所述提示信息输入待训练的审理模型的第一编码层,确定文本特征;将所述结构化信息输入所述待训练的审理模型的第二编码层,确定结构化特征;将所述文本特征以及所述结构化特征作为输入特征。
51、可选地,所述待训练的审理模型还包括第一融合层;
52、所述结果模块具体用于,将所述文本特征以及所述结构化特征输入所述第一融合层,确定多模态特征;将所述多模态特征以及所述文本特征输入所述待训练的审理模型的预测层,确定所述训练样本的第一审理结果以及所述第一审理结果对应的审理依据。
53、可选地,所述待训练的审理模型包括第二融合层以及第三融合层,所述预测层包括依据预测层以及结果预测层;
54、所述结果模块具体用于,确定所述提示信息中各待预测区域的位置信息,其中,所述待预测区域包括依据区域以及结果区域;将所述依据区域的位置信息、所述多模态特征以及所述文本特征输入所述第二融合层,确定依据特征;将所述结果区域的位置信息、所述多模态特征、所述文本特征以及所述依据特征输入所述第三融合层,确定结果特征;将所述依据特征输入所述依据预测层,确定所述训练样本对应的审理依据,以及将所述结果特征输入所述结果预测层,确定所述训练样本的第一审理结果。
55、可选地,所述待训练的审理模型包括第二融合层以及第三融合层,所述预测层包括依据预测层以及结果预测层;
56、所述结果模块具体用于,确定所述提示信息中各待预测区域的位置信息,其中,所述待预测区域包括依据区域以及结果区域;将所述依据区域的位置信息以及所述输入特征输入所述第二融合层,确定依据特征;将所述结果区域的位置信息、所述输入特征以及所述依据特征输入所述第三融合层,确定结果特征;将所述依据特征输入所述依据预测层,确定所述训练样本对应的审理依据,以及将所述结果特征输入所述结果预测层,确定所述训练样本的第一审理结果。
57、可选地,所述训练模块具体用于,基于所述审理依据,进行贝叶斯推理,确定所述训练样本对应的第二审理结果;以所述第一审理结果与所述第二审理结果之间的差异最小、所述第一审理结果以及所述第一标注之间的差异最小和所述审理依据以及所述第二标注之间的差异最小为目标,对所述待训练的审理模型进行训练。
58、可选地,所述结果模块具体用于,将所述输入特征输入所述待训练的审理模型的预测层,确定所述训练样本的第一审理结果以及所述第一审理结果对应的各审理依据;
59、所述训练模块具体用于,根据所述训练样本的第二标注,从所述各审理依据中,选取审理依据,并作为推理依据;基于所述推理依据,进行贝叶斯推理,确定所述训练样本对应的第二审理结果。
60、可选地,所述装置还包括:
61、应用模块,用于确定待审理案件对应的案件信息,并确定所述案件信息对应的提示信息;将所述案件信息以及所述提示信息输入训练完成的审理模型的编码层,确定输入特征;将所述输入特征输入所述审理模型的预测层,确定所述待审理案件对应的审理结果以及所述审理结果对应的审理依据;将所述审理结果以及所述审理依据发送给用户。
62、本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述模型训练的方法。
63、本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述模型训练的方法。
64、本说明书采用的上述至少一个技术方案能够达到以下有益效果:
65、本说明书提供的模型训练的方法中,确定历史上用户请求审理的案件信息作为训练样本,并确定训练样本对应的提示信息。再将训练样本以及提示信息输入待训练的审理模型的编码层,确定输入特征。之后,将输入特征输入待训练的审理模型的预测层,确定训练样本的第一审理结果以及第一审理结果对应的审理依据。然后,将历史上审理训练样本后得到的结果作为第一标注,以及将第一标注对应的审理依据作为第二标注。再至少根据第一审理结果、审理依据、第一标注以及第二标注,对待训练的审理模型进行训练。
66、从上述方法中可以看出,本方法中确定历史上用户请求审理的案件信息作为训练样本,并确定训练样本对应的提示信息。再将训练样本以及提示信息输入待训练的审理模型的编码层,确定输入特征。之后,将输入特征输入待训练的审理模型的预测层,确定训练样本的第一审理结果以及第一审理结果对应的审理依据。然后,将历史上审理训练样本后得到的结果作为第一标注,以及将第一标注对应的审理依据作为第二标注。再至少根据第一审理结果、审理依据、第一标注以及第二标注,对待训练的审理模型进行训练,使得训练完成的审理模型用户根据待审理案件的信息,确定审理结果以及审理结果对应的审理依据,后续可以用预测出的审理依据来佐证预测出的审理结果,增加了审理模型的可解释性,并且基于提示信息以及训练样本训练审理模型,使得审理模型可以更好地学习到审理依据以及审理结果之间的关系,提高了审理模型的预测的准确性。