投诉单据的识别方法、装置、存储介质及电子设备与流程

文档序号:37270134发布日期:2024-03-12 20:58阅读:14来源:国知局
投诉单据的识别方法、装置、存储介质及电子设备与流程

本技术涉及人工智能领域、金融科技领域及相关,具体而言,涉及一种投诉单据的识别方法、装置、存储介质及电子设备。


背景技术:

1、随着金融科技领域技术的发展,金融机构为满足用户需求所开拓的业务种类越来越多,而金融机构所接收到的投诉单据的数量也随着用户数量的增长而增加,其中,由于金融机构收到的投诉中存在代理机构为解决用户的征信问题而进行恶意投诉的情况,从而增大了金融机构对投诉单据的真实性进行识别的难度。现有技术中,通常依据专家规则判断金融机构收到的投诉单据是否为代理投诉单据,在需要对多个投诉单据进行识别的情况下,依据单一的专家规则对每个投诉单据进行识别会导致识别时间长、识别效率低的问题。

2、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本技术提供了一种投诉单据的识别方法、装置、存储介质及电子设备,以至少解决对投诉单据的真实性进行识别的效率低的技术问题。

2、根据本技术的一个方面,提供了一种投诉单据的识别方法,包括:获取业务单据对应的目标单据,其中,目标单据用于记录第一用户针对业务单据的办理流程所发起的投诉信息,业务单据用于记录第二用户办理的金融业务的业务信息;判断第一用户与第二用户是否相同;在第一用户与第二用户不同的情况下,确定目标单据为代理投诉单据,其中,代理投诉单据的发起者为代理机构;在第一用户与第二用户相同的情况下,将目标单据对应的投诉文本转换为文本向量,并将文本向量输入至目标模型,其中,目标模型为对l个投诉单据进行训练得到的神经网络模型,l为大于1的整数;通过目标模型预先训练的先验知识确定文本向量对应的目标标签,并将目标标签作为目标单据对应的识别结果,其中,目标标签用于表征目标单据的发起者信息。

3、可选地,投诉单据的识别方法还包括:依据目标单据确定第一用户序号,其中,第一用户序号为第一用户的唯一标识;依据业务单据确定第二用户序号,其中,第二用户序号为第二用户的唯一标识;在第一用户序号与第二用户序号不同的情况下,确定第一用户与第二用户不同;在第一用户序号与第二用户序号相同的情况下,确定第一用户与第二用户相同。

4、可选地,投诉单据的识别方法还包括:确定l个投诉单据中的每个投诉单据的识别标签,其中,识别标签为第一标签或第二标签,第一标签用于表征投诉单据为代理投诉单据,第二标签用于表征投诉单据为非代理投诉单据;对l个投诉单据中的每个投诉单据对应的投诉文本进行预处理操作,得到每个投诉单据对应的第一投诉文本,其中,预处理操作用于统一每个投诉单据对应的投诉文本的文本格式;对每个投诉单据对应的第一投诉文本进行数据清洗操作,得到每个投诉单据对应的第二投诉文本,其中,数据清洗操作用于去除每个投诉单据对应的第一投诉文本中所包括的特殊字符和标点符号;依据每个投诉单据对应的第二投诉文本和识别标签生成目标模型。

5、可选地,投诉单据的识别方法还包括:对每个投诉单据对应的第二投诉文本进行分词操作,得到每个投诉单据对应的m个单词,其中,m为正整数;依据每个投诉单据对应的m个单词生成每个投诉单据对应的单据向量;依据每个投诉单据对应的单据向量生成训练集和测试集,其中,训练集包括p个单据向量,测试集包括q个单据向量,p和q均为正整数,并且l等于p与q之和;基于训练集中的p个单据向量和训练集包括的每个单据向量对应的识别标签对神经网络模型进行训练,得到初始模型;基于测试集中的q个单据向量和测试集包括的每个单据向量对应的识别标签对初始模型进行测试,并依据测试结果对初始模型进行更新;将最后一次更新后的初始模型作为目标模型。

6、可选地,投诉单据的识别方法还包括:获取第一预设规则,其中,第一预设规则用于依据投诉单据对应的第一用户的通讯号码和第二用户的通讯号码确定投诉单据对应的识别标签;依据第一预设规则确定l个投诉单据中的每个投诉单据的识别标签。

7、可选地,投诉单据的识别方法还包括:获取第二预设规则,其中,第二预设规则用于依据投诉单据对应的第一用户的声学特征和第二用户的声学特征确定投诉单据对应的识别标签;依据第二预设规则确定l个投诉单据中的每个投诉单据的识别标签。

8、可选地,投诉单据的识别方法还包括:获取投诉单据的第一用户号码和第二用户号码,其中,第一用户号码为第一用户在发起投诉单据时所使用的通讯号码,第二用户号码为第二用户在办理投诉单据涉及的金融业务时使用的通讯号码;在第一用户号码和第二用户号码相同的情况下,确定投诉单据对应的识别标签为第二标签;在第一用户号码和第二用户号码不相同的情况下,获取第一用户号码的归属地和第二用户号码的归属地;在第一用户号码的归属地和第二用户号码的归属地相同的情况下,确定投诉单据对应的识别标签为第二标签;在第一用户号码的归属地和第二用户号码的归属地不相同的情况下,确定投诉单据对应的识别标签为第一标签。

9、可选地,投诉单据的识别方法还包括:获取投诉单据对应的第一音频和第二音频,其中,第一音频用于记录第一用户针对金融业务进行投诉的通讯内容,第二音频用于记录第二用户办理金融业务的通讯内容;对第一音频进行特征提取,得到第一特征向量,其中,第一特征向量用于表征第一用户的声学特征;对第二音频进行特征提取,得到第二特征向量,其中,第二特征向量用于表征第二用户的声学特征;在第一特征向量和第二特征向量之间的相似度小于预设阈值的情况下,确定投诉单据的识别标签为第一标签;在第一特征向量和第二特征向量之间的相似度大于或等于预设阈值的情况下,确定投诉单据的识别标签为第二标签。

10、可选地,投诉单据的识别方法还包括:对目标单据对应的投诉文本进行预处理操作和数据清洗操作,得到目标单据对应的目标投诉文本;对目标投诉文本进行分词操作,得到目标单据对应的n个目标单词;依据n个目标单词生成目标单据对应的文本向量。

11、根据本技术的另一方面,还提供了一种投诉单据的识别装置,包括:获取单元,用于获取业务单据对应的目标单据,其中,目标单据用于记录第一用户针对业务单据的办理流程所发起的投诉信息,业务单据用于记录第二用户办理的金融业务的业务信息;判断单元,用于判断第一用户与第二用户是否相同;第一确定单元,用于在第一用户与第二用户不同的情况下,确定目标单据为代理投诉单据,其中,代理投诉单据的发起者为代理机构;转换单元,用于在第一用户与第二用户相同的情况下,将目标单据对应的投诉文本转换为文本向量,并将文本向量输入至目标模型,其中,目标模型为对l个投诉单据进行训练得到的神经网络模型,l为大于1的整数;第二确定单元,用于通过目标模型预先训练的先验知识确定文本向量对应的目标标签,并将目标标签作为目标单据对应的识别结果,其中,目标标签用于表征目标单据的发起者信息。

12、根据本技术的另一方面,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行上述任意一项的投诉单据的识别方法。

13、根据本技术的另一方面,还提供了一种电子设备,其中,电子设备包括一个或多个处理器和存储器,存储器用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述任意一项的投诉单据的识别方法。

14、在本技术中,首先获取业务单据对应的目标单据,其中,目标单据用于记录第一用户针对业务单据的办理流程所发起的投诉信息,业务单据用于记录第二用户办理的金融业务的业务信息,其次,判断第一用户与第二用户是否相同,然后,在第一用户与第二用户不同的情况下,确定目标单据为代理投诉单据,其中,代理投诉单据的发起者为代理机构,之后,在第一用户与第二用户相同的情况下,将目标单据对应的投诉文本转换为文本向量,并将文本向量输入至目标模型,其中,目标模型为对l个投诉单据进行训练得到的神经网络模型,l为大于1的整数,最后,通过目标模型预先训练的先验知识确定文本向量对应的目标标签,并将目标标签作为目标单据对应的识别结果,其中,目标标签用于表征目标单据的发起者信息。

15、由上述内容可知,本技术依据目标单据获取第一用户的用户信息,依据业务单据获取第二用户的用户信息,之后,依据第一用户的用户信息与第二用户的用户信息的比较结果执行不同的操作。在第一用户的用户信息和第二用户的用户信息不同的情况下,直接确定当前目标单据为代理投诉单据,提高了确定目标单据是否为代理投诉单据的效率;在第一用户的用户信息和第二用户的用户信息不同的情况下,通过目标模型对目标单据进行进一步分析,即利用目标模型预先训练的先验知识确定目标单据的发起者信息,实现了提高确定投诉单据是否为代理投诉单据的准确率和速率的目的,从而提高了后续对投诉单据中的投诉内容的真实性进行识别的效率,进而解决了现有技术中对投诉单据的真实性进行识别的效率低的技术问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1