本发明涉及通信,特别是指一种通话语音处理方法、装置、服务器及可读存储介质。
背景技术:
1、在信息科技高速发展、人们手机不离身的今天,越来越多诈骗分子通过手机、电话、网络等通信工具实施无接触的电信诈骗,电话诈骗是电信网络诈骗的一种主要形式,在各个领域、各类人群中都存在着电话诈骗的风险,比如在虚拟码号服务下的招聘领域,尽管虚拟码号服务可以一定程度保证应聘者的通信隐私,但是并不能杜绝诈骗的发生,因为在通话中通话双方还可以口头交换微信、手机号码等联系方式,进而进一步联系增加诈骗发生的可能。
2、现有的电话诈骗判断,是在对通话语音进行识别和转化之后,对识别出的有确切文字结果的来电语音的词组与存储的诈骗关键词组进行比对,根据重复的比例来判断是否为诈骗电话。同时需要结合人工识别模块,一定程度依赖工作人员的人工判别结果。
3、然而,词粒度的匹配一方面易造成具有字段特征的普通用户号码被误判,另一方面难以识别出不具有字段特征的诈骗电话,且人工识别也会耗费大量的人力,缺乏智能性。
技术实现思路
1、本发明的目的是提供一种通话语音处理方法、装置、服务器及可读存储介质,在无需人工参与的识别中,准确地判断通话语音是否涉嫌诈骗。
2、为达到上述目的,本发明的实施例提供一种通话语音处理方法,应用于服务器,包括:
3、获取待检测的通话语音数据;
4、根据诈骗句式模板,获得所述通话语音数据的第一特征信息;
5、根据所述第一特征信息对所述通话语音数据进行检测,确定是否涉嫌诈骗。
6、可选地,所述根据诈骗句式模板,获得所述通话语音数据的第一特征信息之前,还包括:
7、根据历史通话语音数据,提取主叫号码的关键语音信息;
8、根据所述关键语音信息,确定通话语音的句子集合;
9、对所述句子集合进行聚类,确定诈骗句式模板。
10、可选地,所述根据诈骗句式模板,获得所述通话语音数据的第一特征信息包括:
11、将所述通话语音数据与所述诈骗句式模板进行匹配,得到第一特征值。
12、可选地,所述将所述通话语音数据与所述诈骗句式模板进行匹配,得到第一特征值之后,还包括:
13、基于诈骗判决条件,对所述通话语音数据进行分析,得到第二特征值;其中,所述诈骗判决条件包括以下至少一项:
14、主叫发言的次数大于第一阈值;
15、所述诈骗句式模板被成功匹配的次数大于第二阈值。
16、可选地,所述根据所述第一特征信息对所述通话语音数据进行检测,确定是否涉嫌诈骗包括:
17、将所述第一特征信息输入诈骗预测模型;
18、基于所述诈骗预测模型的输出结果,确定所述通话语音数据是否涉嫌诈骗。
19、可选地,所述将所述特征信息输入诈骗预测模型之前,还包括:
20、根据所述诈骗句式模板,获得历史通话语音数据的第二特征信息;
21、根据所述历史通话语音数据的诈骗判决结果,获得判决标签;
22、将所述第二特征信息作为训练输入,所述判决标签作为训练目标训练所述诈骗预测模型。
23、可选地,所述诈骗预测模型的输出结果是表征通话语音是否涉嫌诈骗的预测值;
24、所述基于所述诈骗预测模型的输出结果,确定所述通话语音数据是否涉嫌诈骗包括:
25、在所述预测值满足第三阈值的情况下,确定所述通话语音数据涉嫌诈骗;
26、在所述预测值未满足第三阈值的情况下,确定所述通话语音数据未涉嫌诈骗。
27、可选地,所述诈骗句式模板包括:诈骗表达模板以及诈骗解除模板。
28、为达到上述目的,本发明的实施例提供一种通话语音处理装置,应用于服务器,包括:
29、获取模块,用于获取待检测的通话语音数据;
30、第一处理模块,用于根据诈骗句式模板,获得所述通话语音数据的第一特征信息;
31、第二处理模块,用于根据所述第一特征信息对所述通话语音数据进行检测,确定是否涉嫌诈骗。
32、可选地,所述装置还包括:
33、第三处理模块,用于根据历史通话语音数据,提取主叫号码的关键语音信息;
34、第四处理模块,用于根据所述关键语音信息,确定通话语音的句子集合;
35、第五处理模块,用于对所述句子集合进行聚类,确定诈骗句式模板。
36、可选地,所述第一处理模块包括:
37、第一处理子模块,用于将所述通话语音数据与所述诈骗句式模板进行匹配,得到第一特征值。
38、可选地,所述第一处理模块还包括:
39、第二处理子模块,用于基于诈骗判决条件,对所述通话语音数据进行分析,得到第二特征值;其中,所述诈骗判决条件包括以下至少一项:
40、主叫发言的次数大于第一阈值;
41、所述诈骗句式模板被成功匹配的次数大于第二阈值。
42、可选地,所述第二处理模块包括:
43、第六处理模块,用于将所述第一特征信息输入诈骗预测模型;
44、第七处理模块,用于基于所述诈骗预测模型的输出结果,确定所述通话语音数据是否涉嫌诈骗。
45、为达到上述目的,本发明的实施例提供一种服务器,包括:收发器、处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令;根据所述收发器传递的指令,所述处理器执行所述程序或指令时实现上述应用于服务器的通话语音处理方法。
46、为达到上述目的,本发明的实施例提供一种可读存储介质,其上存储有程序或指令,所述程序或指令被处理器执行时实现如上所述应用于服务器的通话语音处理方法中的步骤。
47、本发明的上述技术方案的有益效果如下:
48、本发明实施例的方法,会在获取待检测的通话语音数据之后,根据诈骗句式模板来得到该通话语音数据的第一特征信息,从而根据该第一特征信息对该通话语音数据进行检测,确定其是否涉嫌诈骗。这里,采用了句子粒度的模板来获得检测使用的特征信息,相较于词粒度匹配更为严格、准确,降低了误判的可能性;另外,由于诈骗句式模板能够适用于多领域、减少了人工辅助,使得对通话语音的涉骗判断具有可复用性,且自动性和智能性更高。
1.一种通话语音处理方法,其特征在于,应用于服务器,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据诈骗句式模板,获得所述通话语音数据的第一特征信息之前,还包括:
3.根据权利要求1所述的方法,其特征在于,所述根据诈骗句式模板,获得所述通话语音数据的第一特征信息包括:
4.根据权利要求3所述的方法,其特征碍于,所述将所述通话语音数据与所述诈骗句式模板进行匹配,得到第一特征值之后,还包括:
5.根据权利要求1所述的方法,其特征在于,所述根据所述第一特征信息对所述通话语音数据进行检测,确定是否涉嫌诈骗包括:
6.根据权利要求5所述的方法,其特征在于,所述将所述特征信息输入诈骗预测模型之前,还包括:
7.根据权利要求6所述的方法,其特征在于,所述诈骗预测模型的输出结果是表征通话语音是否涉嫌诈骗的预测值;
8.根据权利要求1所述的方法,其特征在于,所述诈骗句式模板包括:诈骗表达模板以及诈骗解除模板。
9.一种通话语音处理装置,其特征在于,应用于服务器,包括:
10.根据权利要求9所述的装置,其特征在于,还包括:
11.根据权利要求9所述的装置,其特征在于,所述第一处理模块包括:
12.根据权利要求11所述的装置,其特征碍于,所述第一处理模块还包括:
13.根据权利要求9所述的装置,其特征在于,所述第二处理模块包括:
14.一种服务器,包括:收发器、处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令;其特征在于,根据所述收发器传递的指令,所述处理器执行所述程序或指令时实现如权利要求1-8任一项所述的通话语音处理方法。
15.一种可读存储介质,其上存储有程序或指令,其特征在于,所述程序或指令被处理器执行时实现如权利要求1-8任一项所述的通话语音处理方法中的步骤。