通话语音处理方法、装置、服务器及可读存储介质与流程

文档序号：35816729发布日期：2023-10-22 07:37阅读：27来源：国知局

本发明涉及通信，特别是指一种通话语音处理方法、装置、服务器及可读存储介质。

背景技术：

1、在信息科技高速发展、人们手机不离身的今天，越来越多诈骗分子通过手机、电话、网络等通信工具实施无接触的电信诈骗，电话诈骗是电信网络诈骗的一种主要形式，在各个领域、各类人群中都存在着电话诈骗的风险，比如在虚拟码号服务下的招聘领域，尽管虚拟码号服务可以一定程度保证应聘者的通信隐私，但是并不能杜绝诈骗的发生，因为在通话中通话双方还可以口头交换微信、手机号码等联系方式，进而进一步联系增加诈骗发生的可能。

2、现有的电话诈骗判断，是在对通话语音进行识别和转化之后，对识别出的有确切文字结果的来电语音的词组与存储的诈骗关键词组进行比对，根据重复的比例来判断是否为诈骗电话。同时需要结合人工识别模块，一定程度依赖工作人员的人工判别结果。

3、然而，词粒度的匹配一方面易造成具有字段特征的普通用户号码被误判，另一方面难以识别出不具有字段特征的诈骗电话，且人工识别也会耗费大量的人力，缺乏智能性。

技术实现思路

1、本发明的目的是提供一种通话语音处理方法、装置、服务器及可读存储介质，在无需人工参与的识别中，准确地判断通话语音是否涉嫌诈骗。

2、为达到上述目的，本发明的实施例提供一种通话语音处理方法，应用于服务器，包括：

3、获取待检测的通话语音数据；

4、根据诈骗句式模板，获得所述通话语音数据的第一特征信息；

5、根据所述第一特征信息对所述通话语音数据进行检测，确定是否涉嫌诈骗。

6、可选地，所述根据诈骗句式模板，获得所述通话语音数据的第一特征信息之前，还包括：

7、根据历史通话语音数据，提取主叫号码的关键语音信息；

8、根据所述关键语音信息，确定通话语音的句子集合；

9、对所述句子集合进行聚类，确定诈骗句式模板。

10、可选地，所述根据诈骗句式模板，获得所述通话语音数据的第一特征信息包括：

11、将所述通话语音数据与所述诈骗句式模板进行匹配，得到第一特征值。

12、可选地，所述将所述通话语音数据与所述诈骗句式模板进行匹配，得到第一特征值之后，还包括：

13、基于诈骗判决条件，对所述通话语音数据进行分析，得到第二特征值；其中，所述诈骗判决条件包括以下至少一项：

14、主叫发言的次数大于第一阈值；

15、所述诈骗句式模板被成功匹配的次数大于第二阈值。

16、可选地，所述根据所述第一特征信息对所述通话语音数据进行检测，确定是否涉嫌诈骗包括：

17、将所述第一特征信息输入诈骗预测模型；

18、基于所述诈骗预测模型的输出结果，确定所述通话语音数据是否涉嫌诈骗。

19、可选地，所述将所述特征信息输入诈骗预测模型之前，还包括：

20、根据所述诈骗句式模板，获得历史通话语音数据的第二特征信息；

21、根据所述历史通话语音数据的诈骗判决结果，获得判决标签；

22、将所述第二特征信息作为训练输入，所述判决标签作为训练目标训练所述诈骗预测模型。

23、可选地，所述诈骗预测模型的输出结果是表征通话语音是否涉嫌诈骗的预测值；

24、所述基于所述诈骗预测模型的输出结果，确定所述通话语音数据是否涉嫌诈骗包括：

25、在所述预测值满足第三阈值的情况下，确定所述通话语音数据涉嫌诈骗；

26、在所述预测值未满足第三阈值的情况下，确定所述通话语音数据未涉嫌诈骗。

27、可选地，所述诈骗句式模板包括：诈骗表达模板以及诈骗解除模板。

28、为达到上述目的，本发明的实施例提供一种通话语音处理装置，应用于服务器，包括：

29、获取模块，用于获取待检测的通话语音数据；

30、第一处理模块，用于根据诈骗句式模板，获得所述通话语音数据的第一特征信息；

31、第二处理模块，用于根据所述第一特征信息对所述通话语音数据进行检测，确定是否涉嫌诈骗。

32、可选地，所述装置还包括：

33、第三处理模块，用于根据历史通话语音数据，提取主叫号码的关键语音信息；

34、第四处理模块，用于根据所述关键语音信息，确定通话语音的句子集合；

35、第五处理模块，用于对所述句子集合进行聚类，确定诈骗句式模板。

36、可选地，所述第一处理模块包括：

37、第一处理子模块，用于将所述通话语音数据与所述诈骗句式模板进行匹配，得到第一特征值。

38、可选地，所述第一处理模块还包括：

39、第二处理子模块，用于基于诈骗判决条件，对所述通话语音数据进行分析，得到第二特征值；其中，所述诈骗判决条件包括以下至少一项：

40、主叫发言的次数大于第一阈值；

41、所述诈骗句式模板被成功匹配的次数大于第二阈值。

42、可选地，所述第二处理模块包括：

43、第六处理模块，用于将所述第一特征信息输入诈骗预测模型；

44、第七处理模块，用于基于所述诈骗预测模型的输出结果，确定所述通话语音数据是否涉嫌诈骗。

45、为达到上述目的，本发明的实施例提供一种服务器，包括：收发器、处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令；根据所述收发器传递的指令，所述处理器执行所述程序或指令时实现上述应用于服务器的通话语音处理方法。

46、为达到上述目的，本发明的实施例提供一种可读存储介质，其上存储有程序或指令，所述程序或指令被处理器执行时实现如上所述应用于服务器的通话语音处理方法中的步骤。

47、本发明的上述技术方案的有益效果如下：

48、本发明实施例的方法，会在获取待检测的通话语音数据之后，根据诈骗句式模板来得到该通话语音数据的第一特征信息，从而根据该第一特征信息对该通话语音数据进行检测，确定其是否涉嫌诈骗。这里，采用了句子粒度的模板来获得检测使用的特征信息，相较于词粒度匹配更为严格、准确，降低了误判的可能性；另外，由于诈骗句式模板能够适用于多领域、减少了人工辅助，使得对通话语音的涉骗判断具有可复用性，且自动性和智能性更高。

技术特征：

1.一种通话语音处理方法，其特征在于，应用于服务器，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据诈骗句式模板，获得所述通话语音数据的第一特征信息之前，还包括：

3.根据权利要求1所述的方法，其特征在于，所述根据诈骗句式模板，获得所述通话语音数据的第一特征信息包括：

4.根据权利要求3所述的方法，其特征碍于，所述将所述通话语音数据与所述诈骗句式模板进行匹配，得到第一特征值之后，还包括：

5.根据权利要求1所述的方法，其特征在于，所述根据所述第一特征信息对所述通话语音数据进行检测，确定是否涉嫌诈骗包括：

6.根据权利要求5所述的方法，其特征在于，所述将所述特征信息输入诈骗预测模型之前，还包括：

7.根据权利要求6所述的方法，其特征在于，所述诈骗预测模型的输出结果是表征通话语音是否涉嫌诈骗的预测值；

8.根据权利要求1所述的方法，其特征在于，所述诈骗句式模板包括：诈骗表达模板以及诈骗解除模板。

9.一种通话语音处理装置，其特征在于，应用于服务器，包括：

10.根据权利要求9所述的装置，其特征在于，还包括：

11.根据权利要求9所述的装置，其特征在于，所述第一处理模块包括：

12.根据权利要求11所述的装置，其特征碍于，所述第一处理模块还包括：

13.根据权利要求9所述的装置，其特征在于，所述第二处理模块包括：

14.一种服务器，包括：收发器、处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令；其特征在于，根据所述收发器传递的指令，所述处理器执行所述程序或指令时实现如权利要求1-8任一项所述的通话语音处理方法。

15.一种可读存储介质，其上存储有程序或指令，其特征在于，所述程序或指令被处理器执行时实现如权利要求1-8任一项所述的通话语音处理方法中的步骤。

技术总结
本发明提供一种通话语音处理方法、装置、服务器及可读存储介质，涉及通信技术领域。该方法应用于服务器，包括：获取待检测的通话语音数据；根据诈骗句式模板，获得所述通话语音数据的特征信息；根据所述特征信息对所述通话语音数据进行检测，确定是否涉嫌诈骗。本发明实施例的方法，在无需人工参与的识别中，准确地判断通话语音是否涉嫌诈骗。

技术研发人员：王楠楠,侯雷静,李慧慧,刘敏
受保护的技术使用者：中国移动通信有限公司研究院
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王楠楠侯雷静李慧慧刘敏
技术所有人：中国移动通信集团有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。