本发明涉及电信通话技术领域,具体涉及一种基于语音关键词检测和声纹的反电信诈骗方法。
背景技术:
近年来,我国电信诈骗案时有发生,在社会上造成了非常恶劣的影响。电信诈骗问题亟待解决。
专利《针对虚拟号段的电信诈骗判断方法》申请号:cn201610840634.7该方案包括获取警方电信诈骗案情数据和运营商通信数据;进行数据匹配,得到初始训练集;采用随机过采样方法得到正负类均衡样本;训练正负类均衡样本得到预测模型;将用户的虚拟号段呼入号码通信特征带入预测模型并得到判断结果。
现有的方案大多需要运营商数据系统与公安数据系统配合起来使用,这样使得系统的布局更为复杂,成本较高。
技术实现要素:
有鉴于此,为了解决现有技术中的上述问题,本发明提出一种基于语音关键词检测和声纹的反电信诈骗方法,以此减少电信诈骗案的发生,无需公安数据系统配合,便可有效的实现电信诈骗的监控,布局方便,使用成本较低。
本发明通过以下技术手段解决上述问题:
一种基于语音关键词检测和声纹的反电信诈骗方法,包括如下步骤:
s1、系统初始化:首先构建一个存取声纹信息的大型数据库,在用户通话过程中提取电话拨打方用户的声纹信息,并在数据库中查找是否已有对应的声纹存在,若不存在,则存储对应的声纹信息;若存在,则丢弃该声纹信息;库中每一个声纹id启动一个计数量,用于统计该声纹涉及敏感关键词的次数,初始化为0;
s2、判断诈骗嫌疑:设置很多与诈骗相关敏感关键词,用于检测电话拨打方用户在通话过程中是否存在诈骗嫌疑;当检测到相关的敏感关键词,则提取该用户的声纹id,并查找数据库,若库中匹配到对应的id,则将该id相应的计数量加1;若库中还没注册该用户声纹,则将该用户声纹存储起来,并将计数量加1;
s3、用户提醒:当声纹对应的计数量超出某个阈值,在该用户下次再次拨打电话,并检测到有敏感关键词时,给电话接收方发送提醒短信。
进一步地,步骤s2中,语音关键词检测采用一种全音素框架的语音关键词检测方法,通过训练通用声学模型来实现语音关键词快速定制与跟换,并结合限制解码路径以及后期处理,具体包括如下步骤:
首先训练深度神经网络声学模型,根据唤醒词修改词典,构造基于filler的解码网络,并根据训练样本训练支持向量机分类器;对输入语音进行预处理,将处理后的语音特征输入解码网络进行解码,根据深度神经网络声学模型计算声学得分,得到解码结果;将识别成功的解码结果的统计量输入支持向量机分类器进行分类,得到最终的识别结果。
进一步地,统计量包含每个音素所占用的时长、音素的后验概率以及置信度。
进一步地,步骤s2中,声纹提取与识别选择用梅尔频率倒谱系数mfcc+高斯混合模型gmm的方法实现,具体的步骤如下:
s21、对输入的语音数据序列pcm码流进行语音检测,去除非语音信号和静默语音信号;
s22、对语音信号分帧、加窗,提取每一帧语音信号的mfcc参数并保存;
s23、用第s22步提取的mfcc参数训练话者的gmm,得到专属某话者的gmm声纹模型;
s24、声纹识别:提供输入话音与gmm声纹模型的匹配运算函数,以判断输入话音是否与声纹匹配。
与现有技术相比,本发明的有益效果至少包括:
本发明能实现有效的阻止电信诈骗的发生,布局简单,使用方便,反应较灵敏。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的运行流程图;
图2为本发明系统初始化的流程图;
图3为本发明语音关键词检测的流程图;
图4为本发明声纹提取的流程图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合附图和具体的实施例对本发明的技术方案进行详细说明。需要指出的是,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
如图1所示,本发明公开了一种基于关键词检测和声纹识别的反电信诈骗方法,主要包括三大步骤:
第一,系统初始化。如图2所示,首先构建一个存取声纹信息的大型数据库,在用户通话过程中提取电话拨打方用户的声纹信息,并在数据库中查找是否已有对应的声纹存在,若不存在,则存储对应的声纹信息。若存在,则丢弃该声纹信息。库中每一个声纹id启动一个计数量,用于统计该声纹涉及敏感关键词的次数,初始化为0。
第二,判断诈骗嫌疑。设置很多与诈骗相关敏感关键词,用于检测电话拨打方用户在通话过程中是否存在诈骗嫌疑。当检测到相关的敏感关键词,系统则提取该用户的声纹id,并查找数据库,若库中匹配到对应的id,则将该id相应的计数量加1。若库中还没注册该用户声纹,则将该用户声纹存储起来,并将计数量加1。
第三,用户提醒。当声纹对应的计数量超出某个阈值,在该用户下次再次拨打电话,并检测到有敏感关键词时,给电话接收方发送提醒短信。
本发明中用到的关键技术:语音关键词检测与声纹识别的实施方法如下:
一、语音关键词检测,如图3所示,采用一种全音素框架的语音关键词检测方法,通过训练通用声学模型来实现语音关键词快速定制与跟换,并结合限制解码路径以及后期处理,降低系统计算开销与成本。
首先训练深度神经网络声学模型,根据唤醒词修改词典,构造基于filler的解码网络,并根据训练样本训练支持向量机分类器;对输入语音进行预处理,将处理后的语音特征输入解码网络进行解码,根据深度神经网络声学模型计算声学得分,得到解码结果;将识别成功的解码结果的统计量(包含每个音素所占用的时长、音素的后验概率以及置信度等)输入支持向量机分类器进行分类,得到最终的识别结果。
二、声纹提取与识别如图4所示,声纹提取与识别模块选择用mfcc+gmm(梅尔频率倒谱系数+高斯混合模型)的方法实现,具体的步骤如下:
1、对输入的语音数据序列(pcm码流)进行语音检测,去除非语音信号和静默语音信号。
2、对语音信号分帧、加窗,提取每一帧语音信号的mfcc参数并保存。
3、用第2步提取的mfcc参数训练话者的gmm(高斯混合模型),得到专属某话者的gmm声纹模型。
4、声纹识别。提供输入话音与gmm声纹模型的匹配运算函数,以判断输入话音是否与声纹匹配。
本发明能实现有效的阻止电信诈骗的发生,布局简单,使用方便,反应较灵敏。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。