本技术涉及电数字处理的,尤其是涉及一种基于声纹识别的通信线索分析提醒方法。
背景技术:
1、声纹识别技术通过提取身份特征信息和声纹特征,将声信号转换成电信号,再利用计算机通过相关算法进行比对识别。它主要依赖于每个人语音中的个性特征,如发音习惯、共鸣方式、嗓音纯度、平均音高等,这些特征在成年后能在相当长的时间里保持相对稳定不变。声纹识别系统通过比对两段语音的说话人在相同音素上的发声来判断是否为同一个人,从而实现“闻声识人”的功能。
2、目前,声纹识别技术的应用场景较多,比如公共安全领域、金融领域、社保领域、智能硬件领域等,以公共安全领域为例,可以建立声纹数据库,在特定场合下实时监测声纹信息,进行预警;可以利用声纹识别技术进行海量筛查,缩小侦查范围,提高办案效率;也可以通过声纹鉴定技术识别电信诈骗案件中的涉案语音,确定犯罪嫌疑人身份;或者对来电人员及其提供的通信线索内容进行核查,减少恶意重复报案的成功概率。
3、然而,针对通信线索相关人员的身份进行设别时,由于有些人员的声音特征并没有事先录入,因此需要在有限的通话时间内尽可能的获取足够的样本,目前在面对未知人员的通信线索提供的过程中,需要尽快提升相关人声识别模型的识别精准度和训练效率。
技术实现思路
1、为了在样本有限的情况下,快速提升人声识别模型的识别精准度和训练效率,本技术提供一种基于声纹识别的通信线索分析提醒方法,采用如下的技术方案:
2、一种基于声纹识别的通信线索分析提醒方法,包括:
3、步骤s1、在通信过程中获取来电人员的来电信息;所述来电信息包括音频录音信息、来电时间信息和来电位置信息;
4、步骤s2、对所述音频录音信息降噪后进行特征提取,得到对应的瀑布声谱图;
5、步骤s3、对所述瀑布声谱图进行图像增强后发送人声识别模型;
6、步骤s4、获取所述人声识别模型所输出的所述来电人员的身份信息;
7、步骤s5、根据所述音频录音信息获取所述来电人员提供线索的线索描述文本数据;
8、步骤s6、判断所述线索描述文本数据是否为重复线索;
9、若为重复线索,则标记所述来电人员并发送相关提醒通知,否则根据当前的所述线索描述文本数据和历史来电信息进行通信线索分析。
10、通过采用上述技术方案,对获取瀑布声谱图进行图像增强,有利于提升采用基于神经网络模型训练的人声识别模型的识别精准度,从而有利于提升后续对是否为同一人进行的重复线索提供的判断的可靠性,从而能够减少来自改来电人员的恶意来电接听率,减少对有限公共资源的过度占用和浪费。
11、可选地,所述对所述瀑布声谱图进行图像增强的过程包括:
12、步骤s31、提取并储存所述瀑布声谱图中的y分量;
13、步骤s32、根据所述y分量的亮度情况对所述瀑布声谱图进行图像分割,获取对应的y分量分块图像;
14、步骤s33、对所述y分量分块图像进行区域对比度并行增强;
15、步骤s34、对所述y分量分块图像进行整体均衡化;
16、步骤s35、对所述y分量分块图像的uv分量图像进行自适应补偿。
17、通过采用上述技术方案,通过基于亮度的区域对比度并行增强、y分量图像整体均衡化以等步骤,首先对矩形子图像的对比度进行自适应增强,从而提高图像细节,之后通过y分量图像整体均衡化,可以消除因对比度增强之后各分子块图像之间的接缝,进一步提高调整完成后的图像质量,最后对其uv分量进行自适应补偿处理,可以使得图像中的边缘和纹理等细节更加清晰,从而实现对大分辨率的瀑布声谱图的图像质量增强
18、可选地,所述步骤s31、提取并储存所述瀑布声谱图中的y分量的过程包括:
19、将所述瀑布声谱图转换为yuv格式;
20、提取并储存yuv格式的所述瀑布声谱图中的y分量。
21、可选地,所述s32、根据所述y分量的亮度情况对所述瀑布声谱图进行图像分割,获取对应的y分量分块图像的过程包括:
22、预设至少三个亮度梯度的亮度阈值区间;
23、根据所述亮度阈值区间将与所述瀑布声谱图进行区域划分;
24、根据所述区域划分的结果和最小矩形对所述瀑布声谱图进行图像分割,得到所述y分量分块图像;所述最小矩形所在区域为所述y分量分块图像的矩形子图像。
25、通过采用上述技术方案,在根据亮度进行亮度阈值区间的配置时,可以采用在最小亮度和最大亮度区间内进行三等分的设计来划定三个亮度阈值区间;如果通话时间较少,也就是能够获取的原始数据样本很少时,可以进行四等分或者五等分,以此能够在大幅度的扩大训练样本的数量,够提供不同类型的扰动,从而能够充分提升人声识别模型的识别准度、鲁棒性和训练效率,大幅度的降低训练成本。
26、可选地,所述步骤s33、对所述y分量分块图像进行区域对比度并行增强的过程包括:
27、利用线程库对所述矩形子图像进行多线程并行处理,同时对三个亮度梯度的亮度阈值区间的矩形子图像进行增强;
28、对每个所述矩形子图像进行平滑处理,获取对应的低频部分;
29、基于原始图像减去所述低频部分得到高频部分;
30、根据预设增强组合算法对所述低频部分和所述高频部分进行重新组合。
31、通过采用上述技术方案,通过使用线程库对这些子图像多线程并行处理,同时对过亮目标、正常亮度目标和较暗目标子图像分别采用不同的增强手段,即基于亮度的区域对比度并行增强方法,通过对过亮目标子图像强光抑制,减小目标像素值,增强对比度,正常亮度目标子图像自适应对比度增强,较暗目标子图像低照度增强,增加目标像素值,增强对比度,再根据实际环境光线具体亮暗程度进行自适应偏移补偿,重新调整图像的像素值大小,提升目标细节,之后通过将低频部分和高频部分的图像进行重新组合,得到算法的输出结果图,即可对处理后的子图像自适应对比度增强,均值化操作,可以使得图像细节增强。
32、可选地,所述步骤s34、对所述y分量分块图像进行整体均衡化的过程包括:
33、使用均衡化的方法对y分量图像进行操作,使y分量图像整体均衡化,消除或淡化每个图像块之间的明显缝隙的影响。
34、通过采用上述技术方案,通过结合灰度图像使用均衡化的方法对y分量图像进行操作,这时y分量图像整体均衡化,可以消除或淡化接缝处的影响,从而提高调整完成后的图像质量,进一步提高了大分辨率图像的清晰度以及质量。
35、可选地,将所述线索描述文本数据与所述来电人员提供的历史线索描述文本数据进行相似度计算的过程包括:
36、针对一个线索描述文本数据,提取预设属性对应的特征描述词;所述预设属性有至少n个;
37、将所述特征描述词与所述历史线索描述文本数据的同类属性的特征描述词进行相似度评估:
38、
39、其中,为所述历史线索描述文本数据中编号为b的数据与当前所述线索描述文本数据a的相似度估值,表示相应同属性文本数据对应文字向量之间的余弦值,表示相应同属性文本数据对应文字向量之间的欧几里得距离;
40、将相似度评估结果中的最大值作为相似度比对值,若,判断不为重复线索,否则为重复线索。
41、综上所述,本技术包括以下至少一种有益技术效果:
42、1、对获取瀑布声谱图进行图像增强,有利于提升采用基于神经网络模型训练的人声识别模型的识别精准度,从而有利于提升后续对是否为同一人进行的重复线索提供的判断的可靠性,从而能够减少来自改来电人员的恶意来电接听率,减少对有限公共资源的过度占用和浪费。
43、2、在根据亮度进行亮度阈值区间的配置时,可以采用在最小亮度和最大亮度区间内进行三等分的设计来划定三个亮度阈值区间;此处的核心在于,如果通话时间较少,也就是能够获取的原始数据样本很少时,可以进行四等分或者五等分,以此能够在大幅度的扩大训练样本的数量,够提供不同类型的扰动,从而能够充分提升人声识别模型的识别准度、鲁棒性和训练效率,大幅度的降低训练成本。