一种处理语音数据的方法、装置、设备及可读存储介质与流程

文档序号：15969941发布日期：2018-11-16 23:24阅读：236来源：国知局

本发明涉及音频处理技术领域，更具体地说，涉及一种处理语音数据的方法、装置、设备及可读存储介质。

背景技术

随着计算机技术和音频处理技术的不断发展融合，声纹鉴定技术已广泛应用于司法鉴定，为司法鉴定提供了良好的技术保障。

目前，对于待鉴定的语音文件的语音频谱图，现有的声纹鉴定系统可以从时间上选取特定区域的语音频谱图。但是由于每个语音信号的频率范围是特定不变的，且现有的系统无法选取特定的频率范围，从而导致需要选取语音数据的所有频率范围，而当语音数据的频率范围覆盖高频区域时，在对其进行降噪处理的过程中，削弱了原有的语音音频的质量，从而导致语音音频的播放不清晰，影响声纹鉴定结果；同时，由于选取的语音数据量较大，也降低了语音数据的处理效率。

因此，如何提高语音数据的处理效率，为声纹鉴定提高可靠的技术支持，是本领域技术人员需要解决的问题。

技术实现要素：

本发明的目的在于提供一种处理语音数据的方法、装置、设备及可读存储介质，以提高语音数据的处理效率，为声纹鉴定提高可靠的技术支持。

为实现上述目的，本发明实施例提供了如下技术方案：

一种处理语音数据的方法，包括：

获取目标语音文件的频谱图并展示；

接收用户在所述频谱图中选取的目标频率范围，并根据所述目标频率范围确定对应的目标语音数据；

提取所述目标语音数据，并对所述目标语音数据进行处理后，播放所述目标语音数据。

其中，所述获取目标语音文件的频谱图并展示之前，还包括：

获取所述目标语音文件，并生成所述目标语音文件的频谱图。

其中，所述提取所述目标语音数据，并对所述目标语音数据进行处理后，播放所述目标语音数据，包括：

提取所述目标语音数据，并对所述目标语音数据进行频域转换；

对频域转换后的目标语音数据进行时域转换，并播放所述目标语音数据。

其中，所述提取所述目标语音数据，并对所述目标语音数据进行频域转换，包括：

将所述频谱图中除所述目标频率范围的其他频率置零，以提取所述目标语音数据，并对所述目标语音数据进行频域转换。

一种处理语音数据的装置，包括：

获取模块，用于获取目标语音文件的频谱图并展示；

确定模块，用于接收用户在所述频谱图中选取的目标频率范围，并根据所述目标频率范围确定对应的目标语音数据；

执行模块，用于提取所述目标语音数据，并对所述目标语音数据进行处理后，播放所述目标语音数据。

其中，还包括：

生成模块，用于获取所述目标语音文件，并生成所述目标语音文件的频谱图。

其中，所述执行模块包括：

频域转换单元，用于提取所述目标语音数据，并对所述目标语音数据进行频域转换；

时域转换单元，用于对频域转换后的目标语音数据进行时域转换，并播放所述目标语音数据。

其中，所述频域转换单元具体用于：

将所述频谱图中除所述目标频率范围的其他频率置零，以提取所述目标语音数据，并对所述目标语音数据进行频域转换。

一种处理语音数据的设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上述任意一项所述的处理语音数据的方法的步骤。

一种可读存储介质，所述可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上述任意一项所述的处理语音数据的方法的步骤。

通过以上方案可知，本发明实施例提供的一种处理语音数据的方法，包括：获取目标语音文件的频谱图并展示；接收用户在所述频谱图中选取的目标频率范围，并根据所述目标频率范围确定对应的目标语音数据；提取所述目标语音数据，并对所述目标语音数据进行处理后，播放所述目标语音数据。

可见，所述方法可使用户根据目标语音文件的频谱图自主选择特定法人频率范围，且由于用户是根据频谱图选取的语音数据，所以选取的语音数据的质量更佳，也无需对其进行降噪处理，故不会影响原来的语音音频的质量，使得播放的语音音频更佳清晰；同时，由于选取的语音数据量较小，也提高语音数据的处理效率。

相应地，本发明实施例提供的一种处理语音数据的装置、设备及可读存储介质，也同样具有上述技术效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例公开的一种处理语音数据的方法流程图；

图2为本发明实施例公开的另一种处理语音数据的方法流程图；

图3为本发明实施例公开的一种处理语音数据的装置示意图；

图4为本发明实施例公开的一种处理语音数据的设备示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例公开了一种处理语音数据的方法、装置、设备及可读存储介质，以提高语音数据的处理效率，为声纹鉴定提高可靠的技术支持。

参见图1，本发明实施例提供的一种处理语音数据的方法，包括：

s101、获取目标语音文件的频谱图并展示；

目前，声纹鉴定专家在进行声纹鉴定时，一般通过语音频谱图来判别待鉴定的语音音节和已有的模板语音音节的不同。当待鉴定的语音频谱图和模板语音频谱图极为相似时，用户可自由选取待鉴语音和模板语音的同一语音音节的频谱图进行比较。故获取目标语音文件的频谱图并进行展示，可使用户根据频谱图自由选取想要试听的部分语音。

s102、接收用户在频谱图中选取的目标频率范围，并根据目标频率范围确定对应的目标语音数据；

具体的，在现有的声纹鉴定系统中，仅支持用户选取相似语音音节的频谱图，当用户选取的语音音节的频率范围比较广泛，且覆盖高频区域时，对高频区域进行降噪等处理后，会使得用户选取的语音音节播放不清晰，从而影响声纹鉴定结果。

在本实施例中，用户可自由选取想要试听的语音音节的频率范围。例如：当某一音节的频率覆盖范围为3khz-8khz时，用户可选取频率范围为3khz-5khz的语音进行试听。具体的，当用户选取目标频率范围后，声纹鉴定系统则可根据用户选取的频率范围确定想要试听的语音数据，并对其进行后续处理。

s103、提取目标语音数据，并对目标语音数据进行处理后，播放目标语音数据。

具体的，当用户选取的语音数据的频率范围未覆盖较高频率时，无需对语音数据进行降噪处理，从而不会影响原来语音音节的质量，进而可使语音播放的更为清晰。

可见，本实施例提供的一种处理语音数据的方法，所述方法可使用户根据目标语音文件的频谱图自主选择特定法人频率范围，且由于用户是根据频谱图选取的语音数据，所以选取的语音数据的质量更佳，也无需对其降噪处理，从而不会影响原来的语音音频的质量，使得播放的语音音频更佳清晰；同时，由于选取的语音数据量较小，也提高语音数据的处理效率。

本发明实施例公开了另一种处理语音数据的方法，相对于上一实施例，本实施例对技术方案作了进一步的说明和优化。

参见图2，本发明实施例提供的另一种处理语音数据的方法，包括：

s201、获取目标语音文件，并生成目标语音文件的频谱图；

具体的，当获取到一份语音文件时，首先需要根据获得的语音文件生成对应的频谱图。例如：当获取到嫌疑人的录音文件时，可将该录音文件导入声纹鉴定系统，声纹鉴定系统对其进行识别读取后，根据其生成对应的频谱图并展示，以使用户根据频谱图选择合适的频率范围进行试听。

s202、获取目标语音文件的频谱图并展示；

s203、接收用户在频谱图中选取的目标频率范围，并根据目标频率范围确定对应的目标语音数据；

s204、提取目标语音数据，并对目标语音数据进行处理后，播放目标语音数据。

可见，本实施例提供的另一种处理语音数据的方法，所述方法可使用户根据目标语音文件的频谱图自主选择特定法人频率范围，且由于用户是根据频谱图选取的语音数据，所以选取的语音数据的质量更佳，也无需对其降噪处理，从而不会影响原来的语音音频的质量，使得播放的语音音频更佳清晰；同时，由于选取的语音数据量较小，也提高语音数据的处理效率。

基于上述任意实施例，需要说明的是，所述提取所述目标语音数据，并对所述目标语音数据进行处理后，播放所述目标语音数据，包括：

提取所述目标语音数据，并对所述目标语音数据进行频域转换；

对频域转换后的目标语音数据进行时域转换，并播放所述目标语音数据。

具体的，对目标语音数据进行频域转换，能够表征目标语音数据的语音特性，可将目标语音数据的波形分解为不同频率正余弦波形后的幅度分布，能在频域上更好的分析目标语音数据。一般地语音文件均为时域信号，故对频域转换后的目标语音数据进行时域转换后，才可播放目标语音数据。

基于上述任意实施例，需要说明的是，所述提取所述目标语音数据，并对所述目标语音数据进行频域转换，包括：

将所述频谱图中除所述目标频率范围的其他频率置零，以提取所述目标语音数据，并对所述目标语音数据进行频域转换。

具体的，为了提取出用户选取的目标频率范围内的目标语音数据，可在频谱图中将除目标频率范围的其他频率均置零，使得目标频率范围内的语音数据得以保留，从而获得目标语音数据。

例如：若某一音节的频率覆盖范围为3khz-8khz时，用户选取的频率范围为3khz-5khz，那么可将5khz-8khz范围的频率置零，以保留3khz-5khz范围内的语音。

下面对本发明实施例提供的一种处理语音数据的装置进行介绍，下文描述的一种处理语音数据的装置与上文描述的一种处理语音数据的方法可以相互参照。

参见图3，本发明实施例提供的一种处理语音数据的装置，包括：

获取模块301，用于获取目标语音文件的频谱图并展示；

确定模块302，用于接收用户在所述频谱图中选取的目标频率范围，并根据所述目标频率范围确定对应的目标语音数据；

执行模块303，用于提取所述目标语音数据，并对所述目标语音数据进行处理后，播放所述目标语音数据。

可见，本实施例提供了一种处理语音数据的装置，该装置通过获取模块获取目标语音文件的频谱图并展示；通过确定模块接收用户在所述频谱图中选取的目标频率范围，并根据所述目标频率范围确定对应的目标语音数据；通过执行模块提取所述目标语音数据，并对所述目标语音数据进行处理后，播放所述目标语音数据。故可使用户根据目标语音文件的频谱图自主选择特定法人频率范围，且由于用户是根据频谱图选取的语音数据，所以选取的语音数据的质量更佳，也无需对其降噪处理，从而不会影响原来的语音音频的质量，使得播放的语音音频更佳清晰；同时，由于选取的语音数据量较小，也提高语音数据的处理效率。

其中，还包括：

生成模块，用于获取所述目标语音文件，并生成所述目标语音文件的频谱图。

其中，所述执行模块包括：

频域转换单元，用于提取所述目标语音数据，并对所述目标语音数据进行频域转换；

时域转换单元，用于对频域转换后的目标语音数据进行时域转换，并播放所述目标语音数据。

其中，所述频域转换单元具体用于：

将所述频谱图中除所述目标频率范围的其他频率置零，以提取所述目标语音数据，并对所述目标语音数据进行频域转换。

下面对本发明实施例提供的一种处理语音数据的设备进行介绍，下文描述的一种处理语音数据的设备与上文描述的一种处理语音数据的方法及装置可以相互参照。

参见图4，本发明实施例提供的一种处理语音数据的设备，包括：

存储器401，用于存储计算机程序；

处理器402，用于执行所述计算机程序时实现上述任意实施例所述的处理语音数据的方法的步骤。

下面对本发明实施例提供的一种可读存储介质进行介绍，下文描述的一种可读存储介质与上文描述的一种处理语音数据的方法、装置及设备可以相互参照。

一种可读存储介质，所述可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上述任意实施例所述的处理语音数据的方法的步骤。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：冯来见;张锦华
技术所有人：广州国音科技有限公司
我是此专利的发明人

上一篇：基于终端智能监控功能的充电运行服务系统的制作方法
上一篇：一种方便拆装的对中杯的制作方法