一种基于声纹识别的数据获取方法及系统的制作方法

文档序号：8431778阅读：306来源：国知局

一种基于声纹识别的数据获取方法及系统的制作方法
【技术领域】
[0001]本发明涉及声纹识别领域，并且更具体地，涉及一种基于声纹识别的数据获取方法及系统。
【背景技术】
[0002]随着与终端设备相关的信息技术的日益发展，用户对于通过终端设备进行数据获取的需求越来越大。通常，用户可以在终端设备处输入要访问的数据的地址，从而获取数据并对数据进行处理；或者用户可以在终端设备搜索相关数据从而获取数据并对数据进行处理。由于上述方式均需要用户在终端设备上进行手动输入，而当用户处于忙碌状态(例如，驾驶车辆)时，通常无法进行有效输入。此外，当用户听到某段语音，想获得与这段语音相关的数据时，通过上述方式无法获取数据内容。因此，需要将声纹识别技术应用到数据获取和处理的过程中。
[0003]目前，声纹识别技术广泛应用于诸如汽车导航、密码认证、智能设备等领域。声纹是指通过专用的电声转换仪器(声谱仪、语图仪等)将声波特征绘制成的波谱图形。声纹可以是各种声学特征图谱的集合。声纹是人类长期稳定的特征信号。声纹识别是把未知人的语音数据(检材)与已知人的语音数据(样本)分别通过电声转换仪器绘成声纹图谱，再根据图谱上的语音声学特征进行比较和综合分析，以得出两者是否相同的判断过程。
[0004]声纹识别广义上分为两种:语音识别和说话人识别。语音识别是根据说话人的发音辨认其所说的语音、音节、单词或单句。语音识别需要排除不同说话人的个人声音特色，确定代表各个语音单位的共性特征。说话人识别是根据语音来辨认说话人，而通常不考虑声音的内容和意义。说话人识别需要分离出每个个体的声音特性。语音识别是当前确认语音数据的文本内容的主要方式。说话人识别是当前生物信息认证方式中的一种主流方式，并且通常包括文本相关以及文本无关两种声纹识别方式，即，说话人识别包括说话人辨认和说话人确认两个方面。说话人辨认是一对多的分析过程，即判断出某段语音是若干人中哪一个所说。说话人确认是一对一的确定过程，即确认某段语音是否属于指定的某人。声纹识别通常也都包括训练、校验两个步骤。声纹识别的核心是预先录入声音样本，并提取每个样本独一无二的特征，建立特征数据库，并且在使用时将待检声音与数据库中的特征进行匹配，通过分析计算，实现说话人识别。然而，在实际应用中，文本无关型的声纹识别方式由于识别结果的不确定性，通常要和其他的生物特征认证方式共同使用，很难作为一种独立的检测方式，由此也限制了其使用的范围。
[0005]为此，需要一种能够利用稳定识别技术的数据获取方法及系统。

【发明内容】

[0006]为了解决上述问题，根据本发明的一个方面，提供一种基于声纹识别的数据获取系统，所述数据获取系统包括:
[0007]用户终端，接收待识别的语音数据并且对所述待识别的语音数据进行语音格式预处理，从经过语音格式预处理的音频数据提取语音特征，将所提取的语音特征组成语音特征集合；
[0008]对待识别的语音数据进行关键词识别，获得一个或多个关键词，根据所述一个或多个关键词对从识别服务器接收的识别对象集合中的每个识别对象的匹配度进行加权，根据加权后的匹配度确定目标对象，并且获取与所确定的目标对象相对应的数据；以及
[0009]识别服务器，根据用户终端发送的语音特征集合中的所有语音特征与语音模型进行匹配，确定所述待识别的语音数据对应的识别对象集合，其中在识别对象集合中按照匹配度递减的顺序对识别对象进行排序。
[0010]优选地，其中用户终端对所述待识别的语音数据进行语音格式预处理包括:利用预处理单元对所述待识别的语音数据进行分割以生成多个语音片段；对多个语音片段进行宽窄带判别，对判别为宽带信号的语音片段添加宽带标识，对判别为窄带信号的语音片段添加窄带标识；以及对添加了宽带标识或窄带标识的语音片段进行音频特征提取，得到特征数据。
[0011]优选地，其中所述特征数据包括语音片段的起始时间、语音特征和音频文件名称。
[0012]优选地，其中识别服务器根据用户终端发送的语音特征集合中的所有语音特征与语音模型进行匹配，确定所述待识别的语音数据对应的识别对象集合包括:
[0013]识别服务器从用户终端接收语音特征集合，并且将语音特征集合中的所有语音特征与预先存储的语音模型进行匹配，根据匹配度确定与所述待识别的语音数据对应的至少一个识别对象，将所述至少一个识别对象组成识别对象集合。
[0014]可替换地，将语音特征集合传送至用户终端的匹配单元，用户终端的匹配单元将语音特征集合中的所有语音特征与预先存储的语音模型进行匹配，根据匹配度确定与所述待识别的语音数据对应的至少一个识别对象，将所述至少一个识别对象组成识别对象集入口 ο
[0015]优选地，其中用户终端根据所述一个或多个关键词对识别对象集合中的每个识别对象的匹配度进行加权，根据加权后的匹配度确定目标对象包括:用户终端的目标对象确定单元根据所述一个或多个关键词在相关度数据库中进行搜索，确定待识别的语音数据与识别对象集合中每个识别对象的相关度，根据所述相关度对每个识别对象的匹配度进行加权，根据加权后的匹配度确定目标对象。
[0016]优选地，其中用户终端获取与所确定的目标对象相对应的数据包括:用户终端的数据获取单元根据关联规则确定与所述目标对象相对应的数据内容并且将针对数据内容的请求发送至内容服务器，从内容服务器获取所述数据内容。
[0017]根据另一方面，提供一种基于声纹识别的数据获取方法，所述数据获取方法包括:
[0018]接收待识别的语音数据；
[0019]对所述待识别的语音数据进行语音格式预处理；
[0020]从经过语音格式预处理的音频数据提取语音特征，将所提取的语音特征组成语音特征集合；
[0021]根据语音特征集合中的所有语音特征与语音模型进行匹配，确定所述待识别的语音数据对应的识别对象集合，其中在识别对象集合中按照匹配度递减的顺序对识别对象进tx排序;
[0022]对待识别的语音数据进行关键词识别，获得一个或多个关键词；
[0023]根据所述一个或多个关键词对识别对象集合中的每个识别对象的匹配度进行加权，根据加权后的匹配度确定目标对象；以及
[0024]获取与所确定的目标对象相对应的数据。
[0025]优选地，其中对所述待识别的语音数据进行语音格式预处理包括:
[0026]对所述待识别的语音数据进行分割以生成多个语音片段；
[0027]对多个语音片段进行宽窄带判别，对判别为宽带信号的语音片段添加宽带标识，对判别为窄带信号的语音片段添加窄带标识；
[0028]对添加了宽带标识或窄带标识的语音片段进行音频特征提取，得到特征数据。
[0029]优选地，所述特征数据包括语音片段的起始时间、语音特征和音频文件名称。
[0030]优选地，其中根据语音特征集合中的所有语音特征与语音模型进行匹配，确定所述待识别的语音数据对应的识别对象集合包括:
[0031]将语音特征集合发送至识别服务器，识别服务器将语音特征集合中的所有语音特征与预先存储的语音模型进行匹配，根据匹配度确定与所述待识别的语音数据对应的至少一个识别对象，将所述至少一个识别对象组成识别对象集合。
[0032]可替换地，将语音特征集合发送至终端设备的匹配单元，终端设备的匹配单元将语音特征集合中的所有语音特征与预先存储的语音模型进行匹配，根据匹配度确定与所述待识别的语音数据对应的至少一个识别对象，将所述至少一个识别对象组成识别对象集入口 ο
[0033]优选地，其中根据所述一个或多个关键词对识别对象集合中的每个识别对象的匹配度进行加权，根据加权后的匹配度确定目标对象包括:根据所述一个或多个关键词在相关度数据库中进行搜索，确定待识别的语音数据与从所述识别服务器获取的识别对象集合中每个识别对象的相关度，根据所述相关度对每个识别对象的匹配度进行加权，根据加权后的匹配度确定目标对象。
[0034]优选地，其中获取与所确定的目标对象相对应的数据包括:根据关联规则确定与所述目标对象相对应的数据内容并且将针对数据内容的请求发送至内容服务器，从内容服务器获取所述数据内容。
[0035]根据本发明的基于声纹识别的数据获取方法及系统通过关键字对声纹识别的初步结果进行

完整全部详细技术资料下载

当前第1页1 2 3 4 5

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘畅;
技术所有人：刘畅;
我是此专利的发明人

上一篇：通话声音识别方法及装置的制造方法
上一篇：语音到文本转换的方法及装置的制造方法