一种声纹识别相似度评分的方法和装置的制造方法

文档序号:9912686阅读:1126来源:国知局
一种声纹识别相似度评分的方法和装置的制造方法
【技术领域】
[0001]本发明涉及声纹识别技术领域,尤其涉及一种声纹识别相似度评分的方法和装置。
【背景技术】
[0002]由于歌曲演唱(singing)相对于自然人说话的语音(voice)更为多变和复杂,歌曲演唱虽然也是由人的声道产生声音,但是无论现实演唱还是语料库的歌曲干声语料,都含有音乐伴奏带来的干扰,且目前并没有相关技术可以将音乐和人声完美分离,因此现有声纹识别技术应用于歌曲演唱进行歌唱者识别或者计算相似度时,评分结果不稳定,如,同一个人多次演唱相同或不同歌曲,相关声纹识别得分会出现很大的不同。通常需要得到相对一致的得分时,一方面要求演唱者能够以稳定的音色或演唱技巧进行演唱,并且不含过多背景音乐,如KTV场合,另一方面要求语料库的歌曲干声尽量纯净,即不含过多音乐伴奏。而上述两方面是比较难办到的,导致现有声纹识别评分结果不稳定。

【发明内容】

[0003]为此,需要提供一种声纹识别相似度评分的方法和装置,解决现有声纹识别结果不稳定的问题。
[0004]为实现上述目的,发明人提供了一种声纹识别相似度评分的方法,包括如下步骤:
[0005]在语料库中的各个对象的语料子集内挑选若干音频数据与语料库中所有的声音模型进行匹配,得到各自的第一声纹识别得分集合;
[0006]获取声纹数据,并将声纹数据与语料库中所有的声音模型进行匹配,得到第二声纹识别得分集合;
[0007]根据第二声纹识别得分集合的高低顺序分配对应的第一得分系数集合;
[0008]根据第一声纹识别得分集合和第二声纹识别得分集合计算对应的第二得分系数集合;
[0009]根据第一得分系数集合、第二得分系数集合和二者对应的得分权重算出最终得分集合;
[0010]将最终得分集合中最高得分作为声纹相似度的得分。
[0011 ]进一步地,步骤“根据第一声纹识别得分集合和第二声纹识别得分集合计算对应的第二得分系数集合”包括步骤:
[0012]根据第一声纹识别得分集合和第二声纹识别得分集合,计算语料库中每个对象的声纹识别得分集合与第二声纹识别得分集合的相关性系数,并根据相关性系数的高低顺序分配对应的第二得分系数集合。
[0013]进一步地,所述声纹数据为用户声纹数据,步骤“将声纹数据与语料库中所有的声音模型进行匹配,得到第二声纹识别得分集合”后包括如下步骤:
[0014]将用户声纹数据及对应的第二声纹识别得分集合制作为用户的虚拟名片信息并保存。
[0015]进一步地,获取虚拟名片信息,根据虚拟名片信息得到用户声纹数据及对应的声纹识别得分集合,将对应的声纹识别得分集合作为第二声纹识别得分集合。
[0016]进一步地,步骤“将用户声纹数据及对应的第二声纹识别得分集合制作为用户的虚拟名片信息并保存”包括步骤:
[0017]将用户声纹数据及对应的第二声纹识别得分集合经过压缩或者加密后转化为用户虚拟名片字符串信息或者虚拟名片二维码信息。
[0018]进一步地,还包括如下步骤:
[0019]将最终得分集合中最高得分对应的声音模型作为声纹数据最匹配的声音模型,根据最匹配的声音模型推荐歌曲或者歌曲演唱者。
[0020]进一步地,还包括步骤:将语料库中各个对象的语料子集内的音频数据训练得到对应的声音模型。
[0021]以及本发明还提供一种声纹识别相似度评分装置,包括如下模块:
[0022]第一声纹评分模块:用于在语料库中的各个对象的语料子集内挑选若干音频数据与语料库中所有的声音模型进行匹配,得到各自的第一声纹识别得分集合;
[0023]第二声纹评分模块:用于获取声纹数据,并将声纹数据与语料库中所有的声音模型进行匹配,得到第二声纹识别得分集合;
[0024]第一得分系数模块:用于根据第二声纹识别得分集合的高低顺序分配对应的第一得分系数集合;
[0025]第二得分系数模块:用于根据第一声纹识别得分集合和第二声纹识别得分集合,计算语料库中每个对象的声纹识别得分集合与第二声纹识别得分集合的相关性系数,并根据相关性系数的高低顺序分配对应的第二得分系数集合;
[0026]最终得分计算模块:用于根据第一得分系数集合、第二得分系数集合和二者对应的得分权重算出最终得分集合;
[0027]相似度得分模块:用于将最终得分集合中最高得分作为声纹相似度的得分。
[0028]进一步地,所述声纹数据为用户声纹数据,第一得分系数模块还用于将用户声纹数据及对应的第二声纹识别得分集合制作为用户的虚拟名片信息并保存。
[0029]进一步地,第一得分系数模块还用于:将用户声纹数据及对应的第二声纹识别得分集合经过压缩或者加密后转化为用户虚拟名片字符串信息或者虚拟名片二维码信息;
[0030]第一得分系数模块还用于获取虚拟名片字符串信息或者虚拟名片二维码信息,根据上述信息得到用户声纹数据及对应的声纹识别得分集合,将对应声纹识别得分集合作为第二声纹识别得分集合。
[0031]进一步地,还包括推荐模块:
[0032]将最终得分集合中最高得分对应的声音模型作为声纹数据最匹配的声音模型,根据最匹配的声音模型推荐歌曲或者歌曲演唱者。
[0033]进一步地,还包括声音模型训练模块:将语料库中各个对象的语料子集内的音频数据训练得到对应的声音模型。
[0034]区别于现有技术,上述技术方案具有如下优点:1、第一得分系数优点:一般的声纹识别方法或应用,最终得分即第二声纹识别得分集合,本专利在此基础上将此得分进行排名并按排名分段配置得分系数,最终与第一得分权重(〈 = 100分)相乘作为最终得分的一部分。2、第二得分系数优点:是发明人在实验中发现语料库中每个对象的任意语料与语料库内所有声纹模型进行匹配后得到的得分排名始终保持基本一致(绘制成曲线后,这些曲线走势相近,即相关性高),这一稳定特性最终被本发明人作为“新声纹特征”用于声纹识别,优化最终得分,使得最终得分区分度高,稳定性好。因此将对应用户的第一声纹识别得分与每个语料库对象的声纹识别得分集合进行匹配,相关性高即可以说明用户的声纹特性很大可能性与对应的预料库对象相似。最后,通过第一声纹识别得分和第二声纹识别得分并算上权重,对声纹识别进行综合性评定,使得评定的得分结果稳定,区分度高,可以让声纹识别的结果相对稳定,不易出现声纹识别结果相差大的问题。
【附图说明】
[0035]图1为本发明方法实施例的流程图;
[0036]图2为本发明装置实施例的结构示意图。
[0037]附图标记说明:
[0038]200、声纹识别装置,210、声纹数据,
[0039]201、声音模型训练模块,202、第一声纹评分模块,
[0040]203、第二声纹评分模块,204、第一得分系数模块,
[0041]205、第二得分系数模块,206、最终得分计算模块,
[0042]207、相似度得分模块,208、推荐模块,
[0043]209、存储模块。
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1