一种基于语音匹配的k歌计分方法和装置制造方法

文档序号：2826059阅读：256来源：国知局

一种基于语音匹配的k歌计分方法和装置制造方法
【专利摘要】本发明提供了一种基于语音匹配的k歌计分方法，在演唱过程中，提取原唱音频，同时持续不断的采集用户的声音、计算用户的音频特征，并且按照句为单位，与原唱的音频特征进行对比，依照不同的权值进行计分，本发明不再单纯的考虑例如具体的音调、音色、音量、节奏时长等因素，而是从声音的本质出发，考虑声音的本质特征，分析声音的频谱特性，从而可以将上述因素综合考虑进来，然后进行相应的计算，从而得到更为全面、准确的计分结果。
【专利说明】一种基于语音匹配的k歌计分方法和装置

【技术领域】
[0001]本申请涉及一种k歌计分方法和装置，特别是涉及一种基于语音匹配的k歌计分方法和装置。

【背景技术】
[0002]KTV练唱计分是很早就出现的一个功能，但是大部分采用的计分方案都比较简单，例如单纯的比较音量大小。音量大则计分高，音量小则计分低，用户体验非常不好，或者是直接比较音量，即用用户输入的音量和原始音频的音量做一个比对，音量越接近得分越高。
[0003]计分之所以不好做，就是因为评判唱的好坏有各种标准，唱的时序是否对准，唱的音高是否足够，唱的音色是否一致，等等，所有这些因素必须综合考虑，也就是说，由于在KTV唱歌，对其进行计分，评判的标准是和原唱者的匹配程度，也就是要求演唱者在各方面与原唱越接近越好，然而如上所述，在评判时，需要考虑上述各种因素，才能把练唱计分做好。但是这些因素很多，很难考虑周全，并且也很难将其综合考虑，哪个因素占的比重应该大一些，哪个因素占的比重应该小一些，都是有很多争议的，目前，也有很多人提出了许多种计分方法，包括根据音调的高低、节奏时长等，但是由于上述具体的因素较多，标准也很难统一，因此还没有一种方法和系统能够综合考虑各种因素，并且同时能够实现较为准确的计分。

【发明内容】

[0004]本发明的目的是提供一种基于语音匹配的k歌计分方法，在演唱过程中，提取原唱音频，同时持续不断的采集用户的声音、计算用户的音频特征，并且按照句为单位，与原唱的音频特征进行对比，依照不同的权值进行计分，本发明不再单纯的考虑例如具体的音调、音色、音量、节奏时长等因素，而是从声音的本质出发，考虑声音的本质特征，分析声音的频谱特性，从而可以将上述因素综合考虑进来，然后进行相应的计算，从而得到更为全面、准确的计分结果。
[0005]本发明的所述k歌计分方法所采取的技术方案如下:一种基于语音匹配的k歌计分方法，包括以下步骤:
[0006]I)从原始音频中，提取原唱音频；
[0007]2)计算原唱音频的音频特征，包括包络、频谱、时序或者根据频谱得分计算的置信度；
[0008]3)将原唱音频特征信息打包；
[0009]4)用户演唱时，提取用户演唱的音频数据的音频特征；
[0010]5)与原唱音频特征做比对，按不同音频特征，取不同的权值进行计分。
[0011]该k歌计分方法，能够克服【背景技术】中的问题，计分比较准确，客观。该方法运用在了酷我K歌客户端，用户在演唱歌曲时，会从服务器下载对应的计分文件。演唱过程中，持续不断的采集用户的声音、计算用户的音频特征。按照句为单位，与原唱的音频特征进行对比，依照不同的权值进行计分。

【专利附图】

【附图说明】
[0012]附图1为【背景技术】中比较原唱与演唱者音量特征的曲线图；
[0013]附图2为本发明的基于语音匹配的k歌计分方法的流程图。

【具体实施方式】
[0014]以下结合附图和具体实施例对本发明进行详细的说明。
[0015]在酷我k歌的计分中，采用了本发明的方法，本发明不再局限于单纯的考虑声音的音调、音色等特征的比较，而是考虑声音的频谱特征及包洛信息等，以歌曲的句为单位进行比对，并按照相应的权重进行计算，从而计算得出演唱者与原唱的匹配程度，从而最终给出计算的得分，之所以采用频谱特征，是由于频谱图是代表瞬间声音中各个频率成分分布的图形，频谱图既代表声音的频率构成，也反映了各频率分量的比重，因此由频谱图得到的声音信号更加客观和准确。举例来说，钢琴发出C调，小提琴发出同一音区的音调，如果分别比较其频谱图，我们可以发现，其基频基本一致，但它们的谐频的成分、幅度有很大的不同。正式由于其频谱组成的不同，才使人感到其音色的不同，而之所以有不同的频谱图，关键还在于两种乐器的结构、制作乐器使用的材料不同。同样的，对于人声也是一样的，各人的音调可以非常接近，但是音色是不一样的，在音调相同的基础上，如果音色也非常接近，那么其得分就会比较高。
[0016]下面我们来看酷我k歌中采用的计分方法的具体操作过程，首先，从原始音频中，采用谱减法提取原唱音频；当原唱者声音与背景音乐无法分离时，可以首先进行音效处理，将原唱者的声音滤掉，分离出背景音乐，然后将歌唱者的声音与背景音乐混合再与混合在一起的原唱者声音和背景音乐进行比较，以消除原唱者声音的干扰，提高比较的准确性。
[0017]第二，获取用户演唱的wav数据，由麦克风等设备采集歌唱者的声音，交由处理单元处理，
[0018]第三，提取wav数据的音频特征:首先，根据音频能量，提取包络信息；其次，根据音频时域信息提取频谱特征；接着，由于存在杂音干扰的问题，此处，我们将原唱频谱与演唱者频谱先进行比较然后得出得分，然后根据上述频谱比较后的得分计算置信度，用来判断并去除杂音干扰；
[0019]第四，将上述包络信息与原唱的相应音频特征对比，计算每一句的得分，根据在ktv的统计以及综合考虑用户体验，我们将上述各项权重设置如下:
[0020]a)音频包络信息占比:25 %
[0021 ] b)音频频谱信息占比:50%
[0022]c)根据频谱信息计算的置信度占比:25%
[0023]第五，整首歌曲演唱完毕，综合每句歌得分，计算全曲得分。
[0024]当然，在上面的步骤中，我们是以句为单位，也可以采用按预定的时间间隔对个长时间进行划分，计算每个时间间隔内每种特征的对比，得出区域对比，然后计算所有时间间隔的区域对比的加权平均值，作为歌唱时间内的总对比。
[0025]歌唱时间由歌唱者限定，可以是整首歌曲时间，获得整首歌曲时间内的对比；也可以是整首歌曲时间的一段时间段，获得某段时间内的对比。
[0026]将每种特征的对比与其权重作相应计算得到该种对比的得分，然后将所有特征的对比得分相加获得歌唱者最终的综合得分。
[0027]可以选择将每一时刻或预定时间段或每一句的对比结果采用实时显示，将对比结果用实时评分条的充满程度展示给歌唱者。
[0028]以上对本发明实施例所提供的技术方案进行了详细介绍，本文中应用了具体个例对本发明实施例的原理以及实施方式进行了阐述，以上实施例的说明只适用于帮助理解本发明实施例的原理；同时本领域的一般技术人员，根据本发明的实施例，在【具体实施方式】以及应用范围上均会有改变之处，综上所述，本发明书内容不应理解为对本发明的限制。
【权利要求】
1.一种基于语音匹配的k歌计分方法，其特征在于包括如下步骤: 1)、从原始音频中，提取原唱音频； 2)、获取用户演唱的wav数据，由麦克风设备采集歌唱者的声音，交由相应的处理单元处理； 3)、提取所述wav数据的音频特征: 首先，根据音频能量，提取包络信息；其次，根据音频时域信息提取频谱特征； 4)、将原唱频谱与演唱者频谱先进行比较然后得出得分，然后根据上述频谱比较后的得分计算置信度，用来判断并去除杂音干扰； 5)、再将所述提取的包络信息与原唱的相应音频特征包络信息比较，计算每一句的得分， 6)、上述各项权重设置如下: a)音频包络信息占比:25% b)音频频谱信息占比:50% c)根据频谱信息计算的置信度占比:25% 7)、整首歌曲演唱完毕，综合每句歌得分，计算全曲得分。
2.根据权利要求1所述的基于语音匹配的k歌计分方法，其特征是:所述步骤1)中提取原唱音频采用谱减法。
3.根据权利要求1所述的基于语音匹配的k歌计分方法，其特征是:原唱者声音与背景音乐无法分离时，首先进行音效处理，将原唱者的声音滤掉，分离出背景音乐，然后将歌唱者的声音与背景音乐混合再与混合在一起的原唱者声音和背景音乐进行比较，以消除原唱者声音的干扰。
4.根据权利要求1所述的基于语音匹配的k歌计分方法，其特征是:将每一句为单位的所述比较替换为预定时间段的比较。
5.根据权利要求4所述的基于语音匹配的k歌计分方法，其特征是:将每一时刻或预定时间段或每一句的对比结果采用实时显示，将对比结果用实时评分条的充满程度展示给歌唱者。
【文档编号】G10L25/48GK104282316SQ201310269402
【公开日】2015年1月14日申请日期:2013年7月1日优先权日:2013年7月1日
【发明者】柳瑞峰, 董坤, 鲁宝宏, 孙明申请人:亿览在线网络技术（北京）有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：柳瑞峰;董坤;鲁宝宏;孙明
技术所有人：亿览在线网络技术(北京)有限公司
我是此专利的发明人

上一篇：数据编解码方法、装置及数据通信系统的制作方法
上一篇：空调及其声控遥控器和声控遥控器的语音控制与提示方法