基于分段式多元线性回归的个性化头相关传递函数生成系统及方法与流程

文档序号:12891767阅读:440来源:国知局
基于分段式多元线性回归的个性化头相关传递函数生成系统及方法与流程
本发明涉及三维音频效果增强领域,尤其涉及适用于双声道耳机设备的个性化头相关传递函数模型的建立以及利用该模型生成与使用者相匹配的个性化头相关函数的方法。
背景技术
:随着虚拟现实(VirtualReality,简称VR)技术的日渐发展,传统的立体声音效已经无法满足沉浸式声音体验的要求,而基于多声道的三维音频技术由于播放设备昂贵、部署要求复杂等原因很难进入个人使用领域。头相关传递函数(HeadRelatedTransferFunction,简称HRTF)描述了声音由特定方位传递入人耳的过程中经过耳廓、躯干等人体部位反射、衍射而发生的改变。因此利用HRTF可以计算出来自不同方位的声音传递到人耳时的效果,从而模拟出立体空间声音定位的效果。头相关脉冲响应(HeadRelatedImpulseResponse,简称HRIR)是HRTF的时域表示。个性化HRTF可以显著增强三维音频的空间方位感,而HRTF与使用对象密切相关。目前有两种方法获取HRTF数据:一种是通过实验直接测量得到;另一种是通过建立人体参数模型从而计算出相关HRTF。对于实验测量获得HRTF数据,对实验所需设备和环境要求很高,且测量过程非常复杂,对于个体用户难以实施。而对于建立人体参数模型通过计算得到HRTF则存在建模难度大、计算复杂、精度不高的缺点。技术实现要素:本发明的目的是提供通过人体测量参数信息而获得个性化HRTF的技术方案,使得个体使用用户能够获得良好的三维音频体验。为达到上述目的,本发明提供一种适用于双声道耳机设备的,基于HRIR波形分组分析的个性化HRTF生成系统,包括:模块1:HRIR前端时延移除模块,模块2:HRIR数据冗余压缩模块,模块3:HRIR数据分组模块,模块4:人体测量参数提取模块,模块5:个性化HRTF算子计算模块,模块6:个性化HRIR生成模块,模块7:三维音频生成及测试模块,模块8:人体测量参数微调模块。所述模块1:HRIR前端时延移除模块,用于对HRTF样本库中提取的HRIR时域数据进行分析,计算出样本中的双耳间时差信息,并将HRIR样本中由于声波到达人耳而导致的时延空白数据移除。该模块计算所得的信号输出给HRIR数据冗余压缩模块——模块2。所述模块2:HRIR数据冗余压缩模块,用于对HRIR数据进行分析压缩,以降低后期计算的复杂度。该模块统计并分析出HRIR数据的后端冗余噪声信号,对该类信号进行删除,以达到压缩数据量并提升计算效率的目的。该模块计算所得的数据传输给HRIR数据分组模块——模块3。所述模块3:HRIR数据分组模块,用于对来自于模块2的HRIR信号进行分组,将长信号切分为小规模的分组信号(可以将长信号切分为多个长度为8个采样的分组信号,在实际应用中分组的数量和每个分组的长度可根据情况进行选择)。分组后的信号传输给个性化HRTF算子计算模块——模块5。所述模块4:人体测量参数提取模块,用于对HRTF样本库中的人体测量参数样本进行统计分析,提取出同HRIR具有显著相关性的部分人体测量参数数据(包括但不限于头宽度、头高度、头深度、颈部直径、颈部高度、肩膀宽度、胸部厚度、耳廓高度、耳廓宽度、耳廓相对于头部中心偏移距离、耳甲腔宽度、耳甲腔高度、耳甲腔深度,耳屏间切迹宽度、外耳张角)。该模块计算所得数据传输给个性化HRTF算子计算模块——模块5.所述模块5:个性化HRTF算子计算模块,用于建立模块3和模块4输入数据间的映射关系。该模块将模块3输入的数据按照分组信息分别与模块4输入的人体参数信息进行建模分析,最终得到人体测量参数数据与HRIR数据之间的计算算子。利用该算子建立的模型能够通过任意个体的人体测量参数获取其个性化HRIR数据。该模块计算所得数据输入给个性化HRIR生成模块——模块6。所述模块6:个性化HRIR生成模块,用于将模块5所得个性化算子结合使用用户提供的人体测量参数计算出适用于该用户的个性化HRIR信息。该模块计算所得数据传输给三维音频生成及测试模块——模块7。所述模块7:三维音频生成及测试模块,用于利用模块6所得个性化HRIR信息对音频进行三维空间模拟,通过用户使用的主观感受情况,可以生成适用于当前用户的个性化HRTF数据;或者通过模块8对人体测量参数进行修正以达到三维音频效果的进一步改善。所述模块8:人体测量参数微调模块,用于对当前用户提供的人体测量参数进行修正。由于人体参数的测量存在误差,该模块提供了对人体测量参数进行修正的功能。修正后的人体测量参数再次传输给模块6生成调整后的个性化HRIR信息。本发明还提供了基于HRIR波形分组分析的个性化HRTF生成方法,包括以下步骤:步骤1,对HRTF样本库按样本对象依次进行HRIR波形分析,得到HRIR中代表声波首次到达耳道对应的波峰位置T0,之后将T0之前的HRIR信号进行删除。步骤2,对于来源于步骤1的HRIR数据,逐一进行波形分析,得到HRIR中最后波峰或波谷的位置T1,对超出T1长度的HRIR进行截断,对长度不足的HRIR进行补0。通过步骤1和步骤2,将原始数据中的无效冗余信号删除,以压缩数据量和减少计算量。步骤3,对来源于步骤2的HRIR进行切割分组。按照逐样本对象、逐声道、逐方位的顺序对来源于步骤2的HRIR进行分组,可根据步骤2中传输数据长度决定分组的大小。步骤4,对待选用人体测量参数进行参数间的相关性分析,筛除过度相关的人体参数,选用适当的人体测量参数并提取出HRTF样本库中对应的人体测量参数数据。不同的类型的人体参数具有不同的测量复杂度,而人体参数的数量又关系到生成个性化HRTF的精确度,可以根据实际需要对人体参数的选取进行调整。步骤5,对分组后的HRIR和人体测量参数进行多元线性回归计算。根据来源于步骤3和步骤4的数据,对二者的数据按照HRIR分组的顺序通过多元线性回归建立关系,从而得到各个方位对应的个性化算子。步骤6,使用者按照步骤4中要求的人体参数提供相应的人体测量参数,通过与步骤5中获得的个性化算子进行计算,得到适用于该使用者的各个方位的个性化HRIR数据。步骤7,将步骤6得到的个性化HRIR数据同测试音频序列进行卷积运算,即可得到相应方位的三维音频效果。使用者根据主观听音感受可以决定是否需要对个性化参数进行调整,或者选择保存当前个性化信息。步骤8,对人体测量参数进行微调,再次经由步骤6生成新的个性化HRIR。经过若干次步骤6——步骤7——步骤8的迭代,最终用户可以得到最佳的三维音频体验效果。所述步骤1中的HRTF样本库至少包括测试人体样本的左右耳HRIR测量数据以及包含人体样本的包括但不限于头宽度、头高度、头深度、颈部直径、颈部高度、肩膀宽度、胸部厚度、耳廓高度、耳廓宽度、耳廓相对于头部中心偏移距离、耳甲腔宽度、耳甲腔高度、耳甲腔深度,耳屏间切迹宽度、外耳张角的测量数据。对其中步骤1中HRTF样本库的原始数据进行声波首次到达耳道前的延时移除,处理对象为针对样本库中所有方位的HRIR进行;该移除算法为对原始HRIR波形进行首次抵达耳道波峰分析,计算获得首次抵达耳道的波峰位置,从而移除该波峰之前的时延数据。对其中步骤1和步骤2中进行冗余数据删除而实现压缩数据的方法,其方法为对经过移除前端时延的HRIR进行最末波峰/波谷位置分析,删除最末波峰/波谷位置之后的无效数据从而只保留下HRIR波形主体范围。对其中步骤4中人体测量参数的选择包括但不限于头宽度、头高度、头深度、颈部直径、颈部高度、肩膀宽度、胸部厚度、耳廓高度、耳廓宽度、耳廓相对于头部中心偏移距离、耳甲腔宽度、耳甲腔高度、耳甲腔深度,耳屏间切迹宽度、外耳张角,也可以根据计算的复杂度要求选取部分人体测量参数进行计算。对其中步骤5中的计算方式,强调的是依照分组后的HRIR数据,依次使用多元线性回归分析进行相关计算。对其中步骤6中用户提供的人体测量参数,其参数的范围应与步骤4涉及的参数一致,其包含但不限于头宽度、头高度、头深度、颈部直径、颈部高度、肩膀宽度、胸部厚度、耳廓高度、耳廓宽度、耳廓相对于头部中心偏移距离、耳甲腔宽度、耳甲腔高度、耳甲腔深度,耳屏间切迹宽度、外耳张角,也可以根据计算的复杂度要求选取部分人体测量参数进行计算。对其中步骤6中生成的个性化HRIR数据,是按照步骤3的HRIR分组信息重新进行重组得到的完整HRIR信息,其重组过程包含按分组信息进行HRIR分组拼接、HRIR前端时延信息添加,HRIR后端冗余信息恢复。其中步骤6使用的音频测试序列为单声道音频序列,测试所使用的方位信息为预先规划的确定路线信息。附图说明图1是本发明实施例的系统结构框图。图2是本发明实施例的方法流程图。其中,1:HRIR前端时延移除模块、2:HRIR数据冗余压缩模块、3:HRIR数据分组模块、4:人体测量参数提取模块、5:个性化HRTF算子计算模块、6:个性化HRIR生成模块、7:三维音频生成及测试模块、8:人体测量参数微调模块。具体实施方式下面以具体实施例结合附图对本发明的技术方案作进一步说明:参见图1,本发明提供一种适用于双声道耳机设备的,基于HRIR波形分组分析的个性化HRTF生成系统,该系统包括模块1:HRIR前端时延移除模块、模块2:HRIR数据冗余压缩模块、模块3:HRIR数据分组模块、模块4:人体测量参数提取模块、模块5:个性化HRTF算子计算模块、模块6:个性化HRIR生成模块、模块7:三维音频生成及测试模块、模块8:人体测量参数微调模块。所述模块1:HRIR前端时延移除模块,用于对HRTF样本库中提取的HRIR时域数据进行分析,计算出样本中的双耳间时差信息,并将HRIR样本中由于声波到达人耳而导致的时延空白数据移除。该模块计算所得的信号传输给模块2。具体实施时,在HRTF样本库中按样本对象分别挑选出该对象所有空间方位的HRIR信息数据,对各方位的HRIR波形进行分析,得到声波首次到达耳道的采样波峰位置,从而确定出HRIR的前端时延,将前端时延的信息进行删除。所述模块2:HRIR数据冗余压缩模块,用于对HRIR数据进行分析压缩,以降低后期计算的复杂度。该模块统计并分析出HRIR数据的后端冗余噪声信号,对该类信号进行删除,以达到压缩数据量并提升计算效率的目的。该模块计算所得的数据传输给模块3。具体实施时,将来源于模块1的HRIR数据按照逐对象、逐方位的顺序依次进行统计分析,统计出HRIR信号的平均最末波峰位置,再综合考虑HRIR的音频特性选取适当时长作为HRIR的有效时长,将其有效时长后的冗余数据进行删除。所述模块3:HRIR数据分组模块,用于对来自于模块2的HRIR信号进行分组,将长信号切分为小规模的分组信号。分组后的信号传输给模块5。具体实施时,可根据HRIR有效时长选取不同的分组长度。例如将某样本对象的某方位HRIR信号平均划分为8个分组,则在当前方位应当划分为2×8=16个分组信息,分别对应左右耳的HRIR原始信号,每耳对应8个分组。所述模块4:人体测量参数提取模块,用于对HRTF样本库中的人体测量参数样本进行统计分析,提取出与HRIR具有密切相关性的部分人体测量参数数据。该模块计算所得数据输入给模块5。具体实施时,对HRTF样本库中的样本对象进行人体测量参数相关度统计,挑选一定数量的人体测量参数传输给模块5与HRIR分组数据进行相关计算。所述模块5:个性化HRTF算子计算模块,用于建立模块3和模块4输入数据间的映射关系。该模块对模块3输入的数据按照分组信息分别同模块4输入的人体参数信息进行建模分析,最终得到人体测量参数信息与HRIR数据之间的计算算子。利用该算子建立的模型能够使用任意个体的人体测量参数计算出其个性化HRTF数据。该模块计算所得数据传输给模块6。具体实施时,将来自于模块3的全部样本对象的HRIR数据进行汇总,并按照区分左右声道、区分分组类别的形式分别与来源于模块4的样本人体测量参数进行多元线性回归分析,从而获得对应于各声道、各方位的HRTF个性化算子。所述模块6:个性化HRIR生成模块,用于使用模块5计算所得的个性化算子结合使用用户提供的人体测量参数计算出适用于该用户的个性化HRIR数据。该模块计算所得数据传输给模块7。具体实施时,用户提供相应的人体测量参数,该参数通过个性化算子计算可以得到适用于当前用户的各方位个性化HRIR信息。所述模块7:三维音频生成及测试模块,用于利用模块6所得个性化HRIR数据对音频进行三维空间模拟,通过用户使用的主观感受情况,可以生成适用于当前用户的个性化HRTF数据;或者通过模块8对人体测量参数进行修正以达到三维音频效果的进一步改善。具体实施时,用户挑选测试单声道音频序列,该测试序列经过来源于模块6的个性化HRIR处理后生成具有三维效果的音效,用户根据自己的主观感受,可以选择是否需要对自己的人体参数进行微调以提升三维音效的定位效果。所述模块8:人体测量参数微调模块,用于对当前用户提供的人体测量参数进行修正。由于人体参数测量存在误差,该模块提供了对测量参数进行修正的功能。修正后的人体测量参数再次传输给模块6,生成调整后的个性化HRIR数据。具体实施时,用户可以对人体测量参数进行修正,不同参数的修正对生成的三维音效会产生不同的影响,经过多次微调最终可达到最佳三维音效的定位效果。参见图2,本发明实例提供的个性化HRTF生成方法可以通过计算机进行运行,具体包括以下步骤:步骤S1,对HRTF样本库按样本对象依次进行HRIR波形分析,得到HRIR中代表声波首次到达耳道时对应的波峰位置T0,实施例中对HRIR进行振幅统计,得到当前HRIR波形中的最大振幅为Fmax,之后从HRIR起始位置依次进行分析,以首次超过0.8×|Fmax|的波峰作为首次抵达耳道的波峰位置,从而确定T0,之后将T0之前的HRIR信号进行删除,并对删除后的HRIR末端进行补0操作,使得HRIR的整体长度保持不变。步骤S2,对于来源于S1的HRIR数据,逐一进行波形分析,得到HRIR中最后波峰或波谷的位置T1,实施例中对HRIR进行振幅统计,得到当前HRIR波形中的最大振幅为Fmax,之后从HRIR最终位置向前依次进行分析,以首次超过0.2×|Fmax|的振幅绝对值作为最后波峰或波谷位置,从而确定T1,移除T1后的数据。对获得的HRIR数据进行统计,结合HRIR的音频特性,确定最终保留的HRIR信号长度L,对超出长度的HRIR进行截断,对长度不足的HRIR进行补0。实施例中采用的HRIR长度为每声道64个采样点。步骤S3,对来源于S2的HRIR进行切割分组。实施例中采用的分组数量为8,每声道HRIR长度为64采样点,即每声道HRIR被分为8个分组。步骤S4,提取出HRTF样本库中的人体参数数据。实施例中提取的人体参数有15个,分别为:头宽度、头高度、头深度、颈部直径、颈部高度、肩膀宽度、胸部厚度、耳廓高度、耳廓宽度、耳廓相对于头部中心偏移距离、耳甲腔宽度、耳甲腔高度、耳甲腔深度,耳屏间切迹宽度、外耳张角。步骤S5,对分组后的HRIR和人体测量参数进行相关度计算。实施实例中将来源于S3的数据按照区分声道、方位的方式进行组织,每声道每方位存在8个分组的HRIR矩阵,即每个HRIR分组为H(N×R)矩阵(N个样本对象,每个样本对象在当前分组有R个采样点数据);将来源于S4的人体参数组织为A(N×M)矩阵(N个样本对象,每样本对象M个人体参数)。之后进行多元线性回归计算出β(M×R)矩阵使得:H^i=A·βi+Eii=1,2...8---(1)]]>其中为HRIR分组矩阵,A为人体测量参数矩阵,βi为当前方位的个性化算子矩阵,i为当前分组编号,E为计算所得残差。具体多元线性回归计算方法为现有技术,本发明不予赘述。步骤S6,使用者提供人体参数,结合S5得到的个性化算子,生成该使用者的个性化HRIR数据。实施实例中按照如下计算规则计算:H^i=A·βii=1,2...8---(2)]]>H^=H^1∪H^2∪...∪H^8---(3)]]>其中算式(2)中为HRIR分组矩阵,A为人体测量参数矩阵,βi为当前方位的个性化算子矩阵,i为当前分组编号。算式(3)中为将分组HRIR结果进行拼合得到的个性化HRIR结果。步骤S7,将S6得到的个性化HRIR数据同测试音频序列进行卷积运算,即可得到相应方位的三维音频效果。实施实例中首先选择一系列连续角度的(如顺时针旋转360度)HRIR数据,然后对测试音频序列按照选取HRIR方位进行分组,之后按照方位顺序对相应的音频分组进行卷积运算得到顺时针旋转一周的三维音效。使用者可根据音效效果选择保存为个性化HRTF或者通过步骤S8进行人体测量参数调整。Wi=Pi⊗H^i---(4)]]>W=∪wi(5)其中算式(4)中代表卷积运算,Pi代表测试音频分组,代表特定方位的HRIR信息,Wi代表当前音频分组运算得到的三维音频结果,i表示当前的分组编号。算式(5)中Wi代表(4)中所得的三维音频分组,W代表最终的三维音频效果,i表示当前的分组编号,运算符号∪代表将各个三维音频分组进行拼接运算。步骤S8,由于使用者提供的人体测量参数可能存在一定的测量误差,当使用者在S7步骤中经过主观测试,认为三维音频效果不理想,则可以由S8步骤对人体测量参数进行微调。经过若干次步骤S6——步骤S7——步骤S8的迭代,最终用户可以得到最佳的三维音频体验效果。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1