个性化HRTF获取系统的制作方法

文档序号:15933790发布日期:2018-11-14 02:03阅读:1089来源:国知局

本发明涉及于三维虚拟声合成技术领域,是一种高空间分辨率的个性化hrtf获取系统,可以获取针对不同个体在任意角度上匹配的hrtf数据。

背景技术

头相关传输函数(hrtf)是虚拟声合成的核心技术,它描述的是自由场下声源到双耳之间的传输函数,是人体结构对声波综合滤波的结果,包含着关于声源定位的大部分信息。hrtf是与空间位置信息和人体参数有关的物理量。

一方面,由于hrtf数据和人体生理参数关系联系比较紧密,不同的生理参数所对应的hrtf数据各不相同。它表征了声音从声源到双耳传输过程中人体各个生理器官,如头部、耳廓、肩膀、躯干等对声音综合滤波的结果。不同听者具有不同的个性化生理参数,所以hrtf是一个因人而异的个性化物理量。个性化hrtf可以通过实验室测量或数值计算获取。但是,由于实验计算获取hrtf十分耗时耗力,一般在很多虚拟声的应用中,都退而求其次使用固定单一的hrtf数据库,这必然会影响到声像定位的精度和效果。

另一方面,现有的hrtf数据库大多都存在空间分辨率不高的问题。完整的hrtf数据测量需要对所有不同声源位置进行测量,即便是远场的hrtf,虽然测量时声源的距离是固定不变的,但对不同声源空间方向进行测量也是一个十分耗时的工作,通常需要对成百上千个空间方向进行测量。正是由于这种复杂性,hrtf的测量都是在一些事先设定好的有限方位上进行的。目前国内外多个机构已经完成hrtf数据测量,但测量角度方位都很有限,如麻省理工学院多媒体实验室(mitmedialab)的kemar人工头数据库,在水平角上的测量间隔是5°,在仰角上也是-40°到90°非均匀采集的;加州大学cipic实验室的数据库中仅在-45°到45°之间是均匀采集的。

人体生理参数和空间方位角度信息是影响hrtf数据和定位效果的两大因素,目前尚未有方法同时获取高分辨的个性化hrtf数据。



技术实现要素:

本发明的发明目的在于提供了一种个性化hrtf获取系统,可以获取针对不同个体在任意角度上匹配的hrtf数据,从而解决对高空间分辨率和个性化的需求。

本发明的发明目的通过以下技术方案实现:

一种个性化hrtf获取系统,包含预处理模块和hrtf获取模块,其中:

所述预处理模块用于将采集到的使用者的生理参数与“关键人体参数与特征角度hrtf映射网络”进行匹配,获取与该使用者匹配的特征角度hrtf数据;

hrtf获取模块用于首先将获取的与使用者匹配的特征角度hrtf数据作为训练样本,通过径向基神经网络训练,得到“空间位置信息与特征角度hrtf数据映射网络”;再将输入的方位角度信息与“空间位置信息与特征角度hrtf数据映射网络”进行匹配,获得对应的个性化hrtf数据。

优选地,所述使用者的生理参数包含耳甲腔长、耳长、耳宽、耳屏切迹、头宽、颈深、肩宽和外耳张角。

优选地,所述“关键人体参数与特征角度hrtf映射网络”通过以下方式获取:

步骤一,分析人体参数与hrtf的相关性,根据相关性获取关键人体参数;

步骤二,利用局部线形嵌入的方法将hrtf数据映射到二维空间,在二维空间得到hrtf的局部线性特征后提取特征角度hrtf;

步骤三,利用步骤一中得到的关键人体参数和步骤二中得到的特征角度hrtf作为训练样本,利用bp神经网络,计算得到关键人体参数与特征角度hrtf之间的映射关系。

优选地,所述步骤二中在二维空间得到hrtf的局部线性特征后提取特征角度hrtf具体做法为:在二维空间,通过对二维流形的边缘两点进行直线拟合,添加新的数据点后,下一点与前一段直线进行拟合,在计算出本段直线斜率与前一段直线斜率的误差δi后,将误差δi与设定的允许误差δ进行比较,若满足δi≤δ则认为两段直线端点之间仍是线性关系,反之,不是线性关系则将这一点所对应的高维hrtf数据作为特征角度的hrtf。

优选地,个性化hrtf获取系统还包含生理参数采集模块,用于采集使用者的正面与侧面的上身图像,通过图像处理获取生理参数,将生理参数输入到预处理模块中。

附图说明

图1:本发明的结构示意图;

图2a:生理参数中关键头部示意图;

图2b:生理参数中躯干参数示意图;

图2c:生理参数中关键耳廓参数示意图一;

图2d:生理参数中关键耳廓参数示意图二;

图3:实验获取的分辨率5°的原始hrtf数据;

图4:本发明获得的分辨率1°的高分辨率hrtf数据。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。本实施例中hrtf数据库以美国cipic实验室所提供的hrtf数据库为例。

参见图1所示,本实施例提供的个性化hrtf获取系统,包含预处理模块和hrtf获取模块。

预处理模块用于将采集到的使用者的生理参数与“关键人体参数与特征角度hrtf映射网络”进行匹配,获取与该使用者匹配的特征角度hrtf数据。

“关键人体参数与特征角度hrtf映射网络”为预先建立好,存储在预处理模块中,“关键人体参数与特征角度hrtf映射网络”可以通过以下步骤建立:

步骤1.1,分析人体参数与hrtf的相关性,根据相关性获取关键人体参数。具体为:

实际对使用者不可能测量全部的生理参数信息,需选择主要影响hrtf的几个关键生理参数。采用相关性分析:

(1)式中,x为人体参数矩阵;y为hrtf矩阵或者人体参数矩阵;r为计算得出的相关系数;当y为人体参数矩阵时,得到的r为每个人体参数之间的相关系数,取r较小的人体参数;当y为hrtf矩阵时,得到的r为每个人体参数与hrtf之间的相关系数,取r较大的人体参数;n为数据集的大小,当y为人体参数矩阵时,i表示从人体参数的索引;当y为hrtf矩阵时,i表示某个方向上hrtf数据的索引。

使用cipic数据库提供的35个无损受试者的27个生理参数信息,经过对所有受试者样本数据分析,关键生理参数选定为d1耳甲腔长,d5耳长,d6耳宽,d7耳屏切迹,x1头宽,x8颈深,x12肩宽,θ2外耳张角,参见图2a、2b、2c、2d所示。

步骤1.2,利用局部线形嵌入的方法将hrtf数据映射到二维空间,在二维空间得到hrtf的局部线性特征后提取特征角度hrtf。

hrtf数据在邻近角度具有局部线性特征,为了准确获取这种局部线性特征,利用局部线形嵌入的方法将高维空间的hrtf数据映射到二维空间中,可以在二维空间中较为容易地观察邻近角度hrtf具体的局部线性特征。在得到hrtf的局部线性特征后,就可以提取特征角度hrtf,具体做法为:在二维空间,通过对二维流形的边缘两点进行直线拟合,添加新的数据点后,下一点与前一段直线进行拟合,在计算出本段直线斜率与前一段直线斜率的误差δi后,将其与设定的允许误差δ进行比较,若满足δi≤δ则可以认为两段直线端点之间仍是线性关系。反之,不是线性关系则将这一点所对应的高维hrtf数据作为特征角度的hrtf。通过对特征角度hrtf的提取,能够对原始hrtf数据进行压缩,达到减少存储量的目的,同时,人体参数与hrtf数据之间映射关系的计算量也会降低。

步骤1.3,关键人体参数和特征角度hrtf数据映射。

利用步骤1.1中相关性分析得到的关键人体参数数据和步骤1.2中得到的特征角度hrtf作为训练样本,利用bp神经网络,计算得到关键人体参数与特征角度hrtf之间的映射关系,从而得到“关键人体参数与特征角度hrtf映射网络”。

hrtf获取模块用于首先将获取的与使用者匹配的特征角度hrtf数据作为训练样本,通过径向基神经网络训练,得到“空间位置信息与特征角度hrtf数据映射网络”;再将输入的方位角度信息与“空间位置信息与特征角度hrtf数据映射网络”进行匹配,获得对应的个性化hrtf数据。hrtf获取模块采用在线处理,具体为:

步骤2.1,将获取的匹配特征角hrtf数据作为训练样本,通过径向基神经网络训练,得到空间位置信息与其对应hrtf数据的映射关系。即通过k均值聚类方法确定隐含层高斯函数的聚类中心xj,隐含层高斯函数为:

其中k为聚类中心的个数。所有的隐含层的输出为φ(xi),输出层的训练样本为其中di为目标hrtf数据。再通过递推最小二乘方法对输出层训练样本进行训练,得到权值向量wj的更新。从而最终构造出映射关系的逼近数学形式:

步骤2.2,输入所需方位角信息获取对应个性化hrtf数据。

在个性化hrtf获取系统中,还可以设置一个生理参数采集模块,使用者通过摄像头或提供正面与侧面上身图像输入到生理参数采集模块,通过图像处理获取其关键生理参数,将关键生理参数输入预处理模块中得到与该使用者匹配的特征角度hrtf数据。

本发明提供的一种高空间分辨率的个性化hrtf获取方法可以获取针对不同个体在任意角度上匹配的hrtf数据,从而解决对高空间分辨率和个性化的需求。本发明的实验效果参见图3、图4所示,图3为实验获取的分辨率5°的原始hrtf数据,图4为本发明获得的分辨率1°的高分辨率hrtf数据。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1