音频数据处理装置、音频装置、音频数据处理方法、程序及记录介质的制作方法

文档序号：7914993阅读：177来源：国知局

专利名称：音频数据处理装置、音频装置、音频数据处理方法、程序及记录介质的制作方法
技术领域：
本发明涉及音频数据处理装置、音频装置、音频数据处理方法、程序以及记录了该程序的记录介质。
背景技术：
近年来，以欧州为中心正在盛行研究以波阵面合成技术(Wave Field Synthesis WFS)为基本原理的音频系统(例如，参照非专利文献I)。WFS是指，基于惠更斯原理将从呈阵列状排列的多个扬声器(以下，称之为“扬声器阵列”)所辐射的声音的波阵面进行合成的技术。在通过WFS所提供的音响空间内，面对扬声器阵列所听到声音的收听者产生如下这样的感觉，即，实际从扬声器阵列所辐射的声音像是从虚拟存在于扬声器阵列的后方的声源(以下，称之为“虚拟声源”)所辐射来的那样(例如，参照图I)。作为能够应用WFS系统的装置，存在有电影、音频系统、电视、AV箱架、电视会议系统、电视游戏等。例如，数字内容为电影的情况下，演员的存在以称为虚拟声源的形式而记录于介质。由此，在演员一边进行会话一边在屏幕内进行移动的情况下，能够与屏幕内的演员的移动方向相配合地使虚拟声源相对于屏幕而向左右、前后以及任意方向进行定位。在例如专利文献I中公开了可使虚拟声源进行移动的系统。在先技术文献专利文献专利文献I JP特表2007-502590号公报非专利文献非专利文献I :A. J. Berkhout, D. de Vries,和P. Vogel著，“通过波场合成来进行的音响控制(Acoustic control by wave field synthesis) ”(荷兰)，第 93 (5)版，期刊美国声学协会(Acoustical Society of America) (J. Acoust. Soc), 1993 年 5 月，P.2764-2778。
发明概要发明所要解决的课题由于作为声波的发生源的声源以及收听者的相对速度不同而观测出声波的频率不同，作为这样的物理现象，已知多普勒效应。根据多普勒效应，在声波的发生源即声源靠近收听者的情况下，声波的振动连续从而频率变高，反之，在声源远离收听者的情况下，声波的振动被拉长从而频率变低。这意味着即使声源移动，从声源而到达的声波的波数量也不发生变化。但是，非专利文献I所记载的内容是以虚拟声源不移动而被固定的情况为前提，并没有研究伴随着虚拟声源的移动而发生的多普勒效应。因此，在虚拟声源向远离扬声器的方向移动或向接近扬声器的方向移动的情况下，以扬声器所发出的声音为基础的音频信号的波数量发生变化，由于该波数量的变化而导致波形失真。由于若在波形中产生失真则会让收听者将其感知为噪声，因此需要采取消除波形失真的措施。另外，关于波形失真的详细情况在后面叙述。另一方面，专利文献I所记载的技术中，考虑了伴随虚拟声源的移动而发生的多普勒效应，通过使成为音频信号的基础的音频数据中、从某片段内的适当的样本数据至下一片段内的适当的样本数据为止的范围的音频数据对应的权重系数进行变化，来补正该范围的音频数据。另外，所谓“片段”是音频数据的处理单位。通过补正音频数据能在某种程度上消除音频信号波形的极端失真，降低由于波形失真而产生的噪声。但是，在专利文献I所记载的技术仅仅是尝试对音频数据进行平滑化。即，在专利文献I所记载的内容中，并不是根据虚拟声源相对于扬声器的接近以及远离来特定波形失真并根据该所特定的波形失真来进行不同的补正的技术。由此，专利文献I所记载的技术中，存在下述课题由于很多情况下波形失真被残留，由此，不能充分获得避免由波形失真引起的噪声这样的效果。
发明内容
本发明是鉴于所涉及的课题而开发的，其目的在于提供一种根据虚拟声源相对于扬声器的接近以及远离来特定波形失真的场所，并通过根据波形失真来进行不同的补正来消除使虚拟声源进行移动的情况下所产生的波形失真，进而避免由波形失真引起的噪声的音频数据处理装置等。解决课题的手段本发明的音频数据处理装置，其输入与移动的虚拟声源所发出的声音对应的音频数据、该虚拟声源的位置以及基于所述音频数据而辐射声音的扬声器的位置，并基于所述虚拟声源的位置以及所述扬声器的位置来补正所述音频数据，所述音频数据处理装置具备计算单元，其计算在一前一后的时间点从所述扬声器的位置至所述虚拟声源的位置为止的各自的第一距离以及第二距离；比较单元，其比较所述第一距离以及所述第二距离；特定单元，其在比较结果为所述第一距离以及所述第二距离不同的情况下，对前后时间点的所述音频数据中存在的失真部分进行特定；以及补正单元，其根据所述虚拟声源对所述扬声器的接近以及远离，对所特定的部分的所述音频数据进行不同的补正。本发明的音频数据处理装置中，所述音频数据包含样本数据，所述特定单元特定由于所述虚拟声源对所述扬声器的远离而引起的样本数据的重复部分，所述补正单元具备对所特定的所述重复部分进行补正的第一补正单元。本发明的音频数据处理装置中，所述音频数据包含样本数据，所述特定单元特定由于所述虚拟声源对所述扬声器的接近而引起的样本数据的缺失部分，所述补正单元具备对中间为所特定的所述缺失部分的前后部分进行补正的第二补正单元。本发明的音频数据处理装置中，所述音频数据包含样本数据，所述特定单元对由于所述虚拟声源对所述扬声器的接近以及远离而引起的样本数据的重复部分或者样本数据的缺失部分进行特定，所述补正单元具备对所特定的所述重复部分进行补正的第一补正单元；以及对中间为所特定的所述缺失部分的前后部分进行补正的第二补正单元。本发明的音频数据处理装置中，进行所述补正的部分是声波传播所述第一距离以及所述第二距离的时间幅度的差，或者是与所述差成比例的时间幅度。本发明的音频数据处理装置中，所述第一补正单元将所特定的所述重复部分中所含的样本数据置换成通过将由该样本数据所形成的2个波形内的I个波形均等地扩展至2倍的时间幅度而获得的样本数据。本发明的音频数据处理装置中，所述第二补正单元将所特定的所述缺失部分以及该缺失部分的前后部分中所含的样本数据置换成通过将由该样本数据所形成的波形均等地压缩至2/3倍的时间幅度而获得的样本数据。本发明的音频数据处理装置中，还具备对通过所述补正单元进行补正后的音频数据实施增益控制的单元。本发明的音频数据处理装置中，所述虚拟声源的数量为I个或者多个。本发明的音频装置，其利用与移动的虚拟声源所发出的声音对应的音频数据、该虚拟声源的位置以及基于所述音频数据而辐射声音的扬声器的位置，并基于所述虚拟声源的位置以及所述扬声器的位置来补正所述音频数据，所述音频装置具备数字内容输入部，其输入包含所述音频数据以及所述虚拟声源的位置的数字内容；内容信息分离部，其解析所述数字内容输入部所输入的数字内容，并对在该数字内容中所含的音频数据以及虚拟声源的位置的数据进行分离；音频数据处理部，其基于所述内容信息分离部所分离出的虚拟声源的位置的数据以及所述扬声器的位置的数据，来对所述内容信息分离部所分离出的音频数据进行补正；和音频信号生成部，其基于补正后的音频数据，生成输出给所述扬声器的音频信号，所述音频数据处理部具备下述单元，即计算在一前一后的时间点从所述扬声器的位置到所述虚拟声源的位置为止的各自的第I距离以及第2距离的单元；比较所述第一距离以及所述第二距离的单元；在比较结果为所述第一距离以及所述第二距离不同的情况下，对前后时间点的所述音频数据中存在的失真部分进行特定的单元；以及根据所述虚拟声源对所述扬声器的接近以及远离，对所特定的部分的所述音频数据进行不同的补正的单
J Li ο本发明的音频装置中，所述数字内容输入部从存储有数字内容的记录介质、经由网络来发布数字内容的服务器或对数字内容进行广播的广播站来输入数字内容。本发明的音频数据处理方法是音频数据处理装置中的音频数据处理方法，该音频数据处理装置输入与移动的虚拟声源所发出的声音对应的音频数据、该虚拟声源的位置以及基于所述音频数据而辐射声音的扬声器的位置，并基于所述虚拟声源的位置以及所述扬声器的位置来补正所述音频数据，所述音频数据处理方法包括计算在一前一后的时间点从所述扬声器的位置到所述虚拟声源的位置为止的各自的第I距离以及第2距离的步骤；比较所述第一距离以及所述第二距离的步骤；在比较结果为所述第一距离以及所述第二距离不同的情况下，对前后时间点的所述音频数据中存在的失真部分进行特定的步骤；以及根据所述虚拟声源对所述扬声器的接近以及远离，对所特定的部分的所述音频数据进行不同的补正的步骤。本发明的程序中输入与移动的虚拟声源所发出的声音对应的音频数据、该虚拟声源的位置以及基于所述音频数据而辐射声音的扬声器的位置，并基于所述虚拟声源的位置以及所述扬声器的位置来补正所述音频数据，所述程序使计算机执行如下步骤计算在一前一后的时间点从所述扬声器的位置到所述虚拟声源的位置为止的各自的第I距离以及第2距离的步骤；比较所述第一距离以及所述第二距离的步骤；在比较结果为所述第一距离以及所述第二距离不同的情况下，对前后时间点的所述音频数据中存在的失真部分进行特定的步骤；以及根据所述虚拟声源对所述扬声器的接近以及远离，对所特定的部分的所述音频数据进行不同的补正的步骤。本发明的记录介质记录前述的程序。根据本发明的音频数据处理装置，在第一距离以及第二距离不同的情况下，对前后时间点的音频数据中存在的失真部分进行特定，并根据虚拟声源对扬声器的接近以及远离，对所特定的部分的音频数据进行不同的补正，所以，能够消除使虚拟声源进行移动而产生的波形失真。根据本发明的音频数据处理装置，对虚拟声源对扬声器的远离而引起的样本数据的重复部分进行补正，由此，能够消除在使虚拟声源对扬声器远离的情况下所产生的波形失真。根据本发明的音频数据处理装置，对由于虚拟声源对扬声器的接近而引起的样本数据的缺失部分进行补正，由此，能够消除在使虚拟声源对扬声器接近的情况下所产生的波形失真。根据本发明的音频数据处理装置，对由于虚拟声源对扬声器的接近以及远离而引起的样本数据的重复部分以及样本数据的缺失部分进行补正，由此，能够消除在使虚拟声源相对于扬声器而远离以及接近的情况下所产生的波形失真。根据本发明的音频数据处理装置，对上述的补正后的样本数据进一步进行基于增益控制的补正，由此，能够补正由于虚拟声源对扬声器的接近以及远离而引起的波形失真。根据本发明的音频装置，在第一距离以及第二距离不同的情况下，对前后时间点的音频数据中存在的失真部分进行特定，并根据虚拟声源对扬声器的接近以及远离，对所特定的部分的音频数据进行不同的补正，由此，能够输出消除了因使虚拟声源移动而产生的波形失真后的音频信号。根据本发明的音频数据处理方法，在第一距离以及第二距离不同的情况下，特定前后时间点的音频数据中存在的失真部分，并根据虚拟声源对扬声器的接近以及远离，对所特定的部分的音频数据进行不同的补正，由此，能够消除在使虚拟声源移动而产生的波形失真。根据本发明的程序，在第一距离以及第二距离不同的情况下，对前后时间点的音频数据中存在的失真部分进行特定，并根据虚拟声源对扬声器的接近以及远离，对所特定的部分的音频数据进行不同的补正，由此，能够消除在使虚拟声源进行移动而产生的波形失真。根据本发明的计算机可读取的记录介质，在第一距离以及第二距离不同的情况下，对前后时间点的音频数据中存在的失真部分进行特定，并根据虚拟声源对扬声器的接近以及远离，对所特定的部分的音频数据进行不同的补正，由此，能够消除在因使虚拟声源移动而产生的波形失真。发明效果根据本发明所涉及的音频数据处理装置等，在使虚拟声源进行移动时对音频数据进行补正，由此能够消除由于虚拟声源的移动而产生的波形失真，进而能够避免由波形失真所引起的噪声。

图I是WFS所提供的音响空间的一个示例的说明图。图2A是通常说明音频信号的说明图。图2B是通常说明音频信号的说明图。图2C是通常说明的音频信号的说明图。图3是由音频数据所形成的音频信号波形的一部分的说明图。图4是由第一片段内的音频数据所形成的音频信号波形的一个示例的说明图。图5是由第二片段内的音频数据所形成的音频信号波形的一个示例的说明图。图6是结合了图4所示的由音频数据所形成的音频信号波形以及图5所示的由音频数据所形成的音频信号波形后的音频信号波形的一个示例的说明图。图7是由第一片段内的音频数据所形成的音频信号波形的一个示例的说明图。图8是由第二片段内的音频数据所形成的音频信号波形的一个示例的说明图。图9是表示在由第一片段内的最初的部分的音频数据所形成的音频信号波形以及由第二片段内的最后的部分的音频数据所形成的音频信号波形之间产生了 4件缺失部分的状态的说明图。图10是结合了图7所示的由音频数据所形成的音频信号波形以及图8所示的由音频数据所形成的音频信号波形后的音频信号波形的一个示例的说明图。图11是表示具备实施方式I所涉及的音频数据处理部的音频装置的构成例的框图。图12是表示实施方式I所涉及的音频数据处理部的内部构成例的框图。图13是输入音频数据缓冲器的一构成例的说明图。图14是声波传播时间数据缓冲器的一构成例的说明图。图15是由补正后的音频数据所形成的音频信号波形的说明图。图16是由补正后的音频数据所形成的音频信号波形的说明图。图17是表示实施方式I所涉及的数据处理的流程的流程图。图18是表示波形失真部分的特定以及补正处理的流程的流程图。图19是表示实施方式2所涉及的音频装置的内部构成例的框图。
具体实施例方式实施方式I首先，开始说明以虚拟声源在WFS所提供的音响空间内不发生移动为前提的运算模型以及已考虑了虚拟声源的移动的运算模型，接下来转至对实施方式的说明。图I是WFS所提供的音响空间的一个示例的说明图。在图I所示的音响空间中，存在有由M个扬声器103_1 103_M构成的扬声器阵列103以及与扬声器阵列103面对来收听声音的收听者102。在该音响空间中，从M个扬声器103_1 103_11所辐射的声音的波阵面基于惠更斯的原理而被进行波阵面合成，并作为合成波阵面104而在音响空间内进行传播。此时，收听者102对于实际上从扬声器阵列103福射的声音会产生如同从定位于扬声器阵列103的后方的实际不存在的N个虚拟声源101_1 101_N所辐射来的这样的感觉。将虚拟声源101_1 101_NS称为虚拟声源101。
另一方面，图2A、图2B以及图2C是通常说明音频信号的说明图。对音频信号进行理论性处理时，通常，音频信号表现为连续信号S (t)。图2A表示连续信号S(t)，图2B表示采样间隔的脉冲列，图2C是表示连续信号S(t)以采样间隔At所被样本取样且量化后的数据s(bAt)的图(其中，b=正的整数)。例如，如图2A所示，连续信号S(t)在时间t的轴以及振幅S的轴上都是连续的。样本取样的目的在于，基于连续信号S(t)而获得时间上离散的信号。这是将连续信号S(t)以离散的时刻bAt处的数据s(bAt)来进行表现。虽然理论上样本取样的间隔可以是可变的，但实际设为固定间隔。样本取样以及量化操作是按如下方式进行的即，在将采样间隔设为时，如图2C所示，对连续信号S(t)以间隔At的脉冲列(图2B)进行间取，并将其进行量化。另外，在以后的说明中，将量化后的数据s (b At)称为“样本数据”。在本运算模型中，生成对扬声器阵列103所含的第m个扬声器(以下，称为“扬声器103_m”。)所赋予的音频信号在时刻t处的样本数据。在此，如图I所示，虚拟声源101的数量为N，构成扬声器阵列103的扬声器的个数为M。数I
N Im(t) = Jt) ■ ■ - (1》
yi ~ j其中，qn(t):从N个虚拟声源101中的第η个虚拟声源(以下，称为“虚拟声源101_η”。)辐射后而到达M个扬声器中的扬声器103_m的声波在离散时刻t的样本数据。Iffl(t):对扬声器103_m所赋予的音频信号在离散时刻t的样本数据。数2qn = Gn · Sn (t- τ J…⑵其中，Gn :虚拟声源101_η对应的增益系数sn(t):对虚拟声源101_n所赋予的音频信号在离散时刻t的样本数据τ·:由虚拟声源101_n的位置以及扬声器103_m的位置之间的距离所引起的声波传播时间份的样品数数3
W
L0077JN厂% 7
I tmagf·ρν
I ■. ΜΗ·· ■
y n m其中，w :加权常数rn :虚拟声源101_n的位置矢量(固定值)rm :扬声器103_m的位置矢量(固定值)数4
权利要求
1.一种音频数据处理装置，其输入与移动的虚拟声源所发出的声音对应的音频数据、该虚拟声源的位置以及基于所述音频数据而辐射声音的扬声器的位置，并基于所述虚拟声源的位置以及所述扬声器的位置来补正所述音频数据，所述音频数据处理装置的特征在于，具备计算单元，其计算在一前一后的时间点从所述扬声器的位置至所述虚拟声源的位置为止的各自的第一距离以及第二距离；比较单元，其比较所述第一距离以及所述第二距离；特定单元，其在比较结果为所述第一距离以及所述第二距离不同的情况下，对前后时间点的所述音频数据中存在的失真部分进行特定；以及补正单元，其根据所述虚拟声源对所述扬声器的接近以及远离，对被特定的部分的所述音频数据进行不同的补正。
2.根据权利要求I所述的音频数据处理装置，其中所述音频数据包含样本数据，所述特定单元对由于所述虚拟声源对所述扬声器的远离而引起的样本数据的重复部分进行特定，所述补正单元具备对所特定的所述重复部分进行补正的第一补正单元。
3.根据权利要求I所述的音频数据处理装置，其中所述音频数据包含样本数据，所述特定单元对由于所述虚拟声源对所述扬声器的接近而引起的样本数据的缺失部分进行特定，所述补正单元具备对中间为所特定的所述缺失部分的前后部分进行补正的第二补正单元。
4.根据权利要求I所述的音频数据处理装置，其中所述音频数据包含样本数据，所述特定单元对由于所述虚拟声源对所述扬声器的接近以及远离而引起的样本数据的重复部分或者样本数据的缺失部分进行特定，所述补正单元具备对所特定的所述重复部分进行补正的第一补正单元；以及对中间为所特定的所述缺失部分的前后部分进行补正的第二补正单元。
5.根据权利要求2至4中任意一项所述的音频数据处理装置，其中进行所述补正的部分是声波传播所述第一距离以及所述第二距离的时间幅度的差，或者是与所述差成比例的时间幅度。
6.根据权利要求2至4中任意一项所述的音频数据处理装置，其中所述第一补正单元将所特定的所述重复部分中所含的样本数据置换成通过将由该样本数据所形成的2个波形内的I个波形均等地扩展至2倍的时间幅度所得到的样本数据。
7.根据权利要求3或4所述的音频数据处理装置，其中所述第二补正单元将所特定的所述缺失部分以及该缺失部分的前后部分中所含的样本数据置换成通过将由该样本数据所形成的波形均等地压缩至2/3倍的时间幅度所得到的样本数据。
8.根据权利要求I至7中任意一项所述的音频数据处理装置，其中还具备对通过所述补正单元进行补正后的音频数据实施增益控制的单元。
9.根据权利要求I至8中任意一项所述的音频数据处理装置，其中所述虚拟声源的数量为I个或者多个。
10.一种音频装置，其利用与移动的虚拟声源所发出的声音对应的音频数据、该虚拟声源的位置以及基于所述音频数据而辐射声音的扬声器的位置，并基于所述虚拟声源的位置以及所述扬声器的位置来补正所述音频数据，所述音频装置的特征在于，具备数字内容输入部，其输入包含所述音频数据以及所述虚拟声源的位置在内的数字内容；内容信息分离部，其解析所述数字内容输入部所输入的数字内容，并对在该数字内容中所含的音频数据以及虚拟声源的位置的数据进行分离；音频数据处理部，其基于所述内容信息分离部所分离出的虚拟声源的位置的数据以及所述扬声器的位置的数据，来对所述内容信息分离部所分离的音频数据进行补正；和音频信号生成部，其基于补正后的音频数据，生成输出给所述扬声器的音频信号，所述音频数据处理部具备下述单元，即计算在一前一后的时间点从所述扬声器的位置到所述虚拟声源的位置为止的各自的第I距离以及第2距离的单元；比较所述第一距离以及所述第二距离的单元；在比较结果为所述第一距离以及所述第二距离不同的情况下，对前后时间点的所述音频数据中存在的失真部分进行特定的单元；以及根据所述虚拟声源对所述扬声器的接近以及远离，对所特定的部分的所述音频数据进行不同的补正的单元。
11.根据权利要求10所述的音频装置，其中所述数字内容输入部从存储数字内容的记录介质、经由网络来发布数字内容的服务器或对数字内容进行广播的广播站来输入数字内容。
12.—种音频数据处理方法，是音频数据处理装置中的音频数据处理方法，该音频数据处理装置输入与移动的虚拟声源所发出的声音对应的音频数据、该虚拟声源的位置以及基于所述音频数据而辐射声音的扬声器的位置，并基于所述虚拟声源的位置以及所述扬声器的位置来补正所述音频数据，所述音频数据处理方法的特征在于，包括计算在一前一后的时间点从所述扬声器的位置到所述虚拟声源的位置为止的各自的第I距离以及第2距离的步骤；比较所述第一距离以及所述第二距离的步骤；在比较结果为所述第一距离以及所述第二距离不同的情况下，对前后时间点的所述音频数据中存在的失真部分进行特定的步骤；以及根据所述虚拟声源对所述扬声器的接近以及远离，对所特定的部分的所述音频数据进行不同的补正的步骤。
13.一种程序，输入与移动的虚拟声源所发出的声音对应的音频数据、该虚拟声源的位置以及基于所述音频数据而辐射声音的扬声器的位置，并基于所述虚拟声源的位置以及所述扬声器的位置来补正所述音频数据，所述程序使计算机执行如下步骤计算在一前一后的时间点从所述扬声器的位置到所述虚拟声源的位置为止的各自的第I距离以及第2距离的步骤；比较所述第一距离以及所述第二距离的步骤；在比较结果为所述第一距离以及所述第二距离不同的情况下，对前后的时间点的所述音频数据中的失真的部分进行特定的步骤；以及根据所述虚拟声源的相对于所述扬声器的接近以及远离，对所特定的部分的所述音频数据进行不同的补正的步骤。
14.一种计算机可读取的记录介质,其特征在于，记录了权利要求13所述的程序。
全文摘要
提供一种通过消除在虚拟声源进行了移动的情况下所产生的波形失真来大幅地降低由波形失真引起的噪声的音频数据处理装置等。本发明包括对不同时间点的虚拟声源的位置与扬声器之间的距离进行计算的步骤；在这些距离不同的情况下，判定虚拟声源对扬声器是远离还是接近的步骤；根据远离或者接近来进行波形失真部分的特定以及补正的步骤。
文档编号H04S5/02GK102656906SQ20108005573
公开日2012年9月5日申请日期2010年12月1日优先权日2009年12月9日
发明者佐藤纯生, 倪婵斌, 服部永雄申请人:夏普株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：佐藤纯生;服部永雄;倪婵斌
技术所有人：夏普株式会社
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。