音频信号处理装置和处理音频信号的方法

文档序号：7757743阅读：112来源：国知局

专利名称：音频信号处理装置和处理音频信号的方法
技术领域：
本发明涉及音频信号处理装置和用于处理音频信号的方法。
背景技术：
随着通过使得观看者的每个眼睛看见不同的图像来实现立体影像的三维显示装置的实际使用，立体视频内容被广泛用作家用视频内容的可能性越来越大。三维显示装置呈现富有深度的视频图像，使得观看者感觉靠近或远离视频图像中的物体或感觉就像他们是在从不同角度观看一样。

发明内容
然而，伴随立体视频内容的声音是以诸如2声道和5. 1声道之类的一般格式提供的，这些格式不能完全产生适于视频图像的深度的声音效果。另外，不仅用于立体视频内容的声音缺乏听觉深度，而且通常的声音也缺乏听觉深度，因此，有时需要更好地增强深度感
知的声音。因此，本发明提供一种能够呈现富有听觉深度的声音的音频信号处理装置和用于处理音频信号的方法。根据本发明一个实施例，提供一种音频信号处理装置，其处理音频信号并将音频信号提供给音频输出单元。该音频信号处理装置包括特征分量提取单元，该特征分量提取单元提取音频信号中所包含的至少高频分量作为特征分量，并将音频信号和所提取出的特征分量提供给音频输出单元，以使得提取出的特征分量的声像定位于比音频信号的声像更靠近收听者。根据该结构，音频信号被输出，同时，与被靠近麦克风记录的声音中有特征的高频和低频声音相对应的特征分量被从音频信号中提取出并被输出，以使得特征分量的声像定位于比音频信号的声像更接近收听者，从而提供富有听觉深度的声音。另外，上述音频信号处理装置还可以包括接近定位处理单元，该接近定位处理单元对所提取出的特征分量执行接近定位处理，以将所提取出的特征分量的声像定位于比音频信号的声像更接近收听者。在该装置中，已经经历了接近定位处理的特征分量代替所提取出的特征分量被提供给音频输出单元。此外，上述音频信号处理装置还可以包括特征分量衰减单元，该特征分量衰减单元衰减音频信号中所包含的特征分量，并且可以将衰减后的音频信号和所提取出的特征分量提供给音频输出单元，使得所提取出的特征分量的声像被定位于比音频信号的声像更接近收听者并且衰减后的音频信号的声像被定位于比音频信号的声像更远离收听者。此外，上述音频信号处理装置还可以包括分离定位处理单元，该分离定位处理单元对衰减后的音频信号执行分离定位处理，以将衰减后的音频信号的声像定位于比音频信号的声像更远离收听者。在该装置中，已经经历了分离定位处理的音频信号代替衰减后的音频信号被提供给音频输出单元。分离定位处理单元可以将衰减后的音频信号相对音频信号延迟预定量的时间。此外，在特征分量提取单元中，用于提取特征分量的条件可以响应于由收听者做出的操作指令被可变地控制。在接近定位处理单元中，针对特征分量的接近定位处理的条件可以响应于由收听者做出的操作指令被可变地控制。在特征分量衰减单元中，用于衰减音频信号的条件可以响应于由收听者做出的操作指令被可变地控制。在分离定位处理单元中，针对音频信号的分离定位处理的条件可以响应于由收听者做出的操作指令被可变地控制。另外，所要输入的音频信号可以是多声道信号，并且多声道信号的输入可以被控制以使得由收听者指定的声道的信号被输入到特征分量提取单元。此外，根据本发明另一实施例，提供一种用于处理音频信号的方法，包括以下步骤从音频信号中提取至少高频分量作为特征分量；以及将音频信号和所提取出的特征分量提供给音频输出单元，以将所提取出的特征分量的声像定位于比音频信号的声像更接近收听者。根据本发明上述实施例，可以提供一种能够呈现富有听觉深度的声音的音频信号处理装置和用于处理音频信号的方法。

图IA图示出伴随视频内容的声音被记录的情况；图IB图示出伴随视频内容的声音被再现的情况；图2是图示出根据本发明一个实施例的再现设备的基本结构的框图；图3是图示出根据本发明第一实施例的音频信号处理装置的框图；图4是图示出根据本发明第二实施例的音频信号处理装置的框图；图5是图示出根据本发明第三实施例的音频信号处理装置的框图；图6是图示出根据本发明第四实施例的音频信号处理装置的框图；以及图7是图示出根据本发明第五实施例的音频信号处理装置的框图。
具体实施例方式以下将参考附图来详细描述本发明的优选实施例。注意，在该说明书和附图中，基本具有相同功能和结构的结构元件用相同的标号表示，并且省略对这些结构元件的重复描述。图IA和图IB图示出伴随视频内容的声音被记录和再现的情况。如图IA中所示，在一般的视频内容制作中，来自视频图像V中前面的声源SSf的声音Sf (人的对话等等) 由设在声源SSf附近的麦克风MIC靠近麦克风地(on-mic)被记录，而来自视频图像V中后面的声源SSr的声音Sr (环境声音等等)被远离麦克风地(off-mic)被记录。前面的声音Sf往往在所有频率范围内都维持高电平(high level)，特别是，往往在低频范围中被接近的麦克风以高电平记录(接近效应)。后面的声音Sr往往在所有频率范围中都以低电平记录，特别是，往往在高频范围中下降为低电平。与占据前面的声音Sf 中的一大部分的那些高频和低频的声音相对应的信号分量可以被定义作为该音频信号的特征分量Sc。
所记录的声音Sf和Sr以合成声音Sm的形式被存储和再现。如果声音Sm是2声道信号、5. 1声道信号或具有其他格式的信号，则该声音被存储为与每个声道相对应的声音 Sml, Sm2..。在回放立体视频内容时，如图IB中所示，通过合成前面的声音Sf和后面的声音Sr得到的声音Sm的声像(sound image)仅被定位在扬声器SP的前面，导致声音的再现在听觉上缺乏深度。为了防止这样的情况，本发明的一个实施例输出音频信号并且提取该音频信号的特征分量Sc，并将其输出以使得特征分量Sc的声像定位于比该音频信号的声像更接近收听者L，其中特征分量Sc对应于靠近麦克风记录的声音中有特征的高频和低频声音。以这种方式，将声音定位于接近收听者强调了附近的声音，从而提供富有听觉深度的声音。现在参考附图，以下将描述本发明的一个实施例。该实施例描述了本发明被应用于能够再现伴随立体视频图像的声音的光盘再现设备1的示例。然而，本发明除了可以应用于光盘再现设备1以外，还能应用于能够再现伴随立体视频图像的声音的电视接收机和多媒体装置(例如，个人计算机)。此外，本发明不限于伴随立体视频图像的声音的再现，还可以应用于伴随通常的视频图像的声音以及不伴随视频图像的声音的再现。[1.再现设备1的结构]图2是图示出根据本发明一个实施例的再现设备1的基本结构。再现设备1包括光盘阅读器11、解复用器12、视频数据解码器13、视频信号处理器14、视频信号接口 15、音频数据解码器16、音频信号处理器17 (音频信号处理装置)、音频信号接口 18、系统控制器19和操作信号处理器20。再现设备1通过视频信号接口 15和音频信号接口 18连接到三维显示器21和扬声器22。另外，再现设备1通过遥控器23来遥控。光盘阅读器11包括用于装载光盘D的装载器、旋转驱动器、光学读取头、螺纹电机 (thread motor)、伺服电路和某些其它组件。光盘阅读器11通过将激光光束照射到所装载的光盘D上并接收从光盘D反射的光束来读出被记录在光盘D上的复用数据(视频数据、音频数据等等)，使这些数据经历预定处理，并且将处理后的数据馈送至解复用器12。这里使用的术语“视频数据”是已经使用预定编码方案压缩了并被用来再现立体图像的数据。音频数据可以是2声道、5. 1或其它多声道的数据。假定以下所描述的音频数据是使用预定编码方案压缩了的2声道数据。解复用器12将被提供的复用数据分离成视频数据和音频数据(例如，2声道音频数据)。解复用器12将视频数据馈送至视频数据解码器13，还将音频数据馈送至音频数据解码器16。视频数据解码器13对所馈送的视频数据进行解压缩来将其解码成原始视频数据，并且将其馈送至视频信号处理器14。视频信号处理器14将所馈送的视频数据转换成模拟数据并且执行预定信号处理来创建适于再现立体图像的视频信号。然后，视频信号通过视频信号接口 15被输出至三维显示器21。三维显示器21在其显示屏上输出与输出的视频信号相对应的视频图像。三维显示器21富有深度地呈现视频图像，使得观看者感觉到接近或远离视频图像中的物体，或者感觉就像他们在从不同的角度观看一样。三维显示器21是通过使得观看者的每个眼睛可以看见不同的图像来提供立体图像的显示装置，并且可以与具有特殊光学特性的眼镜一起使用或者可以在没有它们的情况下使用。音频数据解码器16对所馈送的音频数据进行解压缩来将其解码成原始音频数据并且将音频数据馈送至音频信号处理器17。音频信号处理器17将所馈送的音频数据转换成模拟音频数据，执行预定信号处理，并且将经过处理的音频数据通过音频信号接口 18输出至扬声器22。扬声器22输出与所馈送的音频信号相对应的声音。系统控制器19例如是控制再现设备1中的各个组件的麦克风。具体地，系统控制器19将预定的控制信号发送给音频信号处理器17来控制它。应当注意，尽管为了方便说明，图1中的系统控制器19仅与音频信号处理器17连接，但是实际上系统控制器19也与其它组件连接。操作信号处理器20接收从遥控器23发送的操作信号，对操作信号进行解调并且将其馈送至系统控制器19。遥控器23包括布置在其上的输入装置，例如，按钮、按键和触控面板。尽管稍后将进行详细描述，但是，音频信号处理器17至少提取音频信号中所包含的高频分量，将其定义为特征分量Sc，并且将音频信号和所提取出的特征分量Sc提供给扬声器22，以使得所提取出的特征分量Sc的声像定位于比音频信号的声像更接近收听者L。这使得再现设备1可以提供具有与立体视频图像的深度有关的听觉深度的声音。[2.音频信号处理装置的结构]现在参考图3至图7，以下将描述根据本发明第一至第五实施例的音频信号处理装置。在项目已经在一个实施例中被描述了一次之后，在其它实施例中将不再描述它们。[2-1.第一实施例]图3是图示出根据本发明第一实施例的音频信号处理装置30的框图。图3图示出音频信号处理装置30(对应于图2中的音频信号处理器17)和其外围组件。音频信号处理装置30置于音频数据解码器16和扬声器组22之间。扬声器组22 包括左右主扬声器SPl，SPr和左右副扬声器SPls，SPrs，左右副扬声器SPls，SPrs被布置得比左右主扬声器SPl，SPr更接近收听者L。音频信号处理装置30包括预处理单元31、处理针对左扬声器SPl的音频信号的左信号处理系统和处理针对右扬声器SPr的音频信号的右信号处理系统。左信号处理系统和右信号处理系统分别包括特征分量提取单元321和32r。预处理单元31从自音频数据解码器16提供的音频数据生成左声道和右声道的音频信号，并且将这些信号分别馈送至左右信号处理系统。由于左右信号处理系统执行相同的处理，所以将具体对左信号处理系统进行描述。预处理单元31将针对左声道的音频信号馈送至左信号处理系统中的特征分量提取单元321以及左主扬声器SP1。特征分量提取单元321包括准许特定频率范围的音频信号通过的滤波器等，特征分量提取单元321提取所馈送的音频信号中所包含的特征分量Sc 并且将特征分量Sc馈送至左副扬声器SPls。音频信号中所包含的特征分量Sc是与高频和低频声音(在本实施例中具体为高频声音)相对应的信号分量。这样的高频和低频声音占据被靠近麦克风记录并且位于视频图像V的前景中的声音Sf的一大部分。音频信号可以划分为中频分量，比该中频分量低的低频分量和比中频分量高的高频分量，中频分量针对4kHz在Q = 1. 5到2. 0的范围内。以这种方式，音频信号从主扬声器SP1，SPr输出，同时，特征分量Sc从被设置得比主扬声器 SPl, SPr更接近收听者L的副扬声器SPls，SPrs输出，从而，将特征分量Sc的声像定位于比音频信号的声像更接近收听者L。根据该实施例，音频信号从主扬声器SP1，SPr输出，同时，与被靠近麦克风记录的声音Sf中有特征的(distinctive)高频和低频声音相对应的特征分量Sc被从音频信号提取出然后从副扬声器SPls，SPrs输出，使得特征分量Sc的声像被定位于比音频信号的声像更接近收听者L，从而提供富有听觉深度的声音。[2-2.第二实施例]图4是图示出根据本发明第二实施例的音频信号处理装置40的框图。在该实施例中，扬声器组22包括左右扬声器SPl，SPr，左右扬声器SPl，SPr也用作虚拟扬声器SPlv，SPrv。音频信号处理装置40除了包括预处理单元41和特征分量提取单元421，42r以外，还包括接近定位处理单元431，43r和合成处理单元441，44r。以下描述将具体涉及左信号处理系统。预处理单元41将针对左声道的音频信号提供给左信号处理系统的特征分量提取单元421和合成处理单元441。特征分量提取单元421提取所提供的音频信号中所包含的特征分量Sc并且将其馈送至接近定位处理单元431。接近定位处理单元431例如可以是执行接近定位处理的均衡器，接近定位处理涉及所馈送的特征分量Sc的频率响应特性和/或声音电平的更改。然后，接近定位处理单元 431将经过处理的特征分量Sc馈送至左右信号处理系统中的合成处理单元441，44r。在接近定位处理中，声像定位控制处理基于有关头部的传达函数等被执行，以将特征分量Sc的声像定位于比音频信号的声像更接近收听者L。合成处理单元441合成从预处理单元41和左右信号处理系统的接近定位处理单元431，43r馈送的音频信号，并且将合成的音频信号提供给左扬声器SP1，合成处理单元 441例如可以是声音混合器。调节已经经历了接近定位处理的特征分量Sc的权重能够使得特征分量Sc的声像被定位于比音频信号的声像更接近收听者L的预定位置。以这种方式，音频信号从扬声器SP1，SPr输出，同时，已经经历了接近定位处理的特征分量Sc从虚拟扬声器SPlv，SPrv输出，从而将特征分量Sc的声像定位于比音频信号的声像更接近收听者L。根据该实施例，音频信号从扬声器SP1，SPr输出，同时，与被靠近麦克风记录的声音Sf中有特征的高频和低频声音相对应的特征分量Sc被从音频信号提取出并从虚拟扬声器SPlv，SPrv输出，从而在没有设置副扬声器的情况下提供富有听觉深度的声音。[2-3.第三实施例]图5是根据本发明第三实施例的音频信号处理装置50的框图。在该实施例中，音频信号处理装置50除了包括预处理单元51、特征分量提取单元521，52r、接近定位处理单元531，53r、合成处理单元541，54r，还包括特征分量衰减单元 551，55r。以下描述将具体涉及左信号处理系统。预处理单元51将针对左声道的音频信号提供给左信号处理系统的特征分量提取单元521和特征分量衰减单元551。特征分量提取单元521和接近定位处理单元531的结构和操作与第二实施例的特征分量提取单元421和接近定位处理单元431相同，将不再重复它们的描述。特征分量衰减单元551可以是能够衰减特定频率范围中的音频信号的滤波器等，其衰减所提供的音频信号中所包含的特征分量Sc并且将衰减后的音频信号(即，具有衰减后的特征分量的音频信号)馈送至合成处理单元541。音频信号中所包含的特征分量Sc是与高频和低频声音(在本实施例中具体为高频声音)相对应的信号分量。这样的高频和低频声音占据被靠近麦克风地记录的声音Sf的一大部分并且位于视频图像V的前景中。合成处理单元541合成从特征分量衰减单元551和左右信号处理系统中的接近定位处理单元531，53r馈送的音频信号，并且之后将合成后的音频信号馈送至左扬声器SP1。左扬声器SPl输出与衰减后的音频信号相对应的声音以及与已经经历了接近定位处理的特征分量Sc相对应的声音。以这种方式，具有衰减后的特征分量Sc的音频信号从扬声器SP1，SPr输出，同时已经经历了接近定位处理的特征分量Sc从虚拟扬声器SPlv，SPrv输出，从而将特征分量Sc 的声像定位于比音频信号的声像更接近收听者L，并且将具有衰减后的特征分量Sc的音频信号的声像定位于比音频信号的声像更远离收听者L(音频信号的声像被定位为衰减后的音频信号的声像)。换而言之，特征分量Sc的衰减可以进一步增强由已经经历了接近定位处理的特征分量Sc的声像和具有衰减后的特征分量Sc的音频信号的声像所呈现的深度。根据该实施例，特征分量Sc已经衰减的音频信号从扬声器SP1，SPr输出，同时与被靠近麦克风记录的声音Sf中有特征的高频和低频声音相对应的特征分量Sc从音频信号被提取，经历接近定位处理并且从虚拟扬声器SPlv，SPrv输出，从而在没有设置副扬声器的情况下提供富有听觉深度的声音。[2-4.第四实施例]图6是图示出根据本发明第四实施例的音频信号处理装置60。在该实施例中，音频信号处理装置60除了包括预处理单元61、特征分量提取单元 621，62r、接近定位处理单元631，63r、合成处理单元641，64r和特征分量衰减单元651，65r 以外，还包括分离定位处理单元661，66r。以下描述将具体涉及左信号处理系统。预处理单元61将针对左声道的音频信号提供给左信号处理系统的特征分量提取单元621和特征分量衰减单元651。特征分量提取单元621和接近定位处理单元631的结构和操作与第二实施例的特征分量提取单元421和接近定位处理单元431相同，将不再重复它们的描述。特征分量衰减单元651衰减所提供的音频信号中所包含的特征分量Sc并且将具有衰减后的特征分量Sc的音频信号提供给分离定位处理单元661。分离定位处理单元661执行涉及频率响应、声音电平和/或时间的更改的分离定位处理来馈送具有衰减后的特征分量Sc的所提供的音频信号。然后，分离定位处理单元 661将经过处理的音频信号馈送至左右信号处理系统的合成处理单元641，64r。在分离定位处理中，基于有关头部的传达函数等来对衰减后的音频信号执行声像定位控制处理，以降低特征分量Sc的声音电平和/或延迟将衰减后的音频信号馈送至合成处理单元641，64ι 的时间，从而将衰减后的音频信号定位于比音频信号的声像更远离收听者L。具体地，相对特征分量Sc的输出延迟输出衰减后的音频信号使得收听者L就好像由于哈斯(Haas)效应特征分量Sc的声像被定位于比衰减后的音频信号的声像更接近收听者L那样收听到与音频信号相对应的声音。合成处理单元641合成从左右信号处理系统的特征分量衰减单元651，65r和接近定位处理单元631，63r馈送的音频信号并且将合成后的音频信号馈送至左扬声器SP1。左扬声器SPl输出与已经经历了分离定位处理的音频信号相对应的声音以及与已经经历了接近定位处理的特征分量Sc相对应的声音。以这种方式，具有衰减后的特征分量Sc的音频信号经历分离定位处理并且从第一虚拟扬声器SPlvl输出，同时特征分量Sc经历接近定位处理并且从第二虚拟扬声器 SPlv2输出，从而将特征分量Sc的声像定位于比音频信号的声像更接近收听者L并且将衰减后的音频信号的声像定位于比音频信号的声像更远离收听者L(音频信号的声像被定位为衰减后的音频信号的声像)。换而言之，对具有衰减后的特征分量Sc的音频信号执行分离定位处理可以增强由已经经历了接近定位处理的特征分量Sc的声像和已经经历了分离定位处理的音频信号的声像所呈现的深度。根据该实施例，具有衰减后的特征分量Sc的音频信号经历分离定位处理并且从第一虚拟扬声器SPlvl，SPrvl输出，同时，与被靠近麦克风记录的声音Sf中有特征的高频和低频声音相对应的特征分量Sc从音频信号被提取出，经历接近定位处理并且从第二虚拟扬声器SPlv2，SPrv2输出，从而在没有设置副扬声器的情况下提供富有听觉深度的声音。[2-5.第五实施例]图7是图示出根据本发明第五实施例的音频信号处理装置70的框图。在该实施例中，音频数据被格式化为5. 1声道数据并且扬声器组22包括左前扬声器SPfl、中前扬声器SPfc、右前扬声器SPfr、左后扬声器SPrl、右后扬声器SPrr和低音扬声器SPw。在该实施例，当收听者L利用遥控器23提供用于各种设置的指令时，系统控制器 19发送管理音频信号处理装置70中每个单元的处理操作的控制信号。操作信号的输入例如是通过遥控器23、三维显示器21等上所显示的屏幕菜单来进行的。预处理单元71从由音频数据解码器16提供的音频数据生成用于各个声道(即，用于左前声道、中前声道、右前声道、右后声道和低音声道)的音频信号，并且将所生成的音频信号馈送至各自的信号处理系统。预处理单元71响应于控制信号来控制开关元件或其它元件，以改变要提供给左信号处理系统和右信号处理系统的数据。如果提取处理、衰减处理和定位处理中没有一个被设置为要被执行，则预处理单元71将用于左前声道、中前声道、右前声道、右后声道和低音声道的数据分别提供给相对应的扬声器 SPfl、SPfc、SPfr、SPrl、SPrr 和 SPw。另一方面，如果提取处理、衰减处理和定位处理被设置为要被执行，则预处理单元 71将用于中前声道、左后声道、右后声道和低音(woofer)声道的数据提供给相对应的扬声器SPfc、SPrl、SPrr和SPw，并且将用于左前声道和右前声道的数据分别提供给左信号处理系统和右信号处理系统的特征分量提取单元721，72r和分离定位处理单元761，76r。替代将中前声道数据提供给位于中前的扬声器SPfc，预处理单元71可以将中前声道数据分割成左前声道数据和右前声道数据，并且将它们与最初生成的左前和右前声道数据分别相加，并且可以将左前和右前声道数据分别发送给左右信号处理系统的特征分量提取单元721，72r。
该分割处理被执行，因为，尽管用于左后声道、右后声道和低音声道的音频数据主要贡献于听觉空间感知，用于左前声道、中前声道和右前声道的音频数据往往提供平坦的听觉感知，因此，定位处理和其它处理更好地增强听觉深度感知。在接收到作为用于调节提取处理的设置的指令的控制信号之后，特征分量提取单元721，72r响应于该控制信号调节它们自己的滤波器的参数，以选择要被提取的音频信号的特定频率范围作为特征分量Sc。该控制信号例如包括指示用于提取高频和/或低频分量的提取处理是否必要或指定特定频率范围的信息。在接收到作为调节接近定位处理的设置的指令的控制信号之后，接近定位处理单元731，73r响应于该控制信号调节它们自己的均衡器的参数，以设置特征分量Sc的频率响应和/或信号电平。该控制信号例如包括指示频率响应和/或声音电平的更改是否必要或指定更改频率响应和/或声音电平的条件的信息。在接收到作为用于调节衰减处理的设置的指令的控制信号之后，特征分量衰减单元751，75r响应于该控制信号调节它们自己的滤波器的参数，以选择要被衰减的音频信号的特定频率范围作为特征分量Sc。该控制信号例如包括指示针对高频和/或低频分量的衰减处理是否必要或指示特定频率范围的信息。在接收到作为用于调节分离定位处理的设置的指令的控制信号之后，分离定位处理单元761，76r响应于该控制信号调节它们自己的均衡器的参数并且更改特征分量Sc的频率响应、声音电平和/或延迟量。该控制信号例如包括指示频率响应、声音电平和/或延迟量的更改是否必要或指定用于更改频率响应、声音电平和/或延迟量的条件的信息。在接收到作为用于调节合成处理的设置的指令的控制信号的之后，合成处理单元 741, 74r响应于该控制信号调节它们自己的声音混合器的参数并且改变用于合成每个信号处理系统中被定位于接近和/或一定距离的信号分量的条件和用于合成已经经历了提取处理和/或衰减处理的信号分量的条件。该控制信号例如包括指示分量的合成是否必要或指定合成条件(例如，每个分量的权重)的信息。因此，该实施例可以根据收听者L定制的特征分量提取处理、接近定位处理、特征分量衰减处理、分离定位处理和合成处理的设置，来提供具有令人满意调节过的听觉深度
的声音。已经参考附图描述了本发明的优选实施例，应当理解，本发明不限于这些精确实施例。本发明所属于的技术领域的技术人员将会想到在所附权利要求的范围中所记载的技术思想内的各种更改和修改，并且应当理解，这些更改和修改被本发明的技术范围所覆盖。例如，上述实施例陈述2声道音频数据从2声道扬声器SP1，SPr输出，然而，例如， 5. 1声道、7. 1声道或单声道音频数据可以从2声道、5. 1声道、7. 1声道等输出。假定5. 1声道或7. 1声道从2声道扬声器输出，则5. 1声道或7. 1声道中前3个声道的音频数据被分割成左声道数据和右声道数据，在左右信号处理系统中经历用于提取特征分量Sc的提取处理、接近定位处理、用于衰减音频信号的衰减处理以及分离定位处理，并且从2声道扬声器输出。单声道音频数据从2声道扬声器的输出可以通过将单声道数据分割成左声道数据和右声道数据并且以相同方式输出它们来执行。尽管在上述第二至第五实施例中，特征分量提取单元42，52，62，72和接近定位处理单元43，53，63，73是单独的组件，但是特征分量提取单元42，52，62，72和接近定位处理单元43，53，63，73特可以被集成为像具有滤波功能的均衡器一样。对于第四和第五实施例中所描述的特征量衰减单元65，75和分离定位处理单元66，76同样适用。尽管在第二至第五实施例中，合成处理单元44，54，64，74被提供给左右信号处理系统两者，但是合成处理单元44，54，64，74可以被设计为由左右信号处理系统共用。尽管第五实施例描述了对由第四实施例中的音频信号处理装置60的各个单元执行的处理操作的控制，但是由第一至第三实施例中的音频信号处理装置30，40，50中的单元执行的处理操作也可以被设计为是可控制的。本申请包含与2009年8月27日于日本专利局提交的日本在先专利申请JP 2009-197000中所公开的主题有关的主题，该申请的全部内容通过引用结合于此。本领域技术人员应当理解，根据设计要求和其它因素可以进行各种修改、组合、子组合和更改，只要它们在所附权利要求及其等同物的范围内即可。
权利要求
1.一种音频信号处理装置，处理音频信号并将所述音频信号提供给音频输出单元，所述音频信号处理装置包括特征分量提取单元，所述特征分量提取单元提取所述音频信号中所包含的至少高频分量作为特征分量，其中所述音频信号和所提取出的特征分量被提供给所述音频输出单元，使得所提取出的特征分量的声像被定位于比所述音频信号的声像更靠近收听者。
2.根据权利要求1所述的音频信号处理装置，还包括接近定位处理单元，所述接近定位处理单元对所提取出的特征分量执行接近定位处理，以将所提取出的特征分量的声像定位于比所述音频信号的声像更接近所述收听者，其中已经经历了所述接近定位处理的特征分量代替所提取出的特征分量被提供给所述音频输出单元。
3.根据权利要求1所述的音频信号处理装置，还包括特征分量衰减单元，所述特征分量衰减单元衰减所述音频信号中所包含的特征分量，其中衰减后的音频信号和所提取出的特征分量被提供给所述音频输出单元，使得所提取出的特征分量的声像被定位于比所述音频信号的声像更接近所述收听者并且所述衰减后的音频信号的声像被定位于比所述音频信号的声像更远离所述收听者。
4.根据权利要求3所述的音频信号处理装置，还包括分离定位处理单元，所述分离定位处理单元对所述衰减后的音频信号执行分离定位处理，以将所述衰减后的音频信号的声像定位于比所述音频信号的声像更远离所述收听者，其中已经经历了所述分离定位处理的音频信号代替所述衰减后的音频信号被提供给所述音频输出单元。
5.根据权利要求4所述的音频信号处理装置，其中所述分离定位处理单元将所述衰减后的音频信号相对所述音频信号延迟预定量的时间。
6.根据权利要求1所述的音频信号处理装置，其中在所述特征分量提取单元中，用于提取特征分量的条件响应于由所述收听者做出的操作指令被可变地控制。
7.根据权利要求2所述的音频信号处理装置，其中在所述接近定位处理单元中，针对特征分量的接近定位处理的条件响应于由所述收听者做出的操作指令被可变地控制。
8.根据权利要求3所述的音频信号处理装置，其中在所述特征分量衰减单元中，用于衰减所述音频信号的条件响应于由所述收听者做出的操作指令被可变地控制。
9.根据权利要求4所述的音频信号处理装置，其中在所述分离定位处理单元中，针对所述音频信号的分离定位处理的条件响应于由所述收听者做出的操作指令被可变地控制。
10.根据权利要求1所述的音频信号处理装置，其中所要输入的音频信号是多声道信号，并且所述多声道信号的输入被可变地控制以使得由所述收听者指定的声道的信号被输入到所述特征分量提取单元。
11.根据权利要求1所述的音频信号处理装置，其中所述特征分量是所述音频信号中所包含的高频分量和低频分量。
12.根据权利要求1所述的音频信号处理装置，其中所述音频信号被划分成中频分量、比所述中频分量低的低频分量以及比所述中频分量高的高频分量，所述中频分量针对4kHz在Q = 1. 5到2. 0的范围内。
13.一种用于处理音频信号的方法，包括以下步骤从所述音频信号中提取至少高频分量作为特征分量；以及将所述音频信号和所提取出的特征分量提供给音频输出单元，以将所提取出的特征分量的声像定位于比所述音频信号的声像更接近收听者。
全文摘要
本发明公开了音频信号处理装置和处理音频信号的方法。该音频信号处理装置处理音频信号并将音频信号提供给音频输出单元，其包括提取出所述音频信号中所包含的至少高频分量作为特征分量的特征分量提取单元。音频信号和提取出的特征分量被提供给音频输出单元，使得所提取出的特征分量的声像被定位于比音频信号的声像更靠近收听者。
文档编号H04S5/00GK102006545SQ20101026138
公开日2011年4月6日申请日期2010年8月20日优先权日2009年8月27日
发明者中野健司申请人:索尼公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：中野健司
技术所有人：索尼公司
我是此专利的发明人

上一篇：摄影设备及方法
上一篇：一种公交信息查询方法和系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。