一种音频处理方法及装置的制造方法

文档序号：10616545阅读：347来源：国知局

一种音频处理方法及装置的制造方法
【专利摘要】本发明实施例提供一种音频处理方法及装置，其中的方法具体包括：采集多声道的音频数据；对所述音频数据对应多声道中的单声道进行时延处理，以使所述多声道中不同单声道之间具有预设的时延；输出时延处理后的音频数据。本发明实施例能够通过时延处理产生仿真的立体声场，从而使用户感受到环绕的立体声的效果。
【专利说明】
一种音频处理方法及装置
技术领域
[0001]本发明实施例涉及信息处理技术领域，尤其涉及一种音频处理方法及装置。
【背景技术】
[0002]智能电视作为多媒体设备，具有视觉、听觉、体感等多种感官综合感受的特点。智能电视的音效，作为交互反馈的重要组成部分，越来越受到重视；因为高品质音源本身的立体声效果配合播放设备，将给使用者带来全新的视听体验。
[0003]现有方案中，往往通过单声道或者普通双声道来实现智能电视的音效。
[0004]然而，上述通过单声道或者普通双声道实现的音效，由于未能充分利用普通双声道的立体声效果，因此，容易产生死板生硬的音效，该死板生硬的音效容易使听觉感受缺乏空间感和包围感，从而使用户产生听觉疲劳。

【发明内容】

[0005]本发明实施例提供一种音频处理方法及装置，用以解决现有技术容易使听觉感受缺乏空间感和包围感、导致使用户产生听觉疲劳的缺陷，能够通过时延处理产生仿真的立体声场，从而使用户感受到环绕的立体声的效果。
[0006]本发明实施例提供一种音频处理方法，包括:
[0007]采集多声道的音频数据；
[0008]对所述音频数据对应多声道中的单声道进行时延处理，以使所述多声道中不同单声道之间具有预设的时延；
[0009]输出时延处理后的音频数据。
[0010]本发明实施例提供一种音频处理装置，包括:
[0011]采集模块，用于采集多声道的音频数据；
[0012]时延处理模块，用于对所述音频数据对应多声道中的单声道进行时延处理，以使所述多声道中不同单声道之间具有预设的时延；及
[0013]输出模块，用于输出时延处理后的音频数据。
[0014]本发明实施例提供的音频处理方法及装置，对音频数据对应多声道中的单声道进行时延处理，以使所述多声道中不同单声道之间具有预设的时延；由于对于双耳听力正常的用户，当其双耳聆听延时的音频数据时，人耳会将该音频数据识别成环绕的立体声效果，因此，本发明实施例的时延处理能够产生仿真的立体声场，从而能够使用户感受到环绕的立体声的效果。
【附图说明】
[0015]为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0016]图1示出了本发明的一种音频处理方法实施例一的步骤流程图；
[0017]图2示出了本发明的一种音频处理方法实施例二的步骤流程图；
[0018]图3示出了本发明的一种音频处理方法实施例三的步骤流程图；及
[0019]图4示出了本发明的一种音频处理装置实施例的结构框图。
【具体实施方式】
[0020]为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0021]实施例一
[0022]参照图1，示出了本发明的一种音频处理方法实施例一的步骤流程图，具体可以包括:
[0023]步骤101、采集多声道的音频数据；
[0024]步骤102、对所述音频数据对应多声道中的单声道进行时延处理，以使所述多声道中不同单声道之间具有预设的时延；
[0025]步骤103、输出时延处理后的音频数据。
[0026]本发明实施例对音频数据对应多声道中的单声道进行时延处理，以使所述多声道中不同单声道之间具有预设的时延；由于对于双耳听力正常的用户，当其双耳聆听延时的音频数据时，人耳会将该音频数据识别成环绕的立体声(以下简称环绕声)效果，因此，本发明实施例的时延处理能够产生仿真的立体声场，从而能够使用户感受到环绕声的效果，从而可以避免用户产生听觉疲劳。
[0027]本发明实施例可以应用于手机、平板电脑、车载设备、智能电视等对音效反馈存在情景需求的电子设备，用于将时延处理后的音频数据输出至上述电子设备，以使上述电子设备的操作系统或应用程序调取并播放所述音频数据，从而使用户感受到环绕音的声音效果O
[0028]本发明实施例主要以智能电视为例进行说明，其他电子设备的声音反馈相互参照即可。
[0029]在智能电视没有外接多个音箱的情况下，智能电视的音频输出设备使用了 SoundBar (声频干扰条)，Sound Bar两个音箱的间隔达到了相当的距离，故能够获得较好的立体声效果；这样，可以将本发明实施例处理并输出的音频数据，在简单的双声道设备中回放出来，因此，能够在节省成本和空间的前提下，使用户感受到环绕声的效果。
[0030]例如，在用户使用遥控器、体感、空鼠等与智能电视交互时，智能电视的音频输出设备可以发出不同的声音反馈，传达出智能电视状态变化的响应。上述声音反馈包括但不限于:开机欢迎音、关机音、焦点移动、焦点连续移动、按下、悬停、返回、无效按键、网络异常、系统消息提醒、摄像头拍照、摄像头录像、语音识别开始音、语音识别结束音、外接硬件连接成功音、外接硬件设备断开连接音等。
[0031 ] 在实际应用中，可以采用自然采样、合成器音源和滤波器等各种工具制作、重现适合电子设备的应用场景的时延处理后的音频数据。其中，自然采样工具可用于对音源或者音频文件进行采样；合成器音源用于提供键盘音色；滤波器用于对采集的音频数据进行滤波处理。
[0032]单声道是指单个的声道，如左声道、中置声道或右声道等。在本发明的一种可选实施例中，可以从所述多声道的音频数据中提取单声道的音频数据，以对所述音频数据对应多声道中的单声道进行时延处理。可以理解，本发明实施例对于获取单声道的音频数据不加以限制。
[0033]本发明实施例中，所述多声道中不同单声道之间具有预设的时延。通常，上述时延过短，则容易产生混响的效果；上述时延过长，则容易造成音频数据过长而不实用。可以理解，本领域技术人员可以根据实际应用需求，确定与环绕声的效果相匹配的时延，例如，上述时延可以是通过反复试验得到的值，本发明实施例对于上述时延的具体值不加以限制。
[0034]在本发明的一种可选实施例中，所述对所述音频数据对应多声道中的单声道进行时延处理的步骤，具体可以包括:对所述多声道中的部分单声道进行时延处理，以使所述多通道中不同单声道之间具有预设的时延。上述对所述多声道中的部分单声道进行时延处理，具有运算速度快的优点。
[0035]在本发明的一种应用示例I中，假设上述多声道为:声道1、声道2、声道3、…、声道N，其中，N大于等于2，则可以对上述多声道中的N-1个声道进行时延处理。例如，可以不对声道I进行时延处理，而是基于声道I对声道2?声道N进行时延处理，例如，声道2?声道N相对于声道I的时延可以分别为…、tn:，其中，m…、tn:均可以为正数，且其值可以各不相同。又如，可以基于声道i对声道i+Ι进行时延处理，例如，声道i+Ι相对于声道i的时延可以大于0，其中，i大于等于I。
[0036]本发明实施例可以提供如下对所述多声道中的部分单声道进行时延处理的技术方案:
[0037]技术方案一
[0038]技术方案一中，所述多声道可以为双声道，则所述对所述多声道中的部分单声道进行时延处理的步骤，具体可以包括:对所述双声道中的左声道或者右声道进行时延处理，以使所述双声道中左声道和右声道之间具有预设的时延。
[0039]在本发明的一种应用示例2中，可以在步骤101输出的音频数据基础上，对右声道进行时延处理，使其开始时间晚于左声道，时延约为0.095秒，该音频数据的全长为1.623秒。
[0040]技术方案二
[0041]技术方案二中，所述多声道可以为三声道，则所述对所述多声道中的部分单声道进行时延处理的步骤，具体可以包括:对所述三声道中两个单声道进行时延处理，以使所述三声道中左声道、中置通道和右声道之间具有预设的时延。
[0042]在本发明的另一种应用示例3中，可以在步骤101输出的音频数据基础上，对中置信道和右声道进行时延处理，使其开始时间晚于左声道。
[0043]可以理解，上述对所述多声道中的部分单声道进行时延处理只是作为可选实施例，而不理解为本发明实施例对于对所述音频数据对应多声道中的单声道进行时延处理的应用限制，实际上，本领域技术人员还可以根据实际应用需求，采用对所述音频数据对应多声道中的单声道进行时延处理的其他技术方案，例如，可以对所述多声道中的全部单声道进行时延处理，以使所述多通道中不同单声道之间具有预设的时延，本发明实施例对于对所述音频数据对应多声道中的单声道进行时延处理的具体技术方案不加以限制。
[0044]实施例二
[0045]参照图2，示出了本发明的一种音频处理方法实施例二的步骤流程图，具体可以包括:
[0046]步骤201、采集多声道的音频数据；
[0047]步骤202、对所述音频数据对应多声道中的单声道进行时延处理，以使所述多声道中不同单声道之间具有预设的时延；
[0048]步骤203、将时延处理后的音频数据输出至操作系统或应用程序，以使所述操作系统或应用程序调取并播放所述音频数据。
[0049]相对于实施例一，本实施例对输出时延处理后的音频数据的过程限定为，将时延处理后的音频数据输出至操作系统或应用程序，以使所述操作系统或应用程序调取并播放所述音频数据。
[0050]对于操作系统，可以通过播放所述音频数据来实现操作系统的音效反馈，如开机音、关机音、按键音等。
[0051]对于应用程序，可以通过播放所述音频数据来实现应用程序的音效反馈，如游戏程序在游戏过程中的音效反馈、输入法程序在文字输入过程中的音效反馈等。
[0052]在实际应用中，可以依据时延处理后的音频数据生成对应的音频文件，并将上述音频文件输出至操作系统或应用程序。上述音频文件的格式具体可以包括:MP3(动态影像专家压缩标准音频层面 3，Moving Picture Experts Group Aud1 Layer III)、WAV (Windows Wave), Ogg(OGGVobis)等；其中，Ogg是一种新的音频压缩格式，其具有完全免费、开放和没有专利限制的特点，Ogg文件的扩展名是".0gg", Ogg文件可以不断地进行大小和音质的改良，而不影响旧有的编码器或播放器。可以理解，本发明实施例对于上述音频文件的具体格式不加以限制。
[0053]在本发明的一种可选实施例中，为方便试听，可依据时延处理后的音频数据生成MP3文件，但最终交稿时可以生成Ogg文件并采用CD音质以保证品质。
[0054]实施例三
[0055]参照图3，示出了本发明的一种音频处理方法实施例二的步骤流程图，具体可以包括:
[0056]步骤301、采集多声道的音频数据；
[0057]步骤302、对所述音频数据对应多声道中的单声道进行时延处理，以使所述多声道中不同单声道之间具有预设的时延；
[0058]步骤303、输出时延处理后的音频数据；
[0059]相对于实施例一，本实施例中所述采集多声道的音频数据的步骤301，具体可以包括:
[0060]步骤311、采集音源的声音；
[0061]步骤312、依据预设的音频数据格式，将所采集的声音形成音频数据。
[0062]在实际应用中，所述音源具体可以包括:键盘、乐器、自然声音、环境声音和人声中的至少一种。其中，乐器对应的音乐具体可以包括:管乐、弦乐、打击乐等；由于键盘音色具有可控制音高时长的特点，故相对于其他音源，键盘音色更适合音频数据的制作。可以理解，本领域技术人员可以根据实际应用需求，采用相匹配的音源，本发明实施例对于具体的音源不加以限制。
[0063]在本发明的一种应用示例中，上述采集音源的声音的过程具体可以为:对音源的声音进行录音，并在录音过程中实时对模拟音频信号进行采样，得到数字音频信号。可以理解，本发明实施例对于采集音源的声音的过程不加以限制。
[0064]在本发明的一种可选实施例中，所述音频数据格式具体可以包括:音频采样率、声道属性、音频位宽和音频帧长中的至少一种。其中，音频采样率是指对模拟音频信号进行采样获得数字音频信号的频率；声道属性包括声道数以及声道类型，声道类型比如左声道或者右声道或者中置声道等；音频帧长表示一个音频帧内采样的样本数据的个数。
[0065]综上，本实施例可以使得本领域技术人员根据实际应用需求。采集得到符合应用需求的音频数据，例如，音频数据的音质满足应用需求，或者，音频数据简短(I秒以内)，或者，音频数据醒耳(20Hz至20kHz，特别是6.1kHz左右，音域建议在c2 - c3寻找合适的音尚)和具有悦耳的首色等。
[0066]可以理解，上述将所采集的声音形成音频数据只是作为可选实施例，实际上，本发明实施例也可以从已有的音频文件中提取所需的音频数据，本发明实施例对于采集多声道的音频数据的具体过程不加以限制。
[0067]应用示例
[0068]为使本领域技术人员更好地理解本发明实施例，在此提供本发明的一种音频处理方法示例，该示例具体可以包括如下步骤:
[0069]步骤S1、采用宿主软件通过Midi (乐器数字接口，Musical Instrument DigitalInterface)键盘进行立体声录音；
[0070]这里，宿主软件用于表示编辑音频文件的编辑器，如protools, cubase, soner等；由于这些软件大多需要安装各类插件，所以可被称为宿主软件。例如，可以在宿主软件上安装VST (虚拟录音室技术，Virtual Stud1 Technology)插件，该VST插件可以在支持AS1(音频流输入输出接口，Aud1 Stream Input Output)驱动的硬件平台下能够以较低的延迟提供非常高品质的效果处理。
[0071]步骤S2、采用无压缩格式WAV对所录制的立体声进行混音，并输出音频文件，上述音频文件具体包括两个声道；
[0072]步骤S3、将上述音频文件导入音频工具；
[0073]步骤S4、采用音频工具对上述音频文件的两个音轨同时或分别进行编辑；
[0074]在本发明的一种应用示例中，上述编辑的过程可以为:在前期VST乐器插件演奏输出的音频文件的基础上，对右声道进行时延处理，使其开始时间晚于左声道，时延约为0.095秒，该音频文件的全长为1.623秒。
[0075]步骤S5、将时延处理后的音频文件输出至操作系统或应用程序，以使所述操作系统或应用程序调取并播放所述音频数据。
[0076]例如，在智能电视的操作系统收到邮件时，可以调取并播放上述邮件对应的音频文件，由于上述邮件对应的音频文件进行了时延处理，故可以使播放的声音更立体，效果更加逼真，从而可以避免用户产生听觉疲劳。
[0077]装置实施例
[0078]参照图4，示出了本发明的一种音频处理装置实施例的结构框图，具体可以包括:
[0079]采集模块401，用于采集多声道的音频数据；
[0080]时延处理模块402，用于对所述音频数据对应多声道中的单声道进行时延处理，以使所述多声道中不同单声道之间具有预设的时延；及
[0081]输出模块403，用于输出时延处理后的音频数据。
[0082]在本发明的一种可选实施例中，所述时延处理模块402，具体可以包括:
[0083]处理子模块，用于对所述多声道中的部分单声道进行时延处理，以使所述多通道中不同单声道之间具有预设的时延。
[0084]在本发明的另一种可选实施例中，所述多声道可以为双声道，则所述处理子模块，具体可以包括:
[0085]第一处理单元，用于对所述双声道中的左声道或者右声道进行时延处理，以使所述双声道中左声道和右声道之间具有预设的时延。
[0086]在本发明的再一种可选实施例中，所述多声道可以为双声道，则所述处理子模块，具体可以包括:
[0087]第二处理单元，用于对所述三声道中两个单声道进行时延处理，以使所述三声道中左声道、中置通道和右声道之间具有预设的时延。
[0088]在本发明的又一种可选实施例中，所述输出模块403，具体可以包括:
[0089]输出子模块，用于将时延处理后的音频数据输出至操作系统或应用程序，以使所述操作系统或应用程序调取并播放所述音频数据。
[0090]在本发明的一种可选实施例中，所述采集模块401，具体可以包括:
[0091]采集子模块，用于采集音源的声音；及
[0092]生产子模块，用于依据预设的音频数据格式，将所采集的声音形成音频数据。
[0093]在本发明的另一种可选实施例中，所述音源具体可以包括:键盘、乐器、自然声音、环境声音和人声中的至少一种。
[0094]在本发明的再一种可选实施例中，所述音频数据格式具体可以包括:音频采样率、声道属性、音频位宽和音频帧长中的至少一种。
[0095]以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。
[0096]通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如R0M/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0097] 最后应说明的是:以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
【主权项】
1.一种音频处理方法，其特征在于，包括: 采集多声道的音频数据；对所述音频数据对应多声道中的单声道进行时延处理，以使所述多声道中不同单声道之间具有预设的时延；输出时延处理后的音频数据。2.根据权利要求1所述的方法，其特征在于，所述对所述音频数据对应多声道中的单声道进行时延处理的步骤，包括: 对所述多声道中的部分单声道进行时延处理，以使所述多通道中不同单声道之间具有预设的时延。3.根据权利要求2所述的方法，其特征在于，所述多声道为双声道，则所述对所述多声道中的部分单声道进行时延处理的步骤，包括: 对所述双声道中的左声道或者右声道进行时延处理，以使所述双声道中左声道和右声道之间具有预设的时延。4.根据权利要求2所述的方法，其特征在于，所述多声道为三声道，则所述对所述多声道中的部分单声道进行时延处理的步骤，包括: 对所述三声道中两个单声道进行时延处理，以使所述三声道中左声道、中置通道和右声道之间具有预设的时延。5.根据权利要求1所述的方法，其特征在于，所述输出时延处理后的音频数据的步骤，包括: 将时延处理后的音频数据输出至操作系统或应用程序，以使所述操作系统或应用程序调取并播放所述音频数据。6.根据权利要求1所述的方法，其特征在于，所述采集多声道的音频数据的步骤，包括: 采集音源的声音；依据预设的音频数据格式，将所采集的声音形成音频数据。7.根据权利要求6所述的方法，其特征在于，所述音源包括:键盘、乐器、自然声音、环境声音和人声中的至少一种。8.根据权利要求6所述的方法，其特征在于，所述音频数据格式包括:音频采样率、声道属性、音频位宽和音频帧长中的至少一种。9.一种音频处理装置，其特征在于，包括: 采集模块，用于采集多声道的音频数据；时延处理模块，用于对所述音频数据对应多声道中的单声道进行时延处理，以使所述多声道中不同单声道之间具有预设的时延；及输出模块，用于输出时延处理后的音频数据。10.根据权利要求9所述的装置，其特征在于，所述时延处理模块，包括: 处理子模块，用于对所述多声道中的部分单声道进行时延处理，以使所述多通道中不同单声道之间具有预设的时延。11.根据权利要求10所述的装置，其特征在于，所述多声道为双声道，则所述处理子模块，包括: 第一处理单元，用于对所述双声道中的左声道或者右声道进行时延处理，以使所述双声道中左声道和右声道之间具有预设的时延。12.根据权利要求10所述的装置，其特征在于，所述多声道为三声道，则所述处理子模块，包括: 第二处理单元，用于对所述三声道中两个单声道进行时延处理，以使所述三声道中左声道、中置通道和右声道之间具有预设的时延。
【文档编号】H04S5/00GK105979468SQ201510888040
【公开日】2016年9月28日
【申请日】2015年12月4日
【发明人】杨玲玲
【申请人】乐视致新电子科技（天津）有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨玲玲;
技术所有人：乐视致新电子科技（天津）有限公司;
我是此专利的发明人

上一篇：一种录音处理方法及终端的制作方法
上一篇：在高通平台中集成多种音频信号后处理算法的方法和装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。