一种视频声道处理装置及方法

文档序号:7554853阅读:149来源:国知局
专利名称:一种视频声道处理装置及方法
技术领域
本发明涉及一种多媒体视频文件中的声道处理装置及方法,尤其涉及一种对多媒体视频文件中的单声道进行多声道转换的处理装置和方法。
背景技术
:
对于视频文件,立体声双声道的播放效果比单声道的效果要好,但在媒体文件中占用的空间将增大,在追求播放效果的情况下,如何简单快速地将单声道(一般为左声道)转换为双声道信号,是很多用户的需求。针对上述问题,中国专利申请N0.201210217416.X公开了一种将单声道转换成双声道的方法。在该方法中,其通过将模拟音频信号转换为数字信号,然后将上述数字信号由一个输入声道输出至第一输出声道,并且将上述数字信号进行缓存后再经第二输出声道输出,以此实现将单声道转换成双声道。然而,在该中国专利申请N0.201210217416.X所公开的方法中,由于需要将上述数字信号进行缓存,这会导致左右声道不同步的问题,而且该方法实现起来也是比较复杂。另外,如将一个单声道视频与一个双声道视频合并为一个视频文件时,如果直接将单声道音频转为多声道音频,原单声道音轨被保留为多声道的多个音轨中的一个,多声道的其他音轨被设置为空白。这样,在经过这样的合并处理后,获得的音视频文件虽然从格式上看已经是多声道音视频,但在原来单声道的片段中仍然只有一个音轨是发声的。当音视频播放时,原来单声道的 片段播放出来的效果仍然是单声道的,也就是说只有一个喇叭发声。用户的听音感受因此受到很大影响,尤其是在原来的多声道片段与单声道片段的拼合处,由多个喇叭制造的声场突然变成单个喇叭发声会产生很大的反差。发明内容:
为了解决上述技术问题,本发明提供了一种声道处理装置,包括:解封装装置,用于对音视频文件进行解封装,从而将所述音视频文件解析为相应的音频帧序列和视频帧序列;音频数据解码装置,用于对所述音频帧序列进行解码,并将所述音频帧序列中的音频帧还原为PCM格式的音频数据;声道数转换装置,用于将单声道的PCM格式的音频数据转换成双声道的PCM格式的音频数据;编码装置,通过对所述双声道的PCM格式的音频数据进行编码,获得经重新编码后的音频帧序列;封装装置,用于对所述视频帧序列和所述经重新编码后的首频巾贞序列进行封装。
优选地,所述声道数转换装置对所述单声道的PCM格式的音频数据按一定的字节长度为单元进行复制,从而获得所述双声道的PCM格式的音频数据。优选地,所述声道数转换装置对所述单声道的PCM格式的音频数据按2B字节长度为单元进行复制。优选地,所述编码装置采用与解码前的音频帧序列的编码格式相同的编码格式对所述双声道的PCM格式的音频数据进行编码;所述封装装置采用与解封装前的音视频文件的封装格式相同的封装格式对所述视频帧序列和所述经重新编码后的音频帧序列进行封装。
优选地,所述编码装置采用用户指定的编码格式对所述双声道的PCM格式的音频数据进行编码;所述封装装置采用用户指定的封装格式对所述视频帧序列和所述经重新编码后的音频帧序列进行封装。优选地,所述声道处理装置还包括用于存储数据的存储装置。优选地,所述解封装装置具有音视频文件格式判断单元、解封装选择单元和数个不同格式的解封装单元;其中,所述音视频文件格式判断单元用于对所要解封装的所述音视频文件的格式进行判断;所述解封装选择单元根据所述音视频文件格式判断单元对所述音视频文件的格式的判断结果选择相应格式的所述解封装单元;所述解封装单元用于将相应格式的音视频文件解析为所述音频帧序列和所述视频帧序列。优选地,所述音频数据解码装置具有编码格式判断单元、解码器选择单元和数个不同格式的解码器;其中,所述编码格式判断单元,用于判断所述音频帧序列的编码格式;所述解码器选择单元,基于所述编码格式的判断结果,选择相对应的所述解码器对所述音频帧序列进行解码;所述解码器,用于将具有相应的编码格式的所述音频帧序列中的音频帧还原为PCM格式的音频数据。优选地,所述编码装置具有编码器选择单元和数个不同格式的编码器;其中,所述编码器选择单元,根据所述存储装置存储的有关编码格式的数据选择具有相应的编码格式的所述编码器;所述编码器,用所述相应的编码格式对所述双声道的PCM格式的音频数据进行编码,获得所述经重新编码后的音频帧序列。优选地,所述封装装置包括封装格式选择单元和数个不同格式的封装单元;其中,所述封装格式选择单元,基于所述存储装置存储的有关封装格式的数据选择具有相应封装格式的所述封装单元;所述封装单元,用所述相应封装格式对所述视频帧序列和所述经重新编码后的音频帧序列进行封装。本发明还提供一·种声道处理方法,包括:解封装步骤,对音视频文件进行解封装,从而将所述音视频文件解析为相应的音频帧序列和视频帧序列;音频数据解码步骤,对所述音频帧序列进行解码,并将所述音频帧序列中的音频帧还原为PCM格式的音频数据;声道数转换步骤,将单声道的PCM格式的音频数据转换成双声道的PCM格式的音频数据;编码步骤,通过对所述双声道的PCM格式的音频数据进行编码,获得经重新编码后的音频帧序列;封装步骤,对所述视频帧序列和所述经重新编码后的音频帧序列进行封装。
优选地,在所述声道数转换步骤中,通过对所述单声道的PCM格式的音频数据按一定的字节长度为单元进行复制,从而获得所述双声道的PCM格式的音频数据。优选地,在所述声道数转换步骤,通过对所述单声道的PCM格式的音频数据按2B字节长度为单元进行复制。优选地,在所述编码步骤中,采用与解码前的音频帧序列的编码格式相同的编码格式对所述双声道的PCM格式的音频数据进行编码;在所述封装步骤中,采用与解封装前的音视频文件的封装格式相同的封装格式对所述视频帧序列和所述经重新编码后的音频帧序列进行封装。优选地,在所述编码步骤中,采用用户指定的编码格式对所述双声道的PCM格式的音频数据进行编码;在所述封装步骤中,采用用户指定的封装格式对所述视频帧序列和所述经重新编码后的音频帧序列进行封装。
优选地,所述解封装步骤包括:对所要解封装的所述音视频文件的格式进行判断的步骤;根据所述音视频文件的格式的判断结果选择相应格式的解封装单元的步骤;将相应格式的音视频文件解析为所述音频帧序列和所述视频帧序列的步骤。优选地,所述音频数据解码步骤包括:判断所述音频帧序列的编码格式的步骤;基于所述编码格式的判断结果,选择相对应的解码器对所述音频帧序列进行解码的步骤;将具有相应的编码格式的所述音频帧序列中的音频帧还原为PCM格式的音频数据的步骤。优选地,所述编码步骤包括:根据存储装置存储的有关编码格式的数据选择具有相应的编码格式的编码器的步骤;用所述相应的编码格式对双声道的PCM格式的音频数据进行编码,获得所述经重新编码后的音频帧序列的步骤。优选地,所述封装步骤包括:基于所述存储装置存储的有关封装格式的数据选择具有相应封装格式的封装单元的步骤;用所述相应封装格式对所述视频帧序列和所述经重新编码后的音频帧序列进行封装的步骤。本发明的上述技术方案能够解决不增大媒体文件中占用空间的同时将单声道视频文件转换成双声道视频文 件的问题。同时,本发明的技术方案简化了对声道数转换的操作,并能大批量地进行这种声道数转换处理,从而能够提高了对声道处理的效率和降低了相应的处理成本。


:
图1为本发明实施方式涉及的声道转换的处理装置的结构框 图2为本发明实施方式涉及的声道转换的处理装置的解封装模块的结构框 图3为本发明实施方式涉及的声道转换的处理装置的音频数据解码模块的结构框图; 图4为本发明实施方式涉及的声道转换的处理装置的编码模块的结构框 图5为本发明实施方式涉及的声道转换的处理装置的封装模块的结构框 图6为本发明实施方式涉及的声道转换的处理流程 图7为本发明实施方式涉及的步骤S12的流程 图8为本发明实施方式涉及的步骤S13的流程 图9为本发明实施方式涉及的步骤S14的流程 图1OA为本发明实施方式涉及的在进行声道处理之前的PCM数据包结构示意 图1OB为本发明实施方式涉及的在进行声道处理之后的PCM数据包结构示意 图11本发明实施方式涉及的步骤S15的流程 图12为本发明实施方式涉及的步骤S16的流程图。
具体实施方式
:
下面根据附图所示实施方式阐述本项发明。本发明实施方式所涉及的视频音量定制调节系统在对不同文件格式的多个音视频文件进行合并时可以根据用户的要求对各个音视频文件的音量进行调整。图1显示了本发明实施方式涉及的声道转换处理装置的结构框图。如图1所示,上述视频音量调节系统包括音视频数据接收模块1、解封装模块2、音频数据解码模块3、编码模块4、封装模块5、存储模块6、声道转换模块7和数据总线8。上述音视频数据接收模块1、解封装模块2、音频数据解码模块3、编码模块4、封装模块5、存储模块6和声道转换模块7通过上述数据总线8进行连接。
上述音视频数据接收模块I用于接收需要进行合并的具有不同文件格式的音视频数据(例如分别采用AV1、WMV, RM、RMVB, MOV、TS/PS、MKV等格式的音视频文件),并将所接收的上述音视频数据输送至上述解封装模块2进行相应的解封装。上述解封装模块2从上述音视频数据接收模块I接收到上述音视频数据后,根据所收到的上述音视频数据的相应文件格式进行解封装。在上述解封装过程中,上述解封装模块2将音视频文件解释为相应的视频巾贞序列和首频巾贞序列。然后,上述解封装1旲块2将解封装后获得的上述视频巾贞序列和上述音视频文件封装格式的相关参数存储在上述存储模块6中,将上述音频帧序列输送至上述音频数据解码模块3进行相应的解码。上述音频数据解码模块3从上述解封装模块2接收到上述音频帧序列后,根据所收到的音频帧序列的相应编码格式进行解码。在上述解码过程中,上述音频数据解码模块3对上述音频帧序列进行解码,将上述音频帧序列中的音频帧还原为PCM格式的音频数据,并将上述PCM格式的音频数据和上述音频帧序列编码格式相关的参数存储在上述存储模块6中,直至完成对所有的音频帧序列的解码。上述声道转换模块7从上述存储模块6中获取所存储的PCM格式的音频数据,并对音频采样点数据按一定的字节长度(一般为2个字节)为单元进行复制,从而获得新的PCM格式的音频数据,并将新的PCM格式的音频数据存储在上述存储模块6中。上述编码模块4从上述存储模块6获取上述新的PCM格式的音频数据和上述音频帧序列编码格式相关的参数,并根据上述音频帧序列编码格式相关的参数选择相应的编码器对上述新的PCM格式的音频数据进行编码、压缩,形成新的音频帧序列并存储在存储模块6中。上述封装模块5从上述存储1旲块6中获取上述首视频文件封装格式的相关参数、上述视频巾贞序列和新的首频巾贞序列,然后根据上述音视频文件封装格式的相关参数将上述视频帧序列和上述新的音频帧序列封装成新的音视频文件。
·
图2为本发明实施方式涉及的声道转换处理装置的解封装模块2的结构框图。如图2所示,上述解封装模块2包括音视频文件格式判断单元21、解封装选择单元22和数个解封装单元23、24、25……。其中,上述数个解封装单元23、24、25……具有不同的格式,可以对应于不同的文件格式进行解封装。上述音视频文件格式判断单元21可以判断来自上述音视频数据接收模块I所接收的音视频的文件格式并获取上述音视频的文件格式的相关参数,并将上述音视频的文件格式的相关参数存储到上述存储模块6中,上述解封装选择单元22可以根据上述音视频文件格式判断单元21的判断结果(即音视频文件的格式)从解封装单元23、24、25……中选择相应的解封装单元对上述音视频文件进行解封装,上述相
应的解封装单元(即上述解封装单元23、24、25......中之一)将所接收到的上述音视频文件
解封为相应的视频帧序列和音频帧序列,并将上述视频帧序列和音频帧序列存储在上述存储模块6中。例如,当音视频文件的格式分别为AVI格式时,上述音视频文件格式判断单元21对所接收的音视频文件的格式进行判断,上述解封装选择单元22基于上述判断结果选择与AVI格式相对应的解封装单元(比如解封装单元23)进行解封装;如果上述音视频文件格式判断单元21判断所接收的音视频文件的格式为RM格式时,上述解封装选择单元22基于上述判断结果选择与RM格式相对应的解封装单元(比如解封装单元24)进行解封装;如果上述音视频文件格式判断单元21判断所接收的音视频文件的格式为WMV格式时,上述解封装选择单元22基于上述判断结果选择与WMV格式相对应的解封装单元(比如解封装单元
25)进行解封装。
图3为本发明实施方式涉及的声道转换处理装置的音频数据解码模块3的结构框图。如图3所示,上述音频数据解码模块3包括编码格式判断单元31、解码器选择单元32和数个的解码器33、34、35……。其中,上述数个的解码器33、34、35……可以对应于不同的解码要求进行解码。上述编码格式判断单元31可以判断来自上述解封装模块2所解封的音频帧序列的编码格式并获取所解封的音频帧序列的编码格式的相关参数,并将上述音频帧序列的编码格式的相关参数存储在上述存储模块6中。上述解码器选择单元32可以根据上述编码格式判断单元31的判断结果(即上述音频帧序列的编码格式)从解码器33、34、35……中选择相应的解码器对上述音视频文件进行解码,上述相应的解码器(即上述解码
器33、34、35......中之一)对所收到的上述音频帧序列进行解码,将上述音频帧序列中的音
频帧还原为PCM格式数据,上述PCM格式数据被暂存在存储模块6中。例如,如果上述编码格式判断单元31判断上述音频帧序列的编码格式为MP3编码格式时,上述解码器选择单元32选择与MP3编码格式相对应的解码器(比如解码器33)进行解码,将解码后的PCM格式数据暂存存储模块6中;如果上述编码格式判断单元31判断上述音频帧序列的编码格式为ACC编码格式时,上述解码器选择单元32选择与ACC编码格式相对应的解码器(比如解码器34)进行解码,将解码后的PCM格式数据暂存存储模块6中;如果上述编码格式判断单元31判断上述音频帧序列的编码格式为AC-3编码格式时,上述解码器选择单元32选择与AC-3编码格式相对应的解码器(比如解码器35)进行解码,将解码后的PCM格式数据暂存存储模块6中。图4为本发明实施方式涉及的声道转换处理装置的编码模块4的结构框图。如图4所示,上述编码模块4包括编码器选择单元41、数个编码器42、43、44……。上述编码器选择单元41可以从上述存储模块6中获取经上述声道转换模块7处理后的新的PCM格式数据以及其中存储的原音频帧序列的编码格式参数。上述编码器选择单元41根据上述原音频帧序列的编码格式参数选择相应 的编码器(即上述编码器42、43、44……中之一)对上述新的PCM格式数据进行重新编码,形成新的音频帧序列,并将新的音频帧序列存储在上述存储模块6中。图5为本发明实施方式涉及的声道转换处理装置的封装模块5的结构框图。如图5所示,上述封装模块5包括封装格式选择单元51和数个封装单元52、53、54……。其中,上述数个封装单元52、53、54……具有不同的封装格式,可以对应于不同的封装格式的要求进行封装。上述封装格式选择单元51从上述存储模块6中获取上述音视频文件封装格式的相关参数、上述视频帧序列、新的音频帧序列并根据上述音视频文件封装格式的相关参数选择相应的封装单元(即封装单元52、53、54……中之一)对上述视频帧序列和新的音频帧序列进行封装,获得调节后的音视频文件。在上述实施方式中,上述编码模块4和上述封装模块5还可以根据用户的需求来选择相应的编码格式和封装格式。图6为本发明实施方式涉及的声道转换处理的流程图。下面,参照图6说明在本实施方式涉及的声道转换处理的处理过程。首先,输入音视频文件,上述音视频数据接收模块I接收上述音视频文件数据并将其输送至上述解封装模块2(步骤SI I)。上述解封装模块2对上述音视频文件数据进行解封装,将上述音视频文件数据解析为视频帧序列和音频帧序列,并将上述视频帧序列和音频帧序列以及原音视频文件的封装格式的相关参数存储在上述存储模块6中(步骤S12)。上述音频数据解码模块3从上述存储模块6中获取上述音频帧序列,将上述音频帧序列中的音频帧还原为PCM格式数据,并将上述PCM格式数据和原音频帧序列的编码格式的相关参数存储到上述存储模块6中(步骤S13)。上述声道转换模块7从上述存储模块6中获取上述PCM格式数据,并对上述PCM格式数据进行声道数转换处理,从而获得新的PCM格式的音频数据,并将新的PCM格式的音频数据存储在上述存储模块6中(步骤S14)。具体地,对上述单声道的PCM格式数据的音频采样点数据按一定的字节长度为单元进行复制,从而获得双声道的PCM格式的音频数据(新的PCM格式的音频数据)。上述编码模块4从上述 存储模块6中获取上述双声道的PCM格式数据和原音频帧序列的编码格式的相关参数,并根据原音频帧序列的编码格式的相关参数对新的PCM格式数据进行编码,形成新的音频帧序列并存储到上述存储模块6中(步骤S15)。上述封装模块5从上述存储模块6中获取视频帧序列、新的音频帧序列和原音视频文件的封装格式的相关参数,并根据原音视频文件的封装格式的相关参数进行封装,形成新音视频文件(步骤S16)。图7为本发明实施方式涉及的声道转换处理的步骤S12的流程图。下面,参照图7说明在本实施方式涉及的音视频文件进行解封装处理过程。音频文件格式判断单元21基于所接收的音视频文件数据判断所接收的音视频文件的封装格式,将判断结果输送到解封装选择单元22 (步骤121),同时将原音视频文件的封装格式的相关参数存储到上述存储模块6中(步骤122)。上述解封装选择单元22基于上述判断结果选择相应的解封装单元(步骤123)。例如,上述音视频文件数据可以为AV1、WMV, RM、RMVB、MOV、TS/PS、MKV等封装格式,上述相应的解封装单元能够对上述相应的封装格式的音视频文件数据进行解封装。上述解封装单元(即解封装单元23、24、25……中之一)对上述音视频文件数据进行解封装,将上述音视频文件数据解析为视频帧序列和音频帧序列(步骤124),并将视频帧序列和音频帧序列存储到上述存储模块6中(步骤125)。图8为本发明实施方式涉及的声道转换处理的步骤S13的流程图。下面,参照图8说明在本实施方式涉及的对音频数据进行解码处理过程。编码格式判断单元31对解封装后的音频帧序列的编码格式(例如MP3、AAC、AC_3、MpegAudio等)进行判断,并将判断结果输送到解码器选择单元32 (步骤131),同时将音频帧序列的编码格式的相关参数存储到上述存储模块6中(步骤132)。上述解码器选择单元32基于上述判断结果选择与上述编码格式相应的解码器进行解码(步骤133),上述解码器
(即解码器33、34、35......中之一)将上述音频帧序列中的音频帧还原为PCM格式数据(步骤
134),并将上述PCM格式数据存储至存储模块6中(步骤135)。图9为本发明实施方式涉及的声道转换处理的步骤S14的流程图;图1OA为进行声道处理之前的PCM数据包结构示意图;图1OB为进行了声道处理之后的PCM数据包结构示意图。下面,参照图9、图1OA和图1OB说明在本实施方式涉及的对声道进行转换的处理过程。首先,上述声道转换模块7从上述存储模块6中获取上述PCM格式数据(步骤S140),并确定上述PCM格式数据是否为单声道的音频数据(步骤S141)。当上述PCM格式数据被确定为单声道的音频数据(例如图1OA所示)时(步骤S141:是),上述声道转换模块7将上述PCM格式数据的音频采样点数据按一定的字节长度为单元进行复制(步骤S142)。判断是否对所有的音频采样点数据复制完成(步骤S143),如果未完成对所有的音频采样点数据的复制(步骤S143:否),回到步骤S142进行继续复制,如果已完成对所有的音频采样点数据的复制(步骤S143:是),获得新的PCM格式的音频数据(即双声道的PCM格式的音频数据)(例如图1OB所示)(步骤S144),然后输出新的PCM格式的音频数据并将其存储到上述存储模块6中(步骤S145)。在步骤S141中,如果上述声道转换模块7确定上述PCM格式数据为双声道的音频数据时(步骤S141:否),则直接进入步骤S145输出PCM格式数据。在本实施方式中,上述声道转换模块7将PCM格式数据的音频采样点数据按2B字节长度为单元进行复制。例如,如图1OA所示的单声道的PCM数据包经上述声道转换模块7按2B字节长度为单元进行复制后变为如图1OB所示的双声道的PCM数据包(其中斜体的双字节表示前一个双字节的拷贝)。通过上述声道转换模块7按照每2字节为单元对单声道的PCM数据进行复制,音频的数字信号在经过数模转换后,将会驱动左右两个扬声器发出相同的声音,从而实现单声道到双声道的转换。图11为本发明实施方式涉及的声道转换处理后的PCM格式数据进行编码的步骤S15的流程图。下面,参照图11说明在本实施方式涉及的对声道转换处理后的PCM格式数据进行编码处理过程。编码器选择单元41从上述存储模块6中获取上述经声道转换处理后的PCM格式数据和上述原音频帧序列的编码格式的相关参数(步骤S151)。编码器选择单元41基于上述原音频帧序列的编码格式的相关参数选择相应的编码器(步骤S152)。上述被选定的编码器对上述经声道转换处理后的PCM格式数据进行编码,以获得新的音频帧序列(步骤S153),并将所获得的新的音频帧序列存储在存储模块6中(步骤S154)。图12为本发明 实施方式涉及的对视频帧序列和新的音频帧序列进行封装的步骤S16的流程图。下面,参照图11说明在本实施方式涉及的对视频帧序列和新的音频帧序列进行封装处理过程。上述封装格式选择单元51从上述存储模块6中获取视频帧序列、新的音频帧序列和原音视频文件的封装格式的相关参数(步骤S161)。上述封装格式选择单元51基于原音视频文件的封装格式的相关参数选择与原音视频文件的封装格式相应的封装单元(步骤S162),上述封装单元对上述视频帧序列和上述新的音频帧序列进行重新封装,形成具有与原音视频文件的封装格式相同的新的音视频文件(步骤S163),并输出新的音视频文件(步骤 S164)。在本实施方式中,在步骤15中采用与原音频帧序列的编码格式相同的编码格式对经声道转换处理后的PCM格式数据进行编码。但本发明并不限于此,在步骤15中也可以采用用户指定的编码格式对经声道转换处理后的PCM格式数据进行编码。在本实施方式中,在步骤16中采用与原音视频文件的封装格式相同的封装格式对视频帧序列和新的音频帧序列进行封装。但本发明并不限于此,在步骤15中也可以采用用户指定的封装格式对视频帧序列和新的音频帧序列进行封装。应理解以上说明书中所描述的具体实施方式
和实施例仅用于说明本发明而不用于限制本发明的范围。在阅读了本发明之后,本领域技术人员对本发明的各种等同形式的修改均落于本申请所附 权利要求所限定的范围。
权利要求
1.一种视频声道处理装置,包括: 解封装装置,用于对音视频文件进行解封装,从而将所述音视频文件解析为相应的音频帧序列和视频帧序列; 音频数据解码装置,用于对所述音频帧序列进行解码,并将所述音频帧序列中的音频帧还原为PCM格式的音频数据; 声道数转换装置,用于将单声道的PCM格式的音频数据转换成双声道的PCM格式的音频数据; 编码装置,通过对所述双声道的PCM格式的音频数据进行编码,获得经重新编码后的音频帧序列; 封装装置,用于对所述视频帧序列和所述经重新编码后的音频帧序列进行封装。
2.根据权利要求1所述的声道处理装置,其特征在于: 所述声道数转换装置对所述单声道的PCM格式的音频数据按一定的字节长度为单元进行复制,从而获得所述双声道的PCM格式的音频数据。
3.根据权利要求2所述的声道处理装置,其特征在于: 所述声道数转换装置对所述单声道的PCM格式的音频数据按2B字节长度为单元进行复制。
4.根据权利要求3所述的声道处理装置,其特征在于: 所述编码装置采用与解码前的音频帧序列的编码格式相同的编码格式对所述双声道的PCM格式的音频数据进行编码; 所述封装装置采用与解封装前的音视频文件的封装格式相同的封装格式对所述视频帧序列和所述经重新编码后的音频帧序列进行封装。
5.根据权利要求3所述的声道处理装置,其特征在于: 所述编码装置采用用户指定的编码格式对所述双声道的PCM格式的音频数据进行编码; 所述封装装置采用用户指定的封装格式对所述视频帧序列和所述经重新编码后的音频帧序列进行封装。
6.根据权利要求1 5任一所述的声道处理装置,还包括: 用于存储数据的存储装置。
7.根据权利要求6所述的声道处理装置,其特征在于: 所述解封装装置具有音视频文件格式判断单元、解封装选择单元和数个不同格式的解封装单元;其中, 所述音视频文件格式判断单元用于对所要解封装的所述音视频文件的格式进行判断; 所述解封装选择单元根据所述音视频文件格式判断单元对所述音视频文件的格式的判断结果选择相应格式的所述解封装单元; 所述解封装单元用于将相应格式的音视频文件解析为所述音频帧序列和所述视频帧序列。
8.根据权利要求7所述的声道处理装置,其特征在于: 所述音频数据解码装置具有编码格式判断单元、解码器选择单元和数个不同格式的解码器;其中, 所述编码格式判断单元,用于判断所述音频帧序列的编码格式; 所述解码器选择单元,基于所述编码格式的判断结果,选择相对应的所述解码器对所述音频帧序列进行解码; 所述解码器,用于将具有相应的编码格式的所述音频帧序列中的音频帧还原为PCM格式的音频数据。
9.根据权利要求8所述的声道处理装置,其特征在于: 所述编码装置具有编码器选择单元和数个不同格式的编码器;其中, 所述编码器选择单元,根据所述存储装置存储的有关编码格式的数据选择具有相应的编码格式的所述编码器; 所述编码器,用所述相应的编码格式对所述双声道的PCM格式的音频数据进行编码,获得所述经重新编码后的音频帧序列。
10.根据权利要求9所述的声道处理装置,其特征在于: 所述封装装置包括封装格式选择单元和数个不同格式的封装单元;其中, 所述封装格式选择单元,基于所述存储装置存储的有关封装格式的数据选择具有相应封装格式的所述封装单元; 所述封装单元,用所述相应封装格式对所述视频帧序列和所述经重新编码后的音频帧序列进行封装。
11.一种视频声道处理方法,包括: 解封装步骤,对音视频文件进行解封装,从而将所述音视频文件解析为相应的音频帧序列和视频帧序列; 音频数据解码步骤,对所述音频帧序列进行解码,并将所述音频帧序列中的音频帧还原为PCM格式的音频数据; 声道数转换步骤,将单声道的PCM格式的音频数据转换成双声道的PCM格式的音频数据; 编码步骤,通过对所述双声道的PCM格式的音频数据进行编码,获得经重新编码后的音频帧序列; 封装步骤,对所述视频帧序列和所述经重新编码后的音频帧序列进行封装。
12.根据权利要求11所述的声道处理方法,其特征在于: 在所述声道数转换步骤中,通过对所述单声道的PCM格式的音频数据按一定的字节长度为单元进行复制,从而获得所述双声道的PCM格式的音频数据。
13.根据权利要求12所述的声道处理方法,其特征在于: 在所述声道数转换步骤,通过对所述单声道的PCM格式的音频数据按2B字节长度为单元进行复制。
14.根据权利要求13所述的方法,其特征在于: 在所述编码步骤中,采用与解码前的音频帧序列的编码格式相同的编码格式对所述双声道的PCM格式的音频数据进行编码; 在所述封装步骤中,采用与解封装前的音视频文件的封装格式相同的封装格式对所述视频帧序列和所述经重新编码后的音频帧序列进行封装。
15.根据权利要求13所述的方法,其特征在于: 在所述编码步骤中,采用用户指定的编码格式对所述双声道的PCM格式的音频数据进行编码; 在所述封装步骤中,采用用户指定的封装格式对所述视频帧序列和所述经重新编码后的音频帧序列进行封装。
16.根据权利要求11 15任一所述的方法,其特征在于: 所述解封装步骤包括: 对所要解封装的所述音视频文件的格式进行判断的步骤; 根据所述音视频文件的格式的判断结果选择相应格式的解封装单元的步骤; 将相应格式的音视频文件解析为所述音频帧序列和所述视频帧序列的步骤。
17.根据权利要求16所述的方法,其特征在于: 所述音频数据解码步骤包括: 判断所述音频帧序列的编码格式的步骤; 基于所述编码格式的判断结果,选择相对应的解码器对所述音频帧序列进行解码的步骤; 将具有相应的编码格式的所述音频帧序列中的音频帧还原为PCM格式的音频数据的步骤。
18.根据权利要求17所述的方法,其特征在于: 所述编码步骤包括: 根据存储装置存储的有关编码格式的数据选择具有相应的编码格式的编码器的步骤; 用所述相应的编码格式对双声道的PCM格式的音频数据进行编码,获得所述经重新编码后的音频帧序列的步骤。
19.根据权利要求18所述的方法,其特征在于: 所述封装步骤包括: 基于所述存储装置存储的有关封装格式的数据选择具有相应封装格式的封装单元的步骤; 用所述相应封装格式对所述视频帧序列和所述经重新编码后的音频帧序列进行封装的步骤。
全文摘要
本发明提供一种视频声道处理装置,包括解封装装置,用于对音视频文件进行解封装,从而将所述音视频文件解析为相应的音频帧序列和视频帧序列;音频数据解码装置,用于对所述音频帧序列进行解码,并将所述音频帧序列中的音频帧还原为PCM格式的音频数据;声道数转换装置,用于将单声道的PCM格式的音频数据转换成双声道的PCM格式的音频数据;编码装置,通过对所述双声道的PCM格式的音频数据进行编码,获得经重新编码后的音频帧序列;封装装置,用于对所述视频帧序列和所述经重新编码后的音频帧序列进行封装。本发明还提供一种视频声道处理方法。
文档编号H04N21/439GK103237259SQ20131011902
公开日2013年8月7日 申请日期2013年4月8日 优先权日2013年3月29日
发明者武悦 申请人:天脉聚源(北京)传媒科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1