一种流媒体语言信息匹配装置及方法

文档序号:7928978阅读:187来源:国知局
专利名称:一种流媒体语言信息匹配装置及方法
技术领域
本发明涉及流媒体领域,尤其涉及一种流媒体语言信息匹配装置及方法。
背景技术
目前的流媒体文件中主要包含视频数据流、音频数据流、字幕数据流和用于对流媒体所含内容进行描述的PMT (Program Map Table,节目映射表),PMT记载了流媒体文件中各个流的信息,例如视频的分辨率、帧率、流ID等参数,在播放流媒体文件时,通过对PMT 进行解码输出,通常可以显示出该流媒体文件有几条音频或者几条字幕可供选择,但是现有流媒体文件的PMT中并没有记载用于表明某条音频数据流或字幕数据流对应的是哪个国家语言的语言信息,因此在播放流媒体文件的时候,对PMT解码后无法显示出该流媒体文件中的音频或字幕分别代表哪种语言。而对于DVD或者BD (Blu-ray Disc,蓝光光盘) 来说,在DVD或者BD中存储有用于对当中的流媒体文件进行描述的导航信息文件,虽然该导航信息文件记载有对流媒体文件中每一条音频数据流、字幕数据流相应的语言信息,但是在导出来成流媒体文件时,例如复制该流媒体文件出来或者通过播放器播放该流媒体文件,通常仅会对该流媒体文件进行操作而不会导出导航信息文件,因此发生因缺少导航信息文件而造成语言信息丢失的情况。在实现本发明过程中,发明人发现现有技术至少存在如下问题由于流媒体文件中缺乏语言信息,因此进行流媒体播放时只能显示出有几条音频或者字幕可供选择,没有办法为用户提供更详细、人性化的选择,用户需要盲目地选择其中的音频或字幕后,才知道选中的音频或字幕是哪个国家的语言或文字,若发现不是用户需要的语言或文字,需要再选择其他的,直到选中为止。

发明内容
本发明所要解决的技术问题在于,提供一种能够使用户在播放流媒体文件时显示出该流媒体文件中各音频或字幕的语言信息的流媒体语言匹配装置及方法。为了解决上述技术问题,一方面,本发明的实施例提供了一种流媒体语言匹配装置,所述流媒体包含视频数据流、至少一条音频数据流和PMT,该装置包括语言信息获取单元,用于在播放所述流媒体之前获取该流媒体中各音频数据流的语言信息;语言信息合成单元,用于在所述PMT中为每一条音频数据流添加一个音频语言标识符,各所述音频语言标识符记载有与其一一对应的各音频数据流的语言信息;语言信息解码单元,用于在播放所述流媒体时解码所述PMT中的各音频语言标识符以获得各音频数据流的语言信息,并输出解码出的所述语言信息。所述流媒体还包含至少一条字幕数据流,所述语言信息获取单元还用于在播放所述流媒体之前获取流媒体中各字幕数据流的语言信息;所述语言信息合成单元还用于在所述PMT中为每一条字幕数据流添加一个字幕语言标识符,各所述字幕语言标识符记载有与其一一对应的各字幕数据流的语言信息;所述语言信息解码单元还用于在播放所述流媒体时解码所述PMT中的各字幕语言标识符以获得各字幕数据流的语言信息,并输出解码出的所述语言信息。所述流媒体为DVD或BD中导出的媒体文件,所述语言信息获取单元通过DVD或BD 中的导航信息文件提取出所述媒体文件中音频数据流或字幕数据流的语言信息。所述音频语言标识符和/或字幕语言标识符包括用于识别标识符种类的语言标识符ID和用于存放语言信息的语言编码。所述语言编码采用IS0639编码标准。所述语言编码定义为4个字节的编码长度。另一方面,本发明的实施例提供了一种流媒体语言信息匹配方法,所述流媒体包含视频数据流、至少一条音频数据流和PMT,所述方法包括S201 在播放所述流媒体之前获取流媒体中各音频数据流的语言信息;S202 在所述PMT中为每一条音频数据流添加一个音频语言标识符,各所述音频语言标识符记载有与其一一对应的各音频数据流的语言信息;S203 在播放所述流媒体时解码所述PMT中的各音频语言标识符以获得各音频数据流的语言信息,并输出解码出的所述语言信息。所述流媒体还包含至少一条字幕数据流,在所述步骤S201中,进一步获取流媒体中各字幕数据流的语言信息;在所述步骤S202中,进一步在所述PMT中为每一条字幕数据流添加一个字幕语言标识符,各所述字幕语言标识符记载有与其一一对应的各字幕数据流的语言信息;在所述步骤S203中,进一步解码所述PMT中的各字幕语言标识符以获得各字幕数据流的语言信息,并输出解码出的所述语言信息。所述流媒体为DVD或BD中导出的媒体文件,在所述步骤S202中,通过DVD或BD 中的导航信息文件将所述媒体文件中音频数据流或字幕数据流的语言信息提取出来。所述音频语言标识符和/或字幕语言标识符包括用于存放语言信息的语言编码和用于识别标识符种类的语言标识符ID。采用本发明提供的一种流媒体语言信息匹配装置及方法的技术方案,由于语言信息合成单元在流媒体文件的PMT中为每一条音频数据流添加了一条音频语言标识符,且各条音频语言标识符记载有与其一一对应的各音频数据流的语言信息,因此在播放流媒体文件时,当需要在不同音频之间进行选择的时候,语言信息解码单元可将PMT中包含语言信息的各音频语言标识符解码并显示出来供用户选择。本发明通过在播放流媒体文件之前改变其PMT的内容用以对流媒体文件进行修正,以及在播放时通过对修正后的流媒体文件解码输出以获得语言信息,克服了现有技术中流媒体文件在播放时不能显示各条音频数据流的语言信息的技术问题,达到了为流媒体文件的播放提供更详细、人性化选择的技术效果。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本发明一种流媒体语言信息匹配装置的一种实施例的结构示意图; 图2是本发明一种流媒体语言信息匹配方法的一种实施例的流程图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。下面参考附图对本发明的实施例进行描述。应当说明的是,本文中提到的语言信息均指的是用于表明某条音频或字幕对应的是哪个国家的语言的信息。参见图1,为本发明中一种流媒体语言信息匹配装置一种实施例的结构示意图。其中,流媒体包含视频数据流、 至少一条音频数据流和PMT。本实施方式下,该装置包括用于在播放流媒体之前获取流媒体中各音频数据流的语言信息的语言信息获取单元1,用于在上述PMT中为每一条音频数据流添加一个音频语言标识符的语言信息合成单元2,以及用于在播放上述流媒体时解码所述PMT中的各音频语言标识符以获得各音频数据流的语言信息,并输出解码出的语言信息的语言信息解码单元3。其中,上述各音频语言标识符记载有与其一一对应的各音频数据流的语言信息。进一步的,本发明中所提到的流媒体还可包含至少一条字幕数据流,因此,在本发明提供的一种流媒体语言信息匹配装置的另一种实施方式下,语言信息获取单元1还用于在播放流媒体之前获取该流媒体中各字幕数据流的语言信息,语言信息合成单元2还用于在PMT中为每一条字幕数据流添加一个包含有各上述字幕数据流语言信息的字幕语言标识符,语言信息解码单元3还用于在播放流媒体时解码上述PMT中的各字幕语言标识符以获得各字幕数据流的语言信息,并输出解码出的语言信息。其中,上述各字幕语言标识符记载有与其一一对应的各字幕数据流的语言信息。根据标准IS013818的第一部分,流媒体中的PMT用来登记流媒体文件中各个流的信息,比如视频的分辨率,帧率,流ID等参数。这些参数都是以标识符的形式存放的,所以本发明提供的一种流媒体语言信息匹配装置通过为每一条音频数据流或字幕数据流增加一个语言标识符,用以存放该条流对应的语言信息。本发明提供的一种流媒体语言信息匹配装置,流媒体可以为DVD或BD中导出的媒体文件,也可以为非DVD或BD中导出的普通流媒体文件。本实施方式下,流媒体指DVD或 BD中导出的媒体文件,语言信息获取单元1通过DVD或BD中的导航信息文件将单个媒体文件的语言信息提取出来,并通过语言信息合成单元2将获得的语言信息添加至PMT中。在本发明的另一种实施方式下,当流媒体指的是非DVD或BD中导出的媒体文件时,由于缺少包含媒体文件信息的导航信息文件,因此语言信息获取单元1也可以通过对MPEG文件直接进行播放查看获取语言信息,即用户对MPEG文件直接进行播放时,选中某条音频数据流和 /或某条字幕数据流,来查看该语言信息是属于什么语种,从而获取到语言信息,然后通过语言信息合成单元2来添加对应的音频语言标识符和/或字幕语言标识符。本实施方式下,上述音频语言标识符和/或字幕语言标识符包括用于存放语言信息的语言编码和用于识别标识符种类的语言标识符ID。为了符合语言标识的标准化,我们可以用IS0639的编码方式来表示流所对应的语言信息。为了编程操做方便,我们定义4个字节来存放IS0639编码信息,这样编程的时候就可以使用一个长整形来存放语言编码信息。比如一条英语音频,IS0639的编码为“eng”,使用4字节的标识符来描述就是0x67, 0x6E,0x65,0x00。其它语言的标识符与此类此。需要说明的是,由于IS013818第一部分已经对各标识符的ID分配作出了规定,所以我们自己添加的关于语言的描述符ID只能从64 到255之间选一个,以免和目前常用的其它描述符ID冲突。图2为本发明中一种流媒体语言信息匹配方法一种实施例的流程图。流媒体包含视频数据流、至少一条音频数据流和PMT,该方法包括
5201在播放流媒体之前获取流媒体中各音频数据流的语言信息;
5202在PMT中为每一条音频数据流添加一个音频语言标识符,上述各音频语言标识符记载有与其一一对应的各音频数据流的语言信息;
5203在播放上述流媒体时解码所述PMT中的各音频语言标识符以获得各音频数据流的语言信息,并输出解码出的所述语言信息。进一步的,上述流媒体还可包含至少一条字幕数据流,因此,在本发明提供的一种流媒体语言信息匹配方法的另一种实施方式下,在步骤S201中,进一步获取流媒体中各字幕数据流的语言信息,在步骤S202中,进一步在PMT中添加包含有各字幕数据流语言信息的字幕语言标识符,各字幕语言标识符记载有与其一一对应的各字幕数据流的语言信息; 在步骤S203中,解码上述PMT中的各字幕语言标识符以进一步获得各字幕数据流的语言信息,并输出解码出的语言信息。根据标准IS013818的第一部分,流媒体中的PMT用来登记流媒体文件中各个流的信息。比如视频的分辨率,帧率,流ID等参数。这些参数都是以标识符的形式存放的。所以我们可以通过为每一条音频流、字幕流增加一个语言标识符,用以存放该条流对应的语
曰fn息ο本发明提供的一种流媒体语言信息匹配方法,流媒体可以为DVD或BD中导出的媒体文件,也可以为非DVD或BD中导出的普通流媒体文件。本实施方式下,所述流媒体指DVD 或BD中导出的媒体文件,在步骤S202中,通过DVD或BD中的导航信息文件将媒体文件中各音频数据流或各字幕数据流的语言信息提取出来。在本发明的另一种实施方式下,当流媒体指的是非DVD或BD中导出的媒体文件时,由于缺少包含媒体文件信息的导航信息文件,因此也可以通过对MPEG文件直接进行播放查看获取语言信息,即用户对MPEG文件直接进行播放时,选中某条音频数据流和/或某条字幕数据流,来查看该语言信息是属于什么语种,从而获取到语言信息,然后在PMT中添加对应的音频语言标识符和/或字幕语言标识符。本实施方式下,上述音频语言标识符和/或字幕语言标识符包括用于存放语言信息的语言编码和用于识别标识符种类的语言标识符ID。为了符合语言标识的标准化,我们可以用IS0639的编码方式来表示流所对应的语言信息。为了编程操做方便,我们定义4个字节来存放IS0639编码信息,这样编程的时候就可以使用一个长整形来存放语言编码信息。比如一条英语音频,IS0639的编码为“eng”,使用4字节的标识符来描述就是0x67, 0x6E,0x65,0x00。其它语言的标识符与此类此。需要说明的是,由于IS013818第一部分已经对各标识符的ID分配作出了规定,所以我们自己添加的关于语言的描述符ID只能从64 到255之间选一个,以免和目前常用的其它描述符ID冲突。根据本发明提供的一种流媒体语言信息匹配装置及方法的一种实施方式,由于语
7言信息合成单元2在流媒体文件的PMT中为每一条音频数据流添加了包含有各音频数据流语言信息的音频语言标识符,因此在播放流媒体文件时,当需要在不同音频之间进行选择的时候,语言信息解码单元3可将PMT中包含语言信息的各音频语言标识符解码并显示出来供用户选择。本发明实施例具有如下优点或有益效果通过在播放流媒体文件之前改变其PMT的内容用以对流媒体文件进行修正,以及在播放时通过对修正后的流媒体文件解码输出以获得语言信息,克服了现有技术中流媒体文件在播放时不能显示各条音频数据流的语言信息的技术问题。同时本发明所提供的另一实施例还进一步解决了不能显示各条字幕数据流的语言信息的技术问题,达到了为流媒体文件的播放提供更详细、人性化选择的技术效果。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。以上所述的实施方式,并不构成对该技术方案保护范围的限定。任何在上述实施方式的精神和原则之内所作的修改、等同替换和改进等,均应包含在该技术方案的保护范围之内。
权利要求
1.一种流媒体语言信息匹配装置,其特征在于,所述流媒体包含视频数据流、至少一条音频数据流和PMT,该装置包括语言信息获取单元,用于在播放所述流媒体之前获取该流媒体中各音频数据流的语言 fn息;语言信息合成单元,用于在所述PMT中为每一条音频数据流添加一个音频语言标识符,各所述音频语言标识符记载有与其一一对应的各音频数据流的语言信息;语言信息解码单元,用于在播放所述流媒体时解码所述PMT中的各音频语言标识符以获得各音频数据流的语言信息,并输出解码出的所述语言信息。
2.如权利要求1所述的流媒体语言信息匹配装置,其特征在于,所述流媒体还包含至少一条字幕数据流,所述语言信息获取单元还用于在播放所述流媒体之前获取流媒体中各字幕数据流的语言信息;所述语言信息合成单元还用于在所述PMT中为每一条字幕数据流添加一个字幕语言标识符,各所述字幕语言标识符记载有与其一一对应的各字幕数据流的语言信息;所述语言信息解码单元还用于在播放所述流媒体时解码所述PMT中的各字幕语言标识符以获得各字幕数据流的语言信息,并输出解码出的所述语言信息。
3.如权利要求1或2所述的流媒体语言信息匹配装置,其特征在于,所述流媒体为DVD 或BD中导出的媒体文件,所述语言信息获取单元通过DVD或BD中的导航信息文件提取出所述媒体文件中音频数据流或字幕数据流的语言信息。
4.如权利要求2所述的流媒体语言信息匹配装置,其特征在于,所述音频语言标识符和/或字幕语言标识符包括用于识别标识符种类的语言标识符ID和用于存放语言信息的语言编码。
5.如权利要求4所述的流媒体语言信息匹配装置,其特征在于,所述语言编码采用 IS0639编码标准。
6.如权利要求5所述的流媒体语言信息匹配装置,其特征在于,所述语言编码定义为 4个字节的编码长度。
7.一种流媒体语言信息匹配方法,其特征在于,所述流媒体包含视频数据流、至少一条音频数据流和PMT,所述方法包括5201在播放所述流媒体之前获取流媒体中各音频数据流的语言信息;5202在所述PMT中为每一条音频数据流添加一个音频语言标识符,各所述音频语言标识符记载有与其一一对应的各音频数据流的语言信息;5203在播放所述流媒体时解码所述PMT中的各音频语言标识符以获得各音频数据流的语言信息,并输出解码出的所述语言信息。
8.如权利要求7所述的流媒体语言信息匹配方法,其特征在于,所述流媒体还包含至少一条字幕数据流,在所述步骤S201中,进一步获取流媒体中各字幕数据流的语言信息;在所述步骤S202中,进一步在所述PMT中为每一条字幕数据流添加一个字幕语言标识符,各所述字幕语言标识符记载有与其一一对应的各字幕数据流的语言信息;在所述步骤S203中,进一步解码所述PMT中的各字幕语言标识符以获得各字幕数据流的语言信息,并输出解码出的所述语言信息。
9.如权利要求7或8所述的流媒体语言信息匹配方法,其特征在于,所述流媒体为DVD 或BD中导出的媒体文件,在所述步骤S202中,通过DVD或BD中的导航信息文件将所述媒体文件中音频数据流或字幕数据流的语言信息提取出来。
10.如权利要求8所述的流媒体语言信息匹配装置,其特征在于,所述音频语言标识符和/或字幕语言标识符包括用于存放语言信息的语言编码和用于识别标识符种类的语言标识符ID。
全文摘要
本发明公开了一种流媒体语言信息匹配装置,包括用于获取流媒体中各音频数据流的语言信息的语言信息获取单元,用于在PMT(ProgramMapTable,节目映射表)中为每一条音频数据流添加一个音频语言标识符的语言信息合成单元,以及用于解码上述PMT中的各音频语言标识符以获得各音频数据流的语言信息,并输出解码出的语言信息的语言信息解码单元。本发明还公开了一种流媒体语言信息匹配方法。采用本发明,在播放流媒体文件时,当需要对各条音频数据流进行选择的时候,语言信息解码单元可将PMT中包含的语言信息解码并显示出来,为流媒体文件的播放提供更详细、人性化的选择。
文档编号H04N21/435GK102333242SQ20111029906
公开日2012年1月25日 申请日期2011年9月29日 优先权日2011年9月29日
发明者蔡超林 申请人:深圳市万兴软件有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1