从单个容器输出多种语言的音频和关联音频的系统和方法

文档序号:9693692阅读:400来源:国知局
从单个容器输出多种语言的音频和关联音频的系统和方法
【专利说明】从单个容器输出多种语言的音频和关联音频的系统和方法
[0001]相关申请的交叉引用
[0002]本申请要求2013年4月30日提交的美国临时专利申请N0.61/817,471的优先权,其整体通过参考被并入于此。
技术领域
[0003]本发明涉及视听回放,特别应用于从计算机网络下载的内容。
【背景技术】
[0004]除非在此另有指明,本节中描述的方法并非对于本申请中的权利要求的现有技术并且没有由于包括在本节中而被承认为现有技术。
[0005]消费者越来越多通过下载或流式传输(streaming)来在线获得内容,而不是购买物理介质。提供内容的示例在线服务包括Netflix Watch Instantly ?服务、Apple iTunes?服务、以及Amazon Instant Video ?服务。虽然从最终用户视角来看流式传输和下载可能是类似的,但是技术差别是,下载的内容被存储在本地并且随后从本地存储器回放。从最终用户视角来看,其中在下载仍然在进行中的同时可以开始内容的回放的渐进式(progressive)下载进一步对与流式传输的相似度有贡献。

【发明内容】

[0006]由本发明实施例解决的问题涉及与内容有关的关联音频。关联音频可以是用于视觉受损的用户的音频描述轨道、导演评论轨道等。关联音频区别于主要音频,该主要音频是内容的主要音轨,包括对话轨道、音乐音轨和效果音轨。例如,AC3数字音频压缩标准限定两个主要的和六个关联的服务。主要音频服务是完整的主要(CM)以及音乐和效果(ME);关联服务是视觉受损(VI)、听力受损(HI)、对话(D)、评论(C)、紧急(E)以及画外音(VO)。
[0007]对于诸如数字视频盘(DVD)的物理介质,关联内容(诸如音频描述)可以被包括在物理介质上。然而,这种关联内容可以在与主要音频分离的容器中,以及在其中关联内容可以已经与较低质量(例如,立体声)版本的主要音频预先混合的容器中。
[0008]可替代地,对于DVD,关联内容可以不被设置在物理介质本身上,而是可以经由流式传输或下载在线获得。因此,当用户切换到另一个语言轨道时,DVD播放器设备必须协调用于如下两个组件的新设定:用于来自DVD的新的语言轨道的DVD读取器组件,以及用于对应的关联内容的网络组件(对于流式传输内容)或硬盘驱动组件(对于下载的内容)。除物理组件自身的协调之外,协调必须还考虑切换中涉及的各个软件层(设备驱动器、操作系统、DVD播放器设备控制程序等)。如果这种协调是不完善的,可能得到诸如爆裂声(pops)或毛刺(glitches)之类的听觉假象,对用户体验有负面影响。
[0009]当一个服务器提供主要音频而另一个服务器提供关联音频时,对于在线获得的内容,情形是类似的。对于流式传输内容,客户播放器设备必须将新的流式传输设定传递给服务器设备,其可能以起始于不同时间的它们的新的流响应。对于下载的内容,客户播放器设备必须协调用于本地存储设备的新的读取设定,其在本地存储设备从新的位置读取时可能引入听觉假象。
[0010]最终,可能有用户界面缺陷,其要求与改变用于主要内容的设定相分离地改变关联内容的设定。例如,用户将主要音频从英语切换到法语,但是关联内容继续是英语的,直到它被分离地改变。另一个用户界面缺陷涉及下载内容的管理。当与主要内容分离地提供关联内容时,用户必须管理从它们的分离的来源获得主要内容和关联内容。
[0011 ]响应于以上提到的缺点,本发明的一个实施例涉及播放来自单个媒体容器文件的主要内容和关联内容。单个容器有助于确保关联内容与主要内容的同步以及在添加关联内容的回放时的无缝转换。一个实施例还在切换主要内容(例如,以另一种语言输出)时自动地切换关联内容。通过使用单个媒体容器文件,与许多现有的系统相比,媒体播放器设备的听觉假象的发生减少。
[0012]根据一个实施例,一种方法输出多种语言的音频和关联音频。该方法包括存储多媒体容器。多媒体容器包括多个主要音频数据集和多个关联音频数据集。多个主要音频数据集和多个关联音频数据集具有多种语言。该方法还包括接收第一选择信息。第一选择信息对应于该多种语言中的第一所选语言。该方法还包括从多媒体容器输出第一音频数据流。第一音频数据流对应于该多个主要音频数据集中的具有第一所选语言的第一所选主要音频数据集。该方法还包括接收第二选择信息。第二选择信息与多个关联音频数据集有关。该方法还包括从多媒体容器输出第二音频数据流。第二音频数据流对应于该多个关联音频数据集中的具有第一所选语言的第一所选关联音频数据集。
[0013]该方法还包括接收第三选择信息。第三选择信息对应于该多种语言中的第二所选语言。该方法还包括从多媒体容器输出第三音频数据流代替第一音频数据流。第三音频数据流对应于该多个主要音频数据集中的具有第二所选语言的第二所选主要音频数据集。该方法还包括从多媒体容器自动地输出第四音频数据流代替第二音频数据流。第四音频数据流对应于该多个关联音频数据集中的具有第二所选语言的第二所选关联数据集。
[0014]—种装置输出多种语言的音频和关联音频。该装置包括处理器和存储设备。存储设备被配置为存储多媒体容器。处理器被配置为控制该装置执行与上面描述的方法对应的处理。
[0015]—种计算机程序控制用于输出多种语言的音频和关联音频的装置(包括处理器和存储设备)。计算机程序根据上面描述的方法控制该装置。计算机程序被存储在非暂时的计算机可读介质中。
[0016]以下详细描述和附图提供对本发明的性质和优点的进一步理解。
【附图说明】
[0017]图1是示出媒体播放器设备和有关的组件的图。
[0018]图2是示出由媒体播放器设备(参见图1)用来存储内容的容器的逻辑布置的图。
[0019]图3A是示出容器的物理布置的图。
[0020]图3B示出对于图3A中示出的视频数据、主要音频数据和关联音频数据的更多细
-K-■P。
[0021]图4是输出多种语言的音频和关联音频的方法的流程图。
[0022]图5是对于媒体播放器设备(参见图1)的控制程序的框图。
【具体实施方式】
[0023]在此描述用于媒体回放的技术。在下面的描述中,出于说明的目的,阐述了许多的示例和具体细节以便提供对本发明的彻底的了解。然而,本领域技术人员将明白,如由权利要求所限定的本发明可以单独或者与下面描述的其它特征结合地包括这些示例中的特征中的一些或全部,以及可以进一步包括在此描述的概念和特征的等同物和变型。
[0024]在下面的描述中,各种方法、处理和过程被详述。虽然可以以某一顺序描述特定步骤,但是这种顺序主要为了方便和清楚起见。特定步骤可以被重复多于一次,可以发生在其它步骤之前或之后(即使以另一种顺序描述了那些步骤),以及可以与其它步骤并行地发生。只有当第一步骤必须在第二步骤开始之前完成时,才要求第二步骤跟随第一步骤。当从上下文不清楚时这种情形将被具体地指出。
[0025]在本文档中,术语“和”、“或”和“和/或”被使用。这种术语要被读作具有相同的意思;也就是说,包括地。例如,“A和B”可以意指至少以下:“A和B两者”,“仅A”,“仅B”,“至少A和B两者”。作为另一个示例,“A或B”可以意指至少以下:“仅A”,“仅B”,“A和B两者”,“至少A和B两者”。当意图“互斥或”时,这将被具体地提出(例如,“或者A或者B”,“A和B中的至多一个”)。
[0026]概述和一般说明
[0027]图1是示出媒体播放器设备100和有关的组件的图,包括计算机网络102(例如,因特网)、音频/视频接收器(AVR) 104、电视机106(例如,高清1SOp电视机)以及一个或更多个扬声器108。图1的组件可以被部署在用户的家庭中作为家庭影院系统。
[0028]媒体播放器设备100—般如下与其它组件交互。媒体播放器设备100访问计算机网络102以用于获得内容或与内容有关的其它信息。媒体播放器设备100将内容作为视频和音频信号152输出到AVR 104。媒体播放器设备100与AVR 104之间的连接可以是高清晰度媒体接口(HDMI)连接。信号152中的音频数据可以具有脉冲编码调制(PCM)格式^VR 104在各种内容源(诸如媒体播放器设备100、DVD播放器设备、蓝光盘设备、紧致盘(CD)播放器设备、无线电接收机设备等)与各种输出设备(诸如电视机106和扬声器108)之间作为接口。AVR 104例如经由HDMI连接将视频流154发送到电视机106AVR 104将音频流156发送到扬声器108,以及执行用于扬声器108的一般的放大和驱动功能。
[0029]音频流156的组成将基于扬声器108的数量和配置而改变。例如,对于单个扬声器,音频流156可以是单个单音频声道。对于两个扬声器,音频流156可以是两个立体声音频声道。AVR 104可以将具有环绕声5.1格式的六个声道发送到六个扬声器(例如,左、中心、右、右环绕、左环绕以及亚低音扬声器(subwoofer)),或者将具有环绕声7.1格式的八个声道发送到八个扬声器。
[0030 ]媒体播放器设备100包括处理器、内存、网络连接以及存储系统。通常,存储系统存储媒体播放器设备100经由网络连接(例如从网络102)获得的内容。媒体播放器设备10
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1