从单个容器输出多种语言的音频和关联音频的系统和方法_3

文档序号:9693692阅读:来源:国知局
要音频数据集中的具有第二所选语言的第二所选主要音频数据集。例如,如果用户在412中选择德语,主要音频切换到德语。
[0055]在416处,从多媒体容器自动地输出第四音频数据流来代替第二音频数据流。第四音频数据流对应于关联音频数据集中的具有第二所选语言的第二所选关联数据集。注意,切换是“自动的”,因为用户不需要作为额外动作地重新启用音频描述(408中已做)或者为音频描述选择新的语言。例如,如果用户在412中选择德语,则音频描述自动地也切换到德语。
[0056]参照回图3B,由于关联音频部分与主要音频部分交错,当用户改变语言选择(参见412)时,因为这些部分是物理邻近的,所以对于对话轨道和音频描述轨道两者的语言得到平滑的切换。另外,由于主要音频数据和关联音频数据在单个容器(参见图2)中,因此在发生语言切换时对于两者涉及相同的软件和硬件层(如通过媒体播放器控制程序管理的),进一步对平滑的切换有贡献。
[0057]媒体播放器细节
[0058]本节提供关于媒体播放器设备100(参见图1)的额外细节。
[0059]图5是对于媒体播放器设备100(参见图1)的控制程序500(也被称为媒体播放器应用程序、媒体播放器或者简单地“应用程序”)的框图。控制程序500控制媒体播放器设备100操作作为全功能的启用Dolby Digital Plus的媒体播放器。如上面所讨论的(参见图1),控制程序500可以由与7.1声道AVR和1080p TV显示器连接的Mac Mini计算机(例如,型号标识符:Macmini5,1)执行。应用程序可以被写入以便在OS X 10.8.x(Mountain L1n)上进行操作。该应用程序可以是64位应用程序。
[0060]应用程序500包括解多路复用器(demuxer)组件502、用户界面组件504、视频解码器506、音频解码器508以及HDMI发送器组件510。解多路复用器组件502读取容器200中的视频和音频数据并且如用户界面组件504所指引地解多路复用各个音频流。解多路复用器组件502将所选的音频流提供给音频解码器508,并且将视频流提供给视频解码器组件506。
[0061]用户界面组件504接收各种用户选择,诸如用于选择可用的容器中的一个的文件选择、用于选择对话轨道的轨道选择器、音频描述是否被启用、以及导演的评论是否被启用。用户界面组件504还实现用户选择的其它播放器功能(诸如播放、暂停、拖放等),并且将对应控制信号发送给其它组件。
[0062]视频解码器组件506读取容器200中的视频数据,对视频数据进行解码,并且将解码后的视频数据提供给HDMI发送器组件510。
[0063]音频解码器组件508可以是DD+音频解码器,并且包括解码器520和混合器522。解码器520可以是DD+双声道解码器。解码器520接收所选的主要数据轨道和所选的关联数据轨道,并且将它们解码成脉冲编码调制(PCM)数据和混合元数据。混合器522从解码器520接收PCM数据和混合元数据,根据混合元数据来混合PCM数据,并且将混合后的音频数据提供给HDMI发送器组件510。
[0064]HDMI发送器组件510接收解码后的视频数据和混合后的音频数据,并且将这个数据封装作为HDMI输出信号以从媒体播放器设备100输出。
[0065]应用程序控制媒体播放器设备100操作作为具有以下基本回放能力的全功能音频/视频播放器:播放、暂停和定位器(scrubber)(拖放功能)。媒体播放器支持解码DD+音频(5.1和7.1声道)。应用程序经由HDMI输出(在连接多声道的AVR时)输出多声道的PCM音频。
[0066]媒体播放器解析源容器(例如,MP4文件)并且识别各个主要轨道和它们的语言以及各个关联音频轨道。媒体播放器支持可用的主要音频轨道之间的切换。媒体播放器支持两个DD+音频轨道(例如,5.1/7.1中的主要音频以及单声道中的关联音频)的双解码。在双解码的情况下,媒体播放器混合主要音频和关联音频以便创建混合的音频(例如,5.1或者7.1,取决于主要音频)。
[0067]当对于名称存在多个音频描述轨道(例如,对于主要音频音轨中的每种语言存在匹配的音频描述轨道)时,应用程序深入地自动地挑选合适的音频描述轨道,即应该自动地挑选具有与当前有效的(播放的)主要音频音轨相同的媒体语言标签的音频描述轨道。如果只存在一个音频描述轨道,则应用程序不管主要音频的语言如何都启用这个音频描述轨道(根据用户选择)。
[0068]应用程序支持内容类型如下。一种支持的类型是具有仅一个音频描述轨道(尽管对于主要音频有多种语言)的内容。另一种支持的类型是具有匹配的数量的音频描述轨道和主要音频轨道以及匹配的语言(即对于每种主要音频语言,存在该相同语言的对应音频描述轨道)的内容。在任一种情况下,还可以存在导演的评论轨道;上面描述的内容支持特别涉及音频描述轨道的数量,不涉及次要音频轨道的数量。
[0069]应用程序能够识别容器中的每个音频轨道的语言(例如通过依赖媒体语言元数据标签)。应用程序能够在“音频描述”关联音频轨道之间以及“导演评论”关联音频轨道之间、还以及其它类型的关联音频内容之间识别。例如,元数据可以包括应用程序用来识别关联音频内容的类型的与DD+轨道格式有关的标签,诸如“bsmod”标签。
[0070]媒体播放器确保混合的音频输出没有修剪或者过载。
[0071]应用程序能够将源内容下混合至5.1声道输出或者至立体声输出。应用程序能够认识到下游AVR仅与5.1声道扬声器系统连接并且能够将任何7.1声道音频内容下混合至
5.1。应用程序能够认识到仅立体声输出可用,并且能够将任何5.1声道或者7.1声道音频内容下混合至立体声。
[0072]音频解码器508默认在具有0%比例因子(即最大动态范围)的线路模式(Linemode)动态范围控制(DRC)中操作。应用程序能够切换到射频(RF)模式DRC或者便携模式DRC0
[0073]应用程序响应于来自以下源的输入事件:鼠标移动和点击,键盘映射,以及红外信号(例如,诸如Apple Remote?设备之类的遥控)。可替代地,当通过移动设备实现应用程序时,应用程序响应于触摸输入。
[0074]应用程序在起动时自动地支持显示器分辨率(以便匹配显示设备(例如,经由HDMI连接的TV)的固有分辨率)。应用程序在刚起动时以全屏启动并且以全屏操作;可替代地应用程序可以在窗口中启动和操作。在起动时,应用程序缩放视频回放以便匹配屏幕使得整个视频被显示以及使得视频的高宽比被保持。不要求在运行时刻动态地适应显示器的分辨率的变化。
[0075]在回放期间,当到达内容的末尾时,应用程序自动地返回到内容选择屏幕。
[0076]当鼠标光标被保持在屏幕顶部处多于Is时应用程序显示OSX系统菜单栏;在该情况下,应用程序将能通过点击:DD+电影〉退出DD+电影而终止。
[0077]不需要用于应用程序的安装程序,然而期望的是应用程序的安装要求将关联资源放置在文件系统上的特定位置中(与资源被捆在应用程序包内部相反)。
[0078]应用程序一直对用户交互进行响应。导航应用程序用户界面UI(例如在可用的电影之间循环,或者导航回放菜单)是平滑并且流畅的,而不是迟钝的。用户界面控制的状态(例如,高亮对比非高亮)被立即更新(例如,小于200ms)以反映用户动作,而没有滞后。
[0079]即使在多次切换音频轨道或者多次启用和禁用关联音频轨道之后,音频与视频也一直保持同步。
[0080]选择新的语言轨道快速且没有爆裂声或毛刺地从当前音频轨道切换到新的音频轨道。当切换到新的语言轨道时,对新的轨道的音频回放立即或在小于I秒钟内恢复。如果切换到新的音频轨道需要多于200毫秒,则视频流暂停直到它能够与音频一起恢复,使得音频内容不被丢失。
[0081 ]选择关联音频轨道自动地在该轨道中与主要音频混合,而没有爆裂声和毛刺。当启用或禁用关联音频轨道时,启用这个轨道、回放混合的音频的操作立即或在至多I秒钟之后恢复。
[0082]以平滑和流畅的方式动画化用户界面控制条的逐渐淡入和淡出。在可应用的情况下,用户界面还使用优美的动画用于屏幕转变,例如在上下循环通过可用的电影时,在从内容选择屏幕转变到回放屏幕并且反之亦然时(水平滑动动画),以及在显示或隐藏UI控制条中的上拉菜单时(向上滑动/向下滑动动画)。
[0083]在左右移动拖放柄(handle)的同时,视频显示器定期地更新,例如示出视频中的1-帧,使得用户具有剪辑的哪一部分对应于拖放的视觉反馈。
[0084]用户界面细节
[0085]应用程序的用户界面可以处于各种状态。这些状态包括启动时的初始屏幕(状态I)和回放屏幕(状态2)。
[0086]状态1:启动时的初始屏幕
[0087]当应用程序启动时,第一视图呈现可用于观看的电影资源,与关于电影的相关技术信息一起,特别地是音频内容。在任何给定时间在屏幕上仅呈现一个电影名称,以便使屏幕占地面积(real estate)最大化,但是相邻的电影名称海报在当前可见的电影海报上方和/或下方稍微可见(暗淡)。用户能够用鼠标指针点击那些在当前名称上方或下方的变暗淡的电影海报以便浏览电影。除了鼠标之外,用户还能够如下地从各个电影名称中进行选择:通过按压键盘上的向上或向下箭头键,或者通过按压遥控器上的向上或向下按扭。
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1