包括置信度水平和混合内容信息的补充增强信息的制作方法_2

文档序号:8344952阅读:来源:国知局
[0023] 可W在计算机可执行指令的一般情境中描述所述创新,比如被包括在程序模块 中、在目标真实或虚拟处理器上的计算系统中执行的那些计算机可执行指令。一般来说,程 序模块包括实施特定任务或实施特定抽象数据类型的例程、程序、库、对象、类、组件、数据 结构等等。在各种实施例中,可W按照希望在程序模块之间组合或分离所述程序模块的功 能。用于程序模块的计算机可执行指令可W在本地或分布式计算系统内执行。
[0024] 术语"系统"和"设备"在该里可W互换使用。除非上下文明确地另有所指,否则 术语不表示关于计算系统或计算设备的类型的任何限制。一般来说,计算系统或计算设备 可W是本地的或分布式的,并且可W包括专用硬件和/或通用硬件与实施该里所描述的功 能的软件的任意组合。
[0025] 还可W利用被配置成实施任何所公开的方法的专用计算硬件来实施所公开的方 法。举例来说,所公开的方法可W通过特别被设计或配置成实施任何所公开的方法的集成 电路(例如专用集成电路("ASIC")(比如ASIC数字信号处理单元("DSP")、图形处理单元 ("GPU"),或者可编程逻辑器件("PLD"),比如现场可编程口阵列("FPGA"))来实施。
[0026] 出于说明的目的,本【具体实施方式】使用像"确定"和"使用"之类的术语来描述计 算系统中的计算机操作。该些术语是对于由计算机实施的操作的高层级抽象,并且不应当 与由人类实施的动作混淆。对应于该些术语的实际计算机操作依实现方式而变化。
[0027] II、示例网络环境 图2a和化示出了包括视频编码器(220)和视频解码器(270)的示例网络环境(201, 202)。编码器(220)和解码器(270)利用适当的通信协议通过网络(250)连接。网络(250) 可W包括因特网或者另一计算机网络。
[002引在图2a中所示的网络环境(201)中,每一个实时通信("RTC")工具(210)包括编 码器(220)和解码器(270)二者W用于双向通信。给定的编码器(220)可W产生遵循SMPTE 421M标准、ISO-IEC 14496-10标准(其也已知为H. 264或AVC)、肥VC标准、另一种标准或者 独占格式的输出,其中对应的解码器(270)接受来自编码器(220)的已编码数据。所述双向 通信可W是视频会议、视频电话呼叫或者其他双方通信情形的一部分。虽然图2a中的网络 环境(201)包括两个实时通信工具(210),但是网络环境(201)可W替换地包括参与多方通 信的S个或更多实时通信工具(210)。
[0029] 实时通信工具(210)管理编码器(220)的编码。图3示出了可W被包括在实时通 信工具(210)中的示例编码器系统(300)。可替换地,实时通信工具(210)使用另一编码器 系统。实时通信工具(210)还管理解码器(270)的解码。图4示出了可W被包括在实时通 信工具(210)中的示例解码器系统(400)。可替换地,实时通信工具(210)使用另一解码器 系统。
[0030] 在图化中所示的网络环境(202)中,编码工具(212)包括编码器(220),编码器 (220)对视频进行编码W用于递送到包括解码器(270)的多个回放工具(214)。对于视频 监控系统、web照相机监视系统、远程桌面会议呈现或者其中对视频进行编码并且从一个 位置发送到一个或更多其他位置的其他情形,可W提供单向通信。虽然图化中的网络环 境(202)包括两个回放工具(214),但是网络环境(202)可W包括更多或更少的回放工具 (214)。一般来说,回放工具(214)与编码工具(212)进行通信,W便确定供回放工具(214) 接收的视频流。回放工具(214)接收所述流,将所接收到的已编码数据缓冲适当的一段时 间,并且开始解码和回放。
[0031] 图3示出了可W被包括在编码工具(212)中的示例编码器系统(300)。可替换地, 编码工具(212)使用另一编码器系统。编码工具(212)还可W包括用于管理与一个或更多 回放工具(214)的连接的服务器侧控制器逻辑。图4示出了可W被包括在回放工具(214) 中的示例解码器系统(400)。可替换地,回放工具(214)使用另一解码器系统。回放工具 (214)还可W包括用于管理与编码工具(212)的连接的客户端侧控制器逻辑。
[0032] III、不例编码器系统 图3是可W结合一些所描述的实施例来实施的示例编码器系统(300)的方框图。编码 器系统(300)可W是能够在多种编码模式(比如用于实时通信的低等待时间编码模式、转码 模式W及用于来自文件或流的媒体回放的常规编码模式)当中的任一种编码模式下操作的 通用编码工具,或者其可W是针对一种该样的编码模式进行适配的专用编码工具。编码器 系统(300)可W被实施成操作系统模块、应用库的一部分和/或独立的应用。总体来说,编 码器系统(300)从视频源(310)接收源视频帖(311)序列,并且产生已编码数据作为去到信 道(390)的输出。输出到信道的已编码数据可W包括补充增强信息("SEI")消息,该补充增 强信息消息包括在第V节中描述的语法元素和/或标志。
[0033] 视频源(310)可W是照相机、调谐器卡、存储介质或者其他数字视频源。视频源 (310) W例如30帖每秒的帖率产生视频帖序列。如该里所使用的,术语"帖"通常指代源、 已编码或重建的图像数据。对于逐行视频,帖是逐行视频帖。对于隔行视频,在示例实施例 中,在编码之前对隔行视频帖进行去隔行。可替换地,对于隔行视频,两个互补隔行视频场 (complementary interlaced video field)被编码成隔行视频帖或者单独的场。除了表明 逐行视频帖之外,术语"帖"还可W表明单个未配对视频场、互补视频场对、代表在给定时间 的视频对象的视频对象平面或者更大图像中的感兴趣区段。所述视频对象平面或区段可W 是包括一个场景的多个对象或区段的更大图像的一部分。
[0034] 到来的源帖(311)被存储在包括多个帖缓冲器存储区域(321、322.....32/?)的源 帖临时存储器存储区域(320)中。帖缓冲器(321、322等等)在源帖存储区域(320)中持有 一个源帖。在所述源帖(311)中的一个或更多被存储在帖缓冲器(321、322等等)中之后, 帖选择器(330)周期性地从源帖存储区域(320)选择独立的源帖。帖选择器(330)据W选 择帖W便输入到编码器(340)的顺序可W不同于视频源(310)据W产生帖的顺序,例如帖 的顺序可W提前,W促进时间上的后向预测。在编码器(340)之前,编码器系统(300)可W 包括预处理器(未示出),该预处理器在编码之前对所选帖(331)实施预处理(例如滤波)。
[0035] 编码器(340 )对所选帖(331)进行编码W产生已编码帖(341 ),并且还产生存储器 管理控制操作(MMC0)信号(342)或参考画面设置(RPS)信息。如果当前帖不是被编码的第 一帖,则在实施其编码处理时,编码器(340)可W使用已被存储在已解码帖临时存储器存储 区域(360)中的一个或更多先前编码/解码的帖(369)。该样的所存储的已解码帖(369)被 用作用于当前源帖(331)的内容的帖间预测的参考帖。一般来说,编码器(340)包括实施例 如运动估计和补偿、频率变换、量化W及滴编码之类的编码任务的多个编码模块。由编码器 (340)实施的确切操作可W依压缩格式而变化。输出的已编码数据的格式可W是Windows Media Video 格式、VC-1 格式、MPEG-X 格式(例如 MPEG-1、MPEG-2 或 MPEG-4)、H. 26x 格式 (例如H. 261、H. 262、H. 263、H. 264 )、肥VC格式或其他格式。
[0036] 举例来说,在编码器(340)内,根据来自参考帖的预测来表示帖间编码的预测帖。 运动估计器估计源帖(341)的宏块、块或其他样本集合关于一个或更多参考帖(369)的运 动。当使用多个参考帖时,所述多个参考帖可W来自不同的时间方向或者相同的时间方向。 运动估计器输出运动信息,比如经过滴编码的运动矢量信息。运动补偿器将运动矢量应用 于参考帖,W便确定经过运动补偿的预测值。编码器确定块的经过运动补偿的预测值与对 应的原始值之间的差异巧日果有的话)。利用频率变换、量化和滴编码对该些预测残差值进 一步进行编码。类似地,对于帖内预测,编码器(340)可W确定针对块的帖内预测值,确定预 测残差值,并且对预测残差值进行编码。具体来说,编码器(340 )的滴编码装置压缩经过量 化的变换系数值W及特定边信息(side in化rmation)(例如运动矢量信息、量化参数值、模 式决定、参数选择)。典型的滴编码技术包括Exp-Golomb编码、算
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1