检测数字视频序列中的场景转换的制作方法

文档序号:7940949阅读:137来源:国知局
专利名称:检测数字视频序列中的场景转换的制作方法
技术领域
本发明涉及用于检测数字视频序列中的转换效应的技术。
背景技术
数字视频序列可针对影像序列来描述,也称为视频帧。所述影像序列可呈现编辑 在一起以形成视频剪辑或其它产物的一个或一个以上不同场景。每一场景包括一个或一个 以上相关的视频数据帧。快速连贯地向观看者呈现所述视频序列的帧以产生运动印象。在制作所述视频序列期间,将与一个或一个以上场景相关联的帧编辑在一起以形 成所述序列。将两个场景编辑在一起的位置称作场景转换。换句话说,场景转换是以某一 方式从一个场景转换为另一场景。所述场景可具有从不同角度拍摄的同一目标或两个完全 不同的目标。硬场景转换是从一个场景突然转换为另一场景。硬场景转换可(例如)包含 剪切场景改变或闪现帧。另一方面,软场景转换可为两个场景之间的渐进转换。换句话说, 软转换可发生于若干帧上。软场景转换的实例包含交叉淡变(也称为渐隐)、淡入、淡出等寸。视频编码装置可接收一个或一个以上数字视频序列并对所述序列进行编码以用 于发射至一个或一个以上解码装置或用于存储直到以后发射及解码为止。已制订若干用于 对数字视频序列进行译码的不同视频译码标准。例如,运动图像专家组(MPEG)已开发若干 标准,包含MPEG-I (部分2)、MPEG-2 (部分2)及MPEG-4 (部分2)。其它实例包含国际电信 联盟(ITU-T)H. 261及H. 263标準,及也阐述于MPEG-4部分10中、标题为“高级视频译码 AVC”的新兴ITU-T H. 264标準。一般来说,这些视频译码标准通过以一压缩方式对数据进 行译码来支持视频序列的经改进发射及存储效率。压缩减少需要发射或存储的数据总量以 便有效地发射或存储视频帧。视频译码用于诸多背景中,包含视频串流、摄录像机、个人视 频记录器(PVR)、数字视频记录器(DVR)、视频电话(VT)、视频会议、视频CD(VCD)与数字通 用/视频光盘(DVD)上的数字视频分布,及通过有线及无线发射媒体两者的视频广播应用 以及磁性及光学存储媒体两者上的视频存储应用。MPEG-1、MPEG-2、MPEG-4、ITU-T H. 261、ITU-T H. 263 及 ITU-T H. 264 标准支持利 用连贯视频帧之间的相似性(称作时间或帧间相关)以提供帧间压缩的视频译码技术。这 些标准还支持利用个别视频帧内的相似性(称作空间或帧内相关)以提供帧内压缩的视频 译码技术。通过将基于像素的帧表示转换为基于像素区块的平移运动表示,所述帧间压缩 技术采用跨越邻近或紧密间隔的视频帧的数据冗余。使用帧间技术译码的视频帧通常称作 P( “预测”)帧或B( “双向预测”)帧。使用空间压缩译码的某些帧(一般称作1( “内”) 帧)可以为非预测性(即,仅基于以H. 264之前的标準的变换译码)或预测性(即,基于以 H. 264的空间预测与变换译码两者)。另外,某些帧还可包含帧内译码区块与帧间编码区块 两者的组合。这些编码标准提供非常适合于无线视频广播应用的高效译码。确定用于对一候选帧进行编码的译码技术类型对于译码效率是重要的。由于视频 序列随时间改变其统计性质,因此编码装置应使用于对所述帧进行编码的译码技术类型适于在可达成最有效压缩的最大程度上利用可用冗余。一般来说,编码装置基于周围帧的内容及场景转换的识别来自适应地确定用于对当前帧进行译码的译码技术类型。为此目的, 所述编码装置可试图识别这些场景转换的位置。

发明内容
在一个方面中,一种用于处理数字视频数据的方法包括分析像素值在所述数字 视频数据的序列的多个帧上的分布,及当像素值的分布在具有中间范围的可能像素值中的 像素值的像素位置的数量上展现至少预定量的短期增加时检测所述序列内的场景转换。在另一方面中,一种用于处理数字视频数据的设备包括用于接收多个帧的预处理 器。所述预处理器包含转换检测模块,所述模块分析像素值在所述数字视频数据的序列的 多个帧上的分布,且当像素值的分布在具有中间范围的可能像素值中的像素值的像素位置 的数量上展现至少预定量的短期增加时检测所述序列内的场景转换。在另一方面中,一种用于处理数字视频数据的设备包括用于分析像素值在所述 数字视频数据的序列的多个帧上的分布的装置;及用于当像素值的分布在具有中间范围的 可能像素值中的像素值的像素位置的数量上展现至少预定量的短期增加时检测所述序列 内的场景转换的装置。在另一方面中,一种用于处理数字视频数据的计算机程序产品包括其上具有指令 的计算机可读媒体。所述指令包含用于分析像素值在所述数字视频数据的序列的多个帧 上的分布的代码;及用于当像素值的分布在具有中间范围的可能像素值中的像素值的像素 位置的数量上展现至少预定量的短期增加时检测所述序列内的场景转换的代码。在另一方面中,一种用于处理数字视频数据的集成电路装置包括至少一个处理 器,所述至少一个处理器经配置以分析像素值在所述数字视频数据的序列的多个帧上的分 布,且当像素值的分布在具有中间范围的可能像素值中的像素值的像素位置的数量上展现 至少预定量的短期增加时检测所述序列内的场景转换。可在硬件、软件、固件或其任一组合中实施本发明中所述的技术。如果在软件中实 施所述技术,则可在处理器(其可指代一个或一个以上处理器)中执行所述软件,例如通 用微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA,也称为现场可编程逻辑阵列 FPLA)或数字信号处理器(DSP)或其它等效集成或离散逻辑电路。执行所述技术的软件最 初可存储于计算机可读媒体中且由处理器加载并执行。因此,本发明也涵盖计算机可读媒 体,所述媒体包括致使处理器执行如本发明中所述的各种技术中的任一者的指令。在某些 情形中,所述计算机可读媒体可形成计算机程序产品的一部分,可将所述计算机程序产品 出售给制造商及/或用于装置中。所述计算机程序产品可包含所述计算机可读媒体,且在 某些情形中也可包含包装材料。将在附图及以下说明中阐述一个或一个以上实例的细节。依据所述说明及附图并 根据权利要求书,其它特征、目的及优点将显而易见。


图1是方框图,其图解说明采用根据本发明的场景转换检测技术的数字视频译码 系统。
图2是图1的编码装置的更详细方框图。图3是流程图,其图解说明编码装置利用本发明的场景转换检测技术的实例性操作。图4是流程图,其图解说明编码装置在场景的区段内检测场景转换的实例性操 作。图5是实例性经处理影像直方图数据图表,其表示像素值在一序列的多个帧上的 分布。图6是另一实例性经处理影像直方图数据图表,其表示像素值在一序列的多个帧 上的分布。
具体实施例方式本发明描述用于检测数字视频序列中的场景转换的技术。特定来说,本发明的技 术对检测视频序列中的软场景转换尤其有用。软场景转换是指两个场景之间的渐进转换, 其可包含交叉淡变(也称作渐隐)、淡入、淡出等等。交叉淡变或渐隐是指其中第一场景直 接转换为第二场景的转换效应。淡入是指其中第一场景包括均勻色彩且所述第一场景淡变 为第二场景的转换效应。例如,所述淡入可以从全黑色屏幕转换为所述第二场景。淡出是 指所述第一场景淡变为均勻色彩(例如,黑色)的转换效应。可针对多个视频帧的序列来描述数字视频序列。每一视频帧包括各自对应于特定 像素值的多个像素位置,所述特定像素值界定在对应像素位置处的像素的光亮度及/或色 彩。例如,在YCbCr色彩空间中,所述像素值可以是亮度(Y)值与两个色度值的组合,所述 亮度(Y)值表示所述像素的光亮度(即,强度)且所述两个色度值Cb及Cr分别表示所述 像素的蓝色及红色支配色彩分量。根据本文所述的技术,编码装置分析像素值在多个帧上的分布以检测发生软场景 转换的时间位置(即,时间间隔)。特定来说,所述编码装置分析具有中间范围的可能像素 值中的值的像素位置的分布以在所述多个帧中识别在具有中间范围的可能像素值中的像 素值的像素位置的数量上展现至少预定量的短期增加的时间位置。所述短期增加可(例 如)发生在约2-30个帧上。然而,在某些情形中,所述短期增加可发生在较大集的帧上。在 具有中间范围的可能像素值中的像素值的像素位置的数量上的显著短期增加指示软场景 转换。如下文将更详细描述,对于在转换期间具有大量像素位置经历显著像素值改变的场 景转换情形尤其如此。以此方式,通过在所述多个帧内识别在具有中间范围像素值的像素 位置的数量上具有显著短期增加的位置来检测渐进场景转换的发生。图1是方框图,其图解说明采用根据本文所述技术的场景转换检测的经译码(或经压缩)视频通信系统10。译码系统10包含由网络16连接的编码装置12及解码装置14。 编码装置12从至少一个媒体源18获得数字视频序列、对所述数字视频序列进行编码并经 由网络16将经译码的序列发射到解码装置14。编码装置12及解码装置14可包括任何有 线或无线装置,例如个人计算机、移动无线电电话、服务器、网络用具、集成到车辆中的计算 机、视频游戏平台、便携式视频游戏装置、计算机工作站、计算机信息亭、数字告示牌、大型 计算机、电视机机顶盒、网络电话、个人数字助理(PDA)、移动媒体播放器、家庭媒体播放器、 数字视频投影仪或其它类型的电子装置。作为一个实例,编码装置12或解码装置14可与接收、发射及其它适合组件一起提供于无线通信装置手持机(例如如上所述的移动电话) 内。在某些方面中,媒体源18可包括广播数字视频序列(例如,经由卫星)的一个或 一个以上视频内容提供者。在其它方面中,媒体源18可包括捕获所述数字视频序列的视频 捕获装置。在此情况下,视频捕获装置可集成在编码装置12内或耦合到编码装置12。媒体 源18也可以是位于编码装置12内或耦合到编码装置12的存储器或档案库。从媒体源18接收的视频序列可包括将要作为广播或按需内容来译码及发射的直 播实时或近实时视频及/或音频序列,或可包括将要作为广播或按需内容来译码及发射的 预先记录及所存储的视频及/或音频序列。在某些方面中,所述视频序列中的至少一部分 是由计算机产生的,例如在游戏的情形中。可针对编辑在一起以形成视频序列的多个场景来描述从媒体源18接收的数字视 频序列。编辑在一起的场景可包含其中包含同一目标但自不同相机角度观察的场景。例如, 编辑在一起的场景可包含自第一相机角度摄取的场景及自第二相机角度摄取的同一场景。 另一选择为,编辑在一起的场景可为包含完全不同的目标物的场景。在所述序列中两个场 景编辑在一起的位置称作场景 转换。换句话说,场景转换是以某一方式从一个场景转换为 另一场景。如上所述,所述场景转换可以是硬转换或软转换,所述硬转换是在单个帧中从一 个场景突然改变至另一场景而所述软转换是在若干帧上两个场景之间的渐进改变。所述数字视频序列的每一场景包含其中包含同一目标物的一个或一个以上帧。所 述帧的目标物无需完全相同。例如,所述帧可包含位于稍微不同位置中的同一目标物以表 示物件的运动。所述帧可包含额外目标物,例如进入同一背景中的新物件。以此方式,场景 是由相关帧的序列组成。编码装置12使用一种或一种以上译码技术来对自媒体源18接收的序列的每一帧 进行编码。例如,编码装置12可使用帧内译码技术来对所述帧中的一者或一者以上进行编 码。对使用帧内译码技术编码的帧(通常称作内(“I”)帧)进行译码无需参考其它帧。 然而,使用帧内译码技术编码的帧可使用空间预测以通过利用位于同一帧中的其它视频数 据中的冗余来压缩所述帧。编码装置12也可使用帧间译码技术来对所述帧中的一者或一 者以上进行编码。对使用帧间译码技术编码的帧进行译码需参考一个或一个以上其它帧 (本文中称作参考帧)的至少一部分。经帧间译码的帧可包含一个或一个以上预测(“P”) 帧、双向预测(“B”)帧或其一组合。对P帧进行编码需参考至少一个时间上居先的帧,而 对B帧进行编码需参考至少一个时间上居后的帧及至少一个时间上居先的帧。所述时间上 居先及/或时间上居后的帧称作参考帧。以此方式,帧间译码技术通过利用视频数据中跨 越时间维度的冗余来压缩所述帧。编码装置12可进一步经配置以通过将每一帧分割成多个像素子组且单独地对每 一像素子组进行编码来对所述序列的每一帧进行编码。这些像素子组可称作区块或宏区 块。编码装置12可进一步将每一区块细分成两个或两个以上子区块。作为一个实例,16x16 区块可包括四个8x8子区块或其它细分区块。例如,H. 264标准允许对具有各种不同大小 (例如16xl6、16x8、8xl6、8x8、8x4、4x8及4x4)的区块进行编码。此外,可通过扩展将所述 区块细分成任一大小(例如,2χ16、16χ2、2χ2、4χ16、8χ2及等等)的子区块。也可能有大小 大于或小于16个行或列的区块。如本文中所用,术语“区块”可以指任一大小的区块或子区块。编码装置12可至少部分地基于对所述序列内的场景转换的检测来自适应地确定 用于对所述序列内的候选帧进行编码的译码技术。如上所述,所述场景转换可包含交叉淡 变(也称为渐隐)、淡入、淡出等等。根据本文中所述的技术,编码装置12分析像素值在多 个帧上的分布以在所述帧序列内检测发生软场景转换的时间位置(时间间隔)。如下文将 更详细描述,所述像素值可表示特定像素位置的光亮度(即,亮度)。另一选择为,所述像素 值可表示所述特定像素位置的光亮度及色彩,例如,一个或一个以上光谱通道的强度向量。 编码装置12可在所述多个帧上分析每一帧中具有中间范围的可能像素值内的像素值的像 素位置的数量。编码装置12在具有所述中间范围的可能像素值内的像素值的像素位置的 数量上展现显著短期增加时检测软场景转换。具有所述中间范围的可能像素值中的像素值 的像素位置的数量的显著短期增加指示软转换。对于在转换期间大量像素位置经历显著强 度改变(正向地或负向地)的软转换情形尤其如此。以此方式,通过在所述多个帧内检测 在具有中间范围像素值的像素位置的数量上展现短期增加的位置来检测渐进场景转换的 发生。中间范围像素值的这些短期增加可(例如)发生在相当少的几个帧上(例如,在5 个帧上)或较大数量的帧上(例如,在30个帧上)。然而,在某些情形中,所述短期增加可 发生在较大集的帧上。编码装置12至少部分地基于对所述序列内的一个或一个以上场景转换的检测来 确定用于对所述序列内的候选帧进行编码的译码技术。编码装置12可确定不将所述候选 帧译码成P帧,这是因为所述帧可包含来自一个以上场景的内容。相反,编码装置12可确 定使用加权双向预测译码来将所述候选帧译码成B帧以包含来自两个场景的内容。准确地 确定用于对帧进行译码的译码技术类型减少所需的编码位速率、能够有效地压缩所述帧及 更好地处置场景转换。编码装置12对所述序列的帧进行编码并经由网络16将经编码的帧发射到解码装 置14。网络16可包括有线或无线通信网络中的一者或一者以上,包含乙太网、异步传送模 式(ATM)、电话(例如,POTS)、电缆、电力线路、及光纤系统、及/或无线系统中的一者或一者 以上,所述无线系统包括以下系统中的一者或一者以上码分多重存取(CDMA或CDMA2000) 通信系统、频分多重存取(FDMA)系统、正交频分多重存取(OFDMA)系统、时分多重存取 (TDMA)系统(例如通用分组无线电服务(GPRS/GSM)/增强型数据GSM环境(EDGE))、地面 集群无线电(TETRA)移动电话系统、宽带码分多重存取(WCDMA)系统、高数据速率(IxEV-DO 或IxEV-DO黄金多播)系统、IEEE 802. 11系统、仅正向链路(FLO)系统、数字媒体广播 (DMB)系统、手持式数字视频广播(DVB-H)系统、地面综合服务数字广播(ISDB-T)系统等 等。尽管在无线背景中描述本发明的技术,但其可用于压缩供用于经由有线网络发射的数 据。解码装置14自编码装置12接收经编码数据并对所述经译码帧进行解码。解码装置14可进一步通过显示器(未显示)向用户呈现经解码的视频帧,所述显示器可集成于解 码装置14内或可提供为经由有线或无线连接耦合到解码装置14的离散装置。例如,解码 装置14可实施为数字电视、无线通信装置、游戏装置、便携式数字助理(PDA)、膝上型计算 机或桌上型计算机、数字音乐及视频装置(例如那些以商标“iPod”出售的装置)或无线电 电话(例如蜂窝式、基于卫星或地面的无线电电话)或其它经配备用于视频及/或音频串流、视频电话或两者的无线移动终端的一部分。解码装置14可与移动或静止装置相关联。 在其它方面中,解码装置14可包括耦合到有线网络的有线装置。编码装置12及解码装置14可根据视频压缩标准(例如动画专家组(MPEG)、 MPEG-I (部分 2)、MPEG-2 (部分 2)、MPEG-4 (部分 2)、ITU-T H. 261、ITU-T H. 263 或对应于 MPEG-4部分10的ITU-T H. 264 (高级视频译码AVC))来操作。H. 264/MPEG-4 (AVC)标准是 由ITU-T视频译码专家组(VCEG)与IS0/IEC动画专家组(MPEG) —同制定,作为称为联合 视频组(JVT)的共同合作组织的产物。H. 264标准描述于由ITU-T研究组在2005年3月作 出的用于泛用视听服务的ITU-T推荐H. 264高级视频译码中,其在本文中可称作H. 264标 准或H. 264规范、或H. 264/AVC标准或规范。在某些方面中,对于视频广播来说,本发明中所述的技术可应用于增强型H. 264 视频译码以便在使用FLO空中接口规范(“用于地面移动多媒体多播的仅正向链路空中接 口规范”将出版为技术标准TIA-1099( “FLO”规范))的地面移动多媒体多播(TM3)系统中 输送实时视频服务。FLO规范包含界定位串流语法与语义及适合于FLO空中接口的解码过 程的实例。另一选择为,可根据其它标准(例如,DVB-H(手持式数字视频广播)、ISDB-T(地 面综合服务数字广播)或DMB(数字媒体广播))来广播视频。然而,本发明中所述的技术 并非局限于任一特定类型的广播、多播、单播或点对点系统。在广播的情形中,视频数据提 供者10可向多个接收装置广播数个通道的视频数据。图2是编码装置12的更详细方框图。编码装置12包含预处理器20、编码器22及 发射器24。在某些方面中,编码模块12可驻存于无限通信装置手持机内以对影像及/或视 频进行编码以便经由无线网络发射到另一无线通信装置。预处理器20接收所述序列的帧 并分析所述帧以辅助编码器22对所述帧进行编码且分析所述帧序列以使用本文所述的转 换检测技术在所述帧序列内识别发生场景转换的时间位置。特定来说,预处理器20接收所述序列的多个帧。预处理器20可自媒体源18 (图 1)接收所述序列的多个帧。在某些情形中,例如当媒体源18为广播经编码数字视频序列的 视频内容提供者时,所述帧可为经译码帧。举例来说,编码装置12可包含解码器(图2中 未显示),其在将所述帧提供给预处理器20之前对所述序列的帧进行解码。所述解码器可 将所述帧解码为像素域以用于由预处理器20执行的操作。在其它情形下,例如当媒体源18 为数码摄录机时,所述帧可为原始像素数据的帧。对于每一帧来说,预处理器20可基于与像素位置相关联的像素值来将帧的像素 位置分类为一个或一个以上群组(有时称作箱)。如本文中所用,术语“像素值”是指界定 像素位置处的像素的光亮度及/或色彩的信息。例如,在YcbCr色彩空间的情形中,像素值 可由亮度(Y)值与两个色度值Cb及Cr来表示,所述亮度(Y)值表示像素的强度且所述两 个色度值Cb及Cr分别表示蓝色及红色支配色彩分量。在此情形中,预处理器20可基于与 像素位置相关联的亮度值来分类所述像素位置。在某些其它情形中,预处理器20可给亮度 值增添一个或一个以上色度通道值以便基于像素值来分类像素位置。另一方面,在RGB色 彩空间的情形中,像素值可由红色(R)通道值、绿色(G)通道值及蓝色(B)通道值来表示, 所述红色(R)通道值表示像素的红色分量的强度,所述绿色(G)通道值表示像素的绿色分 量的强度且所述蓝色(B)通道值表示像素的蓝色分量的强度。在此情形中,预处理器20可 基于表示所述色彩空间的一个或一个以上通道的向量来分类像素位置。
在某些情形中,每一箱可对应于所述可能像素值中的特定一者。在8-位灰度影像 的情形中,每一箱可对应于介于0到255范围中的值。换句话说,存在256个单独的箱,每 一箱仅对应于一个值。另一选择为,所述箱可对应于所述可能像素值的子组。举例来说,每 一箱可对应于特定数量的连续像素值,例如,64个箱各自对应于4个连续像素值。尽管针对 使用8位灰阶来表示每一像素进行描述,但可使用更多或更少箱来表示像素。尽管在上述 实例中预处理器20是针对每一帧对像素位置进行分类,但预处理器20可仅针对所述帧的 子组将像素位置分类成群组。例如,预处理器20可每隔一个帧、每隔两个帧或针对所述帧 的某一其它部分对像素分布进行分类及/或分析。预处理器20可产生经处理直方图数据序列,即时间系列,所述序列使用对应于中 间范围的可能像素值的群组/箱来表示具有中间范围像素值的像素位置在多个帧上的分 布。在一个方面中,所述经处理直方图数据系列可显示具有中间范围的可能像素值内的像 素值的像素位置在所述多个帧上的数量变化。换句话说,所述经处理直方图数据系列可图 解说明具有中间范围像素值的像素位置的数量如何随时间变化。在一个实例中,预处理器 20可产生经处理直方图数据系列,所述系列表示具有介于60与140之间且更优选地介于 80与120之间像素值的像素位置的分布。然而,此范围仅仅是实例性的。预处理器20可产 生经处理直方图数据系列,所述系列表示具有其它范围内的像素值的像素位置的分布。
预处理器20的转换检测模块26分析像素值在所述多个帧上的分布以检测所述序 列内的场景转换的位置。在一个方面中,转换检测模块26分析像素值在所述多个帧上的分 布以识别在具有中间范围的可能像素值内的值的像素位置的数量上具有显著暂时增加的 时间位置(时间间隔)。此短期增加指示转换。例如,在淡入或淡出期间,显著数量的像素 位置可明显地增加或减少光亮度。在任一情形中,所述像素值可在所述中间范围中从亮转 换到暗或从暗转换到亮。作为一实例,在从均勻黑色屏幕到场景的淡入期间,显著数量的像 素位置因从黑色(即,小亮度像素值)至与增加的光亮度对应的像素值的像素位置改变而 增加光亮度。在此从小亮度像素值转换为中等或大亮度像素值期间,显著数量的像素在中 间范围的亮度像素值中转换。同样,在淡出为均勻黑色屏幕期间,显著数量的像素通过在光 亮度减少期间在中间范围的亮度像素值中转换而显著地减少光亮度至所述均勻黑色屏幕。 因此,转换的此一特性是在一系列两个或两个以上位于场景转换处或附近的连续帧上具有 中间范围的可能像素值内的值的像素位置的数量的明显增力口。尽管于上述实例中使用了亮 度(Y通道)像素值,但可使用其它色彩通道像素值对转换的检测进行补充及辅助,例如表 示两个或两个以上色彩通道值(例如,RGB色彩通道值)的像素强度向量。在每一情形中, 所述亮度或强度向量一般来说指示像素的光亮度的等级或像素的光亮度与色彩的组合。可基于场景转换的性质来进一步图解说明此特性,如下文所描述。以下是描述软 转换的模型方程式ρ (m+k, (X,y)) = {α (k) ρ (m,(χ, y))} + { (1_ α (k))p (m+n, (x,y))}(1)其中在分辨率为320x240 的情形中,k e {0、1、···、η},(χ, y) e {1、2、· · ·、320}
x{l、2.....240},(χ表示两个集的笛卡尔乘积),p(i,(x,y))表示帧i (时刻i)及位置(x,
y)中的像素强度值,m是此后即刻开始交叉淡变的时刻,η是在此期间交叉淡变发生且结束 的时间间隔长度,α (k)是k的非增加(例如,减小)函数,其中α (0) = 1且α (η) =0。可将像素位置的整个集{(x,y)|(x,y) e {1,2,…,320}χ{1,2,…,240}}分类成以下三种可能子组中的一者1. £t= i(X,y)|p(m,(x,y)) p(QH"n,(x,y)>丨(明显增加的像素值位置)2. £1= {(x,y> I p(m,(x,y)_) p(m+n,(x>y))}(明显减少的像素值位置)3. ^= i(x,y) I p(m,(x,y))sp(m+n,(x,y))}(相对稳定的像素值位置)其中p(m,(χ, y))对应于位于(x,y)处的像素在此后即刻开始交叉淡变的时刻时 的值,且P(m+n,(x,y))对应于位于(x,y)处的像素在结束交叉淡变的时刻时的值。(x,y) 是显示器上的像素位置。子组1-3满足以下两个条件
£t η = 0,£ι η = 0,£τ η = 0.可通过如下划定差(p(m,(χ, y))-p(m+n, (χ, y)))的绝对值的上限来达成以上分 类|p(m,(χ, y))-p (m+n, (χ, y))彡 T,其中阈值 T >0。此意指当像素位置(X,y)满足以上不等式时,则将认为此像素位置隶属于相对稳 定的像素值位置的子组^。否则,即,如果像素位置(X,y)不满足以上不等式,则此像素位 置将包含于岛中(如果‘P(m,(x,y)) >p(m+n, (x,y))’)或包含于灼中(如果‘p(m,(χ, y)) <p(m+n, (x,y))’)。可在范围[20,...,40]中选择值作为阈值T,例如30。当在像素强度值上经历明显增加或明显减少的像素位置的数量 为显著(例如IfTU A| = I^tI +丨负丨对应于μ丨的充足大分数或等效地
=(|£τ| + \£ι\)Ι\£\乏工,其中J为阈值)时,作为所述转换的结果,充足 大数量的像素位置在所述像素值上经历充足大的摆动。在一个实例中,可将阈值 Γ设定为 0. 30。子组釙将引发从对应于小像素值的箱朝向对应于较大像素值的箱的概率质量转移。 以类似方式,基于其定义,集负将引发从对应于大像素值的箱朝向对应于较小像素值的箱 的概率质量转移。在任一方向转移的概率质量将必须穿过与中间范围像素值相关联的箱, 简言之,即在一短期内占据这些箱且导致此中间范围的箱中的暂时概率质量堆积。中间范 围像素值的箱中的此短期暂时概率质量堆积可表示软转换的发生。转换检测模块26可经 配置以检测此概率质量堆积从而识别软转换的发生。换句话说,转换检测模块26可在具有所监测中间范围的像素值内的像素值的像 素位置的数量上经历显著暂时增加时检测渐进场景转换。例如,转换检测模块26可在具有 所监测中间范围内的像素值的像素位置的数量在短期时间周期内超过阈值时检测转换。所 述阈值可以是以静态方式配置的值。例如,转换检测模块26可在具有所监测中间范围内的 像素值的像素位置的数量在30个或更少个帧上展现大于或等于所述像素位置的20%或者 大于或等于所述像素位置的30%的增加或类似增加时检测转换。在分辨率为320x240的情 形中,所述阈值可等于30,000 (其对应于所述像素位置的大约40% )。另一选择为,所述阈 值可以是以统计方式推论出的动态值,其是依据若干连续帧上在不同箱范围内的平均箱计 数所确定。例如,转换检测模块26可在具有所监测中间范围内的像素值的像素位置的数量 增加先前30个帧上的平均中间范围箱计数的50%时检测转换。上述转换检测技术针对多个帧分析像素值在整个帧上的分布。然而,所述技术可 应用于帧的多个区段而非整个帧。例如,在针对整个场景未检测到转换时,预处理器20可使用上述技术来检测所述场景仅一部分内的转换。例如,在新闻广播期间,所述场景的左上 部分可转换为新场景,所述新场景显示新闻节目主持人正谈论的新闻事件的镜头的图像。 于此情形中,预处理器20可将所述场景分割成片段并分析多个帧的对应片段的像素值以 检测所述场景的区段中的转换。因而,所述帧的区段可仅包含所述帧的区块子组。转换检测模块26可给编码器22提供关于检测到的转换的位置的信息。编码器22 可至少基于转换的经识别位置来确定用于对每一帧或所述帧的区块进行编码的译码技术。 例如,编码器22可决定不将所述候选帧译码成P帧,这是因为所述帧是包含来自一个以上 场景的内容的转换的一部分。相反,编码装置12可确定(例如)使用加权双向预测译码来 将所述候选帧译码成B帧,以包含来自两个场景的内容。准确确定用于对帧进行译码的译 码技术类型减少所需的编码位速率、能够有效地压缩所述帧及更好地处置视频转换。编码器22根据选定的编码技术对所述帧或区块进行编码并经由发射器24发射经 编码的帧。发射器24可包含适当的调制解调器及驱动器硬件、软件及/或固件以经由网 络16(图1)发射经编码的视频。在某些情形中,编码装置12可包含互逆发射及接收电路, 使得每一电路可充当经由网络16发射的经编码视频及其它信息的发射装置及接收装置两 者。换句话说,可将编码装置12的所图解说明的组件集成为编码器/解码器(CODEC)的一 部分。在某些方面中,编码装置12可对在时间周期内接收的帧进行编码、组合及发射。 例如,在某些视频译码系统中,将多个视频数据帧一起编组成视频数据片段(有时称作“超 帧”)。如本文中所用,术语“超帧”是指在时间周期或窗口内所收集以形成数据片段的帧群 组。在利用FLO技术的译码系统中,所述超帧可包括可额定地具有30个帧的一秒数据片段。 预处理器20可分析所述数据片段的帧,例如,在FLO情形中,为30个帧的群组。在此情形 中,预处理器20可仅检测大致发生于一个超帧内的场景转换。换句话说,可能难以检测发 生于多个数据片段上的转换。然而,超帧可包含任一数量的帧。也可利用所述技术来对其 它数据片段进行编码、组合及发射,例如用于在不同时间周期内接收的数据片段(所述时 间周期可为或可不为固定时间周期),或用于个别数据帧或帧集。换句话说,可界定超帧以 覆盖大于或小于一秒的周期的时间间隔,或甚至可变的时间间隔。注意,本发明通篇中,特 定视频数据片段(例如,类似于超帧的概念)是指特定大小及/或时长的任一视频数据块。在编码装置12中,可个别实施前述技术,或可一起实施此类技术中的两者或两者 以上或所有此类技术。编码装置12中的组件为可应用于实施本文中所述技术的那些组件 的实例。然而,如果需要,编码装置12可包含许多其它组件,以及组合一个或一个以上上述 模块的功能的更少组件。编码装置12中的组件可至少部分地通过处理器来实施。术语处 理器可用于指代各种处理装置中的任一者,包含一个或一个以上处理器,例如通用微处理 器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA,也称为现场可 编程逻辑阵列FPLA)或离散逻辑、软件、硬件、固件或其任一组合。将不同的特征绘示成模 块意在突出编码装置12的不同功能方面且未必暗示必须通过分离的硬件或软件组件来实 现这些模块。而是,可将与一个或一个以上模块相关联的功能集成于共同或分离的硬件或 软件组件内。图3是流程图,其图解说明编码装置(例如图2的编码装置12)利用本发明的转 换检测技术的实例性操作。预处理器20从图1的媒体源18接收数字视频序列的多个帧(30)。预处理器20基于与像素位置相关联的像素值将每一帧的像素位置分类为一个或一 个以上群组(例如,箱)(32)。如上所述,所述像素值可为表示相应像素位置处的像素的光 亮度及/或色彩的标量像素值。例如,用于本发明技术的像素值可为亮度(Y通道)像素值。 另一选择为,所述像素值可为表示两个或两个以上像素信息通道的强度向量。在某些情形 中,可预先确定此分类。在某些其它情形中,所述分类方案可动态地改变以适应视频信号的 变化的性质。预处理器20可产生表示像素值在多个帧上的分布的直方图数据(34)。在一个方 面中,可处理所述直方图以产生概率值的序列,所述概率值的序列指示在所述多个帧上具 有中间范围的可能像素值内的像素值的像素位置的数量。换句话说,可处理所述直方图以 图解说明具有中间范围像素值的像素位置的概率如何随时间变化。转换检测模块26分析像素值在所述多个帧上的分布以确定具有所述中间范围的 可能像素值内的值的像素位置的数量是否存在显著暂时增加(36)。转换检测模块26可分 析像素值在超帧上(例如,在30个帧上)的分布。例如,转换检测模块26可确定具有所监 测中间范围内的像素值的像素位置的数量是否在一系列帧上经历超过阈值(例如,所述像 素位置的30%)的暂时增加。转换检测模块26可分析所述系列的每一帧或仅分析所述系 列的一部分帧(例如,每隔一个帧)。当转换检测模块26确定具有所述中间范围的可能像 素值内的值的像素的数量不存在显著暂时增加时,转换检测模块26确定所分析的多个帧 内不存在转换(38)。
当转换检测模块26确定具有所述中间范围的可能像素值内的值的像素的数量存 在显著暂时增加(例如,具有中间范围像素值的像素位置的数量经历超过所述阈值的暂时 增加)时,转换检测模块26确定所分析的多个帧内存在转换(40)。编码装置12至少基于 所述多个帧中是否存在转换的确定来选择用于对每一帧或所述帧的区块进行编码的译码 技术(42)。例如,在检测到转换时,编码装置12可确定(例如)使用加权双向预测译码来 将候选帧译码成B帧。将所述候选帧译码成B帧允许经译码帧包含先前帧及后续帧两者的 目标物,因而允许在场景之间更平滑地转换。另一选择为,编码装置12可在未检测到转换 时确定应将所述候选帧译码成P帧。将所述帧译码成P帧允许仅利用先前参考,因而减少 编码的复杂性同时仍令人满意地减少所述经译码帧所利用的带宽的量。编码器22根据选 定的编码技术对所述帧或区块进行编码并发射所述经编码帧(44)。图4是流程图,其图解说明编码装置(例如图2的编码装置12)在场景区段内检 测场景转换的实例性操作。预处理器20从图1的媒体源18接收数字视频序列的多个帧 (50)。预处理器20基于与像素位置相关联的像素值将每一帧的像素位置分类为一个或一 个以上群组(例如,箱)(52)。预处理器20产生表示整个场景的像素值在多个帧上的分布 的直方图数据(54)。在一个方面中,可处理所述直方图以产生概率值的序列,所述概率值的 序列指示在所述多个帧上具有中间范围的可能像素值内的像素值的像素位置的数量。换句 话说,可处理所述直方图数据以图解说明具有中间范围像素值的像素位置的数量如何随时 间变化。转换检测模块26分析像素值在所述多个帧上的分布以确定在所述整个场景上具 有中间范围的可能像素值内的值的像素位置的数量是否存在显著暂时增加(56)。当转换检 测模块26确定具有所述中间范围的可能像素值内的值的像素位置的数量存在显著暂时增加时,转换检测模块26确定所述整个场景已发生了场景转换(58)。换句话说,所述场景转 换是所述整个场景从一个场景到另一个场景的转换。当转换检测模块26确定具有中间范围的可能像素值内的值的像素的数量不存在 显著暂时增加时,转换检测模块26确定在所述帧内不存在整个场景的转换(60)。预处理器 20产生表示所述场景的区段的像素值在多个帧上的分布的直方图数据(62)。在一个方面 中,所述场景的所述区段可对应于所述帧的一个或一个以上相邻区块。例如,所述场景的所 述区段可为所述帧的对应于所述帧的拐角的区块。转换检测模块26分析所述场景的所述区段的像素值的分布以确定在所述场景的 所述区段上具有所述中间范围的可能像素值内的值的像素位置的数量是否存在显著暂时 增加(64)。当转换检测模块26确定具有所述中间范围的可能像素值内的值的像素位置的 数量存在显著暂时增加(例如,具有中间范围值的像素位置的数量经历超过所有像素位置 的数量的30%的暂时增加)时,转换检测模块26确定在所述场景的所述区段内发生场景转 换(66)。换句话说,所述场景转换仅是所述帧的所述场景的一部分的转换。当转换检测模块26确定具有所述中间范围的可能像素值内的值的像素的数量不 存在显著暂时增加时,转换检测模块26确定所述帧的所述场景的所述区段中不存在场景 转换(68)。转换检测模块26确定是否分析所述场景的其它区段(70)。当存在要分析的所 述场景的额外区段时,预处理器20产生表示所述场景的下一区段的中间范围像素值在所 述帧上的分布的直方图数据组并分析所述分布。当不存在要分析的所述场景的更多额外区段或检测到整个场景转换时,编码装置 12至少基于是否存在场景转换的确定来选择用于对所述帧或区块的至少一部分进行编码 的译码技术(72)。编码装置12可在分析所述帧的其它区块时开始对所述帧的某些区块进 行编码。另一选择为,编码装置12可等待直到分析完所述帧的所有区块,此后再对所述帧 的任一区块进行译码。当检测到整个场景转换时,编码装置12可确定(例如,在检测到转 换时)使用加权双向预测译码来将候选帧译码成B帧。当场景转换仅发生于所述场景的区 段中时,编码装置12可基于检测到的转换来确定仅用于所述区段的区块的译码技术。编码 器22根据选定的编码技术对所述帧或区块进行编码并发射所述经编码帧(74)。图5是实例性经处理直方图数据图表,其表示在一序列的多个帧上具有中间范围 的像素值中的值的像素的数量。图5中所图解说明的像素值直方图是基于像素值在特定序 列的YCbCr域中的分布。χ轴表示所述序列的多个帧的帧索引。图5中的经处理直方图数 据显示像素值在所述序列的300个帧上的分布。y轴表示具有所述中间范围的可能像素值 中的像素值的像素的数量的总和。对于图5中所图解说明的实例来说,所述中间范围的可 能像素值针对Y通道为介于像素强度值80与120之间且针对Cb及Cr通道为介于像素色 彩值72与112之间。然而,其它范围的像素值可表示所述中间范围的像素值。图5中的经 处理直方图数据包含在[80、120]范围中的Y通道直方图部分和序列80、在[72、112]范围 中的Cb通道直方图部分和序列82及在[72、112]范围中的Cr通道直方图部分和序列84, 所述序列表示在所述序列的多个帧上具有相应通道的中间范围像素值的像素的数量。如上文详细描述,转换检测模块26 (图2)可分析Y通道直方图部分和序列80以 确定所述中间范围内的像素强度值的分布何时经历显著暂时增加。在图5中所图解说明的 实例中,转换检测模块26检测帧索引65周围及帧索引220周围的位置处的转换。在这些位置中,Y通道直方图部分和序列80在具有中间范围中的像素值的像素的数量上展现显著 增加,继而在具有中间范围中的像素值的像素的数量上展现显著减少。此类模式可指示交 叉淡变的转换。尽管仅使用Y通道(即,强度)直方图部分和序列80来检测图5中所示实例中的 转换,但转换检测模块26也可使用并入有强度像素值及一个或一个以上Cb及Cr通道的像 素值向量来检测所述转换。此外,当在RGB色彩空间中分析所述像素值时,转换检测模块26 可使用单个色彩通道的像素值或两个或两个以上色彩通道的向量。
图6是另一实例性经处理直方图数据图表,其表示在一序列的多个帧上具有中间 范围的像素值中的值的像素的数量。图6中所图解说明的像素值直方图是基于像素值在特 定序列的YCbCr域中的分布。χ轴表示所述序列的多个帧的帧索引。图6中的经处理直方 图数据显示像素值在所述序列的300个帧上的分布。y轴表示具有所述中间范围的可能像 素值中的像素值的像素的数量的总和。对于图6中所图解说明的实例来说,所述中间范围 的可能像素值针对Y通道为介于像素强度值80与120之间且针对Cb及Cr通道为介于像 素色彩值72与112之间。图6中的经处理直方图数据包含在[80、120]范围中的Y通道直 方图部分和序列90、在[72、112]范围中的Cb通道直方图部分和序列92及在[72、112]范 围中的Cr通道直方图部分和序列94,所述序列表示在所述序列的多个帧上具有相应通道 的中间范围像素值的像素的数量。如上文详细描述,转换检测模块26 (图2)可分析Y通道直方图部分和序列90以 确定所述中间范围内的像素强度值的分布何时经历显著暂时增加。在图6中所图解说明的 实例中,转换检测模块26检测帧索引90周围及帧索引255周围的位置处的转换。在这些 位置中,Y通道直方图部分和90在具有该中间范围中的像素值的像素的数量上展现显著增 力口,继而在具有中间范围中的像素值的像素的数量上展现显著减少。此类模式可指示交叉 淡变的转换。尽管仅使用Y通道(即,强度)直方图部分和序列90来检测图6中所示实例中的 转换,但转换检测模块26也可使用并入有多于一个的色通道的像素值向量来检测所述转 换。例如,当在RGB色彩空间中分析所述像素值时,转换检测模块26可使用单个色彩通道 的像素值或两个或两个以上色彩通道的向量。因此,所述像素值向量包含光亮度信息以及 色彩信息。基于本文所述的教示,应了解,可不相依于任何其它方面来实施本文所揭示的一 个方面且可以各种方式来组合这些方面中的两者或两者以上。可在硬件、软件、固件或其 任一组合中实施本文所述的技术。如果在硬件中实施所述技术,则可使用数字硬件、模拟 硬件或其组合来实现所述技术。如果在软件中实施所述技术,则可至少部分地通过一个或 一个以上所存储或所发射的指令或计算机程序产品来实现所述技术,所述计算机程序产品 包含其上存储有一个或一个以上指令或代码的计算机可读媒体。与所述计算机程序产品 的计算机可读媒体相关联的指令或代码可通过计算机来执行,例如,通过一个或一个以上 处理器来执行(例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路 (ASIC)、现场可编程门阵列(FPGA,也称为现场可编程逻辑阵列FPLSa)、或其它等效的集成 或离散逻辑电路)。因此,本发明也涵盖各种集成电路装置中的任一者,所述装置包含实施 本发明中所述的一种或一种以上技术的电路。此种电路可提供于单个集成电路芯片中或提供于多个交互操作的集成电路芯片中。通过实例而非限制的方式,此类计算机可读媒体可包括RAM,例如同步动态随机 存取存储器(SDRAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、可编程只读 存储器(PROM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、 FLASH存储器、CD-ROM或其它光盘存储器件、磁盘存储器件或其它磁性存储装置,或任一其 它可用于以指令或数据结构形式携载或存储所需的程序代码且可由计算机存取的有形媒 体。已描述若干方面及实例。然而,也可对这些实例做各种修改,且本文所呈现的原理 也可应用于其它方面。这些及其它方面均归属于以上权利要求书的范围内。
权利要求
一种用于处理数字视频数据的方法,其包括分析像素值在所述数字视频数据的序列的多个帧上的分布;及当像素值的所述分布在具有中间范围的可能像素值中的像素值的像素位置的数量上展现至少预定量的短期增加时,检测所述序列内的场景转换。
2.如权利要求1所述的方法,其中检测所述序列内的所述场景转换包括在具有所述中 间范围的可能像素值中的像素值的像素位置的百分比在短期时间周期内超过所述帧的像 素位置的总体数量的特定百分比时检测所述序列内的所述场景转换。
3.如权利要求1所述的方法,其进一步包括针对所述多个帧中的至少一子组所述帧,基于与所述像素位置相关联的像素值,将所 述子组的帧的像素位置分类为群组;及使用所述群组中经分类而对应于所述中间范围的可能像素值的像素位置的数量的总 和产生像素值在所述多个帧上的所述分布,其中直方图数据指示具有中间范围像素值的像 素位置的所述数量在所述多个帧上的变化。
4.如权利要求1所述的方法,其中分析像素值在所述多个帧上的所述分布包括针对所述帧内的像素位置区段分析像素 值在所述多个帧上的所述分布;且检测所述场景转换包括在所述帧内的所述像素位置区段的像素值的所述分布在具有 所述中间范围的可能像素值中的像素值的像素位置的所述数量上在短期时间周期内展现 至少预定量的短期增加时,检测所述区段内的所述场景转换。
5.如权利要求1所述的方法,其进一步包括至少基于所述检测到的场景转换选择用于 对所述多个帧中的至少一者进行编码的译码技术。
6.如权利要求5所述的方法,其中选择所述译码技术包括选择用于所述检测到的转换 内的帧的双向译码技术。
7.如权利要求1所述的方法,其中分析像素值在所述多个帧上的所述分布包括分析强 度值与向量强度值及色彩值中的一者在所述多个帧上的分布。
8.如权利要求1所述的方法,其中检测所述场景转换包括检测交叉淡变、淡入及淡出 中的一者。
9.如权利要求1所述的方法,其中在像素值的所述分布展现短期增加时检测所述序 列内的场景转换包括在像素值的所述分布在具有中间范围的可能像素值中的像素值的像 素位置的数量上在30个或更少个帧内展现至少预定量的增加时检测所述序列内的场景转换。
10.一种用于处理数字视频数据的设备,其包括预处理器,其用于接收多个帧,其中所述预处理器包含转换检测模块,其分析像素强度值在所述数字视频数据的序列的多个帧上的分布且在 像素值的所述分布在具有中间范围的可能像素值中的像素值的像素位置的数量上展现至 少预定量的短期增加时检测所述序列内的场景转换。
11.如权利要求10所述的设备,其中所述转换检测模块在具有所述中间范围的可能像 素值中的像素值的像素位置的百分比超过所述帧的像素位置的总体数量的特定百分比时 检测所述序列内的所述场景转换。
12.如权利要求10所述的设备,其进一步包括编码器,所述编码器至少基于所述检测 到的场景转换选择用于对所述多个帧中的至少一者进行编码的译码技术。
13.如权利要求10所述的设备,其中所述转换检测模块在像素值的所述分布在具有中 间范围的可能像素值中的像素值的像素位置的数量上在30个或更少个帧内展现至少预定 量的增加时检测所述序列内的场景转换。
14.如权利要求10所述的设备,其中所述设备包括无线通信装置手持机,所述手持机 进一步包括编码器,其对所述序列的所述帧进行编码;及发射器,其发射所述经编码帧。
15.一种用于处理数字视频数据的计算机程序产品,其包括上面具有指令的计算机可 读媒体,所述指令包括用于分析像素值在所述数字视频数据的序列的多个帧上的分布的代码;及用于在像素值的所述分布在具有中间范围的可能像素值中的像素值的像素位置的数 量上展现至少预定量的短期增加时检测所述序列内的场景转换的代码。
16.如权利要求15所述的计算机程序产品,其中用于检测所述序列内的所述场景转换 的代码包括用于在具有所述中间范围的可能像素值中的像素值的像素位置的百分比超过 所述帧的像素位置的总体数量的特定百分比时检测所述序列内的所述场景转换的代码。
17.如权利要求15所述的计算机程序产品,其进一步包括用于针对所述多个帧中的至少一子组的所述帧而基于与所述像素位置相关联的像素 值将所述子组的帧的像素位置分类为群组的代码;及用于使用所述群组中经分类而对应于所述中间范围的可能像素值的像素位置的数量 的总和产生像素值在所述多个帧上的所述分布的代码,其中直方图数据指示具有中间范围 像素值的像素位置的所述数量在所述多个帧上的变化。
18.如权利要求15所述的计算机程序产品,其中用于分析像素值在所述多个帧上的所述分布的代码包括用于针对所述帧内的像素位 置区段分析像素值在所述多个帧上的所述分布的代码;且用于检测所述场景转换的代码包括用于在所述帧内的所述像素位置区段的像素值的 所述分布在具有所述中间范围的可能像素值中的像素值的像素位置的所述数量上展现至 少预定量的短期增加时检测所述区段内的所述场景转换的代码。
19.如权利要求15所述的计算机程序产品,其进一步包括用于至少基于所述检测到的 场景转换选择用于对所述多个帧中的至少一者进行编码的译码技术的代码。
20.如权利要求19所述的计算机程序产品,其中用于选择所述译码技术的代码包括用 于选择用于所述检测到的转换内的帧的双向译码技术的代码。
21.如权利要求15所述的计算机程序产品,其中用于在像素值的所述分布展现短期增 加时检测所述序列内的场景转换的代码包括用于在像素值的所述分布在具有中间范围的 可能像素值中的像素值的像素位置的数量上在30个或更少个帧内展现至少预定量的增加 时检测所述序列内的场景转换的代码。
22.一种用于处理数字视频数据的设备,其包括用于分析像素值在所述数字视频数据的序列的多个帧上的分布的装置;及用于在像素值的所述分布在具有中间范围的可能像素值中的像素值的像素位置的数 量上展现至少预定量的短期增加时检测所述序列内的场景转换的装置。
23.如权利要求22所述的设备,其中所述检测装置在具有所述中间范围的可能像素值 中的像素值的像素位置的百分比超过所述帧的像素位置的总体数量的特定百分比时检测 所述序列内的所述场景转换。
24.如权利要求22所述的设备,其中所述检测装置在像素值的所述分布在具有中间范 围的可能像素值中的像素值的像素位置的数量上在30个或更少个帧内展现至少预定量的 增加时检测所述序列内的场景转换。
25.一种用于处理数字视频数据的集成电路装置,其包括至少一个处理器,所述至少一 个处理器经配置以分析像素强度值在所述数字视频数据的序列的多个帧上的分布;及在像素值的所述分布在具有中间范围的可能像素值中的像素值的像素位置的数量上 展现至少预定量的短期增加时检测所述序列内的场景转换。
全文摘要
本发明描述用于检测数字视频序列中的场景转换的技术。编码装置可(例如)分析像素值在多个帧上的分布以检测发生所述场景转换的位置。特定来说,所述编码装置分析具有中间范围的可能像素值中的值的像素位置的分布以在所述多个帧中识别在具有中间范围像素值的像素位置的数量上经历显著短期增加的位置。在具有所述中间范围的可能像素值中的像素值的像素位置的所述数量上的显著短期增加指示软转换。以此方式,通过在所述多个帧内识别在具有中间范围像素值的像素位置的所述数量上具有显著短期增加的位置来检测渐进场景转换的发生。
文档编号H04N5/14GK101836431SQ200880112765
公开日2010年9月15日 申请日期2008年10月30日 优先权日2007年10月30日
发明者刘方, 塞伊富拉·哈利特·奥古兹, 帕尼库马尔·巴米蒂帕提, 阿米特·罗哈吉 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1