字幕检测设备、字幕检测方法、及降频信号检测设备的制作方法

文档序号:7650113阅读:165来源:国知局
专利名称:字幕检测设备、字幕检测方法、及降频信号检测设备的制作方法
技术领域
本发明总地涉及一种用于将隔行扫描视频信号变换为逐行扫描视频信号的设备,更具体地涉及一种检测诸如通过2-3降频或2-2降频方式生成的移动图像信号的隔行扫描视频信号中的字幕的设备。
背景技术
在通常将NTSC视频信号用作TV广播信号的情况中,通过隔行扫描系统扫描视频信号。在该系统中,增加了每秒钟的图像当量(equivalent number of image),从而降低了表面闪烁。另一方面,近些年中,诸如液晶显示(LCD)装置或等离子显示装置的薄TV接收机已经稳步地赢得了欢迎。如果在这些薄TV接收机上的扫描线上直接显示隔行扫描视频信号,则会大大降低屏幕的亮度,并且所显示的图像不值得观看。为了避免这个问题,在这些显示装置中,通过逐行扫描系统来显示图像。当要在诸如LCD装置的逐行扫描显示装置上显示隔行扫描视频信号时,需要隔行扫描/逐行扫描变换电路。
在一些情况中,诸如NTSC信号的标准TV视频信号包括基于电影胶片产生的视频信号。电影胶片每秒有24帧,而标准TV视频信号是每秒具有30帧(每秒60场)的隔行扫描视频信号。所以,通过2-3降频(pull-down)方法或2-2降频方法将电影胶片的视频信号变换为标准TV视频信号。在下面的说明中,将通过变换从电影胶片的视频信号得到的隔行扫描视频信号称为“降频信号”。
例如,在2-3降频方法中,首先,以24Hz的帧频扫描电影胶片,以产生隔行扫描视频信号。然后,变换隔行扫描视频信号,以使电影胶片的第一帧可以对应于第一和第二场(2个场)、第二帧对应于第三至第五场(3个场)、第三帧对应于第六和第七场(2个场)、第四帧对应于第八至第十场(3个场)。在被变换为降频信号的场信号中,交替重复奇数场和偶数场。当将电影胶片的帧变换为3个场时,最后一个场(第五场、第十场)是与第一个场(第三场、第八场)相同的视频内容的重复。
通过此方式,使电影胶片的两帧对应于标准TV视频信号的五个场,并根据电影胶片的帧交替重复2-场视频信号和3-场视频信号。从而生成降频信号。
为了将降频信号变换为逐行扫描信号,必须将由电影胶片的同一帧生成的两个场结合为一帧。实现该处理的逐行扫描变换设备确定输入视频信号是否为降频信号。在输入视频信号是降频信号的情况下,该设备确定将要结合的场(下文中称为“对场(pair field)”)。通过结合这些场,生成逐行扫描信号。将这种信号处理称为“降频内插处理(pull-down interpolation process)”。
在一些情况中,诸如电影的视频包括字幕。不管视频信号是否为降频信号,都配置了字幕,以通过多个帧将相同的字符模式混合在视频中。在降频信号中包括字幕的情况下,很难确定视频信号是否为降频信号。
第2002-057993号日本专利申请KOKAI公开文本(专利文件1)中公开了一种技术,其中,当输入视频信号是上述的降频信号时,在没有检测到字幕区域的情况下,执行2-3降频内插处理,以及在检测到字幕区域的情况下,基于运动自适应(motion-adaptive)内插处理生成IP变换信号。
上述的专利文件1没有说明用于检测字幕的具体结构。所以,在现有技术中,不能精确地检测字幕区域且不能正确地执行降频内插处理。

发明内容
本发明的目的在于,精确检测降频信号中的字幕区域并圆满检测降频信号。
总地来说,根据本发明的一个实施例,提供了一种字幕检测设备,其包括差分单元13,用于提供输入视频信号的当前场信号和延迟至少一个场周期的当前场信号之间的场间差分;积分单元14,用于将屏幕划分成多个区域,对包括在多个区域中的每个中的场间差分进行积分,以及提供区域内积分值;以及第一比较单元15,用于将来自积分单元的区域内积分值和第一比较值进行比较,以检测在多个区域中的至少一个中是否检测到了字幕。
根据本实施例,可以精确检测降频信号中的字幕区域,并可以圆满检测降频信号。


提供的附图和相关说明用于阐述本发明的实施例,而不用于限制本发明的范围。
图1是示出根据本发明的第一实施例的字幕检测设备10A的结构的框图;
图2A和图2B示出了场信号中的字幕的实例;图3示出了作为动态范围计算电路16的第一实施例的动态范围计算电路16A;图4示出了作为动态范围计算电路16的第二实施例的动态范围计算电路16B;图5是示出根据本发明的第二实施例的字幕检测设备10B的结构的框图;图6是示出根据本发明的第三实施例的字幕检测设备10C的结构的框图;图7是示出根据本发明的第四实施例的字幕检测设备10D的结构的框图;图8示出了应用本发明的逐行扫描设备40的实例;图9A至图9C示出了如何延迟隔行扫描2-3降频信号;图10示出了作为另一降频信号系统的隔行扫描2-2降频信号;图11示出了根据本发明的降频信号检测电路47的第一实施例;图12A至图12E示出了2-3降频信号的场间相关性和帧间相关性的确定结果的实例;以及图13是示出降频信号检测电路47的第二实施例的结构的框图。
具体实施例方式
下面参考附图,详细说明本发明的实施例。
图1是示出根据本发明的第一实施例的字幕检测设备10A的结构的框图。
当前场信号(亮度信号)S1通过第一垂直低通滤波器(LPF)11,然后输入到场间差分绝对值电路13和区域内动态范围计算电路16中。1-场延迟信号S2通过第二垂直LPF 12,然后输入到场间差分绝对值电路13中。1-场延迟信号S2是通过使用存储电路将当前场信号S1延迟1-场周期而获得的信号(如下面将参考图8详细描述)。第一和第二垂直LPF 11和12去除1场中的垂直高频噪声,并校准当前场信号S1和1-场延迟信号S2的垂直中点。可以将水平LPF用于噪声去除滤波器。
场间差分绝对值电路(差分单元)13逐像素地计算前述的两个输入场信号之间的差分绝对值FDA。将场间差分绝对值FDA提供给区域内积分电路14。区域内积分电路(积分单元)14累加矩形区域(例如,水平的8像素×垂直的8条线、或水平的16像素×垂直的8条线)单元中的差分绝对值FDA,并输出区域差分累加值SDA。第一比较器15将区域差分累加值SDA和区域单元中的差分比较阈值FDT进行比较,并输出差分比较结果FDC。
图2A和图2B示出了场信号中的字幕的实例。图2A和图2B示出了字幕中的字符“A”。图2A示出了当前场信号S1,图2B示出了1-场延迟信号S2。如果计算场信号S1和S2之间的差分,则可以获得多个大值差分(相对于不包括字幕字符的普通场信号)。从而,从区域内积分电路14输出的差分累加(积分)值SDA变得大于差分比较阈值FDT,第一比较器15输出(例如)H电平信号作为差分比较结果FDC。
区域内动态范围计算电路16计算前述区域中的经过垂直LPF11过滤的当前场信号S1的动态范围。具体地,计算电路16输出前述区域中的当前场信号S1的最大值和最小值之间的差作为区域内动态范围SDR。第二比较器17将区域内动态范围SDR和动态范围比较阈值DCT进行比较,并输出动态范围比较结果SDC。
通常,用白色(即,用最高亮度)显示字幕区域中的字符。因此,字幕区域中的动态区域一般具有高值。如果动态范围SDR大于动态范围比较阈值DCT,则比较器17输出(例如)H电平信号作为动态范围比较结果SDC。
根据本发明的一个实施例,运算单元(例如,包括AND电路的组合逻辑)18执行差分比较结果FDC和动态范围比较结果SDC之间的逻辑运算(例如,AND运算),并输出字幕区域检测信号STD。具体地,如果差分积分值SDA大于差分比较阈值FDT,并且如果动态范围SDR大于与上述区域有关的动态范围比较阈值DCT,则运算电路18确定该区域是字幕区域的一部分,并输出(例如)高(H)电平信号作为字幕区域检测信号STD。
如上所述,当检测字幕区域时,不仅确定了区域中的场间差分绝对值的积分值,而且确定了动态范围。从而,可以提高检测的精度。
图3示出了作为动态范围计算电路16的第一实施例的动态范围计算电路16A。
区域内最大亮度值检测电路31接收来自垂直LPF 11的当前场信号S1,并检测区域中的最大亮度值BMX。区域内最小亮度值检测电路32接收来自垂直LPF 11的当前场信号S1,并检测区域中的最小亮度值BMN。差分绝对值计算电路33计算最大亮度值BMX和最小亮度值BMN之间的差分绝对值,并输出计算出的值作为区域内动态范围SDR1。
图4示出了作为动态范围计算电路16的第二实施例的动态范围计算电路16B。
区域内高亮度检测电路34接收来自垂直LPF 11的当前场信号S1,提取区域中的第一至第n高亮度值,并输出所提取的值作为高亮度SHB。高亮度平均值计算电路35计算高亮度SHB的平均值HBM。例如,如果n为4、区域中的最高亮度为100、区域中的第二高亮度为99、具有亮度100的像素的数目为1、并且具有亮度99的像素的数目为4,则高亮度平均值计算电路35计算(100+99×3)/4作为高亮度平均值HBM,并输出99.25作为高亮度平均值HBM。
区域内低亮度检测电路36接收来自垂直LPF 11的当前场信号S1,提取区域中的第一至第n低亮度值,并输出所提取的值作为低亮度SLB。低亮度平均值计算电路37计算低亮度SLB的平均值LBM。例如,如果n为4、区域中的最低亮度为1、区域中的第二低亮度为2、具有亮度1的像素的数目为1、并且具有亮度2的像素的数目为4,则低亮度平均值计算电路36计算(1+2×3)/4作为低亮度平均值LBM,并输出1.75作为低亮度平均值LBM。差分绝对值计算电路38计算高亮度平均值HBM和低亮度平均值LBM之间的差分绝对值,并输出计算出的值作为区域内动态范围SDR2。
所以,动态范围计算电路16B相较于动态范围计算电路16A,可以抑制噪声的影响。
接下来,说明动态范围计算电路16B的修改。在该修改中,区域内高亮度检测电路34在与像素有关的区域中(其不包括具有最高亮度的一个或预定数目的像素)提取第一至第n高亮度值,并输出所提取的值作为高亮度SHB。区域内低亮度检测电路36在与像素有关的区域中(其不包括具有最低亮度的一个或预定数目的像素)提取第一至第n低亮度值,并输出所提取的值作为低亮度SLB。其他电路块的操作与上述块的操作相同。
例如,在由于噪声而使具有最高亮度的一个像素被包括在不包括字幕的区域中的情况下,该区域的动态范围将受到噪声的很大影响,并有可能将该区域确定为字幕区域。类似地,例如,在由于噪声而使具有最低亮度的一个像素被包括在不包括字幕的区域中的情况下,该区域的动态范围将受到噪声的很大影响,并有可能将该区域确定为字幕区域。所以,在该修改中,可以在动态范围的计算中进一步抑制包括在该区域中的噪声的影响。
图5是示出根据本发明的第二实施例的字幕检测设备10B的结构的框图。字幕检测设备10B除了包括图1中所示的字幕检测设备10A的结构外,还包括多场监控电路19。
当对于预定数目或更多的场来说字幕区域确定条件(已经结合图1所示的第一实施例进行了说明)连续成立时,多场监控电路19将该区域确定为字幕区域。具体地,对于预定数目或更多场来说,如果差分积分值SDA大于差分比较阈值FDT以及动态范围SDR大于与上述区域有关的动态范围比较阈值DCT的条件连续成立,则多场监控电路19将该区域确定为字幕区域。
根据第二实施例的字幕检测设备10B可以排除由于噪声等造成的字幕区域的错误检测。简言之,相较于字幕检测设备10A,在字幕检测设备10B中,虽然字幕区域的检测结果延迟了预定数目的场,但可以增强检测结果的可靠性。
图6是示出根据本发明的第三实施例的字幕检测设备10C的结构的框图。字幕检测设备10C包括比较器21和区域内高亮度像素数目计数电路22(它们代替了图1中所示的字幕检测设备10A的动态范围计算电路16)。
如上所述,通常,用具有最大亮度的白色显示字幕区域中的字符。通过比较器21、区域内高亮度像素数目计数电路22、以及比较器23,对该区域中的具有高亮度的像素的数目进行计数,并且在高亮度像素的数目大于比较阈值HBT的情况下,确定该区域为字幕区域。
比较器21将来自垂直LPF 11的当前场信号S1和亮度等级(level)比较阈值BLT进行比较。如果当前场信号S1的值大于比较阈值BLT,则比较器21输出一个H电平脉冲。计数电路22对来自比较器21的输出脉冲进行计数,并输出计数结果HBC。比较器23将计数结果HBC和高亮度像素数目比较阈值HBT进行比较,并输出比较结果HBR。除了比较器21、计数电路22、和比较器23以外的电路块的操作和图1中所示的字幕检测设备10A中的电路块的操作相同。
图7是示出根据本发明的第四实施例的字幕检测设备10D的结构的框图。除了图1中所示的字幕检测设备10A的结构以外,字幕检测设备10D包括图6中所示的比较器21、计数电路22、和比较器23。可以通过增加用于确定前述的区域是否为字幕区域的条件的数目来提高字幕检测设备的字幕区域检测精度。
图8示出了应用本发明的逐行扫描设备40的实例。图8中的降频信号检测电路47包括根据图7中所示的本发明的实施例的字幕检测设备10D。
将当前场信号S1(其是隔行扫描输入亮度信号)输入第一场延迟电路41,并将其作为具有1场延迟的1-场延迟信号S2输出。场延迟电路41包括(例如)两个1-场存储区。将输入的1-场视频信号交替地记录在两个存储区中。类似地,将记录的视频信号交替地读出两个存储区。从而,当将记录的当前场信号作为1-场延迟信号S2读出第一场延迟电路41时,将下一个当先场信号作为场信号S1记录在第一场延迟电路41中。将1-场延迟信号S2输入第二场延迟电路42,并将其作为具有1场延迟的2-场延迟信号S3输出。第二场延迟电路42的结构和操作与第一场延迟电路41相同。
图9A至图9C示出了延迟隔行扫描2-3降频信号的图解。图9A示出了输入当前场信号(2-3降频信号)S1。在信号S1中,Ae是由电影胶片的帧A生成的偶数场,Ao是由电影胶片的帧A生成的奇数场。类似地,Be是由电影胶片的帧B生成的偶数场,Bo是由电影胶片的帧B生成的奇数场。同样适用于Ce、Co、.....。图9B示出了通过将图9A的信号延迟1场而获得的1-场延迟信号S2。图9C示出了通过进一步将图9B的信号延迟1场而获得的2-场延迟信号S3。
图10示出了作为降频信号的另一个实例的隔行扫描2-2降频信号。2-2降频信号是包括由电影胶片的相关帧生成的奇数场和偶数场的视频信号。和2-3降频信号一样,通过每个场延迟电路将2-2降频信号延迟1场。
返回参考图8,运动图像内插信号生成电路43(例如)使用运动向量,通过运动补偿内插法(motion compensation interpolation),从当前场信号S1、1-场延迟信号S2、及2-场延迟信号S3生成位于1-场延迟信号S2的扫描线之间的运动图像内插信号。静止图像内插信号生成电路44(例如)通过平均当前场信号S1和2-场延迟信号S3、或通过使用2-场延迟信号S3本身的值,从当前场信号S1和2-场延迟信号S3生成位于1-场延迟信号S2的扫描线之间的静止图像内插信号。
运动检测电路45基于当前场信号S1和2-场延迟信号S3检测帧间运动,并向混合电路46输出运动检测信号。混合电路46根据运动检测信号改变混合比例,并混合运动图像内插信号和静止图像内插信号,从而生成运动-自适应内插信号MRC。
降频信号检测电路47基于当前场信号S1、1-场延迟信号S2、以及2-场延迟信号S3检测1-场延迟信号S2是否为降频信号,并生成降频信号检测信号PDD和对场(pair field)选择信号PFD。
图11示出了根据本发明的降频信号检测电路47的第一实施例。降频信号检测电路47包括作为本发明的字幕检测设备的实例的图7中所示的根据第四实施例的字幕检测设备10D。所以,下面描述除了字幕检测设备10D之外的电路块。
帧间差分绝对值电路51通过垂直LPF接收当前场信号S1和2-场延迟信号S3。帧间差分绝对值电路51逐像素地计算两个输入信号之间的差分绝对值FDB。区域内积分电路52对区域中的差分绝对值进行积分(累加),并输出积分值SDB。
帧间区域运动检测电路53基于积分值SDB检测区域内图像的帧间运动(像素值变化),并输出运动检测结果FMB。在积分值SDB大于(例如)预定阈值的情况下,帧间区域运动检测电路53确定图像正在帧间移动(像素值变化大),并输出(例如)H电平信号。
帧间全屏相关性检测电路54基于运动检测结果FMB检测全屏幕上的帧间相关性(相似性)的等级,并输出帧间相关性检测结果FRB。例如,帧间全屏相关性检测电路54对1屏幕中的区域的数目求和,其中,确定图像正在移动(即,像素值变化大)。在总和大于预定阈值的情况下,帧间全屏相关性检测电路54输出“弱”(例如,0)作为1-屏幕相关性检测结果FRB。
场间区域运动检测电路55基于积分值SDA检测区域内图像的场间运动(像素值变化),并输出运动检测结果FMA。在积分值SDA大于(例如)预定阈值的情况下,场间区域运动检测电路55确定图像正在场间移动(像素值变化大),并输出(例如)H电平信号。
场间全屏相关性检测电路56基于运动检测值FMA检测全屏幕上的场间相关性的等级,并输出场间全屏相关性检测结果FRA。例如,场间全屏相关性检测电路56对1屏幕中的区域的数目求和,其中,确定图像正在移动(即,像素值变化大)。在总和大于预定阈值的情况下,场间全屏相关性检测电路56输出“弱”(例如,0)作为1-屏相关性检测结果FRA。
在字幕检测设备10D的检测结果STD表示出“字幕”(例如,1)的情况下,帧间区域运动检测电路53和场间区域运动检测电路55中的每一个都输出表示图像没有移动的信号(例如,0)。在一般的情况中,对于字幕区域,帧间区域运动检测电路53和场间区域运动检测电路55中的每一个都确定图像正在移动(像素值变化大),而不管背景图像是静止图像还是运动图像。所以,在本实施例中,对于字幕区域,帧间区域运动检测电路53和场间区域运动检测电路55的输出信号都设置为0(不运动)。从而,可以大大降低图像运动的错误检测的可能性。
在另一实施例中,在字幕检测设备10D的检测结果表示为“字幕”(例如,1)的情况下,在帧间全屏相关性检测电路54和场间全屏相关性检测电路56中减少全屏中的区域的数目。例如,在1屏幕包括1000个区域,并且确定为字幕区域的区域数目为100的情况中,帧间全屏相关性检测电路54基于与另外900个区域相关的检测结果FMB来确定帧间相关性的等级。类似地,场间全屏相关性检测电路56基于与另外900个区域相关的检测结果FMA来确定场间相关性的等级。在这种情况中,没有将字幕区域检测结果STD传送至图11中所示的运动检测电路53和55,而是将其传送至帧间全屏相关性检测电路54和场间全屏相关性检测电路56(如通过虚线示出的)。所以,可以在不受字幕区域的影响的条件下,确定帧间相关性和场间相关性的等级。
降频信号确定电路57基于场间相关性检测信号FRA和帧间相关性检测信号FRB,输出表明输入视频信号是否为降频信号的降频信号检测信号PDD。另外,降频信号确定电路57基于相关性检测信号FRA和FRB,输出表明用于1-场延迟信号S2的对场的对场信号PFD。
图12A至图12E示出了场间相关性和帧间相关性的确定结果的实例。假设将2-3降频信号输入至该设备。
图12A示出了当前场信号S1。图12B示出了1-场延迟信号S2。图12C示出了2-场延迟信号S3。图12D示出了帧间(S1和S3间)的相关性(帧间相关性检测信号FRB)。图12E示出了场间(S1和S2间)的相关性(场间相关性检测信号FRA)。
例如,在如图12中所示输入2-3降频信号的情况中,与连续场相关的帧间相关性检测电路54的确定结果是图12D中的周期P1中所示的(“弱”、“弱”、“强”、“弱”、“弱”)的模式的重复。所以,降频信号确定电路57检测这个降频模式。在2-2降频信号的情况中,与连续场相关的帧间相关性检测电路54的确定结果是(一直为“弱”)的模式。所以,降频信号确定电路57检测该降频模式。
在2-3降频信号的情况中,与连续场相关的场间相关性检测电路56的确定结果是如图12E中的时间周期P1中的(“弱”、“强”、“强”、“弱”、“强”)的降频模式的重复。所以,降频信号确定电路57检测该降频模式。
当上述的降频模式的检测结果在预定数目的场周期内继续时,降频信号确定电路57基于降频模式确定输入至该设备的场信号是否为降频信号(诸如,2-3降频信号或2-2降频信号)。
如果输入至该设备的场信号是降频信号,则降频信号确定电路57输出表明和1-场延迟信号S2成对的场是当前场信号S1还是2-场延迟信号S3的对场选择信号PFD。
返回参考图8,第一选择器48基于对场选择信号PFD,选择当前场信号S1和2-场延迟信号S3之一作为和1-场延迟信号S2成对的场,并向第二选择器49输出所选择的信号作为对场信号PF。在降频信号检测信号PDD表明降频信号的情况中,第二选择器49选择对场信号PF。否则,第二选择器49选择运动自适应内插信号MRC。第二选择器19输出所选择的信号作为内插信号ICS。另外,在字幕区域检测信号STD表示出字幕区域的情况中,选择器49输出运动自适应内插信号MRC作为内插信号ICS。
逐行扫描校准电路50顺序排列(混合)内插信号ICS和作为直接信号的1-场延迟信号S2,并生成逐行扫描变换信号CPS。
在输入视频信号为降频信号并且屏幕包括字幕区域的情况中,根据本发明实施例的逐行扫描设备40精确地检测(例如)8×8像素的区域单元中的字幕区域,并基于不同于字幕区域的区域的视频信号来检测降频信号。从而,可以改进降频信号的检测精度。
另外,根据本发明的实施例,通过将运动自适应内插信号MRC用作直接信号S2的内插信号,在该区域单元中精确地检测降频信号中的字幕区域,并生成仅与字幕区域相关的逐行扫描变换信号CPS。
例如,在从图9C中的场F2插入字幕的情况中,如果执行现有技术的降频内插处理,则将场F1和F2混合为降频信号的第一帧。结果,将图2A中所示的字符显示在显示屏上。将以条纹显示字幕的字符的现象称为“梳状现象(combing phenomeno)”。
如上所述,在本发明中,在区域单元中检测字幕区域,并仅将与字幕区域相关的场和用作直接信号S2的内插信号的运动自适应内插信号MRC混合。所以,即使在输入视频信号是降频信号的情况下,也不会发生梳状现象。在字幕区域中,降频信号被忽略了,视频信号的质量被稍微降低了。但是,具有降低的质量的区域仅限于字符轮廓附近的背景图像(即,区域的宽度中)。另外,由于字幕区域通常出现在屏幕的端部(诸如,屏幕的下部或上部),所以字符轮廓附近的背景图像的劣化不会引起严重问题。
根据本发明的实施例,提高了降频信号检测中的精度,防止了字幕的梳状现象,从而可以显示清楚的视频和字幕(字符串)。
接下来,说明降频信号检测电路47的另一实例。
图13是示出降频信号检测电路47的第二实施例的结构的框图。降频信号检测电路47除了包括图11中所示的降频信号检测电路的结构之外,还包括字幕检测设备10E。字幕检测设备10E包括区域内动态范围计算电路16′、比较器17′、比较器21′、区域内高亮度像素数目计数电路22′、比较器23′、AND电路27′、和OR电路28。字幕检测设备10E的操作和字幕检测设备10D的操作相同。
图13中所示的根据本实施例的降频信号检测电路47不仅通过字幕检测设备10E基于当前场信号S1执行字幕检测,而且通过字幕检测设备10E基于1-场延迟信号S2执行字幕检测。字幕检测设备10D和字幕检测设备10E共用场间差分绝对值电路13、区域内积分电路14、以及比较器15。
在本发明中,在字幕存在于屏幕中的某区域中的当前场信号S1或1-场延迟信号S2中的情况下,相对于不包括该区域的区域执行降频信号检测。从而,在降频信号检测过程中,不仅可以避免当前场信号的字幕的影响,而且可以避免1-场延迟信号的字幕的影响。
可以根据需要,将组成本发明的上述实施例的块构造为包括电子电路或软件处理步骤的硬件。
尽管已经描述了本发明的某些实施例,但仅是通过实例来呈现出这些实施例,而不用于限制本发明的范围。事实上,本文描述的新颖方法和系统可以以各种其他形式来体现;另外,在不脱离本发明的精神的条件下,可以对本文中描述的方法和系统的形式进行各种省略、替换、和修改。所附的权利要求及其等同物用于覆盖将落入本发明的范围和精神中的这些形式或修改。
权利要求
1.一种字幕检测设备,其特征在于,包括差分单元(13),用于提供输入视频信号的当前场信号和延迟了至少一个场周期的所述当前场信号之间的场间差分;积分单元(14),用于将屏幕划分成多个区域,对包括在每个所述区域中的所述场间差分进行积分,以及提供区域内积分值;以及第一比较单元(15),用于将来自所述积分单元(14)的所述区域内积分值和第一比较值进行比较,以检测在所述多个区域中的至少一个中是否检测到了字幕。
2.根据权利要求1所述的字幕检测设备,其特征在于,进一步包括动态范围计算单元(16),用于将所述屏幕划分成多个区域,并计算每个所述区域中的亮度的动态范围;第二比较单元(17),用于将所述动态范围计算单元(16)计算出的所述动态范围和第二比较值进行比较,以及在所述区域的多个单元中提供动态范围比较结果;以及运算单元(18),用于执行作为通过比较所述区域内积分值和所述第一比较值产生的结果的积分值比较结果和所述动态范围比较结果之间的逻辑运算,以及将所述逻辑运算的结果作为字幕区域检测信号来提供。
3.根据权利要求2所述的字幕检测设备,其特征在于,进一步包括监控单元,连接至所述运算单元,所述监控单元用于在所述字幕区域检测信号表明相对于预定数目的场连续检测到了所述字幕区域时,将所述区域确定为字幕区域。
4.根据权利要求2所述的字幕检测设备,其特征在于,进一步包括计数单元(22),用于将所述屏幕划分成多个区域,以及对每个所述区域中的具有高亮度的像素的数目进行计数;以及第三比较单元(23),连接至所述计数单元(22),所述第三比较单元(23)用于将所述像素数目和预定阈值进行比较,并提供高亮度像素数目比较结果;以及运算单元(18),用于执行所述积分值比较结果、所述动态范围比较结果、以及所述高亮度像素数目比较结果之间的逻辑运算。
5.根据权利要求1所述的字幕检测设备,其特征在于,进一步包括第一滤波器(11),用于去除所述当前场信号的高频噪声分量;以及第二滤波器(12),用于去除所述延迟的当前场信号的高频噪声分量,将通过所述第一滤波器(11)去除其噪声分量的所述当前场信号提供给所述差分单元(13)和所述动态区域计算单元(16),并将通过所述第二滤波器(12)去除其噪声分量的所述延迟的当前场信号提供给所述差分单元(13)。
6.根据权利要求2所述的字幕检测设备,其特征在于,进一步包括第一滤波器,用于去除所述当前场信号的高频噪声分量;以及第二滤波器,用于去除所述延迟的当前场信号的高频噪声分量,其中将通过所述第一滤波器去除其噪声分量的所述当前场信号提供给所述差分单元(13)和所述动态范围计算单元,并将通过所述第二滤波器去除其噪声分量的所述延迟信号提供给所述差分单元(13)。
7.根据权利要求2所述的字幕检测设备,其特征在于,所述动态范围计算单元(16A)将所述当前场中的所述区域中的最大亮度和最小亮度之间的差作为动态范围来提供。
8.根据权利要求2所述的字幕检测设备,其特征在于,所述动态范围计算单元(16B)将所述区域中的具有第一高亮度的像素到具有第n高亮度的像素的亮度平均值和所述区域中的具有第一低亮度的像素到具有第n低亮度的像素的亮度平均值之间的差作为动态范围来提供。
9.一种降频信号检测设备,其特征在于,包括第一差分单元(51),用于提供输入视频信号的当前场信号和所述当前场信号的2-场延迟信号之间的帧间差分;第一积分单元(52),连接至所述第一差分单元(51),所述第一积分单元用于(i)将包括所述输入视频信号的屏幕划分成多个区域;(ii)对包括在所述区域中的所述帧间差分进行积分;以及(iii)提供区域内第一积分值;字幕检测单元(10);帧间相关性检测单元(54),连接至所述字幕检测单元(10),所述帧间相关性检测单元用于基于从所述字幕检测单元(10)输出的所述字幕区域检测信号来检测帧间相关性等级;场间相关性检测单元(56),连接至所述字幕检测单元(10),所述场间相关性检测单元用于基于从所述字幕检测单元(10)输出的所述字幕区域检测信号和来自所述第二积分单元(14)的所述第二积分值来检测场间相关性等级;以及确定单元(57),连接至所述帧间相关性检测单元(54)和所述场间相关性检测单元,所述确定单元用于确定所述输入视频信号是否为降频信号。
10.根据权利要求9所述的降频信号检测设备,其特征在于,所述字幕检测单元包括(a)第二差分单元(13),用于提供所述输入视频信号的所述当前场信号(S1)和所述当前场信号的延迟信号(S2)之间的场间差分;(b)第二积分单元(14),用于将所述屏幕划分成多个区域,对包括在每个所述区域中的所述场间差分进行积分,以及提供区域内第二积分值;(c)第一比较单元(15),用于将来自所述第二积分单元(14)的所述区域间第二积分值和第一比较值进行比较,并提供积分值比较结果;(d)动态范围计算单元(16),用于将包括所述当前场信号的屏幕划分成多个区域,以及计算每个所述区域中的亮度的动态范围;(e)第二比较单元(17),用于将所述动态范围比较单元(16)计算出的所述动态范围和第二比较值进行比较,并提供动态范围比较结果;以及(f)第一运算单元(27),用于执行所述第一比较单元(15)的所述积分值比较结果和所述动态范围比较结果之间的逻辑运算,以及将所述逻辑运算的结果作为字幕区域检测信号来提供。
11.根据权利要求10所述的降频信号检测设备,其特征在于,所述字幕检测单元(10B)包括多场监控单元(19),用于在所述字幕区域检测信号表明相对于预定数目的场连续检测到了所述字幕区域的情况下,将所述区域确定为字幕区域。
12.根据权利要求10所述的降频信号检测设备,其特征在于,所述字幕检测单元(10D)进一步包括计数单元(22),用于将所述屏幕划分成多个区域,并对每个所述区域中的具有高亮度的像素的数目进行计数;以及第三比较单元(23),用于将所述计数单元(22)所计的所述像素数目和预定阈值进行比较,以及提供高亮度像素数目比较结果;第一运算单元(27),用于执行所述第一比较单元(15)的所述积分值比较结果、所述动态范围比较结果、以及所述高亮度像素数目比较结果之间的逻辑运算。
13.根据权利要求12所述的降频信号检测设备,其特征在于,所述字幕检测单元(10E)进一步包括第二动态范围计算单元(16′),用于将包括所述延迟信号(S2)的屏幕划分成多个区域,以及计算每个所述区域中的亮度的动态范围;第三比较单元(17′),用于将所述第二动态范围计算单元(16′)计算出的所述动态范围和第三比较值进行比较,并提供第二动态范围比较结果;第二运算单元(27′),用于执行所述第一比较单元(15)的所述积分值比较结果和所述第二动态范围比较结果之间的逻辑运算,并提供所述逻辑运算的结果;以及第三运算单元(28),用于执行所述第一运算单元(27)的所述逻辑运算的结果和所述第二运算单元(27′)的所述逻辑运算的结果之间的逻辑运算,并将所述逻辑运算的结果作为字幕区域检测信号来提供。
14.一种字幕检测方法,其特征在于,包括以下步骤生成输入视频信号的当前场信号和所述当前场信号的延迟信号之间的场间差分(13);将包括所述输入视频信号的屏幕划分成多个区域,对包括在每个所述区域中的所述场间差分进行积分,并提供区域内积分值(14);将所述区域内积分值和第一比较值进行比较,并提供积分值比较结果(15);将所述屏幕划分成多个区域,并计算每个所述区域中的亮度的动态范围(16);将所述动态范围和第二比较值进行比较,并提供动态范围比较结果(17);以及执行所述积分值比较结果和所述动态范围比较结果之间的逻辑运算以产生结果,并将所述结果作为字幕区域检测信号来提供(18)。
15.根据权利要求14所述的字幕检测方法,其特征在于,进一步包括以下步骤在所述字幕区域检测信号表明相对于预定数目的场连续检测到了所述字幕区域的情况下,将所述区域确定为字幕区域(19)。
16.根据权利要求14所述的字幕检测方法,其特征在于,进一步包括以下步骤将所述屏幕划分成多个区域,并对每个所述区域中的具有高亮度的像素的数目进行计数(22);以及将所述具有高亮度的像素的数目和预定阈值进行比较,并提供高亮度像素数目比较结果(23),其中,在所述积分值比较结果、所述动态范围比较结果、以及所述高亮度像素数目比较结果之间执行所述逻辑运算。
全文摘要
积分电路(14)将包括输入视频信号的屏幕划分成多个区域,对包括在每个区域中的场间差分的绝对值进行积分,并提供区域内积分值(SDA)。动态范围计算电路(16)将屏幕划分成多个区域,并计算每个区域中的亮度的动态范围(SDR)。在区域内积分值(SDA)大于比较阈值(FDT)、以及每个区域中的亮度的动态范围(SDR)大于比较阈值(DCT)的情况下,将该区域确定为字幕区域。
文档编号H04N5/278GK101043609SQ200710086639
公开日2007年9月26日 申请日期2007年3月23日 优先权日2006年3月24日
发明者山内日美生 申请人:株式会社东芝
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1