一种台标检测识别的方法及其装置制造方法

文档序号:6502065阅读:169来源:国知局
一种台标检测识别的方法及其装置制造方法
【专利摘要】本发明公开了一种台标检测识别的方法及其装置,其方法包括:检测到台标切换信号后采集机顶盒输出的具有台标信息的预设视频帧图像;获取所述预设视频帧图像中台标的区域;对所述区域中的图像进行文字识别获取台标;通过检测到台标切换信号后再进行台标检测与识别,有效降低后台图像数据的处理工作量;利用频道切换过程中频显信息及电视台的视频图像传输滞后的特点选取预设视频帧图像作为台标检测识别的基准,避免了视频图像背景和噪声的干扰,降低了算法的难度,提高处理速度,实现实时处理。另外,本发明对文字样本库和数字样本库的合理划分既能保证常用电视台的台标识别,又能简化识别出各县级本地台,还不会增加样本数,占用过多的存储空间。
【专利说明】一种台标检测识别的方法及其装置
【技术领域】
[0001 ] 本发明涉及图像识别【技术领域】,特别涉及一种台标检测识别的方法及其装置。
【背景技术】
[0002]电视台台标是一个电视台的标志,包含了该电视台台名、节目取向等重要语义信息,是实现视频分析、理解和检索的重要语意源之一。随着电视技术的飞速发展,现能收看到的电视台节目已扩展多达上百套。为了区分并显示各个电视台的信息,常通过人工对电视信号进行实时监控或者选择特定电视节目收录等方式,其工作强度大,工作效率低,并且难免会有失误。因此,台标检测和识别技术就显得尤为重要。
[0003]台标识别技术是基于内容的视频图像分析、检索领域的热门技术之一。台标的正确识别包括以下几个方面:一是台标的正确检测(分割);二是台标特征的有效表示;二是有效的识别算法。
[0004]上述对台标检测和台标识别技术都是通过对不断电视信号进行实时采集和处理,然而基于现有图像的复杂性、噪声干扰、半透明台标的不易分辨性、台标的相似度较高等情况,加大了算法难度,大大限制了各类基于台标检测和识别算法的应用,影响了准确性和识别率,导致有的台标识别速度慢或无法实现实时。
[0005]因此,现有技术还有待于改进和发展。

【发明内容】

[0006]鉴于上述现有技术的不足之处,本发明的目的在于提供一种台标检测识别的方法及其装置,以解决现有技术台标检测识别准确性不高、识别速度慢的问题。
[0007]为了达到上述目的,本发明采取了以下技术方案:
一种台标检测识别的方法,其包括:
A、检测到台标切换信号后采集机顶盒输出的具有台标信息的预设视频帧图像;
B、获取所述预设视频帧图像中台标的区域;
C、对所述区域中的图像进行文字识别获取台标。
[0008]所述的台标检测识别的方法,其中,在步骤A中,所述预设视频帧图像是检测到台标切换信号后,采集到的延迟第一预设时间后的具有台标信息的视频图像。
[0009]所述的台标检测识别的方法,其中,所述步骤B具体包括:
B1、识别预设视频帧图像的频显信息;
B2、在频显信息中提取出台标单元;
B3、对所述台标单元进行边缘检测,获取台标的区域。
[0010]所述的台标检测识别的方法,其中,所述步骤C具体包括:
Cl、提取区域中的所有字符段,判断字符段的标志位是否为1:如果是,则执行步骤C3 ;否则,执行步骤C2;
C2、将字符段与数字样本库中的数字模版进行匹配,如果匹配成功则返回步骤Cl继续判断下一个字符段;如果匹配失败则设置当前字符段的标志位为1,执行步骤C3 ;
C3、判断字符段中的文字是否与文字样本库中的文字模版匹配,当匹配时输出文字显示台标。
[0011]所述的台标检测识别的方法,其中,所述步骤A之前还包括:检测到频道切换信号后,若在第二预设时间达到后没有再次检测到频道切换信号,则生成台标切换信号。
[0012]所述的台标检测识别的方法,其中,所述数字模版包括阿拉伯数字O、;所述文字样本库包括区域样本库和取向样本库。
[0013]一种用于实现台标检测识别的装置,其包括:
图像采集模块,用于采集机顶盒输出的具有台标信息的预设视频帧图像;
区域获取模块,用于获取所述预设视频帧图像中台标的区域;
文字识别模块,用于对所述区域中的图像进行文字识别获取台标。
[0014]所述的台标检测识别的装置,其中,所述图像采集模块包括:
延时采集单元,用于检测到台标切换信号后,采集机顶盒输出的延迟第一预设时间后的具有台标信息的视频图像作为预设视频帧图像;
信号生成单元,用于检测到频道切换信号后,且在第二预设时间达到后没有再次检测到频道切换信号,则生成台标切换信号。
[0015]所述的台标检测识别的装置,其中,所述区域获取模块包括:
频显识别单元,用于识别预设视频帧图像的频显信息;
提取单元,用于在频显信息中提取出台标单元;
获取单元,用于对所述台标单元进行边缘检测,获取台标的区域。
[0016]所述的台标检测识别的装置,其中,所述文字识别模块包括:
判断单元,用于提取区域中的所有字符段,判断字符段的标志位是否为I;
数字匹配单元,用于将字符段与数字样本库中的数字模版进行匹配,在匹配成功时继续判断下一个字符段是否与数字模版匹配,在匹配失败时设置当前字符段的标志位为I;
文字匹配单元,用于判断字符段中的文字是否与文字样本库中的文字模版匹配,当匹配时输出文子显不台标。
[0017]相较于现有技术,本发明提供的台标检测识别的方法及其装置,通过采集机顶盒输出的预设视频帧图像,获取预设视频帧图像中台标的区域后,再对区域中的图像进行文字识别从而获取台标,降低了后台处理的工作量,避免了视频图像和噪声的干扰,大大降低了算法的难度,提高识别速度,实现了台标的实时检测识别。
【专利附图】

【附图说明】
[0018]图1A为现有技术初始观看的视频节目。
[0019]图1B为现有技术切换频道时电视屏幕的图像变化。
[0020]图1C为现有技术切换频道时在图1B的基础上延时第一时间后的图像。
[0021]图1D为现有技术切换频道时在图1C的基础上延时第二时间后的图像。
[0022]图1E为现有技术切换频道时在图1D的基础上延时第三时间后的图像。
[0023]图1F为现有技术切换频道时在图1C的基础上延时第四时间后的图像。
[0024]图2为本发明提供的台标检测识别的方法流程图。[0025]图3为本发明提供的用于实现台标检测识别的装置的结构框图。
【具体实施方式】
[0026]本发明提供一种台标检测识别的方法及其装置,为使本发明的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0027]现有技术中对电视台的台标进行检测和识别时,根据实际检测发现:在切换电视频道时,电视会出现中文台标标识等频显信息和电视视频存在一段时间延时的特点,且电视台的视频延时要比机顶盒的频显信息传输滞后。请同时参阅图1A?1F,切换频道时视频图像变化延迟过程如图1A至图1F所示:
初始观看的是如图1A所示的视频节目,台标I处显示的是CCTV2-财经频道。当切换频道时电视屏幕上显示如图1B显示的黑频,延时第一时间tl后出现如图1C所示的黑屏,控制框内显示正在直播、按暂停键开始回放的控制信息,屏幕右上角显示机顶盒的台号为018,台标信息为中央四台,再延迟第二时间t2后出现如图1D所示画面,图1D与图1C相比多了屏幕下方的频显信息框,包括方框内的台号(018)、台标信息(中央四台),时间、节目的内容及播放时间等。再延迟第三时间t3后出现如图1E所示的画面,在图1D的基础上黑屏变成了视频画面,其余保持不变。再延迟t4后出现如图1F所示的画面,在图1E的基础上控制框变成了台标2,显示CCTV4-中文国际,屏幕下方的频显信息框,屏幕右上角的台号、台标信息均消失,只剩电视台的台标及该频道的视频图像。
[0028]基于现有的切换频道时视频图像变化延迟过程,本发明提供一种台标检测识别的方法及其装置。请参阅图2,其为本发明提供的台标检测识别的方法流程图,并请同时参阅图1C、图1D。如图2所示,所述的台标检测识别的方法,包括:
S100、检测到台标切换信号后采集机顶盒输出的具有台标信息的预设视频帧图像; S200、获取所述预设视频帧图像中台标的区域;
S300、对所述区域中的图像进行文字识别获取台标。
[0029]在实际观看电视节目时,用户可能会有连续换台操作,一直按下频道切换键进行快速换台,会连续发射出频道切换信息。由于速度太快,此时可能检测不到台标信息。为了避免这种快速换台操作影响台标的检测识别,在步骤Sioo之前还包括:检测到频道切换信号后,若在第二预设时间达到后没有再次检测到频道切换信号,则生成台标切换信号。本实施例在确定是最后一次发出频道切换信号后才生成台标切换信号进行后续的台标检测识另IJ。若只有频道切换信号而无台标切换信号则不进行台标的检测和识别,只对视频图像进行重新采集、频道切换。这样无需时时进行图像处理或向云端传输数据,可以大大节省后台的信号处理强度。
[0030]在步骤SlOO中,所述预设视频帧图像是检测到台标切换信号后,采集到的延迟第一预设时间后的具有台标信息的视频图像。第一预设时间即为【背景技术】中所述的tl+t2的时间,预设视频帧图像也即是图1D所示的视频图像。需要注意的是,根据对不同地区机顶盒频显信息的调研,相当一部分地区在图1C中只有台号,没有台标信息;而图1D下方的方框内均有台号和台标信息。为此,本发明实施例采用图1D所示的视频图像作为台标检测识别的基准,而不是采用图1C所示的视频图像,不仅可以兼容各个地区的台标检测,还能加快检测识别的速度。
[0031 ] 所述步骤S200具体包括:
步骤1、识别预设视频帧图像的频显信息。
[0032]步骤2、在频显信息中提取出台标单元。
[0033]步骤3、对所述台标单元进行边缘检测,获取台标的区域。
[0034]由于部分地区的机顶盒在图1D所示的右上角没有台标信息,而下方的方框内一定会显示台标信息,因此本发明实施例需要先识别出频显信息、即预设视频帧图像下方的方框内的信息。频显信息包括区域I和区域2,区域I中显示台号(如018),台标信息(如中央四台)和当前的电视机时间。区域2中显示该电视台播放的节目内容简介及其对应播放时间。对台标检测识别有用的是区域I中的内容,选择区域I中的台标信息进行识别能准确区分出半透明台标和相似度较高的台标,提高识别率和准确度,为此,需要由步骤2裁剪出区域1、即台标单元。然后再由步骤3对区域I的矩形外框进行边缘检测,获取预设视频帧图像中台标的区域。
[0035]在步骤S300中,对所述区域I中的图像进行文字识别具体包括:
步骤11、提取区域中的所有字符段,判断字符段的标志位是否为1:如果是,则执行步骤13 ;否则,执行步骤12。其中,所述标志位用于存放字符段类型的判断结果,若标志位为I表示字符段为文字;标志位为O表示字符段不是文字、或没有判断过其类型。所述标志位与字符段 对应。
[0036]步骤12、将字符段与数字样本库中的数字模版进行匹配,如果匹配成功则返回步骤11继续判断下一个字符段;如果匹配失败则设置当前字符段的标志位为1,执行步骤13。
[0037]步骤13、判断字符段中的文字是否与文字样本库中的文字模版匹配,当匹配时输出文子显不台标。
[0038]从图1D中可以看出区域I中包括了台号、台标信息和时间。通常台号和时间采用阿拉伯数字显示,台标信息为中文字。在步骤11中,进行文字识别时,将台号、台标信息和时间当作三个字符段分别提取出来,分别判断当前的字符段的标志位是否为I。若为I说明其为文字,可以进行步骤13的文字匹配。若不为I说明其可能为阿拉伯数字,或者是还没有标志的文字,需进入步骤12将其与数字模版进行匹配做进一步地判断。本实施例中所述的文字包括中文字和英文字母。数字模版即为(T9的阿拉伯数字。若与数字(T9匹配就确认为当前的字符段为台号或时间,表示还没有检测到台标信息,需继续判断下一个字符段。若与数字模版不匹配,则确认为文字,只是该文字还没有标记,此时需将该文字对应的字符段的标志位置I即可。标志位置I后将不会变动,以便下次检测该台标信息时可以加快判断的速度。
[0039]判断该字符段为文字后,需继续判断该文字是哪几个字,即该台标信息表示的是哪个电视台的节目。在步骤13中,针对各个地区不同机顶盒显示的差异,所述文字样本库分为区域样本库和取向样本库。
[0040]基于我国有近300多个地级行政区划单位,有近3000个县级行政区划单位,各市县级单位都有很多自己的本地频道,若把所有的电视台都加入区域样本库中会增加数据处理的难度,占用过多空间。为此,所述区域样本库包括各省级、一线城市这类比较通用、常见的频道区域样本,如北京、广东、广西、湖南、湖北、浙江、重庆、南方、东方、凤凰、本港、TVB、翡翠、澳亚等,以保证各地区的共用性。另外,对于CCTVl的显示可能有多种变形,如,cctvl、CCTV-l、中央一台、中央I台、中央一套、中央I套、央视I套等,这些区域样本显示性的差异也都加入样本库,保证各不同地区及不同机顶盒频显的通用性。
[0041 ] 取向样本库用于标识各频道节目内容取向信息。由于各地区及不同机顶盒频道取向文字的频显存在一定的差异,如电影频道,有的地区可能显示为电影频道、影视频道。播放卡通节目的,不同地区的台标名称也不相同,如湖南的精鹰卡通、广东的嘉佳卡通、上海的炫动卡通等,为保证各地区及不同机顶盒频道取向文字的频显的适用性,将这些相关取向文字都加入样本取向库,设置一个大而全的取向库,使得各地区都具有通用性,且避免无法识别频道。取向样本库的文字模版包括:卫视、电视剧、综合、新闻、都市、公共、财经、经济、经贸、少儿、青年、卡酷少儿、精鹰卡通、炫酷卡通、电影、影视、国际、体育、健康、理财、购物、生活、时尚、图文、知音、法制、政法、国防军事、城市建设、环球奇观、发现之旅、老故事、宝贝家等;其他类型包括:台、套、频道。
[0042]对于二、三线城市、县级单位这些地方的电视频道一般只有当地才有,由于这些地方的机顶盒内有自己本地频道区域样本(如广东地区的潮州、汕头、佛山等各频道)。为保证对各地区对本地台的实用性,能识别出本地台,可以对字符段中的文字进行划分。根据惯用台标信息的排列方式,台标中的前两个文字通常为地区,后面的两个或多个文字通常为电视台的类型,如重庆影视频道、潮州公共频道、长沙政法频道等。为此,所述步骤13中将字符段中的文字与文字样本库中的文字模版进行匹配具体包括:
分别判断字符段中前两个文字、后面的其他文字是否与文字模版匹配:
当字符段中所有文字都匹配时,显示该台标对应的文字模版;
当前两个文字匹配,后面的其他文字不匹配时显示识别错误;
当前两个文字不匹配,后面的其他文字匹配时,显示“本地+文字模版”;
当所有文字都不匹配时,显示识别错误。
[0043]例如,假设台标信息为中央四台,则从区域样本库中可以找出中央四台对应CCVT-4-中文国际,则在图1F的台标2中显示CCVT-4-中文国际的图标。若假设台标信息为潮州公共频道,区域样本库中识别不到“潮州”,但能找到“公共频道”,可以显示为“本地公共频道”。同理,则长沙政法频道可识别为本地政法频道。
[0044]上述将字符段中的文字与文字模版进行匹配时采用文字样式匹配和特征值方式。文字样式匹配是指字符段中的文字与文字模版的文字是否一致。例如,需要识别的是“中央一台”,文字模版中有“中央一台”,两者匹配。特征值方式是提取出文字的特征值,文字模版中的文字提取出阈值;进行匹配时判断字符段中文字的特征值是否小于阈值。例如,需要识别的是“长沙政法频道”,其只有“政法频道”与文字模版中有相似的文字,特征值小于文字模版中的阈值,则识别为“本地政法频道”。文字样式匹配和特征值方式的识别率高,识别速度快,能实现实时处理。
[0045]基于上述的台标检测识别的方法,本发明还相应提供一种用于实现台标检测识别的装置,请同时参阅图3,其包括图像采集模块10、区域获取模块20和文字识别模块30,所述图像采集模块10、区域获取模块20和文字识别模块30依次连接。所述图像采集模块10用于采集机顶盒输出的具有台标信息的预设视频帧图像;区域获取模块20用于获取所述预设视频帧图像中台标的区域;文字识别模块30用于对所述区域中的图像进行文字识别获取台标。
[0046]其中,所述图像采集模块10包括信号生成单元101、和与信号生成单元101连接的延时采集单元102。信号生成单元101在检测到频道切换信号后,且在第二预设时间达到后没有再次检测到频道切换信号,则生成台标切换信号。频道切换信号由遥控器上的频道切换按键被按下产生。在换台时,将确认是最后一次按下频道切换按键时才生成台标切换信号,在频繁切换频道时无需时时进行图像处理或向云端传输数据,能减轻后台信号的处理强度。延时采集单元102在检测到台标切换信号后,采集机顶盒输出的延迟第一预设时间后的具有台标信息的视频图像作为预设视频帧图像。所述第一预设时间的大小为【背景技术】中的第一时间加上第二时间,采集到的预设视频帧图像即为图1D所示的视频图像。这样不仅可以兼容各个地区的台标检测,提高台标检测的准确性和全面性,还能加快检测识别的速度。
[0047]所述区域获取模块20包括依次连接的频显识别单元201、提取单元202和获取单元203。所述频显识别单元201识别出预设视频帧图像的频显信息,如图1D所示的方框;提取单元202在频显信息中提取出台标单元,即图1D中的区域I ;获取单元203对所述台标单元进行矩形边框的边缘检测,获取台标的区域。
[0048]所述文字识别模块30包括判断单元301、与判断单元301连接的数字匹配单元302和文字匹配单元303,所述数字匹配单元302连接文字匹配单元303。判断单元301提取台标的区域中的所有字符段,判断字符段的标志位是否为I。若为I则进入文字匹配单元303中判断字符段中的文字是否与文字样本库中的文字模版匹配,当匹配时输出文字显示台标。若不为I则进入数字匹配单元302中将字符段与数字样本库中的数字模版进行匹配,在匹配成功时继续判断下一个字符段是否与数字模版匹配,在匹配失败时设置当前字符段的标志位为I。所述数字匹配单元302中设置一数字样本库,其中的数字模版包括阿拉伯数字(T9。所述文字匹配单元303中设置一文字样本库,所述文字样本库包括根据各省级、一线城市常见的频道区域样本生成的区域样本库、和根据各频道节目内容取向信息生成的取向样本库。区域样本库和取向样本库中设置了常用的电视频道的文字模版。通过在文字样本库匹配相应的文字模版即可识别出台标。
[0049]综上所述,本发明通过边缘检测在预设视频帧图像的频显信息中获取台标的区域,在该区域中对各个字符段进行标志位判断来区分是数字还是台标信息,对检测出的台标信息进行文字识别,与文字模版进行匹配查找出该台标信息对应的台标并显示;其识别率高且识别速度快。本发明通过检测到台标切换信号后再进行台标检测与识别,有效降低后台图像数据的处理工作量;利用频道切换过程中频显信息及电视台的视频图像传输滞后的特点选取预设视频帧图像作为台标检测识别的基准,避免了视频图像背景和噪声的干扰,大大降低了算法的难度,提高处理速度,实现实时处理。另外,本发明对文字样本库和数字样本库的合理划分既能保证常用电视台的台标识别,又能简化各县级本地台的正确识另IJ,还不会增加样本数,占用过多的存储空间。
[0050]可以理解的是,对本领域普通技术人员来说,可以根据本发明的技术方案及其发明构思加以等同替换或改变,而所有这些改变或替换都应属于本发明所附的权利要求的保护范围。
【权利要求】
1.一种台标检测识别的方法,其特征在于,包括: A、检测到台标切换信号后采集机顶盒输出的具有台标信息的预设视频帧图像; B、获取所述预设视频帧图像中台标的区域; C、对所述区域中的图像进行文字识别获取台标。
2.根据权利要求1所述的台标检测识别的方法,其特征在于,在步骤A中,所述预设视频帧图像是检测到台标切换信号后,采集到的延迟第一预设时间后的具有台标信息的视频图像。
3.根据权利要求1所述的台标检测识别的方法,其特征在于,所述步骤B具体包括: B1、识别预设视频帧图像的频显信息; B2、在频显信息中提取出台标单元; B3、对所述台标单元进行边缘检测,获取台标的区域。
4.根据权利要求1所述的台标检测识别的方法,其特征在于,所述步骤C具体包括: Cl、提取区域中的所有字符段,判断字符段的标志位是否为1:如果是,则执行步骤C3 ; 否则,执行步骤C2; C2、将字符段与数字样本库中的数字模版进行匹配,如果匹配成功则返回步骤Cl继续判断下一个字符段;如果匹配失败则设置当前字符段的标志位为1,执行步骤C3 ; C3、判断字符段中的文字是否与文字样本库中的文字模版匹配,当匹配时输出文字显示台标。
5.根据权利要求2所述的台标检测识别的方法,其特征在于,所述步骤A之前还包括:检测到频道切换信号后,若在第二预设时间达到后没有再次检测到频道切换信号,则生成台标切换信号。
6.根据权利要求4所述的台标检测识别的方法,其特征在于,所述数字模版包括阿拉伯数字(T9 ;所述文字样本库包括区域样本库和取向样本库。
7.一种用于实现台标检测识别的装置,其特征在于,包括: 图像采集模块,用于采集机顶盒输出的具有台标信息的预设视频帧图像; 区域获取模块,用于获取所述预设视频帧图像中台标的区域; 文字识别模块,用于对所述区域中的图像进行文字识别获取台标。
8.根据权利要求7所述的台标检测识别的装置,其特征在于,所述图像采集模块包括: 延时采集单元,用于检测到台标切换信号后,采集机顶盒输出的延迟第一预设时间后的具有台标信息的视频图像作为预设视频帧图像; 信号生成单元,用于检测到频道切换信号后,且在第二预设时间达到后没有再次检测到频道切换信号,则生成台标切换信号。
9.根据权利要求7所述的台标检测识别的装置,其特征在于,所述区域获取模块包括: 频显识别单元,用于识别预设视频帧图像的频显信息; 提取单元,用于在频显信息中提取出台标单元; 获取单元,用于对所述台标单元进行边缘检测,获取台标的区域。
10.根据权利要求7所述的台标检测识别的装置,其特征在于,所述文字识别模块包括: 判断单元,用于提取区域中的所有字符段,判断字符段的标志位是否为I ;数字匹配单元,用于将字符段与数字样本库中的数字模版进行匹配,在匹配成功时继续判断下一个字符段是否与数字模版匹配,在匹配失败时设置当前字符段的标志位为I; 文字匹配单元,用于判断字符段中的文字是否与文字样本库中的文字模版匹配,当匹配时输出文子 显不台标。
【文档编号】G06K9/46GK103544467SQ201310142394
【公开日】2014年1月29日 申请日期:2013年4月23日 优先权日:2013年4月23日
【发明者】邓益群, 邵诗强, 施建华 申请人:Tcl集团股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1