一种新闻字幕跟踪方法及装置与流程

文档序号:14474688阅读:263来源:国知局
一种新闻字幕跟踪方法及装置与流程

本发明属于多媒体信息处理技术领域,尤其涉及一种新闻字幕跟踪方法及装置。



背景技术:

新闻视频中蕴含着大量的最新资讯信息,这对于视频网站和新闻类的应用来说有着重要的价值。视频网站或者新闻类的应用需要对每日播出的整条新闻进行拆分、上线,供用户对于其中感兴趣的拆分新闻进行点击观看,然而,由于电视台数量众多,导致往往需要耗费大量的人力进行新闻切分,对切分好的新闻输入标题,并上线到发布系统中。另外,由于新闻的时效性需求,从而对新闻视频处理速度的要求也十分严格,一般要求在新闻播出的较短的时间内,尽快完成整个新闻节目的切割、拆分及上线,而不能采用积压任务后期处理的方式,基于此,自动的新闻视频拆分、分析技术就成为解决这一问题的关键技术。

新闻标题能够为新闻拆分提供具有重大意义的语义线索,对于长新闻拆分算法来讲,新闻标题的出现、结束、重复往往意味着不同的信息,预示着新闻的结构。因此,新闻中标题出现的时间点位以及对应的状态(出现、结束、重复等)对于新闻拆分十分关键,而这些信息的获取需要依靠标题定位以及跟踪技术。对于新闻内容分析而言,新闻标题中的内容是对这条新闻最为直观的总结,借助ocr(opticalcharacterrecognition,光学字符识别)技术,可以直接获取图像中的文字内容,实现由底层特征到语义内容的转变,进而实现标题提取,但其前提依然是需要定位标题的位置。

对新闻标题的定位检测,往往通过对新闻视频的字幕区域进行跟踪实现,目前,一般采用颜色直方图的方式进行新闻字幕的跟踪,然而,此种方式易因不同视频帧的文字内容不同但颜色直方图相似从而导致出现误跟踪,因此,本领域亟需提供一种能够对新闻标题进行精准跟踪的字幕跟踪方案,以实现为新闻标题的定位检测提供依据,进而为新闻拆条或新闻标题的光学字符识别提供依据。



技术实现要素:

有鉴于此,本发明的目的在于提供一种新闻字幕跟踪方法及装置,旨在通过对新闻标题进行精准跟踪,实现为新闻标题的定位检测提供依据,进而为新闻拆条或新闻标题的光学字符识别提供依据。

为此,本发明公开如下技术方案:

一种新闻字幕跟踪方法,包括:

获得待跟踪的多个视频帧,所述多个视频帧中分别包括待跟踪的新闻标题候选区域;

对于当前视频帧中跟踪的目标区域,判断所述目标区域在所述多个视频帧的跟踪过程中是否是第一次跟踪;其中,目标区域在一个视频帧中对应的跟踪过程为针对目标区域的一次跟踪,所述目标区域为所述新闻标题候选区域中的区域;

若判断结果表示是第一次跟踪,则设定新闻标题候选区域中的至少部分区域作为跟踪区域,并获得所述当前视频帧的跟踪区域内图像对应的二值化图像作为参考图像;

若判断结果表示不是第一次跟踪,则以第一次跟踪时处理得到的参考图像为依据,采用二值化图像跟踪方式,对所述当前视频帧的跟踪区域进行跟踪;直至符合预设的跟踪结束条件时,结束对所述多个视频帧的跟踪。

上述方法,优选的,所述设定新闻标题候选区域中的至少部分区域作为跟踪区域,包括:

利用预定的跟踪区域计算式,计算出新闻标题候选区域中的至少部分区域,并将所述至少部分区域作为跟踪区域,所述预定的跟踪区域计算式包括:

track.x=rect.x+rect.w*xratio1;

track.y=rect.y+rect.h*yratio1;

track.w=rect.w*xratio2;

track.h=rect.h*yratio2;

其中,rect.x、rect.y分别表示新闻标题候选区域在视频帧中的起点位置的横、纵坐标,rect.w表示新闻标题候选区域的宽度,rect.h表示新闻标题候选区域的高度;track.x、track.y分别表示跟踪区域在视频帧中的起点位置的横、纵坐标,track.w表示跟踪区域的宽度,track.h表示跟踪区域的高度;xratio1,xratio2、yratio1及yratio2为预先设定的参数,各个所述坐标所在的坐标系分别以视频帧的宽度方向、高度方向为横轴方向及纵轴方向。

上述方法,优选的,所述获得所述当前视频帧的跟踪区域内图像对应的二值化图像作为参考图像,包括:

选取所述当前视频帧的跟踪区域内的图像,并将所述选取的图像由红绿蓝rgb图像转化为灰度图像或亮度图像;

利用预设的分割阈值对所述灰度图像或亮度图像进行二值化处理,得到所述当前视频帧的跟踪区域内图像对应的二值化图像,并将所述二值化图像作为参考图像。

上述方法,优选的,所述以第一次跟踪时处理得到的参考图像为依据,采用二值化图像跟踪方式,对所述当前视频帧的跟踪区域进行跟踪,包括:

获得所述当前视频帧的跟踪区域内图像对应的二值化图像;

将所述二值化图像与第一次跟踪时处理得到的参考图像进行逐点差分,得到逐点差分值,并计算逐点差分值的平均值;

判断所述逐点差分值的平均值是否达到预设的差分阈值,若未达到,则对所述当前视频帧跟踪成功;否则,对所述当前视频帧跟踪失败。

上述方法,优选的,所述直至符合预设的跟踪结束条件时,结束对所述多个视频帧的跟踪,包括:

当在所述多个视频帧跟踪过程中的跟踪失败次数达到预定阈值,或对所述多个视频帧中的所有视频帧完成跟踪时,结束对所述多个视频帧的跟踪。

一种新闻字幕跟踪装置,包括:

获取单元,用于获得待跟踪的多个视频帧,所述多个视频帧中分别包括待跟踪的新闻标题候选区域;

判断单元,用于对于当前视频帧中跟踪的目标区域,判断所述目标区域在所述多个视频帧的跟踪过程中是否是第一次跟踪;其中,目标区域在一个视频帧中对应的跟踪过程为针对目标区域的一次跟踪,所述目标区域为所述新闻标题候选区域中的区域;

第一跟踪处理单元,用于在判断结果表示是第一次跟踪时,设定新闻标题候选区域中的至少部分区域作为跟踪区域,并获得所述当前视频帧的跟踪区域内图像对应的二值化图像作为参考图像;

第二跟踪处理单元,用于在判断结果表示不是第一次跟踪,则以第一次跟踪时处理得到的参考图像为依据,采用二值化图像跟踪方式,对所述当前视频帧的跟踪区域进行跟踪;直至符合预设的跟踪结束条件时,结束对所述多个视频帧的跟踪。

上述装置,优选的,所述第一跟踪处理单元,设定新闻标题候选区域中的至少部分区域作为跟踪区域,进一步包括:

利用预定的跟踪区域计算式,计算出新闻标题候选区域中的至少部分区域,并将所述至少部分区域作为跟踪区域,所述预定的跟踪区域计算式包括:

track.x=rect.x+rect.w*xratio1;

track.y=rect.y+rect.h*yratio1;

track.w=rect.w*xratio2;

track.h=rect.h*yratio2;

其中,rect.x、rect.y分别表示新闻标题候选区域在视频帧中的起点位置的横、纵坐标,rect.w表示新闻标题候选区域的宽度,rect.h表示新闻标题候选区域的高度;track.x、track.y分别表示跟踪区域在视频帧中的起点位置的横、纵坐标,track.w表示跟踪区域的宽度,track.h表示跟踪区域的高度;xratio1,xratio2、yratio1及yratio2为预先设定的参数,各个所述坐标所在的坐标系分别以视频帧的宽度方向、高度方向为横轴方向及纵轴方向。

上述装置,优选的,所述第一跟踪处理单元,获得所述当前视频帧的跟踪区域内图像对应的二值化图像作为参考图像,进一步包括:

选取所述当前视频帧的跟踪区域内的图像,并将所述图像由红绿蓝rgb图像转化为灰度图像或亮度图像;利用所述分割阈值对所述灰度图像或亮度图像进行二值化处理,得到所述当前视频帧的跟踪区域内图像对应的二值化图像,并将所述二值化图像作为参考图像。

上述装置,优选的,所述第二跟踪处理单元,以第一次跟踪时处理得到的参考图像为依据,采用二值化图像跟踪方式,对所述当前视频帧的跟踪区域进行跟踪,进一步包括:

获得所述当前视频帧的跟踪区域内图像对应的二值化图像;将所述二值化图像与第一次跟踪时处理得到的参考图像进行逐点差分,得到逐点差分值,并计算逐点差分值的平均值;判断所述逐点差分值的平均值是否达到预设的差分阈值,若未达到,则对所述当前视频帧跟踪成功;否则,对所述当前视频帧跟踪失败。

上述装置,优选的,所述第二跟踪处理单元,直至符合预设的跟踪结束条件时,结束对所述多个视频帧的跟踪,进一步包括:当在所述多个视频帧跟踪过程中的跟踪失败次数达到预定阈值,或对所述多个视频帧中的所有视频帧完成跟踪时,结束对所述多个视频帧的跟踪。

由以上方案可知,本发明提供的新闻字幕跟踪方法及装置,在第一次进行区域跟踪时,设定视频帧中的跟踪区域,并将第一次跟踪时的视频帧跟踪区域内的图像对应的二值化图像作为参考图像,在此基础上,以第一次跟踪时处理得到的参考图像为依据,采用二值化图像跟踪方式,对待跟踪的其他视频帧进行跟踪区域内图像的跟踪。由此可见,本发明提出了一种利用二值化图像的跟踪方式进行新闻信息跟踪的方案,可有效避免颜色直方图和原图像特征所带来的干扰,不会出现因文字内容不同但颜色直方图相似从而导致的误跟踪,使得跟踪性能更为稳定,更加鲁棒。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1是本发明实施例提供的新闻字幕跟踪方法的流程示意图;

图2是本发明实施例提供的一个视频帧实例中的候选区域以及从候选区域中选取出的跟踪区域的对比示意图;

图3是本发明实施例提供的新闻频道的字幕示意图;

图4是本发明实施例提供的对图像(a)进行二值化后所得的二值化图像(b)的图像效果;

图5是本发明实施例提供的对视频帧进行跟踪的跟踪原理示意图;

图6是本发明实施例提供的新闻字幕跟踪装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供一种新闻字幕跟踪方法,旨在通过对新闻标题进行精准跟踪,实现为新闻标题的定位检测提供依据,进而为新闻拆条或新闻标题的光学字符识别提供依据。

参考图1示出的一种新闻字幕跟踪方法的流程示意图,本实施例中,所述方法可以包括以下步骤:

步骤101、获得待跟踪的多个视频帧,所述多个视频帧中分别包括待跟踪的新闻标题候选区域。

其中,所述待跟踪的多个视频帧一般为时序或帧序连续的多帧视频图像,比如具体可以是新闻视频中的一段视频流或全部视频流对应包括的多帧连续的视频图像等。

视频帧中的新闻标题候选区域,可以是依据经验,人为指定的视频帧中的某一个区域,一般来说,该指定区域多为新闻标题在视频图像中较常出现的位置区域,例如可以是视频帧的底部区域等。该候选区域还可以是利用某种算法在视频帧中检测出的可能的新闻标题区域。

各个视频帧中的新闻标题候选区域的区域位置相对应,所述相对应具体可以是指各个视频帧中的新闻标题候选区域在各自视频帧中具有相同的区域位置。

步骤102、对于当前视频帧中跟踪的目标区域,判断所述目标区域在所述多个视频帧的跟踪过程中是否是第一次跟踪;其中,目标区域在一个视频帧中对应的跟踪过程为针对目标区域的一次跟踪,所述目标区域为所述新闻标题候选区域中的区域。

在获得待跟踪的多个视频帧的基础上,可对多个视频帧执行跟踪过程。其中,对于当前视频帧中跟踪的目标区域而言,首先判断在所述多个视频帧的跟踪过程中是否是第一次跟踪这个区域。本实施例中,针对新闻标题候选区域中的某一区域,如所述目标区域,具体将目标区域在一个视频帧中对应的跟踪过程视为针对该目标区域的一次跟踪。

本申请中,所述“第一次跟踪”某一区域是指在整个视频中初始跟踪该区域,相对应地“非第一次跟踪”该区域则是指在整个视频中初始跟踪该区域后的其他跟踪过程,本申请将在每一视频帧中对某区域的跟踪过程作为对该区域的一次跟踪,而没有站在整个视频的角度采用“初始跟踪”或“非初始跟踪”某一区域这种描述方式,是由于下文中的跟踪结束条件中需要涉及到跟踪统计次数,如果采用“初始跟踪”或“非初始跟踪”的方式,则无法体现跟踪次数,具体可参考下文中关于跟踪结束条件的描述。

步骤103、若判断结果表示是第一次跟踪,则设定新闻标题候选区域中的至少部分区域作为跟踪区域,并获得所述当前视频帧的跟踪区域内图像对应的二值化图像作为参考图像。

如果通过判断获知是第一次跟踪这个区域,那么,针对第一次区域跟踪的情况,发明人考虑到视频帧的新闻标题候选区域中可能包含额外的背景区域,从而为了提升跟踪的准确性,本发明从所述候选区域中选取一跟踪范围,并将选取的跟踪范围内的区域作为实际的跟踪区域,其中,该跟踪区域为所述候选区域的至少部分区域,一般来说,该跟踪区域小于所述候选区域。

接下来,本发明示例性地提供一种在新闻标题候选区域中设置跟踪区域的方式。

假设视频帧中新闻标题候选区域的位置为(rect.x,rect.y,rect.w,rect.h),其中,所述rect.x、rect.y分别表示新闻标题候选区域在视频帧中的起点位置的横、纵坐标,rect.w表示新闻标题候选区域的宽度,rect.h表示新闻标题候选区域的高度,则本实施例将跟踪区域在视频帧中的位置(track.x,track.y,track.w,track.h)设定为:

track.x=rect.x+rect.w*xratio1;

track.y=rect.y+rect.h*yratio1;

track.w=rect.w*xratio2;

track.h=rect.h*yratio2;

其中,track.x、track.y分别表示跟踪区域在视频帧中的起点位置的横、纵坐标,track.w表示跟踪区域的宽度,track.h表示跟踪区域的高度;xratio1,xratio2、yratio1及yratio2为预先设定的参数,各个所述坐标所在的坐标系分别以视频帧的宽度方向、高度方向为横轴方向及纵轴方向。

参考图2,图2提供了一个视频帧实例中的候选区域以及从候选区域中选取出的跟踪区域的对比示意图。

在基于视频帧的候选区域设置实际的跟踪区域之后,本实施例获取第一次跟踪时所对应的视频帧中跟踪区域内图像的二值化图像,并将其作为后续对其他各视频帧进行跟踪的参考图像。发明人通过对大量新闻字幕的观察发现,新闻字幕往往具有“采取简单背景,以及同背景相比具有高对比度文字的方式进行展现”这一字幕特征,该特征具体可参考图3提供的各种新闻频道的字幕特征示意图,这为本发明将字幕区域实现二值化分割提供了重要的依据。

其中,具体可通过以下的处理过程,获得第一次跟踪时所对应的视频帧中跟踪区域内图像的二值化图像:

1)选取所述视频帧跟踪区域内的图像,并将其由rgb(red-green-blue,红绿蓝)图像转化为灰度图像或亮度图像。

具体地,可将选取的跟踪区域内的图像由rgb色彩空间转化为灰度/或者任意亮度色彩分离空间,如yuv,hsv,hsl,lab等。

其中,灰度空间换算公式为:

gray=r*0.299+g*0.587+b*0.114;

而亮度色彩分离空间,以hsl举例,亮度l(lightness)的转化公式为:

l=(max(r,g,b)+min(r,g,b))/2

所述r、g、b分别表示跟踪区域内图像在红、绿、蓝三个颜色通道的分量。

从而,可分别采用以上相应计算式将选取的跟踪区域内的图像由rgb图像转化为灰度图像或亮度图像。

2)计算分割阈值。

对于跟踪区域图像对应的灰度或者亮度图像,利用otsu(最大类间方差法)计算灰度分割阈值。

其中,otsu方法的描述为:

(1)假设灰度图像i可以分割为n个灰度(n<=256),对于这n个灰度可以提取图像的n阶灰度直方图h。

(2)对于直方图中的每一位t(0<=t<n),计算如下公式:

x(i)=i*256/n

(3)获得使最大的t对应的x(t)作为分割阈值th。

3)对跟踪区域图像对应的灰度或亮度图像进行二值化,并将二值化后的图像bref作为对后续视频帧中的跟踪区域进行二值化跟踪时的参考图像。

其中,采用所述分割阈值th,对灰度图像或亮度图像i进行二值化,具体地,若i(x,y)<th,则bref(x,y)=0;否则,若i(x,y)>=th,则bref(x,y)=255。

参考图4,图4示出了对图像(a)进行二值化后所得的二值化图像(b)的图像效果。

在通过以上处理获得第一次跟踪时所对应的视频帧中跟踪区域内图像的二值化图像后,本发明将该二值化图像作为后续对其他各视频帧进行跟踪时的参考图像。

步骤104、若判断结果表示不是第一次跟踪,则以第一次跟踪时处理得到的参考图像为依据,采用二值化图像跟踪方式,对所述当前视频帧的跟踪区域进行跟踪;直至符合预设的跟踪结束条件时,结束对所述多个视频帧的跟踪。

如果通过判断获知不是第一次跟踪,则以第一次跟踪时处理得到的参考图像为依据,采用二值化图像跟踪方式,对所述当前视频帧的跟踪区域进行跟踪。

参考图5提供的对视频帧进行跟踪的跟踪原理示意图,以二值化图像跟踪方式对视频帧进行跟踪的跟踪过程具体可通过以下处理方式实现:

1)首先将当前待跟踪的视频帧的跟踪区域图像,由rgb图像转化为灰度图像或亮度图像。

具体地,可将当前待跟踪的视频帧中跟踪区域内的图像由rgb色彩空间转化为灰度/或者任意亮度色彩分离空间,如yuv,hsv,hsl,lab等。

其中,灰度空间换算公式为:

gray=r*0.299+g*0.587+b*0.114;

而亮度色彩分离空间,以hsl举例,亮度l(lightness)的转化公式为:

l=(max(r,g,b)+min(r,g,b))/2

所述r、g、b分别表示跟踪区域图像在红、绿、蓝三个颜色通道的分量。

从而,可分别采用以上相应计算式将当前待跟踪的视频帧中跟踪区域内的图像,由rgb图像转化为灰度图像或亮度图像。

2)将当前待跟踪的视频帧中跟踪区域内图像对应的灰度或亮度图像进行二值化。即对于图像i中的像素(x,y),其对应的二值化图像bcur的像素为:

若i(x,y)<th,则bcur(x,y)=0;否则,若i(x,y)>=th,bcur(x,y)=255。其中,th为第一次跟踪时处理所得的分割阈值。

3)将当前视频帧的二值化图像bcur同参考图像bref,进行逐点差分,获得逐点差分值,并计算逐点差分值的平均值diff。

逐点差分的平均值diff可采用以下公式计算:

其中,w和h分别表示跟踪区域图像的宽,高。

4)将获得的逐点差分值的差分平均值diff同预先设定的差分阈值thtracking进行比较,判断所述逐点差分值的平均值diff是否达到预设的差分阈值。

如果所述逐点差分值的平均值diff未达到预设的差分阈值thtracking,即diff<thtracking,则表示当前跟踪的视频帧的跟踪区域图像与第一次跟踪时作为参考的跟踪区域图像的图像内容一致(两者差异在允许范围内),此种情况认为对当前视频帧跟踪成功,可继续返回跟踪状态中对下一视频帧进行跟踪;否则,如果所述逐点差分值的平均值diff达到预设的差分阈值thtracking,即diff>=thtracking,则表示当前跟踪的视频帧的跟踪区域图像与第一次跟踪时作为参考的跟踪区域图像的图像内容差异较大,此种情况认为对当前视频帧跟踪失败,在未达到结束条件的情况下,同样需继续返回跟踪状态中,以对下一视频帧进行跟踪。

直至符合预设的跟踪结束条件时,结束对所述多个视频帧的跟踪。

其中,所述结束条件可以是但不限于:对所述多个视频帧跟踪过程中的跟踪失败次数达到预定阈值,或对所述多个视频帧中的所有视频帧完成跟踪。

从而,可在对所述多个视频帧跟踪过程中的跟踪失败次数达到预定阈值,或对所述多个视频帧中的所有视频帧完成跟踪时,结束对所述多个视频帧的跟踪。

其中,设立跟踪失败次数还可以起到以下作用:针对个别视频信号受到干扰,引起图像出现失真,导致匹配失败的问题,通过跟踪失败次数的设立,可使得允许算法有个别数量的视频帧跟踪失败。

在跟踪结束后,可输出相应的跟踪结果,以实现为后续的相关应用提供依据。

比如,返回当前视频帧的帧号,和/或返回跟踪过程中跟踪成功的次数、跟踪失败的次数,和/或返回跟踪区域内的图像等等,从而使得后续将返回的跟踪成功次数、跟踪失败的次数作为确定跟踪区域中是否存在新闻标题、进而进行标题检测的依据,将返回的跟踪区域图像作为新闻标题光学字符识别的依据,将返回的帧号、检测定位出的标题作为新闻拆条的依据等等。

本发明实施例提供的新闻字幕跟踪方法,在第一次进行区域跟踪时,设定视频帧中的跟踪区域,并将第一次跟踪时的视频帧跟踪区域内的图像对应的二值化图像作为参考图像,在此基础上,以第一次跟踪时处理得到的参考图像为依据,采用二值化图像跟踪方式,对待跟踪的其他视频帧进行跟踪区域内图像的跟踪。由此可见,本发明提出了一种利用二值化图像的跟踪方式进行新闻信息跟踪的方案,可有效避免颜色直方图和原图像特征所带来的干扰,不会出现因文字内容不同但颜色直方图相似从而导致的误跟踪,使得跟踪性能更为稳定,更加鲁棒。

本发明的另一实施例公开一种新闻字幕跟踪装置,旨在通过对新闻标题进行精准跟踪,实现为新闻标题的定位检测提供依据,进而为新闻拆条或新闻标题的光学字符识别提供依据。参考图6示出的新闻字幕跟踪装置的结构示意图,所述装置包括:

获取单元1,用于获得待跟踪的多个视频帧,所述多个视频帧中分别包括待跟踪的新闻标题候选区域;判断单元2,用于对于当前视频帧中跟踪的目标区域,判断所述目标区域在所述多个视频帧的跟踪过程中是否是第一次跟踪;其中,目标区域在一个视频帧中对应的跟踪过程为针对目标区域的一次跟踪,所述目标区域为所述新闻标题候选区域中的区域;第一跟踪处理单元3,用于在判断结果表示是第一次跟踪时,设定新闻标题候选区域中的至少部分区域作为跟踪区域,并获得所述当前视频帧的跟踪区域内图像对应的二值化图像作为参考图像;第二跟踪处理单元4,用于在判断结果表示不是第一次跟踪,则以第一次跟踪时处理得到的参考图像为依据,采用二值化图像跟踪方式,对所述当前视频帧的跟踪区域进行跟踪;直至符合预设的跟踪结束条件时,结束对所述多个视频帧的跟踪。

在本发明实施例的一种实施方式中,所述第一跟踪处理单元,设定新闻标题候选区域中的至少部分区域作为跟踪区域,进一步包括:

利用预定的跟踪区域计算式,计算出新闻标题候选区域中的至少部分区域,并将所述至少部分区域作为跟踪区域,所述预定的跟踪区域计算式包括:

track.x=rect.x+rect.w*xratio1;

track.y=rect.y+rect.h*yratio1;

track.w=rect.w*xratio2;

track.h=rect.h*yratio2;

其中,rect.x、rect.y分别表示新闻标题候选区域在视频帧中的起点位置的横、纵坐标,rect.w表示新闻标题候选区域的宽度,rect.h表示新闻标题候选区域的高度;track.x、track.y分别表示跟踪区域在视频帧中的起点位置的横、纵坐标,track.w表示跟踪区域的宽度,track.h表示跟踪区域的高度;xratio1,xratio2、yratio1及yratio2为预先设定的参数,各个所述坐标所在的坐标系分别以视频帧的宽度方向、高度方向为横轴方向及纵轴方向。

在本发明实施例的一种实施方式中,所述第一跟踪处理单元,获得所述当前视频帧的跟踪区域内图像对应的二值化图像作为参考图像,进一步包括:选取所述当前视频帧的跟踪区域内的图像,并将所述图像由红绿蓝rgb图像转化为灰度图像或亮度图像;利用所述分割阈值对所述灰度图像或亮度图像进行二值化处理,得到所述当前视频帧的跟踪区域对应的二值化图像,并将所述二值化图像作为参考图像。

在本发明实施例的一种实施方式中,所述第二跟踪处理单元,以第一次跟踪时处理得到的参考图像为依据,采用二值化图像跟踪方式,对所述当前视频帧的跟踪区域进行跟踪,进一步包括:获得所述当前视频帧的跟踪区域内图像对应的二值化图像;将所述二值化图像与第一次跟踪时处理得到的参考图像进行逐点差分,得到逐点差分值,并计算逐点差分值的平均值;判断所述逐点差分值的平均值是否达到预设的差分阈值,若未达到,则对所述当前视频帧跟踪成功;否则,对所述当前视频帧跟踪失败。

在本发明实施例的一种实施方式中,所述第二跟踪处理单元,直至符合预设的跟踪结束条件时,结束对所述多个视频帧的跟踪,进一步包括:当在所述多个视频帧跟踪过程中的跟踪失败次数达到预定阈值,或对所述多个视频帧中的所有视频帧完成跟踪时,结束对所述多个视频帧的跟踪。

本发明实施例提供的新闻字幕跟踪装置,在第一次进行区域跟踪时,设定视频帧中的跟踪区域,并将第一次跟踪时的视频帧跟踪区域内的图像对应的二值化图像作为参考图像,在此基础上,以第一次跟踪时处理得到的参考图像为依据,采用二值化图像跟踪方式,对待跟踪的其他视频帧进行跟踪区域内图像的跟踪。由此可见,本发明提出了一种利用二值化图像的跟踪方式进行新闻信息跟踪的方案,可有效避免颜色直方图和原图像特征所带来的干扰,不会出现因文字内容不同但颜色直方图相似从而导致的误跟踪,使得跟踪性能更为稳定,更加鲁棒。

对于本发明实施例公开的新闻字幕跟踪装置而言,由于其与以上实施例公开的新闻字幕跟踪方法相对应,所以描述的比较简单,相关相似之处请参见以上实施例中新闻字幕跟踪方法部分的说明即可,此处不再详述。

综上所述,本发明方案具有以下优势:本发明提出了一种基于二值化图像跟踪的方式进行新闻字幕跟踪的方案,可为新闻标题的定位检测、新闻拆条提供依据。相比于现有技术中利用颜色直方图进行跟踪的方法,本发明方案能够更加准确的跟踪字幕区域,不会出现因文字内容不同但颜色直方图相似从而导致的误跟踪;且相比于直接利用图像求差分的方法,本发明方案可以更加有效的避免由于视频压缩引起的噪声对于跟踪性能的干扰,更加鲁棒。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

为了描述的方便,描述以上系统或装置时以功能分为各种模块或单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

最后,还需要说明的是,在本文中,诸如第一、第二、第三和第四等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1