文本增强方法及装置、文本提取方法及装置的制作方法

文档序号:6426945阅读:184来源:国知局
专利名称:文本增强方法及装置、文本提取方法及装置的制作方法
技术领域
本发明一般地涉及图像处理技术领域,尤其是文本增强方法及装置、文本提取方法及装置。
背景技术
在播放视频的过程中,或者在欣赏图像时,视频或者图像中往往会包含文本说明,例如,是对一段视频的发生时间和地点的说明,或者对于图像的解说等。而这些文本内容因为与视频或图像密切相关,所以提取视频或图像中的文本就成为至关重要的技术。现有技术中进行视频或图像的文本提取方法,可以以二值化、边缘颜色聚类和检测技术为基础,针对图像或视频中的文本进行提取。
但是,现有技术在进行文本提取时,由于视频或图像中可能会存在过多的噪音,图像或视频模糊,甚至如果一段视频中存在光照变化,都会使得图像或视频中的文本与背景边界模糊,或者文本内容本身不够清楚,从而影响文本提取的效果。因此,如何能对原始图像或视频中的文本进行增强处理,以增强图像或视频中的文本,进一步的优化文本提取的效果,已成为现有技术中亟待解决的问题。

发明内容
有鉴于此,本发明实施例提供了文本增强方法及装置、文本提取方法及装置,能够对包括一行文本的原始图像中的文本进行增强处理,使得原始图像中的文本更加明显,进一步还可以优化文本提取的效果。根据本发明实施例的一个方面,提供一种文本增强方法,包括获取包括一行文本的原始图像;依据所述原始图像中的任一原始像素点到其邻域集中各个邻域像素点的直接差异度和间接差异度,对所述各个原始像素点的原始亮度值或/和颜色值进行笔画二维滤波,以得到所述原始图像的滤波后的更新亮度值或/和颜色值,所述邻域集的范围为以原始像素点为中心且边长为w的正方形,所述w小于所述原始图像的高度;将所述滤波后的更新亮度值或/和颜色值分别替换对应的所述原始亮度值或/和颜色值,以生成与所述原始图像对应的文本增强图像。根据本发明实施例的另一个方面,提供一种文本增强装置,包括获取模块,用于获取包括一行文本的原始图像;滤波模块,用于依据所述原始图像中的任一原始像素点到其邻域集中各个邻域像素点的直接差异度和间接差异度,对所述各个原始像素点的原始亮度值或/和颜色值进行笔画二维滤波,以得到所述原始图像的滤波后的更新亮度值或/和颜色值,所述邻域集的范围为以原始像素点为中心且边长为w的正方形,所述w小于所述原始图像的高度;替换模块,用于将所述滤波后的更新亮度值或/和颜色值分别替换对应的所述原始亮度值或/和颜色值,以生成与所述原始图像对应的文本增强图像。根据本发明实施例的再一方面,提供一种文本提取方法,包括获取包括一行文本的原始图像;依据所述原始图像中的任一原始像素点到其邻域集中各个邻域像素点的直接差异度和间接差异度,对所述各个原始像素点的原始亮度值或/和颜色值进行笔画二维滤波,以得到所述原始图像的滤波后的更新亮度值或/和颜色值;所述邻域集的范围为以原始像素点为中心且边长为W的正方形;所述W小于所述原始图像的高度;将所述滤波后的更新亮度值或/和颜色值分别替换对应的所述原始亮度值或/和颜色值,以生成与所述原始图像对应的文本增强图像;提取所述文本增强图像中的文本。根据本发明实施例的再一方面,提供一种文本提取装置,包括获取模块,用于获取包括一行文本的原始图像;滤波模块,用于依据所述原始图像中的任一原始像素点到其邻域集中各个邻域像素点的直接差异度和间接差异度,对所述各个原始像素点的原始亮度值或/和颜色值进行笔画二维滤波,以得到所述原始图像的滤波后的更新亮度值或/和颜色值,所述邻域集的范围为以原始像素点为中心且边长为W的正方形,所述W小于所述原始图像的高度;替换模块,用于将所述滤波后的更新亮度值或/和颜色值分别替换对应的所述原始亮度值或/和颜色值,以生成与所述原始图像对应的文本增强图像;提取模块,用于提取所述文本增强图像中的文本。另外,根据本发明的另一方面,还提供了一种存储介质。所述存储介质包括机器可 读的程序代码,当在信息处理设备上执行所述程序代码时,所述程序代码使得所述信息处理设备执行根据本发明的上述文本增强方法及文本提取方法。此外,根据本发明的再一方面,还提供了一种程序产品。所述程序产品包括机器可执行的指令,当在信息处理设备上执行所述指令时,所述指令使得所述信息处理设备执行根据本发明的上述文本增强方法及文本提取方法。根据本发明实施例的上述一种文本增强方法,得到的文本增强图像中的像素点中的文本笔画进行了增强,增强了笔画内部像素的一致性且加深文本与背景差异度,即增强了原始图像中包括的文本,从而可以使后续针对该文本增强图像进行的文本提取更为精确和准确。根据本发明实施例的上述一种文本提取方法,基于得到的文本增强图像进行文本提取,不仅使得文本提取的结果更为精确和准确,也因为降低了文本提取的复杂度,所以提升了文本提取的效率。在下面的说明书部分中给出本发明实施例的其他方面,其中,详细说明用于充分地公开本发明实施例的优选实施例,而不对其施加限定。


下面结合具体的实施例,并参照附图,对本发明实施例的上述和其它目的和优点做进一步的描述。在附图中,相同的或对应的技术特征或部件将采用相同或对应的附图标记来表示。图I是示出作为本发明实施例提供的第一种文本增强方法的流程图;图2是示出作为第一种文本增强方法中步骤S102的流程图;图3是示出作为本发明实施例提供的第二种文本增强方法的流程图;图4是示出作为第二种文本增强方法中步骤S302的一种流程图;图5是示出作为第二种文本增强方法中步骤S302的另一种流程图;图6是示出作为第二种文本增强方法中步骤S302的再一种流程图7是示出作为第二种文本增强方法中步骤S302的又一种流程图;图8是示出作为第二种文本增强方法中步骤S304的流程图;图9是示出作为本发明实施例提供的第一种文本增强装置的示意图;图10是示出作为第一种文本增强装置中滤波模块902的示意图;图11是示出作为本发明实施例提供的第二种文本增强装置的示意图;图12是示出作为第二种文本增强装置中笔画极性估计模块1101的示意图;图13是示出作为第二种文本增强装置中笔画极性估计模块1101的另一示意图;图14是示出作为第二种文本增强装置中笔画极性估计模块1101的再一示意图; 图15是示出作为第二种文本增强装置中笔画极性估计模块1101的又一示意图;图16是示出作为第二种文本增强装置中判断模块1102的示意图;图17是示出作为本发明实施例提供的文本提取方法的流程图;图18是示出作为本发明实施例提供的文本提取装置的示意图;图19是示出作为本发明的实施例中所采用的信息处理设备的个人计算机的示例性结构的框图。
具体实施例方式下面参照附图来说明本发明的实施例。具体的,参见图1,本发明实施例提供了第一种文本增强方法,具体可以包括SlOl :获取包括一行文本的原始图像。在本发明实施例中,所述的文本增强是指对包括一行文本的原始图像中的文本进行增强处理。这里的增强可以理解为,加深文本的边缘,或者突出文本与背景的区别等。本发明实施例在应用时,考虑了文本的笔画表象(例如亮度或颜色等)和其形状(例如文本呈现条纹状)信息,以期达到增强笔画内部像素的一致性且加深文本与背景差异度的效果OS102:依据所述原始图像中的任一原始像素点到其邻域集中各个邻域像素点的直接差异度和间接差异度,对所述各个原始像素点的原始亮度值或/和颜色值进行笔画二维滤波,以得到所述原始图像的滤波后的更新亮度值或/和颜色值,所述邻域集的范围为以原始像素点为中心且边长为w的正方形,所述w小于所述原始图像的高度。本步骤中的直接差异度表示了任一原始像素点与其邻域集中各个领域像素点的直接表象差异,例如颜色或亮度差异,间接差异度则表示了原始像素点到其邻域集中各个领域像素点所经过的像素的梯度模值。利用直接差异度和间接差异度可以对各个原始像素点的原始亮度值或/和颜色值进行笔画二维滤波,以得到所述原始图像的滤波后的更新亮度值或/和颜色值。其中,这里提到的邻域集可以采用以原始像素点为中心以w为边长选取正方形的方式获得,其中,w小于原始图像的图像高度,优选情况下可以取原始图像高度的八分之一。在实际应用中,参考图2所示,所述S102具体可以包括S201 :将所述原始像素点与各个邻域像素点的原始亮度值或/和颜色值进行代数相减以获取所述直接差异度。在本实施例中,采用D1(Lj)表示像素i和j的直接差异度,则可以采用如下公式(I)计算亮度值的直接差异度
权利要求
1.ー种文本增强方法,包括获取包括一行文本的原始图像;依据所述原始图像中的任一原始像素点到其邻域集中各个邻域像素点的直接差异度和间接差异度,对所述各个原始像素点的原始亮度值或/和颜色值进行笔画ニ维滤波,以得到所述原始图像的滤波后的更新亮度值或/和颜色值,所述邻域集的范围为以原始像素点为中心且边长为W的正方形,所述w小于所述原始图像的高度;将所述滤波后的更新亮度值或/和颜色值分别替换对应的所述原始亮度值或/和顔色值,以生成与所述原始图像对应的文本增强图像。
2.根据权利要求I所述的方法,其中,所述对所述各个原始像素点的原始亮度值或/和颜色值进行笔画ニ维滤波的步骤,包括将所述原始像素点与各个邻域像素点的原始亮度值或/和顔色值进行代数相减以获取所述直接差异度;依据所述原始像素点到其邻域集的各个邻域像素点的梯度模值,获取所述间接差异度;根据所述直接差异度和间接差异度计算各个邻域像素点对于所述原始像素点的亮度值或/和颜色值的权重值;采用如下笔画ニ维滤波公式计算所述原始像素点的更新亮度值;
3.根据权利要求I所述的方法,其中,所述获取包括一行文本的原始图像之后,还包括估计所述原始图像中文本的笔画极性,所述极性表示位于笔画区域内部像素点与笔画区域外部像素点之间的亮度值或/和颜色值的大小关系;以及所述得到所述原始图像的滤波后的更新亮度值或/和颜色值之后,还包括判断所述滤波后的更新亮度值或/和颜色值与所述笔画极性是否匹配,如果是,则执行所述替换所述原始亮度值或/和颜色值的步骤。
4.根据权利要求3所述的方法,其中,在所述极性表示笔画区域内部像素点与笔画区域外部像素点之间的亮度值大小关系的情况下,所述估计原始图像中文本的笔画极性的步骤,包括在水平方向、竖直方向以及两个对角线方向上分別采用如下公式计算笔画响应强度
5.根据权利要求3所述的方法,其中,在所述极性表示笔画区域内部像素点与笔画区域外部像素点之间的颜色值大小关系的情况下,所述估计原始图像中文本的笔画极性的步骤,包括在水平方向、竖直方向以及两个对角线方向上分別采用如下公式计算笔画响应强度
6.ー种文本增强装置,包括获取模块,用于获取包括一行文本的原始图像;滤波模块,用于依据所述原始图像中的任一原始像素点到其邻域集中各个邻域像素点的直接差异度和间接差异度,对所述各个原始像素点的原始亮度值或/和颜色值进行笔画ニ维滤波,以得到所述原始图像的滤波后的更新亮度值或/和颜色值,所述邻域集的范围为以原始像素点为中心且边长为w的正方形,所述w小于所述原始图像的高度;替换模块,用于将所述滤波后的更新亮度值或/和颜色值分别替换对应的所述原始亮度值或/和顔色值,以生成与所述原始图像对应的文本增强图像。
7.根据权利要求6所述的装置,其中,所述滤波模块包括第一获取子模块,用于将所述原始像素点与各个邻域像素点的原始亮度值或/和顔色值进行代数相减以获取所述直接差异度;第二获取子模块,用于依据所述原始像素点到其邻域集的各个邻域像素点的梯度模值,获取所述间接差异度;权重计算子模块,用于根据所述直接差异度和间接差异度计算各个邻域像素点对于所述原始像素点的亮度值或/和颜色值的权重值;更新亮度值计算子模块,用于采用如下笔画ニ维滤波公式计算所述原始像素点的更新亮度值;
8.根据权利要求6所述的装置,还包括笔画极性估计模块,用于估计所述原始图像中文本的笔画极性,所述极性表示位于笔画区域内部像素点与笔画区域外部像素点之间的亮度值或/和颜色值的大小关系;以及判断模块,用于判断所述滤波后的更新亮度值或/和颜色值与所述笔画极性是否匹配,如果是,则触发所述替换模块。
9.根据权利要求8所述的装置,在所述极性表示笔画区域内部像素点与笔画区域外部像素点之间的亮度值大小关系的情况下,所述笔画极性估计模块包括第一计算子模块,用于在水平方向、竖直方向以及两个对角线方向上分別采用如下公式计算笔画响应强度
10.根据权利要求8所述的装置,在所述极性表示笔画区域内部像素点与笔画区域外部像素点之间的颜色值大小关系的情况下,所述笔画极性估计模块包括第二计算子模块,用于在水平方向、竖直方向以及两个对角线方向上分別采用如下公式计算笔画响应强度
全文摘要
本发明实施例公开了文本增强方法及装置、文本提取方法及装置,所述文本增强方法包括获取包括一行文本的原始图像;依据所述原始图像中的任一原始像素点到其邻域集中各个邻域像素点的直接差异度和间接差异度,对各个原始像素点的原始亮度值或/和颜色值进行笔画二维滤波,以得到原始图像的滤波后的更新亮度值或/和颜色值,邻域集的范围为以原始像素点为中心且边长为w的正方形,所述w小于所述原始图像的高度;将所述滤波后的更新亮度值或/和颜色值分别替换对应的所述原始亮度值或/和颜色值,以生成与原始图像对应的文本增强图像。通过本发明实施例,可以增强原始图像中包括的文本,以使后续针对该文本增强图像进行的文本提取更为精确和准确。
文档编号G06K9/46GK102831579SQ20111017209
公开日2012年12月19日 申请日期2011年6月16日 优先权日2011年6月16日
发明者潘屹峰, 胜山裕, 孙俊, 直井聪 申请人:富士通株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1