用于识别文本行的方向的设备和方法

文档序号:9708778阅读:713来源:国知局
用于识别文本行的方向的设备和方法
【技术领域】
[0001] 本发明涉及文本识别领域,具体地,涉及一种用于识别文本行的方向的设备和方 法。
【背景技术】
[0002] 在移动设备(例如移动电话、个人数字助理等)上,文本行识别具有广泛的应用。 通常,移动设备的用户首先确定或选择初始的文本行,然后移动设备的系统会自动跟踪初 始的文本行。当文本行消失或跟踪失败时会重新进行检测,然后继续跟踪重新检测到的文 本行。在整个过程中,需要识别文本行的方向,包括初始时文本行方向,以及跟踪和检测时 文本行方向,且文本行的方向为〇到360度。然而,现有技术主要是针对图像中所有文本整 体方向的识别,而非针对文本行跟踪或检测时的方向识别。
[0003] 参考文献1 ( "文本图像的校正方法",CN200910079865. 0)提出利用疑似单个字符 的可信度和某个方向识别可信度累加值来确定文本的方向,然后校正图像的方向。然而,参 考文献1需要利用字符识别来计算可信度,当文字较模糊时无法进行字符识别,不能准确 计算文本方向。此外,由于需要多次利用字符识别技术,导致文本方向识别速度较慢。
[0004] 参考文献 2 ( "Automatic Dominant Orientation Estimation In Text Images Based On Steerable Filters",US2012179468A1)提出采用方向可控滤波器来估计图像中 文本的主方向,首先利用方向可控滤波器计算能量曲线,然后根据能量曲线的峰值来确定 图像中文本的主方向。然而,参考文献2计算得到的文本方向不够精确和鲁棒性不够好,尤 其当图像中文本比较模糊的时候,而且速度不够快。
[0005] 参考文献 3 ( "Methods and apparatus for inferring orientation of lines of text",US5664027A)提出利用提取的符号和欧式最小生成树来推断文本行的方向。然 而,参考文献3的运算复杂度高,而且当图像中的文字比较模糊时难以提取符号。
[0006] 因此,现有技术中存在如下技术问题:计算复杂度较高,以及当图像中文本比较模 糊时不能识别或精确识别文本方向。

【发明内容】

[0007] 为了解决上述技术问题,本发明提供了一种用于识别文本行的方向的设备和方 法。具体地,本发明提出:基于跟踪或检测到的文本行的最小外接矩形方向的变化轨迹以及 检测时匹配的特征点的方向差,快速、准确地计算文本行方向的方法。首先,计算初始的文 本行的最小外接矩形的方向,以及提取初始文本行的特征点,该特征点包含特征点的描述 和方向,利用最小外接矩形的方向和文本行的字符识别的可信度来识别初始的文本行的方 向。其次,在文本行跟踪时,利用跟踪的文本行的最小外接矩形方向的变化轨迹来识别文本 行的方向。另外,在文本行检测时,利用匹配的特征点的方向差以及初始的文本行方向来识 别文本行的方向。
[0008] 具体地,根据本发明的第一方面,提供了一种用于识别文本行的方向的设备,包 括:初始方向识别单元,被配置为识别初始文本行的方向;跟踪方向识别单元,被配置为识 别当前跟踪的文本行方向;以及检测方向识别单元,被配置为识别在跟踪失败时检测到的 文本行方向。
[0009] 在一个实施例中,所述初始方向识别单元被配置为:计算初始文本行的最小外接 矩形的方向;计算初始文本行的字符识别的可信度;以及根据初始文本行的最小外接矩形 的方向和初始文本行的字符识别的可信度,识别初始文本行的方向。
[0010] 在一个实施例中,所述跟踪方向识别单元被配置为:根据文本行的先前方向和当 前跟踪的文本行的最小外接矩形的方向,计算当前跟踪的文本行的方向。
[0011] 在一个实施例中,所述检测方向识别单元被配置为:获得初始文本行的初始特征 信息,所述初始特征信息包含初始文本行的特征点的描述和方向;提取检测到的文本行的 当前特征信息,所述当前特征信息包含检测到的文本行的特征点的描述和方向;以及根据 所述初始特征信息和所述当前特征信息中的匹配特征点的方向差以及初始文本行的方向, 识别当前文本行的方向。
[0012] 在一个实施例中,所述检测方向识别单元被配置为:根据所述初始特征信息和所 述当前特征信息中的所有匹配特征点的方向差的平均值以及初始文本行的方向,识别当前 文本行的方向。
[0013] 在一个实施例中,所述检测方向识别单元被配置为:根据所述初始特征信息和所 述当前特征信息中的任意匹配特征点的方向差以及初始文本行的方向,识别当前文本行的 方向。
[0014] 根据本发明的第二方面,提供了一种用于识别文本行的方向的方法,包括:识别初 始文本行的方向;识别跟踪时的文本行方向;以及在跟踪失败时,识别检测到的文本行方 向。
[0015] 在一个实施例中,识别初始文本行的方向包括:计算初始文本行的最小外接矩形 的方向;计算初始文本行的字符识别的可信度;以及根据初始文本行的最小外接矩形的方 向和初始文本行的字符识别的可信度,识别初始文本行的方向。
[0016] 在一个实施例中,识别当前跟踪的文本行方向包括:根据文本行的先前方向和当 前跟踪的文本行的最小外接矩形的方向,计算当前跟踪的文本行的方向。
[0017] 在一个实施例中,在跟踪失败时识别检测到的文本行方向包括:获得初始文本行 的初始特征信息,所述初始特征信息包含初始文本行的特征点的描述和方向;提取检测到 的文本行的当前特征信息,所述当前特征信息包含检测到的文本行的特征点的描述和方 向;以及根据所述初始特征信息和所述当前特征信息中的匹配特征点的方向差以及初始文 本行的方向,识别当前文本行的方向。
[0018] 在一个实施例中,根据所述初始特征信息和所述当前特征信息中的所有匹配特征 点的方向差的平均值以及初始文本行的方向,识别当前文本行的方向。
[0019] 在一个实施例中,根据所述初始特征信息和所述当前特征信息中的任意匹配特征 点的方向差以及初始文本行的方向,识别当前文本行的方向。
[0020] 采用本发明,能够以较低的计算复杂度快速且鲁棒地识别文本行的方向。此外,本 发明能够在文本行模糊的情况下,很好地识别文本行的方向。
【附图说明】
[0021] 通过下文结合附图的详细描述,本发明的上述和其它特征将会变得更加明显,其 中:
[0022] 图1示出了根据本发明一个实施例的用于识别文本行的方向的设备的框图。
[0023] 图2(a)_2(b)示出了根据本发明一个实施例的初始文本行的方向的示意图。
[0024] 图3-4示出了根据本发明一个实施例的应用场景。
[0025] 图5示出了根据本发明一个实施例的用于识别文本行的方向的方法的流程图。
【具体实施方式】
[0026] 下面,通过结合附图对本发明的具体实施例的描述,本发明的原理和实现将会变 得明显。应当注意的是,本发明不应局限于下文所述的具体实施例。另外,为了简便起见,省 略了对于本发明没有直接关联的公知技术的详细描述,以防止对本发明的理解造成混淆。
[0027] 图1示出了根据本发明一个实施例的用于识别文本行的方向的设备的框图。如图 1所示,设备10包括初始方向识别单元110、跟踪方向识别单元120和检测方向识别单元 130。下面,对设备10中所包括的各个组件进行详细描述。
[0028] 初始方向识别单元110可以被配置为识别初始文本行的方向。例如,在本实施例 中,识别单元110可以被配置为:计算初始文本行的最小外接矩形的方向;计算初始文本行 的字符识别的可信度;以及根据初始文本行的最小外接矩形的方向和初始文本行的字符识 别的可信度,识别初始文本行的方向。
[0029] 下面,结合附图2 (a) -2 (b)来描述初始方向识别单元110识别初始文本行的方向 的一个示例。
[0030] 如图2(a)所示,假设文本行方向为顺时针方向的0到360度,并且设初始文本行 的方向Θ。的范围为270度到360度和0度到90度。初始方向识别单元110以如下过程 来识别初始文本行的方向Θ c :
[0031] 首先,识别单元110计算初始文本行的最小外接矩形的方向Θ b,Θ b的取值范围为 270度到360度(即,-90度到0度)和0度到90度,如图2(b)所示。例如,在计算最小外 接矩形的方向时,可以先计算出最小外接矩形的较长边的位置,然后计算这个较长边与水 平轴的夹角,并将此夹角作为e b。
[0032] 如果Θ b大于270+ α或Θ b小于90- α (其中α为设定的阈值),则Θ。= Θ b。
[0033] 如果Θ b小于270+ α,则Θ。= Θ b或Θ。= α。以这两个方向,分别进行初始文 本行中每个字符的识别,得到每个字符的识别可信度。累计这些可信度,得到相应角度的可 信度,然后选择可信度最大的那个角度作为
[0034] 如果大于90-α,则Θ。= 或θ。= 360-α。同样,以这两个方向,分别进 行初始文本行中每个字符的识别,得到每个字符的识别可信度。累计这些可信度,得到相应 角度的可信度,然后选择可信度最大的那个角度作为Θ。。
[0035] 跟踪方向识别单元120可以被配置为识别当前跟踪文本行的方向。在本实施 例中,跟踪方向识别单元120可以被配置为:根据文本行的先前方向和当前跟踪的文本 行的最小外接矩形的方向,计算当前跟踪的文本行的方向。文本行的跟踪可以利用局部 特征点进行匹配跟踪,比如采用快速0RB(0rientated FAST and Rotated BRIEF)方法, 其中,FAST(Features from Accelerated Segment Test)是一种快速的角点检测方法, BRIEF (Binary Robust Independent Elementary Features)是一种二进制特征检测方法。
[0036] 具体地,跟踪方向识别单元120根据先前跟踪的文本行方向Θ t i和当前跟踪的文 本行的最小外接矩形方向%,计算当前跟踪的文本行的方向。令β为预设的阈值,并且今 的范围为-90度到90度,如图2(b)所示。因此,根据0^和%,可以按照如下顺序采用函 数仁来计算当前跟踪的文本行
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1