字符识别方法及装置与流程

文档序号:12178047阅读:507来源:国知局
字符识别方法及装置与流程

本公开涉及字符识别技术领域,尤其涉及一种字符识别方法及装置。



背景技术:

光学字符识别(OCR)是运用图像识别的方法对扫描文档上的文字进行识别,一般步骤为:图像预处理、行分割、单字符分割、单字符特征提取和识别、语言模型后处理等步骤。已有的单字符切割方法是按照投影图和连通域的方法进行分割,其容易受噪声的影响,单字符分割的效果不佳。



技术实现要素:

本公开实施例提供字符识别方法及装置。所述技术方案如下:

根据本公开实施例的第一方面,提供一种字符识别方法,包括:

获取待识别字符行图像;

通过图像特征识别所述待识别字符行图像中的字符分割线;

根据所述字符分割线对所述待识别字符行图像进行分割,得到字符分割图像。

其中,在所述通过图像特征识别所述待识别字符行图像中的字符分割线之前,还包括:

在保持原尺寸比例不变的情况下,将所述待识别字符行图像调整为预定尺寸。

其中,所述通过图像特征识别所述待识别字符行图像中的字符分割线,包括:

设定滑动窗口,其中,所述滑动窗口的高度与所述待识别字符行图像的高度相等;

在所述待识别字符行图像上按照预定步长移动所述滑动窗口;

提取所述滑动窗口内所述待识别字符行图像的图像特征;

根据所提取的图像特征识别所述待识别字符行图像在所述滑动窗口内是否包含所述字符分割线。

其中,所述根据所提取的图像特征识别所述待识别字符行图像在所述滑动窗口内是否包含字符分割线,包括:

提取所述滑动窗口内的梯度特征;

对所述梯度特征进行降维;

利用降维后的所述梯度特征,通过分类器识别所述滑动窗口的竖直中心线是否为所述字符分割线。

其中,所述通过图像特征识别所述待识别字符行图像中的字符分割线,还包括:

在识别出所述待识别字符行图像中的所有字符分割线之后,去除重复的字符分割线。

其中,所述去除重复的字符分割线,包括:

利用非最大值抑制方法去除重复的字符分割线。

根据本公开实施例的第二方面,提供一种字符识别装置,包括:

获取模块,被配置为获取待识别字符行图像;

识别模块,被配置为通过图像特征识别所述待识别字符行图像中的字符分割线;

分割模块,被配置为根据所述字符分割线对所述待识别字符行图像进行分割,得到字符分割图像。

其中,所述识别模块之前,还包括:

调整模块,被配置为在保持原尺寸比例不变的情况下,将所述待识别字符行图像调整为预定尺寸。

其中,所述识别模块,包括:

设定子模块,被配置为设定滑动窗口,其中,所述滑动窗口的高度与所述待识别字符行图像的高度相等;

移动子模块,被配置为在所述待识别字符行图像上按照预定步长移动所述滑动窗口;

第一提取子模块,被配置为提取所述滑动窗口内所述待识别字符行图像的图像特征;

第一识别子模块,被配置为根据所提取的图像特征识别所述待识别字符行图像在所述滑动窗口内是否包含所述字符分割线。

其中,所述第一识别子模块,包括:

第二提取子模块,被配置为提取所述滑动窗口内的梯度特征;

降维子模块,被配置为对所述梯度特征进行降维;

第二识别子模块,被配置为利用降维后的所述梯度特征,通过分类器识别所述滑动窗口的竖直中心线是否为所述字符分割线。

其中,所述识别模块,还包括:

第一去噪子模块,被配置为在识别出所述待识别字符行图像中的所有字符分割线之后,去除重复的字符分割线。

其中,所述第一去噪子模块,包括:

第二去噪子模块,被配置为利用非最大值抑制方法去除重复的字符分割线。

根据本公开实施例的第三方面,提供一种字符识别装置,包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为:

获取待识别字符行图像;

通过图像特征识别所述待识别字符行图像中的字符分割线;

根据所述字符分割线对所述待识别字符行图像进行分割,得到字符分割图像。

本公开的实施例提供的技术方案可以包括以下有益效果:

上述技术方案,对于获取的待识别字符行图像,即包括一行字符的图像进行字符识别;识别过程中,利用滑动窗口识别所述待识别字符行图像中的字符分割线,并在识别出所有字符分割线之后,根据所述字符分割线分割所述待识别字符行图像,得到字符分割图像。通过本公开的技术方案,利用图像特征识别待识别字符行图像中的字符分割线,进而用字符分割线对待识别字符行图像进行字符分割,能够有效的提高分割的鲁棒性,消除噪声和光照带来的影响。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的字符识别方法的流程图。

图2是根据一示例性实施例示出的字符识别方法中步骤102的流程图。

图3是根据一示例性实施例示出的字符识别方法中步骤204的流程图。

图4是根据一示例性实施例示出的字符识别装置的框图。

图5是根据一示例性实施例示出的字符识别装置中所述识别模块402的框图。

图6是根据一示例性实施例示出的字符识别装置中所述第一识别子模块504的框图。

图7是根据一示例性实施例示出的适用于电动自平衡车的驾驶控制装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种字符识别方法的流程图,如图1所示,包括以下步骤101-103:

在步骤101中,获取待识别字符行图像;

在步骤102中,通过图像特征识别所述待识别字符行图像中的字符分割线;

在步骤103中,根据所述字符分割线对所述待识别字符行图像进行分割,得到字符分割图像。

在本实施例中,对于获取的待识别字符行图像,即包括一行字符的图像进行字符识别;识别过程中,利用滑动窗口识别所述待识别字符行图像中的字符分割线,并在识别出所有字符分割线之后,根据所述字符分割线分割所述待识别字符行图像,得到字符分割图像。通过本公开的技术方案,利用图像特征识别待识别字符行图像中的字符分割线,进而用字符分割线对待识别字符行图像进行字符分割,能够有效的提高分割的鲁棒性,消除噪声和光照带来的影响。

在一实施例中,所述图像特征可以为图像的纹理特征、灰度特征、梯度特征或形状特征。图像特征的选择可以根据具体识别方式和识别字符的不同而具体设置。

在一实施例中,在所述通过图像特征识别所述待识别字符行图像中的字符分割线之前,还包括:在保持原尺寸比例不变的情况下,将所述待识别字符行图像调整为预定尺寸。本实施例中,获取的待识别字符行图像的尺寸大小根据原图像的大小而定,而在识别过程中通常都会统一待识别字符行图像大小,以便于后续的识别。所述预定尺寸的大小可根据具体识别的方式来设置。需要说明的是,在调整过程中,图像的尺寸比例不变,而仅仅是调整图像的宽度或长度,否则会导致图像变形,而影响识别结果。

在一实施例中,如图2所示,步骤102所述通过图像特征识别所述待识别字符行图像中的字符分割线,包括以下步骤201-204:

在步骤201中,设定滑动窗口,其中,所述滑动窗口的高度与所述待识别字符行图像的高度相等;

在步骤202中,在所述待识别字符行图像上按照预定步长移动所述滑动窗口;

在步骤203中,提取所述滑动窗口内所述待识别字符行图像的图像特征;

在步骤204中,根据所提取的图像特征识别所述待识别字符行图像在所述滑动窗口内是否包含所述字符分割线。

在本实施例中,首先设定滑动窗口,所述滑动窗口的高度与所述待识别字符行图像的高度相等,所述滑动窗口的宽度与高度可以相等也可以不相等,具体根据实际情况进行设置。在识别时,从所述待识别字符行图像的最左侧开始,按照预定步长移动所述滑动窗口,每滑动一次,提取滑动窗口内的图像特征,并根据所述图像特征识别所述待识别字符行图像在所述滑动窗口内是否包含字符分割线。所述预定步长可以根据具体情况设置,在要求识别准确率较高的情况下,可以将所述移动步长设置为1,即滑动窗口移动前后相差一个像素,而在要求效率高的情况下,移动步长可以适当增大。

在一实施例中,如图3所示,步骤204所述根据所提取的图像特征识别所述待识别字符行图像在所述滑动窗口内是否包含字符分割线,包括以下步骤301-303:

在步骤301中,提取所述滑动窗口内的梯度特征;

在步骤302中,对所述梯度特征进行降维;

在步骤303中,利用降维后的所述梯度特征,通过分类器识别所述滑动窗口的竖直中心线是否为所述字符分割线。

在本实施例中,图像特征选择使用梯度特征,所述梯度特征可选择提取HOG(Histogram of oriented gradient,方向梯度直方图)和/或WDCH(Weighted Direction Code Histogram)特征。如果选择提取HOG和WDCH两种特征的话,可以将两者组合在一起形成一个特征向量。由于提取的梯度特征的维度较高,所以通常都需要对其进行降维,具体降维幅度可根据实际情况选择,如果要去识别精度较高,则可以选择较小的降维幅度,例如按照保留原信息的百分之99左右的幅度进行降维,如果要求识别精度较低,可以选择较大的降维幅度,例如按照保留源信息的百分之80左右的幅度进行降维等。在提取梯度特征并进行降维后,将所述梯度特征输入值预先训练好的分类器中进行分类,所述分类器可以选择逻辑回归分类器,用于根据所述梯度特征确定所述滑动窗口的数值中心线是否为字符分割线。在训练所述分类器时,先获取样本集,所述样本集中包括正样本和负样本,所述样本集包括已知字符分割线的多个字符行图像,在不同滑动窗口内的图像的梯度特征,且所述正样本为滑动窗口的竖直中心线为字符分割线的滑动窗口内的梯度特征,所述负样本为滑动窗口的竖直中心线不为字符分割线的滑动窗口内的梯度特征,然后根据所述样本集中的样本,通过所选择训练方法训练所述分类器,最终得到分类器的各个分类参数。分类器训练完成后,在识别过程中,将所提取的梯度特征输入至分类器中,在所述分类参数已知的情况下,可以得到分类器的输出,在所述分类器的输出大于或等于预定阈值时,所述梯度特征对应的滑动窗口的竖直中心线为所述滑动窗口内的图像的字符分割线,在所述分类器的输出小于所述预定阈值时,所述梯度特征对应的滑动窗口的竖直中心线不为所述滑动窗口内的图像的字符分割线。通过本实施例中的上述方法,能够快速准确的识别出字符分割线。

在一实施例中,所述通过图像特征识别所述待识别字符行图像中的字符分割线,还包括:

在识别出所述待识别字符行图像中的所有字符分割线之后,去除重复的字符分割线。

在本实施例中,所述重复的字符分割线是指在两个字符间识别出来的多个字符分割线。由于在识别过程中,滑动窗口的移动步长较小,而字符间的间隔又较大,因此在两个字符间可能会识别出来多个字符分割线,因此在分割字符之前,需要去除其他字符分割线,而保留其中的一个最明显的字符分割线。

在一实施例中,所述去除重复的字符分割线,包括:利用非最大值抑制方法去除重复的字符分割线。

在本实施例中,利用非最大值抑制方法去除重复的字符分割线。对于识别出来的每一个字符分割线,以所述字符分割线为竖直中心线而设置一非最大值抑制窗口,进而从所述非最大抑制窗口内的多个字符分割线中选择一个最准确的字符分割线作为最终的字符分割线,而去除该非最大抑制窗口内的其他的字符分割线。所述非最大值抑制窗口的高度可以等于所述待识别字符图像的高度,所述非最大值抑制窗口的宽度要小于待识别字符行图像中字符与两字符间隔的宽度之和,否则会在同一个非最大抑制窗口内出现不同字符间隔内的多个字符分割线,而导致错误去除重复字符分割线的问题。本实施例中,在从一个非最大抑制窗口内的多个字符分割线中选择最准确的字符分割线时,可以利用上一实施例中所述分类器识别出所述字符分割线时得到的输出值来确定。在识别所述字符分割线时,所述分类器根据图像特征得到一个输出值,如果所述输出值大于预定阈值时,则认为所述图像特征对应的滑动窗口的竖直中心线为字符分割线,因此每个字符分割线都对应有一个分类器输出值,且所述分类器输出值越大,说明对应的字符分割线越准确。在本实施例中,对于一个非最大抑制窗口内的多个字符分割线,将对应的分类器输出值最大的一条字符分割线作为最准确的字符分割线,而去除其他字符分割线。通过本实施例的这种方法,能够快速去噪,且准确率高,速度快。

下述为本公开装置实施例,可以用于执行本公开方法实施例。

图4是根据一示例性实施例示出的一种字符识别装置的框图,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图4所示,该字符识别装置包括以下模块401-403:

在获取模块401中,被配置为获取待识别字符行图像;

在识别模块402中,被配置为通过图像特征识别所述待识别字符行图像中的字符分割线;

在分割模块403中,被配置为根据所述字符分割线对所述待识别字符行图像进行分割,得到字符分割图像。

在本实施例中,对于获取的待识别字符行图像,即包括一行字符的图像进行字符识别。识别过程中,利用滑动窗口识别所述待识别字符行图像中的字符分割线,并在识别出所有字符分割线之后,根据所述字符分割线分割所述待识别字符行图像,得到字符分割图像。通过本公开的技术方案,利用图像特征识别待识别字符行图像中的字符分割线,进而用字符分割线对待识别字符行图像进行字符分割,能够有效的提高分割的鲁棒性,消除噪声和光照带来的影响。

在一实施例中,所述图像特征可以为图像的纹理特征、灰度特征、梯度特征或形状特征。图像特征的选择可以根据具体识别方式和识别字符的不同而具体设置。

在一实施例中,在识别模块402之前,还包括以下模块:

在调整模块中,被配置为在保持原尺寸比例不变的情况下,将所述待识别字符行图像调整为预定尺寸。

本实施例中,获取的待识别字符行图像的尺寸大小根据原图像的大小而定,而在识别过程中通常都会统一待识别字符行图像大小,以便于后续的识别。所述预定尺寸的大小可根据具体识别的方式来设置。需要说明的是,在调整过程中,图像的尺寸比例不变,而仅仅是调整图像的宽度或长度,否则会导致图像变形,而影响识别结果。

在一实施例中,如图5所示,所述识别模块402,包括以下模块501-504:

在设定子模块501中,被配置为设定子模块,被配置为设定滑动窗口,其中,所述滑动窗口的高度与所述待识别字符行图像的高度相等;

在移动子模块502中,被配置为在所述待识别字符行图像上按照预定步长移动所述滑动窗口;

在第一提取子模块503中,被配置为提取所述滑动窗口内所述待识别字符行图像的图像特征;

在第一识别子模块504中,被配置为根据所提取的图像特征识别所述待识别字符行图像在所述滑动窗口内是否包含所述字符分割线。

在本实施例中,首先所述设定子模块501设定滑动窗口,所述滑动窗口的高度与所述待识别字符行图像的高度相等,所述滑动窗口的宽度与高度可以相等也可以不相等,具体根据实际情况进行设置。在识别时,所述移动子模块502从所述待识别字符行图像的最左侧开始,按照预定步长移动所述滑动窗口,每滑动一次,所述第一提取子模块503提取滑动窗口内的图像特征,所述第一识别子模块504根据所述图像特征识别所述待识别字符行图像在所述滑动窗口内是否包含字符分割线。所述预定步长可以根据具体情况设置,在要求识别准确率较高的情况下,可以将所述移动步长设置为1,即滑动窗口移动前后相差一个像素,而在要求效率高的情况下,移动步长可以适当增大。

在一实施例中,如图6所示,所述第一识别子模块504,包括以下模块601-603:

在第二提取子模块601中,被配置为提取所述滑动窗口内的梯度特征;

在降维子模块602中,被配置为对所述梯度特征进行降维;

在第二识别子模块603中,被配置为利用降维后的所述梯度特征,通过分类器识别所述滑动窗口的竖直中心线是否为所述字符分割线。

在本实施例中,第二提取子模块601选择使用梯度特征,所述梯度特征可选择提取HOG(Histogram of oriented gradient,方向梯度直方图)和/或WDCH(Weighted Direction Code Histogram)特征。如果选择提取HOG和WDCH两种特征的话,可以将两者组合在一起形成一个特征向量。由于提取的梯度特征的维度较高,所以通常都需要对其进行降维,具体降维幅度可根据实际情况选择,如果要去识别精度较高,则可以选择较小的降维幅度,例如按照保留原信息的百分之99左右的幅度进行降维,如果要求识别精度较低,可以选择较大的降维幅度,例如按照保留源信息的百分之80左右的幅度进行降维等。在提取梯度特征并进行降维后,所述第二识别子模块603将所述梯度特征输入值预先训练好的分类器中进行识别。所述分类器可以选择逻辑回归分类器,用于根据所述梯度特征确定所述滑动窗口的数值中心线是否为字符分割线。在训练所述分类器时,先获取样本集,所述样本集中包括正样本和负样本,所述样本集包括已知字符分割线的多个字符行图像,在不同滑动窗口内的图像的梯度特征,且所述正样本为滑动窗口的竖直中心线为字符分割线的滑动窗口内的梯度特征,所述负样本为滑动窗口的竖直中心线不为字符分割线的滑动窗口内的梯度特征,然后根据所述样本集中的样本,通过所选择训练方法训练所述分类器,最终得到分类器的各个分类参数。分类器训练完成后,在识别过程中,将所提取的梯度特征输入至分类器中,在所述分类参数已知的情况下,可以得到分类器的输出,在所述分类器的输出大于或等于预定阈值时,所述梯度特征对应的滑动窗口的竖直中心线为所述滑动窗口内的图像的字符分割线,在所述分类器的输出小于所述预定阈值时,所述梯度特征对应的滑动窗口的竖直中心线不为所述滑动窗口内的图像的字符分割线。通过本实施例中的上述方法,能够快速准确的识别出字符分割线。

在一实施例中,所述识别模块402,还包括:

第一去噪子模块,被配置为在识别出所述待识别字符行图像中的所有字符分割线之后,去除重复的字符分割线。

在本实施例中,所述重复的字符分割线是指在两个字符间识别出来的多个字符分割线。由于在识别过程中,滑动窗口的移动步长较小,而字符间的间隔又较大,因此在两个字符间可能会识别出来多个字符分割线,因此在分割字符之前,需要去除其他字符分割线,而保留其中的一个最明显的字符分割线。

在一实施例中,所述第一去噪子模块,包括:

第二去噪子模块,被配置为利用非最大值抑制方法去除重复的字符分割线。

在本实施例中,利用非最大值抑制方法去除重复的字符分割线。对于识别出来的每一个字符分割线,以所述字符分割线为竖直中心线而设置一非最大值抑制窗口,进而从所述非最大抑制窗口内的多个字符分割线中选择一个最准确的字符分割线作为最终的字符分割线,而去除该非最大抑制窗口内的其他的字符分割线。所述非最大值抑制窗口的高度可以等于所述待识别字符图像的高度,所述非最大值抑制窗口的宽度要小于待识别字符行图像中字符与两字符间隔的宽度之和,否则会在同一个非最大抑制窗口内出现不同字符间隔内的多个字符分割线,而导致错误去除重复字符分割线的问题。本实施例中,在从一个非最大抑制窗口内的多个字符分割线中选择最准确的字符分割线时,可以利用上一实施例中所述分类器识别出所述字符分割线时得到的输出值来确定。在识别所述字符分割线时,所述分类器根据图像特征得到一个输出值,如果所述输出值大于预定阈值时,则认为所述图像特征对应的滑动窗口的竖直中心线为字符分割线,因此每个字符分割线都对应有一个分类器输出值,且所述分类器输出值越大,说明对应的字符分割线越准确。在本实施例中,对于一个非最大抑制窗口内的多个字符分割线,将对应的分类器输出值最大的一条字符分割线作为最准确的字符分割线,而去除其他字符分割线。通过本实施例的这种方法,能够快速去噪,且准确率高,速度快。

根据本公开实施例的第三方面,提供一种字符识别装置,包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,处理器被配置为:

获取待识别字符行图像;

通过图像特征识别所述待识别字符行图像中的字符分割线;

根据所述字符分割线对所述待识别字符行图像进行分割,得到字符分割图像。

上述处理器还可被配置为:

其中,所述根据所提取的图像特征识别所述待识别字符行图像在所述滑动窗口内是否包含字符分割线,包括:

提取所述滑动窗口内的梯度特征;

对所述梯度特征进行降维;

利用降维后的所述梯度特征,通过分类器识别所述滑动窗口的竖直中心线是否为所述字符分割线。

其中,所述通过图像特征识别所述待识别字符行图像中的字符分割线,还包括:

在识别出所述待识别字符行图像中的所有字符分割线之后,去除重复的字符分割线。

其中,所述去除重复的字符分割线,包括:

利用非最大值抑制方法去除重复的字符分割线。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图7是根据一示例性实施例示出的一种用于字符识别装置的框图,该装置适用于终端设备。例如,装置700可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。

装置700可以包括以下一个或多个组件:处理组件702,存储器704,电源组件706,多媒体组件708,音频组件710,输入/输出(I/O)的接口712,传感器组件714,以及通信组件716。

处理组件702通常控制装置700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器720来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理组件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。

存储器704被配置为存储各种类型的数据以支持在装置700的操作。这些数据的示例包括用于在装置700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。

电源组件706为装置700的各种组件提供电力。电源组件706可以包括电源管理系统,一个或多个电源,及其他与为装置700生成、管理和分配电力相关联的组件。

多媒体组件708包括在所述装置700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当装置700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(MIC),当装置700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。

I/O接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件714包括一个或多个传感器,用于为装置700提供各个方面的状态评估。例如,传感器组件714可以检测到装置700的打开/关闭状态,组件的相对定位,例如所述组件为装置700的显示器和小键盘,传感器组件714还可以检测装置700或装置700一个组件的位置改变,用户与装置700接触的存在或不存在,装置700方位或加速/减速和装置700的温度变化。传感器组件714可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件716被配置为便于装置700和其他设备之间有线或无线方式的通信。装置700可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件716还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。

在示例性实施例中,装置700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器704,上述指令可由装置700的处理器720执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置700的处理器执行时,使得装置700能够执行上述字符识别方法,所述方法包括:

获取待识别字符行图像;

通过图像特征识别所述待识别字符行图像中的字符分割线;

根据所述字符分割线对所述待识别字符行图像进行分割,得到字符分割图像。

其中,在所述通过图像特征识别所述待识别字符行图像中的字符分割线之前,还包括:

在保持原尺寸比例不变的情况下,将所述待识别字符行图像调整为预定尺寸。

其中,所述通过图像特征识别所述待识别字符行图像中的字符分割线,包括:

设定滑动窗口,其中,所述滑动窗口的高度与所述待识别字符行图像的高度相等;

在所述待识别字符行图像上按照预定步长移动所述滑动窗口;

提取所述滑动窗口内所述待识别字符行图像的图像特征;

根据所提取的图像特征识别所述待识别字符行图像在所述滑动窗口内是否包含所述字符分割线。

其中,所述根据所提取的图像特征识别所述待识别字符行图像在所述滑动窗口内是否包含字符分割线,包括:

提取所述滑动窗口内的梯度特征;

对所述梯度特征进行降维;

利用降维后的所述梯度特征,通过分类器识别所述滑动窗口的竖直中心线是否为所述字符分割线。

其中,所述通过图像特征识别所述待识别字符行图像中的字符分割线,还包括:

在识别出所述待识别字符行图像中的所有字符分割线之后,去除重复的字符分割线。

其中,所述去除重复的字符分割线,包括:

利用非最大值抑制方法去除重复的字符分割线。

本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1