一种文字图像识别方法及装置制造方法

文档序号:6639547阅读:230来源:国知局
一种文字图像识别方法及装置制造方法
【专利摘要】本发明实施例提供一种文字图像识别方法及装置,其中方法包括:获取待识别图像;确定所述待识别图像的全图频谱特征值;若所述全图频谱特征值大于阈值,则确定所述待识别图像为文字图像。本发明的文字图像识别方法,具有较高的识别准确性,且计算复杂度较低。
【专利说明】一种文字图像识别方法及装置

【技术领域】
[0001]本发明涉及图像处理【技术领域】,具体涉及一种文字图像识别方法及装置。

【背景技术】
[0002]文字图像为常见的图像,如何识别一种图像为文字图像,对于文字图像的处理具有重要意义。例如,在图像采集应用(如拍照应用)中,文字为常见的图像采集对象,如果在进行文字图像采集时,能够检测出当前所采集的图像为文字图像,则可在图像采集过程中,调取文字图像的处理算法进行图像处理,优化最后的图像效果。
[0003]目前识别文字图像的方式主要是采用识别图像中是否具有文字的方式进行,如果图像中有文字被识别出来,则判断当前的图像为文字图像;这种文字图像识别方式对于印刷体等规范字体具有较高的识别准确性,但是对于手写体等不规范的文字的识别准确性较低,并且由于文字识别算法的使用,使得文字图像的识别计算复杂度较高。


【发明内容】

[0004]有鉴于此,本发明实施例提供一种文字图像识别方法及装置,以解决现有文字图像识别方式所存在的识别准确性较低,计算复杂度较高的问题。
[0005]为实现上述目的,本发明实施例提供如下技术方案:
[0006]一种文字图像识别方法,应用于电子设备,所述方法包括:
[0007]获取待识别图像;
[0008]确定所述待识别图像的全图频谱特征值;
[0009]若所述全图频谱特征值大于阈值,则确定所述待识别图像为文字图像。
[0010]其中,所述获取待识别图像包括:
[0011]获取所述电子设备的图像采集装置的取景图像,将所述取景图像确定为待识别图像;
[0012]或,获取所述电子设备的图像采集装置所拍摄的图像,将所拍摄的图像确定为待识别图像;
[0013]或,调取所述电子设备本地存储的图像,将所调取的本地存储的图像确定为待识别图像;
[0014]或,获取所述电子设备从网络下载的图像,将所下载的图像确定为待识别图像。
[0015]其中,所述确定所述待识别图像的全图频谱特征值包括:
[0016]从所述待识别图像中选取多个检测区域;
[0017]分别对各检测区域进行FTF变换,得到各检测区域对应的频谱特性图;
[0018]确定各频谱特性图的最大频率;
[0019]将各频谱特性图的最大频率进行取均值处理,得到均值频率,将所述均值频率确定为所述全图频谱特征值。
[0020]其中,所述从所述待识别图像中选取多个检测区域包括:
[0021]根据所述待识别图像的分辨率及设定的检测区域的分辨率,确定所述多个检测区域在所述待识别图像中的行数和列数;
[0022]以所述行数和列数将所述待识别图像划分为对应的所述多个检测区域,采样所划分的各检测区域。
[0023]其中,所述确定各频谱特性图的最大频率包括:
[0024]将各频谱特性图的直流分量置零;
[0025]将直流分量置零后的各频谱特性图进行归一化处理;
[0026]确定归一化处理后的各频谱特性图的最大频率。
[0027]其中,所述确定所述待识别图像的全图频谱特征值包括:
[0028]对所述待识别图像进行FTF变换,得到所述待识别图像的频谱特性图;
[0029]将所述待识别图像的频谱特性图的最大频率确定为所述全图频谱特征值。
[0030]本发明实施例还提供一种文字图像识别装置,应用于电子设备,所述装置包括:
[0031]获取模块,用于获取待识别图像;
[0032]特征值确定模块,用于确定所述待识别图像的全图频谱特征值;
[0033]识别确定模块,用于若所述全图频谱特征值大于阈值,则确定所述待识别图像为文字图像。
[0034]其中,所述特征值确定模块包括:
[0035]选取单元,用于从所述待识别图像中选取多个检测区域;
[0036]第一变换单元,用于分别对各检测区域进行FTF变换,得到各检测区域对应的频谱特性图;
[0037]第一频率确定单元,用于确定各频谱特性图的最大频率;
[0038]均值确定单元,用于将各频谱特性图的最大频率进行取均值处理,得到均值频率,将所述均值频率确定为所述全图频谱特征值。
[0039]其中,所述选取单元包括:
[0040]行列确定子单元,用于根据所述待识别图像的分辨率及设定的检测区域的分辨率,确定所述多个检测区域在所述待识别图像中的行数和列数;
[0041]划分采样子单元,用于以所述行数和列数将所述待识别图像划分为对应的所述多个检测区域,采样所划分的各检测区域。
[0042]其中,所述第一频率确定单元包括:
[0043]置零子单元,用于将各频谱特性图的直流分量置零;
[0044]归一子单元,用于将直流分量置零后的各频谱特性图进行归一化处理;
[0045]最大频率确定子单元,用于确定归一化处理后的各频谱特性图的最大频率。
[0046]基于上述技术方案,本发明实施例提供的文字图像识别方法,在获取待识别图像后,可确定待识别图像的全图频谱特征值,并在所述全图频谱特征值大于阈值时,确定所述待识别图像为文字图像,实现文字图像的识别。由于文字图像具有显著的频域特性,因此本发明实施例提供的文字图像识别方法,通过待识别图像的全图频谱特征值进行文字图像的识别,具有较高的识别准确性,且由于未采用复杂算法实现文字图像的识别,因此文字图像识别的计算复杂度较低。可以看出,本发明实施例提供的文字图像识别方法,基于文字图像的频域特性实现文字图像的识别,相比现有技术具有较高的识别准确性,且计算复杂度较低。

【专利附图】

【附图说明】
[0047]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0048]图1为本发明实施例提供的文字图像识别方法的流程图;
[0049]图2为本发明实施例提供的文字图像识别方法的另一流程图;
[0050]图3为本发明实施例提供的选取检测区域的示意图;
[0051]图4为本发明实施例提供的文字图像识别方法的应用示意图;
[0052]图5为本发明实施例提供的文字图像识别方法的再一流程图;
[0053]图6为本发明实施例提供的文字图像识别装置的结构框图;
[0054]图7为本发明实施例提供的文字图像识别装置的另一结构框图;
[0055]图8为本发明实施例提供的特征值确定模块的结构框图;
[0056]图9为本发明实施例提供的选取单元的结构框图;
[0057]图10为本发明实施例提供的第一频率确定单元的结构框图;
[0058]图11为本发明实施例提供的特征值确定模块的另一结构框图。

【具体实施方式】
[0059]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0060]本发明的发明人研宄发现,文字为主的图像,由于文字的大小、排布都具有较强的规律性,因此其频域特性是显著的;而对于其他类型的图像(如风景图像等),其频域分布相比较文字图像更多为低频区域;因此本发明实施例可通过对图像进行频域分析,从而识别图像为文字图像还是非文字图像;若是应用于拍照场景,则可区分出当前的拍照场景为文字场景还是非文字场景。
[0061]图1为本发明实施例提供的文字图像识别方法的流程图,该方法可应用于电子设备,该电子设备可以为手机,平板电脑,笔记本电脑等具有数据处理能力的设备,更进一步,该电子设备可以为具有图像采集装置(如摄像头)的电子设备;参照图1,该方法可以包括:
[0062]步骤S100、获取待识别图像;
[0063]待识别图像可以为任意方式获取的图像,如电子设备正在采用图像采集装置进行拍照,则待识别图像可以为图像采集装置当前的取景图像或是已拍摄的图像;显然,本发明实施例也可对电子设备本地保存或者从网络获取的图像进行识别,则待识别图像可以为所调取的电子设备本地图像或者从网络下载的图像。
[0064]具体的,本发明实施例可获取所述电子设备的图像采集装置的取景图像,将所述取景图像确定为待识别图像;
[0065]或,获取所述电子设备的图像采集装置所拍摄的图像,将所拍摄的图像确定为待识别图像;
[0066]或,调取所述电子设备本地存储的图像,将所调取的本地存储的图像确定为待识别图像;
[0067]或,获取所述电子设备从网络下载的图像,将所下载的图像确定为待识别图像。
[0068]需要说明的是,上述待识别图像的说明仅为举例式说明,其他方式获取的图像也可作为本发明实施例的待识别图像。
[0069]步骤S110、确定所述待识别图像的全图频谱特征值;
[0070]可选的,本发明实施例可米用FFT(Fast Fourier Transformat1n,快速傅氏变换)变换算法,确定待识别图像的全图频谱特征值;显然,FFT变换算法仅为一种得到全图频谱特征值的可选方式,本发明实施例也可采用其他的可得到图像频域特性的算法。
[0071]本发明实施例确定待识别图像的全图频谱特征值的一种方式为对待识别图像进行FFT变换,得到待识别图像的频谱特性图,从而确定频谱特性图的最大频率,将该最大频率作为待识别图像的全图频谱特征值;这种方式虽然直接简单,但所确定的全图频谱特征值存在一定误差;本发明实施例提供的另一种方式为:
[0072]对待识别图像进行检测区域划分,对各检测区域进行FTF变换,得到各检测区域对应的频谱特性图,从而将各频谱特性图的最大频率进行取均值处理,取得到的均值频率作为所述全图频谱特征值。
[0073]步骤S120、若所述全图频谱特征值大于阈值,则确定所述待识别图像为文字图像。
[0074]阈值表示的是文字图像所对应的全图频谱特征值,可根据计算多种文字图像的全图频谱特征值后,取均值得到。
[0075]本发明实施例提供的文字图像识别方法,在获取待识别图像后,可确定待识别图像的全图频谱特征值,并在所述全图频谱特征值大于阈值时,确定所述待识别图像为文字图像,实现文字图像的识别。由于文字图像具有显著的频域特性,因此本发明实施例提供的文字图像识别方法,通过待识别图像的全图频谱特征值进行文字图像的识别,具有较高的识别准确性,且由于未采用复杂算法实现文字图像的识别,因此文字图像识别的计算复杂度较低。可以看出,本发明实施例提供的文字图像识别方法,基于文字图像的频域特性实现文字图像的识别,相比现有技术具有较高的识别准确性,且计算复杂度较低。
[0076]可选的,本发明实施例在确定待识别图像为文字图像后,可调用文字图像相应的处理算法,对该待识别图像进行处理,从而优化该待识别图像的成像效果。
[0077]图2为本发明实施例提供的文字图像识别方法的另一流程图,参照图2,该方法可以包括:
[0078]步骤S200、获取待识别图像;
[0079]步骤S210、从所述待识别图像中选取多个检测区域;
[0080]可选的,本发明实施例可随机从待识别图像中选取多个检测区域;
[0081]可选的,由于FFT变换对于图像分辨率具有要求,因此本发明实施例可设定检测区域的分辨率,所设定的检测区域的分辨率应至少满足FFT变换对于图像分辨率的要求;从而以设定的检测区域的分辨率作为所选取的各检测区域的分辨率,根据待识别图像的分辨率及设定的检测区域的分辨率,可确定待识别图像可被划分的检测区域数量,从而从待识别图像中选取出多个检测区域;
[0082]具体的,本发明实施例可根据待识别图像的分辨率及设定的检测区域的分辨率,确定所述多个检测区域在所述待识别图像中的行数和列数,从而以所述行数和列数将所述待识别图像划分为对应的所述多个检测区域,采样所划分的各检测区域,实现从所述待识另帽像中选取多个检测区域。例如,FFT变换时,要求图像区域的分辨率为2n,在确定了待识别图像的分辨率后,则可确定待识别图像所能划分的检测区域数量,进而可确定所述多个检测区域在所述待识别图像中的行数和列数,对以行数和列数划分好的检测区域进行采样,则可实现从所述待识别图像中选取多个检测区域。
[0083]为便于理解,图3示出了选取检测区域的示意图,参照图3,图a为所获取的待识别图像,本发明实施例可以待识别图像的分辨率及设定的检测区域的分辨率,确定所述多个检测区域在所述待识别图像中的行数和列数为3*3,进而以3*3将图a划分成9个检测区域,采样所划分的各检测区域,实现多个检测区域的选取。
[0084]步骤S220、分别对各检测区域进行FTF变换,得到各检测区域对应的频谱特性图;
[0085]步骤S230、确定各频谱特性图的最大频率;
[0086]可选的,所确定的各频谱特性图的最大频率可以为,各频谱特性图中除直流分量外能量最大的频率;对应的,本发明实施例可在得到各检测区域对应的频谱特性图后,将各频谱特性图的直流分量置零,将直流分量置零后的各频谱特性图进行归一化处理,从而确定归一化处理后的各频谱特性图的最大频率。
[0087]步骤S240、将各频谱特性图的最大频率进行取均值处理,得到均值频率,将所述均值频率确定为所述全图频谱特征值;
[0088]步骤S250、若所述全图频谱特征值大于阈值,则确定所述待识别图像为文字图像。
[0089]可选的,若所述全图频谱特征值不大于阈值,则确定所述待识别图像为非文字图像。
[0090]图2所示方法的一个应用为:在手机摄像头拍摄文字图像时,可采用本发明实施例所提供的文字图像识别方法进行文字图像的识别,从而调用相应的图像处理算法进行文字图像处理,优化文字图像的成像效果。
[0091]图4示出了一个应用示意图,手机的摄像头拍摄图像时,手机内置的处理芯片可获取摄像头所采集的图像,从该图像中选取多个检测区域,分别对各检测区域进行FTF变换,得到各检测区域对应的频谱特性图;将各将频谱特性图的直流分量置零,将直流分量置零后的各频谱特性图进行归一化处理,确定归一化处理后的各频谱特性图的最大频率;将各频谱特性图的最大频率进行取均值处理,得到均值频率;判断该均值频率是否大于阈值,并在大于阈值时,确定手机摄像头当前拍摄的图像为文字图像,从而调用相应的文字图像处理算法对所拍摄的文字图像进行优化处理,提高文字图像的成像效果。
[0092]显然,本发明实施例所提供的文字图像识别方法,也可对电子设备本地存储图像或网络下载图像进行识别。
[0093]图5示出了本发明实施例提供的文字图像识别方法的再一流程图,参照图5,该方法可以包括:
[0094]步骤S300、获取待识别图像;
[0095]步骤S310、对所述待识别图像进行FTF变换,得到所述待识别图像的频谱特性图;
[0096]步骤S320、将所述待识别图像的频谱特性图的最大频率确定为所述全图频谱特征值;
[0097]可选的,本发明实施例可确定待识别图像的频谱特性图中,除直流分量外能量最大的频率为所述全图频谱特征值;具体的,本发明实施例可将待识别图像的频谱特性图的直流分量置零,将直流分量置零后的待识别图像的频谱特性图进行归一化处理,确定归一化处理后的待识别图像的频谱特性图的最大频率。
[0098]步骤S330、若所述全图频谱特征值大于阈值,则确定所述待识别图像为文字图像。
[0099]可选的,若所述全图频谱特征值不大于阈值,则确定所述待识别图像为非文字图像。
[0100]相比于图2所示方法,图5所示方法采用对整张待识别图像进行FTF变换,以待识别图像的频谱特性图的最大频率作为所述全图频谱特征值,从而进行图像频域特性与文字图像频域特性的判断比对,实现文字图像的识别。图5所示方法虽然更为简单,但其准确性稍低于图2所示方法。
[0101]值得注意的是,无论图2所示方法和图5所示方法均是基于文字图像的频域特性实现文字图像识别,均为图1所示方法的可选实现方式。
[0102]图5所示方法的一个应用为:手机的摄像头拍摄图像时,手机内置的处理芯片可获取摄像头所采集的图像,对该图像进行FTF变换,得到该图像的频谱特性图,对该频谱特性图的直流分量置零,将直流分量置零后的频谱特性图进行归一化处理,确定归一化处理后的频谱特性图的最大频率,判断该最大频率是否大于阈值,并在大于阈值时,确定手机摄像头当前拍摄的图像为文字图像,从而调用相应的文字图像处理算法对所拍摄的文字图像进行优化处理,提高文字图像的成像效果。
[0103]显然,本发明实施例所提供的文字图像识别方法,也可对电子设备本地存储图像或网络下载图像进行识别。
[0104]本发明实施例提供的文字图像识别方法,基于文字图像的频域特性实现文字图像的识别,相比现有技术具有较高的识别准确性,且计算复杂度较低。
[0105]下面对本发明实施例提供的文字图像识别装置进行介绍,下文描述的文字图像识别装置可与上文描述的文字图像识别方法相互对应参照。
[0106]图6为本发明实施例提供的文字图像识别装置的结构框图,该文字图像识别装置可应用于电子设备,该电子设备可以为手机,平板电脑,笔记本电脑等具有数据处理能力的设备,更进一步,该电子设备可以为具有图像采集装置(如摄像头)的电子设备;参照图6,该文字图像识别装置可以包括:
[0107]获取模块100,用于获取待识别图像;
[0108]特征值确定模块200,用于确定所述待识别图像的全图频谱特征值;
[0109]识别确定模块300,用于若所述全图频谱特征值大于阈值,则确定所述待识别图像为文字图像。
[0110]可选的,获取模块100可具体用于获取所述电子设备的图像采集装置的取景图像,将所述取景图像确定为待识别图像;或,获取所述电子设备的图像采集装置所拍摄的图像,将所拍摄的图像确定为待识别图像;或,调取所述电子设备本地存储的图像,将所调取的本地存储的图像确定为待识别图像;或,获取所述电子设备从网络下载的图像,将所下载的图像确定为待识别图像。
[0111]可选的,识别确定模块300还可用于若所述全图频谱特征值不大于阈值,则确定所述待识别图像为非文字图像。
[0112]可选的,图7示出了本发明实施例提供的文字图像识别装置的另一结构框图,结合图6和图7所示,该文字图像识别装置还可以包括:
[0113]图像处理模块400,用于在确定待识别图像为文字图像后,调用文字图像相应的处理算法,对待识别图像进行处理,以优化待识别图像的成像效果。
[0114]可选的,图8示出了本发明实施例提供的特征值确定模块200的一种可选结构,参照图8,特征值确定模块200可以包括:
[0115]选取单元210,用于从所述待识别图像中选取多个检测区域;
[0116]第一变换单元211,用于分别对各检测区域进行FTF变换,得到各检测区域对应的频谱特性图;
[0117]第一频率确定单元212,用于确定各频谱特性图的最大频率;
[0118]均值确定单元213,用于将各频谱特性图的最大频率进行取均值处理,得到均值频率,将所述均值频率确定为所述全图频谱特征值。
[0119]可选的,图9示出了本发明实施例提供的选取单元210的一种可选结构,参照图9,选取单元210可以包括:
[0120]行列确定子单元2101,用于根据所述待识别图像的分辨率及设定的检测区域的分辨率,确定所述多个检测区域在所述待识别图像中的行数和列数;
[0121]划分采样子单元2102,用于以所述行数和列数将所述待识别图像划分为对应的所述多个检测区域,采样所划分的各检测区域。
[0122]可选的,选取单元210还可用于随机从所述待识别图像中选取多个检测区域。
[0123]可选的,图10示出了本发明实施例提供的第一频率确定单元212的一种可选结构,参照图10,第一频率确定单元212可以包括:
[0124]置零子单元2121,用于将各频谱特性图的直流分量置零;
[0125]归一子单元2122,用于将直流分量置零后的各频谱特性图进行归一化处理;
[0126]最大频率确定子单元2123,用于确定归一化处理后的各频谱特性图的最大频率。
[0127]可选的,图11示出了本发明实施例提供的特征值确定模块200的另一种可选结构,参照图11,特征值确定模块200可以包括:
[0128]第二变换单元220,对所述待识别图像进行FTF变换,得到所述待识别图像的频谱特性图;
[0129]第二频率确定单元221,用于将所述待识别图像的频谱特性图的最大频率确定为所述全图频谱特征值。
[0130]可选的,第二频率确定单元221也可具有图10所示结构,具体可采用置零子单元将待识别图像的频谱特性图的直流分量置零,采用归一子单元将直流分量置零后的待识别图像的频谱特性图进行归一化处理,采用最大频率确定子单元确定归一化处理后的待识别图像的频谱特性图的最大频率。
[0131]本发明实施例还可提供一种电子设备,该电子设备可以包括上述所述的文字图像识别装置。该电子设备在采用摄像头拍摄图像时,可采用上述所述的文字图像识别装置对所拍摄的图像进行文字图像识别,从而在识别到所拍摄的图像为文字图像后,电子设备可调用相应的图像处理算法对所拍摄的图像进行优化处理,提高所拍摄的图像的成像效果。
[0132]本发明基于文字图像的频域特性实现文字图像的识别,相比现有技术具有较高的识别准确性,且计算复杂度较低。
[0133]本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0134]专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能宄竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0135]结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或【技术领域】内所公知的任意其它形式的存储介质中。
[0136]对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
【权利要求】
1.一种文字图像识别方法,其特征在于,应用于电子设备,所述方法包括: 获取待识别图像; 确定所述待识别图像的全图频谱特征值; 若所述全图频谱特征值大于阈值,则确定所述待识别图像为文字图像。
2.根据权利要求1所述的文字图像识别方法,其特征在于,所述获取待识别图像包括: 获取所述电子设备的图像采集装置的取景图像,将所述取景图像确定为待识别图像; 或,获取所述电子设备的图像采集装置所拍摄的图像,将所拍摄的图像确定为待识别图像; 或,调取所述电子设备本地存储的图像,将所调取的本地存储的图像确定为待识别图像; 或,获取所述电子设备从网络下载的图像,将所下载的图像确定为待识别图像。
3.根据权利要求1或2所述的文字图像识别方法,其特征在于,所述确定所述待识别图像的全图频谱特征值包括: 从所述待识别图像中选取多个检测区域; 分别对各检测区域进行FTF变换,得到各检测区域对应的频谱特性图; 确定各频谱特性图的最大频率; 将各频谱特性图的最大频率进行取均值处理,得到均值频率,将所述均值频率确定为所述全图频谱特征值。
4.根据权利要求3所述的文字图像识别方法,其特征在于,所述从所述待识别图像中选取多个检测区域包括: 根据所述待识别图像的分辨率及设定的检测区域的分辨率,确定所述多个检测区域在所述待识别图像中的行数和列数; 以所述行数和列数将所述待识别图像划分为对应的所述多个检测区域,采样所划分的各检测区域。
5.根据权利要求3所述的文字图像识别方法,其特征在于,所述确定各频谱特性图的最大频率包括: 将各频谱特性图的直流分量置零; 将直流分量置零后的各频谱特性图进行归一化处理; 确定归一化处理后的各频谱特性图的最大频率。
6.根据权利要求1或2所述的文字图像识别方法,其特征在于,所述确定所述待识别图像的全图频谱特征值包括: 对所述待识别图像进行FTF变换,得到所述待识别图像的频谱特性图; 将所述待识别图像的频谱特性图的最大频率确定为所述全图频谱特征值。
7.一种文字图像识别装置,其特征在于,应用于电子设备,所述装置包括: 获取模块,用于获取待识别图像; 特征值确定模块,用于确定所述待识别图像的全图频谱特征值; 识别确定模块,用于若所述全图频谱特征值大于阈值,则确定所述待识别图像为文字图像。
8.根据权利要求7所述的文字图像识别装置,其特征在于,所述特征值确定模块包括: 选取单元,用于从所述待识别图像中选取多个检测区域; 第一变换单元,用于分别对各检测区域进行FTF变换,得到各检测区域对应的频谱特性图; 第一频率确定单元,用于确定各频谱特性图的最大频率; 均值确定单元,用于将各频谱特性图的最大频率进行取均值处理,得到均值频率,将所述均值频率确定为所述全图频谱特征值。
9.根据权利要求8所述的文字图像识别装置,其特征在于,所述选取单元包括: 行列确定子单元,用于根据所述待识别图像的分辨率及设定的检测区域的分辨率,确定所述多个检测区域在所述待识别图像中的行数和列数; 划分采样子单元,用于以所述行数和列数将所述待识别图像划分为对应的所述多个检测区域,采样所划分的各检测区域。
10.根据权利要求8或9所述的文字图像识别装置,其特征在于,所述第一频率确定单元包括: 置零子单元,用于将各频谱特性图的直流分量置零; 归一子单元,用于将直流分量置零后的各频谱特性图进行归一化处理; 最大频率确定子单元,用于确定归一化处理后的各频谱特性图的最大频率。
【文档编号】G06K9/00GK104463136SQ201410800482
【公开日】2015年3月25日 申请日期:2014年12月19日 优先权日:2014年12月19日
【发明者】朱巍巍, 陈继 申请人:中科创达软件股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1