一种文字输入方法和系统的制作方法

文档序号:6597491阅读:93来源:国知局
专利名称:一种文字输入方法和系统的制作方法
技术领域
本发明属于电数据处理技术领域,特别涉及一种文字输入方法。
背景技术
当前,计算机输入法主要有五笔输入法、拼音输入法、手写输入法等类型。当我 们进行资料收集的时候,经常需要将大量纸质文档中的文字录入到计算机中,如果通过 上述的几种输入法进行录入,费时又费力。借助光学字符识别(OCR,Optical Character Recognition)技术,将需要的文字拍摄为图像,然后对图像进行识别,即可实现快速录入。但是,现有技术存在图像处理速度、扫描笔的扫描速度、录入速度较慢的缺陷。

发明内容
本发明所要解决的技术问题在于针对现有技术存在的缺陷,提供一种改进的计算 机扫描输入方法,实现文档资料的快速录入。为解决上述技术问题,本发明提供一种文字输入方法,该文字输入方法包括以下 步骤SlOl 通过图像采集器获取被扫描介质上文字的二维图像;S102:将获取的所述二维图像通过USB接口实时传输给数据处理单元进行后续处 理;S103 对所述二维图像进行二值化处理,获得二值图像;S104:基于图像配准对所述二值图像进行实时拼接,获得被扫描介质上文字的全
景二值图像;S105 对全景二值图像进行校正;S106 由所述校正后的全景二值图像中提取待识别文字行;S107 对所述待识别文字行进行OCR识别并显示。优选地,所述步骤S103中,通过自适应阈值二值化处理方法对所述二维图像进行
二值化处理。优选地,所述步骤S104中的图像配准是通过匹配所述二值图像中相邻图像帧间 的重叠区域计算前后相邻两帧图像之间的位移关系实现。优选地,所述步骤S105之前还包括判断全景二值图像是否存在黑底白字图像, 如果是,则识别所述黑底白字图像并进行反色;否则,直接执行步骤S105。优选地,所述步骤S105中,通过分段游程抹黑处理方法将所述全景二值图像中的 文字行校正为水平状态。所述通过分段游程抹黑处理方法将所述全景二值图像中的文字行校正为水平状 态包括通过连通域标记合并获取所述全景二值图像中的文字行;从所述文字行中选出一行作为校正基准文字行;
通过分段游程抹黑方法得到抹黑基准文字行;通过对所述抹黑基准文字行进行采样计算出文字行的弯曲曲线;根据所述弯曲曲线将所述全景二值图像校正为水平状态。优选地,所述步骤S106中,通过水平投影获取所述校正后的全景二值图像中的多 个完整文字行,并根据所述多个完整文字行各自的位置信息识别并提取出待识别文字行。优选地,所述步骤SlOl具体为通过扫描笔获取被扫描介质上文字的二维图像。本发明还提供一种文字输入系统,该文字输入系统包括图像采集器,采集待输入文字的二维图像;USB传输器,将所述二维图像传送给图像处理器;图像处理器,对来自所述USB传输器的二维图像先后进行二值化处理、实时拼接、 校正以及提取待识别文字行;OCR识别器,对所述待识别文字行进行OCR识别并显示;控制器,控制所述图像采集器、USB传输器、图像处理器及OCR识别器执行各自的 操作。优选地,所述图像采集器为扫描笔。与现有技术相比,本发明技术方案的优势在于通过将图像采集器获取的文字的 二维图像实时传输到图像处理单元中,由图像处理单元进行二值化、配准、拼接、校正和识 别等处理,而且其中的图像配准是基于二值图像进行的,这样,提高了图像处理速度、扫描 笔的扫描速度、录入速度。


图1是根据本发明的文字输入方法的流程图;图2是根据本发明的文字输入方法的实施例中通过扫描笔获得的二维图像;图3是对图2中二维图像进行二值化处理后获得的二值图像;图4是对图3中的二值图像进行实时拼接后获得的全景二值图像;图5是由图4中全景二值图像进行校正后的结果;图6是由图5中校正后的全景二值图像中提取的待识别文字行;图7是根据本发明的文字输入系统的结构示意图。
具体实施例方式本发明提出的文字输入方法,结合附图和实施例说明如下。本发明提供的文字输入方法包含以下步骤图像采集利用图像采集器采集图像;具体地,所述图像采集器可以为扫描笔,即 利用扫描笔的光感应传感器获取被扫描文字的二维图像。扫描笔具有一个带有光学镜头的 光感应传感器,比如CCD传感器,它能记录灰度或彩色二维图像。通过扫描笔,可以获取被 扫描介质上文字的连续图像序列,而且相邻图像帧间具有一定的重叠。图像传输将图像采集步骤获取的二维图像通过USB接口实时传输到数据处理单 元中。本实施例的数据处理单元为计算机。具体地,图像采集器和计算机之间通过USB接 口连接,使得获取的二维图像通过USB接口实时传输到计算机内。
图像处理在计算机内,先进行图像二值化,然后利用相邻图像帧间的重叠区域进 行图像拼接,拼接完成后得到被扫描文字的全景二值图像,对全景二值图像进行校正,从校 正后的全景二值图像中提取待识别的文字行。具体地,在计算机内对接收到的扫描图像进行实时处理首先,对图像进行自适应 阈值二值化处理,得到二维图像的二值图像;然后对二值图像进行拼接,二值图像拼接的核 心是进行图像配准,即通过匹配重叠区域计算后一帧图像相对于前一帧图像的位移,针对 二值图像,可用0表示背景像素值,用1表示前景像素值,本发明提出了一个度量二值图像 相似性的指标一配准系数,即重叠区域中所有像素求“与”运算后的加和值与重叠区域中 所有像素求“或”运算后的加和值的比值。配准系数的分子部分,是图像相关函数的形式,可 以采用FFT进行加速计算,配准系数的分母部分,可以采用积分图进行加速计算,以此指标 为基础进行图像配准,得到配准位置后,就可以实现图像拼接。当一次扫描结束后,图像拼 接也结束,得到扫描文字的全景二值图像。全景二值图像可能是白底黑字,也可能是黑底白 字,对于黑底白字的情况,需要进行反色处理;全景二值图像中的文字行一般不是水平的, 存在弯曲变形,需要将其校正成水平状态;校正后的全景二值图像中除待识别文字行外,可 能还包含一些无效文字行,因此需要将待识别文字行提取出来,待识别文字行一般位于多 行文字的靠近中间的位置,可以据此进行提取。文字识别将待识别文字行送入OCR模块进行识别。具体地,在计算机内,对待识别文字行进行OCR识别。下面将列举一个具体实施例对本发明的文字输入方法进行进一步详细说明,如图 1所示。首先将扫描笔通过USB接口与计算机相连,并启动计算中的扫描处理软件,然后 执行以下步骤SlOl 通过扫描笔获取被扫描介质上文字的二维图像。具体地,使扫描笔贴在被扫描介质上,尽量让待识别文字行位于扫描笔采集窗口 的中央,然后按照一定方向拖动扫描笔进行图像采集,扫描笔按照一定的频率获取图像。在 本实施例中,频率为120帧/秒,即每秒内获取120帧图像;如图2所示为本实施例通过扫 描笔获得的二维图像。S102 将获取的所述二维图像通过USB接口实时传输到计算机中;扫描笔获取的 二维图像经由USB接口实时传输到计算机中;计算机可以为笔记本、个人台式机,也可以为 服务器。S103 对所述二维图像进行二值化处理,获得二值图像;在本实施例中,采用OTSU 自适应阈值二值化算法对图像进行二值化。如图3所示为对图2中二维图像进行二值化处 理后获得的二值图像。S104:基于图像配准对所述二值图像进行实时拼接,获得被扫描介质上文字的全 景二值图像;所述图像配准是通过匹配重叠区域计算前后相邻两帧图像的相对位移关系实 现。具体地,由于二值图像可用0表示背景像素值,用1表示前景像素值,将重叠区域 中所有像素求“与”运算后的加和值与重叠区域中所有像素求“或”运算后的加和值的比值 作为重叠区域相似性的度量指标,并根据此度量逐像素搜索以得到最佳配准位置;获得最佳配准位置后,只需将相邻图像帧中的前一帧图像中的非重叠区域记录下来;从第一帧图 像开始,将相邻两帧图像中的前一帧图像中的非重叠部分拼接到全景二值图像中去,这样 依次进行,直到最后一帧图像;在最后一帧图像处,由于其后已经没有后续图像,故将其全 部拼接到全景二值图像中去。拼接完成后,得到被扫描文字的全景二值图像;如图4所示为 对图3中的二值图像进行实时拼接后获得的全景二值图像。S105 对全景二值图像进行校正。由于全景二值图像可能是白底黑字,也可能是黑底白字,在进行全景二值图像校 正之前,要将黑底白字图像进行反色处理,为此,需要判断全景二值图像是否需要进行反 色,全景二值图像通常为矩形图像,而被扫描文字区域一般不是严格的矩形,因此全景二值 图像一般比被扫描文字区域大,大出的部分一般填充为白色,仅需要利用被扫描文字区域 对图像进行判断;判断方法包括在被扫描文字区域中的每一行图像像素中,以每N个连续 像素点为一组进行连续分组,然后计算所有分组内像素点全部为黑像素的组数B及像素点 全部为白像素的组数W,如果W > B,则判断图像为白底黑字,否则判断图像为黑底白字;对 于已被识别为黑底白字的全景二值图像,将其中的被扫描文字区域进行反色处理;经判断, 图4中所示全景图像为白底黑字,不需要进行反色处理。全景二值图像中的文字行一般不是水平的,存在弯曲变形,需要将其校正成水平 状态。具体方法包括(1)通过连通域标记合并获取全景二值图像中的文字行;(2)从上述文字行中选出一行作为校正基准文字行;(3)利用分段游程抹黑技术(segmented run-length smearing)得到抹黑基准文 字行;(4)通过对抹黑基准文字行进行采样计算出文字行的弯曲曲线;(5)根据弯曲曲线对全景二值图像进行校正。如图5所示即为对图4中全景二值图像进行校正后的结果。S106 由所述校正后的全景二值图像中提取待识别文字行;由图5中可以看出,全景二值图像中除含有待识别文字行外,可能还含有其他文 字行,因此,需要将待识别文字行提取出来。校正后的全景二值图像中的文字行基本处于水 平状态,沿水平方向进行投影,得到黑像素点的投影直方图,利用投影直方图的极小值位置 可以将全景二值图像中的文字行分隔开来,即可得到全景二值图像中的各个完整文字行。 在得到所有完整文字行后,根据这些完整文字行的分别的位置信息识别并提取出待识别文 字行,具体地,取这些文字行中靠近中间位置的文字行作为待识别文字行。图5中含有两行 文字,其中靠近图像中间位置的那一行为待识别文字行,通过行提取,最终得到图6中所示 的待识别文字行。S107 对所述待识别文字行进行OCR识别并显示;将待识别文字行送入OCR模 块进行识别并显示识别出的文字,具体地,可以采用现有的OCR识别程序SDK (Software Development Kit)。如图7所示,本发明的实施例还提供了一种用于实现上述文字输入方法的文字输 入系统,该系统包括图像采集器,采集待输入文字的二维图像;
USB传输器,将所述二维图像传送给图像处理器;图像处理器,对来自所述USB传输器的二维图像先后进行二值化处理、实时拼接、 校正以及提取待识别文字行;OCR识别器,对所述待识别文字行进行OCR识别并显示;控制器,控制所述图像采集器、USB传输器、图像处理器及OCR识别器执行各自的 操作。具体地,所述图像采集器可以为扫描笔,所述USB传输器为USB接口及传输线,所 述图像处理器、OCR识别器以及控制器为设置于计算机内的执行与上述图像处理、OCR识别 步骤相对应操作的软件。
权利要求
1.一种文字输入方法,其特征在于,包括以下步骤5101通过图像采集器获取被扫描介质上文字的二维图像;5102将获取的所述二维图像通过USB接口实时传输到数据处理单元进行后续处理;5103对所述二维图像进行二值化处理,获得二值图像;5104基于图像配准对所述二值图像进行实时拼接,获得被扫描介质上文字的全景二 值图像;5105对全景二值图像进行校正;5106由所述校正后的全景二值图像中提取待识别文字行;5107对所述待识别文字行进行OCR识别并显示。
2.如权利要求1所述的文字输入方法,其特征在于,所述步骤S103中,通过自适应阈值 二值化处理方法对所述二维图像进行二值化处理。
3.如权利要求1所述的文字输入方法,其特征在于,所述步骤S104中的图像配准是通 过匹配所述二值图像中相邻图像帧间的重叠区域计算前后相邻两帧图像之间的位移关系 实现。
4.如权利要求1所述的文字输入方法,其特征在于,所述步骤S105之前还包括判断全景二值图像是否存在黑底白字图像,如果是,则识别所述黑底白字图像并进行 反色;否则,直接执行步骤S105。
5.如权利要求1所述的文字输入方法,其特征在于,所述步骤S105中,通过分段游程抹 黑处理方法将所述全景二值图像中的文字行校正为水平状态。
6.如权利要求5所述的文字输入方法,其特征在于,所述通过分段游程抹黑处理方法 将所述全景二值图像中的文字行校正为水平状态包括通过连通域标记合并获取所述全景二值图像中的文字行;从所述文字行中选出一行作为校正基准文字行;通过分段游程抹黑方法得到抹黑基准文字行;通过对所述抹黑基准文字行进行采样计算出文字行的弯曲曲线;根据所述弯曲曲线将所述全景二值图像校正为水平状态。
7.如权利要求1所述的文字输入方法,其特征在于,所述步骤S106中,通过水平投影获 取所述校正后的全景二值图像中的多个完整文字行,并根据所述多个完整文字行各自的位 置信息识别并提取出待识别文字行。
8.如权利要求1-7中任一项权利要求所述的文字输入方法,其特征在于,所述步骤 SlOl具体为通过扫描笔获取被扫描介质上文字的二维图像。
9.一种文字输入系统,其特征在于,包括图像采集器,采集待输入文字的二维图像;USB传输器,将所述二维图像传送给图像处理器;图像处理器,对来自所述USB传输器的二维图像先后进行二值化处理、实时拼接、校正 以及提取待识别文字行;OCR识别器,对所述待识别文字行进行OCR识别并显示;控制器,控制所述图像采集器、USB传输器、图像处理器及OCR识别器执行各自的操作。
10.如权利要求9所述的文字输入系统,其特征在于,所述图像采集器为扫描笔。
全文摘要
本发明提供了一种文字输入方法和系统,属于电数据处理技术领域。该方法包括以下步骤通过图像采集器获取被扫描介质上文字的二维图像;将获取的所述二维图像通过USB接口实时传输到数据处理单元中;数据处理单元对所述二维图像进行二值化处理,获得二值图像;数据处理单元基于图像配准对所述二值图像进行实时拼接,获得被扫描介质上文字的全景二值图像;数据处理单元对全景二值图像进行校正;数据处理单元由所述全景二值图像中提取待识别文字行;数据处理单元对所述待识别文字行进行OCR识别并显示。本发明提高了图像处理速度、扫描笔的扫描速度、录入速度。
文档编号G06K9/00GK102063611SQ201010034478
公开日2011年5月18日 申请日期2010年1月21日 优先权日2010年1月21日
发明者刘正珍, 刘迎建, 宋柏君, 李永彬, 梁义海 申请人:汉王科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1