基于ocr的无线扫描输入装置和方法

文档序号:6471750阅读:142来源:国知局
专利名称:基于ocr的无线扫描输入装置和方法
技术领域
本发明涉及光学字符识别(OCR, Optical Character Recognition)技术领域,尤 其是一种基于OCR的无线扫描输入装置和方法。
背景技术
目前电脑基本上是通过键盘输入,也有的采用手写笔进行输入,但是输入速度都 比较慢,很难超过5字/秒。随着OCR技术出现,目前字符录入速度可以达到70字/秒以 上。OCR技术通过与高速扫描仪的有机集成,有效解决了纸质文档的录入问题。但是由于扫 描仪一般体积比较大,质量比较重,不方便随身携带,而且价钱比较昂贵,以至于无法大面 积的普及使用。此后有人提出了一种带USB线的扫描笔的输入方法,使OCR输入法摆脱了 扫描仪的束缚,但是该方法的弊端是需要通过USB线连接到电脑,USB传输距离有限,而且 到哪里总要带着一根USB数据线,非常不方便。

发明内容
本发明的目的是克服现有技术中扫描输入装置的不方便,提出一种基于OCR的无 线扫描输入装置和方法,通过无线通信装置在扫描装置和主机或其他带蓝牙的智能设备之 间进行数据传输,摆脱了 USB线的困扰,能够实现远距离输入。 为了实现上述目的,本发明提供了一种基于OCR的无线扫描输入装置,包括扫描
装置和主机,所述扫描装置对图像进行扫描采集和处理并将图像数据发送给所述主机,所
述扫描装置和所述主机之间通过无线通信装置连接,所述无线通信装置包括 无线发送装置,将经过采集和处理的所述图像数据或指令据发送出去; 无线接收装置,接收所述无线发送装置发送来的所述图像数据或指令。 优选地,所述扫描装置和所述主机之间通过蓝牙装置连接,所述无线通信装置为
蓝牙装置,其中所述无线发送装置是蓝牙发送装置,所述无线接收装置是蓝牙接收装置。 优选地,所述扫描装置包括 图像采集装置,包括面阵图像传感器、以及光学系统,通过预定时间间隔对所述图 像进行采集获得一系列二维帧图像; 图像处理装置,对于所述图像采集装置送入的每帧二维图像进行滤波去噪、图像 二值化、编码压縮,以形成压縮二值化图像数据并传输给所述无线发送装置;
所述主机包括 图像拼接装置,接收所述无线接收装置发送来的所述压縮二值化图像数据并进行 解码,得到展开的二值化图像,以及利用前后帧的相关性完成图像的拼接工作,得到一幅完 整的二值化图像; OCR识别装置,包括OCR引擎,将所述完整的二值化图像转换为可编辑字符流。
优选地,其中所述图像拼接装置和所述OCR识别装置之间还包括文字行提取装 置,所述文字行提取装置通过分段行切分将所述完整的二值化图像中的文字分成行,去除边界上的不完整文字图像行,保留拼接后图像中间完整的文字行图像。 优选地,其中所述OCR识别装置后面还包括输出装置,将所述可编辑字符流输出
到用户指定位置。 优选地,其中所述面阵图像传感器为0V6130 COMS传感器,所述预定时间间隔为 1/60秒。 优选地,其中所述滤波采用3x 3的均值滤波,所述图像二值化采用分块的OTSU, 所述二值化图像的编码采用游程编码或JBIG-2编码。 优选地,所述无线发送装置设置于所述扫描装置内;所述无线接收装置设置于所 述主机内。 优选地,其中所述OCR识别装置包括汉王OCR识别引擎。 优选地,其中所述输出装置的用户指定位置是光标所在位置、用户指定的文件或 手机短信。 为实现上述目的,本发明还提供了一种基于OCR的无线扫描输入方法,包括以下 步骤 步骤(a)、所述扫描装置对图像进行扫描采集和处理; 步骤(b)、通过无线发送方式将图像数据或指令发送给所述主机, 步骤(c)、所述主机通过无线接收方式接收所述无线发送装置发送来的所述图像
数据或指令; 步骤(d)、通过OCR识别方法对所述图像数据进一步处理为可编辑字符流。
本发明的基于OCR的无线扫描输入装置和方法通过无线通信装置如蓝牙通信装 置进行数据传输,摆脱了 USB线的困扰,能够实现远距离输入。只要在无线通信装置如蓝牙 通信装置覆盖的有效范围之内都可以使用本输入法,极大的方便了远距离输入的需要。


图1为本发明的基于OCR的无线扫描输入装置的功能方框图;
图2为本发明一个实施例的被处理图像的示意图。
具体实施例方式
下面结合附图详细说明本发明的基于OCR的无线扫描输入装置和方法。 如图1所示,为本发明一个实施例的基于OCR的无线扫描输入装置,主要包括两个
部分扫描装置100、和主机200,两者之间通过无线连接进行信号的发送和接收。扫描装置
100的作用是对纸质文档进行扫描,该装置可以是任何种类的扫描输入设备,如扫描笔、扫
描仪等;而主机200则可以是PC机或智能设备等。 在一个实施例中,扫描装置IOO采用了扫描笔,请同时参见图2,为本发明一个实 施例的被处理图像的示意图。如图1所示,扫描装置100包括 图像采集装置110 :采用面阵图像传感器、以及光学系统获得二维图像,其中面阵 图像传感器可以选择的种类很多,如CCD或CMOS方式的面阵图像传感器均可,在一个具体 实施例中本发明采用了0V6130 COMS传感器。图像采集装置110每隔一定的时间间隔采集 一次,每次采集的图像称为一帧图像,例如1/60秒采集一次,帧图像的大小如144*176像
4素,所得到如图2中310所示的自左至右的一系列帧图像。通过扫描笔笔尖的压力感应器 来触发和终止图像采集过程。 图像处理装置120 :对于图像采集装置送入的每帧图像进行滤波去噪、图像二值 化、编码压縮,然后形成压縮二值化图像数据。在一个实施例中图像编码压縮选择了游程编 码,在另一个实施例中也可以选择JBIG-2编码技术。在一个实施例中滤波可以采用3x3的 均值滤波,图像二值化采用分块的OTSU(最大类间方差),每一帧图像经过图像处理(去噪、 二值化)得到图2中的320中所示的自左至右的一系列的帧图像,这些二值化图像的编码 采用游程编码,然后经过作为无线通信装置的蓝牙装置发送出去,该蓝牙装置可包括蓝牙 发送装置130和蓝牙接收装置210,蓝牙发送装置130和蓝牙接收装置210分别作为无线发 送装置和无线接收装置,无线发送装置可以设置于扫描装置100内;无线接收装置可以设 置于主机200内。 蓝牙发送装置130 :将压縮的二值化图像数据或者一些相关指令(如开始扫描、扫 描完成等)通过无线蓝牙发送装置发送出去。蓝牙装置是一个标准模块,可以选择10m和 100m两种不同传输范围的蓝牙模块,如可选用南京国春电器设备有限公司的GC-05插针式 100米蓝牙模块。 主机200,采用PC端或智能设备端,包括 蓝牙接收装置210:接收压縮二值化图像数据,取出帧图像。同样可以选择南京国 春电器设备有限公司的GC-05插针式100米蓝牙模块。 图像拼接装置220 :调用同扫描装置端对应的图像解码算法,对压縮的帧图像进 行解码,得到展开的二值化图像,如图2中的330中所示的自左至右的一系列的帧图像,经 过对比可见,330中的图像与320是一一对应的,这证明图像得到了很好的还原;然后利用 前后帧的相关性完成图像(帧)的拼接工作。本发明在一边图像传输的同时,一边进行帧 图像的拼接工作,当扫描装置发送图像采集终止,本装置就完成了所有的图像(帧)的拼接 工作,得到一幅完整的二值化图像,如图2中的340即拼接完成后的一幅图像。其中图像拼 接算法可以选择基于相关分析的算法,也可以选择LM(Levenberg-Marquardt)算法及其变 种。 文字行提取装置230 :选择合适的行提取算法,该装置的作用是尽量减少噪声行 和不完整行,以提高OCR引擎的识别速度和正确性。在一个优选实施例中,选择分段行切分 的方法,将图像中的文字分成行,去除边界上的不完整文字图像行,保留拼接后图像中间较 完整的文字行图像,以供OCR识别。行提取算法也可以采用基于连通域分析或基于行投影 的算法,在实施中通过比较发现分段行切分的方法效果最佳。在图2的实施例中上一步骤 得到的图像340经过文字行提前处理,得到图像350,该图中去除了边缘的噪声即图像340 中上面和下面的不完整的文字,保留了中间的具有完整意义的文字行。当然,在一个可选的 实施例中,文字行提取装置230是可以省略的,但这会增加后续装置和步骤的数据处理负 担。 OCR识别装置240 :将文字行图像送入光学字符识别OCR引擎,对图像进行字符切 分并转换为可编辑字符流,以及识别结果字符流后处理等操作。OCR识别装置可以采用目 前市场上可以采购的识别引擎,例如汉王OCR识别引擎,该引擎可以支持Windows, Li皿x平 台,也可以支持嵌入式WinCE、Li皿x、Symbian、MTK等,而且可以识别多种语言,包括中、日、韩、英以及其他的西欧语种。图2的实施例中将图像350输入OCR引擎,经过识别得到图像
360中的可编辑字符流,由图中可见,经过识别得到的文字是完整清晰的。 输出装置250,将可编辑字符流输出到用户指定位置,在一个实施例中将0CR识别
结果直接输出到光标所在位置,或也可以保存到用户指定的文件中。对于手机用户还可以
输出到短信,将识别后的内存通过短信发送。 本发明有着极为广泛的应用,以下是两个实例 l.PC(personal computer,个人电脑)应用图书馆阅览室,用户笔记本在书桌 上,而此时用户想到书架上想输入一些参考资料到PC上,他就可以使用本产品自由的在书 架上进行扫描,识别结果自动的保存到其电脑之中,而无需将参考书籍拿到书桌上进行输 入。 2.手机应用用户有一个带蓝牙的手机,只要用户手机上安装有本发明的输入法 程序以及图1所示的装置,他就可以利用扫描笔随时随地的进行输入,比如他看到一个笑 话,想跟亲人朋友共享,他可以通过扫描笔进行输入到短信,然后发给他们,非常方便。
本发明实施例中还提供了一种基于OCR的无线扫描输入方法,采用上述技术方案 中的装置,包括以下步骤 步骤(a)、所述扫描装置对图像进行扫描采集和处理;
步骤(b)、通过无线发送方式将图像数据发送给所述主机, 步骤(c)、所述主机通过无线接收方式接收所述无线发送装置发送来的所述图像 数据; 步骤(d)、通过OCR识别方法对所述图像数据进一步处理为可编辑字符流。
进一步地,所述步骤(b)和所述步骤(c)中的所述无线发送方式和无线接收方式 为蓝牙发送和接收方式。 进一步地,所述步骤(a)的采集和处理包括先通过预定时间间隔对所述图像进 行采集并转换为一系列二维帧图像,再对所述二维帧图像进行滤波去噪、图像二值化、编码 压縮,以形成压縮二值化图像数据并传输给所述无线发送装置; 进一步地,所述步骤(d)包括对所述无线接收装置发送来的所述压縮二值化图
像数据进行解码,得到展开的二值化图像,然后利用前后帧的相关性完成图像的拼接,得到
一幅完整的二值化图像;接着将所述完整的二值化图像转换为可编辑字符流。 进一步地,所述步骤(d)进一步包括所述图像拼接后先将所述完整的二值化图
像中的文字分成行,去除边界上的不完整文字图像行,保留拼接后图像中间完整的文字行
图像后,再转换为可编辑字符流。 具体地,所述步骤(a)的采集选择面阵图像传感器,所述预定时间间隔为1/60秒; 所述滤波采用3x3的均值滤波,所述图像二值化采用分块的OTSU,所述二值化图像的编码 采用游程编码或JBIG-2编码。 具体地,所述步骤(d)中的所述图像拼接算法为基于相关分析的算法、或LM算法、 或LM算法的变种。具体地,所述步骤(d)中的所述OCR识别方法包括采用汉王OCR识别引擎。 本发明的上述实施例中,通过无线通信装置如蓝牙装置进行数据传输,摆脱了 USB 线的困扰,能够实现远距离输入。只要在无线蓝牙覆盖的有效范围之内都可以使用本输入
6法,极大的方便了远距离输入的需要。典型应用如在图书馆,接受输入PC远在书桌上,而我 们可以在书架边进行文字摘抄。 当然,以上只是通过实施例对本发明进行了阐述,上述实施例是示例而非限制本 发明,例如其中的蓝牙装置也可以被其他形式的无线电技术所替代,本领域技术人员将能 够设计很多替代实施例而不脱离附后的权利要求书的范围。
权利要求
一种基于OCR的无线扫描输入装置,包括扫描装置和主机,所述扫描装置用于对图像进行扫描采集和处理并将图像数据发送给所述主机,其特征是所述扫描装置和所述主机之间通过无线通信装置连接,所述无线通信装置包括无线发送装置,将经过采集和处理的所述图像数据或指令发送出去;无线接收装置,接收所述无线发送装置发送来的所述图像数据或指令。
2. 如权利要求1所述的装置,其特征是所述扫描装置和所述主机之间通过蓝牙装置 连接,所述无线通信装置为蓝牙装置,其中所述无线发送装置是蓝牙发送装置,所述无线接 收装置是蓝牙接收装置。
3. 如权利要求1或2所述的装置,其特征是所述扫描装置包括图像采集装置,包括面阵图像传感器、以及光学系统,通过预定时间间隔对所述图像进 行采集获得一系列二维帧图像;图像处理装置,对于所述图像采集装置送入的每帧二维图像进行滤波去噪、图像二值 化、编码压縮,以形成压縮二值化图像数据并传输给所述无线发送装置;所述主机包括图像拼接装置,接收所述无线接收装置发送来的所述压縮二值化图像数据并进行解 码,得到展开的二值化图像,以及利用前后帧的相关性完成图像的拼接,得到一幅完整的二 值化图像;OCR识别装置,包括OCR引擎,将所述完整的二值化图像转换为可编辑字符流。
4. 如权利要求3所述的装置,其特征是所述图像拼接装置和所述OCR识别装置之间 还包括文字行提取装置,所述文字行提取装置通过分段行切分将所述完整的二值化图像中 的文字分成行,去除边界上的不完整文字图像行,保留拼接后图像中间完整的文字行图像。
5. 如权利要求3或4所述的装置,其特征是所述OCR识别装置还包括输出装置,将所 述可编辑字符流输出到用户指定位置。
6. 如权利要求3所述的装置,其特征是所述面阵图像传感器为0V6130C0MS传感器, 所述预定时间间隔为1/60秒。
7. 如权利要求3所述的装置,其特征是所述滤波采用3x3的均值滤波,所述图像二值 化采用分块的OTSU,所述二值化图像的编码采用游程编码或JBIG-2编码。
8. 如权利要求l所述的装置,其特征是所述无线发送装置设置于所述扫描装置内;所 述无线接收装置设置于所述主机内。
9. 如权利要求5所述的装置,其特征是所述输出装置的用户指定位置是光标所在位置、用户指定的文件或手机短信。
10. —种基于OCR的无线扫描输入方法,采用如权利要求1至9任何一项所述的装置,其特征是所述方法包括以下步骤步骤(a)、所述扫描装置对图像进行扫描采集和处理;步骤(b)、通过无线发送方式将图像数据发送给所述主机,步骤(c)、所述主机通过无线接收方式接收所述无线发送装置发送来的所述图像数据;步骤(d)、通过OCR识别方法对所述图像数据进一步处理为可编辑字符流。
全文摘要
本发明涉及一种基于OCR的无线扫描输入装置和方法,属于光学字符识别技术领域,该装置包括扫描装置和主机,所述扫描装置用于对图像进行扫描采集和处理并将图像数据发送给所述主机,所述扫描装置和所述主机之间通过无线通信装置连接,所述无线通信装置包括无线发送装置,将经过采集和处理的所述图像数据或指令发送出去;以及无线接收装置,接收所述无线发送装置发送来的所述图像数据或指令。本发明摆脱了USB线的困扰,能够实现远距离输入,极大的方便了远距离输入的需要。
文档编号G06F3/01GK101751121SQ20081023953
公开日2010年6月23日 申请日期2008年12月12日 优先权日2008年12月12日
发明者朱军民 申请人:汉王科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1