可调节扫描模式的文字采集方法和扫描装置的制作方法

文档序号:6434471阅读:167来源:国知局
专利名称:可调节扫描模式的文字采集方法和扫描装置的制作方法
技术领域
本发明属于电数据处理技术领域,特别涉及一种可调节扫描模式的文字采集方法和装置。
背景技术
当前,计算机输入法主要有五笔输入法、拼音输入法、手写输入法等类型。当我们进行资料收集时,经常需要将大量纸质文档中的文字录入计算机中,如果通过上述几种输入法进行录入,费时又费力。目前,扫描笔是实现文字录入的有效工具。现有扫描笔通常借助光学字符识别(OCR,Optical Character Recognition)技术,将需要的文字拍摄为图像, 然后对图像进行识别,即可实现快速录入。但是,现有扫描笔的扫描模式单一,且只能扫描得到单行文字,存在扫描笔的扫描速度、录入速度较慢等缺陷。

发明内容
因此,需要一种能够调节扫描模式的文字采集方法和装置。根据本发明的一个方面,提供一种可选择扫描模式的文字采集方法,该方法包括以下步骤
选择第一扫描模式和第二扫描模式之一; 由图像采集器采集被扫描介质上文字的二维图像;
所述图像采集器根据选择的扫描模式从所述二维图像中裁剪相应扫描模式下的有效图像区域;
将该有效图像区域传输至数据处理器进行后续处理。根据本发明的另一个方面,提供一种可选择扫描模式的文字采集方法,该方法包括以下步骤
选择第一扫描模式和第二扫描模式之一并将选择的扫描模式发送至数据处理器; 由图像采集器采集被扫描介质上文字的二维图像;
所述数据处理器根据选择的扫描模式控制所述图像采集器从所述二维图像中裁剪相应扫描模式下的有效图像区域,并将该有效图像区域传输至所述数据处理器进行后续处理。优选地,所述第一扫描模式限定具有第一面积的有效图像区域,所述第二扫描模式限定具有第二面积的有效图像区域。所述裁剪相应扫描模式下的有效图像区域包括通过相应扫描模式的起始点坐标和终点坐标对有效图像区域进行限定。优选地,所述后续处理包括
对所述有效图像区域进行二值化处理,获得二值图像;
基于图像配准对所述二值图像进行实时拼接,获得被扫描介质上文字的全景二值图像;
对所述全景二值图像进行校正; 从所述校正后的全景二值图像中提取待识别文字行; 对所述待识别文字行进行光学字符识别并显示。根据本发明的第三个方面,提供一种应用所述文字采集方法的扫描装置,包括图像采集器,还包括扫描模式选择器,用于选择第一扫描模式和第二扫描模式之一。所述图像采集器,用于采集被扫描介质上文字的二维图像,根据选择的扫描模式从所述二维图像中裁剪相应扫描模式下的有效图像区域,并将该有效图像区域传输至数据处理器进行后续处理。优选地,所述扫描模式选择器,为设置在扫描装置的按键,用以切换扫描装置的扫描模式。优选地,所述扫描模式选择器,为设置在扫描装置扫描窗口处的滑块,通过滑动滑块选择扫描模式。优选地,所述扫描模式为单行扫描模式或至少两行扫描模式。优选地,所述数据处理器为设置在扫描装置中的嵌入式处理器或与所述扫描装置连接的外部数据处理设备。与现有技术相比,本发明技术方案的优势在于用户可以根据需要选择不同的扫描模式,从而实现对被扫描介质上的文字进行单行或多行扫描,相应地,在后续处理中,可以提取单行或多行待识别文字,这样,提高了扫描笔的扫描速度、录入速度。


图1示出根据本发明实施例1的可调节扫描模式的文字采集方法的流程图; 图2示出根据本发明实施例2的可调节扫描模式的文字采集方法的流程图3示出根据本发明实施例1或2的可调节扫描模式的文字采集方法中的有效图像区域的示意图4示出根据本发明实施例1或2的可调节扫描模式的文字采集方法中的有效图像区域的示意图5示出根据本发明实施例1或2的可调节扫描模式的文字采集方法中的后续处理的流程图6示出根据本发明实施例的可调节扫描模式的文字采集装置的结构示意图。
具体实施例方式下面结合附图和具体实施方式
对本发明做进一步阐述。图1示出根据本发明实施例1的可调节扫描模式的文字采集方法的流程图。根据实施例1,本发明提供的可调节扫描模式的文字采集方法包括以下步骤
在步骤101中,选择第一扫描模式和第二扫描模式之一。具体地,用户可以通过与现有的图像采集器相连的扫描模式选择器,例如可以是设置于图像采集器上的功能键,来选择扫描方式为第一扫描模式或第二扫描模式。所述第一扫描模式例如可以是单行扫描模式,所述第二扫描模式例如可以是多行扫描模式。在步骤102中,利用图像采集器采集被扫描介质上文字的二维图像。具体地,图像采集器为由光感应传感器、光感应传感器镜头和电路板组成的光学模组。光感应传感器具有光学镜头,通过光学镜头记录灰度或彩色二维图像,进而获取被扫描文字的二维图像。应用该图像采集器的扫描装置可以获取被扫描介质上文字的连续图像序列,而且相邻图像帧间具有一定的重叠。在步骤103中,所述图像采集器根据选定的扫描模式从所述二维图像中裁剪相应扫描模式下的有效图像区域,并将该有效图像区域传输至数据处理器进行后续处理。具体的,现有的扫描装置中的图像传感器采集到的图像为120帧每秒的640pixs χ 480pixs的图像,但是,后续处理中所使用的有效图像区域为120pixs χ SOpixs部分的图像,其中,120是字高部分,因而需要将图像传感器采集到的图像进行裁剪后通过数据通道传入至数据处理器中进行后续处理。根据本发明实施例,图像采集器根据选择的扫描模式从所采集到的二维图像中裁剪相应扫描模式下的有效图像区域,具体地,所述第一扫描模式限定具有第一面积的有效图像区域,所述第二扫描模式限定具有第二面积的有效图像区域。第一面积和第二面积的大小可以根据需要进行设定。当所述第一扫描模式是单行扫描模式时,如图3,对应的有效图像区域大小和现有的扫描模式一样,为120pixs χ 80pixs。当所述第二扫描模式是多行扫描模式时,如图4所示,对应的有效图像区域大小为MOpixs χ 80pixs。其中,120和240为字高部分。所述的裁剪,是通过起始点坐标和终点坐标对有效图像区域进行限定。首先设定图像左侧顶点坐标为坐标原点,以向下的方向为Y轴正轴,以向右的方向为χ轴正轴,构建一坐标系。在该坐标系内界定有效图像区域。当所述第一扫描模式是单行扫描模式时, 图像采集器将起始点坐标(260,200)作为左上侧顶点和终点坐标(380,280)作为右下侧顶点限定的矩形区域作为有效图像区域传输至数据处理器中进行处理;当所述第二扫描模式是双行扫描模式时,图像采集器将起始点坐标(200,200)作为左上侧顶点和终点坐标 (440,280)作为右下侧顶点限定的矩形区域作为有效图像区域传输至数据处理器中进行处理。本实施例中,数据处理器为设置在应用本实施例所述文字采集方法的扫描装置内部的嵌入式处理器,扫描装置进行文字采集、图像处理识别等动作均由该嵌入式处理器控制完成,此时,该扫描装置形成一种脱机式的扫描设备;而当应用本实施例所述文字采集方法的扫描装置采集的文字图像的后续处理,必须由相连的外部数据处理设备处理时,该扫描装置形成一种联机式扫描设备,数据处理器即为外部数据处理设备。图2示出根据本发明实施例2的可调节扫描模式的文字采集方法的流程图。根据实施例2,本发明提供的可调节扫描模式的文字采集方法包括以下步骤
在步骤201中,选择第一扫描模式和第二扫描模式之一并将选择的扫描模式发送至数据处理器。用户可以通过与现有的图像采集器相连的扫描模式选择器,例如可以是设置于图像采集器上的功能键,来选择扫描方式为第一扫描模式或第二扫描模式。所述第一扫描模式例如可以是单行扫描模式,所述第二扫描模式例如可以是多行扫描模式。所述第一扫描模式限定具有第一面积的有效图像区域,所述第二扫描模式限定具有第二面积的有效图像区域。第一面积和第二面积的大小根据实际需要予以限定。本实施例中,数据处理器为设置在应用本实施例所述文字采集方法的扫描装置内部的嵌入式处理器,扫描装置进行文字采集、图像处理识别等动作均由该嵌入式处理器控制完成,此时,该扫描装置形成一种脱机式的扫描设备;而当应用本实施例所述文字采集方法的扫描装置采集的文字图像的后续处理,必须由相连的外部数据处理设备处理时,该扫描装置形成一种联机式扫描设备,数据处理器即为外部数据处理设备。在步骤202中,利用图像采集器采集被扫描介质上文字的二维图像。具体地,图像采集器为由光感应传感器、光感应传感器镜头和电路板组成的光学模组。光感应传感器具有光学镜头,通过光学镜头记录灰度或彩色二维图像,进而获取被扫描文字的二维图像。应用该图像采集器的扫描装置,可以获取被扫描介质上文字的连续图像序列,而且相邻图像帧间具有一定的重叠。在步骤203中,所述数据处理器根据选择的扫描模式控制所述图像采集器从所述二维图像中裁剪相应扫描模式下的有效图像区域。在本实施例中,如图3和图4所示,首先设定图像左侧顶点坐标为坐标原点,以向下的方向为Y轴正轴,以向右的方向为X轴正轴,构建一坐标系。在该坐标系内界定有效图像区域。当所述第一扫描模式是单行扫描模式时,数据处理器控制图像采集器将起始点坐标(260,200)作为左上侧顶点和终点坐标(380,280)作为右下侧顶点限定的矩形区域32作为有效图像区域传输至数据处理器中进行处理;当所述第二扫描模式是双行扫描模式时,数据处理器控制图像采集器将起始点坐标(200,200)作为左上侧顶点和终点坐标 (440,280)作为右下侧顶点限定的矩形区域32作为有效图像区域传输至数据处理器中进行处理。在步骤204中,将该有效图像区域传输至所述数据处理器进行后续处理。本实施例中,数据处理器为设置在应用本实施例所述文字采集方法的扫描装置内部的嵌入式处理器,扫描装置进行文字采集、图像处理识别等动作均由该嵌入式处理器控制完成,此时,该扫描装置形成一种脱机式的扫描设备;而当应用本实施例所述文字采集方法的扫描装置采集的文字图像的后续处理,必须由相连的外部数据处理设备处理时,该扫描装置形成一种联机式扫描设备,数据处理器即为外部数据处理设备。图5示出根据本发明实施例1或2的可调节扫描模式的文字采集方法中的后续处理的流程图。如上所述,应用该文字采集方法的扫描装置可以为一种联机式扫描设备,此时数据处理器为外部数据处理设备,也可以为一种脱机式扫描设备,此时数据处理器为内置在扫描装置内部的嵌入式处理器。数据处理器对有效图像区域进行的后续处理主要包含以下步骤
1.图像二值化数据处理器对接收到的有效图像区域进行二值化处理,获得二值图像;例如可选用OTSU自适应阈值二值化算法对图像进行二值化。2.图像拼接基于图像配准对所述二值图像进行实时拼接,获得被扫描介质上的全景二值图像,所述图像配准是通过匹配重叠区域计算前后相邻两帧图像的相对位移关系实现。其中图像二值化处理与图像拼接过程顺序可以互换。3.全景二值图像校正对所述全景二值图像进行校正;由于全景二值图像可能是白底黑字,也可能是黑底白字,在进行全景二值图像校正之前,首先要将黑底白字的图像进行反色处理,本实施例优选采用白底黑字图像,不需要进行反色处理。全景二值图像一般不是水平的文字,存在弯曲变形,需要将其校正成水平状态,具体方法包括
(1)通过连通域标记合并获取全景二值图像的文字行;
(2)从上述文字行中选出一行作为校正基准文字行;
(3)利用分段游程抹黑技术得到抹黑基准文字行;
(4 )通过对抹黑基准文字行进行采样计算出文字行的弯曲曲线; (5)根据弯曲曲线对全景二值图像进行校正。4.提取待识别文字行由所述校正后的全景二值图像中提取待识别文字行。具体地,当以第一扫描模式进行文字采集时,采用中心定位的方法提取待识别文字中间行。全景二值图像中除含有带识别的文字行外,可能还有其他文字行,因此需要将待识别的文字提取出来,校正后的全景二值图像中的文字行基本处于水平状态,沿水平方向进行投影,得到黑像素点的投影直方图,利用投影直方图的极小值位置可以将全景二值图像中的文字行分隔开来,即可得到全景二值图像中的各个完整文字行,根据这些完整文字行的位置信息识别并提取除待识别的文字行,具体的取这些文字行中靠近中间位置的文字行作为待识别文字行。当以第二扫描模式进行文字采集时,提取所有的待识别文字行。将待识别的文字提取出来,校正后的全景二值图像中的文字行基本处于水平状态,沿水平方向进行投影,得到黑像素点的投影直方图,利用投影直方图的极小值位置可以将全景二值图像中的文字行分隔开来,即可得到全景二值图像中的各个完整文字行,将各完整文字行均提取出来,作为待识别文字行。5.对所述待识别文字行进行OCR识别并显示。将待识别文字行送入数据处理器中的OCR模块进行识别并显示识别出的文字,并显示到显示屏上,当以第二扫描模式例如多行扫描模式进行文字采集时,对每行文字进行分行显示。当扫描装置为联机式扫描设备时,数据处理器即为外部数据处理设备,识别出的文字在外部数据处理设备的显示屏上显示;当扫描装置为脱机式扫描设备时,数据处理器即为扫描装置内置的嵌入式处理器,识别出的文字直接在扫描装置的显示屏上显示。图6示出根据本发明实施例的可调节扫描模式的扫描装置的结构示意图。该装置包括包括图像采集器,且进一步包括扫描模式选择器,用于选择第一扫描模式和第二扫描模式之一。所述图像采集器,用于采集被扫描介质上文字的二维图像,根据选择的扫描模式从所述二维图像中裁剪相应扫描模式下的有效图像区域,并将该有效图像区域传输至数据处理器进行后续处理。扫描模式选择器为设置在扫描装置上的物理按键,用以切换扫描装置的扫描模式。作为另一种设计方案,扫描模式选择器也可以为设置在扫描装置扫描窗口处的滑块,通过滑动滑块的方式调整扫描模式,即调整二维图像中有效图像区域的面积,以此实现单行或多行扫描。该扫描装置可以为一种脱机式的扫描设备,此时数据处理器为设置在扫描装置内部的嵌入式处理器。若该扫描装置为联机式扫描设备时,数据处理器为通过USB接口与该扫描装置连接的外部数据处理设备,此时该外部数据处理设备为本实施例所述的数据处理器,用以对剪裁获得的有效图像区域进行OCR处理,获得识别结果。
以上借助实施例对本发明进行了具体说明。应当理解,本发明的上述描述是示例性的而非限制性的。本领域技术人员通过阅读本说明书,在不偏离本发明精神的情况下可以对本发明进行修改和变型。本发明的保护范围仅由所附权利要求限定。
权利要求
1.一种可选择扫描模式的文字采集方法,其特征在于,该方法包括以下步骤 选择第一扫描模式和第二扫描模式之一;由图像采集器采集被扫描介质上文字的二维图像;所述图像采集器根据选择的扫描模式从所述二维图像中裁剪相应扫描模式下的有效图像区域,并将该有效图像区域传输至数据处理器进行后续处理。
2.一种可选择扫描模式的文字采集方法,其特征在于,该方法包括以下步骤 选择第一扫描模式和第二扫描模式之一并将选择的扫描模式发送至数据处理器; 由图像采集器采集被扫描介质上文字的二维图像;所述数据处理器根据选择的扫描模式控制所述图像采集器从所述二维图像中裁剪相应扫描模式下的有效图像区域; 将该有效图像区域传输至所述数据处理器进行后续处理。
3.根据权利要求1或2所述的方法,其特征在于,所述第一扫描模式限定具有第一面积的有效图像区域,所述第二扫描模式限定具有第二面积的有效图像区域。
4.根据权利要求1或2所述的方法,其特征在于,所述裁剪相应扫描模式下的有效图像区域包括通过相应扫描模式的起始点坐标和终点坐标对有效图像区域进行限定。
5.根据权利要求1或2所述的方法,其特征在于,所述后续处理包括 对所述有效图像区域进行二值化处理,获得二值图像;基于图像配准对所述二值图像进行实时拼接,获得被扫描介质上文字的全景二值图像;对所述全景二值图像进行校正; 从所述校正后的全景二值图像中提取待识别文字行; 对所述待识别文字行进行光学字符识别并显示。
6.一种应用权利要求1-5任一项文字采集方法的扫描装置,包括图像采集器,其特征在于,还包括扫描模式选择器,用于选择第一扫描模式和第二扫描模式之一;所述图像采集器,用于采集被扫描介质上文字的二维图像,根据选择的扫描模式从所述二维图像中裁剪相应扫描模式下的有效图像区域,并将该有效图像区域传输至数据处理器进行后续处理。
7.根据权利要求6所述的扫描装置,其特征在于,所述扫描模式选择器,为设置在扫描装置的按键,用以切换扫描装置的扫描模式。
8.根据权利要求6所述的扫描装置,其特征在于,所述扫描模式选择器,为设置在扫描装置扫描窗口处的滑块,通过滑动滑块选择扫描模式。
9.根据权利要求7或8所述的扫描装置,其特征在于,所述扫描模式为单行扫描模式或至少两行扫描模式。
10.根据权利要求9所述的扫描装置,其特征在于,所述数据处理器为设置在扫描装置中的嵌入式处理器或与所述扫描装置连接的外部数据处理设备。
全文摘要
本发明公开了一种可选择扫描模式的文字采集方法,属于电数据处理技术领域。该方法包括选择第一扫描模式和第二扫描模式之一;利用图像采集器采集被扫描介质上文字的二维图像;所述图像采集器根据选择的扫描模式从所述二维图像中裁剪相应扫描模式下的有效图像区域,并将该有效图像区域传输至数据处理器进行后续处理。本发明还公开了一种应用可选择扫描模式的文字采集方法的扫描装置。通过本发明,用户可以根据需要选择不同的扫描模式,从而实现对被扫描介质上的文字进行单行或多行扫描,在后续处理中,可以提取单行或多行待识别文字,这样,提高了扫描笔的扫描速度、录入速度。
文档编号G06K9/00GK102360427SQ20111029484
公开日2012年2月22日 申请日期2011年9月30日 优先权日2011年9月30日
发明者信强, 梁义海, 郭峰 申请人:汉王科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1