一种采用光学定位的字符识别输入系统及其方法

文档序号:6357483阅读:224来源:国知局
专利名称:一种采用光学定位的字符识别输入系统及其方法
技术领域
本发明涉及移动终端设备的图像采集处理和光学字符识别的领域,特别是一种采用光学定位的字符识别输入系统及其方法。
背景技术
目前,通过光学字符识别(OCR)技术将印刷文本或手写文本中的字符输入到电脑或者移动终端设备中的方法主要有两种一是采用扫描技术获取文本的图像然后进行字符识别;一种是通过摄像装置获取文本的图像然后进行字符识别。扫描技术虽然可以稳定、清晰地获取文本图像,但是往往需要外接固定的扫描设备。这不适合移动终端设备的使用要求。在某些产品中,如扫描翻译笔,设计了具有扫描功能的结构,但是对于各种日趋人性化、精美化的移动终端设备来说,这种结构影响了移动终端设备外观的完整性和美观性,而且操作不方便。近年来,随着摄像功能在手机、掌上电脑、笔记本电脑等移动终端设备中的普及, 通过摄像装置获取文本图像然后进行字符识别的技术将得到将越来越广泛的应用。目前, 应用最为成功的是手机的名片识别功能。手机通过其摄像装置——摄像头获取名片的图像,经过图像处理和识别将名片的内容识别为文字和符号信息,并归类为标准格式存储到手机档案中。但是对于如何从大篇幅的印刷或者手写文本中选取特定的字、词、句和符号进行图像采集、处理、识别和输入,这一技术还没有很好的解决方案。目前存在的解决方法如下一种方法是利用移动终端设备屏幕中的光标来定位。在获取文本图像之前调整移动终端设备的位置以便将待识别的字符移动到屏幕的光标附近而后采集图像;或者在获取文本图像之后,将屏幕的光标移动到图像中待识别的字符附近。然后,以光标为定位基准让系统找到目标字符进行识别。无论是哪种情况,都要求操作者必须面对移动设备狭小的屏幕,并在极小的图像中首先通过肉眼找到所要识别的字符。这种方法不能根本上提高识别和输入的效率。另一种方法是将移动终端设备的一端做成尖状突出形状并安装摄像头,如一种摄像翻译笔。图像获取时摄像头必须靠近和对准文本并扫描文本,扫描时以每秒50格的影像高速拍下所需文字,然后进行识别。种方法要求1、扫描文本的过程中,需要将安装有摄像头的突出部位对准起始点的字符,并保证起始字符尤其是较长的西文单词完全处于摄像范围之内。2、整句扫描时必须保证手势的稳定而不能发生偏离导致某些字符的部分和全部不在摄像范围之内。这些都对操作者提出要求,增加了操作的难度。这些要求都与移动终端设备的人性化和易用化趋势背道而驰。另外,这种设计所要求的结构不适合在大多数移动终端设备中实现。

发明内容
本发明要解决的技术问题是提供一种利用摄像装置从印刷文本或者手写文本中快速地定向选择字、词、句和符号进行图像的采集、处理、定位、识别并输入的系统和方法。 并且这种系统和方法可以很容易在所有移动终端设备中实现。为解决上述技术问题,本发明采用以下技术方案一种采用光学定位的字符识别输入系统,其硬件结构上具有两个光学作业装置 光束发射装置和摄像装置,如摄像头。光束发射装置发射光束,在印刷文本或者手写文本的表面形成清晰的光斑;摄像装置将印刷文本或者手写文本的一定区域拍摄下来形成图像。一种采用光学定位的字符识别输入系统及其方法,包括1、光束发射模块,其作用是发出指令启动光束发射装置,并规定光束维持的时间长短;2、图像采集模块,其作用是发出指令启动摄像装置,如摄像头,执行图像采集作业;3、图像处理模块,其作用是将图像采集模块获取的文本图像进行倾斜校正、去噪、 反转、灰度等处理,然后以单词(拼音文字)、单字(汉语、日语、韩语等)和符号为基本图像单元进行分割,形成由图像单元组成的排列;4、识别原点定位模块(以下简称定位模块),其作用是寻找和确定文本图像中光斑所在的位置,并将此位置定义为识别原点;5、图像单元选择模块(以下简称选择模块),其作用是以识别原点为出发点,在图像单元矩阵中沿一定方向根据指令的要求选择单个或者多个图像单元;6、OCR识别模块,其作用是将图像单元选择模块选择的图像单元识别为文字和符号;7、输入模块,其作用是将由OCR识别模块获得的文字和符号输入到移动终端设备的相关软件中。识别原点定位模块的技术路线技术路线之一根据光束发射装置和摄像装置在移动终端设备上有相对固定的空间位置关系,识别原点定位模块在二者之间建立起一种空间参照结构。这种空间参照结构的工作原理是光束在印刷文本或者书写文本表面形成的光斑,在图像采集模块获取的图像中永远处于一个固定的相对位置——比如图像的中心点。定位模块将这一相对位置定义为识别原点。技术路线之二光束发射模块发射的光束指向印刷文本或者书写文本中某个特定的单词、单字或者符号所在的区域,并在该区域的内部或者旁边形成光斑。图像采集模块获取图像后,光斑所在的点成为图像中区明显别于其它区域的特征位置。定位模块首先在图像中找到这一特征位置,然后将这一特征位置定义为识别原点。图像单元选择模块以识别原点为出发点对图像单元的选择遵循以下规则选择规则之一相对于需要被识别的文字目标在文本上的位置,当规定光斑位于该目标的起点处的字符区域内部时,那么本系统和方法将定义识别原点所在的图像单元为被识别的第一个单词、单字或者符号。选择规则之二 相对于需要被识别的文字目标在文本上的位置,当规定光斑位于该目标的起点处的字符区域旁边时,那么本系统和方法将定义识别原点所在位置旁边的第一个图像单元为被识别的第一个单词、单字或者符号。根据不同语言的书写方式,旁边可以定义为左边、右边、上边或者下边等。选择规则之三当需要选择和识别由两个或者两个以上的单词、单字或者符号组成的字词符号组合(如词组、成语、较短的书名等)时,识别原点可以位于这一组合中的第一个、最后一个或者中间的任意一个单词、单字或者符号之上或者旁边。选择规则之四当需要选择和识别带标点符号的较长字词符号组合(如较长的书名、单个句子或者几个连续的句子)时,除定义识别原点以外,可以将某一特定的标点符号作为识别的终点(如第一个右书名号、第三个逗号、第二个分号……等)。指令选择模块仅选择图像单元矩阵中位于识别原点和识别终点之间的图像单元。当需要将印刷文本或者手写文本中某一特定的单词(拼音文字)或者单字(汉语、日语、韩语)识别输入到移动终端设备时,其工作步骤如下1、光束发射模块启动光束发射装置,将光束照射到文本上该特定的单词、单字或者符号所在区域的内部或者旁边形成光斑;2、图像采集模块启动摄像装置,拍摄文本获取图像;3、图像处理模块将图像进行倾斜校正、去噪、反转、灰度等处理,然后分割为图像单元,形成图像单元的排列;4、定位模块寻找光斑所在的位置并将其定义识别原点;5、选择模块以识别原点为出发点,选择第一个图像单元;6、OCR识别模块对被选择的图像单元进行识别;7、输入模块将识别获得的文字或符号输入到移动终端设备的相关软件中。当需要将印刷文本或者手写文本中由两个或者两个以上单词、单字或者符号组成的字词符号组合(如词组、成语、较短的书名等)识别输入到移动终端设备时,其工作步骤如下1、光束发射模块启动光束发射装置,按照选择规则将光束照射到文本上该特定的字词符号组合中某个单词、单字或者符号所在的区域,并在该区域的内部或者旁边形成光斑;2、图像采集模块启动摄像装置,拍摄文本获取图像;3、图像处理模块将图像进行倾斜校正、去噪、反转、灰度等处理,然后分割为图像单元,形成图像单元的排列;4、定位模块寻找光斑所在的位置并将其定义识别原点;5、选择模块以识别原点为出发点,按照规定的选择规则选择图像单元;6、OCR识别模块对被选择的图像单元进行识别;7、输入模块将识别获得的文字或符号输入到移动终端设备的相关软件中。当需要将印刷文本或者手写文本中特定的带标点符号的较长字词符号组合(如单个句子、几个连续的句子、较长的书名等)识别输入到移动终端设备时,其工作步骤如下1、光束发射模块启动光束发射装置,按照选择规则将光束照射到文本上该特定的句子中某个单词、单字或者符号所在的区域,并在该区域的内部或者旁边形成光斑;2、图像采集模块启动摄像装置,拍摄文本获取图像;3、图像处理模块将图像进行倾斜校正、去噪、反转、灰度等处理,然后分割为图像单元,形成图像单元的排列;4、定位模块寻找光斑所在的位置并将其定义识别原点;5、选择模块以识别原点为出发点,按照规定的选择规则选择图像单元;6、OCR识别模块对被选择的图像单元进行识别;7、输入模块将识别获得的带标点符号的字词符号组合输入到移动终端设备的相关软件中。本发明的有益效果是,提供了一套快速、便捷地从大篇幅的印刷或者手写文本中选取特定的字、词、句和符号进行图像采集、识别和输入的解决方案;通过采用光学定位的字符识别输入系统及其方法,使用者只要做到把光束照射到文本上确定的位置上,剩下的图像采集、准确的定位识别和输入工作就可以完全交付移动终端设备来完成。识别准确快速、操作简单易行、符合人性化要求;同时该系统可以很好地与现有各种移动终端设备融合,将大大扩展移动终端设备的应用领域。


图1 本发明一种采用光学定位的字符识别输入系统的构成。其中101 印刷文本或者手写文本;102 光束发射装置;103 摄像装置,如摄像头;104:启动光束发射模块,光束发射装置发出光束,照射到文本上在特定的位置形成光斑;105 启动图像采集模块,指令摄像装置,如摄像头,将文本捕捉为图像;106 启动图像处理模块,将文本图像以单词(拼音文字)、单字(汉语、日语、韩语等)或者符号为单元进行分割,形成图像单元;107 经图像处理模块处理后,文本图像成为一个图像单元的有序排列矩阵。其中每一个灰色区域代表一个图像单元;108 拼音文字的图像单元和汉字的图像单元;109 光束发射装置发出的光束在文本上形成的光斑对应着一定的单词、单字或者符号;110 定位模块依据109选择识别的原点;111 选择模块以106、107和108为基础,按照指令选择一定数量的图像单元。最终由OCR识别模块完成识别工作,并由输入模块输入到移动终端设备的相关软件中。图2 选择、识别和输入单词、单字的实施例说明与选择、识别和输入词组的实施例说明。其中,汉字“白”和英文“dream”上较深的印记表示光斑。图3 选择、识别和输入句子的实施例说明。其中,汉字“千”和英文“ I ”上较深的印记表示光斑。
具体实施例方式下面结合附图,对本发明的具体实施方式
进一步说明。首先,移动设备具备摄像装置,如摄像头和光束发射装置。具体实施例一从图2所示的文本中将汉字“帝”选择识别并输入到移动终端设备中。本实施例的选择规则规定识别原点所在位置右边的第一个图像单元为被识别的第一个单词、单字或者符号。其工作步骤如下1、光束发射模块启动光束发射装置,将光束照射到文本上“帝”字的左边形成光斑;2、图像采集模块启动摄像装置,拍摄文本获取图像;3、图像处理模块将图像进行倾斜校正、去噪、反转、灰度等处理,然后分割为图像单元,形成图像单元的排列;4、定位模块寻找光斑所在的位置并将其定义识别原点;5、选择模块以识别原点为出发点,选择识别原点右边第一个图像单元;6、OCR识别模块对被选择的图像单元进行识别,获得汉字“帝”的字符;7、输入模块将识别获得的汉字“帝”的字符输入到移动终端设备的相关软件中。具体实施例二从图2所示的文本中将单词“dream”选择识别并输入到移动终端设备中。本实施例的选择规则规定识别原点所在的图像单元为被识别的第一个单词、单字或者符号。其工作步骤如下1、光束发射模块启动光束发射装置,将光束照射到文本上单词“dream”上形成光斑;2、图像采集模块启动摄像装置,拍摄文本获取图像;3、图像处理模块将图像进行倾斜校正、去噪、反转、灰度等处理,然后分割为图像单元,形成图像单元的排列;4、定位模块寻找光斑所在的位置并将其定义识别原点;5、选择模块以识别原点为出发点,选择识别原点所在区域为第一个图像单元;6、OCR识别模块对被选择的图像单元进行识别,获得单词“dream”的字符;7、输入模块将识别获得的单词“dream”的字符输入到移动终端设备的相关软件中。具体实施例三从图2所示的文本中将汉语“白帝城”选择识别并输入到移动终端设备中。本实施例的选择规则规定识别原点位于词组的第一个单词或者单字所对应的图像单元。向右选择至第三个图像单元。其工作步骤如下1、光束发射模块启动光束发射装置,将光束照射到词组“白帝城”中的“白,,字上形成光斑;2、图像采集模块启动摄像装置,拍摄文本获取图像;3、图像处理模块将图像进行倾斜校正、去噪、反转、灰度等处理,然后分割为图像单元,形成图像单元的排列;4、定位模块寻找光斑所在的位置并将其定义识别原点;
5、选择模块以识别原点为出发点,选择包含识别原点在内的向右至第三个图像单元的所有图像单元;6、OCR识别模块对被选择的图像单元进行识别,获得词组“白帝城”的字符;7、输入模块将识别获得的词组“白帝城”的字符输入到移动终端设备的相关软件中。具体实施例四从图2所示的文本中将英文词组“American dream”选择识别并输入到移动终端设备中。本实施例的选择规则规定识别原点位于词组的最后一个单词或者单字对应的图像单元。向左选择至第二个图像单元。其工作步骤如下1、光束发射模块启动光束发射装置,将光束照射到词组“American dream”中的单词“dream”上形成光斑;2、图像采集模块启动摄像装置,拍摄文本获取图像;3、图像处理模块将图像进行倾斜校正、去噪、反转、灰度等处理,然后分割为图像单元,形成图像单元的排列;4、定位模块寻找光斑所在的位置并将其定义识别原点;5、选择模块以识别原点为出发点,选择包含识别原点在内的向左至第二个图像单元的所有图像单元;6, OCR识别模块对被选择的图像单元进行识别,获得词组“American dream"的字符;7、输入模块将识别获得的词组“American dream"的字符输入到移动终端设备的相关软件中。具体实施例五从图3所示的文本中将汉语句子“千里江陵一日还。”选择识别并输入到移动终端设备中。本实施例的选择规则规定识别原点位于句子的第一个单词或者单字对应的图像单元。识别终点为向右第一个句号对应的图像单元。其工作步骤如下1、光束发射模块启动光束发射装置,将光束照射到句子“千里江陵一日还。”中的 “千”字上;2、图像采集模块启动摄像装置,拍摄文本获取图像;3、图像处理模块将图像进行倾斜校正、去噪、反转、灰度等处理,然后分割为图像单元,形成图像单元的排列;4、定位模块寻找光斑所在的位置并将其定义识别原点;5、选择模块以识别原点为出发点,同时定义向右第一个句号对应的图像单元为识别终点。选择位于识别原点和识别终点之间的所有图像单元;6、OCR识别模块对被选择的图像单元进行识别,获得该句子的文字字符;7、输入模块将识别获得的该句子的文字字符输入到移动终端设备的相关软件中。具体实施例六从图3所示的文本中将连续的英文句子的片段“It is a dream deeply rooted inthe American dream. I have a dream that one day this nation will rise up and live out the true meaning of its creed " We hold these truths to be self-evident ; that all men are created equal.“ ”选择识别并输入到移动终端设备中。本实施例的选择规则规定识别原点位于句子的第一个单词或者单字对应的图像单元。识别终点为向右第二个西文引号对应的图像单元。其工作步骤如下 1、光束发射模块启动光束发射装置,将光束照射到该句子片段的第一个单词“It” 上;2、图像采集模块启动摄像装置,拍摄文本获取图像;3、图像处理模块将图像进行倾斜校正、去噪、反转、灰度等处理,然后分割为图像单元,形成图像单元的排列;4、定位模块寻找光斑所在的位置并将其定义识别原点;5、选择模块以识别原点为出发点,同时定义向右第二个西文引号对应的图像单元为识别终点。选择位于识别原点和识别终点之间的所有图像单元;6、OCR识别模块对被选择的图像单元进行识别,获得该句子的文字字符;7、输入模块将识别获得的该句子的文字字符输入到移动终端设备的相关软件中。
权利要求
1.一种采用光学定位的字符识别输入系统及其方法,其特征在于所述采用光学定位的字符识别输入系统在硬件结构上具有两个光学作业装置光束发射装置和摄像装置,如摄像头。光束发射装置发射光束,在印刷文本或者手写文本的表面形成光斑。所述一种采用光学定位的字符识别输入系统,系统构成和工作步骤包括1-1、光束发射模块,其作用是发出指令启动光束发射装置,并规定光束维持的时间长短;1-2、图像采集模块,其作用是发出指令启动摄像装置,如摄像头,执行图像采集作业; 1-3、图像处理模块,其作用是将图像采集模块获取的文本图像进行倾斜校正、去噪、反转、灰度等处理,然后以单词(拼音文字)、单字(汉语、日语、韩语等)和符号为基本图像单元进行分割,形成由图像单元组成的排列;1-4、识别原点定位模块(以下简称定位模块),其作用是寻找和确定文本图像中光斑所在的位置,并将此位置定义为识别原点;1-5、图像单元选择模块(以下简称选择模块),其作用是以识别原点为出发点,在图像单元矩阵中沿一定方向根据指令的要求选择单个或者多个图像单元;1-6、OCR识别模块,其作用是将图像单元选择模块选择的图像单元识别为文字和符号;1-7、输入模块,其作用是将由OCR识别模块获得的文字和符号输入到移动终端设备的相关软件中。
2.根据权利要求1所述的一种采用光学定位的字符识别输入系统及其方法,其特征在于,识别原点定位模块采用以下技术路线根据光束发射装置和摄像装置在移动终端设备上有相对固定的空间位置关系,识别原点定位模块在二者之间建立起一种空间参照结构。这种空间参照结构的工作原理是光束在印刷文本或者书写文本表面形成的光斑,在图像采集模块获取的图像中永远处于一个固定的相对位置——比如图像的中心点。定位模块将这一相对位置定义为识别原点。
3.根据权利要求1所述的一种采用光学定位的字符识别输入系统及其方法,其特征在于,识别原点定位模块还采用以下技术路线光束发射模块发射的光束指向印刷文本或者书写文本中某个特定的单词、单字或者符号所在的区域,并在该区域的内部或者旁边形成光斑。图像采集模块获取图像后,光斑所在的点成为图像中区明显别于其它区域的特征位置。定位模块首先在图像中找到这一特征位置,然后将这一特征位置定义为识别原点。
4.根据权利要求1所述的一种采用光学定位的字符识别输入系统及其方法,其特征在于,图像单元选择模块对图像单元的选择遵循以下规则相对于需要被识别的文字目标在文本上的位置,当规定光斑位于该目标的起点处的字符区域内部时,那么本系统和方法将定义识别原点所在的图像单元为被识别的第一个单词、单字或者符号。
5.根据权利要求1所述的一种采用光学定位的字符识别输入系统及其方法,其特征在于,图像单元选择模块对图像单元的选择遵循以下规则相对于需要被识别的文字目标在文本上的位置,当规定光斑位于该目标的起点处的字符区域旁边时,那么本系统和方法将定义识别原点所在位置旁边的第一个图像单元为被识别的第一个单词、单字或者符号。根据不同语言的书写方式,旁边可以定义为左边、右边、上边或者下边等。
6.根据权利要求1所述的一种采用光学定位的字符识别输入系统及其方法,其特征在于,图像单元选择模块对图像单元的选择遵循以下规则当需要选择和识别由两个或者两个以上的单词、单字或者符号组成的字词符号组合 (如词组、成语、较短的书名等)时,识别原点可以位于这一组合中的第一个、最后一个或者中间的任意一个单词、单字或者符号之上或者旁边。
7.根据权利要求1所述的一种采用光学定位的字符识别输入系统,其特征在于,图像单元选择模块对图像单元的选择遵循以下规则当需要选择和识别带标点符号的较长字词符号组合(如较长的书名、单个句子或者几个连续的句子)时,除定义识别原点以外,可以将某一特定的标点符号作为识别的终点(如第一个右书名号、第三个逗号、第二个分号……等)。指令选择模块仅选择图像单元矩阵中位于识别原点和识别终点之间的图像单元。
8.根据权利要求1、2、3、4和5所述的一种采用光学定位的字符识别输入系统及其方法,其特征在于,当需要将印刷文本或者手写文本中某一特定的单词(拼音文字)或者单字 (汉语、日语、韩语)识别输入到移动终端设备时,其工作步骤如下8-1、光束发射模块启动光束发射装置,将光束照射到文本上该特定的单词、单字或者符号所在区域的内部或者旁边形成光斑;8-2、图像采集模块启动摄像装置,拍摄文本获取图像;8-3、图像处理模块将图像进行倾斜校正、去噪、反转、灰度等处理,然后分割为图像单元,形成图像单元的排列;8-4、定位模块寻找光斑所在的位置并将其定义识别原点;8-5、选择模块以识别原点为出发点,按照权利要求4或5规定的原则选择第一个图像单元;8-6、OCR识别模块对被选择的图像单元进行识别;8-7、输入模块将识别获得的文字或符号输入到移动终端设备的相关软件中。
9.根据权利要求1、2、3和6所述的一种采用光学定位的字符识别输入系统及其方法, 其特征在于,当需要将印刷文本或者手写文本中由两个或者两个以上单词、单字或者符号组成的字词符号组合(如词组、成语、较短的书名等)识别输入到移动终端设备时,其工作步骤如下9-1、光束发射模块启动光束发射装置,按照选择规则将光束照射到文本上该特定的字词符号组合中某个单词、单字或者符号所在的区域,并在该区域的内部或者旁边形成光斑;9-2、图像采集模块启动摄像装置,拍摄文本获取图像;9-3、图像处理模块将图像进行倾斜校正、去噪、反转、灰度等处理,然后分割为图像单元,形成图像单元的排列;9-4、定位模块寻找光斑所在的位置并将其定义识别原点;9-5、选择模块以识别原点为出发点,按照权利要求6规定的选择规则选择图像单元;9-6、OCR识别模块对被选择的图像单元进行识别;9-7、输入模块将识别获得的文字或符号输入到移动终端设备的相关软件中。
10.根据权利要求1、2、3和7所述的一种采用光学定位的字符识别输入系统及其方法,其特征在于,当需要将印刷文本或者手写文本中特定的带标点符号的较长字词符号组合(如单个句子、几个连续的句子、较长的书名等)识别输入到移动终端设备时,其工作步骤如下10-1、光束发射模块启动光束发射装置,按照选择规则将光束照射到文本上该特定的句子中某个单词、单字或者符号所在的区域,并在该区域的内部或者旁边形成光斑;10-2、图像采集模块启动摄像装置,拍摄文本获取图像;10-3、图像处理模块将图像进行倾斜校正、去噪、反转、灰度等处理,然后分割为图像单元,形成图像单元的排列;10-4、定位模块寻找光斑所在的位置并将其定义识别原点;10-5、选择模块以识别原点为出发点,按照权利要求7规定的选择规则选择图像单元;10-6、OCR识别模块对被选择的图像单元进行识别;10-7、输入模块将识别获得的带标点符号的字词符号组合输入到移动终端设备的相关软件中。
全文摘要
本发明提供了一种采用光学定位的字符识别输入系统及其方法。该系统在硬件结构上具有两个光学作业装置光束发射装置和摄像装置,如摄像头。该系统的构成和工作方法包括1、光束发射模块启动光束发射装置,在文本表面形成光斑;2、图像采集模块启动摄像装置获取文本图像;3、图像处理模块将文本图像以单词、单字和符号为基本单元进行分割,形成图像单元排列;4、识别原点定位模块将光斑在文本图像中的位置定义为识别原点;5、图像单元选择模块以识别原点为出发点,在图像单元排列中选择单个或者多个图像单元;6、OCR识别模块将选择的图像单元识别为文字和符号;7、最后由输入模块输入到移动终端设备的相关软件中。本发明适用于各种移动终端设备。
文档编号G06K9/60GK102169541SQ201110083070
公开日2011年8月31日 申请日期2011年4月2日 优先权日2011年4月2日
发明者郝震龙 申请人:郝震龙
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1