一种信息输入方法及装置的制造方法

文档序号:8380923阅读:139来源:国知局
一种信息输入方法及装置的制造方法
【技术领域】
[0001]本发明涉及到智能输入技术领域,特别涉及到一种信息输入方法及装置。
【背景技术】
[0002]移动终端(如手机)具有大容量存储空间、强大的处理能力,人们可通过该移动终端打电话、发送短信、收发邮件、上网浏览等,当人们需要输入文字信息时,一般都是通过拼音输入法、五笔输入法、手写输入法等类型。当我们需要将大量纸质文档中的文字录入到移动终端时,如果通过上述几种输入法进行录入,费时又费力。

【发明内容】

[0003]本发明的主要目的为提供一种信息输入方法及装置,旨在解决现有技术中在移动终端录入信息的费时费力的缺陷,实现信息的快速输入。
[0004]本发明提供一种信息输入方法,该方法包括:
[0005]通过图像获取模块获取图像;
[0006]对获取的图像中的字符进行切割处理;
[0007]对各个切割字符进行文字识别,以识别出各个切割字符对应的文字;
[0008]将识别的各个文字按对应的切割字符在所述图像的字符版面中的位置,进行文字排版;
[0009]将排版后的文字按文字排版格式输出到文本输入框。
[0010]优选地,所述对获取的图像中的字符进行切割处理的步骤包括:
[0011]对获取的图像中的所有字符进行切割处理;或者
[0012]提供选择操作界面,供用户在获取的图像中选择待识别的图像区域,锁定用户基于所述操作界面选择的图像区域,并对选择的图像区域中的字符进行切割处理。
[0013]优选地,所述对获取的图像中的字符进行切割处理的步骤包括:
[0014]对获取的图像进行二值化、倾斜校正、分段落分行及字符切割。
[0015]优选地,所述锁定用户基于所述操作界面选择的图像区域的步骤包括:
[0016]A、获取用户在所述操作界面的第一选择手势,所述第一选择手势为一条带有预设宽度的直线,根据该第一选择手势将该带有预设宽度的直线覆盖的图像区域锁定为待识别的图像区域;及/或
[0017]B、获取用户在所述操作界面的第二选择手势,所述第二选择手势为两条连续的直线,根据该第二选择手势中的两条连续的直线锁定一个平行四边形区域作为待识别的图像区域。
[0018]优选地,所述将识别的各个文字按对应的切割字符在所述图像的字符版面中的位置,进行文字排版;的步骤之后,该方法还包括:
[0019]将排版后的文字按文字排版格式传送给终端。
[0020]本发明还提供一种信息输入装置,该装置包括:
[0021]图像获取模块,用于获取图像;
[0022]切割处理模块,用于对获取的图像中的字符进行切割处理;
[0023]OCR识别模块,用于对各个切割字符进行文字识别,以识别出各个切割字符对应的文字;
[0024]排版模块,用于将识别的各个文字按对应的切割字符在所述图像的字符版面中的位置,进行文字排版;
[0025]输入模块,用于将排版后的文字按文字排版格式输出到文本输入框。
[0026]优选地,所述切割处理模块包括第一子切割处理单元或者第二子切割处理单元;
[0027]所述第一子切割处理单元,用于对获取的图像中的所有字符进行切割处理;
[0028]所述第二子切割处理单元,用于提供选择操作界面,供用户在获取的图像中选择待识别的图像区域,锁定用户基于所述操作界面选择的图像区域,并对选择的图像区域中的字符进行切割处理。
[0029]优选地,所述切割处理模块还用于对获取的图像进行二值化、倾斜校正、分段落分行及字符切割。
[0030]优选地,所述第二子切割处理单元包括:
[0031]提供单元,用于提供选择操作界面,供用户在获取的图像中选择待识别的图像区域;
[0032]锁定单元,用于获取用户在所述操作界面的第一选择手势,所述第一选择手势为一条带有预设宽度的直线,根据该第一选择手势将该带有预设宽度的直线覆盖的图像区域锁定为待识别的图像区域;及/或用于获取用户在所述操作界面的第二选择手势,所述第二选择手势为两条连续的直线,根据该第二选择手势中的两条连续的直线锁定一个平行四边形区域作为待识别的图像区域;
[0033]处理单元,用于对锁定单元锁定的待识别的图像区域进行切割处理。
[0034]优选地,所述装置还包括与所述排版模块连接的输出模块,所述输出模块用于将排版后的文字按文字排版格式传送给终端。
[0035]采用本发明实施例,可通过图像获取模块获取图像;对获取的图像中的字符进行切割处理;对各个切割字符进行文字识别,以识别出各个切割字符对应的文字;将识别的各个文字按对应的切割字符在所述图像的字符版面中的位置,进行文字排版;将排版后的文字按文字排版格式输出到文本输入框。可方便的实现信息输入,省时省力,提高信息输入效率。
【附图说明】
[0036]图1为本发明的信息输入方法的第一实施例流程示意图;
[0037]图2为本发明的信息输入方法的第一实施例中的待识别区域的一示意图;
[0038]图3为本发明的信息输入方法的第一实施例中的待识别区域的又一示意图;
[0039]图4为本发明的信息输入方法的第二实施例流程示意图;
[0040]图5为本发明的信息输入装置的第一实施例结构框图;
[0041]图6为本发明的信息输入装置的第二实施例结构框图。
[0042]本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
【具体实施方式】
[0043]应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0044]参照图1,图1为本发明的信息输入方法的第一实施例流程示意图,该方法包括:
[0045]S10、通过图像获取模块获取图像。
[0046]该图像获取模块可以是摄像头,该摄像头可以是数字摄像头和模拟摄像头。当用户需要将外部的非计算机可识别信息变成计算机可识别信息时(如将纸质文档中的文字转换成计算机可识别信息),通过图像获取模块获取非计算机可识别信息的图像,如通过摄像头拍摄需要输入信息所在纸的图像。在该步骤中,还可对获取的图像进行图像清晰度判断,如,用户通过该图像获取模块获取图像时,由于手抖动或被拍摄物体抖动,导致拍摄的图像很模糊,达不到在后面步骤的文字识别要求;因此可先对获取的图像进行图像清晰度判断,当判断结果为图像的清晰度没达到预设阀值时,则提醒用户重新通过图像获取模块获取图像。在对获取的图形信息进行图像清晰度判断时,可利用图像的平均边缘强度作为检测值,当平均边缘强度小于预设边缘强度阀值时,则认为拍摄的图像模糊,当平均边缘强度大于或等于预设边缘强度阀值时,则认为拍摄的图像清楚。该平均边缘强度是指由边缘算法(如Sobel算法等)获得。
[0047]S20、对获取的图像中的字符进行切割处理。
[0048]在该步骤S20中,对获取的图像中的字符进行切割处理,具体的,可先对获取的图像进行前景色噪声过滤及背景色噪声过滤,然后对噪声过滤后的图像进行二值化、倾斜校正、分段落分行、字符切割。其中,二值化就是将图像上的像素点的灰度值设置为O或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果;倾斜校正,是对图像中的倾斜内容进行校正(在通过图像获取模块获取图像时,当被拍摄物倾斜放置时,将使得获得的内容倾斜),可预先设置一个水平基准线,再判断该图像边缘(可通过图像边缘检测检测出图像边缘,如通过以下步骤检测图像边缘:1、滤波:边缘检测主要基于导数计算,但受噪声影响,但滤波器在降低噪声的同时也导致边缘强度的损失;2、增强:增强算法将领域中灰度有显著变化的点突出显示。一般通过计算梯度幅值完成;3、检测:但在有些图像中梯度幅值较大的并不是边缘点;4、定位:精确确定边缘的位置。)与该水平基准线的夹角值,当该夹角值大于预设的倾斜角度值时,认为该图像倾斜,则对该图像进行倾斜校正,以使得该图像边缘与水平基准线的夹角值小于或等于预设的倾斜角度值,当该夹角值小于或等于预设的倾斜角度值时,认为该图像不倾斜,不需要进行倾斜校正;分段落分行,对图像中的文档图片先进行分段落在分行即进行版面分析。
[0049]S30、对各个切割字符进行文字识别,以识别出各个切割字符对应的文字。
[0050]在该步骤S30中,对各个切割字符进行文字识别,以识别出各个切割字符对应的文字,具体的,可通过预设的字符库与算法对各个切割字符进行识别,以识别出各个切割字符对应的文字。在该步骤中,可采用微软公司提供的OCR引擎进行文字识别,它是一个公开的编程接口。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1