文字信息获取方法、装置及移动终端与流程

文档序号:11729801阅读:276来源:国知局
文字信息获取方法、装置及移动终端与流程

本发明涉及到文字识别领域,特别是涉及到一种文字信息获取方法、装置及移动终端。



背景技术:

手机用户经常会碰到一个问题,收到了一张图片,需要快速从中提取出部分文字。比如从一张快递单的图片中提取出快递单号,或者一张便签的图片中提取出一个电话号码。

目前从图像中提取文字的技术(ocr文字识别)已经很成熟,并且在名片识别上得到广泛应用。但对上面的场景而言,用户得到的是整张图片中的所有文字,接着还需要从这些文字中选取自己需要的部分,操作麻烦费时。



技术实现要素:

本发明的主要目的为提供一种文字信息获取方法、装置及移动终端,能快速地获取图片中的文字。

本发明提出了一种文字信息获取方法,包括以下步骤:

在获取需提取文字的图片后,接收区域选择命令,在所述图片选取一个或多个待识别区域;

识别所述一个或多个待识别区域中包含的文字;

输出识别结果。

优选地,所述获取需提取文字的图片的步骤包括:

通过相机拍摄图片;或

从图片集中加载图片。

优选地,所述接收区域选择命令,在所述图片选取一个待识别区域的步骤包括:

检测屏幕上从左到右的第一滑动操作;

将屏幕上的滑动起点和滑动终点之间的区域确定为第一待识别区域。

优选地,所述将屏幕上的滑动起点和滑动终点之间的区域确定为第一待识别区域之后,还包括:

为所述待识别区域添加第一半透明蒙版,所述第一半透明蒙版高亮显示。

优选地,所述将屏幕上的滑动起点和滑动终点之间的区域确定为第一待识别区域的步骤之后,还包括:

检测屏幕上从左到右的第二滑动操作;

将屏幕上的滑动起点和滑动终点之间的区域确定为第二待识别区域;

判断所述第一待识别区域与第二待识别区域是否有重叠部分;

若是,则将所述第二待识别区域并入所述第一待识别区域,获得第三待识别区域。

优选地,所述接收区域选择命令,在所述图片选取一个待识别区域的步骤包括:

提供一个矩形选择框;

接收对所述矩形选择框的平移和/或缩放,获得矩形选定框;

将所述矩形选定框内的区域确定为第四待识别区域。

优选地,所述将屏幕上的滑动起点和滑动终点之间的区域确定为第一待识别区域的步骤之后,还包括:

检测屏幕上从右到左的第三滑动操作;

将屏幕上的滑动起点和滑动终点之间的区域确定为第一取消区域;

计算所述第一取消区域与第一待识别区域的重叠部分,记为第一扣取区域;

将所述第一待识别区域扣除所述第一扣取区域,获得第五待识别区域。

优选地,所述输出识别结果的步骤包括:

以文本框的方式显示识别结果。

优选地,所述以文本框的方式显示识别结果的步骤还包括:

确定待识别区域的最终个数;

根据待识别区域的最终个数,分段显示各个待识别区域的识别结果。

优选地,所述以文本框的方式显示识别结果的步骤还包括:

将所述识别结果复制到系统剪切板中。

优选地,所述以文本框的方式显示识别结果的步骤之后,还包括:

接收编辑命令,编辑所述文本框中的文字。

优选地,所述接收编辑命令,编辑所述文本框中的文字的步骤之后,还包括:

接收复制命令,复制所述文本框中的文字。

本发明还提出了一种文字信息获取装置,包括:

选取模块,用于在获取需提取文字的图片后,接收区域选择命令,在所述图片选取一个或多个待识别区域;

识别模块,用于识别所述一个或多个待识别区域中包含的文字;

输出模块,用于输出识别结果。

优选地,所述装置还包括图片获取模块,所述图片获取模块包括:

图片拍摄单元,用于通过相机拍摄图片;或

图片加载单元,用于从图片集中加载图片。

优选地,所述选取模块包括:

第一待识别区域检测单元,用于检测屏幕上从左到右的第一滑动操作;

第一待识别区域选取单元,用于将屏幕上的滑动起点和滑动终点之间的区域确定为第一待识别区域。

优选地,所述选取模块还包括:

蒙版显示单元,用于为所述待识别区域添加第一半透明蒙版,所述第一半透明蒙版高亮显示。

优选地,所述选取模块还包括:

第二待识别区域检测单元,用于检测屏幕上从左到右的第二滑动操作;

第二待识别区域选取单元,用于将屏幕上的滑动起点和滑动终点之间的区域确定为第二待识别区域;

第三待识别区域选取单元,用于判断所述第一待识别区域与第二待识别区域是否有重叠部分,若是,则将所述第二待识别区域并入所述第一待识别区域,获得第三待识别区域。

优选地,所述选取模块包括:

矩形选择框单元,用于提供一个矩形选择框;

矩形选定框单元,用于接收对所述矩形选择框的平移和/或缩放,获得矩形选定框;

第四待识别区域选取单元,用于将所述矩形选定框内的区域确定为第四待识别区域。

优选地,所述选取模块还包括:

第三滑动单元,用于检测屏幕上从右到左的第三滑动操作;

第一取消区域单元,用于将屏幕上的滑动起点和滑动终点之间的区域确定为第一取消区域;

第一扣取区域单元,用于计算所述第一取消区域与第一待识别区域的重叠部分,记为第一扣取区域;

第五待识别区域选取单元,用于将所述第一待识别区域扣除所述第一扣取区域,获得第五待识别区域。

优选地,所述输出模块包括:

文本框显示单元,用于以文本框的方式显示识别结果。

优选地,所述文本框显示单元还包括:

确定待识别区域个数子单元,用于确定待识别区域的最终个数;

显示识别结果子单元,用于根据待识别区域的最终个数,分段显示各个待识别区域的识别结果。

优选地,所述文本框显示单元还包括:

复制子单元,用于将所述识别结果复制到系统剪切板中。

优选地,所述输出模块还包括:

编辑单元,用于接收编辑命令,编辑所述文本框中的文字。

优选地,所述输出模块还包括:

复制单元,用于接收复制命令,复制所述文本框中的文字。

本发明还提出了一种移动终端,包括存储器和处理器;

所述存储器用于存储执行上述任一项所述文字信息获取方法的程序;

所述处理器被配置为用于执行所述存储器中存储的程序。

本发明提出的一种文字信息获取方法、装置及移动终端,能快速地文字信息获取,通过左右滑动的方式,让用户能快速选中需要识别的图片区域,仅对这块区域进行识别,并实时显示识别结果,同时识别后的数据自动保存在剪切板中,方便用户的后续操作。

附图说明

图1为本发明一种文字信息获取方法一实施例的流程示意图;

图2为本发明一种文字信息获取方法另一实施例的流程示意图;

图3为本发明一种文字信息获取装置一实施例的结构示意图;

图4为本发明一种文字信息获取装置另一实施例的结构示意图;

图5为本发明一实施例的移动终端的结构示意框图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组建,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组建和/或它们的组。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。

本发明涉及是一种从图片中提取文字的实现方案,该方案可适用于具有触摸屏功能的智能手机、pad或其他智能设备上。本发明的实现不限于于图片软件,在允许的条件下,也可应用于词典翻译,或者以其他形式展现。

参照图1,本发明提出一种文字信息获取方法,包括以下步骤:

s10、在获取需提取文字的图片后,接收区域选择命令,在所述图片选取一个或多个待识别区域;

s20、识别所述一个或多个待识别区域中包含的文字;

s30、输出识别结果。

首先,在选定需要提取文字的图片之后,用户从选项菜单中选择“划线识别”,此时进入文字提取模式。此时,会在原图基础上叠加一张灰度的半透明蒙版。用户可在该蒙版上选取区域。用户可选取一个待识别区域之后,继续在未选取区域选择另一个待识别区域。在待识别区域选择完毕之后,点击屏幕上的“确定”按钮,一般也可以是“√”的按钮,完成对待识别区域的选定。在确定待识别区域之后,手机上的识别程序开始识别选择区域中包含的文字。

可通过现有的ocr识别技术对图片中的文字进行识别。ocr(opticalcharacterrecognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。识别完成之后会将结果输出。

在一实施例中,所述获取需提取文字的图片的步骤包括:

通过相机拍摄图片;或

从图片集中加载图片。

获取需提取文字的图片的方式有两种,一种是直接通过手机的相机对需要识别的内容进行拍摄,再对拍摄内容进行识别;另一种是需要识别的图片已经储存在手机图片集中,需要在图片集中加载,再进行识别。两种方式均可实现对需提取文字的图片的获取。

在一实施例中,所述接收区域选择命令,在所述图片选取一个待识别区域的步骤s10包括:

检测屏幕上从左到右的第一滑动操作;

将屏幕上的滑动起点和滑动终点之间的区域确定为第一待识别区域。

在文字提取模式中,图片全屏显示。手指从左到右水平滑动可选取单行文字中的全部或部分。手指从左上到右下,或左下到右上滑动可选取一个矩形区域的内容。

在一实施例中,所述将屏幕上的滑动起点和滑动终点之间的区域确定为第一待识别区域之后,还包括:

为所述待识别区域添加第一半透明蒙版,所述第一半透明蒙版高亮显示。

首先,在选定第一待识别区域之后,选定的第一待识别区域上叠加一张灰度的半透明蒙版,以和为选定的区域区分。半透明蒙版高亮显示。

在一实施例中,所述将屏幕上的滑动起点和滑动终点之间的区域确定为第一待识别区域的步骤之后,还包括:

检测屏幕上从左到右的第二滑动操作;

将屏幕上的滑动起点和滑动终点之间的区域确定为第二待识别区域;

判断所述第一待识别区域与第二待识别区域是否有重叠部分;

若是,则将所述第二待识别区域并入所述第一待识别区域,获得第三待识别区域。

在选定第一待识别区域之后,还可以在图片上选择需要识别的部分。由于在识别过程中,很可能需要识别的部分并不是连续的。用户在选择好第一待识别区域后,在选择另一待识别区域,此时会存在两种情况,一种是第二待识别区域与第一待识别区域有重叠部分,另一种是没有。在没有交集的情形下,第一待识别区域和第二待识别区域单独进行识别。

若两者有重叠部分,则合并第一待识别区域和第二待识别区域,形成新的第三待识别区域。此时,不再对第一待识别区域和第二待识别区域进行识别。

在一实施例中,所述接收区域选择命令,在所述图片选取一个待识别区域的步骤包括:

提供一个矩形选择框;

接收对所述矩形选择框的平移和/或缩放,获得矩形选定框;

将所述矩形选定框内的区域确定为第四待识别区域。

在本实施例中,还提供另外一种待识别区域获取方式,具体是直接使用可调节大小且可平移的矩形选择框选择待识别区域。

在一实施例中,所述将屏幕上的滑动起点和滑动终点之间的区域确定为第一待识别区域的步骤之后,还包括:

检测屏幕上从右到左的第三滑动操作;

将屏幕上的滑动起点和滑动终点之间的区域确定为第一取消区域;

计算所述第一取消区域与第一待识别区域的重叠部分,记为第一扣取区域;

将所述第一待识别区域扣除所述第一扣取区域,获得第五待识别区域。

在本实施例中,由于有时候多选了不想选取的区域,此时进行识别势必会造成输出的识别结果包括不需要的部分。因此,在此实施例中,增加了可撤销选定的操作,用户通过手指从右到左的滑动取消已选择的区域。例如如果想取消a区域,则直接用手指在a区域上从右到左滑动,整个a区域则会消失。用户可根据自己的需要重新选择区域或放弃选择。

参照图2、在一实施例中,所述输出识别结果的步骤s30包括:

s31、以文本框的方式显示识别结果。

识别完成之后,以文本框的形式显示识别结果。手机会自动检测识别结果的内容量。如果只是少量文字,则文本框显示于被选中区域的上边或左边。如果是大量文字,则文本框占用一半屏幕或全部屏幕。

在一实施例中,所述以文本框的方式显示识别结果的步骤s31还包括:

确定待识别区域的最终个数;

根据待识别区域的最终个数,分段显示各个待识别区域的识别结果。

在选中多个区域时,手机会将多个区域的识别结果以换行的方式分隔开。例如选择了a、b、c三个区域,识别结果是以这种形式显示识别结果的:最上边的是a的识别结果,然后换行显示b的识别结果,再换行显示c的识别结果。

在一实施例中,所述以文本框的方式显示识别结果的步骤s31还包括:

将所述识别结果复制到系统剪切板中。

在本实施例中,当弹出文本框时,系统会自动复制文本框中的内容。

在一实施例中,所述以文本框的方式显示识别结果的步骤s31之后,还包括:

接收编辑命令,编辑所述文本框中的文字。

现有的识别技术,识别结果难免会有错别字。此时可点击文本框内部,则在相应位置出现光标。可移动光标位置,并在光标文字录入或修改文本框中的文本信息。

在一实施例中,所述接收编辑命令,编辑所述文本框中的文字的步骤之后,还包括:

接收复制命令,复制所述文本框中的文字。

文本框下方还有一复制按钮,点击该按钮则可复制文本框中的所有文字。或者在文本框中拖动光标,选中文字,再长按,等待出现浮动按钮,出现“复制”、“粘贴”等选项,选择“复制”,复制选中文字的内容。

本发明提出的一种文字信息获取的方法,能快速地文字信息获取,通过左右滑动的方式,让用户能快速选中需要识别的图片区域,仅对这块区域进行识别,并实时显示识别结果,同时识别后的数据自动保存在剪切板中,方便用户的后续操作。

参照图3,本发明还提出了一种文字信息获取装置,包括:

选取模块10,用于在获取需提取文字的图片后,接收区域选择命令,在所述图片选取一个或多个待识别区域;

识别模块20,用于识别所述一个或多个待识别区域中包含的文字;

输出模块30,用于输出识别结果。

首先,在选定需要提取文字的图片之后,用户从选项菜单中选择“划线识别”,此时进入文字提取模式。此时,会在原图基础上叠加一张灰度的半透明蒙版。用户可在该蒙版上选取区域。用户可选取一个待识别区域之后,继续在未选取区域选择另一个待识别区域。在待识别区域选择完毕之后,点击屏幕上的“确定”按钮,一般也可以是“√”的按钮,完成对待识别区域的选定。在确定待识别区域之后,手机上的识别程序开始识别选择区域中包含的文字。

可通过现有的ocr识别技术对图片中的文字进行识别。ocr(opticalcharacterrecognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。识别完成之后会将结果输出。

参照图4,在一实施例中,所述装置还包括图片获取模块11,所述图片获取模块11包括:

图片拍摄单元,用于通过相机拍摄图片;或

图片加载单元,用于从图片集中加载图片。

获取需提取文字的图片的方式有两种,一种是直接通过手机的相机对需要识别的内容进行拍摄,再对拍摄内容进行识别;另一种是需要识别的图片已经储存在手机图片集中,需要在图片集中加载,再进行识别。两种方式均可实现对需提取文字的图片的获取。

在一实施例中,所述选取模块10包括:

第一待识别区域检测单元,用于检测屏幕上从左到右的第一滑动操作;

第一待识别区域选取单元,用于将屏幕上的滑动起点和滑动终点之间的区域确定为第一待识别区域。

在文字提取模式中,图片全屏显示。手指从左到右水平滑动可选取单行文字中的全部或部分。手指从左上到右下,或左下到右上滑动可选取一个矩形区域的内容。

在一实施例中,所述选取模块10还包括:

蒙版显示单元,用于为所述待识别区域添加第一半透明蒙版,所述第一半透明蒙版高亮显示。

首先,在选定第一待识别区域之后,选定的第一待识别区域上叠加一张灰度的半透明蒙版,以和为选定的区域区分。半透明蒙版高亮显示。

在一实施例中,所述选取模块10还包括:

第二待识别区域检测单元,用于检测屏幕上从左到右的第二滑动操作;

第二待识别区域选取单元,用于将屏幕上的滑动起点和滑动终点之间的区域确定为第二待识别区域;

第三待识别区域选取单元,用于判断所述第一待识别区域与第二待识别区域是否有重叠部分,若是,则将所述第二待识别区域并入所述第一待识别区域,获得第三待识别区域。

在选定第一待识别区域之后,还可以在图片上选择需要识别的部分。由于在识别过程中,很可能需要识别的部分并不是连续的。用户在选择好第一待识别区域后,在选择另一待识别区域,此时会存在两种情况,一种是第二待识别区域与第一待识别区域有重叠部分,另一种是没有。在没有交集的情形下,第一待识别区域和第二待识别区域单独进行识别。

若两者有重叠部分,则合并第一待识别区域和第二待识别区域,形成新的第三待识别区域。此时,不再对第一待识别区域和第二待识别区域进行识别。

在一实施例中,所述选取模块10包括:

矩形选择框单元,用于提供一个矩形选择框;

矩形选定框单元,用于接收对所述矩形选择框的平移和/或缩放,获得矩形选定框;

第四待识别区域选取单元,用于将所述矩形选定框内的区域确定为第四待识别区域。

在本实施例中,还提供另外一种待识别区域获取方式,具体是直接使用可调节大小且可平移的矩形选择框选择待识别区域。

在一实施例中,所述选取模块10还包括:

第三滑动单元,用于检测屏幕上从右到左的第三滑动操作;

第一取消区域单元,用于将屏幕上的滑动起点和滑动终点之间的区域确定为第一取消区域;

第一扣取区域单元,用于计算所述第一取消区域与第一待识别区域的重叠部分,记为第一扣取区域;

第五待识别区域选取单元,用于将所述第一待识别区域扣除所述第一扣取区域,获得第五待识别区域。

在本实施例中,由于有时候多选了不想选取的区域,此时进行识别势必会造成输出的识别结果包括不需要的部分。因此,在此实施例中,增加了可撤销选定的操作,用户通过手指从右到左的滑动取消已选择的区域。例如如果想取消a区域,则直接用手指在a区域上从右到左滑动,整个a区域则会消失。用户可根据自己的需要重新选择区域或放弃选择。

在一实施例中,所述输出模块30包括:

文本框显示单元,用于以文本框的方式显示识别结果。

识别完成之后,以文本框的形式显示识别结果。手机会自动检测识别结果的内容量。如果只是少量文字,则文本框显示于被选中区域的上边或左边。如果是大量文字,则文本框占用一半屏幕或全部屏幕。

在一实施例中,所述文本框显示单元还包括:

确定待识别区域个数子单元,用于确定待识别区域的最终个数;

显示识别结果子单元,用于根据待识别区域的最终个数,分段显示各个待识别区域的识别结果。

在选中多个区域时,手机会将多个区域的识别结果以换行的方式分隔开。例如选择了a、b、c三个区域,识别结果是以这种形式显示识别结果的:最上边的是a的识别结果,然后换行显示b的识别结果,再换行显示c的识别结果。

在一实施例中,所述文本框显示单元还包括:

复制子单元,用于将所述识别结果复制到系统剪切板中。

在本实施例中,当弹出文本框时,系统会自动复制文本框中的内容。

在一实施例中,所述输出模块30还包括:

编辑单元,用于接收编辑命令,编辑所述文本框中的文字。

现有的识别技术,识别结果难免会有错别字。此时可点击文本框内部,则在相应位置出现光标。可移动光标位置,并在光标文字录入或修改文本框中的文本信息。

在一实施例中,所述输出模块30还包括:

复制单元,用于接收复制命令,复制所述文本框中的文字。

文本框下方还有一复制按钮,点击该按钮则可复制文本框中的所有文字。或者在文本框中拖动光标,选中文字,再长按,等待出现浮动按钮,出现“复制”、“粘贴”等选项,选择“复制”,复制选中文字的内容。

本发明提出的一种文字信息获取装置,能快速地从图片中提取文字,通过左右滑动的方式,让用户能快速选中需要识别的图片区域,仅对这块区域进行识别,并实时显示识别结果,同时识别后的数据自动保存在剪切板中,方便用户的后续操作。

参照图5,本发明实施例中还提供一种移动终端,包括处理器1180和存储器1120;所述存储器1120用于存储执行上述文字信息获取方法的程序;所述处理器1180被配置为用于执行所述存储器1120中存储的程序。

为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该移动终端可以为包括手机、平板电脑、pda(personaldigitalassistant,个人数字助理)、pos(pointofsales,销售终端)、车载电脑等任意终端设备,以移动终端为手机为例。

图5示出的是与本发明实施例提供的移动终端相关的手机的部分结构的框图。参考图5,手机包括:射频(radiofrequency,rf)电路1110、存储器1120、输入单元1130、显示单元1140、传感器1150、音频电路1160、无线保真(wirelessfidelity,wifi)模块1170、处理器1180、以及电源1190等部件。本领域技术人员可以理解,图5中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

下面结合图5对手机的各个构成部件进行具体的介绍:

rf电路1110可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1180处理;另外,将设计上行的数据发送给基站。通常,rf电路1110包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(lownoiseamplifier,lna)、双工器等。此外,rf电路1110还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(globalsystemofmobilecommunication,gsm)、通用分组无线服务(generalpacketradioservice,gprs)、码分多址(codedivisionmultipleaccess,cdma)、宽带码分多址(widebandcodedivisionmultipleaccess,wcdma)、长期演进(longtermevolution,lte)、电子邮件、短消息服务(shortmessagingservice,sms)等。

存储器1120可用于存储软件程序以及模块,处理器1180通过运行存储在存储器1120的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器1120可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1120可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

输入单元1130可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元1130可包括触控面板1131以及其他输入设备1132。触控面板1131,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1131上或在触控面板1131附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板1131可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1180,并能接收处理器1180发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1131。除了触控面板1131,输入单元1130还可以包括其他输入设备1132。具体地,其他输入设备1132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元1140可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1140可包括显示面板1141,可选的,可以采用液晶显示器(liquidcrystaldisplay,lcd)、有机发光二极管(organiclight-emittingdiode,oled)等形式来配置显示面板1141。进一步的,触控面板1131可覆盖显示面板1141,当触控面板1131检测到在其上或附近的触摸操作后,传送给处理器1180以确定触摸事件的类型,随后处理器1180根据触摸事件的类型在显示面板1141上提供相应的视觉输出。虽然在图5中,触控面板1131与显示面板1141是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板1131与显示面板1141集成而实现手机的输入和输出功能。

手机还可包括至少一种传感器1150,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1141的亮度,接近传感器可在手机移动到耳边时,关闭显示面板1141和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。

音频电路1160、扬声器1161,传声器1162可提供用户与手机之间的音频接口。音频电路1160可将接收到的音频数据转换后的电信号,传输到扬声器1161,由扬声器1161转换为声音信号输出;另一方面,传声器1162将收集的声音信号转换为电信号,由音频电路1160接收后转换为音频数据,再将音频数据输出处理器1180处理后,经rf电路1110以发送给比如另一手机,或者将音频数据输出至存储器1120以便进一步处理。

wifi属于短距离无线传输技术,手机通过wifi模块1170可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图5示出了wifi模块1170,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。

处理器1180是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器1120内的软件程序和/或模块,以及调用存储在存储器1120内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器1180可包括一个或多个处理单元;优选的,处理器1180可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1180中。

手机还包括给各个部件供电的电源1190(比如电池),优选的,电源可以通过电源管理系统与处理器1180逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。

虽然本说明书包含很多特定实现细节,但是这些不应当视为对本发明或者可以要求保护的范围的限制,而是作为特定于本发明的特定实施方式的特征的描述。本说明书在独立的实施方式的上下文中描述的特定特征可以在单个实施方式中组合实现。相反,在单个实施方式的上下文中描述的各种特征也可以在多个实施方式中或者在任意适当的子组合中分开实现。另外,虽然上文可能将特征描述为在特定组合中进行并且甚至初始如此要求保护,但是在某些情况下,所要求保护的组合中的一个或多个特征可以从组合中去除,并且所要求保护的组合可以针对子组合或者子组合的变体。

类似地,虽然附图中以特定次序描绘了操作,但是这不应理解为需要以所示出的特定次序或者顺序执行此类操作,或者执行所有示出的操作来达到期望的结果。在某些情况下,多任务和并行处理可能是有利的。另外,上文描述的实施方式中的各种系统组件的分离不应当理解为在所有实施方式中需要此类分离,并且应当理解,所描述的程序组件和系统通常可以一起集成在单个软件产品中或者封装为多个软件产品。

由此,已经描述了本发明的特定实施方式。其他实施方式也在所附权利要求的范围内。在某些情况下,权利要求中限定的动作可以按照不同的次序来执行并且仍然达到期望的结果。另外,附图中绘出的过程未必需要所示出的特定次序或者顺序来达到期望的结果。在某些实现中,多任务和并行处理可能是有利的。

以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

本发明还提供:a1、一种文字信息获取方法,包括以下步骤:

在获取需提取文字的图片后,接收区域选择命令,在所述图片选取一个或多个待识别区域;

识别所述一个或多个待识别区域中包含的文字;

输出识别结果。

a2、根据a1所述的文字信息获取方法,所述获取需提取文字的图片的步骤包括:

通过相机拍摄图片;或

从图片集中加载图片。

a3、根据a1所述的文字信息获取方法,所述接收区域选择命令,在所述图片选取一个待识别区域的步骤包括:

检测屏幕上从左到右的第一滑动操作;

将屏幕上的滑动起点和滑动终点之间的区域确定为第一待识别区域。

a4、根据a3所述的文字信息获取方法,所述将屏幕上的滑动起点和滑动终点之间的区域确定为第一待识别区域之后,还包括:

为所述待识别区域添加第一半透明蒙版,所述第一半透明蒙版高亮显示。

a5、根据a3所述的文字信息获取方法,所述将屏幕上的滑动起点和滑动终点之间的区域确定为第一待识别区域的步骤之后,还包括:

检测屏幕上从左到右的第二滑动操作;

将屏幕上的滑动起点和滑动终点之间的区域确定为第二待识别区域;

判断所述第一待识别区域与第二待识别区域是否有重叠部分;

若是,则将所述第二待识别区域并入所述第一待识别区域,获得第三待识别区域。

a6、根据a1所述的文字信息获取方法,所述接收区域选择命令,在所述图片选取一个待识别区域的步骤包括:

提供一个矩形选择框;

接收对所述矩形选择框的平移和/或缩放,获得矩形选定框;

将所述矩形选定框内的区域确定为第四待识别区域。

a7、根据a3所述的文字信息获取方法,所述将屏幕上的滑动起点和滑动终点之间的区域确定为第一待识别区域的步骤之后,还包括:

检测屏幕上从右到左的第三滑动操作;

将屏幕上的滑动起点和滑动终点之间的区域确定为第一取消区域;

计算所述第一取消区域与第一待识别区域的重叠部分,记为第一扣取区域;

将所述第一待识别区域扣除所述第一扣取区域,获得第五待识别区域。

a8、根据a1所述的文字信息获取方法,所述输出识别结果的步骤包括:

以文本框的方式显示识别结果。

a9、根据a8所述的文字信息获取方法,所述以文本框的方式显示识别结果的步骤还包括:

确定待识别区域的最终个数;

根据待识别区域的最终个数,分段显示各个待识别区域的识别结果。

a10、根据a8所述的文字信息获取方法,所述以文本框的方式显示识别结果的步骤还包括:

将所述识别结果复制到系统剪切板中。

a11、根据a8所述的文字信息获取方法,所述以文本框的方式显示识别结果的步骤之后,还包括:

接收编辑命令,编辑所述文本框中的文字。

a12、根据a11所述的文字信息获取方法,所述接收编辑命令,编辑所述文本框中的文字的步骤之后,还包括:

接收复制命令,复制所述文本框中的文字。

b1、一种文字信息获取装置,包括:

选取模块,用于在获取需提取文字的图片后,接收区域选择命令,在所述图片选取一个或多个待识别区域;

识别模块,用于识别所述一个或多个待识别区域中包含的文字;

输出模块,用于输出识别结果。

b2、根据b1所述的文字信息获取装置,所述装置还包括图片获取模块,所述图片获取模块包括:

图片拍摄单元,用于通过相机拍摄图片;或

图片加载单元,用于从图片集中加载图片。

b3、根据b1所述的文字信息获取装置,所述选取模块包括:

第一待识别区域检测单元,用于检测屏幕上从左到右的第一滑动操作;

第一待识别区域选取单元,用于将屏幕上的滑动起点和滑动终点之间的区域确定为第一待识别区域。

b4、根据b3所述的文字信息获取装置,所述选取模块还包括:

蒙版显示单元,用于为所述待识别区域添加第一半透明蒙版,所述第一半透明蒙版高亮显示。

b5、根据b3所述的文字信息获取装置,所述选取模块还包括:

第二待识别区域检测单元,用于检测屏幕上从左到右的第二滑动操作;

第二待识别区域选取单元,用于将屏幕上的滑动起点和滑动终点之间的区域确定为第二待识别区域;

第三待识别区域选取单元,用于判断所述第一待识别区域与第二待识别区域是否有重叠部分,若是,则将所述第二待识别区域并入所述第一待识别区域,获得第三待识别区域。

b6、根据b1所述的文字信息获取装置,所述选取模块包括:

矩形选择框单元,用于提供一个矩形选择框;

矩形选定框单元,用于接收对所述矩形选择框的平移和/或缩放,获得矩形选定框;

第四待识别区域选取单元,用于将所述矩形选定框内的区域确定为第四待识别区域。

b7、根据b3所述的文字信息获取装置,所述选取模块还包括:

第三滑动单元,用于检测屏幕上从右到左的第三滑动操作;

第一取消区域单元,用于将屏幕上的滑动起点和滑动终点之间的区域确定为第一取消区域;

第一扣取区域单元,用于计算所述第一取消区域与第一待识别区域的重叠部分,记为第一扣取区域;

第五待识别区域选取单元,用于将所述第一待识别区域扣除所述第一扣取区域,获得第五待识别区域。

b8、根据b1所述的文字信息获取装置,所述输出模块包括:

文本框显示单元,用于以文本框的方式显示识别结果。

b9、根据b8所述的文字信息获取装置,所述文本框显示单元还包括:

确定待识别区域个数子单元,用于确定待识别区域的最终个数;

显示识别结果子单元,用于根据待识别区域的最终个数,分段显示各个待识别区域的识别结果。

b10、根据b8所述的文字信息获取装置,所述文本框显示单元还包括:

复制子单元,用于将所述识别结果复制到系统剪切板中。

b11、根据b8所述的文字信息获取装置,所述输出模块还包括:

编辑单元,用于接收编辑命令,编辑所述文本框中的文字。

b12、根据b11所述的文字信息获取装置,所述输出模块还包括:

复制单元,用于接收复制命令,复制所述文本框中的文字。

c1、一种移动终端,包括存储器和处理器;

所述存储器用于存储执行a1至a12任一项所述的文字信息获取方法的程序;

所述处理器被配置为用于执行所述存储器中存储的程序。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1