一种图像识别显示方法、装置及用户设备的制作方法

文档序号:6429533阅读:164来源:国知局
专利名称:一种图像识别显示方法、装置及用户设备的制作方法
技术领域
本申请涉及图像处理技术领域,尤指一种用于识别带文字图像的图像识别显示方法、装置及用户设备。
背景技术
随着互联网的普及,电子传真逐渐替代物理传真机,随时随地方便的收发和管理相关电子传真文档,特别是报价单或扫描件等。在接收端接收到用户传真过来的纯文字、表格、图片等图像文件时,很多时候由于 显示的角度问题导致接收到的图像内容不能正常的流览,需要用户人工操作进行图像角度的转换才能够正常浏览。例如如图I所示的图像,由于接收到之后文字的方向与正常浏览 的方向不同,浏览起来相当吃力。因此,必须逆时针旋转90度才能够正常浏览。现有技术中对于这种需要旋转后才能正常浏览的图像,一般采用把相关电子传真内容保存到本地,再利用专业图像编辑软件(如=Photoshop等)进行旋转处理,将处理好后的图像也保存到本地,再从本地存储器中把旋转后存储的相关图像导入到文档软件里进行浏览。针对电子传真、文档传输、邮件发送等方式传送的图像,当接收到的这种需要旋转的图像比较多,例如有多档时,则需要重复做旋转操作,这导致文件正常浏览的调整操作复杂,给图像正常浏览带来极大的不方便,可见,现有技术中在接收端接收到不能正常显示的图像时,不能实现方便快捷的显示为可正常浏览的图像。

发明内容
本申请实施例提供一种图像识别显示方法、装置及用户设备,用以解决现有技术中存在待浏览图像不能正常浏览时,调整操作麻烦,不能方便快捷的显示为可正常浏览的图像的问题。一种图像识别显示方法,包括对获取的待浏览图像进行扫描,识别出其中包含的至少一个文字;从识别出的文字中选择至少一个角度可识别的笔画,判断选择的角度可识别的笔画与笔画库中对应的笔画是否匹配来确定待浏览图像是否可以正常显示;当判断为否时,确定使选择的角度可识别的笔画与笔画库中对应的笔画相匹配时需要对识别出的文字进行旋转的调整角度,将待浏览图像旋转所述调整角度后保存和/或显示;当判断为是时,保存和/或显示待浏览图像文件。一种图像识别显示装置,包括扫描识别模块、匹配判断模块和图像显示模块;所述扫描识别模块,用于对获取的待浏览图像进行扫描,识别出其中包含的至少一个文字;所述匹配判断模块,用于从识别出的文字中选择至少一个角度可识别的笔画,判断选择的角度可识别的笔画与笔画库中对应的笔画是否匹配来确定待浏览图像是否可以正常显示;当判断为否时,确定使选择的角度可识别的笔画与笔画库中对应的笔画相匹配时需要对识别出的文字进行旋转的调整角度,并通知所述图像显示模块;当判断为是时,通知所述图像显示模块;所述图像显示模块,用于根据所述匹配判断模块的通知,将待浏览图像旋转所述调整角度后保存和/或显示;或根据所述匹配判断模块的通知保存和/或显示待浏览图像文件。一种用于图像识别显示的用户设备,包括上述的图像识别显示装置。本申请有益效果如下本申请实施例提供的图像识别显示方法、装置及用户设备,通过对待浏览图像中的文字进行识别,根据识别出的文字中选择的至少一个角度可识别的笔画,判断选择的角度可识别的笔画与笔画库中对应的笔画是否匹配来确定待浏览图像是否可以正常显示;在 不能正常显示时,确定使选择的角度可识别的笔画与笔画库中对应的笔画相匹配时需要对识别出的文字进行旋转的调整角度,将待浏览图像旋转所述调整角度后保存和/或显示;在能够正常显示时直接保存和/或显示待浏览图像文件。从而实现了对不能正常浏览的图像文件的自动调整。该方法可以自动实现调整,不需要人为参与,避免了复杂的人工操作,实现方便、快捷。


此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中图I为现有技术中不能正常浏览的图像示例图;图2为本申请实施例中图像识别显示方法的流程图;图3为本申请实施例中图像识别显示方法的具体实现流程图;图4为本申请实施例中角度可识别的笔画的示例图;图5为本申请实施例中笔画库的示意图;图6为本申请实施例中图像识别显示装置的结构示意图。
具体实施例方式为了使本申请所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。针对现有技术中,电子传真、文档传输、邮件发送等方式传送的图像,在接收端经常不能正常浏览的问题,本申请实施例提供的一种图像识别显示方法,实现对不能正常浏览的图像的自动识别调整,该方法流程如图2所示,包括如下步骤步骤Sll :对获取的待浏览图像进行扫描,识别出其中包含的至少一个文字。当接收到传真、文档传输、邮件发送等方式传送的图像或要浏览本地存储的图像时,对待浏览图像进行扫描,来识别其中包含的文字。步骤S12 :从识别出的文字中选择至少一个角度可识别的笔画。其中,角度可识别的笔画是指可以识别所在文字的显示方向是否为正常浏览的显示方向的一类笔画。例如角度可识别的笔画包括各种笔体的下列笔画之一或组合撇、捺、点、挑、折、勾。而横和竖等笔画的某些笔体则不符合这个要求,不属于角度可识别的笔画。步骤S13 :判断选择的角度可识别的笔画与笔画库中对应的笔画是否匹配来确定待浏览图像是否可以正常显示。将选择的每个角度可识别的笔画,分别与笔画库中包含的各个笔画依次进行比对;若选择的每个角度可识别的笔画在笔画库中均能找到相匹配的笔画,确定选择的角度可识别的笔画与笔画库对应的笔 画是相匹配的。若是,执行步骤S16 ;否则执行步骤S14。步骤S14 :确定使选择的角度可识别的笔画与笔画库中对应的笔画相匹配时需要对识别出的文字进行旋转的调整角度当步骤S13判断为否时,即选择的角度可识别的笔画与笔画库中对应的笔画不匹配,使待浏览图像不可以正常显示时,进一步确定要使图像可以正常浏览,即使选择的角度可识别的笔画与笔画库中对应的笔画相匹配,需要旋转多大的调整角度才能实现。其中,确定需要对识别出的文字进行旋转的调整角度的过程包括将识别出的文字旋转设定角度,判断旋转后的选择的角度可识别的笔画与笔画库中对应的笔画是否相匹配。当不匹配时,返回重复执行将识别出的文字旋转设定角度的操作,直至选择的角度可识别的笔画与笔画库中对应的笔画相匹配为止;确定选择的角度可识别的笔画与笔画库中对应的笔画相匹配时识别出的文字被旋转的角度之和为需要对识别出的文字进行旋转的调整角度。当匹配时,确定上述设定角度为需要对识别出的文字进行旋转的调整角度。上述设定角度可以根据需要设置,由于一般通常图片都是以90度为单位进行顺时针或逆时针旋转后传输的,因此,一般设定的角度采用90度可以在尽可能少的调整次数后,达到可以使旋转后的选择的角度可识别的笔画与笔画库中对应的笔画相匹配目的,使匹配效率较高。当然也可以设置设定角度为45度或其他度数,这样则需要多调整几次才能达到使旋转后的选择的角度可识别的笔画与笔画库中对应的笔画相匹配目的。上述当不匹配时,由于对旋转的文字进行了不止一次的调整,这不止一次的对文字调整的综合调整结果才使选择的角度可识别的笔画与笔画库中对应的笔画相匹配,因此,使选择的角度可识别的笔画与笔画库中对应的笔画相匹配时需要对识别出的文字进行旋转的调整角度,为这不止一次的调整使文字旋转的总角度。步骤S15 :将待浏览图像旋转调整角度后保存和/或显示。若根据上面的判断需要调整待浏览图像的话,则根据确定的调整角度进行自动调難
iF. O步骤S16 :保存和/或显示待浏览图像文件。当判断为是时,直接保存和/或显示待浏览的图像,无需进行调整操作。本申请所述的“图像不能正常浏览”以及“图像不能正常显示”的情况具体包括图像的显示角度与人眼的正常浏览习惯不符,使得人眼难于正常浏览图像中的内容。例如,图像中包含的文字展示角度并不是竖直摆放,与人眼阅读文字的方向(竖直方向)不符,导致人眼无法正常浏览所述图像中的文字内容。
下面通过一个具体的实施例详细说明上述图像识别显示方法的实现流程,具体如图3所示,包括如下步骤步骤S21 :对获取的待浏览图像进行扫描。对待浏览图像进行逐行进行扫描,来识别其中包含的文字。例如当接收电子传真内容时,对接收内容进行快速扫描,扫描到内容属于文字的部份,然后对这部份进行识别。步骤S22 :是否识别出其中包含的至少一个文字。若是,执行步骤S24,否则,执行步骤S23继续扫描。例如扫描到文字部分时,对文字的第一行进行快速扫描,获取第一个文字或其中一个文字。当然也可以不从第一行中获取,而是从文字部分任意获取一个或几个识别出的 文字。步骤S23 :继续对待浏览图像进行扫描。如果没有扫描到文字部分,则继续扫描直至扫描到文字部分或扫描完整个文件。步骤S24 :从识别出的文字中选择至少一个角度可识别的笔画。如图4所示为几个角度可识别的笔画示例,其中包括笔画“点”和“捺”。由于通常人们文档会采用宋体、黑体其中一种字体,而笔画“点”和“捺”是比较容易进行角度识别的笔画,因此一般可以选择笔画“点”和“捺”作为角度可识别的笔画。如图4所示的笔画“点”和“捺”头小脚重,特点分明。因此可以考虑从识别出的文字中选择笔画“点”和/或“捺”作为角度可识别的笔画。步骤S25 :判断选择的角度可识别的笔画与笔画库中对应的笔画是否匹配。当判断为是时,执行步骤S31 ;否则执行步骤S26。判断选择的角度可识别的笔画与笔画库中对应的笔画是否匹配,以便来确定待浏览图像是否可以正常显示。如图5为笔画库的一个示例图,笔画库中包括了宋体和黑体的点、捺、横、竖、撇、挑、折、勾等各种笔画。当然还可以包括其他笔画,也可以包含笔画的其他笔体。将选择的每个角度可识别的笔画,分别与笔画库中包含的各个笔画依次进行比对。若选择的每个角度可识别的笔画在笔画库中均能找到相匹配的笔画,确定选择的角度可识别的笔画与笔画库对应的笔画是相匹配的。其中,相匹配包括选择的角度可识别的笔画与笔画库对应的笔画形状相同和显示角度一致等,但不要求大小相同。例如,将选择笔画“点”与笔画库中的各个笔画依次进行比对,假如选择的笔画“点”与笔画库中宋体的“点”相匹配。又例如将选择笔画“点”与笔画库中的各个笔画依次进行比对,假如选择的笔画“点”与笔画库中宋体的“点”相匹配,则可以确定待浏览图像是可以正常显示的。上述判断出待浏览图像可以正常显示时,可以返回值Y,不可以正常显示时,可以返回值N。步骤S26 :将识别出的文字放大设定倍数。将识别出的文字放大设定倍数后,再执行下面确定需要对识别出的文字进行旋转的调整角度的步骤。例如可以将识别出的文字,例如第一行的首个汉字或任一个汉字放大到300%,以便更准确的进行识别。步骤S27 :将识别出的文字旋转设定角度。例如可以将识别出的文字存入缓存中,将其顺时针或逆时针选择90度,即设定的角度为+90度或-90度。假设顺时针旋转90度认为是旋转+90度,则逆时针旋转90度认为是旋转-90度;反之亦然。步骤S28 :判断旋转后的上述选择的角度可识别的笔画与笔画库中对应的笔画是否相匹配。当判断为是时,执行步骤S29 ;否则返回继续执行步骤S27。即每次旋转识别出的文字之后,进行一次将选择的角度可识别的笔画与笔画库中的笔画进行比对的操作,以确定是否可以相匹配。也就是说,当不匹配时,可以返回重复执行将识别出的文字旋转设定角度的操作,直至选择的角度可识别的笔画与笔画库中对应的笔画相匹配为止。 步骤S29 :确定需要对识别出的文字进行旋转的调整角度。当对识别出的文字旋转一次之后,旋转后的上述选择的角度可识别的笔画与笔画库中对应的笔画即可以相匹配时,确定上述设定角度为需要对识别出的文字进行旋转的调整角度。例如+90度或者-90度。当对识别出的文字进行一次以上的旋转之后,才能使旋转后的上述选择的角度可识别的笔画与笔画库中对应的笔画相匹配时,确定选择的角度可识别的笔画与笔画库中对应的笔画相匹配时,识别出的文字被旋转的角度之和为需要对识别出的文字进行旋转的调整角度。即对识别出的文字进行一次以上的旋转时,这几次旋转的角度之和为需要对识别出的文字进行旋转的调整角度。例如,可能是+180度、+270度或-180度、-270度。例如每次旋转的都是+90度,总共旋转了两次才能使旋转后的上述选择的角度可识别的笔画与笔画库中对应的笔画相匹配,则这两次旋转的角度之和为需要对识别出的文字进行旋转的调整角度,即需要旋转+180度才能使选择的角度可识别的笔画与笔画库中对应的笔画相匹配,使图像可以正常浏览。当然,其中+180度和-180度可以理解为是对识别出的文字进行顺时针或逆时针180度旋转。+270度和-90度可以理解为对识别出的文字进行顺时针270度旋转或逆时针90度旋转。而-270度和+90度则可以理解为对识别出的文字进行逆时针270度旋转或顺时针90度旋转。步骤S30 :将待浏览图像旋转调整角度后保存和/或显示。若根据上面的判断需要调整待浏览图像的话,则根据确定的调整角度进行自动调

iF. O步骤S31 :保存和/或显示待浏览图像文件。当步骤S25判断为是时,直接保存和/或显示待浏览的图像,无需进行调整操作。基于本申请实施例提供的上述上述图像识别显示方法,本申请实施例还提供一种图像识别显示装置,该装置可以设置在任何用于图像识别显示的用户设备中,用于对待浏览图像的调整,以保证待浏览图像可以正常浏览。该装置的结构如图6所示,包括扫描识别模块101、匹配判断模块102和图像显示模块103。扫描识别模块101,用于对获取的待浏览图像进行扫描,识别出其中包含的至少一个文字。
匹配判断模块102,用于从识别出的文字中选择至少一个角度可识别的笔画,判断选择的角度可识别的笔画与笔画库中对应的笔画是否匹配来确定待浏览图像是否可以正常显示;当判断为否时,确定使选择的角度可识别的笔画与笔画库中对应的笔画相匹配时需要对识别出的文字进行旋转的调整角度,并通知图像显示模块103 ;当判断为是时,通知图像显示模块103。图像显示模块103,用于根据匹配判断模块102的通知,将待浏览图像旋转所述调整角度后保存和/或显示;或根据匹配判断模块102的通知保存和/或显示待浏览图像文件。优选的,上述匹配判断模块102,具体用于当判断为否时,将识别出的文字旋转设定角度,判断旋转后的选择的角度可识别的笔画与笔画库中对应的笔画是否相匹配;当不匹配时,返回重复执行将识别出的文字旋转设定角度的操作,直至选择的角度可识别的笔画与笔画库中对应的笔画相匹配为止,确定选择的角度可识别的笔画与笔画库中对应的笔画相匹配时所述识别出的文字被旋转的角度之和为需要对识别出的文字进行旋转的调 整角度调整角度;当匹配时,确定设定角度为需要对识别出的文字进行旋转的调整角度。优选的,上述匹配判断模块102,具体用于将选择的每个角度可识别的笔画,分别与笔画库中包含的各个笔画依次进行比对;若选择的每个角度可识别的笔画在笔画库中均能找到相匹配的笔画,确定选择的角度可识别的笔画与笔画库对应的笔画是相匹配。优选的,上述匹配判断模块102,还用于当判断为否时,将识别出的文字放大设定倍数后,再执行确定需要对识别出的文字进行旋转的调整角度的步骤。上述图像识别显示方法及装置,可以对包含文字的图像和表格进行不同角度自动调整,在调整后存储或显示,使图像都能够进行正常的显示供用户浏览,不需要人工通过专用的图像编辑软件进行操作和调整,避免了重复操作的麻烦,这样只通过一个图像显示别装置,用户在打开电子传真,接收电子邮件和其他方式的传输文件后,就可以由接收端的用户设备自动将图像转化为可正常浏览的显示方向。由于用户无需手工处理,大大降低使用者操作的门槛,也大大提高用户的工作效率。本领域的技术人员应明白,本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。例如可以通过C语言等编程语言编辑计算机程序功能模块实现。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。上述说明示出并描述了本申请的优选实施例,但如前所述,应当理解本申请并非 局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权力要求的保护范围内。
权利要求
1.一种图像识别显示方法,其特征在于,包括 对获取的待浏览图像进行扫描,识别出其中包含的至少一个文字; 从识别出的文字中选择至少一个角度可识别的笔画,判断选择的角度可识别的笔画与笔画库中对应的笔画是否匹配来确定待浏览图像是否可以正常显示; 当判断为否时,确定使选择的角度可识别的笔画与笔画库中对应的笔画相匹配时需要对识别出的文字进行旋转的调整角度,将待浏览图像旋转所述调整角度后保存和/或显示;当判断为是时,保存和/或显示待浏览图像文件。
2.如权利要求I所述的方法,其特征在于,所述确定使选择的角度可识别的笔画与笔画库中对应的笔画相匹配时需要对识别出的文字进行旋转的调整角度,具体包括 将识别出的文字旋转设定角度,判断旋转后的所述选择的角度可识别的笔画与笔画库中对应的笔画是否相匹配; 当不匹配时,返回重复执行将识别出的文字旋转设定角度的操作,直至所述选择的角度可识别的笔画与笔画库中对应的笔画相匹配为止;确定选择的角度可识别的笔画与笔画库中对应的笔画相匹配时所述识别出的文字被旋转的角度之和为需要对识别出的文字进行旋转的调整角度; 当匹配时,确定所述设定角度为需要对识别出的文字进行旋转的调整角度。
3.如权利要求I所述的方法,其特征在于,所述判断选择的角度可识别的笔画与笔画库中对应的笔画是否匹配,具体包括 将选择的每个角度可识别的笔画,分别与笔画库中包含的各个笔画依次进行比对; 若选择的每个角度可识别的笔画在笔画库中均能找到相匹配的笔画,确定选择的角度可识别的笔画与笔画库对应的笔画是相匹配。
4.如权利要求I所述的方法,其特征在于,还包括 当判断为否时,将识别出的文字放大设定倍数后,再执行确定需要对识别出的文字进行旋转的调整角度的步骤。
5.如权利要求1-4任一所述的方法,其特征在于,所述角度可识别的笔画包括各种笔体的下列笔画之一或组合撇、捺、点、挑、折、勾。
6.一种图像识别显示装置,其特征在于,包括扫描识别模块、匹配判断模块和图像显示模块; 所述扫描识别模块,用于对获取的待浏览图像进行扫描,识别出其中包含的至少一个文字; 所述匹配判断模块,用于从识别出的文字中选择至少一个角度可识别的笔画,判断选择的角度可识别的笔画与笔画库中对应的笔画是否匹配来确定待浏览图像是否可以正常显示;当判断为否时,确定使选择的角度可识别的笔画与笔画库中对应的笔画相匹配时,需要对识别出的文字进行旋转的调整角度,并通知所述图像显示模块;当判断为是时,通知所述图像显示模块; 所述图像显示模块,用于根据所述匹配判断模块的通知,将待浏览图像旋转所述调整角度后保存和/或显示;或根据所述匹配判断模块的通知保存和/或显示待浏览图像文件。
7.如权利要求6所述的装置,其特征在于,所述匹配判断模块,具体用于当判断为否时,将识别出的文字旋转设定角度,判断旋转后的所述选择的角度可识别的笔画与笔画库中对应的笔画是否相匹配;当不匹配时,返回重复执行将识别出的文字旋转设定角度的操作,直至所述选择的角度可识别的笔画与笔画库中对应的笔画相匹配为止,确定选择的角度可识别的笔画与笔画库中对应的笔画相匹配时所述识别出的文字被旋转的角度之和为需要对识别出的文字进行旋转的调整角度调整角度;当匹配时,确定所述设定角度为需要对识别出的文字进行旋转的调整角度。
8.如权利要求6所述的装置,其特征在于,所述匹配判断模块,具体用于将选择的每个角度可识别的笔画,分别与笔画库中包含的各个笔画依次进行比对;若选择的每个角度可识别的笔画在笔画库中均能找到相匹配的笔画,确定选择的角度可识别的笔画与笔画库对应的笔画是相匹配。
9.如权利要求6-8任一所述的装置,其特征在于,所述匹配判断模块,还用于当判断为否时,将识别出的文字放大设定倍数后,再执行确定需要对识别出的文字进行旋转的调整角度的步骤。
10.一种用于图像识别显示的用户设备,其特征在于,包括如权利要求6-9任一所述的图像识别显示装置。
全文摘要
本申请公开了一种图像识别显示方法、装置及用户设备,该方法包括对获取的待浏览图像进行扫描,识别出其中包含的至少一个文字;从识别出的文字中选择至少一个角度可识别的笔画,判断选择的角度可识别的笔画与笔画库中对应的笔画是否匹配来确定待浏览图像是否可以正常显示;当判断为否时,确定使选择的角度可识别的笔画与笔画库中对应的笔画相匹配时需要对识别出的文字进行旋转的调整角度,将待浏览图像旋转所述调整角度后保存和/或显示;当判断为是时,保存和/或显示待浏览图像文件。该方法可以自动识别和调整图像的显示方向,保证图像正常显示。
文档编号G06K9/00GK102902947SQ201110212078
公开日2013年1月30日 申请日期2011年7月27日 优先权日2011年7月27日
发明者蔡景助 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1