一种信息提取方法和装置与流程

文档序号:16631016发布日期:2019-01-16 06:34阅读:175来源:国知局
一种信息提取方法和装置与流程

本发明涉及ocr信息技术领域,尤其涉及一种信息提取方法和装置。



背景技术:

现有的ocr提取技术是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。也就是说,现有的ocr提取技术是识别并提取图像中文字的过程,但是该技术是将图片中所有读取到的文字信息都不展现,而不能选择性的提取图像中的部分信息。



技术实现要素:

本发明实施例提供了一种信息提取方法和装置,解决了现有技术中ocr提取技术不能选择性的提取图像中的部分信息的技术问题,达到了实现快速提取信息有用信息,快速对信息进行采集、录入,提高工作效率的技术效果。

鉴于上述问题,提出了本申请实施例以便提供一种信息提取方法和装置。

第一方面,本发明提供了一种信息提取方法,所述方法包括:获得第一图像信息,所述第一图像中包含n个信息,其中,所述n为大于0的整数;获得标准信息;根据所述标准信息,提取所述第一图像信息中的m个信息,其中,所述m为小于等于n且大于零的整数。

优选的,所述根据所述标准信息,提取所述第一图像信息中的m个信息之后,还包括:获得所述m个信息的属性信息;根据所述属性信息,对所述m个信息进行分类。

优选的,所述根据所述标准信息,提取所述第一图像信息中的m个信息为:根据ocr信息提取技术提取所述第一图像信息中的m个信息。

优选的,所述获得标准信息,包括:获得目标国家;根据所述目标国家,确定所述标准信息。

第二方面,本发明提供了一种信息提取装置,所述装置包括:

第一获得单元,所述第一获得单元用于获得第一图像信息,所述第一图像中包含n个信息,其中,所述n为大于0的整数;

第二获得单元,所述第二获得单元用于获得标准信息;

第一提取单元,所述第一提取单元用于根据所述标准信息,提取所述第一图像信息中的m个信息,其中,所述m为小于等于n且大于零的整数。

优选的,所述装置还包括:

第三获得单元,所述第三获得单元用于获得所述m个信息的属性信息;

第一分类单元,所述第一分类单元用于根据所述属性信息,对所述m个信息进行分类。

优选的,所述装置还包括:

第一ocr信息提取单元,所述第一ocr信息提取单元根据ocr信息提取技术提取所述第一图像信息中的m个信息。

优选的,所述装置还包括:

第四获得单元,所述第四获得单元用于获得目标国家;

第一确定单元,所述第一确定单元用于根据所述目标国家,确定所述标准信息。

第三方面,本发明提供了一种信息提取装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:获得第一图像信息,所述第一图像中包含n个信息,其中,所述n为大于0的整数;获得标准信息;根据所述标准信息,提取所述第一图像信息中的m个信息,其中,所述m为小于等于n且大于零的整数。

本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:

本申请实施例提供的一种信息提取方法和装置,通过获得第一图像信息,所述第一图像中包含n个信息,其中,所述n为大于0的整数;获得标准信息;根据所述标准信息,提取所述第一图像信息中的m个信息,其中,所述m为小于等于n且大于零的整数。解决了现有技术中ocr提取技术不能选择性的提取图像中的部分信息的技术问题,达到了实现快速提取信息有用信息,快速对信息进行采集、录入,提高工作效率的技术效果。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

图1为本发明实施例中一种信息提取方法的流程示意图;

图2为本发明实施例中一种信息提取装置的结构示意图;

图3为本发明实施例中另一种信息提取装置的结构示意图。

附图标号说明:总线300,接收器301,处理器302,发送器303,存储器304,总线接口306。

具体实施方式

本发明实施例提供了一种信息提取方法和装置,用于解决现有技术中ocr提取技术不能选择性的提取图像中的部分信息的技术问题,达到了实现快速提取信息有用信息,快速对信息进行采集、录入,提高工作效率的技术效果。

本发明提供的技术方案总体思路如下:

在本发明实施例的技术方案中,通过获得第一图像信息,所述第一图像中包含n个信息,其中,所述n为大于0的整数;获得标准信息;根据所述标准信息,提取所述第一图像信息中的m个信息,其中,所述m为小于等于n且大于零的整数。达到了实现快速提取信息有用信息,快速对信息进行采集、录入,提高工作效率的技术效果。

下面通过附图以及具体实施例对本发明技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。

本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。

实施例一

图1为本发明实施例中一种信息提取方法的流程示意图。如图1所示,所述方法包括:

步骤110:获得第一图像信息,所述第一图像中包含n个信息,其中,所述n为大于0的整数;

具体而言,所述第一图像信息为用户的个人相关信息,其中,所述第一图像信息包括用户出国时的所要用到的个人护照,签证等证件上面的信息,因此,所述第一图像中包含的信息数量比较多,即,所述第一图像中包含有n个信息,其中的信息包括姓名、出生年月、性别等信息,因此,所述n个信息中的所述n为大于0的整数。举例而言,当用户出国时,会用到护照,而护照是一个国家的公民出入本国国境和到国外旅行或居留时,由本国发给的一种证明该公民国籍和身份的合法证件,其上存储有个人的相关信息,以中国护照为例,在护照的信息页显示有个人的照片、姓名、出生日期、护照的签发时间和签发地点等相关信息。当用户前往新加坡时,需要携带护照和有效签证,同时还需要填写出境卡,此时用户可采用手机上出国宝app中对自己的个人信息进行输入,进一步的用户可采用相机拍摄护照的信息页,从而获得该用户的第一图像信息,从而可以省去手动输入造成浪费时间,同时也避免了用户在手动写入时容易造成书写错误的问题。

步骤120:获得标准信息;

进一步的,所述获得标准信息,包括:获得目标国家;根据所述目标国家,确定所述标准信息。

具体而言,所述目标国家即为用户出国所前往的国家,所述标准信息为去往该国家需要填写的出入境资料的相关信息,因此,根据出国所去的地方不同,需要填写的标准信息也会存在差异。举例而言,当用户去往新加坡时,需要携带护照和有效签证,进而填写个人出境卡资料时,同样需要按照该国的要求在资料上填写个人信息,其中,新加坡的出境卡上需要填写的内容包括姓名、出生年月、入境卡编号、护照编号、居住的城市、航班号、出国所住的酒店等相关内容,除了上述信息之外,还需要填写自己短期内是否去过非洲或南美洲、离开该国家后回去哪个城市等信息;而当用户去往英国时,在填写出境卡资料时,需要填写姓名、生日、国籍、职业、在英国逗留到什么时等基本信息,而无需填写自己短期内是否去过非洲或南美洲等信息,因此,根据去往的国家不同,所填的标准信息会根据该国家的要求而有所不同。

步骤130:根据所述标准信息,提取所述第一图像信息中的m个信息,其中,所述m为小于等于n且大于零的整数。

进一步的,所述根据所述标准信息,提取所述第一图像信息中的m个信息为:根据ocr信息提取技术提取所述第一图像信息中的m个信息。

进一步的,所述根据所述标准信息,提取所述第一图像信息中的m个信息之后,还包括:获得所述m个信息的属性信息;根据所述属性信息,对所述m个信息进行分类。

具体而言,根据前往国家所需要的标准信息,从所述第一图像信息中的n个信息提取相关的m个信息,所述m个信息数量可以全部包含在所述n个信息内,也可少于所述n个信息,也就是说,m为小于等于n且大于零的整数。进一步的,在依据标准信息对所述m个信息进行提取时,此时采用ocr信息提取技术进行提取,其中,ocr为opticalcharacterrecognition(光学字符识别)的缩写,意思是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,ocr信息提取技术是针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的一种技术。进一步的,在提取到所述m个信息之后,会依据所述m个信息的属性信息进行分类,换言之,当所述ocr信息提取技术在获得所述m个信息之后,通过ocr信息提取技术将进一步将所述m个信息的字符直接转换为可编辑文本,进一步在按照类别分类时,可根据所述的m个信息是否为数字、文字或是其他符号进行分类。举例而言,当用户前往某个国家时,需要填写对应的资料时,当选择在出国宝app中输入个人信息时,先采用相机拍摄用户的护照中的信息页,即可获得第一图像信息,进而将扫描到的图片上传至第三方服务器,通过第三方服务器进行解析之后,然后返回图片中的所有的数据信息,接着根据用户出国的国家不同,所需要填写的信息也有所不同,该信息即为标准信息,因此,采用ocr信息提取技术会依据上述标准信息提取所述第一图像信息中的有用信息,该有用信息即为出入境卡上用户出国需要填写的信息,然后进一步按照类别分开,最终通过页面展示给用户,从而解决了现有技术中ocr提取技术不能选择性的提取图像中的部分信息的技术问题,达到了实现快速提取信息有用信息,快速对信息进行采集、录入,提高工作效率,节省用户时间的技术效果。

实施例2

基于与前述实施例中一种信息提取方法同样的发明构思,本发明还提供一种信息提取装置,如图2所示,包括:

第一获得单元11,所述第一获得单元11用于获得第一图像信息,所述第一图像中包含n个信息,其中,所述n为大于0的整数;

第二获得单元12,所述第二获得单元12用于获得标准信息;

第一提取单元13,所述第一提取单元13用于根据所述标准信息,提取所述第一图像信息中的m个信息,其中,所述m为小于等于n且大于零的整数。

进一步的,所述装置还包括:

第三获得单元,所述第三获得单元用于获得所述m个信息的属性信息;

第一分类单元,所述第一分类单元用于根据所述属性信息,对所述m个信息进行分类。

进一步的,所述装置还包括:

第一ocr信息提取单元,所述第一ocr信息提取单元根据ocr信息提取技术提取所述第一图像信息中的m个信息。

进一步的,所述装置还包括:

第四获得单元,所述第四获得单元用于获得目标国家;

第一确定单元,所述第一确定单元用于根据所述目标国家,确定所述标准信息。

前述图1实施例1中的一种信息提取方法的各种变化方式和具体实例同样适用于本实施例的一种信息提取装置,通过前述对一种信息提取方法的详细描述,本领域技术人员可以清楚的知道本实施例中一种信息提取装置的实施方法,所以为了说明书的简洁,在此不再详述。

实施例3

基于与前述实施例中一种信息提取方法同样的发明构思,本发明还提供一种信息提取装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该程序被处理器执行时实现前文所述一种信息提取方法的任一方法的步骤。

其中,在图3中,总线架构(用总线300来代表),总线300可以包括任意数量的互联的总线和桥,总线300将包括由处理器302代表的一个或多个处理器和存储器304代表的存储器的各种电路链接在一起。总线300还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口306在总线300和接收器301和发送器303之间提供接口。接收器301和发送器303可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。

处理器302负责管理总线300和通常的处理,而存储器304可以被用于存储处理器302在执行操作时所使用的信息。

本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:

本申请实施例提供的一种信息提取方法和装置,通过获得第一图像信息,所述第一图像中包含n个信息,其中,所述n为大于0的整数;获得标准信息;根据所述标准信息,提取所述第一图像信息中的m个信息,其中,所述m为小于等于n且大于零的整数。解决了现有技术中ocr提取技术不能选择性的提取图像中的部分信息的技术问题,达到了实现快速提取信息有用信息,快速对信息进行采集、录入的技术效果。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程信息处理设备的处理器以产生一个机器,使得通过计算机或其他可编程信息处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程信息处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程信息处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1