一种营业执照的文本识别方法、系统及相关组件与流程

文档序号:18303118发布日期:2019-07-31 10:27阅读:248来源:国知局
一种营业执照的文本识别方法、系统及相关组件与流程
本发明涉及图像处理
技术领域
,特别涉及一种营业执照的文本识别方法、系统、一种计算机可读存储介质及一种电子设备。
背景技术
:文本识别是一种利用计算机自动识别字符的技术,属于模式识别应用的一个重要领域。人们在生产和生活中,要处理大量的文字、报表和文本,文本识别技术可以减轻人们的劳动,提高处理效率。自动识别图像中的文字信息可以应用于多个领域,例如识别身份证、银行卡中的文字内容,进而提取关键信息。在对营业执照进行文本识别的相关技术中,通常先确定预先设置的待识别区域,再对待识别区域进行相关的文本识别操作。但是,当营业执照的样式变化时,上述相关文本识别方法就失效了。因此,如何对多种样式营业执照进行文本识别操作,提高营业执照文本识别结果的准确性是本领域技术人员目前需要解决的技术问题。技术实现要素:本申请的目的是提供一种营业执照的文本识别方法、系统、一种计算机可读存储介质及一种电子设备,能够对多种样式营业执照进行文本识别操作,提高营业执照文本识别结果的准确性。为解决上述技术问题,本申请提供一种营业执照的文本识别方法,该文本识别方法包括:获取目标营业执照的执照图像,并对所述执照图像执行文本区域划分操作,得到多个文本区域;对每一所述文本区域执行文本识别操作得到每一所述文本区域的文本内容;根据所述文本内容确定每一所述文本区域对应的信息类型;根据所述文本内容和相应的信息类型生成所述目标营业执照的文本识别结果。可选的,对所述执照图像执行文本区域划分操作,得到多个文本区域包括:确定所述执照图像中每一文本符号的位置信息;根据所述位置信息对执照图像执行文本区域划分操作,得到多个所述文本区域,以使每一所述文本区域内的所有文本符号间距均小于预设值。可选的,对每一所述文本区域执行文本识别操作包括:利用预设文字识别算法对每一所述文本区域执行文本识别操作;其中,所述预设文字识别算法包括densenet+ctc识别方法。可选的,根据所述文本内容确定每一所述文本区域对应的信息类型包括:提取所述文本内容的关键词,并根据所述关键词确定每一所述文本区域对应的信息类型。可选的,所述信息类型包括注册号、社会信用代码、名称、住所、法定代表人、有效日期中的任一项或任几项的组合。可选的,在根据所述文本内容确定每一所述文本区域对应的信息类型之后,还包括:记录每一所述文本区域的区域中心点坐标与信息类型的对应关系;根据所述对应关系生成营业执照文字识别模板。本申请还提供了一种营业执照的文本识别系统,该文本识别系统包括:区域划分模块,用于获取目标营业执照的执照图像,并对所述执照图像执行文本区域划分操作,得到多个文本区域;识别模块,用于对每一所述文本区域执行文本识别操作得到每一所述文本区域的文本内容;类型确定模块,用于根据所述文本内容确定每一所述文本区域对应的信息类型;结果生成模块,用于根据所述文本内容和相应的信息类型生成所述目标营业执照的文本识别结果。可选的,所述区域划分模块包括:位置确定单元,用于确定所述执照图像中每一文本符号的位置信息;划分单元,用于根据所述位置信息对执照图像执行文本区域划分操作,得到多个所述文本区域,以使每一所述文本区域内的所有文本符号间距均小于预设值。本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序执行时实现上述营业执照的文本识别方法执行的步骤。本申请还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现上述营业执照的文本识别方法执行的步骤。本申请提供了一种营业执照的文本识别方法,包括获取目标营业执照的执照图像,并对所述执照图像执行文本区域划分操作,得到多个文本区域;对每一所述文本区域执行文本识别操作得到每一所述文本区域的文本内容;根据所述文本内容确定每一所述文本区域对应的信息类型;根据所述文本内容和相应的信息类型生成所述目标营业执照的文本识别结果。本申请首先根据执照图像中的文本分布状况将营业执照划分为多个文本区域,由于营业执照中的文本是按照一定的规则排布的,一块文本区域所反映的文字内容属于特定的一类文字信息,如名称、类型或住所等,因此本申请根据每一文本区域中文字内容确定该区域的信息类型,进而根据每一文本区域的信息类型和文内内容生成相应的营业执照文本识别结果。本申请能够对多种样式营业执照进行文本识别操作,提高营业执照文本识别结果的准确性。本申请同时还提供了一种营业执照的文本识别系统、一种计算机可读存储介质和一种电子设备,具有上述有益效果,在此不再赘述。附图说明为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例所提供的一种营业执照的文本识别方法的流程图;图2为本申请实施例所提供的另一种营业执照的文本识别方法的流程图;图3为本申请实施例提供的企业法人营业执照示意图;图4为本申请实施例提供的文本区域划分示意图;图5为本申请实施例所提供的一种营业执照的文本识别系统的结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。下面请参见图1,图1为本申请实施例所提供的一种营业执照的文本识别方法的流程图。具体步骤可以包括:s101:获取目标营业执照的执照图像,并对所述执照图像执行文本区域划分操作,得到多个文本区域;其中,本实施例的目的在于自动提取对目标营业执照的文本信息,具体的,对目标营业执照的文本识别结果应该符合的条件为:文本内容识别准确、文本内容类型归类准确,不应存在文本内容与文本类型匹配错误的情况。在本步骤之前可以存在接收到文本识别操作的指令,根据该指令获取目标营业执照的执照图像。作为一种可行的实施方式,可以预先在本步骤之前拍摄好目标营业执照的执照图像并将执照图像存储至特定的存储空间,在执行s101时直接从存储空间获取执照图像即可。可以理解的是,营业执照中可以包括背景区域和文本区域,本实施例中对执照图像执行文本区域划分操作相当于将是否存在文本内容作为判断依据将营业执照划分为背景区域和文字区域,也就是说,不包括文本内容的区域为背景区域,包括文本内容的区域为文本区域。上述所提到的文本内容可以包括文字、符号、数字等。进一步的,营业执照中的文本内容是按照一定的格式排列的,因此在营业执照中存在特定的某些文本内容集中存在于某一区域的情况,例如:营业执照中“名称”所对应的文本内容存在于一个文本区域内,“经营范围”所对应的文本内容存在于一个文本区域内,且“名称”对应的文本区域与“经营范围”对应的文本区域的间距大于预设距离。具体的,可以利用retinanet框架进行文本检测确定执照图像中的文本区域,以便完成文本区域划分操作。确定文本区域后可以得到每一文本区域的位置信息(如顶点坐标),以便在s102中根据文本区域的位置信息对文本区域执行文本识别操作。当然,在经过s101的操作后可以将执照照片划分为背景区域和多个文本区域,具体的,文本区域可以包括注册号、社会信用代码、名称、住所、法定代表人、有效日期所对应的内容。需要说明的是,由于营业执照的格式要求,营业执照上的文本内容可以分为两类,一类是用于指示本区域内容的信息类型的“项”以及该信息类型所对应的“内容”。因此每一文本区域可以分为两个子区域,故文本区域可以指注册号项、注册号内容、社会信用代码项、社会信用代码内容、名称项、名称内容、住所项、住所内容、法定代表人项、法定代表人内容、有效日期项和有效日期内容所对应的区域。s102:对每一所述文本区域执行文本识别操作得到每一所述文本区域的文本内容;其中,本步骤建立在已经确定了执照图像中的文本区域的基础上,对每一文本区域执行文本识别操作得到文本区域内的文本内容。本实施例不限定文本识别操作的具体过程,可以根据实际应用场景选择适当的文本识别算法执行文本识别操作,例如ocr文字识别算法、densenet+ctc识别方法等。s103:根据所述文本内容确定每一所述文本区域对应的信息类型;其中,本步骤的目的在于确定文本区域的信息类型,在已经得到该文本区域中的文本内容之后,可以对文本内容进行基于关键词的语法语义分析确定信息类型。作为一种可行的实施方式,可以利用训练好的文本信息类型检测模型对文本内容进行相应的分析,得到每一文本区域的信息类型。根据前面的论述可知每一文本区域可以包括两个子区域,因此在本步骤中确定的信息类型可以是该文本区域对应的所有文本的信息类型,也可以是该文本区域所包括的每一子区域文本的信息类型的集合。例如信息类型可以包括注册号、社会信用代码、名称、住所、法定代表人、有效日期,也可以是注册号项、注册号内容、社会信用代码项、社会信用代码内容、名称项、名称内容、住所项、住所内容、法定代表人项、法定代表人内容、有效日期项和有效日期内容,本实施例不对信息类型的划分方式进行具体的限定。s104:根据所述文本内容和相应的信息类型生成所述目标营业执照的文本识别结果。其中,在得到目标营业执照的每一文本区域的文本内容和信息类型之后,可以按照文本内容和信息类型的对应关系生成相应的文本识别结果。作为一种可行的实施方式,可以按照表格的方式输出包括每一文本内容和相应的信息类型的文本识别结果。本实施例首先根据执照图像中的文本分布状况将营业执照划分为多个文本区域,由于营业执照中的文本是按照一定的规则排布的,一块文本区域所反映的文字内容属于特定的一类文字信息,如名称、类型或住所等,因此本实施例根据每一文本区域中文字内容确定该区域的信息类型,进而根据每一文本区域的信息类型和文内内容生成相应的营业执照文本识别结果。本实施例能够对多种样式营业执照进行文本识别操作,提高营业执照文本识别结果的准确性。下面请参见图2,图2为本申请实施例所提供的另一种营业执照的文本识别方法的流程图,本实施例的具体步骤可以包括:s201:获取目标营业执照的执照图像,并确定所述执照图像中每一文本符号的位置信息;其中,本步骤中提到的文本符号即文字、数字、符号的总称,不同类型的文本符号存在不同的位置信息确定方式。例如,当文本符号为汉字时,文本符号的位置信息为每一汉字的几何中心;当文本符号为英文等由字母构成的语言时,文本符号为每一单次的集合中心。本领域的技术人员还可以想到其他的文本符号的位置信息确定方式,此处不进行具体的限定。s202:根据所述位置信息对执照图像执行文本区域划分操作,得到多个所述文本区域,以使每一所述文本区域内的所有文本符号间距均小于预设值。其中,本步骤的目的在于按照位置分布信息对执照图像中文本符号进行文本区域划分,可以将文字间距小于预设值的所有文本符号间距小于预设值的所有文本符号所在的区域设置为一个文本区区域。在划分文本区域之后,得到的每一文本区域内的所有文本符号间距均小于预设值,任一两个不同文本区域内的文本符号之间的距离大于或等于该预设值。s203:利用预设文字识别算法对每一所述文本区域执行文本识别操作得到每一所述文本区域的文本内容;其中,所述预设文字识别算法可以包括densenet+ctc识别方法。s204:提取所述文本内容的关键词,并根据所述关键词确定每一所述文本区域对应的信息类型。s205:根据所述文本内容和相应的信息类型生成所述目标营业执照的文本识别结果。作为一种可行的实施方式,在根据所述文本内容确定每一所述文本区域对应的信息类型之后,还包括以下操作:记录每一所述文本区域的区域中心点坐标与信息类型的对应关系;根据所述对应关系生成营业执照文字识别模板。在生成文字识别模板之后,可以确定所有与该文字识别模板相对应的营业执照中每一位置的文本符号所代表的信息类型,以便根据区域中心点坐标确定类型的文本区域的位置,进而实现快速的文本识别。下面通过在实际应用中的实施例说明基于通用文本识别方法,比如用densenet+ctc进行文本识别。请参见图3,图3为本申请实施例提供的企业法人营业执照示意图,首先输入一张包含营业执照完整信息的图片(如图3)然后对图片进行文本检测,可以得到每一个文本区域的坐标(x1,y1,x2,y2),(x1,y1)为左上角坐标,(x2,y2)为右下角坐标。请参见图4,图4为本申请实施例提供的文本区域划分示意图。对检测到的文本区域进行文本识别,可以得到如表1所示的文字。对文本识别结果提取关键信息,比如在识别到的信息中查找“注册号”,找到注册号得到注册号文本框的坐标信息(x1,y1,x2,y2)。根据该关键信息的坐标信息,在所有的得到的文本位置进行检索,找到与该关键信息在同一横行的文本信息,比如,与注册号同一行的是一行数字:302xxxxxxxxxxx。其中,找同一行的方法可以为:通过每一个文本框的坐标可以得到每个框的中心点,看哪个中心点的纵坐标落在比如“注册号”,y1,y2之间。以此类推,就可以找到所有营业执照上的关键信息。最后对营业执照上的关键信息进行整合:得到如表2所示的对应关系并输出。本实施例从包含营业执照完整信息的图片中进行文本检测,然后进行文本识别,根据文本位置信息以及识别的结果进行匹配,得到营业执照上关键信息内容。表1文本识别结果表注册号3302xxxxxxxxxxx社会信用代码9974xxxxxxxxxxx名称xx市xxxx有限公司住所xx省xx市xxxx路121-1法定代表人李某某有效日期至2050年8月21日表2执照信息整合表注册号3302xxxxxxxxxxx社会信用代码9974xxxxxxxxxxx名称xx市xxxx有限公司住所xx省xx市xxxx路121-1法定代表人李某某有效日期至2050年8月21日请参见图5,图5为本申请实施例所提供的一种营业执照的文本识别系统的结构示意图;该系统可以包括:区域划分模块100,用于获取目标营业执照的执照图像,并对所述执照图像执行文本区域划分操作,得到多个文本区域;识别模块200,用于对每一所述文本区域执行文本识别操作得到每一所述文本区域的文本内容;类型确定模块300,用于根据所述文本内容确定每一所述文本区域对应的信息类型;结果生成模块400,用于根据所述文本内容和相应的信息类型生成所述目标营业执照的文本识别结果。本实施例首先根据执照图像中的文本分布状况将营业执照划分为多个文本区域,由于营业执照中的文本是按照一定的规则排布的,一块文本区域所反映的文字内容属于特定的一类文字信息,如名称、类型或住所等,因此本实施例根据每一文本区域中文字内容确定该区域的信息类型,进而根据每一文本区域的信息类型和文内内容生成相应的营业执照文本识别结果。本实施例能够对多种样式营业执照进行文本识别操作,提高营业执照文本识别结果的准确性。进一步的,所述区域划分模块100包括:位置确定单元,用于确定所述执照图像中每一文本符号的位置信息;划分单元,用于根据所述位置信息对执照图像执行文本区域划分操作,得到多个所述文本区域,以使每一所述文本区域内的所有文本符号间距均小于预设值。进一步的,识别模块200具体为利用预设文字识别算法对每一所述文本区域执行文本识别操作得到每一所述文本区域的文本内容的模块;其中,所述预设文字识别算法包括densenet+ctc识别算法。进一步的,类型确定模块300具体为用于提取所述文本内容的关键词,并根据所述关键词确定每一所述文本区域对应的信息类型的模块。进一步的,所述信息类型包括注册号、社会信用代码、名称、住所、法定代表人、有效日期中的任一项或任几项的组合。进一步的,还包括:记录模块,用于在根据所述文本内容确定每一所述文本区域对应的信息类型之后,记录每一所述文本区域的区域中心点坐标与信息类型的对应关系;末班生成模块,用于根据所述对应关系生成营业执照文字识别模板。由于系统部分的实施例与方法部分的实施例相互对应,因此系统部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。本申请还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。本申请还提供了一种电子设备,可以包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然所述电子设备还可以包括各种网络接口,电源等组件。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本
技术领域
的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1