信息的审核方法及装置与流程

文档序号:17147845发布日期:2019-03-19 23:08阅读:340来源:国知局
信息的审核方法及装置与流程

本发明涉及信息审核技术领域,具体而言,涉及一种信息的审核方法及装置。



背景技术:

现阶段,企业或者个人在对一些项目进行申报时,需要提供一些材料,项目发布单位需要对申报系统中的各项资料进行审核,而对各项资料进行审核的工作量相对较大,需要消耗大量的人力且审查效率低、容易出错。相关技术中是通过人工对人才和企业信息进行审核,并未存在审核系统对人才和企业信息自动进行审核的方案。

针对上述的问题,目前尚未提出有效的解决方案。



技术实现要素:

本发明实施例提供了一种信息的审核方法及装置,以至少解决相关技术中通过人力对人才和企业信息进行审核的工作量大,导致的审查效率低、出错率高的技术问题。

根据本发明实施例的一个方面,提供了一种信息的审核方法,包括:获取待审核信息,待审核信息至少包括:人才信息和/或企业信息;将待审核信息与第三方数据比对,得到比对结果;依据比对结果与标识的映射关系,对待审核信息进行标记。

可选地,依据比对结果与标识的映射关系,对待审核信息进行标记,包括:在待审核信息与第三方数据匹配的情况下,将待审核信息标记为已通过阶段;在待审核信息与第三方数据不匹配的情况下,将待审核信息标记为待复审阶段。

可选地,获取待审核信息之前,包括:获取原始图片;判断原始图片的类型,类型包括:人才信息证件和企业信息证件;采用与原始图片的类型对应的方式,对原始图片进行文字提取,得到待审核信息。

可选地,在原始图片为人才信息证件的情况下,对原始图片进行文字提取,包括:对原始图片进行图像增强;将增强后的图片与每个模板进行匹配;将匹配成功的图片输入文字分类器中,得到待审核信息。

可选地,在原始图片为企业信息证件的情况下,对原始图片进行文字提取,包括:对原始图片进行图像增强;将增强后的图片与每个模板进行匹配;对匹配成功的图片进行特征点提取,得到待审核信息。

可选地,对匹配成功的图片进行特征点提取,包括:将匹配成功的图片每个字切割为一个图片;对切割后的每个图片进行特征点提取;将提取的特征点与数据库中字图片的特征点进行匹配,得出识别文字。

可选地,在原始图片为企业信息证件的情况下,对原始图片进行文字提取之前,包括:判断原始图片是否存在二维码;如果存在二维码,根据二维码获取待审核信息。

根据本发明实施例的另一方面,还提供了一种信息的审核装置,包括:获取单元,用于获取待审核信息,待审核信息至少包括:人才信息和/或企业信息;比对单元,用于将待审核信息与第三方数据比对,得到比对结果;标记单元,用于依据比对结果与标识的映射关系,对待审核信息进行标记。

可选地,标记单元包括:标记模块,用于在待审核信息与第三方数据匹配的情况下,将待审核信息标记为已通过阶段;在待审核信息与第三方数据不匹配的情况下,将待审核信息标记为待复审阶段。

可选地,获取单元包括:第一获取模块,用于获取原始图片;第一判断模块,用于判断原始图片的类型,类型包括:人才信息证件和企业信息证件;信息获取模块,用于采用与原始图片的类型对应的方式,对原始图片进行文字提取,得到待审核信息。

可选地,信息获取模块包括:第一增强子模块,用于对原始图片进行图像增强;第一匹配子模块,用于将增强后的图片与每个模板进行匹配;第一信息获取子模块,用于将匹配成功的图片输入文字分类器中,得到待审核信息。

可选地,信息获取模块包括:第二增强子模块,用于对原始图片进行图像增强;第二匹配子模块,用于将增强后的图片与每个模板进行匹配;第二信息获取子模块,用于对匹配成功的图片进行特征点提取,得到待审核信息。

可选地,第二信息获取子模块包括:切割子模块,用于将匹配成功的图片每个字切割为一个图片;提取子模块,用于对切割后的每个图片进行特征点提取;获取子模块,用于将提取的特征点与数据库中字图片的特征点进行匹配,得出识别文字。

可选地,获取单元还包括:第二判断模块,用于判断原始图片是否存在二维码;第三获取模块,用于如果存在二维码,根据二维码获取待审核信息。

根据本发明实施例的另一个方面,提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述的自行车的助力实现方法。

根据本发明实施例的另一个方面,提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述的自行车的助力实现方法。

在本发明实施例中,采用获取待审核信息,待审核信息至少包括:人才信息和/或企业信息;将待审核信息与第三方数据比对,得到比对结果;依据比对结果与标识的映射关系,对待审核信息进行标记的方式,通过对人才和企业材料审核内容的提取并将提取到的需要审核的信息与第三方数据进行比对从而完成对人才和企业提供的材料的审核,达到了快速准确的对人才和企业信息的审核的目的,从而实现了减少人才和企业信息的审核时对人力的大量投入的技术效果,进而解决了相关技术中通过人力对人才和企业信息进行审核的工作量大,导致的审查效率低、出错率高的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是根据本发明实施例的一种信息的审核方法的流程图;

图2是根据本发明实施例的一种信息的审核装置的结构图;

图3是根据本发明实施例的一种可选的信息的审核装置的结构图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

相关技术中,企业或者个人在对一些项目进行申报时,需要提供一些材料,项目发布单位需要对申报系统中的各项资料进行审核,而对各项资料进行审核的工作量相对较大,需要消耗大量的人力且审查效率低、容易出错。

为解决上述问题,本申请实施例提供了相应的解决方案,以下详细说明。

根据本发明实施例,提供了一种信息的审核的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本发明实施例的一种信息的审核方法的流程图,如图1所示,该方法包括如下步骤:

步骤s102,获取待审核信息,待审核信息至少包括:人才信息和/或企业信息;

步骤s102中待审核信息包括但不限于:居民身份证中的姓名、性别、出生、住址、公民身份证号码、有效期限的信息、签发机关(人才信息);毕业证和学位证中的学校,姓名,毕业年限(人才信息);营业执照中的名称、类型、住所、法定代表人、注册资本、成立日期、营业期限、经营范围(企业信息)

在本申请实施例中,获取待审核信息方式如下:

可选地,获取待审核信息之前包括:获取原始图片;判断原始图片的类型,类型包括:人才信息证件和企业信息证件;采用与原始图片的类型对应的方式,对原始图片进行文字提取,得到待审核信息。其中,原始图片包括:待核查材料的扫描件、待核查材料的电子版,待核查材料包括但不限于身份证、毕业证、学位证、营业执照。人才信息证件包括:身份证、毕业证、学位证;企业信息证件包括:企业的营业执照。

采用与原始图片的类型对应的方式,对原始图片进行文字提取,得到待审核信息可以通过以下方式获取:

1)在原始图片为人才信息证件的情况下,利用拉普拉斯算子的方法对原始图片进行图像增强,将增强后的图片与每个模板进行匹配,将匹配成功的图片输入文字分类器中,得到待审核信息。其中,利用cnn(卷积神经网络模型)训练一个文字分类器(对每个汉字训练多次)。

2)原始图片为企业信息证件的情况下,对原始图片进行图像增强,将增强后的图片与每个模板进行匹配,对匹配成功的图片进行特征点提取,得到待审核信息。其中,对匹配成功的图片进行特征点提取包括:将匹配成功的图片每个字切割为一个图片并根据原位置建立索引,对切割后的每个图片进行特征点提取,将提取的特征点与数据库中字图片的特征点进行匹配,得出识别文字,进而得到待审核信息。

由于人才信息证件(例如身份证、毕业证和学位证)中的规格相同,待识别的审核信息的位置固定,所以不用对原始图片进行切割,对增强后的图片与每个模板进行匹配后,将匹配的待识别的审核信息的图片输入文字分类器中,从而得到待审核信息,而企业信息证件(例如营业执照)的规格不是统一的,待识别的审核信息的位置不固定,所以需要采用对原始图片进行切割,对文字进行逐一识别的方式,得到待审核信息。

可选地,在原始图片为企业信息证件的情况下,对原始图片进行文字提取之前,可以判断原始图片是否存在二维码,如果存在二维码,根据二维码获取待审核信息。具体地,一些营业执照上会有二维码,通过扫描二维码可以得到与执照对应的公司的全部资料信息,从而得到待审核信息。

步骤s104,将待审核信息与第三方数据比对,得到比对结果;

其中,第三方数据可以是准确的人才和企业的信息,可以来自数据库中存储的人才和企业的信息。

步骤s106,依据比对结果与标识的映射关系,对待审核信息进行标记。

可选地,依据比对结果与标识的映射关系,对待审核信息进行标记,包括:在待审核信息与第三方数据匹配的情况下,将待审核信息标记为已通过阶段;在待审核信息与第三方数据不匹配的情况下,将待审核信息标记为待复审阶段。

本申请实施例提供一种可选实施例,从而对上述方法进行说明:

首先,原始图片,也就是待审核证件,的类型进行判断,判断待审核证件是身份证、毕业证、学位证还是营业执照。

1、在原始图片为身份证时,信息的审核方法如下:

对提交的扫描的正反面的身份证图片上面的文字进行提取(标有“居民身份证”的一面为正面,标有“个人信息”的一面为反面);将提取到的身份信息与从多方接口中获取的第三方数据进行比对;对得到的比对结果进行判定,若匹配有误,则标记为待复审阶段。若匹配成功,则标记为已通过阶段。其中,对文字提取的步骤如下:

1)身份证的正面分别为中华人民共和国身份证、签发机关和有效期限为两个模板,反面以姓名、性别、出生、住址、公民身份证号码为5个模板,一共7个模板;

2)将被识别身份证扫描件记作被搜索图,利用拉普拉斯算子的方法对被搜索图进行图像增强;

3)将被搜索图与模板进行一一匹配,通过以下方式判断是否匹配成功:

其中,tk(m,n)为模板,k的值在1-7之间,表示第k个模板,sij(m,n)为被搜索图中覆盖的子图,r(i,j)为相关系数,当子图和模板完全一样时,其值为1,其对应的子图即为匹配的目标;

4)利用cnn训练一个文字分类器(对每个汉字训练多次),然后将匹配的每个目标输入此分类器中,即可分别得到姓名、性别、出生、住址、公民身份证号码、有效期限的信息,签发机关。

2、在原始图片为毕业证或者学位证时,信息的审核方法如下:若无学位证扫描信息的,直接进入待复查阶段;对毕业证和学位证分别用身份证信息核查中的文字分类器对毕业证和学位证的扫描图片进行逐行识别,分别识别学位证书类别(学士学位,硕士学位,博士学位),学校,姓名,毕业年限等待审核信息;分别对提取得到的学历信息与从多方接口中获取的第三方数据进行比对;若匹配有误,则标记为未通过,若匹配成功,则标记为已通过。

3、在原始图片为业证和学位证时,信息的审核方法如下:首先,对营业执照进行整体扫描,找寻营业执照上的二维码(全国新版的营业执照从2014年3月开始都加印了“二维码”);若有二维码,则扫码进入将会显示公司的全部资料信息,并直接提取关于企业的信息;若无二维码,则对营业执照的扫描图进行文字提取;将上述过程中得到的企业信息与从多方接口中获取的第三方数据进行比对,若匹配有误,则标记为未通过;若匹配成功,则标记为已通过。其中,对文字提取的步骤如下:

1)使用retinex算法对图像进行增强;

2)采用与身份证文字提取中相同的方法(此处不再赘述)对其进行模板匹配,得到匹配的目标;

3)对匹配的目标图片进行切割,将每个字切割成为一个图片,并根据原位置建立索引;

4)用尺度不变特征变换算法对每个字组成的图片进行特征点的提取;

5)用尺度不变特征变换算法对数据库中的字组成的图片进行特征点的提取;

6)对4)和5)中提取的特征点进行匹配,得出识别的文字,进而得到公司的相关的待审核信息(名称、类型、住所、法定代表人、注册资本、成立日期、营业期限、经营范围)。

通过上述步骤,对人才和企业的信息自动审核可以减少人力、物力,降低审核成本,减少审核时间内,为项目的申报提供更多的便利,达到了快速准确的对人才和企业信息的审核的目的,从而实现了减少人才和企业信息的审核时对人力的大量投入的技术效果,进而解决了相关技术中通过人力对人才和企业信息进行审核的工作量大,导致的审查效率低、出错率高的技术问题。

根据本发明实施例,提供了一种信息的审核的产品实施例,图2是根据本发明实施例的一种信息的审核装置的结构图,如图2所示,该装置包括:

获取单元20,用于获取待审核信息,待审核信息至少包括:人才信息和/或企业信息;

比对单元22,用于将待审核信息与第三方数据比对,得到比对结果;

标记单元24,用于依据比对结果与标识的映射关系,对待审核信息进行标记。

可选地,标记单元24包括:标记模块240,用于在待审核信息与第三方数据匹配的情况下,将待审核信息标记为已通过阶段;在待审核信息与第三方数据不匹配的情况下,将待审核信息标记为待复审阶段。

在本申请实施例中,图3是根据本发明实施例的一种可选的信息的审核装置的结构图,如图3所示。

可选地,获取单元20包括:

第一获取模块201,用于获取原始图片;

第一判断模块203,用于判断原始图片的类型,类型包括:人才信息证件和企业信息证件;

信息获取模块205,用于采用与原始图片的类型对应的方式,对原始图片进行文字提取,得到待审核信息。

可选地,信息获取模块205包括:

第一增强子模块215,用于对原始图片进行图像增强;

第一匹配子模块225,用于将增强后的图片与每个模板进行匹配;

第一信息获取子模块235,用于将匹配成功的图片输入文字分类器中,得到待审核信息。

可选地,信息获取模块205包括:

第二增强子模块245,用于对原始图片进行图像增强;

第二匹配子模块255,用于将增强后的图片与每个模板进行匹配;

第二信息获取子模块265,用于对匹配成功的图片进行特征点提取,得到待审核信息。

可选地,第二信息获取子模块265包括:

切割子模块266,用于将匹配成功的图片每个字切割为一个图片;

提取子模块267,用于对切割后的每个图片进行特征点提取;

获取子模块268,用于将提取的特征点与数据库中字图片的特征点进行匹配,得出识别文字。

可选地,获取单元20还包括:

第二判断模块207,用于判断原始图片是否存在二维码;

第二获取模块209,用于如果存在二维码,根据二维码获取待审核信息。

此处需要说明的是,上述获取单元20、比对单元22、标记单元24对应于上述实施例中的步骤s102至步骤s106,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以在诸如一组计算机可执行指令的计算机系统中执行。

需要说明的是,图2至图3所示实施例的优选实施方式,可以参见图1的相关描述,此处不再赘述。

本申请实施例还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述的信息的审核方法。

本申请实施例还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述的信息的审核方法。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1