本发明涉及信息采集、分析和存储领域,特别涉及一种利用网络爬虫自动更新的数据库系统和自动更新方法。
背景技术:
本申请的申请人在授权公告号为cn101136909b的发明专利文件(申请号为cn200610113602.3)中公开了一种利用通信网络核查用户真实身份的方法及系统,其中的方法包括以下步骤:1)核查系统将被核查人的一项或多项唯一特征信息与身份数据库中的真实身份信息相关联;2)核查人通过通信网络向核查系统提交被核查人的某一项唯一特征信息,同时提交想要核查的具体项目;3)核查系统收到核查人提交的核查具体项目后,通过通信网络向被核查人申请核查授权;4)被核查人响应所述申请,授权核查人允许经由核查系统核查的项目;5)核查系统根据被核查人的授权项目从核查系统中的身份信息数据库调用经验证后的数据,然后展示给核查人。上述方法用于在保证用户隐私的情况下,快速、方便地核查用户的真实身份。
然而,在实际生活中还存在核查人不知道上述人为设置的唯一特征信息而仅仅知道被核查人的某些生物特征信息(比如,人脸信息、手写签名信息)的情况。
因此,有必要提供一种能够自动更新包含被核查人的某些生物特征信息的第三方数据库和对该第三方数据库进行自动更新的方法,从而使结合该第三方数据库进行核查能够进一步保证核查结果的准确性。
技术实现要素:
至少为了部分解决上面提到的技术问题,本发明提出了以下技术方案。
根据本发明的第一个方面,提出了一种利用网络爬虫自动更新的数据库系统,包括:
用户身份证信息数据库,用于存储和查询用户身份证的信息;
公安部服务器,其与用户身份证信息数据库和互联网相连接,用于互联网客户通过该公安部服务器对用户身份证信息数据库进行查询;
用户生物特征信息自动更新数据库,用于存储、查询和更新用户生物特征信息;
自动更新数据库查询服务器,其与用户生物特征信息自动更新数据库和互联网相连接,用于互联网客户通过该自动更新数据库查询服务器对用户生物特征信息自动更新数据库进行查询;
自动更新数据库更新服务器,其与用户生物特征信息自动更新数据库和互联网相连接,用于自动查询和获取来自用户身份证信息数据库的指定用户的身份证信息查询结果、使用网络爬虫通过互联网采集与指定用户的身份证信息查询结果相关的备选用户生物特征信息,针对备选用户生物特征信息进行识别,并且将备选用户生物特征信息中被识别为对应于指定用户的身份证信息查询结果的选定用户生物特征信息存储到用户生物特征信息自动更新数据库中,用于互联网客户通过自动更新数据库查询服务器对用户生物特征信息自动更新数据库进行后续查询。
根据本发明的数据库系统,其中的自动更新数据库更新服务器包括:
用户身份证信息获取模块,用于自动查询和获取来自用户身份证信息数据库的指定用户的身份证信息查询结果并输出该指定用户的标识和该信息查询结果;
网络爬虫模块,其与用户身份证信息获取模块相连接,用于使用网络爬虫通过互联网采集与指定用户的身份证信息查询结果相关的备选用户生物特征信息并输出该备选用户生物特征信息;
生物特征信息识别模块,其与网络爬虫模块和用户身份证信息获取模块相连接,用于针对备选用户生物特征信息进行识别,并且将备选用户生物特征信息中被识别为对应于指定用户的标识的指定用户的身份证信息查询结果的选定用户生物特征信息存储到用户生物特征信息自动更新数据库中,用于互联网客户通过自动更新数据库查询服务器对用户生物特征信息自动更新数据库进行后续查询。
根据本发明的数据库系统,其中的自动更新数据库更新服务器还包括:
用户指定模块,其与用户身份证信息获取模块相连接,用于指定用户并将所指定的用户的标识输出给用户身份证信息获取模块以标识指定用户。
根据本发明的数据库系统,其中,用户的身份证信息包括用户的身份证号和身份证照片,备选用户生物特征信息包括来源于互联网的用户照片。
根据本发明的利用网络爬虫的数据库自动更新方法,由上文所述的数据库系统使用,所述方法包括以下步骤:
通过用户身份证信息数据库存储和查询用户身份证的信息;
互联网客户通过公安部服务器对用户身份证信息数据库进行查询;
通过用户生物特征信息自动更新数据库存储、查询和更新用户生物特征信息;
互联网客户通过自动更新数据库查询服务器对用户生物特征信息自动更新数据库进行查询;
通过自动更新数据库更新服务器自动查询和获取来自用户身份证信息数据库的指定用户的身份证信息查询结果、使用网络爬虫通过互联网采集与指定用户的身份证信息查询结果相关的备选用户生物特征信息,针对备选用户生物特征信息进行识别,并且将备选用户生物特征信息中被识别为对应于指定用户的身份证信息查询结果的选定用户生物特征信息存储到用户生物特征信息自动更新数据库中,用于互联网客户通过自动更新数据库查询服务器对用户生物特征信息自动更新数据库进行后续查询。
根据本发明的数据库自动更新方法,其中,使用该方法的系统中的自动更新数据库更新服务器还包括用户身份证信息获取模块、网络爬虫模块和生物特征信息识别模块,该方法还包括以下步骤:
用户身份证信息获取模块自动查询和获取来自用户身份证信息数据库的指定用户的身份证信息查询结果并输出该指定用户的标识和该信息查询结果;
网络爬虫模块使用网络爬虫通过互联网采集与指定用户的身份证信息查询结果相关的备选用户生物特征信息并输出该备选用户生物特征信息;
生物特征信息识别模块针对备选用户生物特征信息进行识别,并且将备选用户生物特征信息中被识别为对应于指定用户的标识的指定用户的身份证信息查询结果的选定用户生物特征信息存储到用户生物特征信息自动更新数据库中,用于互联网客户通过自动更新数据库查询服务器对用户生物特征信息自动更新数据库进行后续查询。
根据本发明的数据库自动更新方法,其中,使用该方法的系统中的自动更新数据库更新服务器还包括用户指定模块,该方法还包括以下步骤:
通过用户指定模块指定用户并将所指定的用户的标识输出给用户身份证信息获取模块以标识指定用户。
根据本发明的数据库自动更新方法,其特征在于,用户的身份证信息包括用户的身份证号和身份证照片,备选用户生物特征信息包括来源于互联网的用户照片。
本发明所公开的上述系统和方法引入了对包含诸如用户的最新面部特征的照片的用户生物特征信息自动更新数据库的查询,通过查询结果对待核查人员进行验证,能够进一步保证核查结果的准确性。
附图说明
通过阅读下文具体实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出具体实施方式的目的,而并不能被认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是利用网络爬虫自动更新的数据库系统的示意图。
图2是利用网络爬虫自动更新的数据库系统中的自动更新数据库更新服务器的示意框图。
图3是由图1所示的数据库系统所使用的利用网络爬虫的数据库自动更新方法的流程图。
图4是图2所示的自动更新数据库更新服务器所使用的利用网络爬虫的数据库自动更新方法中的部分步骤的流程图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施方式。虽然附图中显示了本发明的示例性实施方式,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
图1是利用网络爬虫自动更新的数据库系统的示意图。
如图1所示,根据本发明的利用网络爬虫自动更新的数据库系统,包括用户身份证信息数据库、公安部服务器、用户生物特征信息自动更新数据库、自动更新数据库查询服务器和自动更新数据库更新服务器。
图1中的用户身份证信息数据库用于存储和查询用户身份证的信息。
图1中的公安部服务器,其与用户身份证信息数据库和互联网相连接,用于互联网客户通过该公安部服务器对用户身份证信息数据库进行查询。
图1中的用户生物特征信息自动更新数据库,用于存储、查询和更新用户生物特征信息。
图1中的自动更新数据库查询服务器,其与用户生物特征信息自动更新数据库和互联网相连接,用于互联网客户通过该自动更新数据库查询服务器对用户生物特征信息自动更新数据库进行查询。
图1中的自动更新数据库更新服务器,其与用户生物特征信息自动更新数据库和互联网相连接,用于自动查询和获取来自用户身份证信息数据库的指定用户的身份证信息查询结果(指定用户的身份证号和指定用户的身份证照片)、使用网络爬虫通过互联网采集与指定用户的身份证信息查询结果相关的备选用户生物特征信息(例如,来源于网络、不同于指定用户的身份证照片的指定用户的其它备选照片,这些备选照片更准确地反映了该用户当前的面部特征),针对备选用户生物特征信息(指定用户的其它备选照片)进行识别,并且将备选用户生物特征信息中被识别为对应于指定用户的身份证信息查询结果的选定用户生物特征信息(例如,将与指定用户的身份证照片中的面部特征匹配的指定用户的其它备选照片作为选定照片;将来自诸如企业信息网、政府公开网、实名认证微博、微信等经过验证的网络的关于该指定用户的其它备选照片作为选定照片;将来自网络且与该指定用户的认证手机号或认证邮箱关联的其它备选照片作为选定照片)存储到用户生物特征信息自动更新数据库中,用于互联网客户通过自动更新数据库查询服务器对用户生物特征信息自动更新数据库进行后续查询。
图2是利用网络爬虫自动更新的数据库系统中的自动更新数据库更新服务器的示意框图。
如图2所示,自动更新数据库更新服务器包括用户身份证信息获取模块、网络爬虫模块和生物特征信息识别模块。
图2中的用户身份证信息获取模块用于自动查询和获取来自用户身份证信息数据库的指定用户的身份证信息查询结果并输出该指定用户的标识和该信息查询结果。可选择地,用户的标识可以是用户的身份证号,也可以是能够唯一区分用户的其它唯一标识符(例如,企业编号+员工编号)。
图2中的网络爬虫模块,其与用户身份证信息获取模块相连接,用于使用网络爬虫通过互联网采集与指定用户的身份证信息查询结果相关的备选用户生物特征信息并输出该备选用户生物特征信息。
图2中的生物特征信息识别模块,其与网络爬虫模块和用户身份证信息获取模块相连接,用于针对备选用户生物特征信息进行识别,并且将备选用户生物特征信息中被识别为对应于指定用户的标识的指定用户的身份证信息查询结果的选定用户生物特征信息存储到用户生物特征信息自动更新数据库中,用于互联网客户通过自动更新数据库查询服务器对用户生物特征信息自动更新数据库进行后续查询。
如图2所示,自动更新数据库更新服务器还可选择地包括:在图2中由虚线框表示的用户指定模块,其与用户身份证信息获取模块相连接,用于指定用户并将所指定的用户的标识输出给用户身份证信息获取模块以标识指定用户。
需要了解的是,如图2和图3所示的数据库系统中所使用的用户的身份证信息包括用户的身份证号和身份证照片,备选用户生物特征信息包括来源于互联网的用户照片。
图3是由图1所示的数据库系统所使用的利用网络爬虫的数据库自动更新方法的流程图。
如图3所示,所提出的利用网络爬虫的数据库自动更新方法包括以下步骤:
s302:通过用户身份证信息数据库存储和查询用户身份证的信息。
s304:互联网客户通过公安部服务器对用户身份证信息数据库进行查询。
s306:通过用户生物特征信息自动更新数据库存储、查询和更新用户生物特征信息。
s308:互联网客户通过自动更新数据库查询服务器对用户生物特征信息自动更新数据库进行查询。
s310:通过自动更新数据库更新服务器自动查询和获取来自用户身份证信息数据库的指定用户的身份证信息查询结果、使用网络爬虫通过互联网采集与指定用户的身份证信息查询结果相关的备选用户生物特征信息,针对备选用户生物特征信息进行识别,并且将备选用户生物特征信息中被识别为对应于指定用户的身份证信息查询结果的选定用户生物特征信息存储到用户生物特征信息自动更新数据库中,用于互联网客户通过自动更新数据库查询服务器对用户生物特征信息自动更新数据库进行后续查询。
例如,通过自动更新数据库更新服务器自动查询和获取来自用户身份证信息数据库的指定用户的身份证信息查询结果(指定用户的身份证号和指定用户的身份证照片)、使用网络爬虫通过互联网采集与指定用户的身份证信息查询结果相关的备选用户生物特征信息(例如,来源于网络、不同于指定用户的身份证照片的指定用户的其它备选照片,这些备选照片更准确地反映了该用户当前的面部特征),针对备选用户生物特征信息(指定用户的其它备选照片)进行识别,并且将备选用户生物特征信息中被识别为对应于指定用户的身份证信息查询结果的选定用户生物特征信息(例如,将与指定用户的身份证照片中的面部特征匹配的指定用户的其它备选照片作为选定照片;将来自诸如企业信息网、政府公开网、实名认证微博、微信等经过验证的网络的关于该指定用户的其它备选照片作为选定照片;将来自网络且与该指定用户的认证手机号或认证邮箱关联的其它备选照片作为选定照片)存储到用户生物特征信息自动更新数据库中,用于互联网客户通过自动更新数据库查询服务器对用户生物特征信息自动更新数据库进行后续查询。
图4是图2所示的自动更新数据库更新服务器所使用的利用网络爬虫的数据库自动更新方法中的部分步骤的流程图。
如图4所示,图2所示的自动更新数据库更新服务器所使用的数据库自动更新方法中的部分步骤包括:
s402:用户身份证信息获取模块自动查询和获取来自用户身份证信息数据库的指定用户的身份证信息查询结果并输出该指定用户的标识和该信息查询结果。
可选择地,用户的标识可以是用户的身份证号,也可以是能够唯一区分用户的其它唯一标识符(例如,企业编号+员工编号)。
s404:网络爬虫模块使用网络爬虫通过互联网采集与指定用户的身份证信息查询结果相关的备选用户生物特征信息并输出该备选用户生物特征信息。
s406:生物特征信息识别模块针对备选用户生物特征信息进行识别,并且将备选用户生物特征信息中被识别为对应于指定用户的标识的指定用户的身份证信息查询结果的选定用户生物特征信息存储到用户生物特征信息自动更新数据库中,用于互联网客户通过自动更新数据库查询服务器对用户生物特征信息自动更新数据库进行后续查询。
当图2所示的自动更新数据库更新服务器还包括用户指定模块时,该数据库自动更新方法中的部分步骤还包括:
可选步骤s408:通过用户指定模块指定用户并将所指定的用户的标识输出给用户身份证信息获取模块以标识指定用户。
需要了解的是,如图3和图4所示的数据库自动更新方法,其中所使用的用户的身份证信息包括用户的身份证号和身份证照片,备选用户生物特征信息包括来源于互联网的用户照片。
本发明所公开的上述系统和方法引入了对包含诸如用户的最新面部特征的照片的用户生物特征信息自动更新数据库的查询,通过查询结果对待核查人员进行验证,能够进一步保证核查结果的准确性。
可选择地,在验证了针对指定用户进行查询所得到的结果与指定用户一致以后,还可以采集用户的面部图像,并将采集到的用户的面部图像存储到用户生物特征信息自动更新数据库中。从而使现场信息核查与后台数据库数据的更新实现一体化。
以上所述,仅为本发明示例性的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。