网络爬虫在户籍管理上的应用方法

文档序号:9631538阅读:274来源:国知局
网络爬虫在户籍管理上的应用方法
【技术领域】
[0001]本发明涉及网络爬虫技术领域,具体为一种网络爬虫在户籍管理上的应用方法。
【背景技术】
[0002]网络爬虫是一个自动提取网页的程序,它为搜索引擎从万维网上下载网页,是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。网络爬虫是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁,自动索引,模拟程序或者蠕虫。网络爬虫技术可以迅速准确的从互联网中获取目的信息,互联在对户籍管理的过程中常需要对巨大的户籍信息数据库对其中的一个信息点进行搜索,传统的搜索方法不仅速度缓慢,收索的信息的尊确性也较低,而网络爬虫的特性恰好可以很好的解决这个问题,为此,我们提出一种网络爬虫在户籍管理上的应用方法。

【发明内容】

[0003]一种网络爬虫在户籍管理上的应用方法,具体步骤如下所示:
[0004]第一步,输入户籍信信息的关键词。
[0005]第二步,服务器收索户籍信息的URL。
[0006]第三步,服务器抓取户籍信息的网页内容。
[0007]第四步,再次输入户籍信息的关键词进行二次过滤。
[0008]优选的,所述关键词可为姓名、年龄、性别,家庭住址等,可以输入其中的一个,也可以输入多个收索关键词。
[〇〇〇9]优选的,所述收索户籍信息的URL初始网页信息,将不会有信息窗口显示该信息。
[〇〇1〇]优选的,所述再次输入户籍信息的的关键词进行二次过滤前,会弹出关键词输入的即时窗口。
[〇〇11]与现有技术相比,本发明的有益效果是:该网络爬虫在户籍管理上的应用方法在采用网络爬虫自动收索网页的基础上对网页再次过滤,户籍信息库的信息量很大,对我们而言如果想要需找目标户籍信息,需要耗费很大的人力,但也不一定能够找出准确的户籍信息,该方法细化了收索的户籍信息,为我们获取目标户籍信息提供了方便有效的方法。
【附图说明】
[0012]图1为本发明的流程图。
【具体实施方式】
[0013]一种网络爬虫在户籍管理上的应用方法,具体步骤如下所示:
[0014]第一步,输入户籍信信息的关键词,所述关键词可为姓名、年龄、性别,家庭住址等,可以输入其中的一个,也可以输入多个收索关键词。
[0015]第二步,服务器收索户籍信息的URL,所述收索户籍信息的URL初始网页信息,将不会有信息窗口显示该信息。
[0016]第三步,服务器抓取户籍信息的网页内容。
[0017]第四步,再次输入户籍信息的关键词进行二次过滤,所述再次输入户籍信息的的关键词进行二次过滤前,会弹出关键词输入的即时窗口。
[0018]第五步,获取户籍信息,所述获取户籍信息设有快速导出导出点。
[0019]本网络爬虫在户籍管理上的应用方法,只是其中的一个实施例,对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
【主权项】
1.一种网络爬虫在户籍管理上的应用方法,具体步骤如下所示: 第一步,输入户籍信信息的关键词。 第二步,服务器收索户籍信息的URL。 第三步,服务器抓取户籍信息的网页内容。 第四步,再次输入户籍信息的关键词进行二次过滤。2.根据权利要求1所述的一种网络爬虫在户籍管理上的应用方法,其特征在于:所述关键词可为姓名、年龄、性别,家庭住址等,可以输入其中的一个,也可以输入多个收索关键 ο3.根据权利要求1所述的一种网络爬虫在户籍管理上的应用方法,其特征在于:所述收索户籍信息的URL初始网页信息,将不会有信息窗口显示该信息。4.根据权利要求1所述的一种网络爬虫在户籍管理上的应用方法,其特征在于:所述再次输入户籍信息的的关键词进行二次过滤前,会弹出关键词输入的即时窗口。
【专利摘要】本发明公开了一种网络爬虫在户籍管理上的应用方法,具体步骤如下所示:第一步,输入户籍信信息的关键词;第二步,服务器收索户籍信息的URL;第三步,服务器抓取户籍信息的网页内容,第四步,再次输入户籍信息的关键词进行二次过滤。该网络爬虫在户籍管理上的应用方法在采用网络爬虫自动收索网页的基础上对网页再次过滤,户籍信息库的信息量很大,对我们而言如果想要需找目标户籍信息,需要耗费很大的人力,但也不一定能够造出准确的户籍信息,该方法细化了收索的户籍信息,为我们获取目标户籍信息提供了方便有效的方法。
【IPC分类】G06Q50/26, G06F17/30
【公开号】CN105389310
【申请号】CN201410446240
【发明人】姚王平
【申请人】上海尧博信息科技有限公司
【公开日】2016年3月9日
【申请日】2014年9月3日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1