一种互联网人物搜索信息整合分析方法

文档序号:6490218阅读:760来源:国知局
一种互联网人物搜索信息整合分析方法
【专利摘要】本发明公开了一种互联网人物搜索信息整合分析方法,该分析方法主要描述了完整的互联网人物搜索信息整合思路及步骤。通过原始的信息在互联网中查找相关的网页,并对网页进行人物身份信息和帐号信息的二次提取。再与原始信息进行关联进行迭代查找,最后到有相应真实身份信息的网站中提取进一步的身份轨迹,本方法能够极大的提高身份信息收集的效率,并防止人工搜索的疏漏。对情报工作的收集带来便利。
【专利说明】一种互联网人物搜索信息整合分析方法
【技术领域】
[0001]本发明涉及互联网【技术领域】,特别是一种互联网人物搜索信息整合分析方法。
【背景技术】
[0002]互联网的信息蓬勃发展也带来了与传统媒体的不同之处,传统媒体通常由于其专业性,文章以及新闻的发布带有系统以及知识的全部性和完备性。而互联网的信息通常是零散的,分布的,需要进行多次关联整合。
[0003]本分析方法主要针对信息的整合尤其是互联网人物信息的整合,有利于改善目前分散的人物信息状况。有利的改善用户体验,提高人物信息的查询效率。

【发明内容】

[0004]本发明的目的是解决上问题,提供一种分析方法,使得通过有限的人物原始输入信息,搜索整合互联网的零散人物信息为完整的身份及轨迹信息。提高人物情报工作的效率,并为系统的研发提供有利依据。
[0005]为达到上述目的,本发明所采用的技术方案是:一种互联网人物搜索信息整合分析方法,该分析方法主要描述了完整的互联网人物搜索信息整合思路及步骤。通过原始的信息在互联网中查找相关的网页,并对网页进行人物身份信息和帐号信息的二次提取。再与原始信息进行关联进行迭代查找,最后到有相应真实身份信息的网站中提取进一步的身份轨迹。
[0006]原始的信息是提供输入界面给用户输入不完整的身份信息。
[0007]在互联网中查找相关的网页为系统根据当前身份信息在搜索引擎中进行检索,获取到原始的网页信息集合;系统遍历网页信息集合,对每篇网页进行邮箱、即时通讯、身份证、手机、电话等基本身份信息及帐号信息进行提取。
[0008]二次提取为提取方式可采用正则表达式或者其它方式。并对每个提取出来的信息记录下在网页中的位置。
[0009]方法对出现邻近的身份信息进行关联。并记录出现次数以及上下文做为备注。
[0010]方法将所有身份信息展示在界面上,提示给用户进行标注。有效信息则标注为有效,并跟原始信息进行关联,保存相应的分析结果以备下次跟踪分析。
[0011]本方法能够极大的提高身份信息收集的效率,并防止人工搜索的疏漏。对情报工作的收集带来便利。
【具体实施方式】:
[0012]为使本发明的技术方案便于理解,以下结合【具体实施方式】对本发明作进一步的说明。
[0013]实施例:一种互联网人物搜索信息整合分析方法,该分析方法主要描述了完整的互联网人物搜索信息整合思路及步骤。通过原始的信息在互联网中查找相关的网页,并对网页进行人物身份信息和帐号信息的二次提取。再与原始信息进行关联进行迭代查找,最后到有相应真实身份信息的网站中提取进一步的身份轨迹。
[0014]原始的信息是提供输入界面给用户输入不完整的身份信息。
[0015]在互联网中查找相关的网页为系统根据当前身份信息在搜索引擎中进行检索,获取到原始的网页信息集合;系统遍历网页信息集合,对每篇网页进行邮箱、即时通讯、身份证、手机、电话等基本身份信息及帐号信息进行提取。
[0016]二次提取为提取方式可采用正则表达式或者其它方式。并对每个提取出来的信息记录下在网页中的位置。
[0017]方法对出现邻近的身份信息进行关联。并记录出现次数以及上下文做为备注。
[0018]方法将所有身份信息展示在界面上,提示给用户进行标注。有效信息则标注为有效,并跟原始信息进行关联,保存相应的分析结果以备下次跟踪分析。
[0019]本方法能够极大的提高身份信息收集的效率,并防止人工搜索的疏漏。对情报工作的收集带来便利。
[0020]以上所述,仅为本发明的较佳实施例,并非对本发明作任何形式上和实质上的限制,凡熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用以上所揭示的技术内容,而作出的些许更动、修饰与演变的等同变化,均为本发明的等效实施例;同时,凡依据本发明的实质技术对以上实施例所作的任何等同变化的更动、修饰与演变,均仍属于本发明的技术方案的范围内。
【权利要求】
1.一种互联网人物搜索信息整合分析方法,其特征在于:该分析方法主要描述了完整的互联网人物搜索信息整合思路及步骤。通过原始的信息在互联网中查找相关的网页,并对网页进行人物身份信息和帐号信息的二次提取。再与原始信息进行关联进行迭代查找,最后到有相应真实身份信息的网站中提取进一步的身份轨迹。
2.根据权利要求1所述的互联网人物搜索信息整合分析方法,其特征在于:所述原始的信息是提供输入界面给用户输入不完整的身份信息。
3.根据权利要求1所述的互联网人物搜索信息整合分析方法,其特征在于:所述在互联网中查找相关的网页为系统根据当前身份信息在搜索引擎中进行检索,获取到原始的网页信息集合;系统遍历网页信息集合,对每篇网页进行邮箱、即时通讯、身份证、手机、电话等基本身份信息及帐号信息进行提取。
4.根据权利要求1所述的互联网人物搜索信息整合分析方法,其特征在于:所述二次提取为提取方式可采用正则表达式或者其它方式。并对每个提取出来的信息记录下在网页中的位置。
5.根据权利要求1所述的互联网人物搜索信息整合分析方法,其特征在于:所述的方法对出现邻近的身份信息进行关联。并记录出现次数以及上下文做为备注
6.根据权利要求5所述的互联网人物搜索信息整合分析方法,其特征在于:所述的方法将所有身份信息展示在界面上,提示给用户进行标注。有效信息则标注为有效,并跟原始信息进行关联,保存相应的分析结果以备下次跟踪分析。
【文档编号】G06F17/30GK103778162SQ201210414936
【公开日】2014年5月7日 申请日期:2012年10月26日 优先权日:2012年10月26日
【发明者】李旭日 申请人:广州市邦富软件有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1