一种二次优化搜素结果的处理器的制造方法

文档序号:6512510阅读:126来源:国知局
一种二次优化搜素结果的处理器的制造方法
【专利摘要】本发明公开了一种二次优化搜素结果的处理器,目的在于结合各大搜索引擎的优点,最终筛选出最为符合用户的结果。包括抽取搜索记录、根据不同引擎分配不同权重和再次进行匹配三个步骤。
【专利说明】一种二次优化搜素结果的处理器
【技术领域】
[0001]本发明涉及智能搜索领域,更具体的讲是一种按照自己的策略,结合各大搜索引擎的优点,最终筛选出最为符合用户要求的结果搜索处理器。
[0002]
【背景技术】
[0003]1990年以前,没有任何人能搜索互联网。所有搜索引擎的祖先,是1990年由Montreal 的 McGill University 学生 Alan Emtage, Peter Deutsch.BillWheelan 发明的Archie (Archie FAQ)。一个可以用文件名查找文件的系统,于是便有了 Archie.Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。1993年,互联网上出现了最早的Web浏览器Mosaic,次年Netscape推出了 Navigator。浏览器的发展促使Web得到迅速推广,站点数目以惊人的速度增加。随着互联网的迅猛发展,信息按几何式增长,搜索引擎开始快速发展起来。
[0004]1994年7月,世界上出现了最早的真正意义上的搜索引擎——Lycos0除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量。
[0005]1995年12月,Altavista永远改变了搜索引擎的定义。AltaVista是第一个支持自然语言搜索的搜索引擎,AltaVista是第一个实现高级搜索语法的搜索引擎(如AND, OR, NOT等)。用户可以用Altavista搜索Newsgroups新闻组)的内容并从互联网上获得文章,还可以搜索图片名称中的文字、搜索Titles、搜索Javaapplets、搜索ActiveXobjects.许多关于网络爬虫的论文都在第一届和第二届World Wide Web conferences被发表。
[0006]自1998年开始,出现了一个搜索引擎空前繁荣的时期。随着Google的出现,第二代搜索引擎诞生。它们不仅拓展了搜索引擎的生存空间,而且还极大的提高了搜索的质量和效率。除Google外,Yahoo!在2004年也推出了自己的第二代搜索引擎——“一搜”(Yiso)0在国内,百度逐渐取代新浪、搜狐,成为中文第二代搜索引擎的老大。第二代搜索引擎中最具代表性、最成功的还是Google。
[0007]2006年4月18日,中国搜索发布了客户端搜索软件IG (Internet Gateway),而IG是网络猪的升级产品。另外,2004年8月,搜狐CEO张朝阳也提出了第三代互动搜索概念。2005年9月,美国政府提出开始研制第三代搜索引擎。2005年10月,微软公布了该公司做第三代搜索引擎的构想。
[0008]搜索引擎(Search Engines)是指在WWW中能够主动搜索信息、组织信息并能提供查询服务的一种信息服务系统。搜索引擎主要通过网络搜索软件或网站登录方式将WWW上大量网站的页面信息收集到本地,经过加工处理后建成数据库,从而能够对用户提出的各种查询请求作出响应,提供用户所需要的信息地址。搜索引擎提供的导航服务已经成为互联网上非常重要的网络服务,因此搜索引擎也被称为“网络门户”。随着互联网的迅猛发展,网络正深刻地改变着我们的生活,在网络发展如此之快的今天,如何在互联网上以最快的速度获得更多、更准、更有价值的信息,是人们最为关心的问题。然而,网上的信息迅速膨胀,在浩如烟海的网络信息中要查找自己所需要的信息资源极为困难,本发明针对如今面临的搜索结果不令人满意,提出了自己的策略,结合各大搜索引擎的优点,最终筛选出最为符合用户的结果。
[0009]

【发明内容】

[0010]本发明公开了一种二次优化搜素结果的处理器,目的在于结合各大搜索引擎的优点,最终筛选出最为符合用户的结果。
[0011]本发明是采取以下技术方案实现的:一种二次优化搜素结果的处理器,包括抽取搜索记录、根据不同引擎分配不同权重和再次进行匹配三个步骤。
[0012]本发明的实现还包括以下的技术方案:
1.取各个搜索引擎的前100条记录(根据各大搜索引擎统计,前100条记录符合用户搜索意愿的可能性最大,超出100条之后,大多为一些带有广告推广的虚假信息)。
[0013]2.将这些记录求同存异,并且相同的只保留一条记录。将各个引擎搜索结果根据加权平均的形式再次排序,如谷歌引擎可信度高,可将谷歌引擎搜出的结果赋予较高权重,其他则根据情况赋予不同的权重。
[0014]3.然后再次利用客户输入的关键词再次进行匹配,再次过滤出一些伪信息。
[0015]4.最后分类返回结果。
[0016]本发明的优点和有益效果具体体现在以下几个方面:
1.本发明结合全球各大搜素引擎进行搜索,而不是使用单一搜索引擎搜取得结果。
[0017]2.本发明利用了各大搜素引擎的搜素优质结果,各引擎的前100条记录(可以根据实际情况,分配合理权重,更加灵活的来利用各大引擎的搜素结果数)。
[0018]3.将各大搜索引擎的搜索结果进行二次匹配,使最终的排序更加合理,更符合用户的需求。
【专利附图】

【附图说明】
[0019]图1是本发明的实现流程图。
【具体实施方式】
[0020]以下结合说明书附图1对本发明的实施做进一步详述:
一种二次优化搜素结果的处理器,包括抽取搜索记录、根据不同引擎分配不同权重和再次进行匹配三个步骤。
[0021]1.取各个搜索引擎的前100条记录(根据各大搜索引擎统计,前100条记录符合用户搜索意愿的可能性最大,超出100条之后,大多为一些带有广告推广的虚假信息)。
[0022]2.将这些记录求同存异,并且相同的只保留一条记录。将各个引擎搜索结果根据加权平均的形式再次排序,如谷歌引擎可信度高,可将谷歌引擎搜出的结果赋予较高权重,其他则根据情况赋予不同的权重。[0023]3.然后再次利用客户输入的关键词再次进行匹配,再次过滤出一些伪信息。
[0024]4.最后分类返回结果。
[0025]利用本发明所述的技术方案,或本领域的技术人员在本发明技术方案的启发下,设计出类似的技术方案,而达到上述技术效果的,均是落入本发明的保护范围。
【权利要求】
1.一种二次优化搜素结果的处理器,其特征在于:包括抽取搜索记录、根据不同引擎分配不同权重和再次进行匹配三个步骤。
2.根据权利要求1所述的一种二次优化搜素结果的处理器,其特征在于:所述据不同引擎分配不同权重步骤可按照可信度情况赋予权重。
【文档编号】G06F17/30GK103886000SQ201310432809
【公开日】2014年6月25日 申请日期:2013年9月21日 优先权日:2013年9月21日
【发明者】牛晓芳 申请人:天津思博科科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1