Url检索方法及服务器的制造方法

文档序号:9667313阅读:421来源:国知局
Url检索方法及服务器的制造方法
【技术领域】
[0001]本发明涉及通信领域,尤其涉及一种URL检索方法及服务器。
【背景技术】
[0002]随着互联网的普及,互联网网站个数和互联网的使用用户越来越多,用于访问互联网的统一资源定位符(Uniform Resource Locator,简称URL)也越来越多。该URL还可以称为网页地址,通过该网页地址,能够对互联网上的资源进行访问和获取。
[0003]另外,对于互联网信息搜索应用领域,需要记录下每个URL的相关信息,如页面信息、访问信息和内容摘要信息等。在试图获取某一 URL的相关信息时,目前多用全文检索对待检索URL进行检索,首先将待检索URL进行拆分,得到待检索URL包括的所有关键字,再基于关键字预先建立的索引关系,对待检索URL进行检索。
[0004]但是,上述全文检索方式由于需要基于所有的关键字进行检索,因此,造成了检索过程较为复杂,检索效率较低的问题。

【发明内容】

[0005]本发明提供一种URL检索方法及服务器,用于解决现有对待检索URL采用全文检索时检索过程复杂使得检索效率较低的问题。
[0006]为了实现上述目的,本发明提供的一种URL检索方法,包括:
[0007]根据待检索URL的原始字符串,获取所述待检索URL的消息摘要算法MD5值或者所述待检索URL的特征字符串;
[0008]根据所述待检索URL的消息摘要算法MD5值或者所述待检索URL的特征字符串,查询对应的索引表,获取到所述MD5值或者与所述特征字符串对应的目标URL ;
[0009]根据所述目标URL在数据库中的存储位置获取所述目标URL存储信息。
[0010]为了实现上述目的,本发明提供的一种服务器,包括:
[0011]第一获取模块,用于根据待检索URL的原始字符串,获取所述待检索URL的消息摘要算法MD5值或者所述待检索URL的特征字符串;
[0012]查询模块,用于根据所述待检索URL的消息摘要算法MD5值或者所述待检索URL的特征字符串,查询对应的索弓丨表,获取到所述MD5值或者与所述特征字符串对应的目标URL ;
[0013]第二获取模块,用于根据所述目标URL在数据库中的存储位置获取所述目标URL存储信息。
[0014]本发明提供的URL检索方法及服务器,根据待检索URL的原始字符串,获取所述待检索URL的消息摘要算法MD5值或者所述待检索URL的特征字符串;根据所述待检索URL的消息摘要算法MD5值或者所述待检索URL的特征字符串,查询对应的索引表,获取到所述MD5值或者与所述特征字符串对应的目标URL ;根据所述目标URL在数据库中的存储位置获取所述目标URL存储信息。由于对待检索URL预处理,得到相应的特征字符串或MD5值,因此,只需基于特征字符串进行检索,就能得到对应的目标URL,不再对待检索URL进行全文检索,减少了对待检索URL的检索次数,提高了检索效率。
【附图说明】
[0015]图1为本发明实施例一提供的一种URL检索方法的流程示意图;
[0016]图2为本发明实施例二提供的另一种URL检索方法的流程示意图;
[0017]图3为本发明实施例三提供的另一种URL检索方法的流程示意图;
[0018]图4为本发明实施例四提供的一种服务器的结构示意图。
【具体实施方式】
[0019]为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
[0020]实施例一
[0021]图1本发明实施例一提供的一种URL检索方法的流程示意图。本实施例提供的URL检索方法的执行主体为服务器。如图1所示,该URL检索方法包括以下步骤:
[0022]101、根据待检索URL的原始字符串,获取待检索URL的消息摘要算法MD5值或者待检索URL的特征字符串。
[0023]在获取到待检索URL后,根据待检索URL的原始字符串,获取到该待检索URL的消息摘要算法(Message-Digest Algorithm5,简称MD5)值或者该待检索URL的特征字符串。
[0024]102、根据待检索URL的MD5值或者待检索URL的特征字符串,查询对应的索引表,获取到所述MD5值或者与所述特征字符串对应的目标URL。
[0025]具体地,在服务器中分别存储有预先建立的URL原始字符串与MD5值之间的索引表和URL原始字符串与特征字符串的索引表。在获取到待检索URL的MD5值后,查询对应的URL原始字符串与MD5值之间的索引表,获取到与该MD5值
[0026]其中,本实施例中,可以预先建立包括URL原始字符串、特征字符串以及MD5值的索引表并存储在服务器中,这样就可以节省服务器的存储空间。进一步地,在获取到特征字符串或者MD5值后,直接查询上述包括URL原始字符串、特征字符串和MD5值的索引表,就能够获取到目标URL。
[0027]103、根据目标URL在数据库中的存储位置获取目标URL存储信息。
[0028]在索引表中查询到目标URL后,服务器根据该目标URL在数据库中的存储位置,在相应的存储单元中获取到该目标URL的存储信息。其中,存储信息包括:页面信息、访问信息、更新时间、内容摘要以及URL所归属的服务提供方等。
[0029]本实施例提供的URL检索方法,根据待检索URL的原始字符串,获取所述待检索URL的消息摘要算法MD5值或者所述待检索URL的特征字符串,根据所述待检索URL的消息摘要算法MD5值或者所述待检索URL的特征字符串,查询对应的索引表,获取到所述MD5值或者与所述特征字符串对应的目标URL,根据所述目标URL在数据库中的存储位置获取所述目标URL存储信息。由于对待检索URL预处理,得到相应的特征字符串或MD5值,因此,只需基于特征字符串进行检索,就能得到对应的目标URL,不再对待检索URL进行全文检索,减少了对待检索URL的检索次数,提高了检索效率。
[0030]实施例二
[0031]图2为本发明实施例二提供的另一种URL检索方法的流程示意图。本实施例提供的URL检索方法的执行主体为服务器。如图2所示,该URL检索方法包括以下步骤:
[0032]201、截取待检索URL的原始字符串中的头字符串,获取待检索URL的剩余字符串。
[0033]其中,所述头字符串用于指示出所述待检索URL要访问的资源类型。
[0034]一般URL的格式为〈资源类型>://〈主机 >:〈端口 >/〈路径〉,其中,资源类型指出万维网(World Wide Web,简称WWW)客户程序用来操作的工具。如“Http://”表示WWW服务器,“Ftp://”表示文本传输协议(File Transfer Protocol,简称FTP)服务器等。
[0035]具体地,服务器获取到待检索URL后,将待检索URL的原始字符串进行截取,从该原始字符串中的头字符串截取掉,得到该待检索URL的剩余字符串。实际应用中,每个URL原始字符串中的头字符串均用于指示出要访问的资源类型,而且头字符串包括的字符基本一致,因此本实施例中服务器可以将该头字符串从原始字符串中截取掉。其中头字符串包括从该原始字符串的头字符至预设字符串之间的字符,一般预设的字符串为“//”或者“//www.,,。例如,待检索 URL 为:http://www.hostname, com/house/bei jing/dongcheng.html,其中该待检索URL的头字符串为“http://www.”,预设的字符串为“//胃.”。
[0036]202、根据剩余字符串中的分隔符,获取剩余字符串中的所有字符组
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1