Url检索方法及服务器的制造方法_2

文档序号:9667313阅读:来源:国知局
,并从第1组字符组开始,依次选取N个字符组中的第一个字符和最后一个字符,顺序组成待检索URL的特征字符串。
[0037]在对待检索URL的头字符串进行截取后,服务器从剩余字符串包括的分隔符之间,获取到该剩余字符串的所有字符组。举例说明,待检索URL为:http://www.kris3106.com/classl/group2/string3/indexll015,其中剩余字符串为 “kris3106.com/classl/grOUp2/String3/indeX11015”,分隔符为符号“/”,服务器根据分隔符从剩余字符串中获取到的字符组包括:“kris3106.com,,、“classl,,、“group2,,、“string3,,、“indexll015.html,,。
[0038]进一步地,服务器从第1组字符组开始,依次获取N个字符组中的第一个字符和最后一个字符,顺序拼接在一起组成该待检索URL的特征字符串。例如,取“kris3106.com",“£lassl”、“group2”、“St:ring^[]“indexll015.html”每个字符组的第一个字符和最后一个字符,即每个字符组中下划线的字符,顺序拼接在一起组成特征字符串“kmclg2s3il”。本实施例中,预设N的个数为8-12。优选地,预设个数为10。
[0039]203、根据特征字符串查询对应的索弓I表,获取到与特征字符串对应的目标URL。
[0040]本实施例中,预先建立URL原始字符串与特征字符串之间索引关系,并生成索引表存储在服务器中。在获取到待检索URL的特征字符串后,服务器查询预先建立的索引表,获取到与该特征字符串对应的目标URL。
[0041]204、根据目标URL在数据库中的存储位置获取目标URL存储信息。
[0042]进一步地,在索引表中查询到目标URL后,服务器根据该目标URL在数据库中的存储位置,在相应的存储单元中获取到该目标URL的存储信息。其中,存储信息包括:页面信息、访问信息、更新时间、内容摘要以及URL所归属的服务提供方等。
[0043]进一步地,为了保证根据特征字符串获取到目标URL与待检索URL —致,服务器在获取到该目标URL后,将目标URL的原始字符串与待检索URL的原始字符串逐字符进行比较,如果目标URL与待检索URL中每个字符在对应位置上均一致,说明该目标URL与该待检索URL匹配一致,获取该目标URL在数据库中的存储位置,根据该存储位置获取目标URL存储信息。
[0044]进一步地,在特征字符串对应多个目标URL时,服务器还可以通过将所有目标URL与待检索URL进行逐字符比较的方式,确定出与待检索URL —致的目标URL。
[0045]本实施例提供的URL检索方法,通过将待检索URL的原始字符串中的头字符串截取掉得到该待检索URL的剩余字符串,其中头字符串用于指示出待检索URL要访问的资源类型,从剩余字符串包括的分隔符之间获取剩余字符串的所有字符组,依次选取每个字符组的第一个字符和最后一个字符,顺序组成待检索URL的特征字符串,根据特征字符串查询预先建立的索引表,获取与该特征字符串对应的目标URL,根据该目标URL在数据库中的存储位置获取该目标URL存储信息。本实施例提供的URL检索方法是一种模糊匹配检索方法,通过对待检索URL预处理,得到相应的特征字符串,只需基于特征字符串进行检索,就能得到对应的目标URL,不再对待检索URL进行全文检索,减少了对待检索URL的检索次数,从而提尚了检索效率。
[0046]实施例三
[0047]图3为本发明实施例三提供的另一种URL检索方法的流程示意图。本实施例提供的URL检索方法的执行主体为服务器。如图3所示,该URL检索方法包括以下步骤:
[0048]301、对待检索URL原始字符串进行消息摘要算法计算,获取待检索URL的MD5值。
[0049]在试图对待检索URL进行检索时,服务器对待检索URL的原始字符串进行消息摘要算法计算,得到该待检索URL原始字符串的MD5值。
[0050]302、根据所述MD5值查询对应索引表,获取与所述MD5值对应的目标URL。
[0051 ] 本实施例中,预先建立URL原始字符串与MD5值之间索引关系,并生成索引表存储在服务器中。在获取到待检索URL的MD5值后,服务器根据该MD5值,查询上述索引表,得到与该MD5值对应的目标URL。
[0052]由于每个URL对应一个唯一的MD5值,本实施例中服务器根据待检索URL的MD5值检索到的目标URL,将与待检索URL完全一致,实现了对待检索URL的精确检索。
[0053]303、根据目标URL在数据库中的存储位置获取目标URL存储信息。
[0054]本实施例提供的URL检索方法,通过获取待检索URL的MD5值,获取到与该MD5值对应的目标URL,由于每个URL对应唯一的MD5值,本实施例中服务器能够根据该MD5值,检索到与该待检索URL —致的目标URL,实现了精确检索的目的。
[0055]实施例四
[0056]图4为本发明实施例三提供的一种服务器的结构示意图,如图4所示,该服务器包括:第一获取模块41、查询模块42和第二获取模块43。
[0057]其中,第一获取模块41用于根据待检索URL的原始字符串,获取所述待检索URL的消息摘要算法MD5值或者所述待检索URL的特征字符串。
[0058]在获取到待检索URL后,第一获取模块41根据待检索URL的原始字符串,获取到该待检索URL的MD5值或者该待检索URL的特征字符串。
[0059]其中,第一获取模块41具体用于截取所述待检索URL的原始字符串中的头字符串,获取到所述待检索URL的剩余字符串,根据所述剩余字符串中的分隔符,获取所述剩余字符串的所有字符组,并从第1组字符组开始,依次选取N个字符组中的第一个字符和最后一个字符,顺序组成所述待检索URL的特征字符串。
[0060]其中,所述头字符串用于指示出所述待检索URL要访问的资源类型。
[0061]实际应用中,每个URL原始字符串中的头字符串均用于指示出要访问的资源类型,而且头字符串包括的字符基本一致,第一获取模块41可以将该头字符串从原始字符串中截取掉。其中头字符串包括从该原始字符串的头字符至预设字符串之间的字符,一般预设的字符串为“//,,或者“//www.”。例如,待检索URL为:http://www.hostname, com/house/bei jing/dongcheng.html,其中该待检索 URL 的头字符串为“http://www.”,预设的字符串为“//www.”。
[0062]在对待检索URL的头字符串进行截取后,第一获取模块41从剩余字符串包括的分隔符之间,获取到该剩余字符串的所有字符组。举例说明,待检索URL为:http://www.kris3106.com/classl/group2/string3/indexll015,其中剩余字符串为 “kris3106.com/classl/group2/string3/indexll015”,分隔符为符号“/”,服务器根据分隔符从剩余字符串中获取到的字符组包括:“kris3106.com,,、“classl,,、“group2,,、“string3,,、“indexll015.html,,。
[0063]进一步地,第一获取模块41从第1组字符组开始,依次获取N个字符组中的第一个字符和最后一个字符,顺序拼接在一起组成该待检索URL的特征字符串。例如,取“kris3106.coni,,、“£lassl,,、“group2,,、“^tring2,,和 “indexll015.html” 每个字符组的第一个字符和最后一个字符,即每个字符组中下划线的字符,顺序拼接在一起组成特征字符串“kmclg2s3il”。本实施例中,预设N的取值为8-12。优选地,预
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1