一种网站访问方法及系统的制作方法

文档序号:6363491阅读:210来源:国知局
专利名称:一种网站访问方法及系统的制作方法
技术领域
本发明涉及互联网技术领域,尤其涉及一种网站访问方法及系统。
背景技术
互联网上的域名,相当于网站的门牌号码,与网站具有一一对应的关系,在浏览器上输入域名就可连接到特定的网站。域名由域名的主体和域名的后缀组成,域名后缀是指一个域名最后面的东西,如“域名A. C0M”,圆点前面的“域名A”是域名的主体,后面的 “.COM”就是后缀。不同后缀的域名有不同的含义,通常表示域名的行业特征或地区属性, 如com”代表商业公司,“.gov”代表政府机构,“.cn”和us”分别表示中国和美国域名。 通常用户使用浏览器访问某个网站时必须输入网站的整个域名,包括域名主体和后缀。用户输后缀需多敲几次键盘,会降低用户访问网站的效率;特别是对于即将推出的中文后缀, 用户输英文域名主体后需切换为中文输入法,中文后缀比如公司”和网络”,在打字时需敲更多的键盘,明显会影响用户的使用体验。此外,用户有时候会忘记后缀名而无法访问特定的网站;或因为输入错误的后缀而误入另一个不相关的网站,浪费了宝贵的时间,同时为不相关的网站增加了访问量。

发明内容
本发明要解决的技术问题在于,针对现有技术的上述需要输入完整域名才能访问网站从而使网站访问效率较低、出错率高的缺陷,提供一种效率高、出错率低的网站访问方法。本发明解决其技术问题所采用的技术方案是构造一种网站访问方法,其特征在于,包括A.预先建立索引数据库,所述索引数据库存储有多个域名主体及与每个域名主体对应的至少一个关于完整域名的信息;B.接收用户输入的特定网站所对应的特定域名的主体,并将所述特定域名的主体通过网页服务器传送到索引数据库;C.在索引数据库中以所述特定域名的主体为关键词查询所述特定域名的主体所对应的完整域名的信息,并将查询结果返回给用户。在本发明所述的网站访问方法中,所述网站访问方法还包括D.对索引数据库进行更新。在本发明所述的网站访问方法中,所述步骤A包括Al.生成新的关键词作为域名主体;A2.将所生成的域名主体与所有域名后缀进行匹配,组合成多个完整的域名;A3.将所述多个完整的域名进行过滤,以删除不存在的域名;A4.对过滤后的域名所对应的网站进行分析,并根据分析结果对所述过滤后的域名进行排序,以生成全排序结果;
A5.将所述全排序结果存入索引数据库。在本发明所述的网站访问方法中,所述步骤A4和步骤A5之间还包括A6.将所述全排序结果按照过滤后的域名所对应的网站的语言和/或地区进行分类排序,以生成分类排序结果;所述步骤A5还包括将所述分类排序结果存入索引数据库。在本发明所述的网站访问方法中,所述步骤C包括Cl.在索引数据库中以所述特定域名的主体为关键词进行查询,并判断是否查询到与所述特定域名的主体对应的完整域名的信息,若是,则执行步骤C2 ;若否,则执行步骤 C3 ;C2.根据用户信息对全排序结果或分类排序结果进行筛选,并将筛选后的排序结果作为查询结果返回给用户;C3.将所述特定域名的主体与所有域名后缀进行匹配,组合成多个完整的域名;C4.将所述多个完整的域名进行过滤,以删除不存在的域名,并判断过滤后的域名的数量,若过滤后的域名的数量为0,则执行步骤C5 ;若过滤后的域名的数量为1,则执行步骤C6 ;若过滤后的域名的数量大于1,则执行步骤C7 ;C5.向用户反馈域名不存在;C6.向用户反馈该过滤后的域名;C7.对过滤后的域名所对应的网站进行分析,并根据分析结果和用户信息从所述过滤后的域名所对应的网站中筛选出相关网站;CS.判断所述相关网站的数量,若相关网站的数量为0,则执行步骤C9 ;若相关网站的数量为1,则执行步骤ClO ;若相关网站的数量大于1,则执行步骤Cll ;C9.对过滤后的域名所对应的网站进行分析,并根据分析结果对所述过滤后的域名进行排序,以生成全排序结果,并将全排序结果返回给用户;C10.将该唯一的相关网站的域名返回给用户;cn.对相关网站进行分析,并根据分析结果生成相关排序结果,并将相关排序结果作为查询结果返回给用户。在本发明所述的网站访问方法中,在步骤C4中,若过滤后的域名的数量为0,还执行步骤C12 ;若过滤后的域名的数量为1,还执行步骤C13 ;若过滤后的域名的数量大于1, 还执行步骤C14 ;C12.将所述特定域名的主体不存在完整域名的信息存储至索引数据库;C13.将所述特定域名的主体所对应的唯一完整的域名存储至索引数据库;C14.对过滤后的域名所对应的网站进行分析,并根据分析结果对所述过滤后的域名进行排序,以生成全排序结果;C15.将所述全排序结果按照过滤后的域名所对应的网站的语言和/或地区进行分类排序,以生成分类排序结果;C16.将所述全排序结果和分类排序结果存入索引数据库。在本发明所述的网站访问方法中,在所述步骤D中,根据下列中的至少一个对索引数据库进行更新
根据注册用户的主动反馈更新索引数据库;根据多个用户的历史访问记录更新索引数据库;定期搜索新网站以更新索引数据库。在本发明所述的网站访问方法中,根据用户的主动反馈更新索引数据库的步骤包括Dl.接收第一注册用户所反馈的优先级域名或黑名单域名,并将其提交至索引数据库;D2.索引数据库将第一注册用户所输入的优先级域名或黑名单域名分配给至少一个其他注册用户,以进行调查;D3.至少一个其他注册用户对所述优先级域名或黑名单域名所对应的网站进行调查,并将调查结果返回给索引数据库;D4.索引数据库根据调查结果,评价所述第一注册用户的反馈是否准确;D5.若第一注册用户的反馈与调查结果相符,则根据第一注册用户的反馈更新索引数据库;反之,则不更新索引数据库。在本发明所述的网站访问方法中,对过滤后的域名所对应的网站进行以下分析 更新频率、注册时间、网站内容量、采用的语言、网站服务器IP所对应的地区、链接关系及域名后缀信息。在本发明所述的网站访问方法中,所述用户信息包括未注册用户信息或注册用户信息,且未注册用户信息包括用户IP地址、与用户IP地址相关的历史访问记录、分类排序结果类型的设置;注册用户信息包括用户地址、用户偏好设置、用户IP地址、用户的历史访问记录。在本发明所述的网站访问方法中,所述用户信息按照权重由高到低的顺序排列为用户偏好设置、分类排序结果类型的设置、用户的历史访问记录、与用户IP地址相关的历史访问记录、用户地址、用户IP地址。在本发明所述的网站访问方法中,所述步骤B还包括接收用户输入的引用用户, 且引用用户的信息的权重在分类排序结果类型的设置和用户的历史访问记录之间;步骤C2还包括根据所引用用户的信息对全排序结果或分类排序结果进行筛选。本发明还构造一种网站访问系统,包括索引数据库建立模块,用于预先建立索引数据库,所述索引数据库存储有多个域名主体及与每个域名主体对应的至少一个关于完整域名的信息;用户输入模块,用于接收用户输入的特定网站所对应的特定域名的主体,并将所述特定域名的主体通过网页服务器传送到索引数据库;查询模块,用于在索引数据库中以所述特定域名的主体为关键词查询所述特定域名的主体所对应的完整域名的信息,并将查询结果返回给用户。在本发明所述的网站访问系统中,所述网站访问系统还包括更新模块,用于对索引数据库进行更新。在本发明所述的网站访问系统中,所述索引数据库建立模块包括关键词生成单元,用于生成新的关键词作为域名主体;第一组合单元,用于将所生成的域名主体与所有域名后缀进行匹配,组合成多个完整的域名;过滤单元,用于将所述多个完整的域名进行过滤,以删除不存在的域名;第一全排序单元,用于对过滤后的域名所对应的网站进行分析,并根据分析结果对所述过滤后的域名进行排序,以生成全排序结果;第一存储单元,用于将所述全排序结果存入索引数据库。在本发明所述的网站访问系统中,所述索引数据库建立模块还包括第一分类排序单元,用于将所述全排序结果按照过滤后的域名所对应的网站的语言和/或地区进行分类排序,以生成分类排序结果;第二存储单元,用于将所述分类排序结果存入索引数据库。在本发明所述的网站访问系统中,所述查询模块包括查询及判断单元,用于在索引数据库中以所述特定域名的主体为关键词进行查询,并判断是否查询到与所述特定域名的主体对应的完整的域名的信息;第一返回单元,用于在查询到与所述特定域名的主体对应的完整的域名的信息时,根据用户信息对全排序结果或分类排序结果进行筛选,并将筛选后的排序结果作为查询结果返回给用户;第二组合单元,用于在没有查询到与所述特定域名的主体对应的完整的域名的信息时,将所述特定域名的主体与所有域名后缀进行匹配,组合成多个完整的域名;过滤及判断单元,用于将所述多个完整的域名进行过滤,以删除不存在的域名,并判断过滤后的域名的数量;第二返回单元,用于在过滤后的域名的数量为0时,向用户反馈域名不存在;第三返回单元,用于在过滤后的域名的数量为I时,向用户反馈该过滤后的域名;筛选单元,用于在过滤后的域名的数量大于I时,对过滤后的域名所对应的网站进行分析,并根据分析结果和用户信息从所述过滤后的域名所对应的网站中筛选出相关网站;数量判断单元,用于判断所述相关网站的数量;第四返回单元,用于在相关网站的数量为0时,对过滤后的域名所对应的网站进行分析,并根据分析结果对所述过滤后的域名进行排序,以生成全排序结果,并将全排序结果返回给用户;第五返回单元,用于在相关网站的数量为I时,将该唯一的相关网站的域名返回给用户;第六返回单元,用于在相关网站的数量大于I时,对相关网站进行分析,并根据分析结果生成相关排序结果,并将相关排序结果作为查询结果返回给用户。在本发明所述的网站访问系统中,所述查询模块还包括 第三存储单元,用于在过滤后的域名的数量为0时,将所述特定域名的主体不存在完整域名的信息存储至索引数据库;第四存储单元,用于在过滤后的域名的数量为I时,将所述特定域名的主体所对应的唯一完整的域名存储至索引数据库;第二全排序单元,用于在过滤后的域名的数量大于I时,对过滤后的域名所对应的网站进行分析,并根据分析结果对所述过滤后的域名进行排序,以生成全排序结果;
第二分类排序单元,用于将所述全排序结果按照过滤后的域名所对应的网站的语言和/或地区进行分类排序,以生成分类排序结果;第五存储单元,用于将所述全排序结果和分类排序结果存入索引数据库。在本发明所述的网站访问系统中,所述更新模块用于根据下列中的至少一个来更新索引数据库根据注册用户的主动反馈更新索引数据库;根据多个用户的历史访问记录更新索引数据库;定期搜索新网站以更新索引数据库。在本发明所述的网站访问系统中,所述第一全排序单元对过滤后的域名所对应的网站进行以下分析更新频率、注册时间、网站内容量、采用的语言、网站服务器IP所对应的地区、链接关系及域名后缀信息。在本发明所述的网站访问系统中,所述用户信息包括未注册用户信息或注册用户信息,且未注册用户信息包括用户IP地址、与用户IP地址相关的历史访问记录、分类排序结果类型的设置;注册用户信息包括用户地址、用户偏好设置、用户IP地址、用户的历史访问记录。实施本发明的技术方案,由于索引数据库中预先存储有多个域名主体及与每个域名主体对应的至少一个关于完整域名的信息,在用户需要访问某个特定网站时,仅需要输入该特定网站的域名主体,索引数据库就会自动以该特定域名的主体为关键词查询该特定域名的主体所对应的完整域名的信息,并将查询结果返回给用户,因此,用户无需输入域名的后缀即可访问到该特定网站,节约了用户访问网站的时间,提高了用户访问网站的效率, 并避免了由于后缀的拼写错误带来的麻烦,从而提高了用户体验。


下面将结合附图及实施例对本发明作进一步说明,附图中图I是本发明网站访问方法实施例一的流程图;图2是图I中步骤SlO优选实施例的流程图;图3是图I中步骤S30优选实施例的流程图;图4是查询结果优选实施例的显示界面图;图5是本发明网站访问系统实施例一的逻辑图;图6是本发明网站访问系统实施例二的逻辑图;图7是图5中索引数据库建立模块优选实施例的逻辑图;图8是图5中查询模块优选实施例的逻辑图。
具体实施例方式如图I所示,在本发明网站访问方法实施例一的流程图中,该网站访问方法包括S10.预先建立索引数据库,所述索引数据库存储有多个域名主体及与每个域名主体对应的至少一个关于完整域名的信息,应当说明的是,在该域名主体存在对应的完整域名时,“关于完整域名的信息”为所存在的对应的完整域名,在与该域名主体对应的完整域名不存在时,为“关于完整域名的信息”为“域名不存在”信息;
S20.接收用户输入的特定网站所对应的特定域名的主体,并将所述特定域名的主体通过网页服务器传送到索引数据库;S30.在索引数据库中以所述特定域名的主体为关键词查询所述特定域名的主体所对应的完整域名的信息,并将查询结果返回给用户。实施该技术方案,由于索引数据库中预先存储有多个域名主体及与每个域名主体对应的至少一个关于完整域名的信息,在用户需要访问某个特定网站时,仅需要输入该特定网站的域名主体,索引数据库就会自动以该特定域名的主体为关键词查询所述特定域名的主体所对应的完整域名的信息,并将查询结果返回给用户,因此,用户无需输入域名的后缀即可访问到该特定网站,节约了用户访问网站的时间,并避免了由于后缀的拼写错误带来的麻烦,从而提高了用户体验。图2是图I中步骤SlO优选实施例的流程图,在该优选实施例中,步骤SlO进一步包括S101.生成新的关键词作为域名主体;S102.将所生成的域名主体与所有域名后缀进行匹配,组合成多个完整的域名;S103.将所述多个完整的域名进行过滤,以删除不存在的域名;S104.对过滤后的域名所对应的网站进行分析,并根据分析结果对所述过滤后的域名进行排序,以生成全排序结果;S105.将所述全排序结果按照过滤后的域名所对应的网站的语言和/或地区进行分类排序,以生成分类排序结果;S106.将所述全排序结果、所述分类排序结果存入索引数据库。下面具体说明步骤SlO的具体步骤首先,在步骤SlOl中,索引数据库生成新的关键词作为域名主体,传送到后缀匹配服务器。具体地,索引数据库生成的关键词是符合一定条件的,包括但不限于以下域名主体①流量大、访问率较高的知名网站的域名主体,包括访问量排前列的网站、知名人物的个人网站、知名企业或机构的官方网站等等,比如筛选全球排前十万位的网站域名,可通过第三方统计数据获得,也可以通过现有的网页分析技术来实现;②纯数字,比如所有8位以内的阿拉伯数字组成的域名主体;③采用穷举法囊括一定范围内的所有字符组合,字符含从a到z的26个拉丁字母及比如I至8个字符组成的字符串的所有组合;④字符串加阿拉伯数字,比如字符串后面加数字且总长度不超过8位的所有组合;⑤阿拉伯数字加字符串,比如数字后面加字符串且总长度不超过8位的所有组合;⑥字符与阿拉伯数字的任意组合,比如拉丁字母及与阿拉伯数字任意组合 (总长度不超过6位);⑦采用查字典方式罗列出所有常用的字、词、短语及其缩写的拼音,以及常用的英文词组(包括单词、短语及其缩写);比如总长度不超过16位的中文拼音;⑧阿拉伯数字与拼音或词组的组合,比如数字后加中文拼音或英文词组的所有组合、中文拼音或英文词组后加数字的所有组合(总长度不超过12位,数字不超过4位);
⑨中文拼音与英文词组的组合,比如中文拼音后加英文词组、英文词组后加中文拼音、中文拼音后加中文拼音、英文词组后加英文词组(总长度不超过12位);⑩由汉语和英语之外的语言所组成的域名,比如总长度不超过16位的法文单词。应当说明的是,条件①收集知名网站的域名,确保大多数用户经常访问的网站域名都能在索引数据库找到。条件② ⑩归纳总结了目前互联网上大多数网站的域名特征。 目前域名基本上是由数字、拉丁字母及等字符组成,按以上① ⑩所列的条件收集的域名可以覆盖互联网上绝大多数网站的域名,建立以这些域名的主体作为关键词的索引数据库,目的是保证用户的绝大多数查询结果都可以实时返回。若将来域名命名规则有变化时, 上述条件也会相应更新。在步骤S102中,所生成的域名主体,在后缀匹配服务器与所有域名后缀进行匹配,以组成多个完整的域名,例如,为方便说明,假定互联网所有域名后缀包括“.CN”、
PT”、“. C0M”、“. 0RG”、“. NET”,索引数据库传到后缀匹配服务器的关键词为“abc”,经域名后缀匹配组成五个完整的域名,即“abc. CN,,、“abc. PT”、“abc. C0M”、“abc. ORG”和“abc. NET”。在步骤S103中,将所述多个完整的域名进行过滤,以删除不存在的域名。在该步骤中,可使用现有技术识别不存在的域名,比如通过搜索引擎的搜索蜘蛛程序直接访问域名 abc. COM所对应的网站看是否有内容返回,若无内容返回,则定义域名abc. COM不存在。在步骤S104中,后缀匹配服务器访问所述过滤后的域名对应的网站,对过滤后的域名所对应的网站进行分析,并提取网站有用的信息和内容,应当说明的是,在具体实施时,提取网站的信息和内容和过滤域名可同时进行,若某域名对应的网站无内容返回,则可定义成该域名不存在;若某域名所对应的网站有内容返回,则可提取网站的信息和内容。然后,分析比较从各网站提取的信息和内容并作为排序的依据,生成全排序结果,应当说明的是,生成全排序结果可由服务器用现有技术自动完成,现有搜索引擎普遍采用的网络蜘蛛Web Spider 程序就可实现从各网站提取的内容的功能,根据预定排序规则对网站内容进行分析排序也属于现有技术,这里不作详细描述。例如,若检测出“abc. COM”不存在,将其删除,然后分别访问“abc. CN”、“abc. PT”、“abc. 0RG”和“abc. NET”,从剩下的这四个网站提取有用的信息和内容传送给分析排序单元。还应当说明的是,在该步骤中,在分析过滤后的域名所对应的网站时,可具体分析该网站的以下信息更新频率、注册时间、网站内容量、采用的语言、网站服务器IP所对应的地区、链接关系及域名后缀信息等信息。也可以借鉴类似搜索引擎的超链分析技术,分析不同网站的反向链接数来判断网站的重要性和受关注程度。无论采用那种方法分析,最终的目的是给这些网站评级,比如内容较全面、受关注程度较高的网站,相应级别也较高。相反地,内容较少且大多数超链接均不指向站内网页的网站,相应级别也较低(这里所说的是相对而言,实际应用中会对访问量较大的导航类网站作特别处理)。然后根据级别由高到低给网站排序,生成全排序结果。假设上述4个网站的级别分别为:“abc. CN” = 2. l、“abc. PT” = I. 9、“abc. ORG” = I. 8,“abc. NET” = 9. 5。按级别高低排序的全排序结果为“abc. NET, abc. CN, abc. PT,abc. ORG”。在步骤S105中,将所述全排序结果还可分类排序,以生成分类排序结果,细分的依据包括网站采用的语言、网站服务器的IP地址对应的区域、域名后缀的含义等。优选地,分析排序单元根据网站的语言和/或地区来细分,分为面向特定语言用户的网站和面向特定地区用户的网站。例如,对上述全排序结果的4个网站的内容分析后得出结论“abc. 0RG”和“abc. CN”为中文网站,“abc. PT”和“abc. NET”为葡萄牙文网站,由此可推断“abc. ORG”和“abc. CN”主要面向懂中文的用户,“abc. PT”和“abc. NET”主要面向懂葡萄牙文的用户,因此,根据语言的不同可细分为2 个分类排序结果,即分类排序结果(I) “abc. CN,abc.ORG”和分类排序结果(2) “abc.NET, abc. PT”。另外,实际应用中也需根据网站服务器的IP地址对应的区域来细分排序结果,按区域细分排序结果时应同时参考网站采用的语言,假设网站“abc. ORG”的服务器IP地址对应的区域为新加坡,网站“abc. CN”的服务器IP地址对应的区域为中国,而网站“abc. PT” 和“abc. NET”的服务器IP地址对应的区域为葡萄牙,那么根据区域的不同又可细分出三个分类排序结果,其中,分类排序结果(3)包括“abc. CN,abc.ORG”,分类排序结果(4)包括 “abc. 0RG,abc. CN”,分类排序结果(5)包括“abc. NET,abc. PT”。分类排序结果(3)适用于中国用户,分类排序结果(4)适用于新加坡用户,分类排序结果(5)适用于葡萄牙用户。上一个例子中,适用于中国用户的分类排序结果(3)还包括了新加坡的网站“abc.ORG”,主要依据是中国用户以中文为主,网站“abc. ORG”也是中文网站,可能有一部分中国用户需要访问“abc. 0RG”,所以允许“abc. ORG”出现在适用于中国用户的分类排序结果中。分类排序结果(4)顺序与全排序结果的顺序有所不同,这是因为“abc. ORG”和“abc. CN”级别相差不大, 新加坡的中文用户可能更习惯于访问新加坡本地的网站。在优选例中,域名后缀的含义不作为分类排序结果主要依据,但它对分类排序结果也有影响,假设网站“abc. CN”的内容有中文版和英文版,中文跟英文的内容相当,无法区分以哪种语言为主,通过分析后缀,“.CN” 的含义为中国地区,可推断“abc. CN”以中文为主,在中文分类排序结果将优先获得排序,在英文分类排序结果中不参与排序或排在较后的位置。至于如何识别网站采用的语言,有多种方法分析网页内容、分析计算机文件的字符编码类型、分析HTML源文件的语言meta标签等,这里对现有技术不再详细描述。特殊情况,多个国家和地区、多种语言的用户可能会经常访问某个全球性的知名网站,分析排序单元允许这类网站同时出现在多个分类排序结果中。由于全球性的知名网站数量不多,即使用人工方式筛选也可以短时间内完成。上述分类仅是本发明的一个具体实施例,用来解释权利要求,并不用于限定本发明的范围。实际应用中还可细分更多的分类排序结果。最后是将上述的全排序结果和分类排序结果存入到索引数据库的关键词对应的索引表中,例如,存入到上述关键词“abc”的索引表中。存储完毕后,索引数据库继续为下一个关键词创建索引表,如此循环执行,直至符合上述条件① ⑩的所有关键词的索引表创建完毕。在一种特殊情况下,在上述建立索引数据库过程中,当过滤后发现所有与某关键词对应的域名都不存在,则可以跳过分析排序的程序,仍然会将所述关键词及“域名不存在的”的信息存入索引数据库。目前的搜索引擎是通过网页的链接地址来寻找其它网页,其局限性是搜索不到刚成立不久或无外部链接的网站,而且通过链接地址来寻找的只是网站的其中一张网页,容易出现通过多次链接地址找到的都是同一网站的不同页面。本发明关注的是网站的唯一域名,而不是网站的具体页面,显然常规搜索引擎采用的搜索策略不适合本发明。本发明建立索引数据库采用了穷举法,可以搜索到刚成立不久或无外部链接的网站。当然,采用穷举法会涉及庞大的运算量。例如上述条件① ⑩包含的关键词可能多达数千亿个域名,由于大多数域名是不存在的,据统计数据,目前互联网上的网站大约在I亿个左右,所以仅需对 I亿个左右的域名分析排序,大大降低了创建索引表的难度,用多台计算机组成的计算机群在有限的时间内对I亿个左右的域名分析排序是可行的。图3是图I中步骤S30的优选实施例的流程图,该步骤S30进一步包括以下步骤S301.在索引数据库中以所述特定域名的主体为关键词进行查询,并判断是否查询到与所述特定域名的主体对应的完整域名的信息,若是,则执行步骤S302 ;若否,则执行步骤S303 ;S302.根据用户信息对全排序结果或分类排序结果进行筛选,并将筛选后的排序结果作为查询结果返回给用户;S303.将所述特定域名的主体与所有域名后缀进行匹配,组合成多个完整的域名;S304.将所述多个完整的域名进行过滤,以删除不存在的域名,并判断过滤后的域名的数量,若过滤后的域名的数量为0,则执行步骤S305和步骤S306 ;若过滤后的域名的数量为1,则执行步骤S307和步骤S308 ;若过滤后的域名的数量大于1,则执行步骤S309和步骤S314 ;S305.向用户反馈域名不存在;S306.将所述特定域名的主体不存在完整域名的信息存储至索引数据库;S307.向用户反馈该过滤后的域名;S308.将所述特定域名的主体所对应的唯一完整的域名存储至索引数据库;S309.对过滤后的域名所对应的网站进行分析,并根据分析结果和用户信息从所述过滤后的域名所对应的网站中筛选出相关网站;S310.判断所述相关网站的数量,若相关网站的数量为0,则执行步骤S311 ;若相关网站的数量为1,则执行步骤S312 ;若相关网站的数量大于1,则执行步骤S313 ;S311.对过滤后的域名所对应的网站进行分析,并根据分析结果对所述过滤后的域名进行排序,以生成全排序结果,并将全排序结果返回给用户;S312.将该唯一的相关网站的域名返回给用户;S313.对相关网站进行分析,并根据分析结果生成相关排序结果,并将相关排序结果作为查询结果返回给用户;S314.对过滤后的域名所对应的网站进行分析,并根据分析结果对所述过滤后的域名进行排序,以生成全排序结果;S315.将所述全排序结果按照过滤后的域名所对应的网站的语言和/或地区进行分类排序,以生成分类排序结果;S316.将所述全排序结果和分类排序结果存入索引数据库。实施该技术方案,可避免某些不相关网站仅仅因为域名主体与知名网站相同就可获得很高的访问量,从而削弱了抢注域名的现实意义,规范了域名注册的秩序。另一方面, 对于知名网站也不需要再为了保护自身权益而事先注册多个域名主体相同的网站,从而减少了费用。下面具体说明步骤S30的具体步骤当用户要访问某个网站时,需在用户设备界面的输入框输入域名主体。这里的用户设备可以是任何一种可与用户通过鼠标、键盘、触摸屏、遥控器或声控设备进行人机交互的电子产品,包括但不限于计算机、智能手机、PAD等。 当网页服务器获取所述的域名主体(可以通过页面技术,例如JSP、PHP或ASP等,获取用户输入的域名主体),并将所述的域名主体作为关键词传送到索引数据库进行查询。若索引数据库已经存在所述的关键词对应的索引表,则根据用户信息筛选索引表的分类排序结果或全排序结果,筛选后的排序结果作为查询结果返回给用户。筛选时优先选择与用户信息对应的分类排序结果,若无对应的分类排序结果才考虑全排序结果。其中,用户信息包括未注册用户信息或注册用户信息。具体地,未注册用户信息至少包括以下任一项用户IP地址、 与用户IP地址相关的历史访问记录、分类排序结果类型的设置。注册用户信息至少包括以下任一项用户地址、用户偏好设置、用户IP地址、用户的历史访问记录。优选地,索引数据库给以上多项用户信息分别赋予不同的权重,各项基本信息的权重由高到低排列如下用户的偏好设置>分类排序结果类型的设置>用户的历史访问记录>与用户IP地址相关的历史访问记录>用户地址>用户IP地址。筛选排序结果的原则是优先满足权重较高的用户信息,忽略与权重较高的用户信息有冲突的信息。用户偏好设置的权重在用户基本信息中最高,是筛选排序结果时优先考虑的依据。下面分别举例说明用户信息对排序结果的影响对于未注册用户,假设某未注册用户的IP地址所属的区域为中国大陆,则返回适用于中国大陆用户的分类排序结果;若用户的IP地址所属的区域为英国,则返回适用于英国用户的分类排序结果。用户的历史访问记录也是重要的参考信息,例如,若某个固定IP 地址的历史访问记录显示用户访问的大部分网站为中文网站,则返回适用于中文用户的分类排序结果;若某个固定IP地址的历史访问记录显示该用户访问的中文网站和英文网站大约各占一半,则从全排序结果中筛选出的中文网站和英文网站的域名,并将筛选后的域名作为查询结果返回给用户。未注册用户还有一项最重要的信息为分类排序结果类型的设置,当用户希望能获得其它分类排序结果时,索引数据库允许用户自由设置排序结果的类型。例如,IP地址所属的区域为中国的某用户想访问印度的网站,该用户可将查询结果的类型改为“印度用户”,则返回适用于印度用户的分类排序结果。分类排序结果类型的设置功能还允许用户获得包含多种分类排序结果的查询结果,例如,用户P希望访问葡萄牙文的网站,但用户P只是对葡萄牙、巴西和中国澳门的网站感兴趣,用户P可以将查询结果的类型改为“葡萄牙文=葡萄牙用户+巴西用户+中国澳门用户”,索引数据库则会从全排序结果中筛选出适用于葡萄牙、巴西和中国澳门用户的葡萄牙文网站的域名,并将筛选后的域名作为查询结果返回给用户P。所述用户P的例子提到的公式只是为方便说明用户设置的多项条件之间的逻辑关系而作的比喻,这里的“ + ”相当于“或者”,“=”相当于“包含”,“=” 左边的葡萄牙文是前提条件,要求只返回上述三个地区的葡萄牙文网站的域名。对于注册用户,也可以根据注册用户不同的IP地址及历史访问记录返回不同的查询结果,实施方法与未注册用户类似。不同的是,注册用户的基本信息增加了“用户地址” 和“偏好设置”。用户地址有时会跟IP地址所属的区域不一致,比如,注册用户A的注册地址为中国,用户A到英国使用互联网时,其IP地址所属的区域就变为英国。对于这类用户,若无相关历史访问记录,索引数据库根据权重较高的用户地址来筛选该返回的查询结果,即返回适用于中国用户的分类排序结果;若有相关的历史访问记录,索引数据库会根据用户 A的相关历史访问记录来筛选该返回的查询结果。例如,用户A输入的关键词为“abc”,用户 A的历史访问记录为一次访问“abc. edu. cn”、两次访问“abc. net”、三十五次访问“abc. org”,显然,“abc. org”的历史访问记录最多,索引数据库会将“abc. org”所属的分类排序结果作为查询结果返回给用户A(查询结果需将abc. org排第一位);若用户A没有与域名主体“abc”相关的历史访问记录,他的历史访问记录显示近期多次访问以“.edu. cn”为后缀的域名,从中可推断用户A可能是学生或老师,也可能是对教育机构的网站感兴趣的人,索引数据库会将“abc. edu. cn”及其所属的分类排序结果作为查询结果返回给用户A(前提是域名abc. edu. cn存在,若不存在这域名,索引数据库会自动忽略此项历史访问记录提供的基本信息)。注册用户还有一项基本信息叫用户偏好设置,是注册用户最重要的基本信息, 包括但不限于注册用户对某域名设为优先级或黑名单,也包括与未注册用户相同的“分类排序结果类型的设置”功能。也就是说,注册用户的“偏好设置”比未注册用户的“分类排序结果类型的设置”多了设置优先级或黑名单的功能。例如,用户A输入的关键词为“abc”, 该用户的资料中若将“abc. net”设为优先级,则将“abc. net”在查询结果中的位置调至第一位;若用户的资料中将“abc. net”设为黑名单,则将“abc. net”从查询结果中剔除。另外,还应当说明的是,获取用户信息的方式包括但不限制于根据用户在浏览网页期间由网络端或用户设备端所记录的或由用户设备的cookies信息中提取的用户IP地址及用户历史访问记录等等;注册用户的偏好设置和注册资料填写的地址可由该用户的资料中获得,当注册用户通过用户设备登陆用户帐号时,索引数据库就可识别该用户的身份, 从而获得对应该用户的基本信息。为了本领域的相关技术人员更容易理解索引数据库根据不同用户的基本信息返回不同的查询结果,现综合举例假设有六个用户A1、A2、A3、A4、A5和A6,他们在输入框输入域名主体都是“abc”。索引数据库找到了包含关键词“abc”的索引表,该索引表共五条排序结果,分别为全排序结果pl、适用于中国用户的分类排序结果P2、适用于英国用户的分类排序结果P3、适用于中文用户的分类排序结果p4和适用于英文用户的分类排序结果p5。 这五条排序结果包含的域名分别为pi (abc. net、abc. com、abc. cn、abc. org、abc. uk、abc. gov)、p2 (abc. net、abc. cn、abc. com)、p3 (abc. uk、abc. org、abc. gov)、p4 (abc. net、abc. com、abc. cn)、p5(abc. org、abc. uk、abc. gov)。假设用户Al的信息为“IP地址所属区域为英国”,索引数据库根据“ IP地址所属区域为英国”而选择适用于英国用户的分类排序结果 p3作为查询结果返回给用户Al,即用户Al得到的返回结果为“abc. uk、abc. org、abc. gov”; 假设用户A2的信息为“注册资料填写的地址和IP地址所属区域都为中国”,则索引数据库选择适用于中国用户的分类排序结果P2作为查询结果返回给用户A2 ;假设用户A3的信息为“注册资料填写的地址为中国,IP地址所属区域为英国,历史访问记录的网站绝大多数为中文网站”,则索引数据库选择适用于中文用户的分类排序结果P4作为查询结果返回给用户A3 ;假设用户A4的信息为“注册资料填写的地址为中国,IP地址所属区域为英国,历史访问记录的网站绝大多数为中文网站,历史访问记录显示多次访问网站abc. org",比较用户A4的基本信息中“历史访问记录显示多次访问网站abc. org”与关键词“abc”最贴近, 由此可推断用户A4很可能是想访问网站abc. org,则索引数据库选择包含有“abc. org”的分类排序结果P3或P5作为查询结果返回给用户A3 (查询结果应保证abc. org的排序为第一位,若选择p3,需将abc. uk和abc. org排序对调后再将排序结果返回);假设用户A5的信息为“注册资料填写的地址和IP地址所属区域都为日本”,索引数据库没有适用于日本用户的分类排序结果,则选择全排序结果Pl作为查询结果返回给用户A5 ;假设用户A6的信息为“ IP地址所属区域和注册资料填写的地址都为中国,用户将abc. net设为黑名单以及将abc. com设为优先级,则索引数据库首先选出包含有优先级网站“abc. com”的分类排序结果p2和p4,其次参考“IP地址所属区域和注册资料填写的地址都为中国”,从p2和p4 选出适用于中国用户的分类排序结果P2,再次按照用户A6的优先级设置和黑名单,将abc. com在排序结果的位置调至第一位,将abc. net从排序结果中剔除,最终用户A6得到的返回结果为 “abc. com, abc. cn”。在用户访问网站时,若用户输入的关键词较长,在索引数据库没查到相关域名的索引表时,所述的关键词将传送至后缀匹配服务器,与所有域名后缀进行匹配,组成多个完整的域名,然后将该多个完整的域名进行过滤,删除不存在的域名,并访问所述过滤后的域名对应的网站,从网站提取有用的信息和内容。以上流程与建立索引数据库,不再重复解释。因为用户输入的关键词超出建立索引数据库的条件① ⑩所包括的范围,可以推断,用户输入的关键词大约有以下特征字符或数字较长、不属于知名网站的域名主体、不属于常用的拼音或单词等等,现实中以这类关键词为域名主体的可能性较小,出现多个网站的域名主体与用户输入的关键词相同的几率更是微乎其微,可以得出一个推论在索引数据库找不到的域名主体,出现多个相同域名主体的网站的几率极小。所以在大多数情况下,若过滤后没有一个网站的域名主体与关键词相同,或者只有一个网站的域名主体与关键词相同,这两种情况都可以直接将查询结果返回给用户,不用经过后面的分析排序单元。以此同时,后缀匹配服务器会生成包含用户输入的关键词的索引表,存入索引数据库中以供下一次查询使用,当该用户下一次或其他用户输入相同的关键词时,索引数据库就可以直接从所述关键词的索引表提取信息同步返回给用户(当域名存在时,将唯一的域名返回给用户;当域名不存在时,将域名不存在的信息反馈给用户)。若过滤后的有效网站的域名数量 > I时,引出两条分支。第一条分支的流程用于将查询结果返回给用户。具体地,根据用户信息从所述过滤后的域名对应的网站筛选出相关网站。根据用户信息筛选网站的方法在前面已经详细描述,不再重复。这里根据相关网站的数量又分两种处理方式,第一种情况,当所述相关网站只有I个时,则将这唯一相关网站的域名作为查询结果返回给用户,例如用户信息为“经常访问中文网站”,筛选出相关网站只有一个中文网站时,则将这个中文网站的域名返回给用户。第二种情况,当相关网站的数量为不等于I时,即相关网站的数量=0或> I。若相关网站数量为0,则分析比较所述过滤后的域名对应网站的信息和内容,生成全排序结果,并将全排序结果作为查询结果返回给用户;若相关网站的数量> 1,则分析比较所述相关网站的信息和内容,生成相关排序结果,并将相关排序结果作为查询结果返回给用户。应当说明的是,在查询索引数据库时分析网站的方法与建立索引数据库时所采用的方法有所不同在建立数据库的阶段,分析网站的时间比较充足,并且相同域名主体的网站较多,所以需要从每一个网站提取尽可能多的网页以获得较全面的信息,必要时还可以参考外部链接数量来评估网站的受欢迎程度,这是常规的分析排序方法,能获得较客观的排序依据,但无法满足用户希望短时间得到查询结果的要求。而在响应用户查询的时候,必须快速分析比较出网站的级别大小,这里提出一种根据网站首页评估网站级别的简易计算法,计算公式如下网站级别V = D173* (D/10+1. 5Ln+Lw1/3)*(Ly/Lz) VlOOO其中,D代表网站首页内容的大小,单位是Kb(当D > 3000Kb时,按3000Kb计算);Ln代表网站首页包含的指向自身网站其它页面的链接数(若有多个链接指向相同地址,则按I个链接计算);Lw代表网站首页包含的指向外部网站的链接数;Ly代表网站首页包含的指向自身网站其它页面的有效链接数(若Ln为0,则Ly也为0,相应的网站级别也为0); Lz代表从网站首页随机选择的指向自身网站其它页面的链接数(其中Lz < Ln,若Ln为0, 则Ly/Lz的值为0)。例如,假设某网站首页内容的大小为1000Kb,指向自身网站其它页面的链接数为310个,指向外部网站的链接数为27个,分析排序单元从首页随机选择5个指向该网站其它页面的链接,发现只有4个链接是有效链接,其中一个链接指向的网页不存在, 将以上数据代入公式V= 10001/3* (1000/10+1. 5*310+271/3)* (4/5) VlOOO= 10*(100+465+3)*0. 4096/1000 = 2. 326528,由此得出该网站的级别约为2. 3。响应用户查询的时候,之所以采用简易计算法给网站评级,一方面是出于缩短处理时间的考虑;另一个原因是前面得出的推论在索引数据库找不到的域名主体,出现多个相同域名主体的网站的几率极小,所以可以采用简易计算法给少数几个网站评级。现举例说明第一条分支的实施方法,假设用户A输入的关键词为“abc”,过滤后的有效域名共三个,分别为“abc. CN”、“abc. PT”和“abc. 0RG”,用简易计算法给上述3个域名对应的网站评级如下“abc. CN” = 2. l、“abc. PT” = I. 9、“abc. ORG” = I. 8,若根据用户A基本信息对上面三个域名进一步筛选,发现没有符合的域名,也就是筛选出的相关网站数量为0,则按级别由高到低次序对过滤后的三个域名进行排序,生成全排序结果“abc. CN、abc. PT、abc. 0RG”,并将全排序结果作为查询结果返回给用户;若根据用户A基本信息对上面3个域名筛选后发现只有“abc. CN”符合,即相关网站数量为1,则将“abc. CN”返回给用户;若根据用户A基本信息对上面三个域名筛选后发现“abc. CN”和“abc. PT”符合,即相关网站数量为2,则按级别由高到低次序对这2个相关网站进行排序,生成相关排序结果 “abc. CN、abc. PT”,并将相关排序结果作为查询结果返回给用户。当用户获得查询结果时,按“ENTER”键或其它按键/按钮即可访问所述查询结果中排第一的域名对应的网站;用户也可以通过鼠标或键盘/按键/按钮选择所述查询结果中的其它域名。例如,假设用户输入的域名主体为“域名A”,查询结果为“域名A. com. cn、 域名A. net、域名A. CN、域名A. com、域名A. tw、域名A. hk”,该用户输入“域名A”后直接按 “ENTER”键就可以访问查询结果中排第一的网址“www.域名A. com. cn”。查询结果在用户设备中可以以多种形式呈现,一个优选方案是以动态下拉菜单的形式出现在用户设备的显示窗口,如图4所示,用户可以通过键盘上下方向键或鼠标点击下拉菜单中的任一个网址, 在默认设置中,用户直接按“ENTER”键访问的是下拉菜单中排第一也就是查询结果中排第一的网站。动态下拉菜单展示查询结果可以用多种方法实现,例如,利用JavaScript通过XMLHTTP获得索引数据库整理出来的索引数据,并动态生成一个IFRAME显示出来(注, JavaScrip是一种面向对象的动态类型的客户端脚本语言;XMLHTTP是一组应用程序编程接口函数集,可被JavaScript调用,通过HTTP在浏览器和索引数据库之间收发数据,可以动态地在用户设备的显示窗口更新查询结果;IFRAME也就是文档中的文档,或者像浮动的框架,可以实现如图4所展示的下拉菜单的效果)。在过滤后的有效网站的域名数量> I时所引出的第二条分支是生成全排序结果和分类排序结果,最后是将生成的全排序结果和分类排序结果加入到以所述用户输入的域名主体作为关键词的索引表,并存入索引数据库中以供下一次查询使用。第二条分支是执行上述响应用户查询过程中的步骤S314至步骤S316,这个过程与与前面建立索引数据库中的步骤S104至步骤S106相同,目的是补充索引数据库的关键词和索引表,这里不再重复描述。第二条分支可以与第一条分支同时进行,也可以在第一条分支处理完用户查询后的空闲时间运行。处理第二条分支时可以用常规的网站分析方法给网站评级,也可以采用第一条分支所用的简易计算法。在一个优选实施例中,步骤S20还包括接收用户输入的引用用户,且引用用户的信息的权重在分类排序结果类型的设置和用户的历史访问记录之间。相应地,步骤C2还包括根据所引用用户的信息对全排序结果或分类排序结果进行筛选。实施该技术方案,可以允许用户引用其他用户的基本信息来作为排序的依据,比如,允许用户A引用注册用户B的偏好设置,或者引用注册用户B的全部信息,所引用的信息也作为用户A的信息的一部分, 索引数据库就可以根据这些信息提供更精准的排序结果。在另一个优选实施例中,为保证在索引数据库中根据用户输入的域名主体查询时,更接近用户需求,更准确地查询到所对应的完整域名的信息,该网站访问方法还包括 对索引数据库进行更新。例如,根据下列中的至少一个对索引数据库进行更新(I)根据注册用户的主动反馈更新索引数据库;(2)根据多个用户的历史访问记录更新索引数据库;
(3)定期搜索新网站以更新索引数据库。下面具体说明这三种情况(I)根据注册用户的主动反馈更新索引数据库。具体如下接收第一注册用户(例如注册用户A)所反馈的优先级域名或黑名单域名,并将其提交至索引数据库;索引数据库将第一注册用户所输入的优先级域名或黑名单域名分配给至少一个其他注册用户(例如注册用户B、C、D、E等),以进行调查;注册用户B、C、D、E等接受任务后,调查用户A提交的优先级域名或黑名单域名对应的网站,并将调查结果返回给索引数据库。然后,索引数据库根据注册用户B、C、D、E等的调查结果,按一定的规则评价注册用户A的反馈是否准确(比如根据少数服从多数,或者综合注册用户B、C、D、E等的权重相加减来做更精确的评价)。若评价结果证实注册用户A的反馈与调查结果相符,则增加注册用户A的权重值或给予适当奖励,同时更新索引数据库的索引表;反之则不更新索引数据库,且降低注册用户A的权重值或给予适当惩罚。另外,注册用户B、C、D、E等的权重值的增减也与他们的调查结果是否准确相关联。应当说明的是,注册用户的权重值是用来评价注册用户的价值和分辨能力的一个指标,用VIP来表示。例如,规定刚注册用户的VIP值为1,每过一个月VIP增加0. I ; 用户准确提交一个正确的优先级域名或黑名单域名,则其VIP增加0. 2,反之则减少0. 2 ;注册用户准确调查一个域名,则其VIP增加0. I,反之则减少0. I。下面以一个具体例子来说明例如,假设注册用户A把“域名100. com”作为黑名单域名提交给索引数据库,并附上理由是“带病毒的网站”。索引数据库将调查“域名100. com”的信息向其他VIP值彡I的注册用户发布,假设注册用户B、C、D、E等4人主动申请了这一任务。在规定时间内,注册用户B、C、D、E将调查结果返回给索引数据库。索引数据库可以以多种方式接收调查结果,比如可以以选择按钮的形式当注册用户B、C、D、E使用浏览器打开用于提交调查结果的页面时,可以通过鼠标点击页面内的单选按钮来选择“是带病毒的网站”或者“不是带病毒的网站”,索引数据库根据他们的点击就可获得调查结果。然后索引数据库通过统计所有的调查结果来评价注册用户A的反馈是否准确。假设注册用户B、C、D三人的调查结果为“是带病毒的网站”,注册用户E的调查结果为“不是带病毒的网站”,根据少数服从多数的原则,索引数据库由此判断“域名100. com是带病毒的网站”,注册用户A的反馈和注册用户B、C、D的调查结果是正确的,而注册用户E的调查结果是错误的。然后,索引数据库会将“域名100. com”从排序结果剔除。索引数据库经过修订后,除了那些将“域名100. com”设为优先级的用户外,其他用户再输入“域名100”时,查询结果不会出现“域名100.com”。普通用户只能通过输入带后缀的域名,才能访问“域名100.com”。 索引数据库修订排序结果的同时,给注册用户A的VIP值加0. 2,注册用户B、C、D的VIP值分别增加0. I。注册用户E因为调查结果不正确,VIP值减少0. I。索引数据库也可以结合参与调查的用户的VIP值来判断调查结果。例如,假设注册用户A把“域名100. com”作为优先级域名提交给索引数据库,并附上理由是“域名100. com”比排第一位的“域名100. 0RG”内容更丰富,有更多用户访问,建议“域名100. com”排在“域名100.0RG”前面。注册用户B、C、D、E参与调查。返回的调查结果是注册用户B、C 赞成注册用户A的提议,注册用户D、E反对。假设注册用户B、C、D、E的VIP值分别是I. 5、 I. 3,3. 5和2. 6,注册用户B、C的VIP值相加为I. 5+1. 3 = 2. 8,而注册用户D、E的VIP值之和为6. I。索引数据库根据反对方的VIP值大于赞成方的VIP值,从而断定注册用户A的反馈是错误的,索引数据库不用修订。同时将用户A的VIP值减少0. 2,注册用户D、E的VIP 值则分别增加0. 1,注册用户B、C因为调查结果不正确,VIP值分别减少0. I。(2)根据多个用户的历史访问记录更新索引数据库。具体如下分别获取多个用户对相同域名主体的不同网站的访问次数;索引数据库根据访问记录提供的数据统计上述各网站的访问率;分析排序单元根据统计结果修订索引表中的分类排序结果或全排序结果。其中,网站访问率可以用如下公式计算网站访问率V= (P1+P2+P3+......+Pn) /N其中,P1、P2、P3......Pn分别为N个用户访问所统计的网站的概率。计算方式为
Pn = Fn/Sn,这里,Fn为第N个用户访问所统计网站的次数,Sn为第N个用户访问域名主体与所统计网站相同的所有网站的总次数。例如,假设索引数据库需要修订关键词为“abc”的“适用于中国用户”的分类排序结果,原有的分类排序结果为“abc. NET”、“abc. CN”、“abc. 0RG”。索引数据库从中国用户中随机选择多个用户,为方便说明,定为3个,分别为用户Yl、Y2和Y3,获取他们在过去一个月内访问上述网站的次数。访问记录显示,用户Yl访问上述3个网站的次数依次为4次、20 次和I次;用户Y2访问上述3个网站的次数依次为6次、92次和2次;用户Y 3访问上述3 个网站的次数依次为45次、2次和3次。然后根据访问记录提供的数据统计上述各网站的访问率。先统计“abc. NET”,用户Yl访问“abc. NET”4次,访问分类排序结果中所有网站的次数为=4+20+1 = 25,则用户Yl访问“abc. NET”的概率为:4/25 = 0. 16 ;同理,可以计算出用户Y2访问“abc NET”的概率为:6/100 = 0. 06 ;用户Y3访问“abc. NET”的概率为:45/50 = 0. 9,代入公式可计算出网站“abc. NET”的访问率 V = (Pl+P2+P3)/3 = (0. 16+0. 06+0. 9)/3 = 0.373。同样地,可以算出网站“abc. CN”的访问率=(0. 8+0. 92+0. 04)/3 = 0. 587。网站“abc. 0RG”的访问率=(0. 04+0. 02+0. 06)/3 = 0. 04。统计结果表明“abc. CN”的访问率最高,超过排第一的网站“abc. NET”。按规则,访问率高的域名应该排在前面,所以要将排序结果修订为“abc. CN, abc. NET, abc.ORG”。按同样的方法可以修订其他分类排序结果和全排序结果。(3)定期搜索新网站以更新索引数据库。互联网上每天都有网站开通,每天都有网站关闭,仅依靠前两种修订索引数据库的方案显然是不能及时获得上述网站的信息。为此, 索引数据库可以通过定期搜索新网站来更新索引表。搜索新网站可采用与之前建立索引数据库相同的穷举法,也就是搜索设定范围内的所有关键词。修订索引数据库时所搜索的关键词包括(a)域名命名规则有变化时,新命名规则允许的关键词;(b)索引数据库内现有的关键词。上述条件(a)的关键词是索引数据库没有的,例如,假设建立索引数据库时不允许用中文作为域名主体,所以索引数据库没有这类域名,后来域名命名规则有变更,允许中文作为域名主体,这就需要补充这类关键词的索引表。方法可采用与之前建立索引数据库相同的流程,不再重复。上述条件(b)是用来修订现有关键词的索引表,分别对索引数据库里所有关键词的索引表定期更新。修订步骤与之前建立索引数据库类似,例如,包括(I)将索引数据库的某关键词分别与所有后缀匹配,组成多个完整域名,然后进行过滤,删除不存在的域名,并访问所述过滤后的域名对应的网站,对过滤后的域名所对应的网站进行分析,从中提取简单的信息和内容,根据所述的简单的信息和内容对所述的过滤后的域名进行分类,形成分类域名;
(2)参考所述关键词原有的全排序结果对所述过滤后的域名进行排序,生成新的全排序结果;(3)参考所述关键词原有的分类排序结果对所述分类域名进行排序,生成新的分类排序结果;(4)将新的全排序结果和新的分类排序结果替换掉原有的排序结果并存入所述关键词的索引表。在上述步骤(I)中,与建立索引数据库所不同的是只需从过滤后的域名对应的网站提取简单的信息和内容,比如通过蜘蛛程序抓取网站首页,提取的信息和内容主要用来给网站分类。根据的语言和/或地区来细分网站,与之前建立索引数据库所采用分类方法相同。所述的分类域名并没有给各个域名排序,仅对过滤后的域名分类。在上述步骤(2)中,参考所述关键词原有的全排序结果对所述过滤后的域名进行排序,具体地,原有全排序结果存在的域名排在前面并按原有全排序结果的相对先后次序排序,原有全排序结果不存在的域名也就是新域名排在后面。例如,索引数据库需修订的关键词为“abc”的索引表,原有全排序结果为“abc. net”、“abc. cn”、“abc. pt”、“abc. org”、 “abc. com” “abc. cc”,经过一个月后,索引数据库用上述订步骤⑴对以“abc”为域名主体的进行过滤,删除不存在的域名,过滤后的域名“abc. cc”、“abc. s o”、“abc. tv”、“abc. cn”、 “abc. pt”、“abc. org”。过滤后的域名“abc. so”、“abc. tv”没有出现在原有全排序结果中, 应排在后面;过滤后的域名“abc. cc”、“abc. cn”、“abc. pt”、“abc. org”同时出现在原有全排序结果中,应排前面。然后按原有全排序结果的相对先后次序排序,形成新的全排序结果 “abc. cn”、“abc. pt,,、“abc. org”、“abc. cc”、“abc. so”、“abc. tv”,应当说明的是,修订索引表时把新域名放在后面,新域名之间的先后顺序可任意。在上述步骤(3)中,参考所述关键词原有的分类排序结果对所述分类域名进行排序,与上述步骤(2)的原理相同。例如,假设关键词“aaa”分类域名有两组面向中文用户的分类域名“aaa. com”、“aaa. net”、“aaa. cn”和面向英文用户的分类域名“aaa. org”、“aaa. edu”;原有的分类排序结果有两组面向中文用户的分类域名“aaa. com”、“aaa. cn”和面向法文用户的分类域名“aaa.0rg”、“aaa.net”。先对面向中文用户的分类域名进行排序,按规定,面向中文用户的分类域名“aaa. com”、“aaa. cn”同时出现在面向中文户的分类排序结果中,应排前面;而“aaa. net”仅出现在面向法文用户的分类排序结果中,没有出现在面向中文户的分类排序结果中,按规定应排后面,形成新的面向中文用户的分类排序结果“aaa. com”、“aaa. cn”、“aaa. net”;接着对面向英文用户的分类域名进行排序,原有索引表没有面向英文用户的分类排序结果,所以面向英文用户的分类域名“aaa. org”、“aaa. edu”都相当于新域名,按规定新域名之间的先后顺序可任意,最后得出新的面向英文用户的分类排序结果 “aaa. org,,、“aaa. edu,,。在上述步骤(4)中,用上步骤(2)和步骤(3)获得的排序结果代替原有的排序结果,所述关键词的索引表修订完毕后,继续修订索引数据库下一个关键词的索引表,直至所有关键词的索引表全部更新。本发明还兼顾用户自由选择的需求,与按现有的技术相同,允许用户输入带后缀的完整域名,然后按“ENTER”键或其它按键/按钮直接访问完整域名对应的精确网址。图5是本发明网站访问系统实施例一的逻辑图,该网站访问系统包括索引数据库建立模块10、用户输入模块20和查询模块30。其中,索引数据库建立模块10用于预先建立索引数据库,所述索引数据库存储有多个域名主体及与每个域名主体对应的至少一个关于完整域名的信息;用户输入模块20用于接收用户输入的特定网站所对应的特定域名的主体,并将所述特定域名的主体通过网页服务器传送到索引数据库;查询模块30用于在索引数据库中以所述特定域名的主体为关键词查询所述特定域名的主体所对应的完整域名的信息,并将查询结果返回给用户。图6是本发明网站访问系统实施例二的逻辑图,该网站访问系统包括索引数据库建立模块10、用户输入模块20、查询模块30和更新模块40。其中,索引数据库建立模块
10、用户输入模块20和查询模块30与图5所示的实施例一中索引数据库建立模块10、用户输入模块20和查询模块30的逻辑结构相同,在此不做赘述,以下仅说明更新模块40,该更新模块40用于对索引数据库进行更新。优选地,更新模块40用于根据下列中的至少一个来更新索引数据库根据注册用户的主动反馈更新索引数据库;根据多个用户的历史访问记录更新索引数据库;定期搜索新网站以更新索引数据库。图7是上述实施例中索引数据库建立模块10的逻辑结构图,该索引数据库建立模块10可进一步包括关键词生成单元101、第一组合单元102、过滤单元103、第一全排序单元104、第一存储单元105、第一分类排序单元106和第二存储单元107。其中,关键词生成单元101用于生成新的关键词作为域名主体;第一组合单元102用于将所生成的域名主体与所有域名后缀进行匹配,组合成多个完整的域名;过滤单元103用于将所述多个完整的域名进行过滤,以删除不存在的域名;第一全排序单元104用于对过滤后的域名所对应的网站进行分析,并根据分析结果对所述过滤后的域名进行排序,以生成全排序结果,优选地, 第一全排序单元104对过滤后的域名所对应的网站进行以下分析更新频率、注册时间、网站内容量、采用的语言、网站服务器IP所对应的地区、链接关系及域名后缀信息;第一存储单元105用于将所述全排序结果存入索引数据库。第一分类排序单元106用于将所述全排序结果按照过滤后的域名所对应的网站的语言和/或地区进行分类排序,以生成分类排序结果;第二存储单元107用于将所述分类排序结果存入索引数据库。
图8是上述实施例中查询模块30的逻辑结构图,所述查询模块30包括查询及判断单元301、第一返回单元302、第二组合单元303、过滤及判断单元304、第二返回单元305、 第三存储单元306、第三返回单元307、第四返回单元308、筛选单元309、数量判断单元310、 第四返回单元311、第五返回单元312、第六返回单元313、第二全排序单元314、第二分类排序单元315、第五存储单元316。其中,查询及判断单元301用于在索引数据库中以所述特定域名的主体为关键词进行查询,并判断是否查询到与所述特定域名的主体对应的完整的域名的信息;第一返回单元302用于在查询到与所述特定域名的主体对应的完整的域名的信息时,根据用户信息对全排序结果或分类排序结果进行筛选,并将筛选后的排序结果作为查询结果返回给用户,优选地,所述用户信息包括未注册用户信息或注册用户信息,且未注册用户信息包括用户IP地址、与用户IP地址相关的历史访问记录、分类排序结果类型的设置;注册用户信息包括用户地址、用户偏好设置、用户IP地址、用户的历史访问记录,且按照权重由高到低的顺序排列为用户偏好设置、分类排序结果类型的设置、用户的历史访问记录、与用户IP地址相关的历史访问记录、用户地址、用户IP地址;第二组合单元303用于在没有查询到与所述特定域名的主体对应的完整的域名的信息时,将所述特定域名的主体与所有域名后缀进行匹配,组合成多个完整的域名;过滤及判断单元304用于将所述多个完整的域名进行过滤,以删除不存在的域名,并判断过滤后的域名的数量;第二返回单元 305用于在过滤后的域名的数量为0时,向用户反馈域名不存在;第三存储单元306用于在过滤后的域名的数量为0时,将所述特定域名的主体不存在完整域名的信息存储至索引数据库;第三返回单元307用于在过滤后的域名的数量为I时,向用户反馈该过滤后的域名; 第四存储单元308用于在过滤后的域名的数量为I时,将所述特定域名的主体所对应的唯一完整的域名存储至索引数据库;筛选单元309用于在过滤后的域名的数量大于I时,对过滤后的域名所对应的网站进行分析,并根据分析结果和用户信息从所述过滤后的域名所对应的网站中筛选出相关网站;数量判断单元310用于判断所述相关网站的数量;第四返回单元311用于在相关网站的数量为0时,对过滤后的域名所对应的网站进行分析,并根据分析结果对所述过滤后的域名进行排序,以生成全排序结果,并将全排序结果返回给用户;第五返回单元312用于在相关网站的数量为I时,将该唯一的相关网站的域名返回给用户;第六返回单元313用于在相关网站的数量大于I时,对相关网站进行分析,并根据分析结果生成相关排序结果,并将相关排序结果作为查询结果返回给用户。第二全排序单元314用于在过滤后的域名的数量大于I时,对过滤后的域名所对应的网站进行分析,并根据分析结果对所述过滤后的域名进行排序,以生成全排序结果;第二分类排序单元315用于将所述全排序结果按照过滤后的域名所对应的网站的语言和/或地区进行分类排序,以生成分类排序结果;第五存储单元316用于将所述全排序结果和分类排序结果存入索引数据库。以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
权利要求
1.一种网站访问方法,其特征在于,包括A.预先建立索引数据库,所述索引数据库存储有多个域名主体及与每个域名主体对应的至少一个关于完整域名的信息;B.接收用户输入的特定网站所对应的特定域名的主体,并将所述特定域名的主体通过网页服务器传送到索引数据库;C.在索引数据库中以所述特定域名的主体为关键词查询所述特定域名的主体所对应的完整域名的信息,并将查询结果返回给用户。
2.根据权利要求I所述的网站访问方法,其特征在于,所述网站访问方法还包括D.对索引数据库进行更新。
3.根据权利要求I所述的网站访问方法,其特征在于,所述步骤A包括Al.生成新的关键词作为域名主体;A2.将所生成的域名主体与所有域名后缀进行匹配,组合成多个完整的域名;A3.将所述多个完整的域名进行过滤,以删除不存在的域名;A4.对过滤后的域名所对应的网站进行分析,并根据分析结果对所述过滤后的域名进行排序,以生成全排序结果;A5.将所述全排序结果存入索引数据库。
4.根据权利要求3所述的网站访问方法,其特征在于,所述步骤A4和步骤A5之间还包括A6.将所述全排序结果按照过滤后的域名所对应的网站的语言和/或地区进行分类排序,以生成分类排序结果;所述步骤A5还包括将所述分类排序结果存入索引数据库。
5.根据权利要求4所述的网站访问方法,其特征在于,所述步骤C包括Cl.在索引数据库中以所述特定域名的主体为关键词进行查询,并判断是否查询到与所述特定域名的主体对应的完整域名的信息,若是,则执行步骤C2 ;若否,则执行步骤C3 ; C2.根据用户信息对全排序结果或分类排序结果进行筛选,并将筛选后的排序结果作为查询结果返回给用户;C3.将所述特定域名的主体与所有域名后缀进行匹配,组合成多个完整的域名;C4.将所述多个完整的域名进行过滤,以删除不存在的域名,并判断过滤后的域名的数量,若过滤后的域名的数量为0,则执行步骤C5 ;若过滤后的域名的数量为1,则执行步骤 C6 ;若过滤后的域名的数量大于1,则执行步骤C7 ;C5.向用户反馈域名不存在;C6.向用户反馈该过滤后的域名;C7.对过滤后的域名所对应的网站进行分析,并根据分析结果和用户信息从所述过滤后的域名所对应的网站中筛选出相关网站;CS.判断所述相关网站的数量,若相关网站的数量为0,则执行步骤C9 ;若相关网站的数量为1,则执行步骤ClO ;若相关网站的数量大于1,则执行步骤Cll ;C9.对过滤后的域名所对应的网站进行分析,并根据分析结果对所述过滤后的域名进行排序,以生成全排序结果,并将全排序结果返回给用户;C10.将该唯一的相关网站的域名返回给用户;CU.对相关网站进行分析,并根据分析结果生成相关排序结果,并将相关排序结果作为查询结果返回给用户。
6.根据权利要求5所述的网站访问方法,其特征在于,在步骤C4中,若过滤后的域名的数量为0,还执行步骤C12 ;若过滤后的域名的数量为1,还执行步骤C13 ;若过滤后的域名的数量大于1,还执行步骤C14;C12.将所述特定域名的主体不存在完整域名的信息存储至索引数据库;C13.将所述特定域名的主体所对应的唯一完整的域名存储至索引数据库;C14.对过滤后的域名所对应的网站进行分析,并根据分析结果对所述过滤后的域名进行排序,以生成全排序结果;C15.将所述全排序结果按照过滤后的域名所对应的网站的语言和/或地区进行分类排序,以生成分类排序结果;C16.将所述全排序结果和分类排序结果存入索引数据库。
7.根据权利要求2所述的网站访问方法,其特征在于,在所述步骤D中,根据下列中的至少一个对索引数据库进行更新根据注册用户的主动反馈更新索引数据库;根据多个用户的历史访问记录更新索引数据库;定期搜索新网站以更新索引数据库。
8.根据权利要求7所述的网站访问系统,其特征在于,根据用户的主动反馈更新索引数据库的步骤包括Dl.接收第一注册用户所反馈的优先级域名或黑名单域名,并将其提交至索引数据库;D2.索引数据库将第一注册用户所输入的优先级域名或黑名单域名分配给至少一个其他注册用户,以进行调查;D3.至少一个其他注册用户对所述优先级域名或黑名单域名所对应的网站进行调查, 并将调查结果返回给索引数据库;D4.索引数据库根据调查结果,评价所述第一注册用户的反馈是否准确;D5.若第一注册用户的反馈与调查结果相符,则根据第一注册用户的反馈更新索引数据库;反之,则不更新索引数据库。
9.根据权利要求3所述的网站访问方法,其特征在于,对过滤后的域名所对应的网站进行以下分析更新频率、注册时间、网站内容量、采用的语言、网站服务器IP所对应的地区、链接关系及域名后缀信息。
10.根据权利要求5所述的网站访问方法,其特征在于,所述用户信息包括未注册用户信息或注册用户信息,且未注册用户信息包括用户IP地址、与用户IP地址相关的历史访问记录、分类排序结果类型的设置;注册用户信息包括用户地址、用户偏好设置、用户IP 地址、用户的历史访问记录。
11.根据权利要求10所述的网站访问方法,其特征在于,所述用户信息按照权重由高到低的顺序排列为用户偏好设置、分类排序结果类型的设置、用户的历史访问记录、与用户IP地址相关的历史访问记录、用户地址、用户IP地址。
12.根据权利要求11所述的网站访问方法,其特征在于,所述步骤B还包括接收用户输入的引用用户,且引用用户的信息的权重在分类排序结果类型的设置和用户的历史访问记录之间;步骤C2还包括根据所引用用户的信息对全排序结果或分类排序结果进行筛选。
13.一种网站访问系统,其特征在于,包括索引数据库建立模块,用于预先建立索引数据库,所述索引数据库存储有多个域名主体及与每个域名主体对应的至少一个关于完整域名的信息;用户输入模块,用于接收用户输入的特定网站所对应的特定域名的主体,并将所述特定域名的主体通过网页服务器传送到索引数据库;查询模块,用于在索引数据库中以所述特定域名的主体为关键词查询所述特定域名的主体所对应的完整域名的信息,并将查询结果返回给用户。
14.根据权利要求13所述的网站访问系统,其特征在于,所述网站访问系统还包括更新模块,用于对索引数据库进行更新。
15.根据权利要求13所述的网站访问系统,其特征在于,所述索引数据库建立模块包括关键词生成单元,用于生成新的关键词作为域名主体;第一组合单元,用于将所生成的域名主体与所有域名后缀进行匹配,组合成多个完整的域名;过滤单元,用于将所述多个完整的域名进行过滤,以删除不存在的域名;第一全排序单元,用于对过滤后的域名所对应的网站进行分析,并根据分析结果对所述过滤后的域名进行排序,以生成全排序结果;第一存储单元,用于将所述全排序结果存入索引数据库。
16.根据权利要求15所述的网站访问系统,其特征在于,所述索引数据库建立模块还包括第一分类排序单元,用于将所述全排序结果按照过滤后的域名所对应的网站的语言和 /或地区进行分类排序,以生成分类排序结果;第二存储单元,用于将所述分类排序结果存入索引数据库。
17.根据权利要求16所述的网站访问系统,其特征在于,所述查询模块包括查询及判断单元,用于在索引数据库中以所述特定域名的主体为关键词进行查询,并判断是否查询到与所述特定域名的主体对应的完整的域名的信息;第一返回单元,用于在查询到与所述特定域名的主体对应的完整的域名的信息时,根据用户信息对全排序结果或分类排序结果进行筛选,并将筛选后的排序结果作为查询结果返回给用户;第二组合单元,用于在没有查询到与所述特定域名的主体对应的完整的域名的信息时,将所述特定域名的主体与所有域名后缀进行匹配,组合成多个完整的域名;过滤及判断单元,用于将所述多个完整的域名进行过滤,以删除不存在的域名,并判断过滤后的域名的数量;第二返回单元,用于在过滤后的域名的数量为0时,向用户反馈域名不存在;第三返回单元,用于在过滤后的域名的数量为I时,向用户反馈该过滤后的域名;筛选单元,用于在过滤后的域名的数量大于I时,对过滤后的域名所对应的网站进行分析,并根据分析结果和用户信息从所述过滤后的域名所对应的网站中筛选出相关网站; 数量判断单元,用于判断所述相关网站的数量;第四返回单元,用于在相关网站的数量为0时,对过滤后的域名所对应的网站进行分析,并根据分析结果对所述过滤后的域名进行排序,以生成全排序结果,并将全排序结果返回给用户;第五返回单元,用于在相关网站的数量为I时,将该唯一的相关网站的域名返回给用户;第六返回单元,用于在相关网站的数量大于I时,对相关网站进行分析,并根据分析结果生成相关排序结果,并将相关排序结果作为查询结果返回给用户。
18.根据权利要求17所述的网站访问系统,其特征在于,所述查询模块还包括 第三存储单元,用于在过滤后的域名的数量为0时,将所述特定域名的主体不存在完整域名的信息存储至索引数据库;第四存储单元,用于在过滤后的域名的数量为I时,将所述特定域名的主体所对应的唯一完整的域名存储至索引数据库;第二全排序单元,用于在过滤后的域名的数量大于I时,对过滤后的域名所对应的网站进行分析,并根据分析结果对所述过滤后的域名进行排序,以生成全排序结果;第二分类排序单元,用于将所述全排序结果按照过滤后的域名所对应的网站的语言和 /或地区进行分类排序,以生成分类排序结果;第五存储单元,用于将所述全排序结果和分类排序结果存入索引数据库。
19.根据权利要求14所述的网站访问系统,其特征在于,所述更新模块用于根据下列中的至少一个来更新索引数据库根据注册用户的主动反馈更新索引数据库;根据多个用户的历史访问记录更新索引数据库;定期搜索新网站以更新索引数据库。
20.根据权利要求17所述的网站访问系统,其特征在于,所述用户信息包括未注册用户信息或注册用户信息,且未注册用户信息包括用户IP地址、与用户IP地址相关的历史访问记录、分类排序结果类型的设置;注册用户信息包括用户地址、用户偏好设置、用户 IP地址、用户的历史访问记录。
全文摘要
本发明公开了一种网站访问方法和系统,该方法包括A.预先建立索引数据库,所述索引数据库存储有多个域名主体及与每个域名主体对应的至少一个关于完整域名的信息;B.接收用户输入的特定网站所对应的特定域名的主体,并将所述特定域名的主体通过网页服务器传送到索引数据库;C.在索引数据库中以所述特定域名的主体为关键词查询所述特定域名的主体所对应的完整域名的信息,并将查询结果返回给用户。本发明还构造一种网站访问系统。实施本发明的技术方案,用户无需输入域名的后缀即可访问到该特定网站,节约了用户访问网站的时间,并且避免了由于后缀的拼写错误带来的麻烦,从而提高了用户体验。
文档编号G06F17/30GK102609473SQ20121001630
公开日2012年7月25日 申请日期2012年1月17日 优先权日2012年1月17日
发明者钟进发 申请人:钟进发
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1