提供含有特殊字符的互联网地址的方法

文档序号:7724990阅读:271来源:国知局
专利名称:提供含有特殊字符的互联网地址的方法
技术领域
本发明涉及在计算机网络(互联网)中提供含有特殊字符的互联网地址(域)的方法。
在选择互联网地址时,在浏览器中标志http//的后面以字母、数字、连字符等形式输入相应的互联网地址,通常,这些字母、数字、连字符等的总数受所谓ASCII(美国标准信息交换码)的限制。此地址借助于互联网中的域名服务器(DSN)被转换为数字的密钥,即所谓的IP地址(互联网协议地址),并起动连接程序。
上述方法的缺点在于,变音字母以及其它诸如“&”和类似的特殊字符不能使用。在IT领域,并且也在互联网中由于英语的限制上述字符都用元音组替代,例如“ü”用“ue”代替,“”用“ae”代替。因而在德国Müller先生的域用“Mueller.de”代替,同样公司名C&A用“c-und-a.de”代替。为了允许采用包含特殊字符的域,所有至今已经使用的计算机和程序要进行更新。然而这意味着很难访问现有域名系统结构。实际上,尤其是基于经济上的原因这是不能接受的。信息链中一个丢失的环节将足以令包含特殊字符的一个域不能被辩认。
在计算机网络中多台计算机被连接起来。每台这样的计算机必须在此网络中可以被唯一识别。在目前的最大型网络中,即在互联网中,单个的计算机(主机)通过所谓的IP地址而被唯一地识别。
因为记住许多主机IP地址对于人们来说是困难的,因此引入了一个系统,它为一个IP地址分配了一个域名。这个系统称为域名系统。所谓的域名服务器(DNS)给出有关域名与IP地址间对应关系的信息。在域名系统内规定关于域名的某些约定。如标志以一个字母开始,以一个字母或一个数字结束,并且在中间有字母、数字或连字符。例如标志为www.mueller.de,www.bochum.de,www.eu.com或www.sms.t-online.de。
域名空间被设计为树状结构。从树根(root)出发,随后是常用的顶级域(gTLDs),如“de”,“com”或“org”。它们进一步划分为子域。附图中示出顶级域“com”的一个小片段,它具有子域“us”和“eu”。最后树叶标识各个网络资源(大多为主机或路由器),例如在

图1中为“www”或“mail”。
域名空间的DNS管理含有域名空间树中的一个节点和此节点以下的所有分支的区域。通过在树的不同深度上的域名服务器,不同DNS的区域相互重迭。一个DNS识别比它更高的DNS和比它更低的DNS。
DNS的主要任务是将IP地址分配给域名或者相反。用户程序(例如浏览器)不能自己完成这种查询(询问)。大多数操作系统集成了这种服务。用户程序可借助于操作系统调用取得这些信息。解析器(Resolver)承担对DNS的查询。为了提高效率,所有的解析器具有一个本地高速缓存器(中间存储器),从而它们可快速应答多重查询。图II示出一个这样的标准查询一个标准的DNS查询过程如下(1)一个用户程序有一个域名,并希望得到该域名对应的IP地址。
(2a)用户程序发出一个查询到解析器并等待它应答。
解析器检查应答是否已经在高速缓存器中,如果是的话,解析器回传此应答。
(2b)如果应答还没有在高速缓存器中出现,则解析器在其一方发出一个询问到一个DNS。
(3)DNS向解析器返送所要的应答。
(4)解析器在其高速缓存器中复制此应答,并且同时将此应答传送给用户程序。
但是可能存在以下情况第一个被查询的DNS对解析器提出的询问没有给出应答。在此情况下存在两种可能第一个被查询的DNS自行寻找能对此询问作出应答的其他DNS,在这种情况下解析器不改变,它只是等待,直至从“它的”DNS得到一个应答。这种询问方式被称为“循环的”。图III示出一个循环查询。
循环DNS查询过程如下;(1)由解析器发出一个询问给某个DNS。在此询问中还包含此询问应被“循环”执行的信息。
(2)如果第一个被查询的DNS没有显示对此询问的应答,该DNS继续将此询问转发到另一个DNS,其中第一个被查询的DNS猜测此另一个DNS能给出应答。
(3)如果这个DNS也显示没有答复,它将此消息返送回来并告之它是否知道一个可能给出应答的DNS。这个过程可多次反复。
(4)最后第一个DNS抵达一个知道此答案的DNS。大多数情况这是一个所谓的授权域名服务器。
(5)对此询问的应答被返送回解析器。
如果第一个DNS不能为对它的询问提出答案,则另一个DNS将被推荐,解析器必须重新查询此DNS。这个过程可以多次反复,直至最后解析器查询一个DNS,它能提供应答。此方法被示于图III中。
WO 00/56036涉及用使域国际化的方法。其中采用一个中间程序,它必须被相应浏览器下载。此程序由域产生一个ASCII字符序列,并连续传送此序列。为了域能被域名服务器(DNS)辨认,字符序列必须寄存在服务器中。为了寄存含有特殊字符的互联网地址,此地址被输入单码系统并转换为拉丁文字母。此变换被称为RACE,它是基于行的ASCII兼容编码。因此,此域必须以ASCII码寄存在DNS中,例如作为bq-bhasutr.com,以使它能被DNS识别。因而,为了在全世界范围内允许使用含有这些特殊字符的域,必须对所有的DNS做改动。此外,为了进行检测,所有查询首先要被传到一个高性能的DNS服务器,因为不这样后面的常规DNS就不能实现上述变换。
WO 00/50966建议在计算机网络中设一个中间服务器,它接受所有的查询并继续传送这些查询给DNS根服务器。在此应进行类似于前面所述的方法的识别,IP地址被送回中间服务器,然后中间服务器将其回传送给用户。WO99/40511公开了相同方式的解决方柔。
所有已提出的解决方案建议都要求改变现有系统,即以附加模块的方式改变浏览器的网络单元或改变不输入特殊字符的DNS,才能可靠地辩认域名中的特殊字符。
因此本发明的任务在于,为使用含有特殊字符的域名提出简单且经济的解决方案,它在保持现有用于非特殊字符域的DNS服务器结构下就可应用。
本发明任务由权利要求1所述方法完成。
本发明给出一种用于在计算机网络中提供含有特殊字符的互联网地址的方法。其中,当域被一个用户调用时首先由现有的解析器转换为一个书写字符码。此书写字符码被传输到第一个DNS,即所谓的根服务器。转换后的书写字符码是一个二进制字符或16进制字符序列,如果此书写字符码不能被第一个DNS识别,则此书写字符码被继续传送给至少一个另外的DNS,在那里通过顺序比较运算求出此书写字符码所对应的现有数字密钥(IP地址),并将它返传给用户。
如果书写字符码可以被第一个DNS部分解码,则借助于已识别的部分密钥连接另一个DNS。它进行进一步的解码。以此顺序继续连接其它的DNS,直至被调用的互联网地址完全被解码,并且最终作为IP地址传送给用户。
一个互联网地址,例如huser.eu.com,按照本发明将从后向前被解码(也可以从图V和图VI看出)。第一个连接的DNS识别结尾“.com”。它将此查询转发到下一级,即另一个DNS被连接,它识别部分密钥“eu”。然后IP地址剩下的部分密钥不被常规的DNS识别,它对于常规的DNS而言在网络技术的意义上是一个无意义的数字序列。
这个无意义的数字序列在一个DNS上在顺序比较运算中被解码,并且在此作为非常规查询被变换为由一个数字序列构成的常规应答。即此书面字符码借助于顺序比较运算被分配给正确的IP地址,并且将它返转给用户。于是用户抵达他所要访问的互联网站。
图V示出本发明在使用特殊字符时的域名辩认和未知的特殊字符的识别或编码。
一个用户查询“huser.eu.com”这个域,并将其输入到用户的浏览器中。这个包含特殊字符“”的域根据所使用的浏览器或解析器转换为一个书写字符码,例如通过解析器B产生的书写字符码。“.h□§user”。然后此查询通过互联网传送到第一个DNS。这个DNS识别结尾“com”。在第二个DNS中完成书写字符码的进一步解码,其中部分密钥“eu”被解码。最后在第三个DNS中顺序的比较运算完成此书写字符码的二进制序列的完全解码。然后第三个DNS返传正确的IP地址到查询方或用户。对于第三个DNS也不能解码此被查询域的情况,可以将它登记在一个错误列表中。借助于此错误列表,第三个域名服务器的提供者可采取相应的措施。
所谓含有特殊字符的域是指含有除“ A/a”至“Z/z”,“0”至“9”和分隔符“.,-,@”之外字符的域。所有国际字符被视为特殊字符,甚至于当这些字符可能处在ASCII范围“A/a”至“Z/z”或“0”至“9”之内,然而在原来的浏览器中,即在请求器中没有表现为上述字符。
顺序比较运算指向一个分配表,按照本发明它含有由各种浏览器/解析器程序所产生的书面字符码的密钥,这些分配表被连续地遍历,并且存储在那里的序列与由用户的浏览器/解析器所产生的书写字符码进行比较。
浏览器或解析器将包含有同一个特殊字符的域转换为相互不同的单字符或多字符序列,含有这样的单字符或多字符序列的书写字符码不能被至今所使用的DNS识别。本发明的一个主要优点在于,对于一个特殊字符不再要求字节方式的对应或所产生的书写字符的分段,而是将域或包含特殊字符的域的书写字符码作为整体,即在整个长度上通过顺序的比较运算来识别。由于在分配表中现在作为一个整体直接登入各种浏览器和/或解析器所产生的书写字符码,这种域可以完全与符合至今已有协定的域一样地被识别,并且在一个域名服务器链中被考虑。
另一个优点是,仅当实际中特殊字符在域中出现时才需要用辩认含有特殊字符的域的DNS进行顺序比较运算。这样减轻了辩认含有特殊字符的域的DNS的负担。
倘若本发明方法在一个不能解码特殊字符的DNS中被应用,域名服务器的操作者处将给出一个错误信息;并且将此信息登入一个错误列表中。借助此错误列表,操作者可能要人工挑选出正确的、还没有正确编码的输入,并且必要时将这些输入保存到DNS的分配表中。
查明域在分配表中登录的正确性可通过人工输入“http//…”到各个生产商的浏览器中完成。这样来检查浏览器给出什么书写字符码以及什么IP地址对应此书写字符码。从而人工完成将书写字符码分配至正确的IP地址,然后书写字符码被登入DNS的分配表中。这必须对每个典型的浏览器族或对每个操作系统进行,从而至少一个或者在最坏的情况下对每个典型的浏览器族或操作系统在DNS的分配表中要完成一个附加登录。这个人工方法可通过具有权利要求2所述措施的自动的方法而明显改进。对于这些措施本权利要求独立的保护。
主要目的在于,或者是有时延地,或者是在线地处理一个错误列表同时要将明显的不识别错误作为可能的新书写字符码和/或新的未知浏览器或域名查询识别出来,而且在必要时插入一个校正登录到DNS的分配表中。这样可以使将来的相同请求器的查询正确地被识别,即对应到正确的IP地址并返传它。
按照权利要求2的特征,在一个可预先规定的时间段内,在一个DNS上被分析的非常规书写字符码作为对IP地址的正确的请求而被分析和存储,同时通过一个算法,将被存储的书写字符码中重复出现的非常规组成部分求出并标准化。接着书写字符码的标准化的组成部分被用作在顺序比较运算中识别具有同样的或类似的组成部分的书写字符码的基础。
通过收集非常规的、即在一个时间窗中不符合现有协定的书写字符码和以下假设非常规书写字符码作为正确的对IP址的请求而被分析,存在以下可能有针对性地用一个算法分析这些数据,尤其是求出重复出现的非常规组成部分并将其标准化。
码组成部分的标准化可按照权利要求3中所举出的判别标准中的一项或多项进行。首先检查书写字符码的这个组成部分是否能被分配给一个应用程序,尤其是配合主机的一个浏览器和/或解析器。从不同浏览器(请求器)收到的所有地址请求在此被分类为正确的,并且被对应于分配表中预先给定的IP地址。如果相应的请求器查询不同,则可以在分配表中做一个或多个登录项。
除了识别请求器的专用特征或变型外,按照权利要求3小项b的措施,地域的,即国家的特征应被识别。浏览器虽然以一种编程语言被编程,然而在与用户的接口上提供各种字符组。有时浏览器干脆是多语种的并以各种方言输出。因而在按权利要求3小项b标准化时检查一个确定的,对书写字符码有影响的应用程序字符组是否能产生书写字符码的非常规组成部分。
此外可以按照权利要求3小项c的措施检查确定的、对书写字符码有影响的应用程序参数是否能产生书写字符码的非常规组成部分。应用程序或浏览器的各个参数是可由用户改变的。例如一位用户可以应用不同的字符组。其结果是同一个请求器,特别是一个浏览器可输出不同的由参数规定的书写字符码,这些书写字符码必须被DNS学习,并通过登录到分配表中将它们与正确的IP地址对应。
在某些较陈旧的操作系统中不限制允许用的字符为操作系统所允许的字符。其它字符,尤其是特殊字符被简单地剔除掉。此字符剔除原则上可同样被分析为一个有效的书写字符码。例如书写字符码不再包含一定会出现的特殊字符,而且也借助剔除多余的字符将书写字符码正确地对应于一个IP地址。
因此可以按照权利要求3小项d的措施检查是否一个对书写字符码有影响的操作系统被应用于主机上,以便用这种方式来识别并学习书写字符码的操作系统规格的改变。
最后,也可以返传书写字符码的非常规组成部分到输入地点和/或到传输路径上。按照权利要求3小项e应进行一个在沿此方向进行的检查和标准化。尤其是由于字符的消除和/或插入,或由于在传输时各个位的不想要的或想要的屏蔽造成的失真,书写字符码可能发生变化,并且被接收的DNS不能对应到IP地址。由于网络中输入地点的改变,尤其是不同大洲的输入地点,可能导致尽可能多的DNS更改,书写字符码。借助于识别和标准化这些更改,可以校对一个DNS的分配表。
将标准化的结果用作自动完成DNS的分配表的基础是有益的(权利要求4)。
权利要求2至4所述的方法中,主要分为两个时间阶段,第一阶段收集数据,而第二阶段分析数据,除了这些方法也可以按照权利要求5至13的特征设置一些机制,它们推动一个自动选择过程,必要时此过程可实时进行。
这里,接收到的书写字符码如此被处理,尤其是被滤除,使得只有在书写字符码中使用的标准字符,尤其是字母和数字字符“A/a”至“Z/z”,“0”至“9”以及分隔符“-,.,@”被作为后面分配表的顺序比较运算的基础(权利要求5)。其中要点在于适当滤除后的书写字符码被登录到分配表中,从而通过相继的比较运算对一个新输入的滤除后的查询实现唯一对应。
与此相应,按照权利要求6的措施,在滤除后的书写字符码与分配表的一个IP地址能唯一对应时,完成此对应,并传送此IP地址给请求器。
因为虽然一个唯一的、与滤除后书写字符码的对应是可能遇到的,但书写字符码的滤除对于下一个查询却是多余的,从而按照权利要求7的措施,要将未经滤除的书写字符码存储到分配表中。这样省去了滤除操作,并可实现书写字符码与分配表登录的快速对应。
权利要求8的主题是,分配表的每个IP地址被分配一个可改变的值。一个IP地址的值必须不能强制改变,但可根据不同的作用因素提高或降低。一个重要因素是IP地址的查询频繁度(权利要求9)。访问一个IP地址的次数通常被寄存在互联网业务提供商那里,也可以设想将查询某IP地址的频繁度寄存在DNS中,并且为分配表的一个IP地址分配一个相应于此频繁度的重要因素。
从而产生了以下可能在滤除后的书写字符码与分配表的与IP地址不可能唯一对应时,所有在查询中得到的对应被传送给主机,即请求器,供在线选择(权利要求10)。此种在线选择可以按可能的对应的值大小顺序进行,这些可能的对应是由DNS传送给请求器的(权利要求11)。具有最大值的IP地址,尤其是具有最高查询率的IP地址被选用为第一个IP地址,因为用户/请求器同样想访问此地址的概率最大。用户的选择被DNS记录,这样一来,一个正确的IP地址能自动并主要是在线地对应于书写字符码。通过主机计算机/请求器一侧的记录,在下一次查询用此域名时无需通过由DNS起动的选择过程就能得到所要网站的正确的IP地址。
按照权利要求12的措施可选的一种可能是,在滤除后的书写字符码与一个IP地址不可能唯一对应时,具有最高值的那个IP地址被分配给此书写字符码。这种分配方法特别简单,并且迅速地得到结果。此结果是否是请求器实际所要的取决于是否此请求器是想不想调用这个具有最大值的IP地址。此方法特别适用了分配表中那些IP地址具有很大差别的值的场合,这时调用具有最高值的IP地址的概率很大。
在可能的对应数目较大时,或在这些对应具有基本相等的值时,采用权利要求13的措施是有好处的由一个判决程序自动起动权利要求8至12所述措施中的一个。这应根据超过一个可预定的值的可能的对应的数量和/或值的差值数量作出判定。例如,如果在分配表中有5个相等值的IP地址,合理的选择是将所有在可以考虑的对应传送给主机/请求器供其在线选择。但是如果在分配表中只有两个登录,一个登录具有很高的值,而另一个登录具有几乎没有的小值,合理的选择是采用权利要求12的措施,被传送的书写字符码被对应于具有较高值的那一个IP地址,这里未解决的问题是,以什么方式和方法来确定值。
如果通过按照权利要求1至13中任一个所述方法所进行的顺序比较运算和/或标准化不能对此书写字符码指配分配表中的一个IP地址,则按照权利要求14,这个书写字符码被给到一个错误列表中,用于人工的后续处理。
权利要求15的主题是,书写字符码在其分配完成后被DNS中间存储在请求器的高速缓存器中。这样可以减轻辩认特殊字符的DNS的负担,并加快请求器对所要域的访问。这样在重复调用时不需要再开始连接专用的域名服务器(对照图V中的3域名服务器)。
图II示出此方法和作为基础的计算机网。该计算机网具有第一个域名服务器(1),它在用户调用一个互联网地址时与一台计算机(2)连接。此第一个DNS1可由互联网地址所产生的书写字符码识别一个部分密钥,即识别结尾“.com”。此查询然后与部分密钥一起,这里用(??????101)表示,被继续传送到DNSX(3)。这个DNS能识别“.eu.com”部分密钥,根据部分密钥(????11101)。然后这个部分密钥被传送到DNSY(4),在这里完成下一步解码。在此链的终端,DNSZ(5)被连接,它是授权的域名服务器,在这里借助于顺序比较运算给出正确的IP地址。如此求出的已知数字密钥(IP地址)被传送给用户。然后用户抵达他所选择的互联网站。
通过本发明,可以使用含有特殊字符的互联网地址,而无需为此而为域名根服务器或请求器,例如浏览器,配置附加的转换模块或存储每个单独的域。通过此链式解码,借助于树状结构的对应关系,在DNSZ(5)中只有前面连接的域名服务器1,3和4不能识别的那部分域被解码。
附图标记说明1-DNS2-计算机3-DNSX4-DNSy5-DNSZ
权利要求
1.用于在计算机网络(互联网)中提供含有特殊字符的互联网地址(域)的方法,其中当域被一个用户调用时首先被转换为一个书写字符码,此书写字符码被传送到第一个域名服务器DNS(1),如果此书写字符码不能被第一个DNS(1)识别,则此书写字符码从第一个DNS(1)继续传送给至少一个另外的DNS(5),在那里通过一个顺序比较运算的分析将此书写字符码解码,并且对于书写字符码被第一个DNS(1)部分解码的情况,借助于已知的部分密钥连接至少另一个DNS(3-5),它进行进一步的解码,在那里一个已知的数字密钥(IP地址)被分配给此书写字符码,并且此IP地址被返传给用户,其特征在于,顺序比较运算借助于分配表对各种浏览器和/或解析器所产生的书写字符码识别出密钥。
2.特别如权利要求1所述的方法,其特征在于,在一个可预先给定的时间段内,指向一个DNS的非常规书写字符码作为正确的对IP地址的请求被分析和存储,其中通过一个算法,被存储的书写字符码中重复出现的非常规组成部分被求出并被标准化,接着书写字符码的标准化组成部分被用作在顺序比较运算中识别具有同样的或类似的组成部分的书写字符码的基础。
3.如权利要求2所述的方法,其特征在于,码组成部分的标准化根据以下判别标准中的一项或多项进行a)检查书写字符码的这个组成部分是否能分配给请求器的应用程序,尤其是一个浏览器和/或解析器;b)检查一个确定的、对书写字符码有影响的应用程序字符组是否能产生书写字符码的非常规组成部分;c)检查确定的、对书写字符码有影响的应用程序参数是否能产生书写字符码的非常规组成部分;d)检查是否一个对书写字符码有影响的操作系统被应用于主机/请求器上;e)检查一个对书写字符码有影响的输入地点和/或传输路径是否能产生书写字符码的非常规组成部分。
4.如权利要求2或3所述的方法,其特征在于,标准化的结果被用作自动完成DNS的分配表的基础。
5.如权利要求1所述的方法,其特征在于,被DNS(1-5)所接收的书写字符码根据所用的特殊字符加以滤除,其中只有在书写字符码中使用的标准字符,尤其是字母和数字字符“A”至“Z”,“0”至“9”和“-”被作为后面分配表的顺序比较运算的基础。
6.如权利要求5所述的方法,其特征在于,在滤除后的书写字符码与分配表的一个IP地址能唯一地对应时,完成此对应并传送此IP地址给请求器。
7.如权利要求6所述的方法,其特征在于,在滤除后的书写字符码唯一对应时,存储未经滤除的书写字符到DNS中。
8.如权利要求1至7中任一项所述的方法,其特征在于,分配表的每个IP地址被分配一个可改变的值。
9.如权利要求8所述的方法,其特征在于,分配表的IP地址被调用的频繁度被寄存,并且IP地址被分配对应于调用频繁度的值。
10.如权利要求5所述的方法,其特征在于,在滤除后的书写字符码与分配表的IP地址不可能唯一对应时,所有可以考虑的对应被传送给请求器,供在线选择。
11.如权利要求10所述的方法,其特征在于,在DNS中所考虑的对应以其值的大小顺序依次输出。
12.如权利要求8所述的方法,其特征在于,在滤除后的书写字符码与IP地址不可能唯一对应时,具有最高值的那个IP地址被分配给此书写字符码。
13.如权利要求8至12中任一项所述的方法,其特征在于,根据超过一个可预定的值的可能的对应的数量和/或值的差值自动实施权利要求8至12所述的方法。
14.如权利要求1至13中任一项所述的方法,其特征在于,通过顺序比较运算和/或标准化不能被指配的书写字符码被给到一个错误列表中,用于人工的后续处理。
15.如权利要求1至14中任一项所述的方法,其特征在于,书写字符码在其分配完成之后被DNS中间存储在请求器的高速缓存器中。
全文摘要
本发明涉及一种用于提供含有特殊字符的互联网地址的方法。在用户从一台计算机调用一个互联网地址时,第一个域名服务器(DNS)被连接。对此DNS至少分配一个另外的DNS,第一个DNS没有或仅部分识别的互联网协议地址被继续传给另外的DNS,在这里通过一个顺序比较运算的判定,此地址被解码,并且作为已知的数字密钥(IP地址)返传给用户。
文档编号H04L12/24GK1494795SQ02805638
公开日2004年5月5日 申请日期2002年2月21日 优先权日2001年2月28日
发明者拉兹罗·哈森诺, 拉兹罗 哈森诺 申请人:个性化有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1