一种关键词及其资源记录的转换存储方法和系统的制作方法

文档序号:6471083阅读:143来源:国知局

专利名称::一种关键词及其资源记录的转换存储方法和系统的制作方法
技术领域
:本发明涉及关键词存储
技术领域
,特别是涉及一种基于域名(DNS)数据库的关键词转换存储方法和系统。
背景技术
:随着互联网络的规模和用户的扩大以及各种技术的迅猛发展,人们更希望使用自然化的方式来访问网络资源,比如语音,本地语言,商标输入等等。关键词技术就是藉此而生的,这是继网际协议(IP)地址、域名之后的一种新型互联网资源的寻址技术。关键词(Keywords)是一种新兴的网络名称访问技术,通过建立关键词与网站地址的统一资源定位符(URL)的对应关系,就可以直接访问目标网站或其它统一资源定位标识(URI)的信息资源。在关键词的技术框架下,关键词提供商把人类易于记忆的企业名、产品名、商标名或其它通用名称和网络资源进行绑定,互联网用户通过关键词寻址可以获得关键词所关联的网络资源的访问方式,实现对目标资源的直接访问,这种命名方式更符合用户的记忆习惯。只要在浏览器地址栏直接输入中文名称就可以到达用户需要访问的网址,关键词寻址省掉了输入WWW网址的环节。而且,和域名类似,关键词寻址具备身份标志性。对企业而言,其还具有"商标"的意义和作用。目前,国内外有多家关键词提供商,关键词及其资源记录存储在这些提供商各自的数据库中。随着网络用户数量的快速增加,呈现出对网络资源大量需求的趋势。越来越多的关键词资源记录占用了更多的数据库资源,数据的传输速率也受到查询量的影响,使各个关键词提供商有限的数据库容量成为其提供关键词存储服务发展的瓶颈。为了使关键词寻址具有高度的可扩展性,满足数据大量存储和快速查询的需求,迫切需要设计一种灵活而高效的关键词存储机制。
发明内容本发明所要解决的技术问题是提供一种关键词及其资源记录的转换存储方法和系统,能够解决关键词资源数据库容量有限的问题,而且可以对关键词的查询快速响应。为了解决上述问题,本发明公开了一种关键词及其资源记录的转换存储方法,该方法包括读取关键词及其资源记录;所述关键词符合巴科斯瑙尔范式的语法要求;将该关键词转换为一美国标准信息交换码(ASCII)域名;将该ASCII域名存储为域名数据库中的键值;将与该关键词相应的资源记录映射转换为与该键值相应的域名资源记录进行存储。具体的,通过以下步骤将关键词转换为一ASCII域名去除关键词类别符;如果存在二级关键词,将顶级关键词和二级关键词交换顺序,同时将原分隔符转换成ASCII域名的标准分隔符;在顶级关键词后添加标准分隔符和关键词类别域标签,所述关键词类别域标签由所述关键词类别符确定得到;添加为关键词保留的域名后缀;将上述文字域名格式的字符串转换成ASCII编码的域名。具体的,通过以下步骤完成资源记录的映射过程将关键词转换得到的ASCII域名映射并存储为域名资源记录里的名称;将关键词原资源记录中的生存时间,映射并存储为域名资源记录里的生存时间;将关键词原资源记录中的统一资源定位符类型和关键词等级类型,分别映射并存储为域名资源记录里名称权威指针类型和文本文件类型;将关键词原资源记录中的统一资源定位符资源值和关键词等级资源值,分别映射并存储为域名资源记录里名称权威指针记录和文本文件记录。优选的,所述名称权威指针记录的数量为一条或一条以上。具体的,所述关键词类别域标签可以分为组织关键词标签、个人关键词标签和通用关键词标签。依据本发明另一实施例,还公开了一种关键词及其资源记录的转换存储系统,该系统包括获取模块,用于读取关键词及其资源记录;所述关键词符合巴科斯瑙尔范式的语法要求;转换模块,用于将该关键词转换为一ASCII域名;域名存储模块,用于将该ASCII域名存储为域名数据库中的键值;映射模块,用于将与该关键词相应的资源记录映射转换为与该键值相应的域名资源记录进行存储。具体的,所述转换模块可以包括去类别符子模块,用于去除关键词类别符;交换子模块,若存在二级关键词,用于交换顶级关键词和二级关键词的顺序,并同时将原分隔符转换成ASCII域名的标准分隔符;添加关键词类别域标签子模块,用于在顶级关键词后添加标准分隔符和关键词类别域标签;所述关键词类别域标签由所述关键词类别符确定得到;加后缀子模块,用于在关键词类别域标签后添加为关键词保留的域名后缀;转码子模块,用于将上述文字域名格式的字符串转换成ASCII编码的域名。具体的,所述映射模块包括如下子模块名称映射子模块,用于将关键词转换得到的ASCII域名映射并存储为域名资源记录里的名称;生存时间映射子模块,用于将关键词原资源记录中的生存时间,映射并存储为域名资源记录里的生存时间;资源类型映射子模块,用于将关键词原资源记录中的统一资源定位符类型和关键词等级类型,分别映射并存储为域名资源记录里名称权威指针类型和文本文件类型;资源值映射子模块,用于将关键词原资源记录中的统一资源定位符资源值和关键词等级资源值,分别映射并存储为域名资源记录里名称权威指针记录和文本文件记录。优选的,所述名称权威指针记录的数量为一条或一条以上。与现有技术相比,本发明具有以下优点通过本发明将现有的关键词资源记录映射为DNS数据库中的资源记录,利用DNS的高度可扩展性、灵活的授权管理、分布式的名字空间管理、缓存量大以及同一中间或终端服务器上的用户可共享DNS数据资源的特点来达到本发明的目的。高度可扩展性、分布式的名字空间管理,使基于DNS数据库的关键词存储可分散于多个DNS数据库,不受数据库容量的限制,可扩展性好;缓存量大以及同一中间或终端服务器上的用户可共享DNS数据资源,使得对关键词的存储和查询都更加快速、高效;DNS数据库成熟的管理运营机制,使关键词查询服务更加可靠;灵活的授权机制使得关键词从注册到使用都更加简便快捷。图1是本发明关键词及其资源记录的转换存储方法实施例的流程图;图2是本发明方法实施例关键词转换的流程图;图3是本发明方法实施例资源记录的映射过程的流程图;图4是本发明关键词及其资源记录的转换存储系统的结构示意框图;图5是本发明系统实施例转换模块的结构示意框图;图6是本发明系统实施例映射模块的结构示意框图。S2将该关键词转换为一ASCII域名;S3将该ASCII域名存储为DNS数据库的键值;S4将与该关键词相应的资源记录映射转换为与该键值相应的DNS资源记录进行其中,步骤SI中读取原关键词及其资源记录,该关键词符合BNF定义。首先对关键词进行简单的介绍说明。关键词语法的BNF定义如下具体实施例方式为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。本发明提供了一种关键词及其资源记录的转换存储方法的实施例,如图1所示,其包括如下步骤SI读取关键词及其资源记录;所述关键词符合巴科斯瑙尔范式(BNF)的语法要求;存储。〈关键词〉=〈关键词类别符〈关键词名字〈顶级关键词〈二级关键词〈分隔符〉=〈关键词标签〉:〈连字符串〉〈字母汉字数字关键词类别符X关键词名字=〈顶级关键词〉=〈关键词标签>=〈关键词标签>:"|"/"|空格=〈字母汉字数字〈字母汉字数字连字符::=〈字母>|〈汉字>顶级关键词X分隔符X二级关键词连字符串〉]〈字母汉字数字>]I〈字母汉字数字连字符x连字符串:数字>字母汉字数字连字符字母汉字数字汉字字母数字=任何一个汉字=a_z|A_Z=0-9其中,在双引号""中的字代表着这些字符本身;在双引号""外的字(有可能有下划线)代表着语法部分;尖括号〈>内包含的为必选项;方括号[]内包含的为可选项;大括号{}内包含的为可重复0至无数次的项;竖线I表示在其左右两边任选一项,相当于"OR"的意思;::=是"被定义为"的意思。关键词由关键词类别符和关键词名字构成。关键词类别符包括"@"、"="和"+",分别代表所定义的关键词为组织关键词、个人关键词和通用关键词。可以通过设置默认的关键词类别符来简化应用程序的输入,如将"+"设置为默认的关键词类别符。关键词名字可使用分隔符将关键词名字分为顶级关键词和二级关键词两部分,二级关键词可为空。顶级关键词和二级关键词都称为关键词标签。关键词标签可以由任意的中文、字母、数字和连接符组成,但第一个和最后一个符号不能为连字符。为了减少争议并保护关键词注册者的权益,关键词寻址系统应支持中文繁简等效、英文字母大小写等效、全角半角等效。本发明方法实施例中的关键词符合BNF的定义规范,便于通过本发明方法的转换规则对关键词进行转换操作。如图2所示,将关键词转换为一ASCII域名的步骤S2包括如下子步骤S21去除关键词类别符;S22如果存在二级关键词,将顶级关键词和二级关键词交换顺序,同时将原分隔符转换成ASCII域名的标准分隔符;S23在顶级关键词后添加标准分隔符和关键词类别域标签,所述关键词类别域标签由所述关键词类别符确定得到;S24添加为关键词保留的域名后缀;S25将上述文字域名格式的字符串转换成ASCII编码的域名。将符合BNF定义的关键词转换为一个ASCII编码的域名,例如对关键词"@新浪体育"进行转换,要经历如下步骤去除关键词类别符@,得到"新浪体育";由于存在二级关键词"体育",所以将顶级关键词"新浪"和二级关键词"体育"交换顺序,在本实施例中,ASCII域名的标准分隔符为".",所以将原分隔符""转换成ASCII域名的标准分隔符".",得到"体育.新浪";在顶级关键词后添加标准分隔符"."和关键词类别域标签"org",所述关键词类别域标签由所述关键词类别符确定得到,关键词类别域标签可以分为组织关键词标签"org"、个人关键词标签"ps"和通用关键词标签"pub",关键词类别域标签与关键词类别符的对应关系如下表所示<table>tableseeoriginaldocumentpage7</column></row><table>此时得到"体育.新浪.org";添加为关键词保留的域名后缀,例如,在中国该域名后缀可以是".cn.cn",得到"体育.新浪.org.cn.cn",这样就得到了一个中文域名格式的字符串;将上述文字域名格式的字符串通过Puyncode编码转换成ASCII编码的域名,得到"xn__tqqp71j.xn__efvx5o.org.cn.cn,,。步骤S3为将ASCII域名存储为DNS数据库中的键值,具体包括为该域名分配一个DNS数据库中的节点,该域名存储为该节点的键值。对于上面举的例子,即为域名"xn—tqqp71j.xn__efvx5o.org.cn.cn,,分配一个DNS数据库中的节点。由于Punycode转码的特点,一个关键词标签唯一对应一组ASCII编码的字符串,因此一个关键字经步骤S2转换后唯一对应一个DNS资源记录的键值,一个键值唯一对应DNS空间中的一个节点。在步骤S4中,要将与该关键词相应的资源记录映射转换为与该键值相应的DNS资源记录进行存储。每个关键词都对应于一组资源记录,每个关键词资源记录逻辑上都由以下几部分组成关键词,符合关键词语法定义的字符串,指出了该资源记录属于的关键词;生存时间(TTL),4字节的整型,单位为秒,主要用于资源记录的缓存;TTL指定了资源记录能够被缓存的最长时间;资源类型,16位的整型,指出了该条资源记录所包含的资源值的类型;目前存在两种类型的关键词资源记录统一资源定位符(URL)类型记录关键词相关联的URL,关键词等级(CLS)类型记录关键词的等级;资源值,资源值的格式取决于资源类型对于URL类型,资源值包括URL的优先级和符合RFC3986的绝对URL的字符串,一个关键词可以对应一个或一个以上URL资源值;对于CLS类型,资源值为单字节的整数,一个关键词只能对应一个CLS值。本发明方法实施例中,关键词资源记录映射的步骤S4如图3所示,包括如下子步骤S41将关键词转换得到的ASCII域名映射并存储为DNS资源记录里的名称(NAME);S42将关键词原资源记录中的TTL,映射并存储为DNS资源记录里的TTL;S43将关键词原资源记录中的URL类型和CLS类型,分别映射并存储为DNS资源记录里NAPTR类型和TXT类型;S44将关键词原资源记录中的URL资源值和CLS资源值,分别映射并存储为DNS资源记录里NAPTR记录和TXT记录。本步骤是将关键词原资源记录映射转换为与其对应键值相应的DNS资源记录进行存储。原关键词映射为DNS资源记录里的NAME,该NAME值为经过步骤S2将关键词转换为ASCII编码的域名;关键词资源记录中的TTL映射并存储为DNS资源记录里的TTL,此TTL可根据需要进行设置(如48600秒);将关键词原资源记录中的URL类型和CLS类型分别映射存储为DNS资源记录里NAPTR类型和TXT类型;将关键词原资源记录中的URL资源值和CLS资源值,分别映射并存储为DNS资源记录里NAPTR记录和TXT记录。关键词原资源记录中的URL资源值,包括URL优先级和符合RFC3986的绝对URL的字符串;对于CLS,资源值为单字节整数。DNS资源记录中的NAPTR记录包括ORDER、PREFERENCE、FLAGS、SERVICES、REGEXP、REPLACEMENT六个字段,其格式为DomainTTLClassTypeORDERPREFERENCEFLAGSSERVICESREGEXPREPLACEMENT。关键词原资源记录中的优先级和绝对URL的字符串分别映射到DNS资源记录中NAPTR记录的PREFERENCE和REGEXP字段,NAPTR记录中的其它字段使用默认设置的值。PREFERENCE字段设置为URL资源值的优先级;ORDER字段设置为一个常数(例如10);FLAGS字段设置为"u",表明该重写规则是一个终止迭代(Terminal)规则;REGEXP字段为置换表达式,REGEXP的格式满足RFC3402中的置换表达式的定义,映射后的置换表达式中包含ere和r印l值;ere取值为"'.*$",表示匹配所有字符串,r印l取值为URL的字符串。这一置换表达式的输出就是r印l部分的URL字符串;REPLACEMENT字段设置为".",表示该字段为空;SERVICES="K2U"。还是使用上面的例子进行说明,为域名"xn—tqqp71j.xn—efvx5o.org.cn.cn"分配一个DNS数据库中的节点,该域名存储为该节点的键值;其NAPTR记录各字段设置值为PREFERENCE字段设置为URL资源值的优先级30;ORDER字段设置为常数10;FLAGS字段设置为"u";REGEXP字段的置换表达式中ere取值为"~.*$",r印l取值为URL的字符串"http://sports,sina.com.cn,,;REPLACEMENT字段设置为".";SERVICES="K2U";则该关键词对应的NAPTR记录为INNAPTR1030"u""K2U,,"!'.*$!http:〃sports.sina.com.cn!,,.对于CLS记录,代表了关键词的等级,对上面例子,若关键词"(i新浪体育"的关键词等级为5,则其对应的DNS资源记录的TXT记录为"CLS5"。通过本发明方法的上述映射规则,关键词资源记录中的URL资源值就映射为DNS资源记录中NAPTR记录。例如,关键词"=博客张三"与两个URL相关联,则其对应的NAPTR记录集合形式为INNAPTR1030'V,"K2U,,"!'.*$!http:〃blog.sina.com.cn/zhangsan!"INNAPTR1040"u""K2U,,"!~.*$!http:〃zhangsan.spaces,msn.com!,,.当一个关键词对应两条或两条以上NAPTR记录时,用户查询该关键词返回的结果中,按照PREFERENCE的优先级对NAPTR记录由高到低进行排列。同一关键词键值NAPTR记录的PREFERENCE各不相同,但ORDER都是相同的。基于本发明上述的转换存储步骤,一个关键词唯一地对应了DNS数据库空间中的一个节点,而关键词的资源记录则映射为DNS数据库中与该节点相对应的资源记录进行存储。查询时,首先将关键词转换成ASCII域名作为查找DNS数据库的键值,返回的DNS数据库查询结果如果包括NAPTR类型资源记录,则对应了该关键词的URL类型资源记录,如果包括TXT类型资源记录,则对应了该关键词的CLS类型资源记录。本发明的关键词及其资源记录的转换存储方法中,标准分隔符都采用国际域名标准分隔符".";而且,为关键词保留的域名后缀不限于".cn.cn",实际应用中对如".kw.cn"、".gjc.cn"等的域名后缀本发明都可进行调整适用,取决于国家为关键词保留何种样式的域名后缀。通过上述系列步骤,实现了将关键词资源记录转换存储为DNS资源记录的过程。通过本发明将现有的关键词资源记录映射为DNS数据库中的资源记录,利用DNS的高度可扩展性、灵活的授权管理、分布式的名字空间管理、缓存量大以及同一中间或终端服务器上的用户可共享DNS数据资源的特点来达到本发明的目的。高度可扩展性、分布式的名字空间管理使基于DNS数据库的关键词存储可分散于多个DNS数据库,不受数据库容量的限制,可扩展性好;缓存量大以及同一中间或终端服务器上的用户可共享DNS数据资源使得对关键词的存储和查询都更加快速、高效;DNS数据库成熟的管理运营机制使关键词查询服务更加可靠;灵活的授权机制使得关键词从注册到使用都更加简便快捷。本发明还提供了一种关键词及其资源记录的转换存储系统的实施例,其结构如图4所示,该关键词及其资源记录的转换存储系统1包括获取模块10,用于读取关键词及其资源记录;所述关键词符合BNF的语法要求;转换模块20,用于将该关键词转换为一ASCII域名;域名存储模块30,用于将该ASCII域名存储为DNS数据库中的键值;映射模块40,用于将与该关键词相应的资源记录映射转换为与该键值相应的DNS资源记录进行存储。如图5所示,所述转换模块20包括去类别符子模块201,用于去除关键词类别符;交换子模块202,若存在二级关键词,用于交换顶级关键词和二级关键词的顺序,并同时将原分隔符转换成ASCII域名的标准分隔符;添加关键词类别域标签子模块203,用于在顶级关键词后添加标准分隔符和关键词类别域标签;所述关键词类别域标签由所述关键词类别符确定得到;加后缀子模块204,用于在关键词类别域标签后添加为关键词保留的域名后缀;转码子模块205,用于将上述文字域名格式的字符串转换成ASCII编码的域名。如图6所示,所述映射模块40包括如下子模块名称映射子模块401,用于将关键词转换得到的ASCII域名映射并存储为DNS资源记录里的NAME;生存时间映射子模块402,用于将关键词原资源记录中的TTL,映射并存储为DNS资源记录里的TTL;资源类型映射子模块403,用于将关键词原资源记录中的URL类型和CLS类型,分别映射并存储为DNS资源记录里NAPTR类型和CLS类型;资源值映射子模块404,用于将关键词原资源记录中的URL资源值和CLS资源值,分别映射并存储为DNS资源记录里NAPTR记录和TXT记录。通过本发明系统的上述映射过程,关键词原资源记录中的URL资源值就映射为DNS资源记录中NAPTR记录。本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。以上对本发明所提供的一种关键词及其资源记录的转换存储方法和系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容10不应理解为对本发明的限制'权利要求一种关键词及其资源记录的转换存储方法,其特征在于,包括读取关键词及其资源记录;所述关键词符合巴科斯瑙尔范式的语法要求;将该关键词转换为一美国标准信息交换码域名;将该美国标准信息交换码域名存储为域名数据库中的键值;将与该关键词相应的资源记录映射转换为与该键值相应的域名资源记录进行存储。2.如权利要求1所述的关键词及其资源记录的转换存储方法,其特征在于,通过以下步骤将关键词转换为一美国标准信息交换码域名去除关键词类别符;如果存在二级关键词,将顶级关键词和二级关键词交换顺序,同时将原分隔符转换成美国标准信息交换码域名的标准分隔符;在顶级关键词后添加标准分隔符和关键词类别域标签,所述关键词类别域标签由所述关键词类别符确定得到;添加为关键词保留的域名后缀;将上述文字域名格式的字符串转换成美国标准信息交换码编码的域名。3.如权利要求1所述的关键词及其资源记录的转换存储方法,其特征在于,通过以下步骤完成资源记录的映射过程将关键词转换得到的美国标准信息交换码域名映射并存储为域名资源记录里的名称;将关键词原资源记录中的生存时间,映射并存储为域名资源记录里的生存时间;将关键词原资源记录中的统一资源定位符类型和关键词等级类型,分别映射并存储为域名资源记录里名称权威指针类型和文本文件类型;将关键词原资源记录中的统一资源定位符资源值和关键词等级资源值,分别映射并存储为域名资源记录里名称权威指针记录和文本文件记录。4.如权利要求3所述的关键词及其资源记录的转换存储方法,其特征在于,所述名称权威指针记录的数量为一条或一条以上。5.如权利要求1所述的关键词及其资源记录的转换存储方法,其特征在于,所述关键词类别域标签分为组织关键词标签、个人关键词标签和通用关键词标签。6.—种关键词及其资源记录的转换存储系统,其特征在于,包括获取模块,用于读取关键词及其资源记录;所述关键词符合巴科斯瑙尔范式的语法要求;转换模块,用于将该关键词转换为一美国标准信息交换码域名;域名存储模块,用于将该美国标准信息交换码域名存储为域名数据库中的键值;映射模块,用于将与该关键词相应的资源记录映射转换为与该键值相应的域名资源记录进行存储。7.如权利要求6所述的关键词及其资源记录的转换存储系统,其特征在于,所述转换模块包括去类别符子模块,用于去除关键词类别符;交换子模块,若存在二级关键词,用于交换顶级关键词和二级关键词的顺序,并同时将原分隔符转换成美国标准信息交换码域名的标准分隔符;添加关键词类别域标签子模块,用于在顶级关键词后添加标准分隔符和关键词类别域标签;所述关键词类别域标签由所述关键词类别符确定得到;加后缀子模块,用于在关键词类别域标签后添加为关键词保留的域名后缀;转码子模块,用于将上述文字域名格式的字符串转换成美国标准信息交换码编码的域名。8.如权利要求6所述的关键词及其资源记录的转换存储系统,其特征在于,所述映射模块包括如下子模块名称映射子模块,用于将关键词转换得到的美国标准信息交换码域名映射并存储为域名资源记录里的名称;生存时间映射子模块,用于将关键词原资源记录中的生存时间,映射并存储为域名资源记录里的生存时间;资源类型映射子模块,用于将关键词原资源记录中的统一资源定位符类型和关键词等级类型,分别映射并存储为域名资源记录里名称权威指针类型和文本文件类型;资源值映射子模块,用于将关键词原资源记录中的统一资源定位符资源值和关键词等级资源值,分别映射并存储为域名资源记录里名称权威指针记录和文本文件记录。9.如权利要求8所述的关键词及其资源记录的转换存储系统,其特征在于,所述名称权威指针记录的数量为一条或一条以上。全文摘要本发明提供了一种关键词及其资源记录的转换存储方法和系统,所述方法包括读取关键词及其资源记录;所述关键词符合巴科斯瑙尔范式的语法要求;将该关键词转换为一ASCII域名;将该ASCII域名存储为域名数据库中的键值;将与该关键词相应的资源记录映射转换为与该键值相应的域名资源记录进行存储。本发明利用DNS数据库高度可扩展性、分布式的名字空间管理,使基于DNS数据库的关键词存储可分散于多个DNS数据库,不受数据库容量的限制,可扩展性好;利用DNS数据库缓存量大以及同一中间或终端服务器上的用户可共享DNS数据资源,使得对关键词的存储和查询都更加快速、高效。文档编号G06F17/30GK101739424SQ20081022579公开日2010年6月16日申请日期2008年11月13日优先权日2008年11月13日发明者张国强,李晓东,毛伟申请人:中国科学院计算机网络信息中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1