权威服务器负载均衡的方法、设备及系统的制作方法

文档序号:7758945阅读:104来源:国知局
专利名称:权威服务器负载均衡的方法、设备及系统的制作方法
技术领域
本发明属于互联网技术领域,涉及一种权威服务器负载均衡的方法、设备及系统。
背景技术
域名系统(Domain Name System ;以下简称DNS)主要用于完成从域名到互联网协 议(Internet Protocol ;以下简称IP)地址的映射及其它互联网资源的解析,是当今互联 网中重要的基础设施。现有技术中,DNS包括递归服务器和权威服务器。图1为现有技术中在Internet 上查询域名girigiri. gbrmpa. gov. au的流程图。下面以图1为例,介绍递归服务器和权威 服务器的功能。如图1所示,递归服务器用于接收网络客户端的域名查询请求。递归服务 器首先检查自身的缓存中是否保存有该域名查询请求对应的数据,如果已保存,递归服务 器会立即将查询结果放入响应包中返回给请求查询的网络客户端用户。如果没有保存,递 归服务器会替网络客户端向远程的权威服务器提出查询。如图1所示,递归服务器先将域 名查询请求发送给根区域的权威服务器。根区域的权威服务器通过对域名查询请求中的域 名进行解析,返回给递归服务器一个指向au区的权威服务器的地址。递归服务器根据接收 到的地址,再将域名查询请求发送给au区的权威服务器,以供au的权威服务器对域名进行 解析。如图1所示,再依次经过gov. au区的权威服务器以及gbrmpa. gov. au的权威服务器 对域名girigiri. gbrmpa. gov. au的解析后,gbrmpa. gov. au区的权威服务器最终向递归服 务器返回一个指向girigiri. gbrmpa. gov. au的地址,并由递归服务器将该地址返回给网 络客户端,以供网络客户端访问。图2为现有的DNS的权威服务器的负载均衡结构示意图。在图1所示DNS中,每 一个区域的权威服务器中可能包括有多台服务器,称为一组权威服务器。如图2所示,以au 区的权威服务器中包括有多台服务器为例这多台服务器负责管理au区,对外公布一个IP 地址。在au区内部的各台服务器之间采用任播技术。这样就需要考虑多台服务器之间负 载均衡的问题。如图2所示,通常采用在递归服务器和au区的权威服务器之间设置有一个 负载均衡设备。由负载均衡设备采用负载均衡调度方法实现递归服务器至au区内的各权 威服务器之间的调度。现有技术中通常采用轮询(Round Robin;以下简称RR)负载均衡调 度方法实现调度。该调度方法是每一次把域名查询请求轮流分配给内部的各台服务器,从 1开始,直到N(内部服务器个数),然后重新开始循环。但是,现有的RR负载均衡调度方法假设所有服务器的处理性能都相同,不关心每 台服务器的当前连接数和响应速度。当请求服务间隔时间变化比较大时,RR负载均衡调度 方法还会因为当前连接数和响应速度的差异,而容易导致服务器间的负载不平衡。而且RR 负载均衡调度方法只适合于权威服务器组中的所有服务器都具有相同软硬件配置的情形, 并且还要求平均服务请求相对均衡。因此,RR负载均衡调度方法不能实现真正的负载均衡, 适用性较差。

发明内容
本发明提供一种权威服务器负载均衡的方法、设备及系统,用以解决现有技术中 域名系统的权威服务器中负载均衡适用性差的缺陷,在各区的权威服务器组中实现负载均本发明提供一种权威服务器负载均衡的方法,包括下列步骤根据递归服务器的查询行为特征将递归服务器聚类为至少一个群集;建立各所述群集与目标区的权威服务器组中的权威服务器之间的对应关系。本发明提供一种权威服务器的负载均衡设备,包括聚类处理模块,用于根据递归服务器的查询行为特征将递归服务器聚类为至少一 个群集;配置模块,用于建立各所述群集与目标区的权威服务器组中的权威服务器之间的 对应关系。本发明还提供一种域名系统,包括至少一个递归服务器、至少一个区的权威服务 器组,以及至少一个上述所述权威服务器的负载均衡设备;各区的权威服务器组中包括至 少一个权威服务器;所述权威服务器的负载均衡设备与对应区的权威服务器组中的至少一 个权威服务器连接;所述权威服务器的负载均衡设备还与所述至少一个递归服务器连接本发明的权威服务器负载均衡的方法、设备及系统,通过利用N个递归服务器的 查询时间序列和参考模型,将N个递归服务器的查询时间序列进行聚类处理,以将N个查询 时间序列分别划分至K个群集;根据划分后的群集建立群集与目标区的权威服务器组中的 服务器之间的对应关系。采用本发明实施例的技术方案,根据群集中所对应的递归服务器 与权威服务器组中的权威服务器之间的对应关系,实现递归服务器至权威服务器之间的灵 活调度。与现有技术相比,采用本发明的技术方案,与请求服务的时间间隔以及权威服务器 的响应速度都没有关系,能够有效地实现负载均衡的目的。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图是本发明 的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根 据这些附图获得其他的附图。图1为现有技术中在Internet上查询域名girigiri. gbrmpa. gov. au的流程图;图2为现有的DNS的权威服务器的负载均衡结构示意图;图3为本发明实施例一提供的权威服务器负载均衡的方法的流程如图;图4为本发明实施例二提供的权威服务器负载均衡的方法的流程如图;图5为本发明实施例三提供的权威服务器负载均衡的方法的流程图;图6为本发明实施例四提供的权威服务器负载均衡的方法的流程图;图7为本发明实施例五提供的权威服务器的负载均衡设备的结构示意图;图8为本发明实施例六提供的权威服务器的负载均衡设备的结构示意图;图9为本发明实施例七提供的权威服务器的负载均衡设备的结构示意图;图10为本发明实施例八提供的权威服务器的负载均衡设备的结构示意图11为本发明实施例九提供的域名系统的结构示意图。
具体实施例方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例 中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是 本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员 在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。图3为本发明实施例一提供的权威服务器负载均衡的方法的流程如图。本实施例 的执行主体为权威服务器的负载均衡设备。如图3所示,本实施例的域名系统权威服务器 负载均衡的方法,具体可以包括如下步骤步骤100、根据递归服务器的查询行为特征将递归服务器聚类为至少一个群集;步骤101、建立各群集与目标区的权威服务器组中的权威服务器之间的对应关系。本实施例的域名系统权威服务器负载均衡的方法,根据递归服务器的查询行为特 征,将递归服务器聚类为至少一个群集。其中这里每个群集中被划分的递归服务器的数目 不做限制。也可为一个、两个,也可以为多个。聚类之后,将每一个群集与目标区的权威服 务器组中的一个权威服务器之间建立关联,也就是将该群集中的递归服务器与权威服务器 组中的权威服务器之间建立映射,由该权威服务器负责解析该群集中的各递归服务器的域 名查询请求。当群集较小时,多个群集可以对应目标区的权威服务器组中同一个对应的权威服 务器,同样可以实现权威服务器的负载均衡调度。本实施例的权威服务器负载均衡的方法,通过根据递归服务器的查询行为特征将 递归服务器聚类为若干个群集;并建立各群集与目标区的权威服务器组中的权威服务器之 间的对应关系,能够有效地均衡权威服务器组中的各权威服务器的负载。与现有技术相比, 采用本发明的技术方案,与请求服务的时间间隔以及权威服务器的响应速度都没有关系, 实现递归服务器至权威服务器之间的灵活调度。图4为本发明实施例二提供的权威服务器负载均衡的方法的流程如图。如图4所 示,本实施例的域名系统权威服务器负载均衡的方法,在包括上述实施例一的技术方案的 基础上,其步骤100具体可以包括如下步骤步骤1001、获取多个递归服务器在第一时间段内的查询时间序列,得到多个查询 时间序列;这里以N个递归服务器为例,对应地N个查询时间序列可以采用公式dteain = {X1,
K,XN}表述,Xi表示第i个递归服务器在第一时间段内的查询时间序列,i = 1,......,N,
N为正整数;dtrain= {X1,K,XN}中各查询时间序列包括对应的递归服务器的标识和按照查 询时间顺序排列的目标域名列表。具体地,这里获取的N个递归服务器的查询时间序列,是根据N个递归服务器在第 一时间段内的查询数据得到的。这里的查询数据包括递归服务器的标识、查询时间和查询 的目标域名。其中获取查询数据具体可以从权威服务器中的日志里面获取。对于某一个递 归服务器,按照查询时刻的先后顺序,将第一时间段内查询的目标域名按顺序排列,所得即 为该递归服务器对应的目标域名列表。将该递归服务器的标识与对应的目标域名列表合称为该递归服务器的查询时间序列。各递归服务器查询时间序列的获取可以参考现有相关技 术,在此不再赘述。这里获取的N个递归服务器的查询时间序列为参考的查询时间序列,用于后续划 分群集,因此也可以称之为训练集。各查询时间序列包括对应的递归服务器的标识优选地为该递归服务器的IP地 址,这样还可以同时根据该IP地址,识别该递归服务器的物理地址。步骤1002、根据多个查询时间序列,获取参考模型的模型参数和至少一个群集的 群集数目;具体地,这里以至少一个群集的群集数目为K为例,K为正整数。在本实施例中, 为了有效地对划分群集,首先必须选择一个参考模型,并根据步骤100获取的N个递归服务 器的查询时间序列,即N个查询时间序列,获取该参考模型的模型参数以及群集数目。步骤1003、根据模型参数和群集数目,对多个查询时间序列进行聚类处理,使得多 个查询时间序列分别划分至至少一个群集中。具体地,根据步骤101获取的模型参数和群集数目,对N个查询时间序列进行聚类 处理,将N个查询序列划分至K个群集中。由于每个查询序列对应一个递归服务器,即相当 于将N个递归服务器划分至K个群集中。本实施例的权威服务器负载均衡的方法,通过利用N个递归服务器的查询时间序 列和参考模型,将N个递归服务器的查询时间序列进行聚类处理,以将N个查询时间序列分 别划分至K个群集;根据划分后的群集建立群集与目标区的权威服务器组中的服务器之间 的对应关系。采用本发明实施例的技术方案,根据群集中所对应的递归服务器与权威服务 器组中的权威服务器之间的对应关系,实现递归服务器至权威服务器之间的灵活调度。与 现有技术相比,采用本发明实施例的技术方案,与请求服务的时间间隔以及权威服务器的 响应速度都没有关系,能够有效地实现负载均衡的目的。而且采用现有的RR负载均衡调度方法只适用于权威服务器组中的各权威服务器 都有相同的软硬件配置,并且平均服务请求相对均衡的条件下。而本实施例的技术方案,目 标区中的权威服务器组中的各权威服务器的软硬件配置可以不相同。因此,本实施例的权 威服务器负载均衡的方法具有较强的适用性。图5为本发明实施例三提供的权威服务器负载均衡的方法的流程图。本实施例的 权威服务器负载均衡的方法以选取参考模型为一阶混合马尔可夫模型为例,详细描述本发 明的技术方案。如图5所示,本实施例的权威服务器负载均衡的方法,具体可以包括如下步 骤步骤200、获取N个递归服务器在第一时间段内的查询时间序列dteain = {X1,...,
XnI ;具体地,这里的N个递归服务器的查询时间序列也可以称之为查询时间序列训练 集。其中Xi表示第i个递归服务器的查询时间序列,其中i e [1,......N]。这里假设
χ ‘ = (iip,xl,..-,x'Li),、表示该第i个递归服务器的标识,例如这里可以取第i
个递归服务器的IP地址。X;表示该第i个递归服务器在该第一时间段内的查询的第j个 目标域名,j e [1,...,Li]。Li可以表示域名查询序列Xi的长度,即该查询时间序列Xi中包括Li个目标域名。如下述表1所示,为查询6个递归服务器在某一时间段内的查询时间序列。表 1
IP地址
域名查询序列
218. 241. XXX. XXXwww. sohu. com www. 163. com www. cnnic. cn www. g. cn hefei-stip. cn
218. 242. XXX. XXXHefei-stip. cn qhdetc. cn bAodi. cn qtgs. cn cultural ink. cn
218. 243. XXX. XXX:Cmc. cn linxixian. cn Xyny. cn agriln. cn Bhjy. cn gyjt. cn
218. 244. XXX. XXXZhiqian. cn dtsrdcwh. cn Ahaic. cn gzwh. cn ccgp-heilongj. cn
218. 245. XXX. XXXTraffic, cn xmmie. cn Qzagri. cn ywsi. cn Lsinfo. cn hbzljd. cn
218. 246. XXX. XXX Xgzsw. cn jsmfm. cn Kunqubaotou. cn xuanbao. cn cckcet. cn步骤201、选取一阶混合马尔可夫模型,根据获取的查询时间序列dtrain = {X1,K, XN},获取群集数目为K时对应的一阶混合马尔可夫模型的模型参数θκ= {>κ,θ\,θτκ};这里K= 1,2,......,M ;Μ为大于1的正整数。此时还不能够确定群集数目K。
也就是说此时的群集数目K是假定选取的。例如可以顺次取K为从1到100之间的整数。 对于每一个假定的K值,根据查询时间序列dtrain,通过期望最大化算法迭代获取对应的一 阶混合马尔可夫模型的模型参数θκ= {>κ,θ\,θτκ},其中π £表示群集数目为K时,各 群集对应的马尔可夫链在一阶混合马尔可夫模型中的权重,θ \表示群集数目为K时,各群 集对应的马尔可夫链在一阶混合马尔可夫模型中的初始状态概率向量,θτκ表示群集数目 为K时,各群集对应的马尔可夫链的状态转移概率矩阵。本实施例以参考模型为一阶混合马尔可夫(亦即Markov)模型为例。该一阶混合 马尔可夫模型中包括至少一个马尔可夫链,每一个马尔可夫对应一个群集。基于网络客户端的域名查询行为通常具有思维连贯性,当前要查询的域名通常受 到之前所查询的域名的影响。而且基于计算复杂度的考虑,认为当前查询的域名只与前一 次查询的域名相关。所以,这里选取的马尔可夫模型假设各递归服务器将要查询的目标域 名只与前一次查询的目标域名有关。步骤202、根据群集数目K = 1,2,......,M时,一阶混合马尔可夫的模型参数
θκ={>κ,θ V θ tJ以及N个递归服务器在第二时间段内的测试查询时间序列dtest = {X' 1^...,X' N},获取群集K的值以及对应的一阶混合马尔可夫的模型参数θκ= {>κ,
θ 1K' θ tJ ;具体地,采用“样本外预测对数得分”的方法,还需要获取一个独立于上述步骤200 的查询时间序列的一个测试查询时间序列;例如该测试查询时间序列为dtest = {x' S..., X' N}测试查询时间序列的获取可以参照上述查询时间序列的获取,在此不再赘述。采用 “样本外预测对数得分”的方法,通过最小化下述函数SCore(K,dtest)的值,便可以获取到此
8时对应的群集数目K的值以及对应的一阶混合马尔可夫的模型参数θκ = {>κ,θ\,θτκ}。
权利要求
一种权威服务器负载均衡的方法,其特征在于,包括下列步骤根据多个递归服务器的查询行为特征将所述多个递归服务器聚类为至少一个群集;建立各所述群集与目标区的权威服务器组中的权威服务器之间的对应关系。
2.根据权利要求1所述的权威服务器负载均衡的方法,其特征在于,根据多个递归服 务器的查询行为特征将所述多个递归服务器聚类为至少一个群集,具体包括获取所述多个递归服务器在第一时间段内的查询时间序列;各所述查询时间序列包括 对应的递归服务器的标识和按照查询时间顺序排列的目标域名列表;根据所述多个查询时间序列,获取参考模型的模型参数和所述至少一个群集的群集数目;根据所述模型参数和所述群集数目,对所述多个查询时间序列进行聚类处理,使得所 述多个查询时间序列分别划分至所述至少一个群集中。
3.根据权利要求2所述的权威服务器负载均衡的方法,其特征在于,建立各所述群集 与目标区的权威服务器组中的权威服务器之间的对应关系,具体包括建立各所述群集对应的递归服务器的标识与所述目标区的权威服务器组中的权威服 务器的标识之间的对应关系。
4.根据权利要求1-3任一所述的权威服务器负载均衡的方法,其特征在于,还包括 将所述对应关系发送给对应的所述权威服务器,以供所述权威服务器根据所述对应关系,将对应的各所述群集中包括的查询时间序列中的目标域名列表中的目标域名对应的域 名数据,缓存至所述权威服务器的缓存中。
5.根据权利要求2或3所述的权威服务器负载均衡的方法,其特征在于,还包括接收第一递归服务器的域名查询请求,所述域名查询请求中包括所述第一递归服务器 的标识和查询域名;根据所述对应关系,获取与所述第一递归服务器的标识对应的第一权威服务器的标识;将所述域名查询请求发送给所述第一权威服务器,以供所述第一权威服务器获取所述 查询域名对应的域名数据。
6.根据权利要求5所述的权威服务器负载均衡的方法,其特征在于,将所述域名查询 请求发送给所述第一权威服务器,以供所述第一权威服务器获取所述查询域名对应的域名 数据,具体包括将所述域名查询请求发送给所述第一权威服务器,以供所述第一权威服务 器从其缓存中获取所述查询域名对应的域名数据。
7.根据权利要求5所述的权威服务器负载均衡的方法,其特征在于,还包括根据所述参考模型的模型参数,获取预测查询域名,所述预测查询域名为在所述查询 域名之后的下一次可能被查询的域名;将包括所述预测查询域名的检测请求发送至所述第一权威服务器,以供所述第一权威 服务器检测其缓存中是否存储有所述预测查询域名的域名数据;当所述第一权威服务器中没有存储所述预测查询域名的域名数据,向所述第一权威服 务器发送缓存请求,以供所述第一权威服务器将所述预测查询域名的域名数据从所述第一 权威服务器的内存中读取至所述第一权威服务器的缓存中。
8.一种权威服务器的负载均衡设备,其特征在于,包括聚类处理模块,用于根据多个递归服务器的查询行为特征将所述多个递归服务器聚类 为至少一个群集;配置模块,用于建立各所述群集与目标区的权威服务器组中的权威服务器之间的对应 关系。
9.根据权利要求8所述的权威服务器的负载均衡设备,其特征在于,所述聚类处理模 块,包括第一获取单元,用于获取所述多个递归服务器在第一时间段内的查询时间序列;各 所述查询时间序列包括对应的递归服务器的标识和按照查询时间顺序排列的目标域名列 表;第二获取单元,用于根据所述多个查询时间序列,获取参考模型的模型参数和所述至 少一个群集的群集数目;聚类处理单元,用于根据所述模型参数和所述群集数目,对所述多个查询时间序列进 行聚类处理,使得所述多个查询时间序列分别划分至所述至少一个群集中。
10.根据权利要求9所述的权威服务器的负载均衡设备,其特征在于,还包括第一发送模块,用于将所述对应关系发送给对应的所述权威服务器,以供所述权威服 务器根据所述对应关系,将对应的各所述群集中包括的查询时间序列中的目标域名列表中 的目标域名对应的域名数据,缓存至所述权威服务器的缓存中。
11.根据权利要求9所述的权威服务器的负载均衡设备,其特征在于,还包括接收模块,用于接收第一递归服务器的域名查询请求,所述域名查询请求中包括所述 第一递归服务器的标识和查询域名;查询模块,用于根据所述对应关系,获取与所述第一递归服务器对应的第一权威服务 器的标识;第二发送模块,用于将所述域名查询请求发送给所述第一权威服务器,以供所述第一 权威服务器获取所述查询域名对应的域名数据。
12.根据权利要求11所述的权威服务器的负载均衡设备,其特征在于,还包括第三获取模块,用于根据所述参考模型的模型参数,获取预测查询域名,所述预测查询 域名为在所述查询域名之后的下一次可能被查询的域名;第三发送模块,用于将包括所述预测查询域名的检测请求发送至所述第一权威服务 器,以供所述第一权威服务器检测其缓存中是否存储有所述预测查询域名的域名数据;缓存请求模块,用于当所述第一权威服务器中没有存储所述预测查询域名的域名数 据,向所述第一权威服务器发送缓存请求,以供所述第一权威服务器将所述预测查询域名 的域名数据从所述第一权威服务器的内存中读取至所述第一权威服务器的缓存中。
13.—种域名系统,包括至少一个递归服务器、至少一个区的权威服务器组,以及至少 一个如上述权利要求8-12任一所述的权威服务器的负载均衡设备;各区的权威服务器组 中包括至少一个权威服务器;所述权威服务器的负载均衡设备与对应区的权威服务器组中 的至少一个权威服务器连接;所述权威服务器的负载均衡设备还与所述至少一个递归服务 器连接。
全文摘要
本发明提供一种权威服务器负载均衡的方法、设备及系统。其方法包括根据多个递归服务器的查询行为特征将所述多个递归服务器聚类为至少一个群集;建立各所述群集与目标区的权威服务器组中的权威服务器之间的对应关系。采用本发明的技术方案,能够有效地实现负载均衡的目的,具有较强的适用性。
文档编号H04L12/56GK101945041SQ20101027219
公开日2011年1月12日 申请日期2010年9月2日 优先权日2010年9月2日
发明者卢文哲, 吴军, 李晓东, 毛伟, 王欣, 金键 申请人:中国科学院计算机网络信息中心;北龙中网(北京)科技有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1