一种分布式DNS服务的多维度校验方法和系统与流程

文档序号:16149465发布日期:2018-12-05 17:15阅读:171来源:国知局
本发明属于网络
技术领域
:,涉及一种分布式dns服务的多维度校验方法和系统。
背景技术
:本发明属于计算机网络领域中针对分布式解析服务的系统校验分析技术。解析系统是互联网的重要基础设施,主要负责域名和ip地址之间的转换。目前,主要通过系统体检或服务监控以校验和保障解析系统的稳定可靠运行。现有解析服务的体检或监控技术主要通过监测点发起服务探测,根据探测结果验证服务的可用性和正确性,主要存在如下问题:a)、只对具体校验项进行结果检查,缺乏针对校验中发现问题的关联分析;b)、其检验场景主要是针对系统基本的对外服务,缺乏对于系统整体部署逻辑及配置管理规范性与正确性的校验。技术实现要素:针对现有技术中存在的技术问题,本发明的目的在于提供一种分布式dns服务的多维度校验方法和系统。该系统依据整体服务部署情况,通过外部分布式监测点进行对外服务校验,通过内部监测点对各服务角色进行针对性的系统和服务状态校验,并通过校验项之间的依赖与关联关系,智能化分析问题关键所在,同时通过对系统整体部署情况及针对服务角色的配置规范性正确性校验,发现潜在问题,方便便捷管理。为了实现上述目的,本发明的技术方案为:一种分布式dns服务的多维度校验方法,其步骤为:1)校验与分析单元获取解析服务器集群的服务信息及各服务器角色、系统服务配置规范;2)校验和分析单元根据解析服务器集群当前提供的服务信息,触发外部分布式监测点从各地发起服务探测以校验解析服务器集群对外服务是否正常,以及触发内部系统与服务状态搜集单元搜集和校验所述解析服务器集群内各服务器的配置与运行状态;3)校验和分析单元将对外服务异常信息和所述内部系统与服务状态搜集单元的收集信息进行关联分析,完成对当前对外服务的校验。进一步的,发起的所述服务探测包括网络可达性、端口可达性、基本服务可用性、服务性能参数、数据同步和重点数据正确性。进一步的,所述关联分析包括上层应用依赖下层网络、精细逻辑依赖基本可用性、整体异常关联具体落点、本地正常考虑中间链路以具体定位故障点;其中,首先进行上层应用依赖下层网络分析,即对重点数据正确性、数据同步情况、服务性能参数、基本服务可用性进行校验,对端口可达性、网络可达性进行校验,如果同时出现校验异常,则确定出异常发生范围为下层网络;如果下层网络未发生异常,则进行精细逻辑依赖基本可用性分析,即对重点数据正确性、数据同步情况、服务性能参数进行校验,对基本服务可用性进行校验,如果同时校验异常,则确定为问题发生在基本服务可用性;然后进行整体异常关联具体落点分析,即当多个节点对外提供的服务发现异常时,则查询重点数据正确性、数据同步情况、服务性能参数、基本服务可用性、端口可达性和网络可达性所在落点的本地校验情况,当对应落点发生相同的异常时,定位问题和该落点有关;若对应落点未发生相关异常,则定位问题发生在探测点与落点的中间链路。进一步的,所述校验与分析单元根据整体服务信息确定出解析服务器集群的服务器是否为服务单点或薄弱环节;所述内部系统与服务状态搜集单元对解析服务器集群的服务器进行配置正确性与规范性检查。进一步的,所述服务信息维护单元维护的信息包括设定域名、为设定域名提供解析服务的服务地址、解析节点及服务器名称、服务器之间的主辅关系、系统和软件版本规范、系统参数规范和服务配置模板;所述对外服务异常信息包括校验异常的探测项及该探测项的探测发起源与落点。一种分布式dns服务的多维度校验系统,其特征在于,包括服务信息维护单元、校验与分析单元、外部分布式监测点、内部系统与服务状态搜集单元、解析服务器集群;其中,所述服务信息维护单元,用于维护解析服务器集群所承载的服务信息及所述解析服务器集群内的服务器角色、系统服务配置规范;所述内部系统与服务状态搜集单元,用于搜集和校验所述解析服务器集群内各服务器的配置与运行状态;所述解析服务器集群,用于对外提供解析服务;所述外部分布式监测点,用于从各地发起服务探测以校验解析集群对外服务是否正常,并标记对外服务异常信息;所述校验与分析单元,用于根据服务信息触发外部分布式监测点从各地发起服务探测以校验解析服务器集群对外服务是否正常,然后将对外服务异常信息和所述内部系统与服务状态搜集单元的收集信息进行关联分析,完成对当前对外服务的校验。进一步的,所述服务信息维护单元维护的信息包括设定域名、为设定域名提供解析服务的服务地址及服务器名称、服务器之间的主辅关系、系统和软件版本规范、系统参数规范和服务配置模板。进一步的,所述配置与运行状态包括系统网络配置与状态、访问控制配置与端口状态、服务配置与服务可用性/性能/数据同步/重点数据正确性状态。进一步的,所述对外服务异常信息包括校验异常的探测项及该探测项的探测发起源与落点;发起的所述服务探测包括网络可达性、端口可达性、基本服务可用性、服务性能参数、数据同步和重点数据正确性。进一步的,所述关联分析包括上层应用依赖下层网络、精细逻辑依赖基本可用性、整体异常关联具体落点、本地正常考虑中间链路;通过所述关联分析定位故障点;同时通过对系统整体部署情况进行服务单点或薄弱点分析,以及对各服务角色进行服务配置模板匹配和状态参数阈值检查,确定服务变更或系统局部故障对系统的潜在影响。本系统包括服务信息维护单元、校验与分析单元、外部分布式监测点、内部系统与服务状态搜集单元和解析服务器集群,其中,所述服务信息维护单元,用于维护解析服务器集群所承载的服务信息及集群内的服务器角色、系统服务配置规范等,包括提供设定域名的解析服务、解析服务的对外服务地址、在哪些后台服务器上提供此域名的服务、服务器之间的主辅关系、系统和软件版本规范、系统参数规范和服务配置模板等;所述校验与分析单元,根据服务信息维护单元维护的服务信息,通过外部分布式监测点触发对外服务探测校验,通过内部系统与服务状态搜集单元触发内部系统服务状态搜集校验,并对内外校验信息进行智能分析,包括上层应用依赖下层网络、精细逻辑依赖基本可用性、整体异常关联具体落点、本地正常考虑中间链路等方法,具体定位故障点,同时通过对系统整体部署情况进行服务单点/薄弱点分析,以及对各服务角色进行配置模板匹配和状态参数阈值检查,及时发现服务变更或局部故障对系统的潜在影响且方便便捷管理;所述外部分布式监测点,用于从各地发起服务探测以校验解析集群对外服务是否正常,包括网络可达性、端口可达性、基本服务可用性、服务性能参数、数据同步情况、重点数据正确性探测等,同时标记校验异常的探测项并记录此次探测的发起源与落点等;所述内部系统与服务状态搜集单元,用于搜集和校验集群内各服务器的配置与运行状态,包括系统网络配置与状态、访问控制配置与端口状态、服务配置与服务可用性/性能/数据同步/重点数据正确性状态等;以及所述解析服务器集群,用于对外提供解析服务。通过服务信息维护单元获取服务信息与关联服务器,由校验与分析单元触发外部分布式监测点从各地发起服务探测,触发内部系统与服务状态搜集单元进行内部系统与服务状态探测,将外部探测与内部探测结果关联分析,得出问题关键所在。同时对系统整体部署情况进行服务单点/薄弱点分析,以及对各服务角色进行配置模板匹配和状态参数阈值检查,及时发现服务变更或局部故障对系统的潜在影响且方便便捷管理。与现有技术相比,本发明的积极效果为:1)通过从外部进行服务探测、从内部进行系统与服务状态搜集,并根据系统部署信息对校验结果进行智能分析,快速定位问题的关键所在;2)通过对内部系统服务状态搜集与配置规范性正确性检查,结合系统整体部署逻辑,分析各服务是否有单点及薄弱环节、各服务器是否符合配置规范、是否存在潜在问题,以提高系统安全性,并方便统一维护与便捷管理。附图说明图1是本发明一个实施例的一种分布式dns服务的多维度校验分析系统的结构框图;图2是本发明一个实施例的一种分布式dns服务的多维度校验分析系统的示意图;图3是本发明一个实施例的一种分布式dns服务的多维度校验分析方法的流程图。具体实施方式下面结合附图,对优选实施例作详细说明。应该强调的是下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。图1是本发明一个实施例的一种分布式dns服务的多维度校验分析系统的结构框图。图2是本发明一个实施例的一种分布式dns服务的多维度校验分析系统的示意图。如图1和图2所示,该分布式dns服务的多维度校验分析系统可以包括:服务信息维护单元10、校验与分析单元20、外部分布式监测点30、内部系统与服务状态搜集单元40及解析服务器集群50。具体地,服务信息维护单元10可用于维护解析集群所承载的服务信息及集群内的服务器角色、系统和服务配置规范等。更具体地,服务信息维护单元10可以维护集群承载了哪几种解析服务、每个服务的ns和对外服务地址、集群中提供此服务的服务器有哪些,主辅关系如何、系统和服务应符合的配置管理规范等。举例而言,从服务信息维护单元10获取服务信息a.dns.example和b.dns.example提供.example的顶级域服务,节点a和b为a.dns.example的anycast服务节点,节点c和d为b.dns.example的anycast服务节点,服务器a1、a2、b1、b2、c1、c2、d1、d2分别是节点a、b、c、d内提供服务的解析服务器。校验与分析单元20可根据服务信息触发外部分布式监测点30从各地发起服务探测以校验解析集群对外服务是否正常,并触发内部系统与服务状态搜集单元40搜集和校验集群内相关服务器的系统服务的配置与运行状态,然后对外部服务探测异常和内部系统服务收集信息进行关联分析,定位问题的关键所在。举例而言,为对.example的顶级域服务进行服务校验,校验与分析单元20从服务信息维护单元10获取.example的服务信息,触发外部分布式监测点30针对a.dns.example和b.dns.example发起服务探测,包括网络可达性、端口可达性、基本服务可用性、服务性能参数,数据同步、重点数据正确性等,并记录异常查询落点;同时触发内部系统与服务状态搜集单元40针对提供.example顶级域服务的内部角色进行系统网络配置与状态、访问控制配置与端口状态、服务配置与服务可用性/性能/数据同步/重点数据正确性状态等。更具体的,校验结果可以如下表所示:外部服务校验查询落点a内部状态校验重点数据正确性:部分异常本地重点数据正确性:正常数据同步情况:部分异常本地数据同步情况:正常服务性能参数:部分异常本地服务性能:正常基本服务可用性:部分异常服务配置与服务可用性:正常端口可达性:部分异常访问控制配置与端口状态:正常网络可达性:全部正常系统网络配置与状态:正常校验与分析单元20对校验结果进行智能分析,包括上层应用依赖下层网络、精细逻辑依赖基本可用性、整体异常关联具体落点、本地正常考虑中间链路等方法,具体定位故障点。上层应用指重点数据正确性、数据同步情况、服务性能参数、基本服务可用性,下层网络指端口可达性和网络可达性,上层应用依赖下层网络指前者(重点数据正确性、数据同步情况、服务性能参数、基本服务可用性)与后者(端口可达性和网络可达性)同时校验异常时,根据上层应用与下层网络的依赖关系,确定出异常发生范围;如果下层网络未发生异常,则进行精细逻辑依赖基本可用性分析,精细逻辑包括重点数据正确性、数据同步情况、服务性能参数,精细逻辑依赖基本可用性分析指前者(即重点数据正确性、数据同步情况、服务性能参数)与后者(基本服务可用性)同时校验异常时,问题发生在基本服务可用性;整体异常关联具体落点是指多个节点对外提供的服务发现异常时,需要追踪到具体节点,查询校验项(重点数据正确性、数据同步情况、服务性能参数、基本服务可用性、端口可达性和网络可达性)所在落点的本地校验情况,当具体落点发生相同的异常时,可定位问题和此落点有关,同时结合上层应用依赖下层网络、精细逻辑依赖基本可用性,可判断此落点的哪一处发生异常;本地正常考虑中间链路,是指当整体服务出现异常而具体落点未发生此类异常时,可定位问题与监测点到落点的网络或访问策略有关,在结合上层应用依赖下层网络、精细逻辑依赖基本可用性,即可定位问题发生在那个节点的那一层逻辑。故分析上述服务异常可知,整体服务异常的关键在于端口可达性发生异常,而具体落点未发生此异常,问题出在监测点到落点a之间的端口访问策略上。另外,校验与分析单元20可根据服务整体信息分析系统单点和薄弱环节。服务整体信息包括系统承载的域名服务列表、域名对外解析服务地址、承载设定域名服务的解析节点、解析服务等。举例而言,若节点c发生设备故障导致节点不可用,通过对整体服务信息进行分析,可发现节点d是a.dns.example的服务单点。另外,校验与分析单元20可对各服务角色进行配置模板匹配和状态参数阈值检查。举例而言,发现服务器d1的未配置iptables,存在风险。解析服务器集群50用于对外提供解析服务。举例而言,对外提供.example的顶级域解析服务。图3是本发明一个实施例的一种分布式dns服务的多维度校验分析方法的流程图。如图3所示,该分布式dns服务的多维度校验分析方法可以包括:s01,校验与分析单元获取服务信息及各服务器角色、系统服务配置规范等。s02,校验和分析单元触发外部分布式监测点针对整体服务进行探测,触发内部系统与服务状态搜集单元对内部系统服务状态进行搜集,并对信息进行关联分析。s03,校验与分析单元针对整体服务架构信息分析服务单点或薄弱环节。s04,内部系统与服务状态搜集单元进行配置正确性与规范性检查,发现隐藏问题,方便统一与便捷管理。以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
技术领域
:的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1