一种实现网站容灾容错运行的方法与系统的制作方法

文档序号:7946506阅读:268来源:国知局
专利名称:一种实现网站容灾容错运行的方法与系统的制作方法
技术领域
本发明涉及网站安全运行的技术,尤其涉及一种实现网站容灾容错运行的方 法与系统。
背景技术
一个网站的运行,由于需要众多的运营商环节、软硬件设施、各种通讯协议、 技术和人员的支撑,所以发生故障的因素就多种多样,但对于一些关键部门的网站 而言,由于发布信息具有权威性、严肃性、唯一性以及不容篡改性等基本要求,同 时,这些网站的连续可用性也是社会各界关注的焦点,对于这些至关重要的网站, 如何能做到在容灾、容错的前提下长时间的连续运行,即应急保障,就成为了当前 众多网站运行中遇到的棘手问题。其中的主要不利技术因素在于
1) 域名系统(Domain Name System,下称DNS)的工作模式是异步的、多级缓 存的、重定向和分发机制的,这就决定了一个网站在切换不同IP的对外工作服务 器时会有很长的延迟。
2) 网站故障在形式、原因和影响地域等方面具有相当复杂性和多样性,这就 决定了仅使用一些简单的测试方法(如测试链路通断Ping、 了解设备负载等)不 能判断如数据错误、内容被篡改等复杂问题。
综上因素可知,网站要实现可以动态的、异地的、在容灾容错状态下可持续 运行,需要融合多项不同系统的技术方案才能够平稳实现这一需求。

发明内容
本发明的目的在于解决上述问题,提供了一种实现网站容灾容错运行的系统, 对网站经营中的故障及错误具有实时容错容灾的能力。
本发明的另一目的在于提供了一种实现网站容灾容错运行的方法。 本发明的技术方案为本发明揭示了一种实现网站容灾容错运行的系统,包括
至少一个使用容灾备份服务的目标网站;
容灾备份中心,包括备份服务器和存储装置,该存储装置用于存储该些目标 网站的应急备份网站,该备份服务器用于运行应急备份网站;
监控和调度中心,独立运行并识别目标网站的错误和故障,当发生故障或故 障恢复时发送调度指令;
DNS管理中心,包括一组DNS服务器,实现目标网站和应急备份网站的切 换,在接收到该监控和调度中心的发生故障的调度指令以切换到应急备份网站时, 根据域名选中应急备份网站的IP地址,通过该应急备份网站的IP地址实现对该域 名的用户解析请求,在接收到该监控和调度中心的故障解除的调度指令以切换到目 标网站时,根据域名选中目标网站的IP地址,通过该目标网站的IP地址实现对该 域名的用户解析请求。
上述的实现网站容灾容错运行的系统,其中,该容灾备份中心具有自动备份 和数据同步机制,备份数据来自目标网站,该数据同步机制包括划定虚拟服务器 工作区并使用虚拟网络安全隧道来同步所有动态网站的数据;或直接通过访问目标
网站并下载和存储为静态网页。
上述的实现网站容灾容错运行的系统,其中,该DNS服务器使用的生存时间 值为600秒以内。
上述的实现网站容灾容错运行的系统,其中,该监控和调度中心在识别出目 标网站发生故障或者目标网站的故障已经解除时,在发送调度指令的同时向外通知 目标网站的当前状态。
上述的实现网站容灾容错运行的系统,其中,该容灾备份中心启用间隔了一 个时间窗的旧数据提供应急服务。
本发明还揭示了一种实现网站容灾容错运行的方法,包括
监控和调度中心实时监测目标网站,在发现目标网站出现错误或故障时,呼
叫DNS管理中心和容灾备份中心,DNS管理中心启用容灾备份中心所存储的应急 备份网站的IP地址作为当前的解析记录,容灾备份中心设置和检查数据,用户请 求的域名通过该应急备份网站的IP地址访问该应急备份网站;
监控和调度中心实时监测目标网站,在发现目标网站的错误或故障解除时且已持续运行时长超出一预设值,开始呼叫DNS管理中心和容灾备份中心,DNS管 理中心启用原始的目标网站的IP地址作为当前的解析记录,用户请求的域名通过 该原始的目标网站的IP地址访问目标网站,容灾备份中心恢复应急备份网站的数 据同步与备份工作。
上述的实现网站容灾容错运行的方法,其中,该容灾备份中心的数据同步包 括划定虚拟服务器工作区并使用虚拟网络安全隧道来同步所有动态网站的数据; 或直接通过访问目标网站并下载和存储为静态网页。
上述的实现网站容灾容错运行的方法,其中,用户访问请求先使用在本地DNS 缓存服务器中的缓存记录,该本次DNS缓存服务器使用的生存时间值为600秒以 内。
上述的实现网站容灾容错运行的方法,其中,该监控和调度中心在识别出目 标网站发生故障或者目标网站的故障已经解除时,在发送调度指令的同时向外通知 目标网站的当前状态。
上述的实现网站容灾容错运行的方法,其中,该容灾备份中心启用间隔了一 个时间窗的旧数据提供应急服务。
本发明对比现有技术有如下的有益效果本发明通过在网站运行过程中,当
出现各类故障时(电源故障、网络故障、硬件设施故障、软件程序故障、网站维护 中的人为故障、网站高负载运行和系统崩溃、网站遭黑客攻击、网页被非法篡改、 自然灾害等)能够及时切换启用备用服务器组继续对外提供连续服务,从而使一个 (或一组)网站能够保持连续运行并尽可能少的向访问者展示故障和错误。本发明
融合了现有网站监控、内容分发网络(CDN)和容灾备份等技术而形成了一套综合 技术方案和实施方法,本方案较好的解决了位于广域网中的重要部门网站对容错、 容灾和连续运行提出的应急保障需求。


图1是本发明的实现网站容灾容错运行的系统的较佳实施例的概述图。 图2是本发明的实现网站容灾容错运行的方法切换为应急工作方式的示意图。 图3是本发明的实现网站容灾容错运行的方法切换为正常工作方式的示意图。 图4是本发明的一种状态下的数据流示意图。图5是本发明的另一种状态下的数据流示意图。
具体实施例方式
下面结合附图和实施例对本发明作进一步的描述。
图1示出了本发明的实现网站容灾容错运行的系统的较佳实施例。请参加图
1,本实施例的系统包括监控和调度中心1、 DNS管理中心2、容灾备份中心3以及 目标网站4。其中目标网站4可以有多个,例如目标网站a、目标网站b等,除了 在DNS记录中需做CNAME记录或托管面S外,目标网站无需再做任何软、硬件设置 以及管理和运营的改变。
容灾备份中心3包括一组备份服务器30 (例如图示的备份服务器a、备份服 务器b)以及存储装置31。存储装置31用于存储目标网站对应的应急备份网站, 例如目标网站a对应的应急备份网站a。备份服务器30用于运行应急备份网站。 容灾备份中心3需要在接入带宽、软硬件性能等吞吐量设计上做好充分冗余能力安 排。容灾备份中心3具有自动备份和数据同步机制,通过同步或异步方式自动镜像 网站中的网页内容、数据并建立好备份存档。如何同步取决于用户决定,可使用的 方法如划定虚拟服务器(VPS)工作区并使用虚拟网络(VPN)安全隧道来同步所 有数据(通常是用于动态网站,保证和数据的高度一致性),或直接通过访问目标 网站并下载和存储网页(通常是用于静态页面为主的网站)。容灾备份中心3具有 一对多的特征,可以集中管理和存放多个目标网站的镜像。
监控和调度中心1是独立设置和运行的,通过各种手段判断出各种网站错误 以及通过各种手段验证错误判断的可信性。监控和调度中心1使用任意复杂算法和 机制来提高发现问题的准确性。这些网站错误包括链路检査、连接超时检査、拒 接连接、4XX和5XX系统错误检查以及内容错误(被劫持、篡改、人为疏失或I/0 数据错误引起)等等。调度中心通过分布式工作、充分冗余和校验机制的实现,从 而确保监控和调度中心获得较高的稳定性和可靠性支撑。
DNS管理中心2包括一组互为冗余对外工作的DNS服务器,DNS管理中心2主 要实现目标网站4和应急备份网站的切换。由于DNS使用了多级缓存、重定向和分 发机制,所以要实现一个网站由一组服务器切换为另一组服务器提供服务,需要很 长的时间才能完成缓存记录的刷新,这个刷新时间的长短取决于源DNS服务器中相应域名记录的TTL记录所规定的时长加上一个适当量延时,这大致是一个网站切换 工作机IP地址所需的总时间。为了加快网站的切换时间,在处理好压力和负载均 衡性能的前提下DNS服务器中对域名的管理执行短生存时间(Time To Live,即 TTL)策略,TTL值縮短为600秒以内。当监控和调度中心1监测到某目标网站(主 服务器)错误时,将使用调度指令通知DNS服务器的API接口 ,令DNS开始对外解 析某域名。DNS服务器依据调度指令选中寄存于本机的该域名对应的应急备份网站 的IP地址,在此后对该域名的用户解析请求时,提供这一新选中的应急备份网站 的IP地址发还给用户。也就是说,此时使用容灾备份中心3中的应急备份网站的 IP地址作为该域名的工作服务器地址。与此同时,监控和调度中心1也以各种通 讯方式通知网站相关责任人察觉故障和已启动的切换机制状态,以便及时维护网站 和解决故障。在由容灾备份中心3向用户推送网页时,容灾备份中心3的数据与从 复制目标网站主服务器的数据,保留一个适当的时间窗来避免"备份到错误"。
监控和调度中心1仍然持续的监控目标网站原来的主服务器,当发现故障已 被解除并稳定运行了一个既定的时间值之后,监控和调度中心1使用调度指令通知 DNS服务器的API接口 。 DNS服务器依据调度指令选中目标网站原来的主服务器的 IP地址,即网站由应急备份服务器换回主服务器继续提供服务,并同时告知网站 相关责任人。
图2示出了本发明的实现网站容灾容错运行的方法切换为应急工作方式。请 参加图2,监控和调度中心实时监测目标网站的重要网页,当发现目标网站出现错 误或故障时呼叫DNS管理中心和容灾备份中心(步骤S20)。然后,DNS管理中心 开始启用容灾备份中心所存储的应急备份网站的IP地址作为新的解析记录,容灾 备份中心开始设置和检查数据,准备接收即将到来的用户访问(步骤S22)。而后, 访问者开始使用容灾备份中心的IP地址访问应急备份网站(步骤S24)。
图3示出了本发明的实现网站容灾容错运行的方法切换为正常工作方式。请 参加图3,监控和调度中心实时监测目标网站的重要网页,当发现目标网站的错误 或故障已被解除且已持续运行时长超过一个预设值,便开始呼叫DNS管理中心和容 灾备份中心(步骤S30) 。 DNS管理中心开始启用目标网站的主服务器IP地址为新 的解析记录,容灾备份中心开始恢复周期性的网站数据同步与备份工作(步骤 S32)。访问者开始使用目标网站的主服务器IP地址访问目标网站(步骤S34)。
8图4描述了用户访问请求、本地DNS服务器、主记录所在的智能动态DNS服 务器、监控和调度中心、主网站(图示以abc.gov为例的网站)和容灾中心镜像网 站(图示以abc.gov为例的容灾镜像)之间的数据流和时序关系。
当一个用户发起请求某网站(例如图示的abc.gov网站)时,用户浏览器查 询本地DNS服务器,如果本地DNS服务器中的缓存记录有效,则直接返回主网站(或 应急备份网站)的映射IP地址,之后用户从该IP地址的服务器上获得相应内容和 服务。
当一个用户发起请求某网站时,遇到本地DNS服务器缓存中的记录过期(TTL 生存时间过期)时,本地DNS服务器通过根域名服务器引导最终抵达存放了相应域 名的智能动态DNS服务器,开始査询该域名的映射IP地址,智能动态DNS服务器 根据当时的调度状态返回应急备份网站(或主服务器网站)的IP给发出查询的本 地DNS服务器,本地DNS服务器在刷新域名记录并开始TTL倒计时的同时,转发 IP记录给用户,从而实现自一个用户请求访问某域名网站,到获得对应IP地址的 服务器来提供相应内容和服务的全过程。
当目标网站主服务器处于平稳运行状态时,根据监控和调度中心的调度,容 灾备份中心定期从主服务器读取数据并建立镜像。当遇到调度通知将立即启用容灾 备份中心服务时,容灾备份中心将放弃当前正在备份的数据,而启用间隔了一个时 间窗的旧数据向用户提供服务,这样将防止容灾备份中心备份到"错误或篡改后的 网页"。
图5为图4并列的另一种子状态。用户不希望完全托管DNS解析服务在智能 动态DNS服务器中。此时用户仅需要在其智能动态DNS服务器中做CNAME描述即可, 此时用户的查询请求会被重定向到智能动态DNS服务器,从而最终实现及达到图4 一致的目的和效果。
上述实施例是提供给本领域普通技术人员来实现或使用本发明的,本领域普 通技术人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种种修改或 变化,因而本发明的保护范围并不被上述实施例所限,而应该是符合权利要求书提 到的创新性特征的最大范围。
权利要求
1、一种实现网站容灾容错运行的系统,包括至少一个使用容灾备份服务的目标网站;容灾备份中心,包括备份服务器和存储装置,该存储装置用于存储该些目标网站的应急备份网站,该备份服务器用于运行应急备份网站;监控和调度中心,独立运行并识别目标网站的错误和故障,当发生故障或故障恢复时发送调度指令;DNS管理中心,包括一组DNS服务器,实现目标网站和应急备份网站的切换,在接收到该监控和调度中心的发生故障的调度指令以切换到应急备份网站时,根据域名选中应急备份网站的IP地址,通过该应急备份网站的IP地址实现对该域名的用户解析请求,在接收到该监控和调度中心的故障解除的调度指令以切换到目标网站时,根据域名选中目标网站的IP地址,通过该目标网站的IP地址实现对该域名的用户解析请求。
2、 根据权利要求1所述的实现网站容灾容错运行的系统,其特征在于,该容 灾备份中心具有自动备份和数据同步机制,备份数据来自目标网站,该数据同步机制包括划定虚拟服务器工作区并使用虚拟网络安全隧道来同步所有动态网站的数 据;或直接通过访问目标网站并下载和存储为静态网页。
3、 根据权利要求1所述的实现网站容灾容错运行的系统,其特征在于,该 DNS服务器使用的生存时间值为600秒以内。
4、 根据权利要求l所述的实现网站容灾容错运行的系统,其特征在于,该监 控和调度中心在识别出目标网站发生故障或者目标网站的故障已经解除时,在发送 调度指令的同时向外通知目标网站的当前状态。
5、 根据权利要求1所述的实现网站容灾容错运行的系统,其特征在于,该容 灾备份中心启用间隔了一个时间窗的旧数据提供应急服务。
6、 一种实现网站容灾容错运行的方法,包括监控和调度中心实时监测目标网站,在发现目标网站出现错误或故障时,呼叫DNS管理中心和容灾备份中心,DNS管理中心启用容灾备份中心所存储的应急备份网站的IP地址作为当前的解析记录,容灾备份中心设置和检查数据,用户请 求的域名通过该应急备份网站的IP地址访问该应急备份网站;监控和调度中心实时监测目标网站,在发现目标网站的错误或故障解除时且已持续运行时长超出一预设值,开始呼叫DNS管理中心和容灾备份中心,DNS管 理中心启用原始的目标网站的IP地址作为当前的解析记录,用户请求的域名通过 该原始的目标网站的IP地址访问目标网站,容灾备份中心恢复应急备份网站的数 据同步与备份工作。
7、 根据权利要求6所述的实现网站容灾容错运行的方法,其特征在于,该容 灾备份中心的数据同步包括划定虚拟服务器工作区并使用虚拟网络安全隧道来同 步所有动态网站的数据;或直接通过访问目标网站并下载和存储为静态网页。
8、 根据权利要求6所述的实现网站容灾容错运行的方法,其特征在于,用户 访问请求先使用在本地DNS缓存服务器中的缓存记录,该本次DNS缓存服务器使 用的生存时间值为600秒以内。
9、 根据权利要求6所述的实现网站容灾容错运行的方法,其特征在于,该监 控和调度中心在识别出目标网站发生故障或者目标网站的故障已经解除时,在发送 调度指令的同时向外通知目标网站的当前状态。
10、 根据权利要求6所述的实现网站容灾容错运行的方法,其特征在于'该 容灾备份中心启用间隔了一个时间窗的旧数据提供应急服务。
全文摘要
本发明公开了一种实现网站容灾容错运行的方法与系统,对网站经营中的故障及错误具有实时容错容灾的能力。其技术方案为本发明的系统包括目标网站;容灾备份中心,用于存储和运行该些目标网站的应急备份网站;监控和调度中心,独立运行并识别目标网站的错误和故障,当发生故障或故障恢复时发送调度指令;DNS管理中心实现目标网站和应急备份网站的切换,在接收调度指令以切换到应急备份网站时,根据域名选中应急备份网站的IP地址,实现对该域名的用户解析请求,在接收调度指令以切换到目标网站时,根据域名选中目标网站的IP地址,实现对该域名的用户解析请求。本发明应用于网络服务。
文档编号H04L12/26GK101465768SQ20091004517
公开日2009年6月24日 申请日期2009年1月12日 优先权日2009年1月12日
发明者纪明敏, 许晨光, 诺 郭, 郭剑波 申请人:上海及第熊软件科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1