应用发布方法及系统的制作方法

文档序号:8365597阅读:193来源:国知局
应用发布方法及系统的制作方法
【技术领域】
[0001] 本发明涉及计算机应用领域,特别涉及一种基于集群的应用发布方法及系统。
【背景技术】
[0002] 随着信息技术和互联网的发展,应用需要处理的信息日益膨胀。因此,应用在发布 时通常发布在一个集群中,并行处理信息,以提高信息的吞吐量。同时,应用版本的更迭日 益加快,需要更加健全的应用发布系统来保证每一次的发布能够顺利完成。目前的发布系 统,通常会在发布前进行应用编译,监测待发布应用是否存在问题。如果待发布应用不存在 问题,发布系统会将新代码发布到集群的每一台机器上。这样的发布系统存在一个不可避 免的问题,即一旦新的版本存在未被发现的问题,该问题有可能会在全部发布完成后集中 爆发出来,对整个系统产生影响,造成严重的后果,并且在后续处理中需要对每一台机器进 行版本回滚,导致修复系统时间延长,无法有效地控制损失。因此,提高发布系统的安全性 具有非常重要的意义。目前在发布系统中,这一方面的技术比较欠缺。往往一次失败的版 本发布会对整个公司业务造成严重的影响,而且会花费大量的人力来处理该紧急事件,造 成严重的经济损失。

【发明内容】

[0003] 本发明要解决的技术问题是为了克服现有技术中由于应用在被发布到集群中的 所有机器后出现问题,导致整个系统产生影响以及后续修复系统时间长等的缺陷,提供一 种实时监测应用运行状态,并在监测到问题时停止发布的应用发布方法及系统。
[0004] 本发明是通过下述技术方案来解决上述技术问题的:
[0005] 一种应用发布方法,该应用发布方法用于包含N台机器的第一集群,其特点在于, 该应用发布方法包括一更新方法和一监测方法,
[0006] 该更新方法包括以下步骤,设M的初始值为1 :
[0007] Sn、更新该第一集群内第M~M+P台机器的代码;
[0008] S12、将M赋值为M+P+1 ;
[0009] S13、判断M+P是否小于N,若是,则进入步骤Sn,若否,则进入步骤S14;
[0010] S14、更新该第一集群内第M~N台机器的代码;
[0011] 其中,P为整数,且N彡 2,0 彡P< (N-M-l)/2 ;
[0012] 该监测方法包括以下步骤:
[0013] S21、监测该第一集群内已更新代码的机器中出现的错误量X1(l和待更新代码的机 器中出现的错误量Y1(l;
[0014] S22、判断X1(l/Y1(l是否小于或等于第一预设阈值,若是,则进入步骤S21,若否,则进入 步骤S23;
[0015] S23、结束该更新方法和该监测方法的流程,并控制该第一集群内已更新代码的机 器进行代码回滚。
[0016] 本方案中,该更新方法和该监测方法是并行执行的,该监测方法用于实时监测第 一集群内的机器出现的错误量,并在错误率X1(l/Y1(l大于第一预设阈值时结束该应用发布方 法的流程,包括结束该更新方法和该监测方法的流程,即停止发布。此时应用发布失败,为 了保证系统的正常运行,控制已更新代码的机器进行代码回滚,即将已更新代码的机器中 的代码回滚到更新之前的版本。
[0017] 另外,在该更新方法的步骤s14执行完毕后,该监测方法停止执行,此时应用发布 成功。其中,该第一预设阈值的值可以根据系统能够正常运行的条件来设定,也可以根据用 户的需要来设定。
[0018] 较佳地,该监测方法还包括以下步骤:
[0019]s24、监测该第一集群内所有机器中出现的错误量xn;
[0020] s25、判断、是否小于或等于第二预设阈值,若是,则进入步骤S24,若否,则进入步 骤S23;
[0021] 其中,该监测方法的步骤S24和步骤S25在该更新方法的步骤S14之后执行。
[0022] 本方案中,当该更新方法的步骤S14执行完毕,即第一集群内的所有机器的代码更 新完毕时,监测该第一集群内所有机器是否能在一时间段内稳定运行,即监测在该时间段 内该第一集群内所有机器中出现的错误量,若该错误量大于第二预设阈值,则停止发布。此 时应用发布失败,为了保证系统的正常运行,控制已更新代码的机器进行代码回滚。另外, 当第一集群内的所有机器的代码更新完毕时,若在该时间段内该错误量小于或等于第二预 设阈值,即该第一集群能稳定运行,则应用发布成功。其中,该时间段和该第二预设阈值的 值可以根据系统能够正常运行的条件来设定,也可以根据用户的需要来设定。值得注意的 是,该监测方法的步骤S24~S25并非是在该监测方法的步骤S21~S23之后顺序执行的,而 是在该更新方法的步骤s14之后执行。
[0023] 较佳地,将该监测方法的步骤S21替换为步骤S21',步骤S22替换为步骤S22',步骤 s24替换为步骤S24',步骤S25替换为步骤S25',
[0024]S21'、监测该第一集群内已更新代码的机器中出现的错误量X1(l和待更新代码的机 器中出现的错误量Y1(l,并监测与该第一集群存在关联的第二集群内的所有机器在第一时间 段内出现的错误量x2(l和在上一第一时间段内出现的错误量Y2(|;
[0025]S22'、判断X1(l/Y1(l是否小于或等于第一预设阈值,且X2(I/Y2(I是否小于或等于第三预 设阈值,若是,则进入步骤S21 ',若否,则进入步骤S23;
[0026]S24'、监测该第一集群内所有机器中出现的错误量Xn,以及该第二集群内所有机 器在第一时间段内出现的错误量乂21和在上一第一时间段内出现的错误量Y21;
[0027]S25'、判断、是否小于或等于第二预设阈值,且X21/Y21是否小于或等于第三预设 阈值,若是,则进入步骤S24',若否,则进入步骤S23。
[0028] 本方案中,在应用发布的过程中,除了监测该第一集群内已更新代码的机器中出 现的错误量X1(l和待更新代码的机器中出现的错误量Y1(|,还需要监测与该第一集群存在关 联的第二集群内机器的错误量,具体地,监测该第二集群内的所有机器在第一时间段内出 现的错误量X2(l和在上一第一时间段内出现的错误量Y2(|。同样地,在应用发布的过程中除 了判断该第一集群内机器的错误率X1(l/Y1(l,还需要判断该第二集群内机器的错误率X2(i/Y2(i。
[0029]当该第一集群内所有机器的代码更新完毕时,监测该第一集群内所有机器是否能 在一段时间内稳定运行,具体地,除了监测在该段时间内该第一集群内机器的错误量xn,还 需要监测在该段时间内该第二集群内的所有机器在第一时间段内出现的错误量X21和在上 一第一时间段内出现的错误量Y21。同样地,除了判断该第一集群内机器的错误量xn,还需 要判断该第二集群内机器的错误率x21/y21。
[0030] 其中,集群之间是否存在关联是本领域的公知常识,不再赘述,即本领域技术人员 很容易判断该第二集群与该第一集群是否存在关联。
[0031] 较佳地,设该第一集群包括i项指标,x1(l包括第1项指标的错误量X1(11~第i项 指标的错误量X1(li,Y1(l包括第1项指标的错误量¥1(11~第i项指标的错误量Y1(li,Xn包括第 1项指标的错误量xm~第i项指标的错误量Xm,或包括Xm~X⑴和
【主权项】
1. 一种应用发布方法,该应用发布方法用于包含N台机器的第一集群,其特征在于,该 应用发布方法包括一更新方法和一监测方法, 该更新方法包括以下步骤,设M的初始值为1 : Sn、更新该第一集群内第M~M+P台机器的代码; 512、 将M赋值为M+P+1 ; 513、 判断M+P是否小
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1