用于openstack云环境的自动化巡检方法及系统与流程

文档序号:16847937发布日期:2019-02-12 22:28阅读:546来源:国知局
本发明涉及云计算领域,具体涉及一种用于openstack云环境的自动化巡检方法及系统。
背景技术
::openstack是一个开源云计算管理平台项目,在基于openstack的云环境中,网络模块为云环境提供了基础的二层、三层虚拟网络支持,以及高级网络服务,例如负载均衡,防火墙等。在实现上述支持和服务的时候需使用各自不同的插件,因此带来了数量众多的配置项和服务进程,为保证云环境的正常运行,如采用人工方式来监控上述服务进程的状态、保证配置项的正确以及网络平面的连通性,将会极大地增加运维的难度和工作量。技术实现要素:针对现有技术中存在的缺陷,本发明的目的在于提供一种用于openstack云环境的自动化巡检方法,能够有效降低云环境的运维成本以及工作人员的工作量。为达到以上目的,本发明采取的技术方案是,包括:部署巡检工具于云环境的节点上,所述巡检工具用于基于节点的功能,对节点的服务状态和配置项进行检测;配置zabbix的配置文件,以使zabbix接收巡检工具的反馈信息;使用ifconfig命令将任一控制节点的网卡状态置为down,通过zabbix获知该控制节点发出网卡状态异常的告警信息;删除任一计算节点brint里的table0,通过zabbix获知该计算节点发出brint网桥流表丢失的告警信息。在上述技术方案的基础上,所述节点包括控制节点、网络节点和计算节点;所述巡检工具对节点的服务状态和配置项进行检测,检测的项目包括物理网络状态、网络平面连通性、iptables规则和ovs流表。在上述技术方案的基础上,所述物理网络状态的检测具体包括:检测节点的网卡状态,以及节点间连接网线的状态是否正常。在上述技术方案的基础上,所述云环境包括管理网络平面、业务网络平面、存储网络平面和外部网络平面。在上述技术方案的基础上,所述iptables规则的检测用于对计算节点进行,所述iptables规则的检测具体包括:获取虚拟机通信所需的固定iptables规则,判断计算节点的iptables中是否含有所有的固定iptables规则,若否,则进行iptables规则缺失的告警,若是,则判断计算节点的iptables中,所有固定iptables规则的插入顺序是否正确。在上述技术方案的基础上,所述ovs流表的检测具体为:检测节点网桥中的0号表、23号表和60号表是否存在。本发明还提供一种用于openstack云环境的自动化巡检系统,包括:部署模块,其用于部署巡检工具于云环境的节点上,所述巡检工具用于基于节点的功能,对节点的服务状态和配置项进行检测;配置模块,其用于配置zabbix的配置文件,以使zabbix接收巡检工具的反馈信息;第一检测模块,其用于使用ifconfig命令将任一控制节点的网卡状态置为down,通过zabbix获知该控制节点发出网卡状态异常的告警信息;第二检测模块,其用于删除任一计算节点brint里的table0,通过zabbix获知该计算节点发出brint网桥流表丢失的告警信息。在上述技术方案的基础上,所述节点包括控制节点、网络节点和计算节点;所述巡检工具对节点的服务状态和配置项进行检测,检测的项目包括物理网络状态、网络平面连通性、iptables规则和ovs流表。在上述技术方案的基础上,所述物理网络状态的检测具体包括:检测节点的网卡状态,以及节点间连接网线的状态是否正常;所述云环境包括管理网络平面、业务网络平面、存储网络平面和外部网络平面。在上述技术方案的基础上,所述iptables规则的检测用于对计算节点进行,所述iptables规则的检测具体包括:获取虚拟机通信所需的固定iptables规则,判断计算节点的iptables中是否含有所有的固定iptables规则,若否,则进行iptables规则缺失的告警,若是,则判断计算节点的iptables中,所有固定iptables规则的插入顺序是否正确;所述ovs流表的检测具体为:检测节点网桥中的0号表、23号表和60号表是否存在。与现有技术相比,本发明的优点在于:通过在云环境的节点上部署巡检工具,基于节点的功能,实现对节点的服务状态和配置项的自动检测,当节点出现异常时,将异常反馈给zabbix,zabbix进行告警,方便测试人员的查看,有效降低云环境的运维成本以及工作人员的工作量。附图说明图1为本发明实施例中一种用于openstack云环境的自动化巡检方法的流程图;图2为节点上外部网络的网桥连接示意图;图3为计算节点上虚拟机、安全组和集成网桥的连接关系图。具体实施方式本发明实施例提供一种用于openstack云环境的自动化巡检方法,实现对云计算的服务进程和配置项进行自动监控,有效降低云环境的运维成本。本发明实施例还相应地提供了存储介质、设备及系统。以下结合附本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。参见图1所示,本发明实施例提供的一种用于openstack云环境的自动化巡检方法的一实施例包括:s1:部署巡检工具于云环境的节点上,所述巡检工具用于基于节点的功能,对节点的服务状态和配置项进行检测。巡检工具可以根据节点角色的不同进行,在节点上进行差异化部署,实现对节点的服务状态和配置项检测,当节点出现异常时,进行相应的异常反馈。本发明实施例中,节点包括控制节点、网络节点和计算节点。巡检工具对节点的服务状态和配置项进行检测,检测的项目包括物理网络状态、网络平面连通性、iptables规则和ovs流表,iptables为linux内核集成的ip数据包过滤系统,ovs,即openvswitch(开放虚拟交换标准),利用虚拟平台,通过软件的方式形成交换机部件。s2:配置zabbix的配置文件,以使zabbix接收巡检工具的反馈信息。本发明实施例中,zabbix是基于web界面的提供分布式系统监视的开源解决方案。通过对zabbix的配置文件的配置,使得zabbix与巡检工具进行对接,当巡检工具检测到节点异常时,则将异常反馈给zabbix,由zabbix进行异常告警。s3:使用ifconfig命令将任一控制节点的网卡状态置为down,通过zabbix获知该控制节点发出网卡状态异常的告警信息。ifconfig命令是linux中用于显示或配置网络设备(网络接口卡)的命令。通过ifconfig命令将控制节点的网卡状态置为down,即将该控制节点的网卡状态调为关闭,本步骤主要是对巡检工具的运行状态进行测试,人为的将网卡状态置为down,然后看zabbix是否会进行相应的告警,通过测试,保证本发明实施例的自动化巡检方法运行的可靠性。s4:删除任一计算节点brint里的table0,通过zabbix获知该计算节点发出brint网桥流表丢失的告警信息。brint为节点的ovs网桥,ovs,即openvswitch(开放虚拟交换标准),利用虚拟平台,通过软件的方式形成交换机部件,table0为ovs网桥中的0号表,本步骤也是对巡检工具的运行状态进行测试,人为的删除流表,然后看zabbix是否会进行流表丢失的告警,通过测试,保证本发明实施例的自动化巡检方法运行的可靠性。可选地,在上述图1对应的实施例的基础上,本发明实施例提供的一种用于openstack云环境的自动化巡检方法的第一个可选实施例中,物理网络状态的检测具体包括:检测节点的网卡状态,以及节点间连接网线的状态是否正常。例如,巡检工具通过调用系统命令,查询当前网卡(如eth1,eth2,eth3)的状态以及相应网线的连通状态,若状态异常,巡检工具将异常反馈给zabbix,zabbix中的网卡或网线连接监控项便会产生告警,告知用户具体哪个节点的网卡或者网卡连线异常。可选地,在上述图1对应的实施例的基础上,本发明实施例提供的一种用于openstack云环境的自动化巡检方法的第二个可选实施例中,在网络平面连通性检测中,云环境包括管理网络平面、业务网络平面、存储网络平面和外部网络平面,即通常openstack云环境的部署需要四个网络平面,分别为管理网络平面(managment)、业务网络平面(service)、存储网络平面(ceph)和外部网络平面(external),用于不同业务的隔离。网络平面的连通性会影响服务的正常运行,以网络节点为例,节点上外部网络的网桥连接如图2所示,巡检工具根据ml2的配置文件中的bridgemapping设置,可以定时检查brex网桥到brint网桥的一对接口的连接状态,如果检测到某节点的某个网络平面断开,将会抛出节点网络平面断开的异常。ml2的全称是modularlayer2,一个可以同时管理多种layer2技术的框架。可选地,在上述图1对应的实施例的基础上,本发明实施例提供的一种用于openstack云环境的自动化巡检方法的第三个可选实施例中,iptables规则的检测用于对计算节点进行,所述iptables规则的检测具体包括:获取虚拟机通信所需的固定iptables规则,判断计算节点的iptables中是否含有所有的固定iptables规则,若否,则进行iptables规则缺失的告警,若是,则判断计算节点的iptables中,所有固定iptables规则的插入顺序是否正确。虚拟机(vm)、安全组(qbr)和集成网桥(brint)的关系如图3所示,根据虚拟机通信实际所需iptables规则,分析得出需检查的默认固定iptables规则集合。对于iptables规则的检测,举例说明如下:例如取出固定iptables规则1,然后从计算节点的iptables中读取固定iptables规则1,若无返回,则说明规则确实,则巡检工具抛出规则缺失异常的反馈;然后取出固定iptables规则2,然后从计算节点的iptables中读取固定iptables规则2,若无返回,则说明规则确实,则巡检工具抛出规则缺失异常的反馈,依次类推;若能在计算节点的iptables中找到所有固定iptables规则,则进一步判断固定iptables规则的插入顺序是否正确,若否,则抛出插入规则异常的反馈。可选地,在上述图1对应的实施例的基础上,本发明实施例提供的一种用于openstack云环境的自动化巡检方法的第四个可选实施例中,ovs流表的检测具体为:检测节点网桥中的0号表、23号表和60号表是否存在。openstack环境使用ovs作为节点内部的网桥虚拟化软件。网桥内部的数据转发使用流表的方式实现,是对网络设备的数据转发功能的一种抽象。在传统网络设备中,交换机和路由器的数据转发需要依赖设备中保存的二层mac地址转发表或者三层ip地址路由表,openflow(网上通信协议)交换机中使用的流表也是如此,不过在它的表项中整合了网络中各个层次的网络配置信息,从而在进行数据转发时可以使用更丰富的规则。在各个ovs网桥中均有转发数据的基础流表项,来保证数据包的正常转发。以brint为例,巡检工具会定期检查网桥中的0号表(table0)、23号表(table23)和60号表(table60)是否存在,如果监控的流表消失,巡检工具会抛出流表丢失异常反馈。本发明实施例的用于openstack云环境的自动化巡检方法,通过在云环境的节点上部署巡检工具,基于节点的功能,实现对节点的服务状态和配置项的自动检测,当节点出现异常时,将异常反馈给zabbix,zabbix进行告警,方便测试人员的查看,有效降低云环境的运维成本以及工作人员的工作量。本发明实施例提供的一种用于openstack云环境的自动化巡检系统的一实施例包括:部署模块,其用于部署巡检工具于云环境的节点上,所述巡检工具用于基于节点的功能,对节点的服务状态和配置项进行检测;配置模块,其用于配置zabbix的配置文件,以使zabbix接收巡检工具的反馈信息;第一检测模块,其用于使用ifconfig命令将任一控制节点的网卡状态置为down,通过zabbix获知该控制节点发出网卡状态异常的告警信息;第二检测模块,其用于删除任一计算节点brint里的table0,通过zabbix获知该计算节点发出brint网桥流表丢失的告警信息。在上述一种用于openstack云环境的自动化巡检系统对应的实施例的基础上,本发明实施例提供的一种用于openstack云环境的自动化巡检系统的第一个可选实施例中,节点包括控制节点、网络节点和计算节点。巡检工具对节点的服务状态和配置项进行检测,检测的项目包括物理网络状态、网络平面连通性、iptables规则和ovs流表。物理网络状态的检测具体包括:检测节点的网卡状态,以及节点间连接网线的状态是否正常。云环境包括管理网络平面、业务网络平面、存储网络平面和外部网络平面。iptables规则的检测用于对计算节点进行,所述iptables规则的检测具体包括:获取虚拟机通信所需的固定iptables规则,判断计算节点的iptables中是否含有所有的固定iptables规则,若否,则进行iptables规则缺失的告警,若是,则判断计算节点的iptables中,所有固定iptables规则的插入顺序是否正确。ovs流表的检测具体为:检测节点网桥中的0号表、23号表和60号表是否存在。本发明不局限于上述实施方式,对于本
技术领域
:的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围之内。本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1