基于复杂IT云资源池网络的主机监控Agent相互发现方法与流程

文档序号:34443912发布日期:2023-06-13 09:18阅读:31来源:国知局
基于复杂IT云资源池网络的主机监控Agent相互发现方法与流程

本发明涉及it云资源池网管监控,特别是一种基于复杂it云资源池网络的主机监控agent相互发现方法。


背景技术:

1、随着网络的快速发展,it云资源池规模和网路结构越来越复杂和庞大,对it云资源池内的庞大的主机监控也成为it云资源池建设的基础。目前在it云资源池内,对物理主机和云主机的监控主要包含两部分,一部分是通过物理主机的ipmi接口获取物理主机的传感器类数据(ipmi,intelligent platform management interface,智能平台管理接口),用于监控物理主机的风扇、温度、功率等;另一部分是在物理机、云主机的操作系统内安装监控用的agent程序来获取包括cpu、内存、进程、应用、磁盘等等数据,本发明主要是针对后面一种情况进行说明。

2、由于it云资源池主机数量巨大,尤其引入虚拟化技术后,向物理主机和云主机上安装主机监控agent的工作量十分巨大。因此it云资源池的运维管理人员一般情况下会将主机监控agent预先安装到操作系统镜像中。这样在物理主机或者云主机安装完操作系统后,会自动的安装主机监控agent,以便于减少安装工作的成本。但是随着it云资源池的设备规模不断增大,网络环境也越来越复杂,随着操作系统镜像安装后的agent如何发现agent管理服务端成为主要的矛盾。当然通过手动在服务器安装anget可能也存在此类问题。

3、现有技术方案主要有以下几类:

4、1.现有厂商的it云资源池监控系统虽然实现了agent发现的能力,但是仅仅满足简单网络的结构下的发现能力,即agent所在服务器的网络和agent管理服务器网络直连,当agent所在服务器的网络和agent管理服务网络不通时,无法发现此agent。如图1所示,agent b无法被agent管理管理服务端发现。

5、2.从agent管理服务器发起网络探测,扫描其所在网段的全部ip地址的指定端口来发现agent。如图2所示,涉及ip地址包括192.168.1.1;192.168.1.2;192.168.1.3;192.168.1.4;···192.168.1.12等。

6、3.通过在打包到操作系统镜像中agent配置固定agent管理服务地址来发现agent,具体情形如图3所示。

7、4.通过agent访问域名服务器,提前在域名服务器中配置管理服务端信息来发现agent,具体情形如图4所示。

8、当前it云资源池主机监控agent安装的现状,要满足agent及时发现,存在的问题与缺陷,有以下几点:

9、1.图1中,agent a和agent管理服务端网络互通,因此能够发现agent a;但是agent b无法和agent管理管理服务端网络互通,因此agent b无法被发现;因此,此方案存在一定局限性。

10、2.图2中,需要服务端反复逐个扫描本网段全量ip地址,扫描并发及频率过高可能引起网络阻塞,扫描频率过低可能有agent上线发现不及时的情况;因此,此方案存在一定局限性。

11、3.图3中,当管理服务端ip地址、端口号变更时,agent就无法发现管理服务端。需要及时登录每个agent所在服务器修改服务端ip地址并在重新打包操作系统镜像中的agent配置,避免后续安装agent无法注册到管理服务器的情况;因此,此方案存在一定局限性。

12、4.图4中,如果云资源池没有域名服务器则此方案无法完成,在目前的各类云资源池管理系统中,普遍没有域名服务器;因此,此方案存在一定局限性。


技术实现思路

1、本发明针对现有技术中的不足,提供一种基于复杂it云资源池网络的主机监控agent相互发现方法,能够在复杂的it云资源池网络环境下提升通过手工或者镜像安装的agent发现agent管理服务端的能力和效率,能够通过agent相互的发现机制完成agent向管理服务端注册,能够发现网络异常agent并且通过网络正常agent来转发网络异常agent的数据上报能力。

2、本发明的技术解决方案如下:

3、基于复杂it云资源池网络的主机监控agent相互发现方法,其特征在于,包括agent相互发现算法,在所述agent相互发现算法中一个与agent管理服务端网络互通的agent能够探测发现同一个网段内没有与所述agent管理服务端互通的agent,并上报发现结果。

4、所述agent相互发现算法包括以下步骤:

5、步骤1,当agent部署完成后,已注册到agent管理中心的agent获取本agent的ip地址;

6、步骤2,本agent逐一扫描本agent所在网段的全部ip地址的指定端口范围;

7、步骤3,判断是否最后一个ip地址,如果是,则进入步骤13,如果否,则进入步骤4;

8、步骤4,此ip是否发现已注册agent,如果是,则返回步骤2以扫描下一个ip,如果否,则进入步骤5;

9、步骤5,是否端口畅通,如果否,则记录ip状态未发现agent后返回步骤2以扫描下一个ip,如果是,则进入步骤6;

10、步骤6,发送获取agent注册状态命令;

11、步骤7,判断是否响应请求,如果否,则记录ip状态未发现agent后返回步骤2以扫描下一个ip,如果是,则进入步骤8;

12、步骤8,判断agent注册状态,如果已注册,则录ip状态已注册agent后返回步骤2以扫描下一个ip,如果未注册,则进入步骤9;

13、步骤9,判断是否已知注册中心地址,如果未知,则进入步骤11,如果已知,则进入步骤10;

14、步骤10,比对管理中心地址,如果一致,则记录ip状态agent到管理中心网络不通后返回步骤2以扫描下一个ip,不过不一致,则进入步骤11;

15、步骤11,发送管理中心地址;

16、步骤12,获取agent注册结果,如果注册成功,则记录ip状态agent发现成功后返回步骤2以扫描下一个ip,如果注册失败,则记录ip状态agent到管理中心网络不通后返回步骤2以扫描下一个ip;

17、步骤13,统计扫描结果;

18、步骤14,将agent扫描结果上报agent服务端;

19、步骤15,等待下个扫描周期。

20、包括agent通过代理agent向agent管理服务端转发业务数据的算法,以保证agent业务的可用性。

21、所述agent通过代理agent向agent管理服务端转发业务数据的算法包括以下步骤:

22、步骤a1,agent无法注册到管理服务端;

23、步骤a2,agent向代理agent请求转发业务数据;

24、步骤a3,代理agent向管理服务端请求转发agent业务数据;

25、步骤a4,管理服务端根据配置返回是否同意转发结果,如果不同意,则结束,如果同意,则进入步骤a5;

26、步骤a5,向请求agent返回同意转发响应;

27、步骤a6,agent收到同意转发请求;

28、步骤a7,agent准备业务数据给代理agent;

29、步骤a8,代理agent封包转发数据后上报agent管理服务端;

30、步骤a9,agent管理服务端记录业务数据。

31、本发明的技术效果如下:本发明基于复杂it云资源池网络的主机监控agent相互发现方法,相比现有技术解决了在复杂的网络环境下,在一个网段内即使存在agent到管理服务端网络不通的情况,也可以由其他agent探测发现,并上报发现结果。相比其他现有技术,通过agent的相互发现算法,大大提高了复杂网络环境下agent发现的能力和效率;本发明也解决了当agent到管理服务端网络不通的情况下,agent的业务数据无法上报的问题,大大提升了整个agent监控系统的可用性和易用性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1