性能监控方法及装置与流程

文档序号:12824613阅读:164来源:国知局
性能监控方法及装置与流程

本发明涉及计算机技术领域,特别涉及一种性能监控方法及装置。



背景技术:

用户在使用应用的过程中会产生数据,为了对数据进行存储,开发人员可以对运行有应用的应用服务器配置存储服务器。其中,应用可以是诸如数据库之类的软件。

相关技术中,开发人员通过网络将应用服务器连接至外置的存储服务器,该存储服务器可以是多种规格的存储设备的集合。在用户使用应用的过程中,开发人员可以对应用服务器和存储服务器的性能进行监控。通常,在应用服务器侧可以监控到应用服务器的性能,在存储服务器侧可以监控到存储服务器的性能。

当应用服务器在操作某个操作对象时出错,由于此时应用服务器无法监控存储服务器操作该操作对象时的性能,从而无法确定是应用服务器存在问题还是存储服务器存在问题,导致监控出错。



技术实现要素:

为了解决应用服务器操作某个操作对象时出错时,无法确定是应用服务器还是存储服务器存在问题,导致监控出错的问题,本发明实施例提供了一种性能监控方法及装置。所述技术方案如下:

第一方面,提供了一种性能监控方法,所述方法用于管理服务器中,管理服务器分别与应用服务器和存储服务器相连,存储服务器为应用服务器提供数据存储,所述方法包括:

管理服务器接收应用服务器发送的操作对象的应用侧性能信息,并接收存储服务器发送的操作对象的存储侧性能信息;管理服务器再接收应用服务器发送的操作对象的第一标识与第二标识的对应关系;然后,管理服务器从每个操 作对象的应用侧性能信息中读取操作对象的第一标识,并从每个操作对象的存储侧性能信息中读取操作对象的第二标识;管理服务器根据对应关系确定每个操作对象对应的应用侧性能信息及存储侧性能信息;最后,管理服务器对每个操作对象对应的应用侧性能信息及存储侧性能信息分析,根据分析结果确定是应用服务器还是存储服务器存在问题。

通过管理服务器确定每个操作对象对应的应用侧性能信息和存储侧性能信息,再对每个操作对象对应的应用侧性能信息和存储侧性能信息进行分析,可以根据分析结果确定是应用服务器还是存储服务器存在问题,解决了无法确定是应用服务器还是存储服务器存在问题,导致监控出错的问题,达到了提高监控的准确性的效果。

在第一方面的第一种可能的实现方式中,第一标识包括操作对象的名称和逻辑地址中的至少一种,第二标识包括操作对象的物理地址;

对应关系由应用服务器获取每个操作对象的名称和逻辑地址的第一对应关系,并获取每个操作对象的名称和物理地址的第二对应关系,将包括相同名称的第一对应关系和第二对应关系进行合并得到的。

通过应用服务器分别收集第一对应关系和第二对应关系,将第一对应关系和第二对应关系合并成对应关系,以便于根据该对应关系对操作对象的应用侧性能信息和存储侧性能信息进行对应,解决了无法对应用侧性能信息和存储侧性能信息进行对应的问题,达到了提高分析的准确性的效果。

在第一方面的第二种可能的实现方式中,当应用侧性能信息包括数据操作的应用侧时延的信息,存储侧性能信息包括数据操作的存储侧时延的信息时,对每个操作对象对应的应用侧性能信息及存储侧性能信息分析,包括:

将应用侧时延减去存储侧时延,得到时延差值;检测该时延差值是否大于第一阈值;当检测结果为该时延差值大于第一阈值时,生成应用服务器存在第一配置问题的分析结果。

通过管理服务器比较时延差值与第一阈值的大小,可以自动确定是否是应用服务器存在问题,解决了需要开发人员比较时延差值与第一阈值的大小,确定问题的效率低和准确性的问题,达到了提高确定问题的效率和准确性的效果。

结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,对每个操作对象对应的应用侧性能信息及存储侧性能信息分析,还包 括:

检测存储侧时延是否大于第二阈值;当检测结果为存储侧时延大于第二阈值时,生成存储服务器存在第二配置问题的分析结果。

通过管理服务器比较存储侧时延与第二阈值的大小,可以自动确定是否是存储服务器存在问题,解决了需要开发人员比较存储侧时延与第二阈值的大小,确定问题的效率低和准确性的问题,达到了提高确定问题的效率和准确性的效果。

第二方面,提供了一种性能监控装置,该装置用于管理服务器中,管理服务器分别与应用服务器和存储服务器相连,存储服务器为应用服务器提供数据存储,所述装置,包括:

接收单元,用于接收应用服务器发送的操作对象的应用侧性能信息,并接收存储服务器发送的操作对象的存储侧性能信息;

接收单元,还用于接收应用服务器发送的操作对象的第一标识与第二标识的对应关系;

读取单元,用于从接收单元接收的每个操作对象的应用侧性能信息中读取操作对象的第一标识;

读取单元,还用于从接收单元接收的每个操作对象的存储侧性能信息中读取操作对象的第二标识;

确定单元,用于根据接收单元接收的对应关系确定读取单元读取的每个操作对象对应的应用侧性能信息及存储侧性能信息;

分析单元,用于对确定单元确定的每个操作对象对应的应用侧性能信息及存储侧性能信息分析;

确定单元,还用于根据分析单元得到的分析结果确定是应用服务器还是存储服务器存在问题。

通过管理服务器确定每个操作对象对应的应用侧性能信息和存储侧性能信息,再对每个操作对象对应的应用侧性能信息和存储侧性能信息进行分析,可以根据分析结果确定是应用服务器还是存储服务器存在问题,解决了无法确定是应用服务器还是存储服务器存在问题,导致监控出错的问题,达到了提高监控的准确性的效果。

在第二方面的第一种可能的实现方式中,第一标识包括操作对象的名称和 逻辑地址中的至少一种,第二标识包括操作对象的物理地址;

对应关系由应用服务器获取每个操作对象的名称和逻辑地址的第一对应关系,并获取每个操作对象的名称和物理地址的第二对应关系,将包括相同名称的第一对应关系和第二对应关系进行合并得到的。

通过应用服务器分别收集第一对应关系和第二对应关系,将第一对应关系和第二对应关系合并成对应关系,以便于根据该对应关系对操作对象的应用侧性能信息和存储侧性能信息进行对应,解决了无法对应用侧性能信息和存储侧性能信息进行对应的问题,达到了提高分析的准确性的效果。

在第二方面的第二种可能的实现方式中,当应用侧性能信息包括应用侧时延的信息,存储侧性能信息包括存储侧时延的信息时,分析单元,具体用于:

将应用侧时延减去存储侧时延,得到时延差值;检测时延差值是否大于第一阈值;当检测结果为时延差值大于第一阈值时,生成应用服务器存在问题的分析结果。

通过管理服务器比较时延差值与第一阈值的大小,可以自动确定是否是应用服务器存在问题,解决了需要开发人员比较时延差值与第一阈值的大小,确定问题的效率低和准确性的问题,达到了提高确定问题的效率和准确性的效果。

结合第二方面的第二种可能的实现方式,在第二方面的第三种可能的实现方式中,分析单元,还用于:检测存储侧时延是否大于第二阈值;当检测结果为存储侧时延大于第二阈值时,生成存储服务器存在问题的分析结果。

通过管理服务器比较存储侧时延与第二阈值的大小,可以自动确定是否是存储服务器存在问题,解决了需要开发人员比较存储侧时延与第二阈值的大小,确定问题的效率低和准确性的问题,达到了提高确定问题的效率和准确性的效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明各个实施例提供的性能监控系统的第一种结构示意图;

图2是本发明各个实施例提供的性能监控系统的第二种结构示意图;

图3是本发明各个实施例提供的性能监控系统的第三种结构示意图;

图4是本发明各个实施例提供的性能监控系统的第四种结构示意图;

图5是本发明各个实施例提供的性能监控系统的第五种结构示意图;

图6是本发明各个实施例提供的性能监控系统的第六种结构示意图;

图7是本发明各个实施例提供的性能监控系统的第七种结构示意图;

图8是本发明一个实施例提供的管理服务器的结构示意图;

图9是本发明一个实施例提供的性能监控方法的方法流程图;

图10a是本发明另一实施例提供的性能监控方法的方法流程图;

图10b是本发明另一实施例提供的显示信息的界面示意图;

图11是本发明一个实施例提供的性能监控装置的结构框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。

请参考图1,其示出了本发明各个示例性实施例提供的性能监控系统的第一种结构示意图。该性能监控系统包括:应用服务器110、存储服务器120和管理服务器130,管理服务器130分别与应用服务器110和存储服务器120相连。其中,存储服务器120与应用服务器110相连,且为应用服务器110提供数据存储。

请参考图2所示的性能监控系统的第二种结构示意图,应用服务器110上运行有应用数据收集程序111,应用数据收集程序111用于收集应用服务器110的应用侧性能信息,并将该应用侧性能信息发送给管理服务器130。存储服务器120上运行有存储数据收集程序121,存储数据收集程序121用于收集存储服务器130的存储侧性能信息,并将该存储侧性能信息发送给管理服务器130。管理服务器130用于对应用侧性能信息和存储侧性能信息进行分析,并根据分析结果确定是应用服务器110还是存储服务器120存在问题。

其中,应用服务器110上运行的应用可以是本地应用,如本地数据库、虚拟桌面、虚拟机等等,也可以是联网应用,如云端数据库、物联网应用、车联 网应用等等。需要补充说明的是,本发明仅以应用服务器110进行举例说明,在实际实现时,还可以将应用服务器110替换为终端,此时的应用可以是终端中安装的应用。

请参考图3所示的性能监控系统的第三种结构示意图,性能监控系统还可以包括结果输出器140,管理服务器130将分析结果发送给结果输出器140进行输出。其中,结果输出器140可以是显示器、播放器等等,本发明不作限定。

请参考图4所示的性能监控系统的第四种结构示意图,应用服务器110上还运行有应用性能统计程序112,该应用性能统计程序112用于收集应用服务器110的应用侧性能信息,并将该应用侧性能信息发送给应用数据收集程序111。

请参考图5所示的性能监控系统的第五种结构示意图,应用数据收集程序111可以包括代理(agent)数据收集程序111a和数据传输程序111b,代理数据收集程序111a与应用性能统计程序112相连,数据传输程序111b与管理服务器130相连。其中,代理数据收集程序111a用于收集应用性能统计程序112发送的应用侧性能信息,对该应用侧性能信息进行处理后得到最终的应用侧性能信息,存储在存储组织中。例如,代理数据收集程序111a将该最终的应用侧性能信息整理成xml格式的文件,并将该文件存储在数据库中。

数据传输程序111b用于对代理数据收集程序111a收集的应用侧性能信息进行解析,按照预定协议将解析后得到的应用侧性能信息发送给管理服务器130。具体地,当应用侧性能信息被整理成xml格式的文件时,数据传输程序111b将该文件解析成应用侧性能信息,通过安全文件传送协议(英文:securefiletransferprotocol;简称:sftp)或者安全外壳协议(英文:secureshell;简称:ssh)协议将应用侧性能信息发送给管理服务器130。

请参考图6所示的性能监控系统的第六种结构示意图,性能监控系统可以包括至少一个应用服务器110和至少一个存储服务器120。图6中以性能监控系统包括两个应用服务器110和两个存储服务器120为例进行举例说明。

请参考图7所示的性能监控系统的第七种结构示意图,其中,应用服务器110具体为云应用服务110,存储服务器120具体为云存储服务120。性能监控系统可以包括至少一个云应用服务110和至少一个云存储服务120,图7中以性能监控系统包括一个云应用服务110和一个云存储服务120为例进行举例说明。

为了便于说明,下文以应用服务器110向管理服务器130发送应用侧性能 信息的实现方式进行说明,该实现方式可以包括应用服务器110直接收集应用侧性能信息发送给管理服务器130的实现方式,也可以包括应用数据收集程序111直接收集应用服务器110的应用侧性能信息发送给管理服务器130的实现方式,还可以包括应用性能统计程序112收集应用侧性能信息发送给应用数据收集程序111,应用数据收集程序111将应用侧性能信息发送给管理服务器130的实现方式。同理,下文以存储服务器120向管理服务器130发送存储侧性能信息的实现方式进行说明,该实现方式可以包括存储服务器120直接收集存储侧性能信息发送给管理服务器130的实现方式,也可以包括存储数据收集程序111直接收集存储服务器的存储侧性能信息发送给管理服务器130的实现方式。

请参考图8,其示出了本发明一个示例性实施例提供的管理服务器的结构示意图。该管理服务器可以是图1至图7中所示出的管理服务器,该管理服务器可以包括:接收器810、处理器820和发射器830。本领域技术人员可以理解,图8中示出的管理服务器结构并不构成对管理服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。比如,管理服务器还包括存储器840等。其中:

处理器820是管理服务器的控制中心,利用各种接口和线路连接整个管理服务器的各个部分,通过运行或执行存储在存储器840内的软件程序和/或模块,以及调用存储在存储器840内的应用侧性能信息和存储侧性能信息,执行数据分析功能。可选的,处理器820可包括一个或多个处理核心;可选的,处理器820可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器820中,上述调制解调处理器可以单独实现成为一个基带芯片。

存储器840可用于软件程序以及模块。处理器820通过运行存储在存储器840的软件程序以及模块,从而执行数据分析功能。存储器840可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统841、接收模块842、读取模块843、确定模块844、分析模块845和至少一个其它功能所需的应用程序846等;存储数据区可存储根据管理服务器的使用所创建的数据(比如应用侧性能信息、存储侧性能信息等)等。此外,存储器840可以由任何类型的易 失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(英文:staticrandomaccessmemory,简称:sram),电可擦除可编程只读存储器(英文:electricallyerasableprogrammableread-onlymemory,简称:eeprom),可擦除可编程只读存储器(英文:erasableprogrammablereadonlymemory,简称:eprom),可编程只读存储器(英文:programmableread-onlymemory,简称:prom),只读存储器(英文:readonlymemory,简称:rom),磁存储器,快闪存储器,磁盘或光盘。

发射器830可以包括射频发射组件,比如天线。发射器830用于将分析结果承载在无线信号中进行发送。该无线信号可以是移动通信系统中的时频资源。

接收器810可以包括射频接收组件,比如天线。接收器810用于接收承载在无线信号中的应用侧性能信息和存储侧性能信息。该无线信号可以是移动通信系统中的时频资源。

尽管未示出,管理服务器还可选包括供电电源、蓝牙模块等,在此不再赘述。

请参考图9,其示出了本发明一个实施例提供的性能监控方法的方法流程图,该性能监控方法可以应用于图1至图7所示的管理服务器中。该性能监控方法,包括:

步骤901,接收应用服务器发送的操作对象的应用侧性能信息,并接收存储服务器发送的操作对象的存储侧性能信息。

步骤902,接收应用服务器发送的操作对象的第一标识与第二标识的对应关系。

步骤903,从每个操作对象的应用侧性能信息中读取操作对象的第一标识。

步骤904,从每个操作对象的存储侧性能信息中读取操作对象的第二标识。

步骤905,根据对应关系确定每个操作对象对应的应用侧性能信息及存储侧性能信息。

步骤906,对每个操作对象对应的应用侧性能信息及存储侧性能信息分析。

步骤907,根据分析结果确定是应用服务器还是存储服务器存在问题。

综上所述,本发明实施例提供的性能监控方法,通过管理服务器确定每个操作对象对应的应用侧性能信息和存储侧性能信息,再对每个操作对象对应的 应用侧性能信息和存储侧性能信息进行分析,可以根据分析结果确定是应用服务器还是存储服务器存在问题,解决了无法确定是应用服务器还是存储服务器存在问题,导致监控出错的问题,达到了提高监控的准确性的效果。

由于本实施例提供的性能监控方法可以适用于任何应用,而对于不同的应用,应用服务器收集到的应用侧性能信息是不同的,对应的,存储服务器收集到的存储侧性能信息也是不同的,为了便于理解和说明,本实施例以应用是数据库为例,对数据库的性能监控方法进行举例说明。其中,应用侧性能信息用于描述应用服务器的性能,存储侧性能信息用于描述存储服务器的性能。

请参考图10a,其示出了本发明另一实施例提供的性能监控方法的方法流程图,该性能监控方法可以应用于图1至图7所示的管理服务器中。该性能监控方法,包括:

步骤1001,接收应用服务器发送的操作对象的应用侧性能信息,并接收存储服务器发送的操作对象的存储侧性能信息。

当应用是数据库时,应用侧性能信息可以包括但不限于:应用侧时延的信息和应用侧平均吞吐信息;对应的,存储侧性能信息可以包括但不限于:存储侧时延的信息和存储侧平均吞吐信息。

应用侧时延的信息是指应用服务器中的数据库对某个操作对象的操作时延,存储侧时延的信息是指在应用服务器的控制下,存储服务器对某个操作对象的操作时延。操作对象可以是数据文件,也可以是一个或多个存储设备lun,本实施例不作限定。对操作对象执行的操作可以是读操作、写操作和恢复(redo)操作中的一种。

应用侧平均吞吐信息是衡量应用服务器对某个操作对象的操作过程中的平均数据吞吐量的参数,可以包括但不限于:每秒进行读/写/恢复操作的次数(英文:input/outputoperationspersecond;简称:iops)、带宽等等。其中,带宽是指每秒进行读/写/恢复操作的数据量。

下面分别对应用服务器收集应用侧性能信息和存储服务器收集存储侧性能信息的流程进行介绍。

第一,应用侧性能信息是应用侧时延的信息,且存储侧性能信息是存储侧时延的信息。

1)每隔第一时间段,应用服务器获取在第一时间段内对各个操作对象的操作的应用侧时延,该应用侧时延的开始时刻是应用服务器接收到操作设备输入的操作的时刻,结束时刻是向操作设备输出存储服务器返回的操作结果的时刻;获取操作对象的第一标识;生成携带有应用侧时延和第一标识的应用侧时延的信息,将该应用侧时延的信息发送给管理服务器。其中,第一标识包括操作对象的名称和操作对象的逻辑地址中的至少一种。

当应用服务器接收到外部的操作设备输入的对某个操作对象的操作时,需要将该操作发送给存储服务器,存储服务器对该操作进行处理,将操作结果返回给应用服务器,应用服务器向操作设备输出该操作结果。例如,当应用服务器通过应用侧i/o接口接收到操作设备输入的对数据文件的读操作时,读取该读操作中携带的数据文件的第一标识,根据该第一标识中的数据文件的名称确定该数据文件的物理地址,通过存储侧i/o接口向存储服务器发送携带该物理地址的读操作,存储服务器读取该物理地址中所存储的内容,通过存储侧i/o接口将该内容作为操作结果返回给应用服务器,应用服务器通过应用侧i/o接口向操作设备输出该内容。

根据上述对操作的响应流程可知,从接收到操作设备输入的操作到向操作设备输出操作结果的应用侧时延可以表示应用服务器的性能,因此,应用服务器可以将应用侧时延的信息作为应用侧性能信息发送给管理服务器。

具体地,应用服务器统计对某个操作对象的操作的应用侧时延,并获取该操作中携带的第一标识,生成携带有应用侧时延和第一标识的应用侧时延的信息。可选的,应用服务器还可以获取应用服务器标识,将应用服务器标识添加到应用侧时延的信息中。

由于应用服务器可以对多个操作对象执行操作,收集每个操作对象的应用侧时延的信息所要消耗的资源较多,因此,优选的,应用服务器还可以对在第一时间段内对某个操作对象执行的操作的应用侧时延进行采样,仅对采样期间的操作生成应用侧时延的信息,以节省资源。其中,第一时间段可以自行设置和修改。

2)每隔第一时间段,存储服务器获取在第一时间段内对各个操作对象的操作的存储侧时延,存储侧时延的开始时刻是存储服务器接收到应用服务器发送的操作的时刻,结束时刻是向应用服务器返回操作结果的时刻;获取操作对象 的第二标识;生成携带有存储侧时延和第二标识的存储侧时延的信息,将该存储侧时延的信息发送给管理服务器。其中,第二标识包括操作对象的物理地址,且第二标识是应用服务器对操作对象中的第一标识进行转换后得到的。

根据上述对操作的响应流程可知,从接收到应用服务器发送的操作到向应用服务器输出操作结果的存储侧时延可以表示存储服务器的性能,因此,存储服务器可以将存储侧时延的信息作为存储侧性能信息发送给管理服务器。

具体地,存储服务器统计对某个操作对象的操作的存储侧时延,并获取该操作中携带的第二标识,生成携带有存储侧时延和第二标识的存储侧时延的信息。可选的,存储服务器还可以获取存储服务器标识,将存储服务器标识添加到存储侧时延的信息中。

由于存储服务器可以对多个操作对象执行操作,收集每个操作对象的存储侧时延的信息所要消耗的资源较多,因此,优选的,存储服务器还可以对在第一时间段内对某个操作对象执行的操作的存储侧时延进行采样,仅对采样期间的操作生成存储侧时延的信息,以节省资源。

需要说明的是,应用服务器和存储服务器的采样时间相同,使得同一个操作对象的应用侧时延的信息和存储侧时延的信息都可以被采样到。

本实施例不限定应用服务器获取应用侧时延的信息和存储服务器获取存储侧时延的信息的先后执行顺序。

第二,应用侧性能信息是应用侧平均吞吐信息,且存储侧性能信息是存储侧平均吞吐信息。

1)每隔第二时间段,应用服务器收集在第二时间段内统计的各条应用侧平均吞吐数据;获取操作对象的第一标识;生成携带有应用侧平均吞吐数据和第一标识的应用侧平均吞吐信息,将该应用侧平均吞吐信息发送给管理服务器。

根据上述对操作的响应流程可知,应用侧iops和应用侧带宽可以表示应用服务器的性能,因此,应用服务器可以将应用侧平均吞吐信息作为应用侧性能信息发送给管理服务器。

具体地,当应用侧平均吞吐信息是应用侧iops时,应用服务器统计对某个操作对象执行操作时,应用侧i/o接口每秒的操作次数,得到应用侧iops,并获取该操作中携带的第一标识,生成携带有该应用侧iops和第一标识的应用侧平均吞吐信息。当应用侧平均吞吐信息是应用侧带宽时,应用服务器统计对某 个操作对象执行操作时,应用侧每秒的数据量,得到应用侧带宽,并获取该操作中携带的第一标识,生成携带有该应用侧带宽和第一标识的应用侧平均吞吐信息。可选的,应用服务器还可以获取应用服务器标识,将应用服务器标识添加到应用侧平均吞吐信息中。

其中,第二时间段可以自行设置和修改,且第二时间段的时长可以与第一时间段的时长相同,也可以不同,本实施例不作限定。

2)每隔第二时间段,存储服务器收集在第二时间段内统计的各条存储侧吞吐数据;获取操作对象的第二标识;生成携带有存储侧平均吞吐数据和第二标识的存储侧平均吞吐信息,将该存储侧平均吞吐信息发送给管理服务器。

根据上述对操作的响应流程可知,存储侧iops和存储侧带宽可以表示存储服务器的性能,因此,存储服务器可以将存储侧平均吞吐信息作为存储侧性能信息发送给管理服务器。

具体地,当存储侧平均吞吐信息是存储侧iops时,存储服务器统计对某个操作对象执行操作时,存储侧i/o接口每秒的操作次数,得到存储侧iops,并获取该操作中携带的第二标识,生成携带有该存储侧iops和第二标识的存储侧平均吞吐信息。当存储侧平均吞吐信息是存储侧带宽时,存储服务器统计对某个操作对象执行操作时,存储侧每秒的数据量,得到存储侧带宽,并获取该操作中携带的第二标识,生成携带有该存储侧带宽和第二标识的存储侧平均吞吐信息。可选的,存储数服务器还可以获取存储服务器标识,将存储服务器标识添加到存储侧平均吞吐信息中。

本实施例中不限定应用服务器获取应用侧平均吞吐信息和存储服务器获取存储侧平均吞吐信息的先后执行顺序。

需要说明的是,应用服务器可以主动向管理服务器发送应用侧性能信息,也可以在接收到管理服务器发送的请求时发送应用侧性能信息;同理,存储服务器可以主动向管理服务器发送存储侧性能信息,也可以在接收到管理服务器发送的请求时发送存储侧性能信息,本实施例不作限定。

步骤1002,接收应用服务器发送的操作对象的第一标识与第二标识的对应关系,其中,第一标识包括操作对象的名称和逻辑地址中的至少一种,第二标识包括操作对象的物理地址;且对应关系由应用服务器获取每个操作对象的名称和逻辑地址的第一对应关系,并获取每个操作对象的名称和物理地址的第二 对应关系,将包括相同名称的第一对应关系和第二对应关系进行合并得到的。

其中,第一对应关系可以包括:操作对象的名称和逻辑地址,第二对应关系可以包括:操作对象的名称和物理地址,应用服务器将第一对应关系和第二对应关系进行合并后,得到的对应关系可以为:操作对象的名称、逻辑地址、物理地址。

由于第一标识包括操作对象的名称和逻辑地址中的至少一种,第二标识包括操作对象的物理地址,因此,上述对应关系可以指示第一标识和第二标识的对应关系。

在管理服务器接收到对应关系后,可以对对应关系进行存储。

需要说明的是,由于磁盘损坏、备份等原因,存储服务器中对象的物理地址可能会发生变化,因此,应用服务器需要每隔预定时间段对对应关系进行更新。在一种可能的实现方式中,应用服务器可以每隔第一时间段对对应关系进行更新,将更新后的对应关系和应用侧性能信息一起发送给管理服务器;在另一种可能的实现方式中,由于对象的地理地址变化的频率可能较低,因此,应用服务器可以设置第三时间段,每隔第三时间段对对应关系进行更新,将更新后的对应关系发送给管理服务器,其中,第三时间段的时长大于第一时间段的时长。例如,第一时间段的时长为5分钟,第三时间段是的时长为1天等等,本实施例不作限定。

步骤1003,从每个操作对象的应用侧性能信息中读取操作对象的第一标识。

管理服务器接收应用服务器发送的至少一条应用侧性能信息,并接收存储服务器发送的至少一条存储侧性能信息,此时,管理服务器需要确定同一个操作对象对应的应用侧性能信息和存储侧性能信息。

具体地,由于应用侧性能信息中携带有第一标识,因此,管理服务器可以直接从应用侧性能信息中读取第一标识。

步骤1004,从每个操作对象的存储侧性能信息中读取操作对象的第二标识。

具体地,由于存储侧性能信息中携带有第二标识,因此,管理服务器可以直接从存储侧性能信息中读取第二标识。

本实施例不限定对步骤1003和步骤1004的先后执行顺序。

步骤1005,根据对应关系确定每个操作对象对应的应用侧性能信息及存储侧性能信息。

管理服务器在得到各个第一标识和各个第二标识后,根据对应关系确定每个操作对象的第一标识和第二标识。对于每个操作对象的第一标识和第二标识,将包括该第一标识的应用侧性能信息和包括该第二标识的存储侧性能信息确定为该操作对象对应的应用侧性能信息及存储侧性能信息。

需要说明的是,步骤1002只需要在步骤1005之前执行,本实施例不限定步骤1002和其他步骤的先后执行顺序。

在确定出每个操作对象对应的应用侧性能信息和存储侧性能信息后,管理服务器可以将每个操作对象对应的应用侧性能信息和存储侧性能信息发送给结果输出器。结果输出器可以将每个操作对象对应的应用侧性能信息和存储侧性能信息进行对应输出,并根据应用服务器标识标示应用侧性能信息,根据存储服务器标识标示存储侧性能信息。

当结果输出器是显示器时,可以直接在界面中对应显示应用侧性能信息和存储侧性能信息,使得开发人员能够直观了解到应用侧性能信息和存储侧性能信息之间的关系,提高了信息获取效率。下文以结果输出器为显示器为例,对显示方式进行介绍。

在第一种显示方式中,显示器按照时间顺序显示上述内容。在第二种显示方式中,显示器可以按照各个维度显示上述内容。例如,空间利用维度、i/o热度维度、i/o大小分布维度、时延维度等等。

请参考图10b所示的显示信息的界面示意图,其中,图10b中的(1)图展示的是iops,(2)图展示的是时延,(3)图展示的是带宽。

开发人员可以对结果输出器输出的内容进行观察。当开发人员根据该内容确定应用服务器存在问题时,可以向应用服务器输入第一配置信息,应用服务器根据该第一配置信息修复该问题。例如,当开发人员根据该内容确定应用服务器的任务优先级存在问题时,可以向应用服务器输入任务优先级的配置信息,应用服务器根据该配置信息重新配置任务优先级。

当开发人员根据该内容确定存储服务器存在问题时,可以向存储服务器输入第二配置信息,存储服务器根据该第二配置信息修复该问题。例如,当开发人员根据该内容确定存储服务器的存储空间不够时,可以向存储服务器输入空间配置信息,存储服务器根据该空间配置信息重新分配存储空间。

由于开发人员根据该内容确定是应用服务器还是存储服务器存在问题的效 率和准确率都较低,因此,在一种可能的实现方式中,可以由管理服务器对上述内容继续进行分析,确定是应用服务器还是存储服务器存在问题,此时执行步骤1006。

步骤1006,当应用侧性能信息包括应用侧时延的信息,存储侧性能信息包括存储侧时延的信息时,将应用侧时延减去存储侧时延,得到时延差值;检测时延差值是否大于第一阈值;当检测结果为时延差值大于第一阈值时,生成应用服务器存在问题的分析结果。

其中,时延差值是应用服务器本端响应操作所消耗的时间。当时延差值较大时,说明应用服务器不能及时响应该操作,生成应用服务器存在问题的分析结果;当时延差值较小时,说明应用服务器能够及时响应该操作,生成应用服务器不存在问题的分析结果。

例如,应用侧时延是3s,存储侧时延是2s,计算得到的时延差值是1s,若第一阈值是0.5s,生成应用服务器存在问题的分析结果;若第一阈值是2s,生成应用服务器不存在问题的分析结果。

步骤1007,检测存储侧时延是否大于第二阈值;当检测结果为存储侧时延大于第二阈值时,生成存储服务器存在问题的分析结果。

其中,存储侧时延是存储服务器本端响应操作所消耗的时间。当存储侧时延较大时,说明存储服务器不能及时响应该操作,生成存储服务器存在问题的分析结果;当存储侧时延较小时,说明存储服务器能够及时响应该操作,生成存储服务器不存在问题的分析结果。

例如,存储侧时延是2s,若第二阈值是1s,生成存储服务器存在问题的分析结果;若第二阈值是3s,生成存储服务器不存在问题的分析结果。

步骤1008,根据分析结果确定是应用服务器还是存储服务器存在问题。

需要说明的是,管理服务器还可以将分析结果存储在存储服务器中,后续,其他设备可以向存储服务器获取该分析结果。

可选的,应用服务器还可以获取收集应用服务器的其他性能信息,下面以其他性能信息为等待事件信息为例进行举例说明,本实施例提供的性能监控方法,还包括:接收应用服务器发送的操作对象的等待事件信息;根据等待事件信息确定是否是应用服务器存在问题。

由于应用服务器上统计有上述等待事件信息,因此,应用服务器可以直接 将该等待事件信息发送给管理服务器。其中,等待事件信息是指应用服务器在某种等待下所消耗的时间。例如,等待事件信息可以包括但不限于:中央处理单元(英文:centralprocessingunit;简称:cpu)等待时间、cpu等待任务的排序、i/o等待时间、非i/o等待时间、闲置时间、取样消耗时间。

在一种可能的实现方式中,管理服务器不对等待事件信息进行分析,直接将该等待事件信息发送给结果输出器,结果输出器对该等待事件信息进行显示,以供开发人员进行分析,确定是应用服务器还是存储服务器存在问题。在另一种可能的实现方式中,管理服务器对每个等待事件设置等待阈值,将等待事件信息与对应的等待阈值进行比较,当等待事件信息大于对应的等待阈值时,确定应用服务器存在问题;当等待事件信息小于对应的等待阈值时,确定应用服务器不存在问题。

可选的,应用服务器还可以获取应用服务器标识,将应用服务器标识添加到等待事件信息中。

综上所述,本发明实施例提供的性能监控方法,通过管理服务器确定每个操作对象对应的应用侧性能信息和存储侧性能信息,再对每个操作对象对应的应用侧性能信息和存储侧性能信息进行分析,可以根据分析结果确定是应用服务器还是存储服务器存在问题,解决了无法确定是应用服务器还是存储服务器存在问题,导致监控出错的问题,达到了提高监控的准确性的效果。

通过应用服务器分别收集第一对应关系和第二对应关系,将第一对应关系和第二对应关系合并成对应关系,以便于根据该对应关系对操作对象的应用侧性能信息和存储侧性能信息进行对应,解决了无法对应用侧性能信息和存储侧性能信息进行对应的问题,达到了提高分析的准确性的效果。

通过管理服务器比较时延差值与第一阈值的大小,可以自动确定是否是应用服务器存在问题,解决了需要开发人员比较时延差值与第一阈值的大小,确定问题的效率低和准确性的问题,达到了提高确定问题的效率和准确性的效果。

通过管理服务器比较存储侧时延与第二阈值的大小,可以自动确定是否是存储服务器存在问题,解决了需要开发人员比较存储侧时延与第二阈值的大小,确定问题的效率低和准确性的问题,达到了提高确定问题的效率和准确性的效果。

请参考图11,其示出了本发明一个实施例提供的性能监控装置的结构框图,该性能监控装置可以通过软件、硬件或者两者的结合实现成为管理服务器的全部或者一部分。该性能监控装置,包括:接收单元1110、读取单元1120、确定单元1130和分析单元1140。

接收单元1110,用于实现上述步骤901和步骤902的功能;

读取单元1120,用于实现上述步骤903和步骤904的功能;

确定单元1130,用于实现上述步骤905和907的功能;

分析单元1140,用于实现上述步骤906的功能。

在另一个可选的实施例中,上述接收单元1110,用于实现步骤1001、步骤1002的功能;上述读取单元1120,用于实现步骤1003和步骤1004的功能;上述确定单元1130,用于实现步骤1005、步骤1008的功能;上述分析单元1140,用于实现步骤1006、步骤1007的功能。

相关细节可结合参考上述方法实施例。

需要说明的是,上述接收单元1110可以通过管理服务器的处理器执行存储器中的接收模块来实现;上述的读取单元1120可以通过管理服务器的处理器执行存储器中的读取模块来实现;上述的确定单元1130可以通过管理服务器的处理器执行存储器中的确定模块来实现;上述分析单元1140可以通过管理服务器的处理器执行存储器中的分析模块来实现。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1