确定指标关联性的方法及装置与流程

文档序号：13164362阅读：918来源：国知局

本发明涉及信息处理领域，尤其涉及一种确定指标关联性的方法及装置。
背景技术：
：在监控设备的运行状态时，通常需要根据采集的监控指标数据，建立监控指标的关联关系。目前，主要根据经验手工建立监控指标之间的关联关系。但是，这种方式自动化程度低，耗时长，并且在监控设备较多时可用性差。技术实现要素：本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本发明的第一个目的在于提出一种确定指标关联性的方法，通过第一指标与第二指标在同一时间段内采样点的指标值，计算出所有采样间隔内两个指标的变化量，并获得变化量集合，根据两个指标的变化量集合得到两个指标的置信度，进而根据置信度，来确定两个指标之间是否存在关联关系，实现了通过具体的数据计算，即可确定两个指标之间的关联性，解决了现有技术中根据经验通过手工建立指标的关联关系，存在的耗时长、效率低、可用性差的问题。本发明的第二个目的在于提出一种确定指标关联性的装置。本发明的第三个目的在于提出另一确定指标关联性的装置。本发明的第四个目的在于提出一种计算机程序产品。本发明的第五个目的在于提出一种非临时性计算机可读存储介质。为达上述目的，本发明第一方面实施例提出了一种确定指标关联性的方法，方法包括：获取第一指标和第二指标在同一时间段内各采样点的指标值；根据第一指标相邻采样点的指标值，获取第一指标在相邻采样点对应的时间间隔内的第一变化量，并利用所有采样点的第一变化量得到第一指标在时间段内的第一变化量集合；根据第二指标相邻采样点的指标值，确定第二指标在相邻采样点对应的时间间隔内的第二变化量，并利用所有采样点的第二变化量得到第二指标在时间段内的第二变化量集合；根据第一变化量集合和第二变化量集合，获取第一指标和第二指标存在关联关系的置信度；如果置信度大于等于预设的第一阈值，则确定第一指标和第二指标之间存在关联关系。作为第一方面实施例一种可选的实现方式，根据第一变化量集合和第二变化量集合，获取第一指标和第二指标存在关联关系的置信度，包括：从第一变化量集合中，统计超过预设的第二阈值的第一变化量的第一个数；从第二变化量集合中，统计超过预设的第三阈值的第二变化量的第二个数；从第一变化量集合和第二变化量集合中，统计所有相邻采样点中同时满足第一变化量超过第二阈值且第二变化量超过第三阈值的相邻采样点的第三个数；根据第一个数、第二个数与第三个数，计算置信度。作为第一方面实施例一种可选的实现方式，根据第一变化量集合和第二变化量集合，获取第一指标和第二指标存在关联关系的置信度之前，还包括：从第一变化量集合和第二变化量集合中，确定第一指标和第二指标在相同采样点发生变化的次数；如果次数超过预设的第四阈值，则确定第一指标与所述第二指标存在相关性。作为第一方面实施例一种可选的实现方式，据第一指标相邻采样点的指标值，获取第一指标在相邻采样点对应的时间间隔内的第一变化量，包括：将第一指标相邻采样点中的第i个采样点的指标值与第i+1个采样点的指标值作差值；其中，1≤i≤n，n为采样点的总个数，i与n取整数；将差值的绝对值与第i+1个采样点的指标值作比值；根据比值得到第一变化量；根据第二指标相邻采样点的指标值，确定第二指标在相邻采样点对应的时间间隔内的第二变化量，包括：将第二指标相邻采样点中的第j个采样点的指标值与第j+1个采样点的指标值作差值；其中，1≤j≤n，j取整数；将差值的绝对值与第j+1个采样点的指标值作比值；根据比值得到所述第二变化量。作为第一方面实施例一种可选的实现方式，利用所有采样点的第一变化量得到第一指标在时间段内的第一变化量集合，包括：将所有采样点的第一变化量与第二阈值比较；如果第一变化量超出第二阈值，则将第一变化量标记为第一数值；如果第一变化量未超出第二阈值，则将第一变化量标记为第二数值；利用第一指标每个采样点的数值，形成第一变化量集合；利用所有采样点的第二变化量得到第二指标在时间段内的第二变化量集合，包括：将所有采样点的第二变化量与第三阈值比较；如果第二变化量超出第三阈值，则将第二变化量标记为第一数值；如果第二变化量未超出第三阈值，则将第二变化量标记为第二数值；利用第二指标每个采样点的数值，形成第二变化量集合。作为第一方面实施例一种可选的实现方式，从第一变化量集合中，统计超过预设的第二阈值的第一变化量的第一个数，包括：统计第一变化量集合中出现第一数值的个数作为第一个数；从第二变化量集合中，统计超过第三阈值的第二变化量的第二个数，包括：统计第二变化量集合中出现第一数值的个数作为第二个数；从第一变化量集合和第二变化量集合中，统计所有相邻采样点中同时满足第一变化量超过第二阈值且第二变化量超过第三阈值的相邻采样点的第三个数，包括：从第一变化量集合和第二变化量集合中，统计所有相邻采样点中第一变化量取值为第一数值且第二变化量取值为第一数值的相邻采样点的个数作为第三个数。作为第一方面实施例一种可选地的实现方式，获取第一指标和第二指标在同一时间段内各采样点的指标值之前，包括：确定第一指标所隶属的资源和第二指标所隶属的资源为同一资源；或者，确定第一指标所隶属的资源和第二指标所隶属的资源之间存在关联关系。作为第一方面实施例一种可选的实现方式，根据第一个数、第二个数与采第三个数，计算置信度，包括：将第一个数与第三个数作比值作为第一置信度；将第二个数与第三个数作比值作为第二置信度；从第一置信度和第二置信度中选择最大的作为置信度。作为第一方面实施例一种可选的实现方式，如果第一置信度和第二置信度相同且大于等于第一阈值，则将第一指标所隶属的资源与第二指标所隶属的资源之间的关联关系，作为第一指标与第二指标的关联关系。本发明实施例提出的确定指标关联性的方法，通过获取第一指标和第二指标在同一时间段内各采样点的指标值，根据第一指标相邻采样点的指标值，获取第一指标在相邻采样点对应的时间间隔内的第一变化量，并利用所有采样点的第一变化量得到所述第一指标在时间段内的第一变化量集合，同样地，根据第二指标相邻采样点的指标值，确定第二指标在相邻采样点对应的时间间隔内的第二变化量，并利用所有采样点的第二变化量得到第二指标在时间段内的第二变化量集合，根据第一变化量集合和第二变化量集合，获取第一指标和第二指标存在关联关系的置信度，如果置信度大于等于预设的第一阈值，则确定第一指标和第二指标之间存在关联关系。本实施例中，通过第一指标与第二指标在同一时间段内采样点的指标值，计算出所有采样间隔内两个指标的变化量，并获得变化量集合，根据两个指标的变化量集合得到两个指标的置信度，进而根据置信度，来确定两个指标之间是否存在关联关系，实现了通过具体的数据计算，即可确定两个指标的关联性，自动化程度高，从而解决了现有技术中根据经验通过手工建立指标的关联关系，存在的耗时长、效率低、可用性差的问题。为达上述目的，本发明第二方面实施例提出了一种确定指标关联性的装置，包括：第一获取模块，用于获取第一指标和第二指标在同一时间段内各采样点的指标值；第二获取模块，用于根据第一指标相邻采样点的指标值，获取第一指标在相邻采样点对应的时间间隔内的第一变化量，并利用所有采样点的第一变化量得到第一指标在时间段内的第一变化量集合；第三获取模块，用于根据第二指标相邻采样点的指标值，确定第二指标在相邻采样点对应的时间间隔内的第二变化量，并利用所有采样点的第二变化量得到第二指标在时间段内的第二变化量集合；第四获取模块，用于根据第一变化量集合和第二变化量集合，获取第一指标和第二指标存在关联关系的置信度；第一确定模块，用于如果置信度大于等于预设的第一阈值，则确定第一指标和第二指标之间存在关联关系。作为第二方面实施例一种可选的实现方式，第四获取模块，包括：第一统计单元，用于从第一变化量集合中，统计超过预设的第二阈值的第一变化量的第一个数；第二统计单元，用于从第二变化量集合中，统计超过预设的第三阈值的第二变化量的第二个数；第三统计单元，用于从第一变化量集合和第二变化量集合中，统计所有相邻采样点中同时满足第一变化量超过第二阈值且第二变化量超过第三阈值的相邻采样点的第三个数；计算单元，用于根据第一个数、第二个数与第三个数，计算置信度。作为第二方面实施例一种可选的实现方式，该装置还包括第二确定模块，用于从第一变化量集合和第二变化量集合中，确定第一指标和第二指标在相同采样点发生变化的次数，如果次数超过预设的第四阈值，则确定第一指标与第二指标存在相关性。作为第二方面实施例一种可选的实现方式，第二获取模块，具体用于：将第一指标相邻采样点中的第i个采样点的指标值与第i+1个采样点的指标值作差值；其中，1≤i≤n，n为采样点的总个数，i与n取整数；将差值的绝对值与第i+1个采样点的指标值作比值；根据比值得到第一变化量；第三获取模块，具体用于：将第二指标相邻采样点中的第j个采样点的指标值与第j+1个采样点的指标值作差值；其中，1≤j≤n，j取整数；将差值的绝对值与第j+1个采样点的指标值作比值；根据比值得到所述第二变化量。作为第二方面实施例一种可选的实现方式，第二获取模块具体用于：将所有采样点的第一变化量与第二阈值比较；如果第一变化量超出第二阈值，则将第一变化量标记为第一数值；如果第一变化量未超出第二阈值，则将第一变化量标记为第二数值；利用第一指标每个采样点的数值，形成第一变化量集合；第三获取模块具体用于：将所有采样点的第二变化量与预设的第三阈值比较；如果第二变化量超出第三阈值，则将第二变化量标记为第一数值；如果第二变化量未超出第三阈值，则将第二变化量标记为第二数值；利用第二指标每个采样点的数值，形成第二变化量集合。作为第二方面实施例一种可选的实现方式，第一统计单元，具体用于：统计第一变化量集合中出现第一数值的个数作为第一个数；第二统计单元，具体用于统计第二变化量集合中出现第一数值的个数作为第二个数；第三统计单元，具体用于从第一变化量集合和第二变化量集合中，统计所有相邻采样点中第一变化量取值为第一数值且第二变化量取值为第一数值的相邻采样点的个数作为第三个数。作为第二方面实施例一种可选的实现方式，该装置包括：第三确定模块，用于确定第一指标所隶属的资源和第二指标所隶属的资源为同一资源；或者，确定第一指标所隶属的资源和第二指标所隶属的资源之间存在关联关系。作为第二方面实施例一种可选的实现方式，计算单元，具体用于：将第一个数与第三个数作比值作为第一置信度；将第二个数与第三个数作比值作为第二置信度；从第一置信度和第二置信度中选择最大的作为置信度。作为第二方面实施例一种可选的实现方式，第一获取模块还用于如果第一置信度和第二置信度相同且大于等于第一阈值，则将第一指标所隶属的资源与第二指标所隶属的资源之间的关联关系，作为第一指标与第二指标的关联关系。本发明实施例提出的确定指标关联性的装置，通过获取第一指标和第二指标在同一时间段内各采样点的指标值，根据第一指标相邻采样点的指标值，获取第一指标在相邻采样点对应的时间间隔内的第一变化量，并利用所有采样点的第一变化量得到所述第一指标在时间段内的第一变化量集合，同样地，根据第二指标相邻采样点的指标值，确定第二指标在相邻采样点对应的时间间隔内的第二变化量，并利用所有采样点的第二变化量得到第二指标在时间段内的第二变化量集合，根据第一变化量集合和第二变化量集合，获取第一指标和第二指标存在关联关系的置信度，如果置信度大于等于预设的第一阈值，则确定第一指标和第二指标之间存在关联关系。本实施例中，通过第一指标与第二指标在同一时间段内采样点的指标值，计算出所有采样间隔内两个指标的变化量，并获得变化量集合，根据两个指标的变化量集合得到两个指标的置信度，进而根据置信度，来确定两个指标之间是否存在关联关系，实现了通过具体的数据计算，即可确定两个指标的关联性，自动化程度高，从而解决了现有技术中根据经验通过手工建立指标的关联关系，存在的耗时长、效率低、可用性差的问题。为达上述目的，本发明第三方面实施例提出另一种确定指标关联性的装置，包括处理器和存储器；其中，处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序，以用于实现如第一方面实施例所述的确定指标关联性的方法。为达上述目的，本发明第四方面实施例提出一种计算机程序产品，当计算机程序产品中的指令由处理器执行时，执行如第一方面实施例所述的确定指标关联性的方法。为达上述目的，本发明第五方面实施例提出一种非临时性计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如第一方实施例所述的确定指标关联性的方法。本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。附图说明本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：图1为本发明实施例提供的一种确定指标关联性的方法的流程示意图；图2为本发明实施例提供的一种某设备的cpu使用率和diskio在某时间段内的变化情况的示意图；图3为本发明实施例提供的一种确定指标关联性的装置的结构示意图；图4为本发明实施例提供的另一种确定指标关联性的装置的结构示意图；图5为本发明实施例提供的又一种确定指标关联性的装置的结构示意图；图6为本发明实施例提供的一种计算机程序产品的结构示意图。具体实施方式下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。下面参考附图描述本发明实施例的确定指标关联性的方法及装置。图1为本发明实施例提供的一种确定指标关联性的方法的流程示意图。如图1所示，该确定指标关联性的方法包括以下步骤：s101，获取第一指标和第二指标在同一时间段内各采样点的指标值。在对设备进行监控的过程中，可设置一个采样频率(采样间隔)，以设置的采样频率对监控指标进行采样，根据采样值获得监控指标的变化情况。本实施例中，获取同一个时间段内，第一指标与第二指标在各个采样点的指标值。例如，获取第一指标与第二指标在上午9点到10点之间的时间段内，各个采样点的指标值。为了使计算量可控，在获取第一指标和第二指标在同一时间段内各采样点的指标值之前，可先确定第一指标与第二指标隶属于同一资源，或者确定第一指标所隶属的资源和第二指标所隶属的资源之间存在关联关系，如第一指标所隶属的资源依赖于第二指标所隶属的资源。s102，根据第一指标相邻采样点的指标值，获取第一指标在相邻采样点对应的时间间隔内的第一变化量，并利用所有采样点的第一变化量得到第一指标在时间段内的第一变化量集合。本实施例中，假设获取了第一指标n个采样点的指标值。具体地，首先将第一指标相邻采样点中的第i个采样点的指标值与第i+1个采样点的指标值作差值；其中，1≤i≤n，n为采样点的总个数，i与n取整数。然后，将该差值的绝对值与第i+1个采样点的指标值作比值，根据比值得到第一变化量。如公式一所示。公式一：其中，δka,i表示指标a在第i个采样间隔内，即第i个采样点与第i+1个采样点对应的时间间隔内的变化量，ka,i表示指标a在第i个采样点的指标值，ka,i+1表示指标a在第i+1个采样点的指标值。根据上述公式一可以获得相邻采样点对应的时间间隔内第一指标的第一变化量。在获得相邻采样点对应的时间间隔内第一指标的第一变化量之后，将每个相邻采样点对应的时间间隔内的第一变化量与预设的第二阈值比较，如果第一变化量超出第二阈值，则将第一变化量标记为第一数值。如果第一变化量未超出第二阈值，则将第一变化量标记为第二数值。之后，利用第一指标每个采样点的数值，形成第一变化量集合。例如，获取了第一指标a在某个时间段内8个采样点的指标值，并根据指标值计算出相邻采样点对应的时间间隔内的第一变化量δka,i，其中i＝1，2，…7，δka,1表示指标a在第2个采样点与第1个采样点对应的时间间隔内的第一变化量。将δka,1、δka,2、δka,3、δka,4、δka,5、δka,6和δka,7分别和第二阈值比较，假设δka,1、δka,3、δka,4、δka,5和δka,6超出了第二阈值，则将δka,1、δka,3、δka,4、δka,5和δka,6标记为1，将为未超出第二阈值的δka,2和δka,7标记为0。也就是说，δka,1、δka,2、δka,3、δka,4、δka,5、δka,6和δka,7对应的标记分别为1、0、1、1、1、1、0。然后，将1、0、1、1、1、1、0形成指标a的第一变化量集合。当然，除了用1和0来区分第一变化量是否超过第二阈值之外，也可以用其他数值或者符号进行标记，本发明对此不作限制。s103，根据第二指标相邻采样点的指标值，确定第二指标在相邻采样点对应的时间间隔内的第二变化量，并利用所有采样点的第二变化量得到第二指标在时间段内的第二变化量集合。本实施例中，假设获取了第二指标n个采样点的指标值。具体地，首先将第二指标相邻采样点中的第j个采样点的指标值与第j+1个采样点的指标值作差值；其中，1≤j≤n，n为采样点的总个数，j与n取整数。然后，将该差值的绝对值与第j+1个采样点的指标值作比值，根据比值得到第二变化量。如公式二所示。公式二：其中，δkb,j表示指标b在第j个采样间隔内，即第j个采样点与第j+1个采样点对应的时间间隔内的变化量，δkb,j表示指标b在第j个采样点的指标值，kb,j+1表示指标b在第j+1个采样点的指标值。根据上述公式二可以获得相邻采样点对应的时间间隔内第二指标的第二变化量。然后，利用所有采样点的第二变化量得到第二指标在时间段内的第二变化量集合。具体地，将所有采样点的第二变化量与预设的第三阈值比较，如果第二变化量超出预设的第三阈值，则将第二变化量标记为第一数值；如果第二变化量未超出第三阈值，则将第二变化量标记为第二数值。再利用第二指标每个采样点的数值，形成第二变化量集合。例如，获取了第二指标b在某个时间段内8个采样点的指标值，并根据指标值计算出相邻采样点对应的时间间隔内的第二变化量δkb,j，其中j＝1，2，…7，δkb,1表示指标b第1个采样点与第2个采样点对应的时间间隔内的第二变化量。将δkb,1、δkb,2、δkb,3、δkb,4、δkb,5、δkb,6和δkb,7分别和第三阈值比较，假设δkb,1、δkb,2、δkb,4和δkb,5超出了第三阈值，则将δkb,1、δkb,2、δkb,4和δkb,5标记为1，将为未超出第三阈值的δkb,3、δkb,6和δkb,7标记为0。也就是说，δkb,1、δkb,2、δkb,3、δkb,4、δkb,5、δkb,6和δkb,7对应的标记分别为1、1、0、1、1、0、0。然后，将1、1、0、1、1、0、0形成指标b的第二变化量集合。本实施例中，通过第一数值和第二数值，区分第一变化量和第二变化量是否超过分别预设的阈值，并用第一数值和第二数值形成第一变化量集合第二变化量集合，不仅减少了存储空间，而且减少了计算量。本实施例中，可根据第一指标与第二指标在相同采样点发生变化的次数，来确定两个指标之间是否存在相关性。其中，同时发生变化可理解为，第一指标和第二指标的某一采样点的采样值与前一采样点的采样值相比，都增大或者都减小。具体地，在一段时间范围内的所有采样点中，如果第一指标与第二指标同时发生变化的次数超过预设的第四阈值，可以确定第一指标与第二指标存在相关性。例如，在100个采样点中，如果两个指标同时发生变化的次数超过60次，则确定两个指标之间存在相关性。s104，根据第一变化量集合和第二变化量集合，获取第一指标和第二指标存在关联关系的置信度。本实施例中，在获得第一变化量集合和第二变化量集合后，从第一变化量集合中，统计超过预设的第二阈值的第一变化量的第一个数。由s102可知，超过预设的第二阈值的第一变化量可被标记为第一数值，并形成第一变化量集合，因此第一变化量集合中出现第一数值的个数，即为超过预设的第二阈值的第一变化量的第一个数，从而可通过统计第一变化量集合中出现第一数值的个数，来获得第一个数。同理，可通过统计第二变化量集合中出现第一数值的个数，获得第二变化量集合中超过预设的第三阈值的第二变化量的第二个数。再统计第一变化量集合和第二变化量集合中，所有相邻采样点同时满足第一变化量超过第二阈值且第二变化量超过第三阈值的相邻采样点的第三个数。与上述统计第一个数和第二个数的方法类似，统计第一变化量集合和第二变化量集合中，所有采样间隔的第一变化量取值为第一数值且第二变化量取值为第一数值的采样间隔的个数即第三个数。在获得第一个数、第二个数和满足第一变化量超过第二阈值且第二变化量超过第三阈值的采样间隔个数之后，可将第一个数与该采样间隔个数的比值作为第一置信度，如公式三所示；将第二个数与该采样间隔个数的比值作为第二置信度，如公式四所示。并将第一置信度和第二置信度中最大的，作为第一指标和第二指标存在关联关系的置信度。公式三：其中，confidence(a→b)为第一置信度，count(a)为第一个数，为满足条件的采样点个数，a为第一指标，b为第二指标。公式四：其中，confidence(b→a)表示第二置信度，count(b)为第二个数，为满足条件的采样点个数，a为第一指标，b为第二指标。例如，假设第一指标a的第一变化量集合为{1,0,1,1,1,1,0}，第二指标b的第二变化量集合为{1,1,0,1,1,0,0}。可知，第一变化量集合中第一变化量超过第二阈值的个数为5，第二变化量集合中第二变化量超过第三阈值的个数为4。由表1可知，第一变化量集合和第二变化量集合中，所有采样间隔对应的第一变化量和第二变化量，同时满足第一变化量超过第二阈值且第二变化量超过第三阈值的采样间隔个数为3。表1指标a与指标b的变化量集合中的元素根据公式三和公式四，可计算出第一置信度为1.25，第二置信度为1。由于第一置信度大于第二置信度，因此将第一置信度1.25作为第一指标a与第二指标b存在关联关系的置信度。s105，如果置信度大于等于预设的第一阈值，则确定第一指标和第二指标之间存在关联关系。在获得第一指标与第二指标存在关联关系的置信度后，如果该置信度大于预设的第一阈值，可以确定第一指标和第二指标之间存在关联关系。例如，假设第一阈值为1.2，如果第一指标与第二指标存在关联关系的置信度大于1.2，可以确定第一指标和第二指标之间存在关联关系。实际应用中，可能会存在第一信度和第二置信度相同的情况。本实施例中，如果第一置信度和第二置信度相同且大于等于第一阈值，则将第一指标所隶属的资源与第二指标所隶属的资源之间的关联关系，作为第一指标与第二指标的关联关系。例如，第一指标a隶属于资源a，第二指标b隶属于资源b，资源a依赖于资源b，如果第一置信度和第二置信度相同并都大于第一阈值，那么将资源a依赖于资源b的关联关系，作为第一指标a与第二指标b的关联关系，即第一指标a依赖于第二指标b。下面以某设备的监控指标cpu使用率和diskio(磁盘读写速度)为例，来说明本发明的确定指标关联性的方法。假设，在9:00与10:00之间每隔5分钟，对cpu使用率和diskio进行采样，以获得9:00与10:00时间段内两个指标在采样点的指标值，如表2所示。表2cpu使用率与diskio在采样点的指标值采样点9:009:059:109:159:209:259:309:359:409:459:509:5510:00cpu10％18％20％40％35％60％10％42％38％50％40％60％50％diskio200250300500600700580450600400500900600根据表2中指标的采样值，计算第一指标cpu使用率与第二指标diskio在所有采样点对应的时间间隔内的变化量，假设第一阈值为3，第二阈值为0.20，第三阈值为0.50。根据cpu使用率的变化量与第二阈值的比较结果，获得cpu使用率的变化量集合为{0,0,1,0,0,0,0,0,1,1,1,0}，根据diskio的变化量与第三阈值的比较结果，获得diskio的变化量集合为{0,0,0,0,0,0,0,0,1,0,0,0}。可知，cpu使用率的第一个数为4，diskio的第二个数为1，cpu使用率的变化量超过第二阈值且diskio的变化量超过第三阈值的采样间隔个数为1。根据上述公式三和公式四，可以计算出第一置信度为4，第二置信度为1，cpu使用率与diskio的置信度为4，且大于第一阈值3，因此cpu使用率与diskio之间存在关联关系。根据cpu使用率和diskio在9:00与10:00之间的时间段内的指标值，绘制出该时间段内cpu使用率和diskio的变化情况图，如图2所示。从图2可以看出，内cpu使用率和diskio的变化趋势一致，验证了本发明的确定指标关联性的方法的正确性。本发明实施例提出的确定指标关联性的方法，通过获取第一指标和第二指标在同一时间段内各采样点的指标值，根据第一指标相邻采样点的指标值，获取第一指标在相邻采样点对应的时间间隔内的第一变化量，并利用所有采样点的第一变化量得到所述第一指标在时间段内的第一变化量集合，同样地，根据第二指标相邻采样点的指标值，确定第二指标在相邻采样点对应的时间间隔内的第二变化量，并利用所有采样点的第二变化量得到第二指标在时间段内的第二变化量集合，根据第一变化量集合和第二变化量集合，获取第一指标和第二指标存在关联关系的置信度，如果置信度大于等于预设的第一阈值，则确定第一指标和第二指标之间存在关联关系。本实施例中，通过第一指标与第二指标在同一时间段内采样点的指标值，计算出所有采样间隔内两个指标的变化量，并获得变化量集合，根据两个指标的变化量集合得到两个指标的置信度，进而根据置信度，来确定两个指标之间是否存在关联关系，实现了通过具体的数据计算，即可确定两个指标的关联性，自动化程度高，从而解决了现有技术中根据经验通过手工建立指标的关联关系，存在的耗时长、效率低、可用性差的问题。为了实现上述实施例，本发明还提出一种确定指标关联性的装置的结构示意图。如图3所示，该确定指标关联性的装置包括：第一获取模块310、第一获取模块320、第三获取模块330、第四获取模块340、第一确定模块350。第一获取模块310，用于获取第一指标和第二指标在同一时间段内各采样点的指标值。第二获取模块320用于根据第一指标相邻采样点的指标值，获取第一指标在相邻采样点对应的时间间隔内的第一变化量，并利用所有采样点的第一变化量得到第一指标在时间段内的第一变化量集合。第三获取模块330用于根据第二指标相邻采样点的指标值，确定第二指标在相邻采样点对应的时间间隔内的第二变化量，并利用所有采样点的第二变化量得到第二指标在时间段内的第二变化量集合。在本发明一种可能的实现方式中，第二获取模块320具体用于将第一指标相邻采样点中的第i个采样点的指标值与第i+1个采样点的指标值作差值；其中，1≤i≤n，n为采样点的总个数，i与n取整数；将差值的绝对值与第i+1个采样点的指标值作比值；根据比值得到第一变化量。第三获取模块330具体用于将第二指标相邻采样点中的第j个采样点的指标值与第j+1个采样点的指标值作差值；其中，1≤j≤n，j取整数；将差值的绝对值与第j+1个采样点的指标值作比值；根据比值得到所述第二变化量。在本发明一种可能的实现方式中，第二获取模块320具体用于将所有采样点的第一变化量与第二阈值比较；如果第一变化量超出第二阈值，则将第一变化量标记为第一数值；如果第一变化量未超出第二阈值，则将第一变化量标记为第二数值；利用第一指标每个采样点的数值，形成第一变化量集合。第三获取模块330具体用于将所有采样点的第二变化量与第三阈值比较；如果第二变化量超出第三阈值，则将第二变化量标记为第一数值；如果第二变化量未超出第三阈值，则将第二变化量标记为第二数值；利用第二指标每个采样点的数值，形成第二变化量集合。第四获取模块340用于根据第一变化量集合和第二变化量集合，获取第一指标和第二指标存在关联关系的置信度。第一确定模块350用于如果置信度大于等于预设的第一阈值，则确定第一指标和第二指标之间存在关联关系。进一步地，如图4所示，第四获取模块340包括：第一统计单元341、第二统计单元342、第三统计单元343、计算单元344。第一统计单元341用于从第一变化量集合中，统计超过预设的第二阈值的第一变化量的第一个数。第二统计单元342用于从第二变化量集合中，统计超过预设的第三阈值的第二变化量的第二个数。第三统计单元343用于从第一变化量集合和第二变化量集合中，统计所有相邻采样点中同时满足第一变化量超过第二阈值且第二变化量超过第三阈值的相邻采样点的第三个数。计算单元344用于根据第一个数、第二个数与第三个数，计算置信度。在本发明的一种可能的实现形式中，第一统计单元341具体用于统计第一变化量集合中出现第一数值的个数作为第一个数.第二统计单元342具体用于统计第二变化量集合中出现第一数值的个数作为第二个数。第三统计单元343具体用于从第一变化量集合和第二变化量集合中，统计所有相邻采样点中第一变化量取值为第一数值且第二变化量取值为第一数值的相邻采样点的个数作为第三个数。计算单元344具体用于将第一个数与第三个数作比值作为第一置信度；将第二个数与第三个数作比值作为第二置信度；从第一置信度和第二置信度中选择最大的作为置信度。更进一步地，如图5所示，该装置还可包括：第二确定模块360、第三确定模块370。第二确定模块360用于从第一变化量集合和第二变化量集合中，确定第一指标和第二指标在相同采样点发生变化的次数；如果次数超过预设的第四阈值，则确定第一指标与第二指标存在相关性。第三确定模块370用于确定第一指标所隶属的资源和第二指标所隶属的资源为同一资源；或者，确定第一指标所隶属的资源和第二指标所隶属的资源之间存在关联关系。第一获取模块310还用于如果第一置信度和第二置信度相同且大于等于第一阈值，则将第一指标所隶属的资源与第二指标所隶属的资源之间的关联关系，作为第一指标与第二指标的关联关系。需要说明的是，上述对确定指标关联性的方法的解释说明，也适用于对确定指标关联性的装置的解释说明，在此不再赘述。本发明实施例提出的确定指标关联性的装置，通过获取第一指标和第二指标在同一时间段内各采样点的指标值，根据第一指标相邻采样点的指标值，获取第一指标在相邻采样点对应的时间间隔内的第一变化量，并利用所有采样点的第一变化量得到所述第一指标在时间段内的第一变化量集合，同样地，根据第二指标相邻采样点的指标值，确定第二指标在相邻采样点对应的时间间隔内的第二变化量，并利用所有采样点的第二变化量得到第二指标在时间段内的第二变化量集合，根据第一变化量集合和第二变化量集合，获取第一指标和第二指标存在关联关系的置信度，如果置信度大于等于预设的第一阈值，则确定第一指标和第二指标之间存在关联关系。本实施例中，通过第一指标与第二指标在同一时间段内采样点的指标值，计算出所有采样间隔内两个指标的变化量，并获得变化量集合，根据两个指标的变化量集合得到两个指标的置信度，进而根据置信度，来确定两个指标之间是否存在关联关系，实现了通过具体的数据计算，即可确定两个指标的关联性，自动化程度高，从而解决了现有技术中根据经验通过手工建立指标的关联关系，存在的耗时长、效率低、可用性差的问题。为达上述目的，本发明还提出另一种确定指标关联性的装置，包括处理器和存储器；其中，处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序，以用于实现如上述实施例所述的确定指标关联性的方法。为达上述目的，本发明还提出一种计算机程序产品，当计算机程序产品中的指令由处理器执行时，执行如上述实施例所述的确定指标关联性的方法。为了清楚说明前述计算机程序产品的具体结构，图6示出了适于用来实现本发明实施方式的示例性计算机程序产品12的框图。图6显示的计算机程序产品12仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。如图6所示，计算机程序产品12以通用计算机设备的形式表现。计算机程序产品12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，系统存储器28，连接不同系统组件(包括系统存储器28和处理单元16)的总线18。总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(industrystandardarchitecture，简称isa)总线，微通道体系结构(microchannelarchitecture，简称mac)总线，增强型isa总线、视频电子标准(vedioelectronicstandardassociation，简称vesa)局域总线以及外围组件互连(peripheralcomponentinterconnect，简称pci)总线。计算机程序产品12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机程序产品12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。系统存储器28可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(randomaccessmemory，简称ram)30和/或高速缓存存储器32。计算机程序产品12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示，通常称为“硬盘驱动器”)。尽管图6中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。具有一组(至少一个)程序模块42的程序/实用工具40，可以存储在例如存储器28中，这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。计算机程序产品12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信，还可与一个或者多个使得用户能与该计算机程序产品12交互的设备通信，和/或与使得该计算机程序产品12能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22进行。并且，计算机程序产品12还可以通过网络适配器20与一个或者多个网络(例如局域网，广域网和/或公共网络，例如因特网)通信。如图所示，网络适配器20通过总线18与计算机程序产品12的其它模块通信。应当明白，尽管图中未示出，可以结合计算机程序产品12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、独立磁盘冗余阵列(redundantarrayofindependentdisks，简称raid)系统、磁带驱动器以及数据备份存储系统等。处理单元16通过运行存储在系统存储器28中的程序，从而执行各种功能应用以及数据处理，实现上述基于确定指标关联性的方法。为达上述目的，本发明还提出一种非临时性计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述实施例所述的确定指标关联性的方法。在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属
技术领域：
的技术人员所理解。在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(ram)，只读存储器(rom)，可擦除可编辑只读存储器(eprom或闪速存储器)，光纤装置，以及便携式光盘只读存储器(cdrom)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。本
技术领域：
的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：马云存
技术所有人：东软集团股份有限公司
我是此专利的发明人

上一篇：一种海量移动终端在线量统计方法和装置与流程
上一篇：一种用于转炉自动加水的控制器的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。