一种数据监控方法及系统与流程

文档序号:15143943发布日期:2018-08-10 20:13阅读:211来源:国知局
本发明涉及计算机
技术领域
:,更具体地,涉及一种数据监控方法及系统。
背景技术
::大数据是一个庞大的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征,其涉及数据创建、存储、检索和分析等。每天有大量的新增数据存储在大数据中,如果某项数据出现异常,则将影响后期数据的产生。因此,及时发现大数据中异常的数据,对整个大数据是非常重要的。hadoop和hive是目前业界广泛使用的数据存储以及查询的分布式解决方案。hive,是基于hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql(structuredquerylanguage,结构化查询语言)查询功能,可以将sql语句转换为mapreduce(映射化简)任务进行运行。其优点是学习成本低,可以通过类sql语句快速实现简单的mapreduce统计,不必开发专门的mapreduce应用,十分适合数据仓库的统计分析。hdfs(hadoop分布式文件系统)被设计成适合运行在通用硬件(commodityhardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。hdfs是一个高度容错性的系统,适合部署在廉价的机器上。hdfs能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。hdfs放宽了一部分posix(portableoperatingsysteminterface,可移植操作系统接口)标准的约束,来实现流式读取文件系统数据的目的。现有技术中hdfs中的数据监控包括对数据进行验平(即,数据量的平衡性验证,用于验证数据量处于平衡状态,属于系统数据监控方式的一种)。然而,现有技术中针对不同的监控规则均需要在后台进行程序编写来实现,但是对于大部分用户来说,并没有相关的研发背景,无法按照实际的监控需求编写程序来实现对数据的监控,且现有的监控规则并不通用,需要对不同的监控规则分别编写监控程序,整个过程需要耗费大量的人力和时间。此外,现有的数据监控方式仅仅对单一的数据进行监控,而数据往往是存在依赖关系的,对于下游的数据而言,当且仅当上游数据的监控结果为正常时,才能确保下游数据的监控结果正常。技术实现要素:本发明为了克服现有技术中的数据监控方法存在的针对不同的监控规则均需后台编写程序来实现对数据的监控,需耗费大量的人力和时间,同时并没有考虑数据之间的依赖关系,难以确保监控结果的准确性的问题,提供一种数据监控方法及系统。一方面,本发明提供一种数据监控方法,包括:s1,获取用户选择的待监控项目,根据所述待监控项目从预先存储的监控配置文件库中获取与所述待监控项目对应的监控配置文件,所述监控配置文件中至少包括监控规则和拓扑依赖关系;s2,根据所述拓扑依赖关系获取所述待监控项目中各项待监控数据的监控顺序,按照所述监控顺序并利用所述监控规则依次对各项所述待监控数据进行监控,依次获得各项所述待监控数据的监控结果;s3,按照所述拓扑依赖关系,将各项所述待监控数据的监控结果进行存储。优选地,所述步骤s1之前还包括:接收用户输入的所述待监控项目和所述待监控项目对应的监控配置信息,根据所述监控配置信息生成所述监控配置文件,并将所述监控配置文件与所述监控项目关联进行存储。优选地,所述监控配置文件中还包括项目负责人信息;相应地,所述步骤s3之后还包括:当至少一项所述待监控数据的监控结果为异常时,向所述项目负责人发送警示信息。优选地,所述监控配置文件中还包括监控周期,相应地,所述步骤s2还包括:根据所述监控周期对各项所述待监控数据进行周期性地监控。优选地,所述监控配置文件中还包括结果统计周期,相应地,所述步骤s3之后还包括:按照所述结果统计周期,将各项所述待监控数据的监控结果发送给所述项目负责人。优选地,所述步骤s3之后还包括:利用有向无环图对所述监控结果进行展示。一方面,本发明提供一种数据监控系统,包括:监控任务获取模块,用于获取用户选择的待监控项目,根据所述待监控项目从预先存储的监控配置文件库中获取与所述待监控项目对应的监控配置文件,所述监控配置文件中至少包括监控规则和拓扑依赖关系;数据监控模块,用于根据所述拓扑依赖关系获取所述待监控项目中各项待监控数据的监控顺序,按照所述监控顺序并利用所述监控规则依次对各项所述待监控数据进行监控,依次获得各项所述待监控数据的监控结果;监控结果存储模块,用于按照所述拓扑依赖关系,将各项所述待监控数据的监控结果进行存储。优选地,还包括:数据监控配置模块,用于接收用户输入的所述待监控项目和所述待监控项目对应的监控配置信息,根据所述监控配置信息生成所述监控配置文件,并将所述监控配置文件与所述监控项目关联进行存储。一方面,本发明提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行所述数据监控方法。一方面,本发明提供一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行所述数据监控方法。本发明提供的一种数据监控方法及系统,用户可以根据实际需求对待监控的数据的监控规则进行配置,无需编写程序即可实现监控规则的配置,节省了研发人力和时间,有效提升了用户体验;同时,用户可以根据实际情况配置待监控数据的拓扑依赖关系,使得系统能够根据用户配置的拓扑依赖关系对待监控数据进行有序监控,当存在数据异常时,能够准确定位异常数据的位置,同时能够对各项待监控数据的上游数据进行准确监控,进而确保监控结果的准确性。附图说明图1为本发明实施例的一种数据监控方法的整体流程示意图;图2为本发明实施例的一种数据监控系统的整体结构示意图。具体实施方式下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。图1为本发明实施例的一种数据监控方法的整体流程示意图,如图1所示,本发明提供一种数据监控方法,包括:s1,获取用户选择的待监控项目,根据所述待监控项目从预先存储的监控配置文件库中获取与所述待监控项目对应的监控配置文件,所述监控配置文件中至少包括监控规则和拓扑依赖关系;s2,根据所述拓扑依赖关系获取所述待监控项目中各项待监控数据的监控顺序,按照所述监控顺序并利用所述监控规则依次对各项所述待监控数据进行监控,依次获得各项所述待监控数据的监控结果;s3,按照所述拓扑依赖关系,将各项所述待监控数据的监控结果进行存储。具体地,在实际应用中,当用户需要对数据进行监控时,需先创建对应的监控项目,在创建监控项目时,用户需在系统中写入监控项目的名称和监控项目的相关负责人。在完成监控项目的创建后,针对创建的监控项目,用户可以根据实际需求配置监控项目相关的监控配置信息,系统根据用户配置的监控配置信息生成监控项目对应的监控配置文件,并将监控配置文件和监控项目关联存储在监控配置文件库中。其中监控配置信息至少包括:监控项目的监控规则和监控项目中各数据的拓扑依赖关系,拓扑依赖关系具体可以采用有向无环图的形式进行存储,拓扑依赖关系中清楚地表明了某一节点数据的上游节点数据。进一步地,在用户完成监控项目的监控配置文件的配置后,用户选择并向系统提交待监控的项目,系统根据用户提交的待监控的项目,从预先存储的监控配置文件库中查询与待监控项目对应的监控配置文件,由此通过监控配置文件获取待监控项目对应的监控规则和各项待监控数据的拓扑依赖关系。进一步地,由于拓扑依赖关系中将各项待监控数据进行有向连接,将各项待监控数据有向连接的顺序作为各项待监控数据的监控顺序,故而可以通过拓扑依赖关系获得各项待监控数据的监控顺序。系统再按照获得的监控顺序,并利用上述获得的对应监控规则依次对各项待监控数据进行监控,系统将判断各项待监控数据是否符合对应的监控规则,进而依次获得各项待监控数据的监控结果。进一步地,对于获得的各项待监控数据的监控结果,系统将按照拓扑依赖关系,例如可以采用有向无环图的形式,对各项待监控数据的监控结果进行存储,同时对于有向无环图中各节点的各项待监控的数据的不同监控结果可以用不同的颜色进行醒目标识,可以用绿色标识代指该节点的待监控数据的监控结果为正常,可以用红色标识代指该节点的待监控数据的监控结果为异常。由此,可以通过有向无环图清晰地体现各项待监控数据的监控结果。本发明提供的一种数据监控方法,用户可以根据实际需求对待监控的数据的监控规则进行配置,无需编写程序即可实现监控规则的配置,节省了研发人力和时间,有效提升了用户体验;同时,用户可以根据实际情况配置待监控数据的拓扑依赖关系,使得系统能够根据用户配置的拓扑依赖关系对待监控数据进行有序监控,当存在数据异常时,能够准确定位异常数据的位置,同时能够对各项待监控数据的上游数据进行准确监控,进而确保监控结果的准确性。基于上述任一实施例,提供一种数据监控方法,所述步骤s1之前还包括:接收用户输入的所述待监控项目和所述待监控项目对应的监控配置信息,根据所述监控配置信息生成所述监控配置文件,并将所述监控配置文件与所述监控项目关联进行存储。具体地,本实施例中,用户可以预先配置监控项目的监控配置信息,当用户需要对某些数据进行监控时,用户需首先针对待监控的数据创建待监控项目,在创建待监控项目时,用户需在系统中写入待监控项目的名称和待监控项目的相关负责人。在完成监控项目的创建后,针对创建的待监控项目,用户可以根据实际需求配置待监控项目相关的监控配置信息,系统根据用户配置的监控配置信息生成待监控项目对应的监控配置文件,并将监控配置文件和待监控项目关联存储在监控配置文件库中。其中监控配置信息至少包括:监控项目的监控规则和监控项目中各数据的拓扑依赖关系,拓扑依赖关系具体可以采用有向无环图的形式进行存储,拓扑依赖关系中清楚地表明了某一节点数据的上游节点数据。此外,上述监控配置信息中还包括待监控数据的数据地址和数据类型,其中系统根据数据地址能够准确查找到待监控数据,并通过对比数据类型准确定位待监控数据,进而实现对待监控数据的有效监控。对于不同时间产生的相同数据,可以将数据的产生时间作为数据地址的一部分,以有效区分不同时间产生的相同数据。本发明提供的一种数据监控方法,用户可以根据实际需求对待监控的数据的监控规则进行配置,无需编写程序即可实现监控规则的配置,节省了研发人力和时间,有效提升了用户体验。基于上述任一实施例,提供一种数据监控方法,所述监控配置文件中还包括项目负责人信息;相应地,所述步骤s3之后还包括:当至少一项所述待监控数据的监控结果为异常时,向所述项目负责人发送警示信息。具体地,用户针对待监控项目配置的监控配置文件中,还需针对待监控的项目配置相应的项目负责人信息。在此基础上,系统根据待监控项目,获取待监控项目对应的监控规则和拓扑依赖关系,根据拓扑依赖关系确定待监控项目中各项待监控数据的监控顺序,按照监控顺序并利用监控规则依次对各项待监控数据就那些监控,当待监控项目中任意一项待监控数据的监控结果为异常时,系统将向预先配置的待监控项目对应的项目负责人发送警示信息。进一步地,系统可以通过邮件或短信等形式向用户发送警示信息,同时采用有向无环图的形式向用户展示各项待监控数据的监控结果,同时通过醒目标识将监控结果为异常的数据显示出来,以便于用户能够快速定位异常数据。本发明提供的一种数据监控方法,当待监控项目中的各项待监控数据中存在监控结果为异常的数据时,系统能够及时向项目负责人发送警示信息,以便于项目负责人及时发现异常数据,以免异常数据对后期数据的影响。基于上述任一实施例,提供一种数据监控方法,所述监控配置文件中还包括监控周期,相应地,所述步骤s2还包括:根据所述监控周期对各项所述待监控数据进行周期性地监控。具体地,鉴于大部分数据的变化是周期性地,在确保对数据进行有效监控的同时,为了进一步降低系统的监控负担,本实施例中,用户还可以对待监控项目的监控周期进行配置,用户可以结合实际情况对不同的待监控项目配置不同的监控周期,监控周期可以为每天、每小时或每分钟,由此,系统可以根据监控周期对待监控项目中的各项待监控数据进行周期性地监控。本发明提供的一种数据监控方法,用户可以结合实际需求设置待监控项目的监控周期,系统根据监控周期对待监控项目中的各项待监控数据进行周期性地监控,确保对数据进行有效监控的同时,一定程度上降低了系统的监控负担,有利于提高系统的整体监控效率。基于上述任一实施例,提供一种数据监控方法,所述监控配置文件中还包括结果统计周期,相应地,所述步骤s3之后还包括:按照所述结果统计周期,将各项所述待监控数据的监控结果发送给所述项目负责人。具体地,为了便于用户掌握数据监控的结果,用户在配置监控项目的监控配置信息时,还可以给每个监控项目配置对应的结果统计周期,并将配置的结果统计周期存储在监控配置文件中。当进行实际数据监控时,系统获得用户选择的待监控项目对应的监控配置文件后,按照监控配置文件中预先配置的结果统计周期,将待监控项目中各项监控数据的监控结果发送给对应的项目负责人。由此,便于项目负责人周期性地统计各项待监控数据的监控结果,进而能够全面掌握各项待监控数据的监控结果,以便于及时发现异常数据。本发明提供的一种数据监控方法,用户可以针对待监控项目配置对应的结果统计周期,系统按照结果统计周期将待监控项目中各项待监控数据的监控结果发送给项目负责人,有利于项目负责人及时发现并定位异常数据,有效避免异常数据对后期数据的影响。基于上述任一实施例,提供一种数据监控方法,所述步骤s3之后还包括:利用有向无环图对所述监控结果进行展示。具体地,由于数据之间是存在依赖关系的,用户针对待监控项目配置的拓扑依赖关系即表明各项待监控数据之间的依赖关系,故而在对其中某一项待监控数据进行监控时,系统将根据拓扑依赖关系,将该项待监控数据对应的上游数据进行监控,进而依次完成对各项待监控数据的监控,并按照拓扑依赖关系,将各项待监控数据的结果进行存储,并按照用户预先配置的结果统计周期,将各项待监控数据的监控结果发送给用户,并按照拓扑依赖关系将各项待监控数据的监控结果以有向无环图的形式进行展示,便于用户清楚定位异常数据的位置,有效提升了用户体验。本发明提供的一种数据监控方法,系统根据用户预先配置的拓扑依赖关系,利用有向无环图对监控结果进行展示,便于用户及时准确地定位异常数据的位置,并能够有效确保监控结果的准确性,进一步提升了用户体验。图2为本发明实施例的一种数据监控系统的整体结构示意图,如图2所示,本发明提供一种数据监控系统,包括:监控任务获取模块1,用于获取用户选择的待监控项目,根据所述待监控项目从预先存储的监控配置文件库中获取与所述待监控项目对应的监控配置文件,所述监控配置文件中至少包括监控规则和拓扑依赖关系;数据监控模块2,用于根据所述拓扑依赖关系获取所述待监控项目中各项待监控数据的监控顺序,按照所述监控顺序并利用所述监控规则依次对各项所述待监控数据进行监控,依次获得各项所述待监控数据的监控结果;监控结果存储模块3,用于按照所述拓扑依赖关系,将各项所述待监控数据的监控结果进行存储。具体地,在用户完成监控项目的监控配置文件的配置后,用户选择并向系统提交待监控的项目,监控任务获取模块1根据用户提交的待监控的项目,从预先存储的监控配置文件库中查询与待监控项目对应的监控配置文件,监控配置文件预先存储了用户配置的监控配置信息,包括监控规则和拓扑依赖关系。由此,监控任务获取模块1能够通过监控配置文件获取待监控项目对应的监控规则和各项待监控数据的拓扑依赖关系。进一步地,由于拓扑依赖关系中将各项待监控数据进行有向连接,由此,数据监控模块2将各项待监控数据有向连接的顺序作为各项待监控数据的监控顺序,故而可以通过拓扑依赖关系获得各项待监控数据的监控顺序。数据监控模块2再按照获得的监控顺序,并利用上述获得的对应监控规则依次对各项待监控数据进行监控,数据监控模块2将判断各项待监控数据是否符合对应的监控规则,进而依次获得各项待监控数据的监控结果。进一步地,对于获得的各项待监控数据的监控结果,监控结果存储模块3将按照拓扑依赖关系,例如可以采用有向无环图的形式,对各项待监控数据的监控结果进行存储,同时对于有向无环图中各节点的各项待监控的数据的不同监控结果可以用不同的颜色进行醒目标识,可以用绿色标识代指该节点的待监控数据的监控结果为正常,可以用红色标识代指该节点的待监控数据的监控结果为异常。由此,可以通过有向无环图清晰地体现各项待监控数据的监控结果。本发明提供的一种数据监控系统,用户可以根据实际需求对待监控的数据的监控规则进行配置,无需编写程序即可实现监控规则的配置,节省了研发人力和时间,有效提升了用户体验;同时,用户可以根据实际情况配置待监控数据的拓扑依赖关系,使得系统能够根据用户配置的拓扑依赖关系对待监控数据进行有序监控,当存在数据异常时,能够准确定位异常数据的位置,同时能够对各项待监控数据的上游数据进行准确监控,进而确保监控结果的准确性。基于上述任一实施例,提供一种数据监控系统,还包括:数据监控配置模块,用于接收用户输入的所述待监控项目和所述待监控项目对应的监控配置信息,根据所述监控配置信息生成所述监控配置文件,并将所述监控配置文件与所述监控项目关联进行存储。具体地,本实施例中,用户可以预先配置监控项目的监控配置信息,当用户需要对某些数据进行监控时,用户需首先利用数据监控配置模块针对待监控的数据创建待监控项目,在创建待监控项目时,用户需在数据监控配置模块中写入待监控项目的名称和待监控项目的相关负责人。在完成监控项目的创建后,针对创建的待监控项目,用户可以根据实际需求利用数据监控配置模块配置待监控项目相关的监控配置信息,数据监控配置模块根据用户配置的监控配置信息生成待监控项目对应的监控配置文件,并将监控配置文件和待监控项目关联存储在监控配置文件库中。其中监控配置信息至少包括:监控项目的监控规则和监控项目中各数据的拓扑依赖关系,拓扑依赖关系具体可以采用有向无环图的形式进行存储,拓扑依赖关系中清楚地表明了某一节点数据的上游节点数据。此外,上述监控配置信息中还包括待监控数据的数据地址和数据类型,其中数据监控模块根据数据地址能够准确查找到待监控数据,并通过对比数据类型准确定位待监控数据,进而实现对待监控数据的有效监控。对于不同时间产生的相同数据,可以将数据的产生时间作为数据地址的一部分,以有效区分不同时间产生的相同数据。本发明提供的一种数据监控系统,用户可以根据实际需求对待监控的数据的监控规则进行配置,无需编写程序即可实现监控规则的配置,节省了研发人力和时间,有效提升了用户体验。基于上述任一实施例,提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:获取用户选择的待监控项目,根据待监控项目从预先存储的监控配置文件库中获取与待监控项目对应的监控配置文件,监控配置文件中至少包括监控规则和拓扑依赖关系;根据拓扑依赖关系获取待监控项目中各项待监控数据的监控顺序,按照监控顺序并利用监控规则依次对各项待监控数据进行监控,依次获得各项待监控数据的监控结果;按照拓扑依赖关系,将各项待监控数据的监控结果进行存储。基于上述任一实施例,提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:获取用户选择的待监控项目,根据待监控项目从预先存储的监控配置文件库中获取与待监控项目对应的监控配置文件,监控配置文件中至少包括监控规则和拓扑依赖关系;根据拓扑依赖关系获取待监控项目中各项待监控数据的监控顺序,按照监控顺序并利用监控规则依次对各项待监控数据进行监控,依次获得各项待监控数据的监控结果;按照拓扑依赖关系,将各项待监控数据的监控结果进行存储。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。综合上述,本发明提供的一种数据监控方法及系统,用户可以根据实际需求对待监控的数据的监控规则进行配置,无需编写程序即可实现监控规则的配置,节省了研发人力和时间,有效提升了用户体验;同时,用户可以根据实际情况配置待监控数据的拓扑依赖关系,使得系统能够根据用户配置的拓扑依赖关系对待监控数据进行有序监控,当存在数据异常时,能够准确定位异常数据的位置,同时能够对各项待监控数据的上游数据进行准确监控,进而确保监控结果的准确性。最后,本申请的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1