一种大数据管理平台的作业任务管理方法

文档序号:6640580阅读:502来源:国知局
一种大数据管理平台的作业任务管理方法
【专利摘要】本发明公开一种大数据管理平台的作业任务管理方法,属于数据管理领域,具体步骤为:①建立大数据管理平台的管理系统,包括Web端统一在线作业任务管理模块,Server端应用程序调度及状态维护模块,Agent端应用程序执行模块;②利用Web端统一在线作业任务管理模块,用户上传作业任务的应用程序,并录入其基本信息;③通过任务API接口进入Server端应用程序调度及状态维护模块,对状态维护命令做统一维护,并发送作业任务状态通知信息;④Agent端应用程序执行模块根据用户提交的配置,执行应用程序,并设定应用程序的执行日志输出,本发明实现在线提交应用程序、自定义配置执行信息和状态变化通知信息,可定制任务执行计划,从而提高大数据管理平台的易用性。
【专利说明】一种大数据管理平台的作业任务管理方法

【技术领域】
[0001]本发明公开一种作业任务管理方法,属于数据管理领域,具体地说是一种大数据管理平台的作业任务管理方法。

【背景技术】
[0002]当前,互联网和移动互联网迅速发展,同时大数据和云计算时代的到来,加速了海量数据处理技术的发展。随之而来,大数据管理平台技术已日趋成熟,开源社区和一些大数据服务提供商陆续推出基于Hadoop的大数据管理平台。然而,在使用大数据管理平台执行应用程序的作业任务时,表现的并不友好,各个技术组件在同一平台中并没有统一的作业任务管理中心,而只是各自提供独立的只可在线查看的服务。导致在大数据管理平台在线提交任务,以及作业状态变化时主动发送通知信息非常不便。本发明提供一种大数据管理平台的作业任务管理方法,通过Web端统一在线作业任务管理模块,Server端应用程序调度及状态维护模块,Agent端应用程序执行模块的相互作用实现在线提交应用程序、自定义配置执行信息和状态变化通知信息,可定制任务执行计划,从而提高大数据管理平台的易用性,同时方便了管理员对集群运行任务的统一管理并且应用人员对其发起的任务可进行实时状态跟踪,可以指导大数据管理平台中的作业任务系统的开发,具有较高的参考价值和实际意义。


【发明内容】

[0003]本发明针对大数据管理平台没有统一的作业任务管理中心,而只是各自提供独立的只可在线查看的服务,导致在线提交任务,以及作业状态变化时主动发送通知信息非常不便的问题,提供一种大数据管理平台的作业任务管理方法,实现在线提交应用程序、自定义配置执行信息和状态变化通知信息,可定制任务执行计划,从而提高大数据管理平台的易用性,同时方便了管理员对集群运行任务的统一管理并且应用人员对其发起的任务可进行实时状态跟踪。
[0004]本发明提出的具体方案是:
一种大数据管理平台的的作业任务管理方法,具体步骤为:
①建立大数据管理平台的管理系统,主要包括Web端统一在线作业任务管理模块,Server端应用程序调度及状态维护模块,Agent端应用程序执行模块;
②利用Web端统一在线作业任务管理模块,用户登录管理平台,提供作业任务的应用程序,上传至集群中,上传时对应用程序的类型、程序大小和命名规范性做校验,不符合规则的拒绝提交;用户进行作业任务基本信息的配置项录入,对用户录入的任务配置项,进行合法性和规范校验,不符合规范的信息拒绝提交;用户对接收状态通知的配置项进行录入;
③Web端统一在线作业任务管理模块接收的用户上传的作业任务信息通过任务API接口进入Server端应用程序调度及状态维护模块,应用程序调度及状态维护模块维护应用程序执行状态,Server端通过Agent接口接收Agent端处理的各个流程阶段状态发起的维护命令,对状态维护命令做统一维护,并负责作业任务状态通知信息的发送;
④Agent端应用程序执行模块根据用户提交的配置,筛选出当前Agent节点需要执行的应用程序,设定执行计划,并设定应用程序的执行日志输出,将日志内容分类规整,做到可通过前段web端下载查看具体的内容。
[0005]所述的步骤②中统一在线作业任务管理模块还提供指定条件的检索功能,对非管理员用户,只能查询当前用户提交的作业任务,管理员角色账号可查询全部作业任务信息,可点击下载或查看详细报告链接,提供作业任务执行的详细内容。
[0006]所述的步骤②中作业任务基本信息的配置项包括程序类型、执行引擎、任务名称、执行用户、计划执行时间、执行程序参数、是否接收状态通知、优先级、任务描述。
[0007]所述的步骤②中接收状态通知的配置项包括接收方式、状态定制、邮箱地址、手机号、免打扰时间。
[0008]所述的步骤④中应用程序执行模块还负责对已经执行完成,且设置了计划任务的记录,做清理处理,避免出现冗余过期的任务记录。
[0009]一种大数据管理平台的的作业任务管理系统,应用于一种大数据管理平台的的作业任务管理方法,包括:
Web端统一在线作业任务管理模块,负责根据用户权限在线提交配置作业任务应用程序、配置状态接收通知信息和制定执行作业任务计划功能;
Server端应用程序调度及状态维护模块,负责对作业任务应用程序执行时的调度以及作业任务状态的集中维护功能;
Agent端应用程序执行模块,负责配置定时计划任务,根据用户自定义的作业任务执行计划和Server端的调度,对当前Agent节点需要执行的作业列表和执行的具体时间做出响应,启动执行,并且对应用程序的执行日志的收集。
[0010]本发明的有益之处是:本发明的大数据管理平台中Web端统一在线作业任务管理模块,具备根据用户权限在线提交配置作业任务应用程序、配置状态接收通知信息和制定执行作业任务计划功能;server端应用程序调度及状态维护模块,具备对作业任务应用程序执行时的调度以及作业任务状态的集中维护功能;Agent端应用程序执行模块,包括发起应用程序的执行和执行日志的收集功能;通过三个模块在大数据管理平台的互相作用,实现在线提交大数据处理应用程序、自定义配置执行信息和管理状态变化通知信息,同时定制任务执行计划的目的,从而提高大数据管理平台的易用性,方便管理员对集群运行任务的统一管理并且应用人员对其发起的任务可进行实时状态跟踪。

【专利附图】

【附图说明】
[0011]图1是大数据管理平台的体系结构示意图;
图2是大数据管理平台的作业任务管理系统功能列表示意图。

【具体实施方式】
[0012]结合附图对本发明做进一步说明。
[0013]本发明的大数据管理平台下的作业任务管理系统,主要从Web端统一在线作业任务管理模块、Server端应用程序调度及状态维护模块、Agent端应用程序执行模块这三个模块进行开发实施,参见附图1。三个模块的开发实施,不局限于使用某一种具体的开发编程语言或算法。
[0014]Web端统一在线作业任务管理模块主要负责:
作业任务应用程序提交:
用户登录管理平台,提供任务管理入口,可选择本地的已开发调试完成的应用程序,上传至集群中。在上传时,对应用程序的类型、程序大小和命名规范性做校验,不符合规则的拒绝提交。
[0015]作业任务配置:
作业任务配置,基于提交应用程序操作,在作业任务提交过程中,进行作业任务基本信息的配置录入,其中配置项包括但不局限于:程序类型,比如可以是class、jar、sh、py ;执行引擎,如Java、Scala、Perl、Hive、HBase> Python ;还有任务名称、执行用户、计划执行时间、执行程序参数、是否接收状态通知、优先级、任务描述。
[0016]对用户录入的任务配置项,进行合法性和规范校验,不符合规范的拒绝信息提交。
[0017]状态通知接收配置:
状态通知接收配置,基于作业任务配置操作进行配置,当用户提交作业任务时,配置了接收状态通知,则需要对通知接收配置项进行录入,包括但不局限于:接收方式,比如接收邮件、短信等方式;状态定制,包括等待执行、执行中、异常退出、被主动终止、已完成;还有邮箱地址、手机号、免打扰时间等。
[0018]作业任务基本信息查询:
用户可在任务管理模块中,进行作业任务执行信息的检索,提供指定条件的检索功能,对非管理员用户,只能查询当前用户提交的作业任务,管理员角色账号可查询全部作业任务?目息O
[0019]作业任务基本信息项目可包括:作业ID、作业名称、应用程序名、执行程序参数、应用程序类型、执行引擎、执行应用程序节点、进程ID、当前状态、执行用户、计划执行时间、提交用户、提交时间、开始时间、结束时间、优先级、是否接收通知、手机号、邮箱、接收方式、接收通知的状态、通知免打扰时间。
[0020]作业任务执行详细报告:
作业任务执行详细报告,基于作业任务信息查询操作来呈现,当在查询出的任务基本信息后,可点击下载或查看详细报告链接,提供作业任务执行的详细内容。同时提供执行输出的日志文件以及用户自定义的日志地址,可供下载查看。此报告,可提供作业任务对集群资源的使用情况。
[0021]Server端应用程序调度及状态维护负责:
维护应用程序执行状态:
维护应用程序执行状态,Server端接收Agent端处理的各个流程阶段状态发起的维护命令,包括:等待执行、执行中、异常退出、被主动终止、已完成。对状态维护命令做统一维护。
[0022]作业任务状态跟踪:
作业任务状态跟踪,属整个系统模块中作业任务的状态控制中心,在Server端进行开发,为Web和Agent提供作业任务的状态相关接口。
[0023]发送作业任务状态通知信息:
发送作业任务状态通知信息,根据用户前端配置的通知属性和Server端的任务状态跟踪,执行通知发送或不发送操作。
[0024]Agent端应用程序执行模块配置定时计划任务:
配置定时计划任务,此功能在Agent客户端进行开发,根据用户提交的配置,筛选出当前Agent节点需要执行的应用程序,并设定执行计划。相应的,对执行完成的,已经设置了计划任务的记录,做清理处理,避免出现冗余的过期的任务记录。
[0025]执行作业任务应用程序:
根据在配置的计划任务,在Agent端具体指定时间发起应用程序的执行,并设定应用程序的执行日志输出。
[0026]日志收集:
Agent端根据用户录入的执行配置发起执行后,对于程序的正常执行,异常退出,主动终止以及用户在应用程序中编写的终端输出内容等产生的数据日志信息,做出整理,将日志内容分类规整,做到可通过前段web页面下载查看具体的内容。
【权利要求】
1.一种大数据管理平台的作业任务管理方法,其特征是具体步骤为: ①建立大数据管理平台的管理系统,主要包括Web端统一在线作业任务管理模块,Server端应用程序调度及状态维护模块,Agent端应用程序执行模块; ②利用Web端统一在线作业任务管理模块,用户登录管理平台,提供作业任务的应用程序,上传至集群中,上传时对应用程序的类型、程序大小和命名规范性做校验,不符合规则的拒绝提交;用户进行作业任务基本信息的配置项录入,对用户录入的任务配置项,进行合法性和规范校验,不符合规范的信息拒绝提交;用户对接收状态通知的配置项进行录入; ③Web端统一在线作业任务管理模块接收的用户上传的作业任务信息通过任务API接口进入Server端应用程序调度及状态维护模块,应用程序调度及状态维护模块维护应用程序执行状态,Server端通过Agent接口接收Agent端处理的各个流程阶段状态发起的维护命令,对状态维护命令做统一维护,并负责作业任务状态通知信息的发送; ④Agent端应用程序执行模块根据用户提交的配置,筛选出当前Agent节点需要执行的应用程序,设定执行计划,并设定应用程序的执行日志输出,将日志内容分类规整,做到可通过前段web端下载查看具体的内容。
2.根据权利要求1所述的一种大数据管理平台的的作业任务管理方法,其特征是所述的步骤②中统一在线作业任务管理模块还提供指定条件的检索功能,对非管理员用户,只能查询当前用户提交的作业任务,管理员角色账号可查询全部作业任务信息,可点击下载或查看详细报告链接,提供作业任务执行的详细内容。
3.根据权利要求2所述的一种大数据管理平台的的作业任务管理方法,其特征是所述的步骤②中作业任务基本信息的配置项包括程序类型、执行引擎、任务名称、执行用户、计划执行时间、执行程序参数、是否接收状态通知、优先级、任务描述。
4.根据权利要求2或3所述的一种大数据管理平台的的作业任务管理方法,其特征是所述的步骤②中接收状态通知的配置项包括接收方式、状态定制、邮箱地址、手机号、免打扰时间。
5.根据权利要求4所述的一种大数据管理平台的的作业任务管理方法,其特征是步骤④中应用程序执行模块还负责对已经执行完成,且设置了计划任务的记录,做清理处理,避免出现冗余过期的任务记录。
6.一种大数据管理平台的的作业任务管理系统,应用于一种大数据管理平台的的作业任务管理方法,其特征是包括: Web端统一在线作业任务管理模块,负责根据用户权限在线提交配置作业任务应用程序、配置状态接收通知信息和制定执行作业任务计划功能; Server端应用程序调度及状态维护模块,负责对作业任务应用程序执行时的调度以及作业任务状态的集中维护功能; Agent端应用程序执行模块,负责配置定时计划任务,根据用户自定义的作业任务执行计划和Server端的调度,对当前Agent节点需要执行的作业列表和执行的具体时间做出响应,启动执行,并且对应用程序的执行日志的收集。
【文档编号】G06F17/30GK104462579SQ201410839313
【公开日】2015年3月25日 申请日期:2014年12月30日 优先权日:2014年12月30日
【发明者】付兴旺, 韦鹏, 吴楠 申请人:浪潮电子信息产业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1