一种数据采集方法及装置的制造方法_2

文档序号:9326918阅读:来源:国知局
以下方式将所生成任务集中的其他任务集中的任务分配到其对应的从节点中:
[0056]所述其他优先级任务分配子模块,包括:任务分配单元、反馈信息接收单元和优先级确定单元;其中,
[0057]所述任务分配单元,用于根据当前执行优先级的上一优先级对应的任务集中的任务对应的从节点发送的任务执行反馈信息,将当前执行优先级对应的任务集中的任务分配到其对应的从节点中;
[0058]所述反馈信息接收单元,用于接收上述分配到任务的从节点发送的反馈信息;
[0059]所述优先级确定单元,用于确定当前执行优先级的下一执行优先级。
[0060]较佳的,所述装置还包括:运行状态检测模块和重启模块;其中,
[0061]所述运行状态检测模块,用于检测所述日志采集系统中的各个从节点的运行状态;
[0062]所述重启模块,用于当检测到各个从节点中的任一从节点处于异常运行状态之后,向该从节点发送重启指令,以使其重新处于正常运行状态。
[0063]较佳的,所述重启模块包括:任务转出子模块和任务转回子模块;其中,
[0064]所述任务转出子模块,用于当检测到各个从节点中的任一从节点处于异常运行状态之后,根据已分配至该从节点的任务的执行进度,将已分配的任务转移至其他从节点中执行;
[0065]所述任务转回子模块,用于向该从节点发送重启指令,以使其重新处于正常运行状态,并根据已转移出的任务的执行进度,将已转移出的任务转移回该从节点继续执行。
[0066]本发明实施例提供的一种数据采集方法及装置,将日志采集系统中的各从节点的配置信息添加在预设的配置文件中后,主节点通过对所获得的配置文件进行解析的方式,确定所获得的配置文件中涉及的各个从节点之间的依赖关系,根据所确定的依赖关系和所获得的配置文件中包含的各个从节点对应的任务信息,生成与所获得的配置文件相对应的任务集,按照任务集的执行优先级由高到低的顺序,将所生成的每一任务集中的任务分配到其对应的从节点中,以便由分配到任务的从节点进行数据采集。显然,本发明实施例提供的方案中,无需用户在每个从节点上进行相关配置,提高了日志采集系统前的配置效率,降低了用户的工作量,提高了工作效率。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
【附图说明】
[0067]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0068]图1为本发明实施例提供的一种数据采集方法的流程示意图;
[0069]图2为本发明实施例提供的一种日志采集系统的框架示意图;
[0070]图3为本发明实施例提供的一种确定任务集执行优先级顺序的方法的流程示意图;
[0071]图4为本发明实施例提供的另一种数据采集方法的流程示意图;
[0072]图5为本发明实施例提供的另一种数据采集方法的流程示意图;
[0073]图6为本发明实施例提供的一种数据采集装置的结构示意图。
【具体实施方式】
[0074]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0075]图1为本发明实施例提供的一种数据采集方法的流程示意图,应用于日志采集系统中的主节点;该日志采集系统具有至少I个主节点和多个从节点。
[0076]参见图2,为本发明实施例提供的一种日志采集系统的框架示意图,该示意图中仅包含I个主节点和3个从节点,下面结合图1和图2对本发明实施例提供的数据采集方法进行介绍。
[0077]上述的数据采集方法可以包括以下步骤:
[0078]步骤SlOl:获得预设的配置文件。
[0079]其中,预设的配置文件中包含所述日志采集系统中预设数量个从节点的配置信息和各个从节点对应的任务信息。
[0080]另外,预设的配置文件可以采用xml或json的格式。当然,本发明不需要对配置文件的具体格式进行限制,本领域内的技术人员需要根据实际需要选用合适的配置文件格式。
[0081 ] 需要说明的是,本领域内的技术人员只需在日志采集系统的主节点上对预设的配置文件中针对该系统中的各个从节点进行配置,而无需在该系统中的各个子节点上逐个进行配置,这样可以大大节省人力成本,降低工作人员的工作量,提高整体效率,尤其是随着采集的数据量增加而需要对采集系统进行水平扩展时,上述各项优点更加突出。
[0082]步骤S102:对所获得的配置文件进行解析,确定所获得的配置文件中涉及的各个从节点之间的依赖关系。
[0083]下面对本实施例中提及的各个从节点之间的依赖关系进行简单介绍,这里提到的依赖关系是指两个从节点之间的关联特性。
[0084]具体的,该依赖关系还可以包括:父依赖关系和子依赖关系;其中,当从节点A执行任务要依赖于从节点B执行任务的结果时,称从节点B相对于从节点A具有父依赖关系,称从节点A相对于从节点B具有子依赖关系。
[0085]如图2所示的日志采集系统中,从该图中给出的数据流向可以看出,从节点2和从节点I任务的执行需要依赖于从节点3的任务执行结果,因此,从节点3相对于从节点2或从节点I具有父依赖关系,从节点2或从节点I相对于从节点3具有子依赖关系;同样的,从节点I任务的执行还需要依赖于从节点2任务的执行结果,因此,从节点2相对于从节点I具有父依赖关系,从节点I相对于从节点2具有子依赖关系。
[0086]进一步地,可以把从节点3称为从节点2和从节点I的父关联从节点,把从节点I和从节点2称为从节点3的子关联从节点;同样的,可以把从节点2还称为从节点I的父关联从节点,把从节点I称为从节点2的子关联从节点。
[0087]需要说明的是,工作人员可以预先在预设的配置文件中添加各个从节点之间的依赖信息,例如,各个从节点中的数据流向、各个从节点的数据处理逻辑算法等,通过对该配置文件的解析能够获得该配置文件中所涉及的各个从节点之间的依赖关系。另外,工作人员还可以预先在预设的配置文件中添加各个从节点所申请的系统资源等信息,例如,内存大小、硬盘大小等等。
[0088]在本发明的一种具体实现方式中,上述的日志采集系统的每个从节点中可以包括至少一个用于执行任务的任务执行代理。
[0089]具体的,如图2所示的日志采集系统中,从节点3中包括任务执行代理3,从节点2中包括任务执行代理2和任务执行代理4,从节点I中包括任务执行代理I和任务执行代理 5。
[0090]在日志采集系统的从节点中包括任务执行代理的情况下,上述从节点的配置信息中可以包括:该从节点中所包括的任务执行代理的配置信息。
[0091]这种情况下,对所获得的配置文件进行解析,确定所获得的配置文件中涉及的各个从节点之间的依赖关系时,可以通过对所获得的配置文件进行解析,确定得到所获得的配置文件中涉及到的各个从节点中所包括的任务执行代理之间的依赖关系。
[0092]如图2所示的日志采集系统中,任务执行代理3为任务执行代理2、4、5的父依赖任务执行代理,任务执行代理2、4为任务执行代理I的父依赖任务执行代理,换言之,任务执行代理2、4、5为任务执行代理3的子依赖任务执行代理,任务执行代理I为任务执行代理2、4的子依赖任务执行代理。显然,具有依赖关系的任务执行代理在执行任务时具有先后顺序关系。
[0093]需要说明的是,可以根据解析得到的各个从节点中的各个任务执行代理之间的依赖关系生成包含该依赖关系的依赖关系图或者是依赖关系表。当然,本发明并不需要对体现该依赖关系的具体形式进行限定。
[0094]步骤S103:根据所确定的依赖关系和所获得的配置文件中包含的各个从节点对应的任务信息,生成与所获得的配置文件相对应的任务集。
[0095]其中,所述任务集中包括
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1