基于代理服务的Hadoop生态组件调度服务实现方法及系统的制作方法_2

文档序号:9436004阅读:来源:国知局
1、服务监控单元232和日志管理单元233 ;任务管理单元231通过触发器设置作业定时运行规则,并控制作业的运行时间进行定时任务调度,实现定时完成定制任务,可以指定时间点,也可以设置成每小时、每天等动态时间;月艮务监控单元232对服务运行状态、调用频率、数据流量进行实时监控并褚地检测各种异常信息和业务系统数据处理情况,并实时地检测到各种异常信息和诸多业务系统数据处理情况;日志管理单元233用于服务处理过程的日志记录与监控,其能够查看服务处理过程的跟踪日志。实现了日志分类、查询以及日志优先级的设置。
[0013]当相关业务系统需要获取数据或写入数据时,业务系统将调用RPC客户端程序中查询或写入功能。由RPC客户端调用进程发送一个有进程参数的调用信息到RPC服务器端进程,然后等待服务器端的应答信息。在RPC服务器端,进程保持睡眠状态直到调用信息到达为止。当一个调用信息到达,服务器获得进程参数,计算结果,发送答复信息,然后等待下一个调用信息,RPC客户端调用进程接收答复信息,获得进程结果,然后调用执行继续进行。RPC服务器端将调用接口服务中所注册的相关数据服务,并进行消息格式转换、内容校验等任务。消息格式转换中包括消息格式间的映射转换、填充过滤等处理。校验规则包括重复性检查、唯一性检查、自定义校验规则等内容。然后接口服务将按照调度服务中所设置的任务管理队列进行顺序或并行任务执行。在此过程中,服务调用的全部过程将被监控服务和日志跟踪服务所记录。服务调用将调用已封装好的各个Hadoop技术组件的处理器进行数据交互。调度服务从架构设计上支持高并发、大批量的消息数据并行传输,结合相应的技术组件处理器,实现高并发、高可靠的消息传输,帮助用户构建高效可靠的大数据基础环境。在调度服务提供了对传输过程中的消息进行加密、切片、压缩传输的能力,保证了消息传输的可靠性和安全性。
[0014]下面结合附图2,具体描述一下本发明系统中的代理服务系统的工作原理:RPC调用时,首先监听器用户监听由RPC客户端发来的请求,读取队列通过读取进程实现阻塞等待。在建立RPC服务以后,读取队列根据传输前所提供的目的地址及RPC上层应用程序号转至相应的RPC应用程序服务端,且此时的客户端处于等待状态,直至收到应答或Time Out超时信号。当服务器端获得请求消息,则会根据注册RPC时告诉RPC系统的例程入口地址,执行相应的操作,并将结果返回至PRC客户端。当一次RPC调用结束后,相应线程发送相应的信号,客户端程序才会继续运行。在这个过程中,一个RPC过程是有三个要素来唯一确定的:程序号、版本号和过程号。程序号是用来区别一组相关的并且具有唯一过程好的远程过程。一个程序可以有一个或几个不同的版本,而每个版本的程序都包含一系列能被远程调用的过程,通过版本的引入,使得不同版本下的RPC能同时提供服务。每个版本都包含有许多可供远程调用的过程,每个过程则有其唯一标示的过程号。通过这种调用方式可以充分利用非共享内存的多处理器环境,这样可以简便地将代理应用分布在多台服务器上,代理应用就形成了一个分布式处理与响应环境,提高系统资源的利用率。同时,可以最大程度的减少由于原有业务系统的异构性所带来的影响。
[0015]采用本发明后,业务系统将通过RPC控制端模块将业务数据发送接口服务模块,所传输的的数据将通过接口服务的格式转化、校验后,发送给调度服务。传输的数据内容例如结构化数据、非结构化数据、半结构化数据将通过处理器模块保存入Hadoop中的HDFS、HBase 或 Hive 中。调度服务支持 HTTP (S)、SOAP、JMS、FTP、FILE、SOCKET、MQ、SMTP、POP 等协议。用户可通过页面端的可视化拖拽设计工具进行服务设计,并通过图形化的方式展现整个消息路由的拓扑结构,并且提供右键弹出菜单功能完成路由节点的属性配置。在消息路由拓扑设计完成之后,提供消息推送测试功能,可以对整个路由结构做测通测试,并且给出测试结果,对于故障节点给出相应信息,便于快速问题查找、快速问题定位。调度服务实现了业务系统与Hadoop技术组件之间的关注点的隔离,通过提供代理服务与服务的动态、静态调用降低业务系统与Hadoop技术组件的耦合程度。代理服务作为可重用的服务定义,屏蔽对后端Hadoop接口服务的直接访问,降低了后端Hadoop平台的切换对业务系统的影响程度,并提升了整体大数据体系的适应性和可扩展性。在基于代理的Hadoop生态组件调度模式中,代理服务中对服务的封装通过代理服务消息流来实现,代理服务消息流也是一种交换服务流,由服务调度引擎统一调度执行,解决了业务系统与Hadoop技术组件之间数据交互的管理问题。
【主权项】
1.基于代理服务的Hadoop生态组件调度服务实现方法,其特征在于:其在交通管理大数据平台和/或其它交管业务系统、与Hadoop技术组件之间设置代理服务系统,所述交通管理大数据平台和/或其它交管业务系统通过所述代理服务系统的RPC控制端与接口服务模块进行业务数据的交互传输并由所述RPC控制端实现服务进程的调用及处理,所述接口服务模块对所述业务数据进行格式化、校验后与调度服务模块进行数据的交互传输,所述调度服务模块对业务数据进行调度管理及监控,代理服务系统的服务器模块对所述Hadoop技术组件接口数据进行封装以实现所述代理服务系统与Hadoop技术组件之间数据的交互。2.基于代理服务的Hadoop生态组件调度服务系统,其包括交通管理大数据平台和/或其它交管业务系统、以及Hadoop技术组件,其特征在于:所述交通管理大数据平台和/或其它交管业务系统、与所述Hadoop技术组件之间设置有代理服务系统,所述代理服务系统包括 RPC控制端,用于与所述交通管理大数据平台和/或其他交管业务系统直接对接,并进行进程的调用及程序处理; 接口服务模块,用于对数据进行消息格式转换、校验及权限控制; 调度服务模块,用于任务管理、任务监控及日志管理; 以及处理器模块,用于对所述Hadoop技术组件接口封装并与所述调节服务模块进行数据的交互。3.根据权利要求2所述的基于代理服务的Hadoop生态组件调度服务系统,其特征在于:所述RPC控制端包括RPC客户端和RPC服务器端,所述RPC客户端与所述交通管理大数据平台和/或其它交管业务系统直接对接,所述RPC客户端与所述RPC服务器端之间数据双向传送对接。4.根据权利要求2所述的基于代理服务的Hadoop生态组件调度服务系统,其特征在于:所述接口服务模块包括消息格式转换单元、内容校验单元和权限控制单元,所述消息格式转换单元用于将数据格式进行转换,所述内容校验单元通过创建数据检验规则自动为核心系统或外围系统提供缺失、逻辑等各种数据检验预警告警,用于提示各运行板块业务与管理人员实时进行数据处置,所述权限控制用于对服务的访问进行安全控制。5.根据权利要求2所述的基于代理服务的Hadoop生态组件调度服务系统,其特征在于:所述调度服务模块包括任务管理单元、服务监控单元和日志管理单元;所述任务管理单元通过触发器设置作业定时运行规则,并控制作业的运行时间进行定时任务调度,实现定时完成定制任务;所述服务监控单元对服务运行状态、调用频率、数据流量进行实时监控并褚地检测各种异常信息和业务系统数据处理情况;所述日志管理单元用于服务处理过程的日志记录与监控。
【专利摘要】本发明提供了基于代理服务的Hadoop生态组件调度服务实现方法及系统,其解决现有单一调用Hadoop应用组件无法进行有效的管理与监控的问题以及无法适应交通管理各个业务系统的异构性的问题;其在交通管理大数据平台和/或其它交管业务系统与Hadoop技术组件之间设置代理服务系统,交通管理大数据平台和/或其它交管业务系统通过代理服务系统的RPC控制端与接口服务模块进行业务数据的交互传输并由RPC控制端实现服务进程的调用及处理,接口服务模块对业务数据进行格式化、校验后与调度服务模块进行数据的交互传输,调度服务模块对业务数据进行调度管理及监控,代理服务系统的服务器模块对Hadoop技术组件接口数据进行封装以实现代理服务系统与Hadoop技术组件之间数据的交互。
【IPC分类】H04L29/08, H04L29/06
【公开号】CN105187375
【申请号】CN201510332314
【发明人】邵志骅, 吴晓东, 许卉莹, 崔林山
【申请人】公安部交通管理科学研究所
【公开日】2015年12月23日
【申请日】2015年6月16日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1