一种管道式数据处理方法、设备以及存储介质与流程

文档序号:20699061发布日期:2020-05-12 15:24阅读:149来源:国知局
一种管道式数据处理方法、设备以及存储介质与流程
本发明涉及数据处理领域,具体涉及一种管道式数据处理方法、设备以及存储介质。
背景技术
:在大数据、云计算技术飞速发展的今天,为打破信息孤岛,更多来源的数据汇聚到统一的展现系统用于分析决策,因为这些数据来自不同系统,通常情况下针对不同来源的数据编写一个处理程序用于规范化这些数据是个不错的选择,但这只适用于一成不变的系统,在信息技术飞速发展的今天,新的需求被不断提出,一成不变的数据规范化程序不得不面对频繁的修改,越来越多、越来越复杂的数据处理逻辑被增加到程序中,使得程序难以维护;伴随着数据处理逻辑的增加,程序开始处理性能上的问题,但要找到性能问题出现在哪个处理中并不容易;当数据在处理过程中出现错误时,也无法得知执行这个数据处理逻辑出现问题导致了错误。技术实现要素:有鉴于此,为了克服上述问题的至少一个方面,本发明实施例的提出一种管道式数据处理方法,包括步骤:创建管道节以及管道节描述文件;获取待处理数据;根据所述待处理数据确定对应的所述管道节描述文件;根据所述管道节描述文件确定处理所述待处理数据的若干个管道节;利用所述若干个管道节处理所述待处理数据。在一些实施例中,利用所述若干个管道节处理所述待处理数据,进一步包括:根据所述管道节描述文件预设的管道节跳转规则确定处理所述待处理数据的所述若干个管道节的处理顺序;或,根据所述管道节描述文件确定处理所述待处理数据的第一个管道节并根据所述第一个管道节和其余的所述管道节默认的跳转规则确定处理所述待处理数据的所述若干个管道节的处理顺序。在一些实施例中,还包括:在每一个所述管道节的出入口设置跟踪参数,并根据所述跟踪参数进行监控;响应于其中一个所述管道节异常,调用默认的异常处理节完结处理流程。在一些实施例中,利用所述若干个管道节处理所述待处理数据,进一步包括:构造并初始化管道上下文;利用所述管道上下文记录每一个所述管道节在处理数据时产生的参数信息。在一些实施例中,构造并初始化管道上下文,进一步包括:生成唯一标识符;利用所述唯一标识符标识利用所述若干个管道节对所述待处理数据的处理流程。基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种计算机设备,包括:至少一个处理器;以及存储器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时执行以下步骤:创建管道节以及管道节描述文件;获取待处理数据;根据所述待处理数据确定对应的所述管道节描述文件;根据所述管道节描述文件确定处理所述待处理数据的若干个管道节;利用所述若干个管道节处理所述待处理数据。在一些实施例中,利用所述若干个管道节处理所述待处理数据,进一步包括:根据所述管道节描述文件预设的管道节跳转规则确定处理所述待处理数据的所述若干个管道节的处理顺序;或,根据所述管道节描述文件确定处理所述待处理数据的第一个管道节并根据所述第一个管道节和其余的所述管道节默认的跳转规则确定处理所述待处理数据的所述若干个管道节的处理顺序。在一些实施例中,步骤还包括:在每一个所述管道节的出入口设置跟踪参数,并根据所述跟踪参数进行监控;响应于其中一个所述管道节异常,调用默认的异常处理节完结处理流程。在一些实施例中,利用所述若干个管道节处理所述待处理数据,进一步包括:构造并初始化管道上下文以及生成唯一标识符;利用所述管道上下文记录每一个所述管道节在处理数据时产生的参数信息,并利用所述唯一标识符标识利用所述若干个管道节对所述待处理数据的处理流程。基于同一发明构思,根据本发明的另一个方面,本发明的实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时执行如上所述的任一种管道式数据处理方法的步骤。本发明具有以下有益技术效果之一:本发明提出的方法通过管道节描述文件描述了管道的构成、处理流转规则,解决了数据处理程序难以维护等问题。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。图1为本发明的实施例提供的管道式数据处理方法的流程示意图;图2为本发明的实施例提供的管道式数据处理方法的流程框图;图3为本发明的实施例提供的计算机设备的结构示意图;图4为本发明的实施例提供的计算机可读存储介质的结构示意图。具体实施方式为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。根据本发明的一个方面,本发明的实施例提出一种管道式数据处理方法,如图1所示,其可以包括步骤:s1,创建管道节以及管道节描述文件;s2,获取待处理数据;s3,根据所述待处理数据确定对应的所述管道节描述文件;s4,根据所述管道节描述文件确定处理所述待处理数据的若干个管道节;s5,利用所述若干个管道节处理所述待处理数据。本发明提出的方法通过管道节描述文件描述了管道的构成、处理流转规则,解决了数据处理程序难以维护等问题。在一些实施例中,在步骤s1创建管道节以及管道节描述文件中,可以通过编程界面实现,根据编程界面的定义,编写用于处理数据的xml管道节描述文件,处理数据逻辑需要视具体情况切分到不同的管道节之中,并为需要跳转的管道节设置跳转规则。编程界面约定了与每个管道节对应的控制器如何获得取得管道节,如何使用管道节,如何获得管道节的处理结果,还约定了管道节描述文件如何表达管道节,如何表达管道节执行结果如何处理。这个编程界面需要根据实际情况进行约定,例如可以计划通过java语言实现数据处理程序,即可将编程界面规划为:通过jar包承兑数据处理程序的物理形式,通过class类完全名称(包含所在包名)定位管道节,通过反射的方式加载管道节。使用xml的节点描述管道节,为每个管道节增加id、name属性,增加处理程序文件所在jar包,管道节程序所在类等属性,为每个管道节增加处理结果的跳转规则,指定跳转到管道节及跳转条件。这样,基于以上编程界面的定义,控制器和描述文件可以和谐的动作,共同完成数据处理任务。例如,根据具体业务要求,对编程界面进行约定,并根据约定编写管道节描述文件,如下表所示。而且编程界面还约定了管道节的程序的统一方法签名,根据业务处理需求完成管道节描述文件中定义中的所有管道节程序,程序包文件名与类名与约定致。序号名称字段名称数据类型长度1内码idvarchar(36)362交易码transcodevarchar(256)2563管道pipelinetext4签名signvarchar(2048)2,048在一些实施例中,可以在数据库中增加管道表,用于存储管道节描述文件内容以及与业务的对应关系,其中管道字段用于存储xml管道节描述文件内容,交易码字段用于识别数据处理类型,控制器在执行管道逻辑前先对管道节描述文件内容与签名的一致性进行校验,保障系统在运行过程中管道节描述文件内容不被恶意修改,导致数据处理出现不可预知的错误。在一些实施例中,在实现所述步骤s1中的管道节描述文件时,在管道节描述文件配置到控制程序之前,应增加一个循环检查,避免因跳转规则设置错误导致控制器出现无限循环的问题;更优的,因为某些跳转规则无法在设计时预先检测,可考虑在控制器增加循环节执行次数计数器,并设置执行次数阈值,当执行次数达到阈值时退出执行,有效避免无限循环引发的cpu满载、程序崩溃问题。需要说明的是,在本发明的实施例中,通过使用基于xml的标记语言描述数据处理过程,数据处理过程被抽象为管道,管道由多个管道节组成,这个管道就像一台净水机,每个管道节就像净水机中的过滤膜,每个管道节对数据的处理就像过滤膜完成目标颗粒的过滤一样。在一些实施例中,为了实现管道的级联及组合使用,实现编程界面中管道节定义的程序同时实现控制器定义,在控制器加载管道节后,可以将管道节转换为控制器,这样可以将控制权转交,实现了控制器的管道节将启动另一条崭新的管道,通过这种转换操作可完成管道的转调、级联和组合。在一些实施例中,如图2所示,在步骤s3根据所述待处理数据确定对应的所述管道节描述文件中,可以通过待处理数据中的交易码获取对应的管道节描述文件。这样,在获取到管道节描述文件后即可确定处理待处理数据的若干个管道节,再利用该若干个管理节处理待处理数据。在一些实施例中,在步骤s5,利用所述若干个管道节处理所述待处理数据中,可以进一步包括;根据所述管道节描述文件预设的管道节跳转规则确定处理所述待处理数据的所述若干个管道节的处理顺序;或,根据所述管道节描述文件确定处理所述待处理数据的第一个管道节并根据所述第一个管道节和其余的所述管道节默认的跳转规则确定处理所述待处理数据的所述若干个管道节的处理顺序。具体的,根据管道节描述文件逐一加载管道节执行程序,每个管道节处理完成后,根据管道节描述文件中对应管道节的跳转规则以确定下一管道节,直至最后一个管道节执行完。例如,在一个描述了一条由三个处理管道节构成的管道的管道节描述文件中,描述文件通过filename和classname属性表达了管道节程序的位置的,第一、二节没有设置跳转规则,在执行完成后可进入随后的管道节,第三个管道节通过router指定了一个条件跳转,即执行完成第三个管道节后如果管道节描述文件中cache域中的toerppipeflag参数值为1时,则可以转到code为toerp的管道节。或者,在由管道节描述文件确定第一个管道节后,在每个管道节对应的控制器中设置默认的跳转规则为按顺序跳至下一个管道节是个不错的选择,可以为xml管道节描述文件省去不必要的跳转规则。在一些实施例中,方法还包括:在每一个所述管道节的出入口设置跟踪参数,并根据所述跟踪参数进行监控;响应于其中一个所述管道节异常,调用默认的异常处理节完结处理流程。具体的,为了为处理过程提供性能、过程监测数据,可在管道节的出入口位置附加处理信息,这些工作可以统一由控制器完成,使程序可只专注于数据处理逻辑。在一些实施例中,在实现控制器时为了能够提供性能监控数据和处理流程追溯数据,控制器在每个管道节的出入口处均可加入跟踪信息。并且如图2所示,可以提供一个默认的异常管道节,当管道节程序执行出现程序级异常时,每个管道节对应的控制器可调用默认的异常管道节完结处理流程,也允许在s1中所述的xml管道节描述文件中指定默认的异常管道节,这两类异常节的优先顺序为管道节描述文件异常管道节>控制器默认异常管道节。在一些实施例中,利用所述若干个管道节处理所述待处理数据,进一步包括:构造并初始化管道上下文;利用所述管道上下文记录每一个所述管道节在处理数据时产生的参数信息。具体的,如图2所示,在启动管道节程序前需要构造一个默认的上下文将其传入管道。使用java的线程上下文承载管道处理上下文是个不错的选择,但在线程切换时需要特别注意上下文的传递。管道上下文构造完成后,将其注入线程上下文中,并根据管道节描述文件逐一加载管道节执行程序,而且处理结果可以通过上下文获得。需要说明的是,管道上下文可以记录每一个所述管道节在处理数据时产生的参数信息,例如,流经管道的时间等。管道上下文可根据具体应用场景将上下文进行结构化管理,并可将数据处理程序常的服务封装在上下文中,不但可以提高开发效率,还可有效管理公共资源。在实现使用线程上下文承载管道上下文时,需要对线程上下文进行有效的管理,避免管道处理节编写时误用线程上下文造成管道上下文丢失,由其像java这种线程上下文只能存储一个对象的编程语言,在实际时增加一个线程上下文的包装类将原生的线程上下文进行管控,避免管道上下文丢失的问题。以下是java语言线程上下文包装的示例。在数据处理程序中通过callcontext的logicalsetdata和logicalgetdata可避免管道上下文丢失的问题。在一些实施例中,构造并初始化管道上下文,进一步包括:生成唯一标识符;利用所述唯一标识符标识利用所述若干个管道节对所述待处理数据的处理流程。具体的,唯一标识符(uuid)用于标识每次数据请求,uuid在初始化上下文时生成,并贯穿整个数据处理过程,方便事后处理过程的追溯。在一些实施例中,可以通过initpipeline加载xml管道节描述文件并进行合法性检查,并且在执行管道节ipepi时尝试将其转换为控制器,并通过设置上下文controller.setpipelineconfig中的子管道信息,实现了级联调用。在本实施例中控制器在执行管道节前后还增加了参数处理,这些参数处理不是必须的,但它们的存在可以让管道节使用上下文更加灵活。以下是参数处理的逻辑,利用java中的运行时注解为ipepi动态设置或读取上下文。根据本发明提出的方案提供了一个数据处理机制,应用这种处理机制的系统能够优雅的适应数据处理的变化,能够复用数据处理逻辑;还可提供性能监控数据、提供数据处理流程追溯机制。为了更好的适应数据处理需求的变化,本发明使用了基于xml的标记语言描述数据处理过程,数据处理过程被抽象为管道,管道由多个管道节组成,这个管道就像一台净水机,每个管道节就像净水机中的过滤膜,每个管道节对数据的处理就像过滤膜完成目标颗粒的过滤一样;为了为处理过程提供性能、过程监测数据,可在管道节的出入口位置附加处理信息,这些工作可统一由控制器完成,使程序可只专注于数据处理逻辑。解决了数据处理程序难以维护、性能难以监控、异常问题难以分析等问题。基于同一发明构思,根据本发明的另一个方面,如图3所示,本发明的实施例还提供了一种计算机设备501,包括:至少一个处理器520;以及存储器510,存储器510存储有可在处理器上运行的计算机程序511,处理器520执行程序时执行如上的任一种管道式数据处理方法的步骤。基于同一发明构思,根据本发明的另一个方面,如图4所示,本发明的实施例还提供了一种计算机可读存储介质601,计算机可读存储介质601存储有计算机程序指令610,计算机程序指令610被处理器执行时执行如上的任一种管道式数据处理方法的步骤。最后需要说明的是,本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,的存储介质可为磁碟、光盘、只读存储记忆体(rom)或随机存储记忆体(ram)等。上述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。此外,典型地,本发明实施例公开的装置、设备等可为各种电子终端设备,例如手机、个人数字助理(pda)、平板电脑(pad)、智能电视等,也可以是大型终端设备,如服务器等,因此本发明实施例公开的保护范围不应限定为某种特定类型的装置、设备。本发明实施例公开的客户端可以是以电子硬件、计算机软件或两者的组合形式应用于上述任意一种电子终端设备中。此外,根据本发明实施例公开的方法还可以被实现为由cpu执行的计算机程序,该计算机程序可以存储在计算机可读存储介质中。在该计算机程序被cpu执行时,执行本发明实施例公开的方法中限定的上述功能。此外,上述方法步骤以及系统单元也可以利用控制器以及用于存储使得控制器实现上述步骤或单元功能的计算机程序的计算机可读存储介质实现。此外,应该明白的是,本文的计算机可读存储介质(例如,存储器)可以是易失性存储器或非易失性存储器,或者可以包括易失性存储器和非易失性存储器两者。作为例子而非限制性的,非易失性存储器可以包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦写可编程rom(eeprom)或快闪存储器。易失性存储器可以包括随机存取存储器(ram),该ram可以充当外部高速缓存存储器。作为例子而非限制性的,ram可以以多种形式获得,比如同步ram(dram)、动态ram(dram)、同步dram(sdram)、双数据速率sdram(ddrsdram)、增强sdram(esdram)、同步链路dram(sldram)、以及直接rambusram(drram)。所公开的方面的存储设备意在包括但不限于这些和其它合适类型的存储器。本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。为了清楚地说明硬件和软件的这种可互换性,已经就各种示意性组件、方块、模块、电路和步骤的功能对其进行了一般性的描述。这种功能是被实现为软件还是被实现为硬件取决于具体应用以及施加给整个系统的设计约束。本领域技术人员可以针对每种具体应用以各种方式来实现的功能,但是这种实现决定不应被解释为导致脱离本发明实施例公开的范围。结合这里的公开所描述的各种示例性逻辑块、模块和电路可以利用被设计成用于执行这里功能的下列部件来实现或执行:通用处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或其它可编程逻辑器件、分立门或晶体管逻辑、分立的硬件组件或者这些部件的任何组合。通用处理器可以是微处理器,但是可替换地,处理器可以是任何传统处理器、控制器、微控制器或状态机。处理器也可以被实现为计算设备的组合,例如,dsp和微处理器的组合、多个微处理器、一个或多个微处理器结合dsp和/或任何其它这种配置。结合这里的公开所描述的方法或算法的步骤可以直接包含在硬件中、由处理器执行的软件模块中或这两者的组合中。软件模块可以驻留在ram存储器、快闪存储器、rom存储器、eprom存储器、eeprom存储器、寄存器、硬盘、可移动盘、cd-rom、或本领域已知的任何其它形式的存储介质中。示例性的存储介质被耦合到处理器,使得处理器能够从该存储介质中读取信息或向该存储介质写入信息。在一个替换方案中,存储介质可以与处理器集成在一起。处理器和存储介质可以驻留在asic中。asic可以驻留在用户终端中。在一个替换方案中,处理器和存储介质可以作为分立组件驻留在用户终端中。在一个或多个示例性设计中,功能可以在硬件、软件、固件或其任意组合中实现。如果在软件中实现,则可以将功能作为一个或多个指令或代码存储在计算机可读介质上或通过计算机可读介质来传送。计算机可读介质包括计算机存储介质和通信介质,该通信介质包括有助于将计算机程序从一个位置传送到另一个位置的任何介质。存储介质可以是能够被通用或专用计算机访问的任何可用介质。作为例子而非限制性的,该计算机可读介质可以包括ram、rom、eeprom、cd-rom或其它光盘存储设备、磁盘存储设备或其它磁性存储设备,或者是可以用于携带或存储形式为指令或数据结构的所需程序代码并且能够被通用或专用计算机或者通用或专用处理器访问的任何其它介质。此外,任何连接都可以适当地称为计算机可读介质。例如,如果使用同轴线缆、光纤线缆、双绞线、数字用户线路(dsl)或诸如红外线、无线电和微波的无线技术来从网站、服务器或其它远程源发送软件,则上述同轴线缆、光纤线缆、双绞线、dsl或诸如红外线、无线电和微波的无线技术均包括在介质的定义。如这里所使用的,磁盘和光盘包括压缩盘(cd)、激光盘、光盘、数字多功能盘(dvd)、软盘、蓝光盘,其中磁盘通常磁性地再现数据,而光盘利用激光光学地再现数据。上述内容的组合也应当包括在计算机可读介质的范围内。以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1