一种数据解析的方法和装置的制造方法

文档序号:10512289阅读:429来源:国知局
一种数据解析的方法和装置的制造方法
【专利摘要】本发明公开了一种数据解析的方法和装置。其中,该方法包括:获取文件数据,并获取与文件数据对应的配置文件;根据配置文件对文件数据进行解析;输出解析后的文件数据。本发明解决了现有数据解析过程复杂的技术问题。
【专利说明】
一种数据解析的方法和装置
技术领域
[0001 ]本发明涉及数据处理领域,具体而言,涉及一种数据解析的方法和装置。
【背景技术】
[0002]在移动通信中,数据是网管应用以及用户运营分析的基础,但移动通信网络类型多样,网络设备种类繁多,数据类型多种多样,各设备接口标准化程度不一,数据信息模型各有不同,因此导致各设备产生文件数据格式各异。为了正常使用各设备产生的数据,目前在移动通信行业中大多是针对不同格式的文件数据进行分类处理。网络设备各种类型的数据按规则生成相应的文件,上层各网管在使用时,根据自身需求对指定类型文件进行编码解析以获取合适数据。
[0003]但是,在移动通信网中涉及的硬件设备厂家众多,每个厂家又对应有众多的设备类型,每类设备需要根据规则记录不同类型的数据,由于设备接口及数据标准不统一,导致数据格式繁多,传统网管针对多样化的数据格式采用各异的解析方式,各类数据解析能力参差不齐,数据解析过于复杂。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

【发明内容】

[0005]本发明实施例提供了一种数据解析的方法和装置,以至少解决现有数据解析过程复杂的技术问题。
[0006]根据本发明实施例的一个方面,提供了一种数据解析的方法,包括:获取文件数据,并获取与所述文件数据对应的配置文件;根据所述配置文件对所述文件数据进行解析;输出所述解析后的文件数据。
[0007]根据本发明实施例的另一方面,还提供了一种数据解析的装置,包括:获取单元,用于获取文件数据,并获取与所述文件数据对应的配置文件;解析单元,用于根据所述配置文件对所述文件数据进行解析;输出单元,用于输出所述解析后的文件数据。
[0008]在本发明实施例中,获取文件数据,并获取与该文件数据对应的配置文件;根据该配置文件对该文件数据进行解析;输出该解析后的文件数据。这样,通过统一的配置文件对不同文件数据格式的文件数据进行解析,无需配置各异的解析方式,从而解决了现有数据解析过程复杂的技术问题。
【附图说明】
[0009]为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0010]图1是根据本发明实施例的一种可选的数据解析方法的流程示意图;
[0011]图2是根据本发明实施例的一种可选的正则表达式关系的树状示意图;
[0012]图3是根据本发明实施例的一种可选的数据解析装置的结构示意图;
[0013]图4是根据本发明实施例的另一种可选的数据解析装置的结构示意图;
[0014]图5是根据本发明实施例的又一种可选的数据解析装置的结构示意图。
【具体实施方式】
[0015]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0016]需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0017]根据本发明实施例,提供了一种数据解析的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0018]图1是根据本发明实施例的一种数据解析的方法,如图1所示,该方法包括如下步骤:
[0019]SlOl、获取文件数据,并获取与该文件数据对应的配置文件。
[0020]其中,在获取文件数据前,获取解析参数,并根据该解析参数生成配置文件。
[0021]具体地,该配置文件包括对应不同数据格式的配置模块,该配置模块匹配有对应的正则表达式,各个正则表达式之间存在对应关系,结合输入的解析参数生成配置文件,其中,该正则表达式用于表示该文件数据的解析流程。
[0022]在本实施例一种可能的实现方式中,在获得配置文件后,还可以获取记录日志格式,并根据记录日志格式记录后续的文件数据解析。
[0023]S102、根据该配置文件对该文件数据进行解析。
[0024]在本步骤中,获取该文件数据的数据格式,并确定该数据格式对应的正则表达式,并根据该正则表达式对该文件数据进行解析。
[0025]其中,数据解析时需要按照数据格式匹配对应的正则表达式、及各个正则表达式之间的关系,通过配置文件确定与文件数据匹配的配置模块,这样,每次只需关心需要的匹配模块,通过对应的正则表达式和各个正则表达式之间的关系度文件数据进行解析。
[0026]正则表达式的配置依据数据格式进行设置,在本实施例中,可以为正则表达式添加序号,序号从O开始依次递增。各个正则表达式可以设置对应的主从关系,将主正则表达式的整个匹配结果作为输入,用于从正则的匹配,这对一条文件数据的完整性校验有很大帮助。设置正则表达式关系时以-1作为顶层入口,可以用多个顶层以应对复杂的文件数据的格式。设置正则表达式关系后,按照树状结构对文件数据进行解析,这种分枝结构能够按照树状路径,减少对字符串的匹配,提高效率。
[0027]例如,设置的正则表达式树状关系可以如图2所示(0,I,2,3,4,5为本实施例中各正则表达式的标号):
[0028]其中,O号和3号为主正则表达式,其余为从正则表达式,以O号正则表达式的匹配结果作为I号及2号正则表达式的输入,由2号及3号进行深入详细的文件数据解析,同理3号输出结果作为4号和5号的输入,这样,可以按照上述正则表达式之间关系进行数据解析处理。
[0029]S103、输出该解析后的文件数据。
[0030]在本步骤中,获取输出格式,并根据该输出格式输出该解析后的文件数据,这样,可以按照指定的输出格式输出该文件数据,方便对文件数据的管理。
[0031 ]可选地,在根据该配置文件对该文件数据进行解析后,统计该解析后的文件数据,并输出统计后的文件数据。
[0032]采用上述实施例,通过统一的配置文件对不同文件数据格式的文件数据进行解析,无需配置各异的解析方式,从而解决了现有数据解析过程复杂的技术问题。
[0033]图3为本发明实施例提供的一种数据解析的装置,如图3所示,包括:
[0034]获取单元301,用于获取文件数据,并获取与该文件数据对应的配置文件;
[0035]解析单元302,用于根据该配置文件对该文件数据进行解析;
[0036]输出单元303,用于输出该解析后的文件数据。
[0037]可选地,该解析单元302,具体用于获取该文件数据的数据格式,并确定该数据格式对应的正则表达式,其中,该正则表达式用于表示该文件数据的解析流程,并根据该正则表达式对文件数据进行解析。
[0038]可选地,如图4所示,该装置还包括:生成单元304,用于在获取文件数据前,获取解析参数,并根据该解析参数生成配置文件。
[0039]可选地,如图5所示,该装置还包括:统计单元305,用于在该根据该配置文件对该文件数据进行解析后,在该输出该解析后的文件数据前,统计该解析后的文件数据。
[0040]可选地,该输出单元303,具体用于获取输出格式,并根据该输出格式输出该解析后的文件数据。
[0041]采用上述装置,通过统一的配置文件对不同文件数据格式的文件数据进行解析,无需配置各异的解析方式,从而解决了现有数据解析过程复杂的技术问题。
[0042]上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0043]在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0044]在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
[0045]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0046]另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0047]所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(R0M,Read-0nly Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0048]以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
【主权项】
1.一种数据解析的方法,其特征在于,包括: 获取文件数据,并获取与所述文件数据对应的配置文件; 根据所述配置文件对所述文件数据进行解析; 输出所述解析后的文件数据。2.根据权利要求1所述的方法,其特征在于,所述根据所述配置文件对所述文件数据进行解析包括: 获取所述文件数据的数据格式; 确定所述数据格式对应的正则表达式,其中,所述正则表达式用于表示所述文件数据的解析流程; 根据所述正则表达式对所述文件数据进行解析。3.根据权利要求1所述的方法,其特征在于,在获取文件数据前,所述方法还包括: 获取解析参数,并根据所述解析参数生成配置文件。4.根据权利要求1所述的方法,其特征在于,在所述根据所述配置文件对所述文件数据进行解析后,在所述输出所述解析后的文件数据前,所述方法还包括: 统计所述解析后的文件数据。5.根据权利要求1至4任一项所述的方法,其特征在于,所述输出所述解析后的文件数据包括: 获取输出格式; 根据所述输出格式输出所述解析后的文件数据。6.一种数据解析的装置,其特征在于,包括: 获取单元,用于获取文件数据,并获取与所述文件数据对应的配置文件; 解析单元,用于根据所述配置文件对所述文件数据进行解析; 输出单元,用于输出所述解析后的文件数据。7.根据权利要求6所述的装置,其特征在于,所述解析单元,具体用于获取所述文件数据的数据格式,并确定所述数据格式对应的正则表达式,其中,所述正则表达式用于表示所述文件数据的解析流程;根据所述正则表达式对所述文件数据进行解析。8.根据权利要求6所述的装置,其特征在于,所述装置还包括:生成单元,用于在获取文件数据前,获取解析参数,并根据所述解析参数生成配置文件。9.根据权利要求6所述的装置,其特征在于,所述装置还包括:统计单元,用于在所述根据所述配置文件对所述文件数据进行解析后,在所述输出所述解析后的文件数据前,统计所述解析后的文件数据。10.根据权利要求6至9任一项所述的装置,其特征在于,所述输出单元,具体用于获取输出格式,并根据所述输出格式输出所述解析后的文件数据。
【文档编号】G06F17/30GK105868311SQ201610179353
【公开日】2016年8月17日
【申请日】2016年3月25日
【发明人】马海洋
【申请人】浪潮通信信息系统有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1