数据提取方法及装置的制造方法

文档序号:9887632阅读:330来源:国知局
数据提取方法及装置的制造方法
【技术领域】
[0001]本发明涉及通信领域,具体而言,涉及一种数据提取方法及装置。
【背景技术】
[0002]随着移动通信技术的发展,互联网信息交流传递越来越便捷。运营商网络的不断优化,速度提升,带宽升级,费用降低,都是顺应时代的潮流。为了更好的推广产品,提升用户体验,运营商迫切需要了解用户的需求喜好等等。元数据提取可以协助了解用户常登陆的网站,业务应用,和服务器的交互内容。运营商根据元数据提取的结果就能对用户行为和用户体验做跟踪分析,统计热点网站,用户上相应网站的时延、流量等信息。能更好地优化无线网络,协助运营商提升网络质量,从而使产品获得更高的价值。
[0003]简单地,用户通过互联网终端设备向服务器请求获取资源,在接收和解释请求消息后,服务器会返回响应消息,问题就是如何从海量的报文内容中准确提取出所需要的数据。现有的方法一般都是根据正则表达式直接匹配提取,由于在网络上传输的元数据信息纷繁复杂,有时候无法找到明文的特征,正则表达式无法较好地进行配置;有时候报文数据中有多个提取目标但是提取不全面或者是只需提取一个却提取出很多不需要的错误内容。
[0004]针对相关技术中对目标数据的提取不准确的问题,目前尚未提出有效的解决方案。

【发明内容】

[0005]本发明提供了一种数据提取方法及装置,以至少解决相关技术中对目标数据的提取不准确的问题。
[0006]根据本发明的一个方面,提供了一种数据提取方法,包括:依据数据报文确定提取的目标数据;根据预定的正则表达式对所述报文数据中的内容进行匹配;在所述报文数据中存在至少两个目标数据的情况下,对所述至少两个目标数据进行提取。
[0007]进一步地,根据预定的正则表达式对所述报文数据中的内容进行匹配包括:在所述报文数据中具有字符串特征的情况下,根据预定的字符正则表达式对所述报文数据中的内容进行匹配。
[0008]进一步地,根据预定的正则表达式对所述报文数据中的内容进行匹配包括:在所述报文数据中不具有字符特征的情况下,采用预定函数解析的方式解析所述报文数据,解码得到所述目标数据。
[0009]进一步地,对所述至少两个目标数据进行提取包括:在对不同的所述报文数据中提取所述至少两个目标数据的情况下,通过预先配置的用于记录提取成功的提取次数和/或用于记录提取失败的尝试提取次数对所述目标数据进行提取。
[0010]进一步地,对所述至少两个目标数据进行提取包括:在一个报文数据有两个提取目标的情况下,对所述报文数据中的内容进行多次匹配后对两个目标数据进行提取;和/或,在不同报文数据有两个提取目标的情况下,采用预先配置的用于记录提取成功的提取次数和/或用于记录提取失败的尝试提取次数对两个目标数据进行提取。
[0011]进一步地,在通过预先配置的用于记录提取成功的提取次数和/或用于记录提取失败的尝试提取次数对所述目标数据进行提取之前,还包括:配置动态设置接口,其中,所述动态设置接口用于接收针对不同提取类型设置的不同提取次数和尝试提取次数。
[0012]根据本发明的另一方面,提供了一种数据提取装置,包括:确定模块,用于依据数据报文确定提取的目标数据;匹配模块,用于根据预定的正则表达式对所述报文数据中的内容进行匹配;提取模块,用于在所述报文数据中存在至少两个目标数据的情况下,对所述至少两个目标数据进行提取。
[0013]进一步地,所述匹配模块包括:匹配单元,用于在所述报文数据中具有字符串特征的情况下,根据预定的字符正则表达式对所述报文数据中的内容进行匹配。
[0014]进一步地,所述匹配模块包括:解析单元,用于在所述报文数据中不具有字符特征的情况下,采用预定函数解析的方式解析所述报文数据,解码得到所述目标数据。
[0015]进一步地,所述提取模块包括:提取单元,用于在对不同的所述报文数据中提取所述至少两个目标数据的情况下,通过预先配置的用于记录提取成功的提取次数和/或用于记录提取失败的尝试提取次数对所述目标数据进行提取。
[0016]进一步地,所述提取模块包括:第二提取单元,用于在一个报文数据有两个提取目标的情况下,对所述报文数据中的内容进行多次匹配后对两个目标数据进行提取;和/或,第三提取单元,用于在不同报文数据有两个提取目标的情况下,采用预先配置的用于记录提取成功的提取次数和/或用于记录提取失败的尝试提取次数对两个目标数据进行提取。
[0017]进一步地,所述装置还包括:配置单元,用于配置动态设置接口,其中,所述动态设置接口用于接收针对不同提取类型设置的不同提取次数和尝试提取次数。
[0018]通过本发明,采用依据数据报文确定提取的目标数据;根据预定的正则表达式对所述报文数据中的内容进行匹配;在所述报文数据中存在至少两个目标数据的情况下,对所述至少两个目标数据进行提取,解决了相关技术中对目标数据的提取不准确的问题,进而能够准确提取目标数据的效果。
【附图说明】
[0019]此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0020]图1是根据本发明实施例的数据提取方法的流程图;
[0021]图2是根据本发明实施例的数据提取装置的框图;
[0022]图3是根据本发明优选实施例的数据提取装置的框图一;
[0023]图4是根据本发明优选实施例的数据提取装置的框图二 ;
[0024]图5是根据本发明优选实施例的数据提取装置的框图三;
[0025]图6是根据本发明优选实施例的数据提取装置的框图四;
[0026]图7是根据本发明优选实施例的数据提取方法的流程图一;
[0027]图8是根据本发明优选实施例的数据提取方法的流程图二 ;
[0028]图9是根据本发明优选实施例的数据提取方法的流程图三;
[0029]图10是根据本发明优选实施例的数据提取方法的流程图四;
[0030]图11是根据本发明优选实施例的数据提取方法的流程图五;
[0031]图12是根据本发明优选实施例的数据提取方法的流程图六;
[0032]图13是根据本发明优选实施例的数据提取方法的流程图七。
【具体实施方式】
[0033]下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
[0034]在本实施例中提供了一种数据提取方法,图1是根据本发明实施例的数据提取方法的流程图,如图1所示,该流程包括如下步骤:
[0035]步骤S102,依据数据报文确定提取的目标数据;
[0036]步骤S104,根据预定的正则表达式对该报文数据中的内容进行匹配;
[0037]步骤S106,在该报文数据中存在至少两个目标数据的情况下,对该至少两个目标数据进行提取。
[0038]通过上述步骤,依据数据报文确定提取的目标数据,根据预定的正则表达式对该报文数据中的内容进行匹配,在该报文数据中存在至少两个目标数据的情况下,对该至少两个目标数据进行提取,解决了相关技术中对目标数据的提取不准确的问题,进而能够准确提取目标数据的效果。
[0039]本实施例中,根据预定的正则表达式对该报文数据中的内容进行匹配可以包括:在该报文数据中具有字符串特征的情况下,根据预定的字符正则表达式对该报文数据中的内容进行匹配;和/或,在该报文数据中不具有字符特征的情况下,采用预定函数解析的方式解析该报文数据,解码得到该目标数据。
[0040]在一个可选的实施方式中,对该至少两个目标数据进行提取可以包括:在对不同的该报文数据中提取该至少两个目标数据的情况下,通过预先配置的用于记录提取成功的提取次数和/或用于记录提取失败的尝试提取次数对该目标数据进行提取。
[0041]进一步地,对该至少两个目标数据进行提取包括:在一个报文数据有两个提取目标的情况下,对该报文数据中的内容进行多次匹配后对两个目标数据进行提取;和/或,在不同报文数据有两个提取目标的情况下,采用预先配置的用于记录提取成功的提取次数和/或用于记录提取失败的尝试提取次数对两个目标数据进行提取。
[0042]作为一种优选的实施方式,在通过预先配置的用于记录提取成功的提取次数和/或用于记录提取失败的尝试提取次数对该目标数据进行提取之前,配置动态
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1