一种处理时间序列数据的方法及装置制造方法

文档序号:6626548阅读:274来源:国知局
一种处理时间序列数据的方法及装置制造方法
【专利摘要】本发明公开了一种处理时间序列数据的方法及装置,用以将时间序列数据的时间信息的格式统一化。所述方法包括:根据预设时间信息格式从时间序列数据的记录文档中提取时间信息;根据提取的时间信息确定记录文档中各条时间序列数据所对应的时间信息;将各条时间序列数据所对应的时间信息的格式转换为预设时间格式。本发明能够对时间序列数据的时间信息的格式进行统一,避免因为不支持时间序列数据的时间信息格式,而无法对时间序列数据进行分析,而且时间序列数据以统一的格式记录、展示时间信息,也方便处理、分析、展示这些时间序列数据。
【专利说明】一种处理时间序列数据的方法及装置

【技术领域】
[0001] 本发明涉及信息【技术领域】,特别涉及一种处理时间序列数据的方法及装置。

【背景技术】
[0002] 现有技术中,由于信息技术的快速发展,随之而来产生大量时间序列数据。时间序 列数据的记录文档包括:日志、各种传感器或智能家电产生的数据信息的记录文档、以及各 种交易系统产生的交易数据信息的记录文档。记录文档中的时间序列数据具有时间信息, 例如时间戳。时间信息对于分析数据具有重要意义,例如,不同时间产生的时间序列数据有 可能相同或相似,通过时间信息可以将不同时间产生的时间序列数据区分。目前,各种不同 系统产生的时间序列数据的时间信息的格式会有所不同,当进行数据分析的系统不支持时 间序列数据的时间信息格式时,将无法对时间序列数据进行分析。


【发明内容】

[0003] 本发明提供一种处理时间序列数据的方法及装置,用以将时间序列数据的时间信 息的格式统一化。
[0004] 本发明提供一种处理时间序列数据的方法,包括:包括:
[0005] 根据预设时间信息格式从时间序列数据的记录文档中提取时间信息;
[0006] 根据提取的时间信息确定记录文档中各条时间序列数据所对应的时间信息;
[0007] 将各条时间序列数据所对应的时间信息的格式转换为预设时间格式。
[0008] 其中,所述方法还包括:
[0009] 根据转换为预设时间格式的时间信息,分析所述记录文档。
[0010] 其中,所述根据预设时间信息格式从时间序列数据的记录文档中提取时间信息, 包括:
[0011] 根据预设时间信息格式对应的正则表达式从记录文档的时间序列数据中提取时 间信息。
[0012] 其中,所述根据提取的时间信息确定记录文档中各条时间序列数据所对应的时间 信息,包括:
[0013] 当根据预设时间信息格式从记录文档的一条时间序列数据中匹配出多个时间信 息时,确定所表示的时间与当前时间最接近的时间信息作为所述一条时间序列数据对应的 时间信息。
[0014] 其中,所述根据提取的时间信息确定记录文档中各条时间序列数据所对应的时间 信息,包括:
[0015] 当根据预设时间信息格式从记录文档的一条时间序列数据中未匹配出时间信息 时,将记录文档中与所述一条时间序列数据最接近的、具有对应时间信息的、时间序列数据 的时间信息确定为所述一条时间序列数据对应的时间信息。
[0016] 本发明还提供一种处理时间序列数据的装置,包括:
[0017] 提取模块,用于根据预设时间信息格式从时间序列数据的记录文档中提取时间信 息;
[0018] 确定模块,用于根据提取的时间信息确定记录文档中各条时间序列数据所对应的 时间信息;
[0019] 转换模块,用于将各条时间序列数据所对应的时间信息的格式转换为预设时间格 式。
[0020] 其中,所述装置还包括:
[0021] 分析模块,用于根据转换为预设时间格式的时间信息,分析所述记录文档。
[0022] 其中,所述提取模块,包括:
[0023] 提取子模块,用于根据预设时间信息格式对应的正则表达式从记录文档的时间序 列数据中提取时间信息。
[0024] 其中,所述确定模块,包括:
[0025] 第一确定子模块,用于当根据预设时间信息格式从记录文档的一条时间序列数据 中匹配出多个时间信息时,确定所表示的时间与当前时间最接近的时间信息作为所述一条 时间序列数据对应的时间信息。
[0026] 其中,所述确定模块,包括:
[0027] 第二确定子模块,当根据预设时间信息格式从记录文档的一条时间序列数据中未 匹配出时间信息时,将记录文档中与所述一条时间序列数据最接近的、具有对应时间信息 的、时间序列数据的时间信息确定为所述一条时间序列数据对应的时间信息。
[0028] 本发明的有益效果在于:根据预设时间信息格式从时间序列数据的记录文档中提 取时间信息;根据提取的时间信息确定记录文档中各条时间序列数据所对应的时间信息; 将各条时间序列数据所对应的时间信息的格式转换为预设时间格式;如此,能够对时间序 列数据的时间信息的格式进行统一,避免因为不支持时间序列数据的时间信息格式,而无 法对时间序列数据进行分析,而且时间序列数据以统一的格式记录、展示时间信息,也方便 处理、分析、展示这些时间序列数据。
[0029] 本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变 得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明 书、权利要求书、以及附图中所特别指出的结构来实现和获得。
[0030] 下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

【专利附图】

【附图说明】
[0031] 附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实 施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
[0032] 图1为本发明实施例中一种处理时间序列数据的方法的流程图;
[0033] 图2为本发明实施例中另一种处理时间序列数据的方法的流程图;
[0034] 图3为本发明实施例中一种处理时间序列数据的装置的框图;
[0035] 图4为本发明实施例中另一种处理时间序列数据的装置的框图。

【具体实施方式】
[0036] 以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实 施例仅用于说明和解释本发明,并不用于限定本发明。
[0037] 图1为本发明实施例中一种处理时间序列数据的方法的流程图。该方法可以用于 设备,例如个人电脑、服务器、路由器中,如图1所示,该方法包括如下步骤:
[0038] 在步骤S101中、根据预设时间信息格式从时间序列数据的记录文档中提取时间 信息。
[0039] 在一实施例中,步骤S101可包括:根据预设时间信息格式对应的正则表达式从记 录文档的时间序列数据中提取时间信息。
[0040] 举例而言,各种时间信息格式所对应的正则表达式如下所示:
[0041] 1998-12-31 %Y-%m-%d 98-12-31 %y-%m-%d 1998 years, 312 days %Y years, %j days Jan 24, 2003 %b %d, %Y January 24, 2003 %B %d, %Y 1397477611.862 %s.%3N
[0042] 利用上述正则表达式匹配出记录文档的时间序列数据中时间信息。
[0043] 在本实施例中,使用正则表达式进行匹配,使得匹配操作易于实施。
[0044] 在步骤S102中、根据提取的时间信息确定记录文档中各条时间序列数据所对应 的时间信息。
[0045] 在一实施例中,步骤S102可包括:当根据预设时间信息格式从记录文档的一条时 间序列数据中匹配出一个时间信息时,将匹配出的一个时间信息确定为该时间序列数据对 应的时间信息。
[0046] 在一实施例中,步骤S102可包括:当根据预设时间信息格式从记录文档的一条时 间序列数据中匹配出多个时间信息时,将所表示的时间与当前时间最接近的时间信息确定 为该匹配出多个时间信息的时间序列数据对应的时间信息。
[0047] 举例而言,根据预设时间信息格式从记录文档的一条时间序列数据中匹配出2个 时间信息,所表示的时间分为2014年6月1日6:00和2014年6月3日10:00,当前时间为 2014年6月3日18:00,则确定时间信息"2014年6月3日10:00"为该时间序列数据对应 的时间信息。
[0048] 在本实施例中,对一条时间序列数据匹配出的多个时间信息进行选取,由此能够 为时间序列数据确定出一个对应的时间信息,方便后续时间序列数据分析。
[0049] 在一实施例中,步骤S102可包括:当根据预设时间信息格式从记录文档的一条时 间序列数据中未匹配出时间信息时,将记录文档中与该一条时间序列数据最接近的、具有 对应时间信息的、时间序列数据的时间信息确定为该一条时间序列数据对应的时间信息。
[0050] 举例而言,根据预设时间信息格式从记录文档的第6条时间序列数据中未匹配出 时间信息,在记录文档中第1条、第4条、第9条时间序列数据中分别匹配出时间信息,则选 择与第6条时间序列数据最接近的第4条时间序列数据对应的时间信息作为第6条时间序 列数据对应的时间信息。
[0051] 在本实施例中,能够保证各条时间序列数据都具有对应的时间信息,因此,能够避 免后续分析时,因为没有时间信息而造成的分析困难,进而能够方便后续分析的进行。
[0052] 在步骤S103中、将各条时间序列数据所对应的时间信息的格式转换为预设时间 格式。
[0053] 举例而言,预设时间格式为IS0-8601格式,该格式中包含: 年-月-日-时-分-秒-毫秒-时区差:例如,"timestamp (时间戳Γ ^2014-08-25115 :04:42. 446443+08:00〃。
[0054] 其中,日期格式为yyyy-mm-dd,年为四位数,月为两位数,日为两位数,对于时 间和日期的组合,表达为:小时、分和秒都用两位数表示,精确到毫秒的时间用"秒"小数 点后的数字表示,时间和日期间用大写T分隔。对于UTC(协调世界时,Universal Time Coordinated)时间,最后加一大写字母Z,其他时区用实际时间加时差表示,预设时间格式 表不为 yyyy_臟-ddThh :mm :ss. sss+hh :00〇
[0055] 解析各条时间序列数据所对应的时间信息,确定时间信息中各个项目的数 据,例如,年、月、日对应的数据,将各个项目的数据填入预设时间格式的对应项目中, 从而将各条时间序列数据所对应的时间信息的格式转换为预设时间格式。例如,时间 信息为Jan 24, 2003,确定出时间信息中年、月、日对应的数据分别为2003、01、24,将 年、月、日对应的数据填入IS0-8601格式的年、月、日中,得IS0-8601格式的时间信息 2003-01-24。按上述方法,可将时间信息由98-12-31转化为1998-12-31,将时间信息由07/ Aug/2014:17:50:42+0800 转化为 2014-08-07T17:50:42+08 :00。
[0056] 本实施例的有益效果在于:根据预设时间信息格式从时间序列数据的记录文档中 提取时间信息;根据提取的时间信息确定记录文档中各条时间序列数据所对应的时间信 息;将各条时间序列数据所对应的时间信息的格式转换为预设时间格式;如此,能够对时 间序列数据的时间信息的格式进行统一,避免因为不支持时间序列数据的时间信息格式, 而无法对时间序列数据进行分析,而且时间序列数据以统一的格式记录、展示时间信息,也 方便处理、分析、展示这些时间序列数据。
[0057] 图2为本发明实施例中另一种处理时间序列数据的方法的流程图。该方法可以用 于设备,例如个人电脑、服务器、路由器中,如图2所示,该方法包括如下步骤:
[0058] 在步骤S201中、根据预设时间信息格式从时间序列数据的记录文档中提取时间 信息。
[0059] 在步骤S202中、根据提取的时间信息确定记录文档中各条时间序列数据所对应 的时间信息。
[0060] 在步骤S203中、将各条时间序列数据所对应的时间信息的格式转换为预设时间 格式。
[0061] 上述步骤S201-S203的实施例说明,请参见步骤S101-步骤S103中的实施例说 明,在此不再赘述。
[0062] 在步骤S204中、根据转换为预设时间格式的时间信息,分析记录文档。
[0063] 在一实施例中,对于不同设备产生的时间序列数据的记录文档,根据各个记录文 档中转换为预设时间格式的时间信息,分析不同设备产生的记录文档中时间序列信息的时 间相关性。
[0064] 本实施例的有益效果在于,将不同的记录文档中时间序列数据的时间信息转换为 统一格式,因而能够对不同的记录文档进行分析,并且可以对不同设备产生的记录文档中 时间序列数据做关联性分析。
[0065] 图3为本发明实施例中一种处理时间序列数据的装置的框图。该装置可以用于设 备,例如个人电脑、服务器、路由器中,如图3所示,该装置包括:
[0066] 提取模块31,用于根据预设时间信息格式从时间序列数据的记录文档中提取时间 信息;
[0067] 确定模块32,用于根据提取的时间信息确定记录文档中各条时间序列数据所对应 的时间信息;
[0068] 转换模块34,用于将各条时间序列数据所对应的时间信息的格式转换为预设时间 格式。
[0069] 在一实施例中,如图4所示,装置还包括:
[0070] 分析模块41,用于根据转换为预设时间格式的时间信息,分析所述记录文档。 [0071] 在一实施例中,提取模块,可包括:
[0072] 提取子模块,用于根据预设时间信息格式对应的正则表达式从记录文档的时间序 列数据中提取时间信息。
[0073] 在一实施例中,确定模块,可包括:
[0074] 第一确定子模块,用于当根据预设时间信息格式从记录文档的一条时间序列数据 中匹配出多个时间信息时,确定所表示的时间与当前时间最接近的时间信息作为该一条时 间序列数据对应的时间信息。
[0075] 在一实施例中,确定模块,可包括:
[0076] 第二确定子模块,当根据预设时间信息格式从记录文档的一条时间序列数据中未 匹配出时间信息时,将记录文档中与所述一条时间序列数据最接近的、具有对应时间信息 的、时间序列数据的时间信息确定为该一条时间序列数据对应的时间信息。
[0077] 本发明的有益效果在于:根据预设时间信息格式从时间序列数据的记录文档中提 取时间信息;根据提取的时间信息确定记录文档中各条时间序列数据所对应的时间信息; 将各条时间序列数据所对应的时间信息的格式转换为预设时间格式;如此,能够对时间序 列数据的时间信息的格式进行统一,避免因为不支持时间序列数据的时间信息格式,而无 法对时间序列数据进行分析,而且时间序列数据以统一的格式记录、展示时间信息,也方便 处理、分析、展示这些时间序列数据。
[0078] 关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法 的实施例中进行了详细描述,此处将不做详细阐述说明。
[0079] 本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序 产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实 施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机 可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形 式。
[0080] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程 图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一 流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算 机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理 器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生 用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能 的装置。
[0081] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特 定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指 令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或 多个方框中指定的功能。
[0082] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计 算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或 其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图 一个方框或多个方框中指定的功能的步骤。
[0083] 显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精 神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围 之内,则本发明也意图包含这些改动和变型在内。
【权利要求】
1. 一种处理时间序列数据的方法,其特征在于,包括: 根据预设时间信息格式从时间序列数据的记录文档中提取时间信息; 根据提取的时间信息确定记录文档中各条时间序列数据所对应的时间信息; 将各条时间序列数据所对应的时间信息的格式转换为预设时间格式。
2. 如权利要求1所述的方法,其特征在于,所述方法还包括: 根据转换为预设时间格式的时间信息,分析所述记录文档。
3. 如权利要求1所述的方法,其特征在于,所述根据预设时间信息格式从时间序列数 据的记录文档中提取时间信息,包括: 根据预设时间信息格式对应的正则表达式从记录文档的时间序列数据中提取时间信 息。
4. 如权利要求1所述的方法,其特征在于,所述根据提取的时间信息确定记录文档中 各条时间序列数据所对应的时间信息,包括: 当根据预设时间信息格式从记录文档的一条时间序列数据中匹配出多个时间信息时, 确定所表示的时间与当前时间最接近的时间信息作为所述一条时间序列数据对应的时间 信息。
5. 如权利要求1所述的方法,其特征在于,所述根据提取的时间信息确定记录文档中 各条时间序列数据所对应的时间信息,包括: 当根据预设时间信息格式从记录文档的一条时间序列数据中未匹配出时间信息时,将 记录文档中与所述一条时间序列数据最接近的、具有对应时间信息的、时间序列数据的时 间信息确定为所述一条时间序列数据对应的时间信息。
6. -种处理时间序列数据的装置,其特征在于,包括: 提取模块,用于根据预设时间信息格式从时间序列数据的记录文档中提取时间信息; 确定模块,用于根据提取的时间信息确定记录文档中各条时间序列数据所对应的时间 信息; 转换模块,用于将各条时间序列数据所对应的时间信息的格式转换为预设时间格式。
7. 如权利要求6所述的装置,其特征在于,所述装置还包括: 分析模块,用于根据转换为预设时间格式的时间信息,分析所述记录文档。
8. 如权利要求6所述的装置,其特征在于,所述提取模块,包括: 提取子模块,用于根据预设时间信息格式对应的正则表达式从记录文档的时间序列数 据中提取时间信息。
9. 如权利要求6所述的装置,其特征在于,所述确定模块,包括: 第一确定子模块,用于当根据预设时间信息格式从记录文档的一条时间序列数据中匹 配出多个时间信息时,确定所表示的时间与当前时间最接近的时间信息作为所述一条时间 序列数据对应的时间信息。
10. 如权利要求6所述的装置,其特征在于,所述确定模块,包括: 第二确定子模块,当根据预设时间信息格式从记录文档的一条时间序列数据中未匹配 出时间信息时,将记录文档中与所述一条时间序列数据最接近的、具有对应时间信息的、时 间序列数据的时间信息确定为所述一条时间序列数据对应的时间信息。
【文档编号】G06F17/30GK104268167SQ201410459330
【公开日】2015年1月7日 申请日期:2014年9月10日 优先权日:2014年9月10日
【发明者】陈军, 梁玫娟 申请人:北京优特捷信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1