数据处理方法和装置制造方法

文档序号:6637561阅读:130来源:国知局
数据处理方法和装置制造方法
【专利摘要】本发明公开了一种数据处理方法和装置。其中,该数据处理方法包括:获取待查找的表现数据所对应的待匹配表现时间;对状态数据表和表现数据表关联得到的关联数据表中的关联数据进行分组;获取与所述待匹配表现时间相对应的多条关联数据,其中,每条关联数据包括所述状态数据表中的一条状态数据和所述表现数据表中的一条表现数据;逐个计算所述每条关联数据中的状态时间与表现时间的间隔,得到最小间隔值;以及将所述最小间隔值所对应的一条关联数据中的状态数据作为与所述待匹配表现时间对应的数据。通过本发明,解决了现有技术中找与表现数据配对的状态数据效率比较低的问题,达到了提高查找效率的效果。
【专利说明】数据处理方法和装置

【技术领域】
[0001] 本发明涉及互联网领域,具体而言,涉及一种数据处理方法和装置。

【背景技术】
[0002] 在广告监测系统中,有一张表记录广告的历史状态,另一张表记录各时段的广告 表现。要把某一时段广告的表现和该时段的广告状态关联时,要对两张表的条目通过一定 条件进行配对。在进行配对时,根据需要配对的广告表现Dl对应的时段Tl,找到在状态表 中早于Tl且离Tl最近的T2时刻的状态数据S2,如果不存在这样的状态数据,则找到晚于 Tl且离Tl最近的T3时刻的状态数据S3,该状态数据即为Dl所配对的状态数据。
[0003] 现有的技术方案在状态表中查找与广告表现对应的状态数据时,将状态表和表现 表通过实体主键关联,并对表现表的时间分区按照时间的先后顺序进行排序,并对排序后 的分区提取各分区的第一条数据作为与表现表配对数据。但是,由于对时间分区进行排序 操作的性能较低,耗时较长,导致查找与表现数据配对的状态数据效率比较低的问题。
[0004] 针对现有技术中找与表现数据配对的状态数据效率比较低的问题,目前尚未提出 有效的解决方案。


【发明内容】

[0005] 本发明的主要目的在于提供一种数据处理方法和装置,以解决现有技术中找与表 现数据配对的状态数据效率比较低的问题。
[0006] 为了实现上述目的,根据本发明实施例的一个方面,提供了一种数据处理方法。根 据本发明的数据处理方法包括:获取待查找的表现数据所对应的待匹配表现时间;对状态 数据表和表现数据表关联得到的关联数据表中的关联数据进行分组,其中,每个分组记录 了具有相同广告主键的状态数据和表现数据;获取与所述待匹配表现时间相对应的多条关 联数据,其中,每条关联数据包括所述状态数据表中的一条状态数据和所述表现数据表中 的一条表现数据;逐个计算所述每条关联数据中的状态时间与表现时间的间隔,得到最小 间隔值;以及将所述最小间隔值所对应的一条关联数据中的状态数据作为与所述待匹配表 现时间对应的数据。
[0007] 进一步地,在对状态数据表和表现数据表关联得到的关联数据表中的关联数据进 行分组之前,所述数据处理方法还包括:获取所述状态数据表和所述表现数据表;提取所 述状态数据表的广告主键和所述表现数据表中的广告主键;依次将所述状态数据表中的每 条状态数据与所述表现数据表中具有与状态数据相同广告主键的每条表现数据相关联,得 到关联数据表,其中,所述关联数据表中的每条关联数据都包括状态数据和表现数据。
[0008] 进一步地,对状态数据表和表现数据表关联得到的关联数据表中的关联数据进行 分组包括:提取具有相同所述广告主键的关联数据;在提取到的关联数据中将属于相同的 所述表现时间的关联数据作为一个分组。
[0009] 进一步地,逐个计算所述每条关联数据中的状态时间与表现时间的间隔,得到最 小间隔值包括:判断所述状态时间是否早于所述表现时间;如果所述状态时间早于所述表 现时间,则记录所述关联数据中与所述状态时间所对应的状态主键为负值,其中,所述状态 主键为所述关联数据表中与所述状态时间对应的状态主键;如果所述状态时间晚于所述表 现时间,则记录所述关联数据中与所述状态时间所对应的状态主键为正值;在记录的状态 主键中查找最小的值;以及将查找到的最小的值的绝对值所对应的所述关联数据表中的状 态主键作为所述最小间隔值。
[0010] 进一步地,在获取待查找的表现数据所对应的待匹配表现时间之前,所述数据处 理方法还包括:获取所述状态数据表中的第一状态数据的第一状态时间和与所述第一状态 数据对应的第一状态主键;获取待插入所述状态数据表中的第二状态数据的第二状态时间 和第二状态主键;判断所述第二状态时间是否早于所述第一状态时间;如果所述第二状态 时间早于所述第一状态时间,则将所述第二状态数据的第二状态主键调整为所述第一状态 主键,并将所述第一状态数据的第一状态主键调整为所述第二状态主键;如果所述第二状 态时间晚于所述第一状态时间,则将所述第二状态数据的状态主键设置为所述第二状态主 键。
[0011] 为了实现上述目的,根据本发明实施例的另一方面,提供了一种数据处理装置。根 据本发明的数据处理装置包括:第一获取单元,用于获取待查找的表现数据所对应的待匹 配表现时间;分组单元,用于对状态数据表和表现数据表关联得到的关联数据表中的关联 数据进行分组,其中,每个分组记录了具有相同广告主键的状态数据和表现数据;第二获取 单元,用于获取与所述待匹配表现时间相对应的多条关联数据,其中,每条关联数据包括所 述状态数据表中的一条状态数据和所述表现数据表中的一条表现数据;计算单元,用于逐 个计算所述每条关联数据中的状态时间与表现时间的间隔,得到最小间隔值;以及确定单 元,用于将所述最小间隔值所对应的一条关联数据中的状态数据作为与所述待匹配表现时 间对应的数据。
[0012] 进一步地,所述数据处理装置还包括:第三获取单元,用于在对状态数据表和表现 数据表关联得到的关联数据表中的关联数据进行分组之前,获取所述状态数据表和所述表 现数据表;提取单元,用于提取所述状态数据表的广告主键和所述表现数据表中的广告主 键;关联单元,用于依次将所述状态数据表中的广告主键与所述表现数据表中具有相同广 告主键的每条表现数据相关联,得到关联数据表,其中,所述关联数据表中的每条关联数据 都包括状态数据和表现数据。
[0013] 进一步地,所述分组单元包括:提取模块,用于提取具有相同所述广告主键的关联 数据;确定模块,用于在提取到的关联数据中将属于相同的所述表现时间的关联数据作为 一个分组。
[0014] 进一步地,所述计算单元包括:判断模块,用于判断所述状态时间是否早于所述表 现时间;记录模块,用于在所述状态时间早于所述表现时间时,记录所述关联数据中与所述 状态时间所对应的状态主键为负值;在所述状态时间晚于所述表现时间时,记录所述关联 数据中与所述状态时间所对应的状态主键为正值,其中,所述状态主键为所述关联数据表 中与所述状态时间对应的状态主键;查找模块,用于在记录的状态主键中查找最小的值; 以及确定模块,用于将查找到的最小的值的绝对值所对应的所述关联数据表中的状态主键 作为所述最小间隔值。
[0015] 进一步地,所述数据处理装置还包括:第四获取单元,用于在获取待查找的表现数 据所对应的待匹配表现时间之前,获取所述状态数据表中的第一状态数据的第一状态时间 和与所述第一状态数据对应的第一状态主键;第五获取单元,用于获取待插入所述状态数 据表中的第二状态数据的第二状态时间和第二状态主键;判断单元,用于判断所述第二状 态时间是否早于所述第一状态时间;调整单元,用于在所述第二状态时间早于所述第一状 态时间时,将所述第二状态数据的第二状态主键调整为所述第一状态主键,并将所述第一 状态数据的第一状态主键调整为所述第二状态主键;在所述第二状态时间晚于所述第一状 态时间时,将所述第二状态数据的状态主键设置为所述第二状态主键。
[0016] 根据发明实施例,将表现数据表和状态数据表进行关联后,不需要对表现时间进 行排序来查找与待匹配表现时间所对应的数据,而是通过判断同一条关联数据中的表现时 间和状态时间的时间间隔来判断哪条关联数据中的状态数据是与待匹配表现时间对应的 数据,由于排序的性能较低,会降低匹配的效率,而本实施例不进行排序就能得到匹配结 果,解决了现有技术中找与表现数据配对的状态数据效率比较低的问题,达到了提高查找 效率的效果。

【专利附图】

【附图说明】
[0017] 构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实 施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0018] 图1是根据本发明实施例的数据处理方法的流程图;以及
[0019] 图2是根据本发明实施例的数据处理装置的示意图。

【具体实施方式】
[0020] 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相 互组合。下面将参考附图并结合实施例来详细说明本发明。
[0021] 为了使本【技术领域】的人员更好地理解本发明方案,下面将结合本发明实施例中的 附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是 本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术 人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范 围。
[0022] 需要说明的是,本发明的说明书和权利要求书及上述附图中的术语"第一"、"第 二"等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使 用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语"包括"和 "具有"以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元 的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有 清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0023] 本发明实施例提供了一种数据处理方法。该数据处理方法可以用在广告监测的 数据处理中。通常采用状态数据表和表现数据表来监测广告,状态数据表中记录了广告数 据的状态属性、该状态的改变的时间、每条状态的标识等,表现数据表记录了广告的表现属 性、记录该表现属性的时间和每条表现数据的标识等。在进行广告监测时,需要根据表现数 据来查找与该表现数据对应的状态数据,以结合状态数据和表现数据对广告进行分析,本 实施例可以用于查找与表现数据对应的状态数据,以解决现有技术中查找与表现数据对应 的状态数据的效率比较低的问题。
[0024] 图1是根据本发明实施例的数据处理方法的流程图。如图1所示,该数据处理方 法包括步骤如下:
[0025] 步骤S102,获取待查找的表现数据所对应的待匹配表现时间;
[0026] 步骤S104,对状态数据表和表现数据表关联得到的关联数据表中的关联数据进行 分组,其中,每个分组记录了具有相同广告主键的状态数据和表现数据;
[0027] 步骤S106,获取与待匹配表现时间相对应的多条关联数据,其中,每条关联数据包 括状态数据表中的一条状态数据和表现数据表中的一条表现数据;
[0028] 步骤S108,逐个计算每条关联数据中的状态时间与表现时间的间隔,得到最小间 隔值;
[0029] 步骤S110,将最小间隔值所对应的一条关联数据中的状态数据作为与待匹配表现 时间对应的数据。
[0030] 状态数据表如表1所示,表现数据表如表2所示,对状态数据表和表现数据表进行 关联,得到表3所示的关联数据表。如表1所示,状态数据表1中的每条状态数据包括状态 主键、广告主键、状态时间、属性1和属性2,如表2所示,表现数据表中的每条表现数据包括 表现主键、广告主键、表现时间、指标1和指标2。
[0031] 表1状态数据表
[0032]

【权利要求】
1. 一种数据处理方法,其特征在于,包括: 获取待查找的表现数据所对应的待匹配表现时间; 对状态数据表和表现数据表关联得到的关联数据表中的关联数据进行分组,其中,每 个分组记录了具有相同广告主键的状态数据和表现数据; 获取与所述待匹配表现时间相对应的多条关联数据,其中,每条关联数据包括所述状 态数据表中的一条状态数据和所述表现数据表中的一条表现数据; 逐个计算所述每条关联数据中的状态时间与表现时间的间隔,得到最小间隔值;W及 将所述最小间隔值所对应的一条关联数据中的状态数据作为与所述待匹配表现时间 对应的数据。
2. 根据权利要求1所述的数据处理方法,其特征在于,在对状态数据表和表现数据表 关联得到的关联数据表中的关联数据进行分组之前,所述数据处理方法还包括: 获取所述状态数据表和所述表现数据表; 提取所述状态数据表的广告主键和所述表现数据表中的广告主键; 依次将所述状态数据表中的每条状态数据与所述表现数据表中具有与所述状态数据 相同广告主键的每条表现数据相关联,得到关联数据表,其中,所述关联数据表中的每条关 联数据都包括状态数据和表现数据。
3. 根据权利要求1或2所述的数据处理方法,其特征在于,对状态数据表和表现数据表 关联得到的关联数据表中的关联数据进行分组包括: 提取具有相同所述广告主键的关联数据; 在提取到的关联数据中将属于相同的所述表现时间的关联数据作为一个分组。
4. 根据权利要求1所述的数据处理方法,其特征在于,逐个计算所述每条关联数据中 的状态时间与表现时间的间隔,得到最小间隔值包括: 判断所述状态时间是否早于所述表现时间; 如果所述状态时间早于所述表现时间,则记录所述关联数据中与所述状态时间对应的 状态主键为负值,其中,所述状态主键为所述关联数据表中与所述状态时间对应的状态主 键; 如果所述状态时间晚于所述表现时间,则记录所述关联数据中与所述状态时间所对应 的状态主键为正值; 在记录的状态主键中查找最小的值;W及 将查找到的最小的值的绝对值所对应的所述关联数据表中的状态主键作为所述最小 间隔值。
5. 根据权利要求1所述的数据处理方法,其特征在于,在获取待查找的表现数据所对 应的待匹配表现时间之前,所述数据处理方法还包括: 获取所述状态数据表中的第一状态数据的第一状态时间和与所述第一状态数据对应 的第一状态主键; 获取待插入所述状态数据表中的第二状态数据的第二状态时间和第二状态主键; 判断所述第二状态时间是否早于所述第一状态时间; 如果所述第二状态时间早于所述第一状态时间,则将所述第二状态数据的第二状态主 键调整为所述第一状态主键,并将所述第一状态数据的第一状态主键调整为所述第二状态 主键; 如果所述第二状态时间晚于所述第一状态时间,则将所述第二状态数据的状态主键设 置为所述第二状态主键。
6. -种数据处理装置,其特征在于,包括: 第一获取单元,用于获取待查找的表现数据所对应的待匹配表现时间; 分组单元,用于对状态数据表和表现数据表关联得到的关联数据表中的关联数据进行 分组,其中,每个分组记录了具有相同广告主键的状态数据和表现数据; 第二获取单元,用于获取与所述待匹配表现时间相对应的多条关联数据,其中,每条关 联数据包括所述状态数据表中的一条状态数据和所述表现数据表中的一条表现数据; 计算单元,用于逐个计算所述每条关联数据中的状态时间与表现时间的间隔,得到最 小间隔值拟及 确定单元,用于将所述最小间隔值所对应的一条关联数据中的状态数据作为与所述待 匹配表现时间对应的数据。
7. 根据权利要求6所述的数据处理装置,其特征在于,所述数据处理装置还包括: 第H获取单元,用于在对状态数据表和表现数据表关联得到的关联数据表中的关联数 据进行分组之前,获取所述状态数据表和所述表现数据表; 提取单元,用于提取所述状态数据表的广告主键和所述表现数据表中的广告主键; 关联单元,用于依次将所述状态数据表中的每条状态数据与所述表现数据表中具有与 所述状态数据相同广告主键的每条表现数据相关联,得到关联数据表,其中,所述关联数据 表中的每条关联数据都包括状态数据和表现数据。
8. 根据权利要求6或7所述的数据处理装置,其特征在于,所述分组单元包括: 提取模块,用于提取具有相同所述广告主键的关联数据; 确定模块,用于在提取到的关联数据中将属于相同的所述表现时间的关联数据作为一 个分组。
9. 根据权利要求6所述的数据处理装置,其特征在于,所述计算单元包括: 判断模块,用于判断所述状态时间是否早于所述表现时间; 记录模块,用于在所述状态时间早于所述表现时间时,记录所述关联数据中与所述状 态时间所对应的状态主键为负值;在所述状态时间晚于所述表现时间时,记录所述关联数 据中与所述状态时间所对应的状态主键为正值,其中,所述状态主键为所述关联数据表中 与所述状态时间对应的状态主键; 查找模块,用于在记录的状态主键中查找最小的值;W及 确定模块,用于将查找到的最小的值的绝对值所对应的所述关联数据表中的状态主键 作为所述最小间隔值。
10. 根据权利要求6所述的数据处理装置,其特征在于,所述数据处理装置还包括: 第四获取单元,用于在获取待查找的表现数据所对应的待匹配表现时间之前,获取所 述状态数据表中的第一状态数据的第一状态时间和与所述第一状态数据对应的第一状态 主键; 第五获取单元,用于获取待插入所述状态数据表中的第二状态数据的第二状态时间和 第二状态主键; 判断单元,用于判断所述第二状态时间是否早于所述第一状态时间; 调整单元,用于在所述第二状态时间早于所述第一状态时间时,将所述第二状态数据 的第二状态主键调整为所述第一状态主键,并将所述第一状态数据的第一状态主键调整为 所述第二状态主键;在所述第二状态时间晚于所述第一状态时间时,将所述第二状态数据 的状态主键设置为所述第二状态主键。
【文档编号】G06Q30/02GK104463627SQ201410738571
【公开日】2015年3月25日 申请日期:2014年12月5日 优先权日:2014年12月5日
【发明者】吴充 申请人:北京国双科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1