一种评估不同数据源数据准确度的方法和装置与流程

文档序号:12465893阅读:371来源:国知局
一种评估不同数据源数据准确度的方法和装置与流程

本发明涉及互联网广告投放技术领域,特别是一种评估不同数据源数据准确度的方法和装置。



背景技术:

现在很多企业在互联网平台的不同媒体上投放广告,为了提升广告的投放效果、更好地完成营销目标,通常会使用各数据源的人群标签来进行定向投放。但来自不同数据源的人群标签数据匹配度和准确度不一。目前,仅能通过广告投放后第三方监测公司监测到的相关数据来了解各数据源人群标签的情况。事实上,这种投放后才能得知数据匹配度和准确度情况的方式增大了企业的营销成本。

中国发明专利CN 105989020 A公开了一种呼叫网络多数据源匹配的方法,包括:获取预设时间段内针对以预定电话号码的呼叫日志;获取预定时间段内针对一预定网络的用户访问日志,预定网络包括发布有预定广告素材的网络媒体和预定广告素材所链接至的预定网站,且预定广告素材和预定网站中均提示有预定电话号码;根据呼叫日志与用户访问日志之间的关联程度,为每条呼叫日志筛选出一条关联程度最为紧密的用户访问日志,作为该呼叫日志对应的用户访问日志;根据每条用户呼叫日志对应的用户访问日志中的URL或Refer URL,确定呼叫日志的来源网络媒体;统计每个来源网络媒体对应的会叫日志的数量。



技术实现要素:

本发明需要解决的技术问题是提供一种评估各数据源数据准确度的方法和装置。

为解决上述的技术问题,本发明的一种评估不同数据源数据准确度的方法,包括以下步骤,

步骤S101:数据采集,离线导入各数据源的人群标签数据,统一数据格式并存储;

步骤S102:数据验证,根据设备ID与人群标签的映射关系,基于可复核大数据样本的设备ID与人群属性,匹配、验证得出标签数据的准确度;

步骤S103:数据应用,根据设备ID与人群标签的映射关系,将标签数据应用于实际的广告活动投放中,埋码收集广告活动投放时的曝光、点击、转化等数据;根据标签数据用于广告活动的反馈数据,分析得出这些标签数据中设备ID与所携带标签的相关度;

步骤S104:数据评分,根据所述步骤S102和S103中分析得出的标签准确度和标签相关度,给这两个数值赋予权值计算得出该数据源该标签维度的综合评分。

步骤S105:数据报告,统计每个数据源已知标签数据的准确度、相关度、评分,通过界面展示出报告结果。

进一步的,所述步骤S101中采集各数据源的人群标签数据后,基于设备ID,将来自各数据源的人群标签数据与可复核大数据样本进行匹配、验证。

进一步的,步骤S101和步骤S103中数据采集形式包括离线导入形式和埋码形式。

更进一步的,通过离线导入的形式,将各数据源的人群标签数据采集到系统模块中,数据至少包括设备id、人群标签这二个字段,且每个设备id携带多个人群标签字段;通过埋码的形式,将各人群标签数据用于广告活动中的投放效果采集到系统模块中,数据至少包括活动id、设备id、人群标签、曝光、转化这六个字段。

本发明还包括一种评估不同数据源数据准确度的装置,包括依次连接的数据采集模块、数据验证模块、数据应用模块、数据评分模块和数据报告模块;其中,

数据采集模块,用来采集各数据源的人群标签数据,统一数据的格式并存储;

数据验证模块,根据来自各数据源的设备ID与人群标签的映射关系,分析得出各数据源数据与可复核大数据样本相匹配的准确度;

数据应用模块:将标签数据应用于投放,根据广告活动反馈数据,可以分析得出各数据源数据的相关度;

数据评分模块,根据数据验证模块和数据应用模块的结果对各数据源的各数据维度进行综合评分;

数据报告模块,统计出每个数据源已知数据的准确度、相关度和综合评分,通过界面展示出报告结果。

采用上述结构和方法后,本发明通过各数据源提供的人群标签数据,分析、验证各人群标签,评估出各数据源数据的匹配度和准确度,基于该验证结果和广告活动反馈数据给该维度数据评分,以供投放时参考,以降低企业营销成本。

附图说明

下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明一种评估不同数据源数据准确度的方法的流程图。

图2为本发明一种评估不同数据源数据准确度的装置的结构框图。

图中:1为数据采集模块,2为数据验证模块,3为数据应用模块,4为数据评分模块,5为数据报告模块

具体实施方式

如图1所示,本发明的一种评估不同数据源数据准确度的方法,包括以下步骤,

步骤S101:数据采集,离线导入各数据源的人群标签数据,统一数据格式并存储;

步骤S102:数据验证,根据设备ID与人群标签的映射关系,基于可复核大数据样本的设备ID与人群属性,匹配、验证得出标签数据的准确度;

步骤S103:数据应用,根据设备ID与人群标签的映射关系,将标签数据应用于实际的广告活动投放中,埋码收集广告活动投放时的曝光、点击、转化等数据;根据标签数据用于广告活动的反馈数据,分析得出这些标签数据中设备ID与所携带标签的相关度;

步骤S104:数据评分,根据所述步骤S102和S103中分析得出的标签准确度和标签相关度,给这两个数值赋予权值计算得出该数据源该标签维度的综合评分。

步骤S105:数据报告,统计每个数据源已知标签数据的准确度、相关度、评分,通过界面展示出报告结果。

进一步的,所述步骤S101中采集各数据源的人群标签数据后,基于设备ID,将来自各数据源的人群标签数据与可复核大数据样本进行匹配、验证。

进一步的,步骤S101和步骤S103中数据采集形式包括离线导入形式和埋码形式。

更进一步的,通过离线导入的形式,将各数据源的人群标签数据采集到系统模块中,数据至少包括设备id、人群标签这二个字段,且每个设备id携带多个人群标签字段;通过埋码的形式,将各人群标签数据用于广告活动中的投放效果采集到系统模块中,数据至少包括活动id、设备id、人群标签、曝光、转化这六个字段。

如图2所示,本发明还包括一种评估不同数据源数据准确度的装置,包括依次连接的数据采集模块1、数据验证模块2、数据应用模块3、数据评分模块4和数据报告模块5;其中,

数据采集模块1,用来采集各数据源的人群标签数据,统一数据的格式并存储;

数据验证模块2,根据来自各数据源的设备ID与人群标签的映射关系,分析得出各数据源数据与可复核大数据样本相匹配的准确度;

数据应用模块3:将标签数据应用于投放,根据广告活动反馈数据,可以分析得出各数据源数据的相关度;

数据评分模块4,根据数据验证模块和数据应用模块的结果对各数据源的各数据维度进行综合评分;

数据报告模块5,统计出每个数据源已知数据的准确度、相关度和综合评分,通过界面展示出报告结果。

虽然以上描述了本发明的具体实施方式,但是本领域熟练技术人员应当理解,这些仅是举例说明,可以对本实施方式作出多种变更或修改,而不背离本发明的原理和实质,本发明的保护范围仅由所附权利要求书限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1