一种互联网活动效果的分析方法及装置与流程

文档序号:13032149阅读:182来源:国知局
一种互联网活动效果的分析方法及装置与流程

本申请涉及数据分析领域,特别涉及一种互联网活动效果的分析方法及装置。



背景技术:

随着互联网行业的快速发展,互联网公司对于用户的争夺也越来越剧烈,通常互联网公司选择运营活动来引起用户的兴趣。面对运营活动的不断增多,互联网公司也要对运营活动的效果进行判断,调整运营活动的形式和内容。

通常判断运营活动需要通过三个指标:拉新、留存以及促活,以促活为例,让用户愿意频繁与你发生连接关系,通过数据分析用户喜好,增加粘性,用等级设置,激励体系等增加长期活跃性。对于促活中的用户在运营活动众的投资额为分析对象,其用户在运营活动中的投资额的提成往往与运营活动的优惠力度成正相关。同时还会通过对运营的推广来刺激用户进行投资。

目前不同平台都有大量的活动推广,当时针对不同的活动推广,对于不同的平台所使用的效益评价机制的差别很大。当互联网公司在不同平台投放活动推广时,难以对不同平台的活动推广的效益做有效的判断。

因此如何建立一套统一的活动推广评价机制,是本领域技术人所研究的重点问题。



技术实现要素:

本申请的目的是提供一种互联网活动效果的分析方法,通过建立统一的活动指标处理方法,其包括:指标筛选、异常数据处理以及指标权重计算方法,利用此方法对活动效果数据进行分析时可以找到指标的差异系数,确定指标的离散程度,从而得到指标的权重数据值,计算得到活动的综合得分,根据活动的综合得分确定运营活动的效果。

为解决上述技术问题,本申请提供一种互联网活动效果的分析方法,包括:

对服务器的用户指标进行筛选形成样本指标,并在样本指标中选取第一预定数量活动的第二预定数量指标组成原始指标数据;

将所述原始指标数据进行修正处理,得到修正指标数据;

根据所述修正指标数据进行权重计算处理得到每个所述第一预定数量活动的各所述第二预定数量指标的权重,并根据所述权重得出各所述第一预定数量活动的综合效果值。

可选的,所述对服务器的用户指标进行筛选形成样本指标,并在样本指标中选取第一预定数量活动的第二预定数量指标组成原始指标数据,包括:

在所述服务器采集所述用户指标,在预定部分的所述用户指标中根据用户之间的数据相关性筛选所述用户指标形成所述样本指标;

在所述样本指标中选取第一预定数量活动的第二预定数量指标组成原始指标数据。

可选的,将所述原始指标数据进行修正处理,得到修正指标数据,包括:

将所述原始指标数据按照四分位法进行分类,得到相应的四分位值;

根据四分位值,找出所述分类后的原始指标数据的异常值;

将所述异常值用对应的所述四分位值取代,得到修正指标数据。

可选的,根据所述修正指标数据进行权重计算处理得到每个所述第一预定数量活动的各所述第二预定数量指标的权重,并根据所述权重得出各所述第一预定数量活动的综合效果值,包括:

将所述修正指标数据进行标准化处理,得到标准指标数据;

根据各所述标准指标数据的差异程度,对各所述标准指标数据进行信息熵计算处理,得到所述权重;

利用所述权重对每个所述第一预定数量活动的各所述第二预定数量指标的比重进行计算,得出各所述活动的综合效果值。

可选的,还包括:

根据各所述活动的所述综合效果值,对各所述活动进行排名。

本申请还提供一种互联网活动效果的分析装置,包括:

原始指标数据获取模块,用于对服务器的用户指标进行筛选形成样本指标,并在样本指标中选取第一预定数量活动的第二预定数量指标组成原始指标数据;

修正指标数据获取模块,用于将所述原始指标数据进行修正处理,得到修正指标数据;

综合效果值获取模块,用于根据所述修正指标数据进行权重计算处理得到每个所述第一预定数量活动的各所述第二预定数量指标的权重,并根据所述权重得出各所述第一预定数量活动的综合效果值。

可选的,所述原始指标数据获取模块包括:

样本指标获取单元,用于在所述服务器采集所述用户指标,在预定部分的所述用户指标中根据用户之间的数据相关性筛选所述用户指标形成所述样本指标;

第一处理单元,用于在所述样本指标中选取第一预定数量活动的第二预定数量指标组成原始指标数据。

可选的,所述修正指标数据获取模块包括:

四分位值获取单元,用于将所述原始指标数据按照四分位法进行分类,得到相应的四分位值;

异常值获取单元,用于根据四分位值,找出所述分类后的原始指标数据的异常值;

第二处理单元,用于将所述异常值用对应的所述四分位值取代,得到修正指标数据。

可选的,所述综合效果值获取模块包括:

标准指标数据获取单元,用于将所述修正指标数据进行标准化处理,得到标准指标数据;

权重获取单元,用于根据各所述标准指标数据的差异程度,对各所述标准指标数据进行信息熵计算处理,得到所述权重;

第三处理单元,用于利用所述权重对每个所述第一预定数量活动的各所述第二预定数量指标的比重进行计算,得出各所述活动的综合效果值。

可选的,还包括:

活动排名模块,用于根据各所述活动的所述综合效果值,对各所述活动进行排名。

本申请所提供的一种互联网活动效果的分析方法,包括:对服务器的用户指标进行筛选形成样本指标,并在样本指标中选取第一预定数量活动的第二预定数量指标组成原始指标数据;将所述原始指标数据进行修正处理,得到修正指标数据;根据所述修正指标数据进行权重计算处理得到每个所述第一预定数量活动的各所述第二预定数量指标的权重,并根据所述权重得出各所述第一预定数量活动的综合效果值。

通过建立统一的活动指标处理方法,其包括:指标筛选、异常数据处理以及指标权重计算方法,利用此方法对活动效果数据进行分析时可以找到指标的差异系数,确定指标的离散程度,从而得到指标的权重数据值,计算得到活动的综合得分,根据活动的综合得分确定运营活动的效果。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种互联网活动效果的分析方法的流程图;

图2为本申请实施例提供的一种互联网活动效果的分析方法的原始指标数据获取的流程图;

图3为本申请实施例提供的一种互联网活动效果的分析方法的修正处理的流程图;

图4为本申请实施例提供的一种互联网活动效果的分析方法的权重计算处理的流程图;

图5为本申请实施例提供的一种互联网活动效果的分析装置的结构框图。

具体实施方式

本申请的核心是提供一种互联网活动效果的分析方法及装置,通过建立统一的活动指标处理方法,其包括:指标筛选、异常数据处理以及指标权重计算方法,利用此方法对活动效果数据进行分析时可以找到指标的差异系数,确定指标的离散程度,从而得到指标的权重数据值,计算得到活动的综合得分,根据活动的综合得分确定运营活动的效果。

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

请参考图1,图1为本申请实施例提供的一种互联网活动效果的分析方法的流程图。

本实施例提供一种互联网活动效果的分析方法,可以包括:

s101,对服务器的用户指标进行筛选形成样本指标,并在样本指标中选取第一预定数量活动的第二预定数量指标组成原始指标数据;

本实施例旨在对服务器中的用户行为指标数据进行筛选,选取适合数量行为指标作为处理的原始指标数据。对于一个活动来说,需要选取数量合适的指标数据作为分析的,而所选的指标数据除了数量要求以外还需要根据其相关系数进行选取。其原则为,选择相关系数比较小的数据作为样本指标,也就是说指标数据之间差异越大越适合作为效果分析的指标数据。如果某项指标的指标值全部相等,则该指标在综合评价中不起作用。

本步骤总的来说,就是根据指标的指标值之间的相关性选择数量合适的指标系数作为原始指标数据进行后续的操作。其中,不可避免的会存在一些对于数据的处理和变换操作,为了方便在分析时计算机对数据的读取以及处理,可以根据处理的实际问题以及处理环境进行选择如何处理数据,在此不再做赘述。

s102,将原始指标数据进行修正处理,得到修正指标数据;

在步骤s101的基础上,本步骤旨在对获取的原始指标数据中的异常数据进行修正操作。其中,异常数据是指在数据的集合中与众不同的数据,这些数据可能并非随机产生,而是产生与完全不同的机制。异常数据往往代表一种偏差或者新模式的开始,因此有时对异常数据的识别有时会比正常行为模式的数据更有价值,而有时异常数据对于分析过程会带来巨大的误差。对互联网运营活动的数据分析中,有时会应少数人的操纵得到一些不符合要求,不反应客观实时的异常数据,因此分析中会修正这些异常数据。

基于上述说明,执行的修正操作可以分为:获取原始指标数据中的异常数据和对该异常数据进行修正处理。其中,对于获取异常数据以及进行修正处理,不可避免的还会进行一些其他处理操作,具体选择什么的处理操作可以根据,具体的数据情况以及需要分析时的数据质量来进行选择,在此不再做赘述。

s103,根据修正指标数据进行权重计算处理得到每个第一预定数量活动的各第二预定数量指标的权重,并根据权重得出各第一预定数量活动的综合效果值。

在步骤s102的基础上,对修正后的数据根据每个指标中的指标值计算其的指标在活动效果影响中的影响所占权重。其中,需要根据各指标的差异程度利用信息熵的计算方法对各指标进行计算,得到指标的权重值。而对于不同的活动其中活动的指标所指代的属性都会存在不同程度的差异,而这种差异可以对于活动效果的分析造成一定的误差。因此,根据其指标间的差异程度进行计算得到的权重,可以抵消不同活动间的误差,得到评判标准统一的活动综合效果值,进而使用此效果值可以使活动分析中拥有统一的评判标准。

可选的,在对活动分析后得到每个指标的权重并计算出活动的综合效果值后,可以根据综合效果值对选取的活动之间进行排名,排名的顺序可以根据需要观察的角度选择从大到小或者从小到大,在此不再做限定。

请参考图2,图2为本申请实施例提供的一种互联网活动效果的分析方法的原始指标数据获取的流程图。

结合上一实施例,本实施例是针对上一实施例中如何获取原始指标数据做一个具体限定,本实施例的其他部分与上一实施例大体相同,具体相同的部分请参考上一实施例,在此不再做赘述。

本实施例可以包括:

s201,在服务器采集用户指标,在预定部分的用户指标中根据用户之间的数据相关性筛选用户指标形成样本指标;

本步骤旨在从服务器采集用户的行为治疗,并选取预定部分的行为信息指标构建指标体系,也就是样本指标。方便了后续的筛选操作,使筛选在特定的范围内进行,而无需遍历所有用户的行为数据。

s202,在样本指标中选取第一预定数量活动的第二预定数量指标组成原始指标数据。

在步骤s202的基础上,本步骤旨在从样本指标中根据数据的相关系数筛选数据。由于在分析中,指标数据间的差距越大其在综合评价中所起的作用也就越大,如果某个指标的指标值全部相等,则该指标在综合评价中不起作用。其指标的差距越大也就是代表指标的相关系数较小,因此,在筛选中应选择相关系数较小的数据作为样本数据。并且,根据分析的活动范围和所使用的指标范围选择适当数量的活动和指标。

在此可以选取n项活动,和n项活动中的m个指标形成原始指标数据:

x*j(j=1,...,m)

其中,对于某项指标x*j(j=1,...,m)的指标值用xij表示,在筛选中xij的差距越大代表了其相关系数越小。

请参考图3,图3为本申请实施例提供的一种互联网活动效果的分析方法的修正处理的流程图。

结合上一实施例,本实施例是针对上一实施例中如何进行修正处理操作做一个具体限定,本实施例的其他部分与上一实施例大体相同,具体相同的部分请参考上一实施例,在此不再做赘述。

本实施例可以包括:

s301,将原始指标数据按照四分位法进行分类,得到相应的四分位值;

本步骤旨在基于四分位法进行分类操作,并找到相关的四分位值。大体操作可以是将本数据活动某项指标对应的数据x*j(j=1,...,m)按照由小到大的顺序排列并分成四等份,并求出相应的四分位值。

其中,可以根据如下的公式计算四分位值:

对于每项指标的一组指标值由三个四分位数,分别为下四分位数、中四分位数以及上四分位数由q1、q2以及q3表示。

s302,根据四分位值,找出分类后的原始指标数据的异常值;

在步骤s301的基础上,本步骤旨在利用四分位值找出异常值。大体操作过程为,根据四分位值,讲每组的活动样本数据分别划分为q1、q2、q3以及q4四个区间,并利用区间中的数值进行相互的比对发现数据间差距异常的值并作为异常值。

例如,在对用户所参与活动红包的日均投资额指标数据采取四分位法,发现其中情人节的数据异常偏大,确定其为异常数据。对用户参与的红包人均活动投资额指标根据四分位法进行分析,发现用户参与放风筝活动和运气十足奖励来活动的落在q1区间,但放风筝活动数据相对于其他数据明显偏小,因此,将放风筝的活动数据作为异常数据。

s303,将异常值用对应的四分位值取代,得到修正指标数据。

在步骤s302的基础上,本步骤旨在将异常值进行修正操作。对于查找出的异常值选用与异常值差距最小的四分位值替换。也就是说,上述红包日均投资额指标中情人节的数据存在异常偏大的情况,其与三个四分位值中的q3差距最小,因此将异常数据用q3进行替换。总的来说,本步骤使用四分位值对异常值进行修正,可以使得数据变得平滑,指标对于模型的评价也更为精准。

请参考图4,图4为本申请实施例提供的一种互联网活动效果的分析方法的权重计算处理的流程图。

结合上一实施例,本实施例是针对上一实施例中如何进行权重计算处理操作做一个具体限定,本实施例的其他部分与上一实施例大体相同,具体相同的部分请参考上一实施例,在此不再做赘述。

本实施例可以包括:

s401,将修正指标数据进行标准化处理,得到标准指标数据;

本步骤旨在,对修正后的指标数据进行标准化处理,以便去除量纲的影响。其中,标准化处理中的标准是指将指标分为正向指标和负向指标,正向指标越大,用户指标数据提供的价值就越高,而负向指标的数据越小,用户的指标数据提供的价值就越低。

在此采用最小-最大规范方法对数据进行标准化处理,其中,对于正向指标:

对于负向指标:

其中,x'ij为第i项活动的第j个指标的数值,为了方便期间,标准化后活动数据仍记为xij

s402,根据各标准指标数据的差异程度,对各标准指标数据进行信息熵计算处理,得到权重;

在步骤s401的基础上,本步骤旨在根据各指标的差异程度,利用信息熵计算各指标的权重。

其中,信息熵是信息论中用来刻画信息无需的一个量,利用信息熵进行分析的基本思路是根据指标变异性的大小来确定客观权重。一般来说,若某个指标的信息熵越小,标明指标值的编译程度越大,提供的信息量也就越多,在综合评价中所能起到的作用越大,其权重也就越大。相反,熵越大表示信息的无序化程度越高,提供的信息量也越小,在综合评价中所起到的作用也越小,其权重也就越小。

首先计算第j个指标在第i项活动中的权重,来计算各个活动方案指标值的比重:

再计算第j个指标的熵值:

其中k>0;

最后计算第j项指标的差异系数:

gj=1-ej

其中,用熵值与1之间的差值来表示第j项指标的重要程度,对于第j项指标,熵值越小,差异系数越大,对活动方案的评价作用越大。

定义权数第j项指标所占权重:

s403,利用权重对每个第一预定数量活动的各第二预定数量指标的比重进行计算,得出各活动的综合效果值。

在步骤s402的基础上,本步骤旨在用指标的权重计算活动的综合得分:

本申请实施例提供了一种互联网活动效果的分析方法,通过建立统一的活动指标处理方法,其包括:指标筛选、异常数据处理以及指标权重计算方法,利用此方法对活动效果数据进行分析时可以找到指标的差异系数,确定指标的离散程度,从而得到指标的权重数据值,计算得到活动的综合得分,根据活动的综合得分确定运营活动的效果。

下面对本申请实施例提供的一种互联网活动效果的分析装置进行介绍,下文描述的一种互联网活动效果的分析装置与上文描述的一种互联网活动效果的分析方法可相互对应参照。

请参考图5,图5为本申请实施例提供的一种互联网活动效果的分析装置的结构框图。

该系统可以包括:

原始指标数据获取模块100,用于对服务器的用户指标进行筛选形成样本指标,并在样本指标中选取第一预定数量活动的第二预定数量指标组成原始指标数据;

修正指标数据获取模块200,用于将原始指标数据进行修正处理,得到修正指标数据;

综合效果值获取模块300,用于根据修正指标数据进行权重计算处理得到每个第一预定数量活动的各第二预定数量指标的权重,并根据权重得出各第一预定数量活动的综合效果值。

可选的,原始指标数据获取模块100可以包括:

样本指标获取单元,用于在服务器采集用户指标,在预定部分的用户指标中根据用户之间的数据相关性筛选用户指标形成样本指标;

第一处理单元,用于在样本指标中选取第一预定数量活动的第二预定数量指标组成原始指标数据。

可选的,修正指标数据获取模块200可以包括:

四分位值获取单元,用于将原始指标数据按照四分位法进行分类,得到相应的四分位值;

异常值获取单元,用于根据四分位值,找出分类后的原始指标数据的异常值;

第二处理单元,用于将异常值用对应的四分位值取代,得到修正指标数据。

可选的,综合效果值获取模块300可以包括:

标准指标数据获取单元,用于将修正指标数据进行标准化处理,得到标准指标数据;

权重获取单元,用于根据各标准指标数据的差异程度,对各标准指标数据进行信息熵计算处理,得到权重;

第三处理单元,用于利用权重对每个第一预定数量活动的各第二预定数量指标的比重进行计算,得出各活动的综合效果值。

可选的,该装置还可以包括:

活动排名模块,用于根据各活动的综合效果值,对各活动进行排名。

说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

以上对本申请所提供的一种互联网活动效果的分析方法及装置进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1