一种数据处理方法、装置、电子设备及存储介质与流程

文档序号:25584249发布日期:2021-06-22 16:48阅读:108来源:国知局
一种数据处理方法、装置、电子设备及存储介质与流程

本申请涉及计算机技术领域,尤其涉及一种数据处理方法、装置、电子设备及存储介质。



背景技术:

合约广告表示按照提前约定的广告展示量,来进行售卖的固定位广告形式,需要保证交付量,但是在实际业务流程中,经常会发生流量方资源不能满足广告主需求,即发生了缺量的情况,缺量不仅会影响投放广告业务方的收入,也会影响广告主的投放效果和需求,因此如何有效对缺量原因进行分析并进行挽回是非常有必要的。

相关技术中,主要是在投放后发生缺量时,人工分析缺量原因,进而相关运营人员介入采取相应措施来实现收入挽回,但是这种方式,只能在缺量发生后才能进行原因分析,时效性较差,并且采用人工分析的方式,人力成本较高,效率和准确性也较低。



技术实现要素:

本申请实施例提供一种数据处理方法、装置、电子设备及存储介质,以提高数据处理效率和准确性。

本申请实施例提供的具体技术方案如下:

本申请一个实施例中提供了一种数据处理方法,包括:

分别针对各统计周期,获得符合目标多媒体对象的召回条件的各目标用户;

针对所述各统计周期,分别确定相应的各目标用户在各维流量类型的分布结果,其中,所述各维流量类型表示所述目标多媒体对象所对应的流量分配逻辑,所述分布结果至少包括所述各维流量类型所对应分配的目标用户的数量;

接收到终端针对所述目标多媒体对象的流量分布查询请求时,将在所述各统计周期中确定的分布结果发送给所述终端以进行展示;

根据在所述各统计周期中所述各维流量类型所对应分配的目标用户的数量,确定所述目标多媒体对象发生流量分配缺量的缺量类型。

本申请另一个实施例中提供了一种数据处理方法,包括:

响应于针对目标多媒体对象的流量分布查询操作,展示所述目标多媒体对象在各统计周期中确定的相应的各目标用户的分布结果,其中,所述分布结果至少包括各维流量类型所对应分配的目标用户的数量,在各统计周期中确定的各维流量类型所对应分配的目标用户的数量,用于确定所述目标多媒体对象发生流量分配缺量的缺量类型;

其中,所述各目标用户为服务器分别在各统计周期中,根据所述目标多媒体对象的召回条件而获得的,所述分布结果是服务器分别在各统计周期中,确定的所述相应的各目标用户在各维流量类型的分布结果,所述各维流量类型表示所述目标多媒体对象所对应的流量分配逻辑。

本申请另一个实施例中提供了一种数据处理装置,包括:

获得模块,用于分别针对各统计周期,获得符合目标多媒体对象的召回条件的各目标用户;

第一确定模块,用于针对所述各统计周期,分别确定相应的各目标用户在各维流量类型的分布结果,其中,所述各维流量类型表示所述目标多媒体对象所对应的流量分配逻辑,所述分布结果至少包括所述各维流量类型所对应分配的目标用户的数量;

处理模块,用于接收到终端针对所述目标多媒体对象的流量分布查询请求时,将在所述各统计周期中确定的分布结果发送给所述终端以进行展示;

第二确定模块,用于根据在所述各统计周期中所述各维流量类型所对应分配的目标用户的数量,确定所述目标多媒体对象发生流量分配缺量的缺量类型。

本申请另一个实施例中提供了一种数据处理装置,包括:

展示模块,用于响应于针对目标多媒体对象的流量分布查询操作,展示所述目标多媒体对象在各统计周期中确定的相应的各目标用户的分布结果,其中,所述分布结果至少包括各维流量类型所对应分配的目标用户的数量,在各统计周期中确定的各维流量类型所对应分配的目标用户的数量,用于确定所述目标多媒体对象发生流量分配缺量的缺量类型;

其中,所述各目标用户为服务器分别在各统计周期中,根据所述目标多媒体对象的召回条件而获得的,所述分布结果是服务器分别在各统计周期中,确定的所述相应的各目标用户在各维流量类型的分布结果,所述各维流量类型表示所述目标多媒体对象所对应的流量分配逻辑。

本申请另一个实施例中提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一种数据处理方法的步骤。

本申请另一个实施例中提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种数据处理方法的步骤。

本申请另一个实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的任一种数据处理方法。

本申请实施例中,分别针对各统计周期,获得符合目标多媒体对象的召回条件的各目标用户,并针对所述各统计周期,分别确定相应的各目标用户在各维流量类型的分布结果,其中,所述各维流量类型表示所述目标多媒体对象所对应的流量分配逻辑,所述分布结果至少包括所述各维流量类型所对应分配的目标用户的数量,进而接收到终端针对所述目标多媒体对象的流量分布查询请求时,将在所述各统计周期中确定的分布结果发送给所述终端以进行展示,从而可以根据在所述各统计周期中所述各维流量类型所对应分配的目标用户的数量,确定所述目标多媒体对象发生流量分配缺量的缺量类型,这样,在各统计周期内分别进行自动化统计分析,并且考虑召回的各目标用户的分层流量,确定各统计周期中召回流量的分布结果的动态变化过程,保证了时效性,自动化分析缺量原因,也提高了效率和准确性,以及将分布结果进行可视化展示,可以有效提高对缺量问题的监控和分析的效率。

附图说明

图1为本申请实施例中合约广告缺量及影响分析示意图;

图2为本申请实施例中合约广告缺量原因分布示意图;

图3为本申请实施例中数据处理方法的应用架构示意图;

图4为本申请实施例中一种数据处理方法流程图;

图5为本申请实施例中数据结构示意图;

图6为本申请实施例中数据分析引擎功能示例图;

图7为本申请实施例中召回与询量系统的分配功能示意图;

图8为本申请实施例中数据分析引擎的索引与查询逻辑示意图;

图9为本申请实施例中可视化方式示意图;

图10为本申请实施例中另一种数据处理方法流程图;

图11为本申请实施例中数据处理方法的整体方案逻辑示意图;

图12为本申请实施例中可视化展示结果界面示意图;

图13为本申请实施例中一种数据处理装置结构示意图;

图14为本申请实施例中另一种数据处理装置结构示意图;

图15为本申请实施例中电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,并不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

为便于对本申请实施例的理解,下面先对几个概念进行简单介绍:

合约广告(guaranteeddelivery,gd):合约广告是以展示广告为导向的一种投放方式,指原生商业推广合约产品,保证交付量的广告,即按照提前约定的广告展示量(即曝光量),来进行售卖的固定位广告形式,合约广告与竞价广告不同,竞价广告是以效果为导向的一种自主投放方式,而合约广告保证交付量,可以帮助广告主按照约定的曝光量进行投放,合适需求曝光量的广告主。

缺量:由于合约广告的特点(即先锁量,后投放的业务逻辑),在实际业务流程中,可能会发生流量方资源即曝光量不能满足广告主需求的情况,本申请实施例中将流量方资源不能满足广告主需求的情况称作缺量。

多维分析:是一种数据分析方法,表示对通过多维形式组织起来的数据进行上卷、下钻、切片、切块、旋转等各种分析操作,使分析者能从多个角度、多个侧面观察数据库中的数据,从而更深入地了解包含在数据中的信息,例如本申请实施例中在数据分析引擎中,主要是采用切块和上卷方式,对每个统计周期中召回流量进行分析而获得召回流量的分布情况。

切块:在多维数据结构中,按二维进行切片,按三维进行切块,可得到所需要的数据,例如在“城市、产品、时间”三维立方体中进行切块和切片,可以得到各城市、各产品的销售情况。

上卷:表示从细粒度数据向高层的聚合,例如本申请实施例中可以按照流量的属性将流量聚合成不同的组(group),从结构化查询语言(structuredquerylanguage,sql)数据库模拟语句的角度来说,切块为where语句,上卷为groupby语句。

启发式(heuristic)方法:表示在解决问题时所采取的一种根据经验规则进行发现的方法,是一种可以不断迭代最后找到局部最优解的方法,例如本申请实施例中在询量系统中可以按照启发式方法将流量动态最优地分配给各个订单。

缺量类型:本申请实施例中缺量类型也可以表示发生流量分配缺量的原因,可以预先设置多个缺量类型,也可以通过分析确定缺量类型。

合约广告经常会发生缺量情况,如何有效对缺量原因进行分析并进行挽回是非常有必要的,相关技术中,主要是在投放后发生缺量时,人工分析缺量原因,进而相关运营人员介入并采取相应措施来实现收入挽回,但是这种方式,只能在投放日缺量发生后才能进行原因分析,时效性较差,并且采用人工分析的方式,人力成本较高,效率和准确性也较低。

因此,针对上述问题,本申请实施例中提供了一种数据处理方法,分别针对各统计周期,获得符合目标多媒体对象的召回条件的各目标用户,并针对各统计周期,分别确定相应的各目标用户在各维流量类型的分布结果,其中,各维流量类型表示目标多媒体对象所对应的流量分配逻辑,进而接收到终端发送的针对目标多媒体对象的流量分布查询请求时,将在各统计周期中确定的分布结果发送给终端以进行展示,并且还可以根据展示的在各统计周期中的分布结果,确定目标多媒体对象发生流量分配缺量的缺量类型,这样,在各统计周期内分别进行自动化统计分析,而不是仅在投放日发生缺量后才进行原因分析,根据各个统计周期确定的分布结果进行分析,保证了时效性,并且自动化地分析缺量原因,提高了效率和准确性,以及对统计的分布结果进行可视化展示,可以有效提高对缺量问题的监控和分析的效率,从而提高流量的利用率和业务收入。

本申请实施例中主要针对合约广告,实际上,对于合约广告的缺量原因进行分析进而进行调整和收入挽回是非常必要的,为了更好地理解本申请实施例,下面先对合约广告进行简单说明。

目前,合约广告业务流程主要分为四个阶段:资源询量,下单锁量,订单投放和监控结算。其中,资源询量和下单锁量属于售卖阶段,订单投放和监控结算属于投放阶段。参阅图1所示,为本申请实施例中合约广告缺量及影响分析示意图,如图1所示,广义的合约广告缺量问题主要以两种形式呈现:1)在售卖阶段,合约广告售卖引擎预估的资源剩余量不能满足广告主需求,例如在资源询量阶段,定向条件为地区a的资源最大剩余量,如理想是50w而实际上只有15w,而广告主的下单锁量需求为20w,可知在售卖阶段预估的资源剩余量已经不满足广告主的需求。2)在投放阶段,实际广告投放引擎分配给广告主的曝光量未能满足订单合约中的约定量,即下单锁量的数目,例如,广告主的下单锁量需求为20w,而在实际投放时分配的只有10w,不满足广告主的投放数量需求。

上述两种缺量问题都会影响合约广告业务线的收入,例如,若在售卖阶段发生缺量,则不能有效消化广告主的预算,客户预算流失,若在投放阶段发生缺量,则广告主就会依据合约进行索赔,因此,解决或缓解缺量问题可以有效保证合约广告业务线的收入。

进而通过对缺量问题的原因进行分析,可知导致合约广告缺量问题的原因有很多,例如参阅图2所示,为本申请实施例中合约广告缺量原因分布示意图,如图2所示,30%的原因可能来自于系统缺陷:例如售卖与投放阶段,对订单定向的理解不一致,例如订单的定向需求为上海女性的流量,而售卖时分配给了上海男性的流量,实际投放上海女性的流量明显低于上海男性的流量,发生缺量,又例如,售卖与投放阶段的频控策略不一致等,这部分原因主要是需要通过修复系统逻辑漏洞来解决。另一部分原因可能来自于系统固有的业务逻辑:例如,后下的高优先级订单可以挤占先下的低优先级订单的流量(当整体流量不能同时满足双方的时候),会导致低优先级订单在投放时发生缺量,又例如,为库存预估太高、频控过滤策略太严格等,这部分原因占比70%左右,通常是难以消除的。

通过对缺量原因分布的分析可知,想要完全消除缺量问题比较困难,因此解决缺量问题的重点,更应该着眼于发生缺量后如何挽回收入,而不是消除缺量,可以表现在下列方面:1)在确定了询量不足的原因之后根据缺量原因和缺量数量自动确定与其对应调整策略,并在系统中应用该调整策略;2)对于询量阶段来说,通过找到询量不足的原因,销售人员调整下单策略,从而留住广告主的预算;3)对于投放阶段来说,同样分析缺量原因,运营人员及时根据分析结果采取相应的挽回措施。

基于上述分析,本申请实施例中主要是基于合约广告的特性,构建询量系统逻辑和投放过程中的流量漏斗模型,即目标多媒体对象的流量分配逻辑,通过数据分析引擎进行自动化数据分析,从而确定各统计周期的召回流量的分布结果,进行可视化展示而实现对目标多媒体对象的缺量原因的可视化分析。

参阅图3所示,为本申请实施例中数据处理方法的应用架构示意图,包括终端100和服务器200。

终端100可以是智能手机、平板电脑、便携式个人计算机、台式计算机、智能电视、智能机器人、车载电子设备等任何智能设备,终端100上可以安装有各种应用程序(application,app),例如,本申请实施例中终端100中可以安装有多媒体对象投放效果监控分析平台,用户可以针对某个目标多媒体对象的流量分布进行查询,终端100响应于流量分布查询操作,可以展示该目标多媒体对象在各统计周期中召回的各目标用户的分布结果。

服务器200能够为终端100提供各种网络服务,对于不同的应用程序,服务器200可以认为是相应的后台服务器,例如本申请实施例中,服务器200主要为终端100展示的分布结果提供后台数据分析支持,服务器200可以根据目标多媒体对象的召回条件,从数据库中获得符合召回条件的各目标用户,即为召回流量,并且可以根据目标多媒体对象的流量分配逻辑,确定召回的各目标用户在各维流量类型的分布结果,例如,通常目标多媒体对象的召回流量,经过各维流量类型过滤,例如高优先级挤占、频控条件等,最后分配给目标多媒体对象的流量可能只占其中一部分,将该目标多媒体对象的各统计周期所对应召回流量的分布结果,生成可视化图形,进而发送给终端100进行展示,这样,相关人员可以根据可视化展示的图形,快速准确性地确定发生缺量的缺量类型,即确定缺量原因。

其中,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(contentdeliverynetwork,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。

另外,服务器进行流量分配、广告投放等广告投放链条上不同环节,由于数据较难以透明监控,可能会带来造假风险,因此本申请实施例中还可以应用区块链技术,区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。例如,可以采用区块链技术,将广告的交易和购买策略,均可以通过区块链系统中节点的智能合约功能,通过智能合约的形式,记录在区块链系统中,智能合约为计算机化的协议,可以执行某个合约的条款,通过部署在共享账本上的用于在满足一定条件时而执行的代码实现,根据实际的业务需求代码用于完成自动化的交易,进而在双方参与者达到合约要求,均自动履行合约规定的义务,并通过合约执行前置条件的判断,自动执行智能合约,确保在整个投放过程中,整个产业链价值达到最大化,这样可以在没有第三方监控和参与的机制下,智能完成广告交易和流量购买,提升整个交易平台的完善性。又例如,区块链技术是一种分布式记账,还可以基于区块链技术的数据防篡改、数据可追溯特点,在进行广告交易时采用一种协商和公开一致的规范进行数据交易,这种交易是不支持私自篡改的,可以实现数据公开透明,能够非常有效的避免流量造假和广告作弊,本申请实施例中的数据处理方法中所涉及到的数据可以保存于区块链上。当然可以使用区块链技术,应用到广告投放或交易的其它环节,本申请实施例中并不进行限制。

终端100与服务器200之间可以通过互联网相连实现相互之间的通信。可选地,上述的互联网使用标准通信技术和/或协议。互联网通常为因特网、但也可以是任何网络,包括但不限于局域网(localareanetwork,lan)、城域网(metropolitanareanetwork,man)、广域网(wideareanetwork,wan)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合。在一些实施例中,使用包括超文本标记语言(hypertextmark-uplanguage,html)、可扩展标记语言(extensiblemarkuplanguage,xml)等的技术和/或格式来代表通过网络交换的数据。此外还可以使用诸如安全套接字层(securesocketlayer,ssl)、传输层安全(transportlayersecurity,tls)、虚拟专用网络(virtualprivatenetwork,vpn)、网际协议安全(internetprotocolsecurity,ipsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。

需要说明的是,本申请实施例中的应用架构图是为了更加清楚地说明本申请实施例中的技术方案,并不构成对本申请实施例提供的技术方案的限制,不仅可以应用于合约广告的缺量原因分析场景,对于其它的应用架构和业务应用并不进行限制,本申请实施例提供的技术方案对于类似的问题,同样适用。

本申请各个实施例中,以数据处理方法应用于图3所示的应用架构为例进行示意性说明,并且为便于说明,本申请实施例中主要以目标多媒体对象为合约广告为例进行说明。

基于上述实施例,参阅图4所示,为本申请实施例中一种数据处理方法流程图,应用于服务器,具体该方法包括:

步骤400:分别针对各统计周期,获得符合目标多媒体对象的召回条件的各目标用户。

本申请实施例中,当目标多媒体对象,例如为合约广告订单缺量发生时,运营人员分析缺量原因的逻辑主要是追溯定向召回流量的去向,即分析符合定向召回条件的流量的去向,因此在进行缺量原因分析时,需要先获得召回流量。

具体执行步骤400时,包括:在目标多媒体对象对应的预设生命周期中,分别获得在各统计周期中符合目标多媒体对象的召回条件的各目标用户。

其中,若目标多媒体对象为广告,则预设生命周期表示从目标多媒体对象的下单日开始,直至到投放日,各统计周期小于预设生命周期,例如统计周期为每天,具体本申请实施例中并不进行限制。

也就是说,本申请实施例中,在进行流量分布分析时,不是仅在投放日进行分析,而是在目标多媒体对象的订单的整个生命周期中,按照统计周期分别统计流量分布,例如,下单日为10月1日,投放日为10月10日,则该目标多媒体对象的生命周期为从10月1日至10月10日,统计周期为1天,则可以分别在10月1日至10月10日包含的每天分别进行统计分析,进而可以获得动态的流量分布变化趋势。

步骤410:针对各统计周期,分别确定相应的各目标用户在各维流量类型的分布结果,其中,各维流量类型表示目标多媒体对象所对应的流量分配逻辑,分布结果至少包括各维流量类型所对应分配的目标用户的数量。

本申请实施例中,各维流量类型即为在对目标多媒体对象进行流量分配时所采用的各个流量分配逻辑,为便于理解,下面先对本申请实施例中所依赖的数据结构进行说明:本申请实施例中,以目标多媒体对象为合约广告为例,根据合约广告的业务逻辑,可以将根据召回条件获得的召回流量,即召回的各目标用户构建成一个漏斗模型,参阅图5所示,为本申请实施例中数据结构示意图,召回流量经过漏斗模型的过滤,最后分配给目标多媒体对象的只占其中一部分,通过漏斗模型,将召回流量分到各个流量类型中,本申请实施例中可以将这种流量分层的方式称作流量分层模型,分层结果叫做流量分布。

其中,如图5中的漏斗模型中各层的条件即为流量类型,例如流量类型包括静态过滤(例如定向召回)、高优先级挤占、动态过滤(例如频控条件)、新鲜度过滤策略、选单策略、混排策略等,具体地,静态过滤例如为定向召回策略,即通过目标多媒体对象的召回条件而进行过滤筛选,可以获得符合召回条件的各目标用户,召回流量并不能全部分配给该目标多媒体对象,还需要进行各层过滤;高优先级挤占表示根据各个多媒体对象的订单优先级而进行过滤,通常会优先将流量分配给高优先级的多媒体对象,即比目标多媒体对象的优先级较高的多媒体对象可能会挤占掉部分流量;动态过滤例如为频控条件,通常若针对同一个目标用户重复投放了多次,则可能会造成该目标用户的反感,反而降低了投放效果,因此为了保证投放效果,可以通过频控条件对这部分目标用户进行过滤,例如频控条件为过滤掉投放频次大于阈值的目标用户;新鲜度过滤策略类似于频控条件,频繁地投放给同一目标用户,会降低新鲜度也会造成用户的反感,降低投放效果;选单策略表示同优先级的多媒体对象之间的其它竞争策略,例如可以为优先分配给下单时间更早的等,具体并不进行限制;混排策略表示不同类型多媒体对象之间的竞争策略,例如,竞价广告和合约广告之间的竞争策略。

这样,目标多媒体对象的召回流量,即符合召回条件的各目标用户,通过各个维度的流量类型的过滤,获得最终分配给目标多媒体对象的分配量,并且可以获得各流量类型所对应过滤掉的流量,进而即获得了召回流量在各维流量类型的分布结果。

从而例如,如图5所示,本申请实施例中可以在目标多媒体对象的生命周期中,即下单日至投放日,统计每天的流量分布,进行动态监控跟踪,方便运营人员查看整个生命周期中流量分布的变化趋势,例如图5是以流量类型包括定向召回、高优先级挤占、频控、新鲜度、同级单挤占、分配量为例进行说明,可以统计每天各维流量类型中的分布结果,例如包括流量的数目、占比等。

本申请实施例中,实现召回和分布结果的统计分析等业务逻辑,需要依赖一个数据分析引擎,该数据分析引擎具有切块和上卷的功能,可以对各多媒体对象的订单与流量的分配数据进行上卷与切块的分析,从而获得所需的数据分析结果。

例如,参阅图6所示,为本申请实施例中数据分析引擎功能示例图,通过定向召回条件可以获得各个多媒体对象的订单与流量关联关系,例如分析维度包括地域、订单和平台,并且地域包括地区a、地区b和地区c,平台包括ios、android和hs,订单包括订单1、订单2和订单3,通过切块功能,固定一个维度进行数据分析,通过上卷功能可以将同一类型维度进行聚合分析,例如将ios、android和hs聚合为全平台维度,可以分析订单1、订单2和订单3分别在地区a、地区b和地区c的全平台上的流量分布。

这样,可以基于切块和上卷功能,可以从不同粒度、不同维度等来分析各多媒体对象的订单与流量分配情况。

则执行步骤410时,具体包括:

s1、针对各统计周期,分别根据启发式方法,将相应的各目标用户分配给各多媒体对象,获得各目标用户与所述各多媒体对象的关联关系。

例如,参阅图7所示,为本申请实施例中召回与询量系统的分配功能示意图,切块能力可以根据订单的定向找到满足定向召回条件的召回流量,例如图7中库存召回即可以根据切块功能,获得满足各个召回条件的各目标用户,基于召回的流量,询量系统可以按照启发式方法将召回流量最优地分配给各个多媒体对象的订单,其中启发式方法是一种动态分配方式,相比于先入先出队列(firstinputfirstoutput,fifo)的静态分配方式,可以提高流量利用率和分配效率,具体地启发式方法基本原理是根据经验规则进行发现的方法,通过不断迭代最终找到局部最优解,例如一种方式为,将对应确定的召回流量,根据订单先后顺序,依次分配给对应的订单,但是若第一订单的召回流量有至少两种,分别为召回流量1和召回流量2,并第二订单的召回流量只有一种为召回流量1,则可以不按照第一订单和第二订单的下单时间顺序,而优先将召回流量1分配给第二订单,实现动态分配,并提高流量利用率和分配率。例如,获得满足不同召回条件的召回流量,即在资源询量阶段获得的最大剩余流量,图7中si表示召回流量,即库存所提供流量,di表示各个多媒体对象的订单所需的流量,如图7中,满足地域为“地区a”、性别为“男”、内容为“新闻”的召回流量为s1,这部分召回流量基于流量分配逻辑可能会分配给了订单1和订单2,即可以预估出各个订单在投放前的所预估的分配量。

另外需要说明的是,本申请实施例中,可以从下单日开始直至到投放日,按照统计周期进行分布结果分析,投放日之前的数据分析通常是由预估系统执行,预估系统可以在每个统计周期中进行数据分析处理,利用切块能力,能够实现投放前的订单-流量关联关系,即流量分配逻辑,而投放日的数据分析可以由投放系统实现,从投放系统所上报的数据中可以获得订单与流量的关联关系。

s2、根据各目标用户与各多媒体对象的关联关系和各维流量类型,分别统计相应的各目标用户在各维流量类型下的分布结果。

上卷能力能够按照流量的属性(例如,年龄、性别、地域、流量类型等)将流量聚合成不同组(group),因此,本申请实施例中,主要是利用上卷能力对流量的流量类型和时间进行上卷,这样,利用上卷能力,能够获得各多媒体对象订单的流量分层结果,即召回的各目标用户在各维流量类型的分布结果。

进而,本申请实施例中,基于数据分析引擎的切块和上卷功能,可以通过索引和查询实现在不同维度下的数据分析。

例如,参阅图8所示,为本申请实施例中数据分析引擎的索引与查询逻辑示意图,通过where语句进行切块而获得符合多媒体对象的召回条件的各目标用户,例如库存1为符合男、地区a的各目标用户,库存2为符合女、地区a的各目标用户,库存3为符合男、地区b的各目标用户,若目标多媒体对象的召回条件为男、地区a,则通过where语句指定维度男和地区a,进而获得符合该目标多媒体对象的召回的各目标用户为库存1中的用户。又例如,以性别、地域、内容维度为例,通过groupby语句在性别、地域维度对某多媒体对象的订单分配量进行上卷聚合,性别为男、地域为地区b的该某多媒体对象的订单分配量为4,总库存为5。

这样,通过该数据分析引擎,可以获得各多媒体对象在每个统计周期的召回流量的分布情况,即在各维流量类型的分层分布结果。

步骤420:接收到终端针对目标多媒体对象的流量分布查询请求时,将在各统计周期中确定的分布结果发送给终端以进行展示,根据在各统计周期中各维流量类型所对应分配的目标用户的数量,确定目标多媒体对象发生流量分配缺量的缺量类型。

本申请实施例中可以将各统计周期确定的分布结果,以可视化的形式进行展示,更加便于相关人员进行查看和分析。

其中,执行步骤420中将在各统计周期中确定的分布结果发送给终端,具体包括:

1)根据在各统计周期中确定的分布结果,生成表征在各统计周期中分布结果的可视化图形。

其中,分布结果中至少包括各维流量类型所对应分配的目标用户的数量,可视化图形的横坐标为时间,纵坐标为目标用户的数量,并横坐标的时间从目标多媒体对象的下单日开始,直至到投放日。

本申请实施例中,可以将各统计周期的分布结果以可视化图形的方式以进行展示,其中,由于流量类型为多维,并且数据类型为时间,分析各维流量类型的分布结果随时间的变化趋势,因此,可视化图形可以采用堆叠面积图来表示比例关系的变化,若从某一点上对堆叠面积图进行垂直切片,则可以得到该时间段上的分布情况,当然本申请实施例中并不进行限制,也可以采用其它可视化图形来表征在各统计周期中的分布结果。

2)将可视化图形发送给终端。

例如,参阅图9所示,为本申请实施例中可视化方式示意图,如图9中左图,基于本申请实施例中的数据分析引擎,获得目标多媒体对象的订单的流量分布结果,目标多媒体对象的订单标识为01,投放日为0812,召回条件为地区b,以统计周期为1天,则从下单日开始一直到投放日,确定出该目标多媒体对象每天的召回流量在各维流量类型中的分布结果,例如,在询锁量引擎,输入语句“wheretargetdate=20200812andarea=地区b”,获得召回流量,并且聚合计算引擎,输入语句“groupbydata,inv_type,…”,获得在各维流量类型中的分布结果,如图9中,针对流量类型为高优先级挤占,目标多媒体对象的订单标识为订单01,监控日期为0806,地域为地区b,挤占单为02(即表示订单02挤占了订单01的召回流量),流量为13(表示订单02挤占订单01的召回流量中的数量为13),图9中仅示出了监控日期为0806,0805,0804三天的流量分布数据,当然监控日期可以为从下单日到投放日均可,进而可以通过选择所需查看的时间、流量维度等信息,根据各监控日期所确定的流量分布数据,生成可视化图形,在终端上展示所选择的时间段内的流量分布结果。

这样,获得目标多媒体对象在从下单日到投放日之间每天的分别结果后,生成堆叠面积图,将流量分布情况可视化,可以方便观察投放前后流量分布的变化趋势,并且发生异常时可以回溯历史,分析缺量原因。

进一步地,本申请实施例中还提供了几种可以确定缺量类型的实施方式,分别为:

第一种方式:自动分析缺量类型。

具体地:1)分别确定在投放日之前各维流量类型所对应分配的目标用户的数量的变化趋势,以及在投放日各维流量类型所对应分配的目标用户的数量。

例如,变化趋势为升高或降低,可以针对各个流量类型所对应目标用户的数量进行分析统计,并不进行限制。

2)根据在投放日之前各维流量类型所对应分配的目标用户的数量的变化趋势,以及在投放日各维流量类型所对应分配的目标用户的数量,确定目标多媒体对象发生流量分配缺量的缺量类型。

例如,确定投放前的整体流量,即总召回的目标用户的数量高于投放日的整体流量,并确定在投放日发生了缺量,则可以认为缺量类型即缺量原因为在预估阶段,库存预估偏高,导致订单在下单日预定多了,而在实际投放日并不能满足分配量需求。

第二种方式:人工观察展示结果。

本申请实施例中,通过可视化展示,运营人员可以清晰的看出包括预定阶段和投放阶段的召回流量的分布情况,因此,也较为容易从各分布的动态曲线上观察到其中某些曲线的异常,从而分析出导致缺量的缺量类型,即可以确定出发生流量分配缺量的原因,其中异常其实是指异常的波动,例如,下单时订单a的总召回量是1000,分配量是100,900个未分配给a的流量中,高优先级单挤占了200(即占了总召回量的20%),若在投放时,订单a发生缺量,分配给a的只有50,且观察到在投放日的总召回量中,高优先级订单挤占了80%,则可以认为高优先级挤占是造成订单a缺量的主要原因。

进一步地,确定出缺量类型后,可以基于不同的缺量类型进行调整和处理,具体本申请实施例中提供了一种可能的实施方式,根据预设的发生流量分配缺量的缺量类型和调整策略的映射关系,确定目标多媒体对象发生流量分配缺量的缺量类型所对应的调整策略,并根据确定的调整策略而进行调整。

其中,调整策略的设置,可以根据不同的缺量类型和需求而进行设置,本申请实施例中并不进行限制,例如可以包括:协商排期、准备补量、定向条件调整、取消优化设置、提高推送频次、提高订单优先级等。

例如,缺量类型为高优先级挤占,则调整策略可以为提高目标多媒体对象的订单优先级,但是需要相关算法评估并申请优先级调整。

当然也可以人工根据缺量类型来确定相应的调整策略,从而进行调整处理,本申请实施例中并不进行限制。

本申请实施例中,分别针对各统计周期,获得符合目标多媒体对象的召回条件的各目标用户,并针对各统计周期,分别确定相应的各目标用户在各维流量类型的分布结果,进而接收到终端针对目标多媒体对象的流量分布查询请求时,将在各统计周期中确定的分布结果发送给终端以进行展示,并且根据各统计周期中的分布结果可以用于确定目标多媒体对象发生流量分配缺量的缺量类型,这样,针对召回的各目标用户,自动化分析在各维流量类型的分布结果,并且针对各个统计周期分别进行统计分析,进而可以可视化展示在生命周期中召回流量的各分层流量的动态变化过程,可以在动态变化中分析缺量的缺量类型即原因,自动化分析而不依赖人工分析,提高了效率和准确性,并且可以展示动态变化过程,而不仅是在投放日当天进行缺量分析,提高了时效性和可追溯性,可视化展示方便观察投放前后流量分布的变化趋势,发生异常时可回溯历史,分析缺量原因,进而也降低了开发人员与运营人员在发生缺量时的沟通成本。

基于上述实施例,参阅图10所示,为本申请实施例中另一种数据处理方法流程图,应用于终端侧,具体该方法包括:

步骤1000:响应于针对目标多媒体对象的流量分布查询操作,展示目标多媒体对象在各统计周期中确定的相应的各目标用户的分布结果,其中,分布结果至少包括各维流量类型所对应分配的目标用户的数量,在各统计周期中确定的各维流量类型所对应分配的目标用户的数量,用于确定目标多媒体对象发生流量分配缺量的缺量类型。

其中,各目标用户为服务器分别在各统计周期中,根据目标多媒体对象的召回条件而获得的,分布结果是服务器分别在各统计周期中,确定的相应的各目标用户在各维流量类型的分布结果,各维流量类型表示目标多媒体对象所对应的流量分配逻辑。

具体执行步骤1000时,包括:

s1、接收服务器返回的可视化图形。

其中,可视化图形是服务器根据在各统计周期中确定的分布结果而生成的,分布结果中至少包括各维流量类型所对应分配的目标用户的数量,可视化图形的横坐标为时间,纵坐标为目标用户的数量,并横坐标的时间从目标多媒体对象的下单日开始,直至到投放日。

s2、分别按照各维流量类型对应的预设颜色,展示可视化图形。

例如,不同流量类型分别对应设置一个颜色,这样在进行可视化展示时,可以更加清楚查看不同流量类型所对应的流量。

本申请实施例中,可以分别在各统计周期中,自动化分析目标多媒体对象所召回的各目标用户,在各维流量类型的分布结果,进而终端可以响应于针对目标多媒体对象的流量分布查询操作,展示目标多媒体对象在各统计周期中确定的相应的各目标用户的分布结果,这样,可以对目标多媒体对象的召回流量进行动态监控,并进行可视化展示,可以有效提高对缺量问题的监控和分析的效率。

基于上述实施例,下面采用具体应用场景,对本申请实施例中数据处理方法的整体逻辑进行说明,以目标多媒体对象为合约广告为例,从合约广告的业务流程进行说明,合约广告在售卖阶段进行询量和下单,并在投放阶段进行投放和监控,发生缺量后进行收入挽回,可以将发生缺量到挽回收入的过程称作挽回链。

参阅图11所示,为本申请实施例中数据处理方法的整体方案逻辑示意图,如图11中(a)图为相关技术中的解决方案,相关技术中挽回链只能在投放后并缺量发生后启动,较为被动,时效低,并且缺量发生后,人工分析缺量原因,进而采用相应措施来挽回收入,整体挽回链耗时较长,准确性低,人工成本较高。

而如图11中(b)图为本申请实施例中的解决方案,合约广告下单,并在投放日进行投放,不仅仅是在投放发生缺量后才进行分析,而且在投放前即进行数据分析,按照各统计周期,分别确定召回的各目标用户在各维流量类型的分布结果,进而可以自动化分析在下单日至投放日的整个生命周期中,流量分布的变化趋势,在投放后发生缺量后可以更加准确地确定出缺量原因,从而相关人员可以采用相应措施进行调整来挽回收入,这样,通过自动化分析缺量原因,可以预警缺量并发生缺量后快速准确获知缺量原因,即可以缩短甚至提前挽回链。

基于上述实施例,下面从产品侧对本申请实施例中的数据处理方法进行说明,本申请实施例中的数据处理方法可以最终用于缺量类型即缺量原因的确定,以目标多媒体对象为合约广告为例,因此可以应用到合约广告的投放效果评估阶段,具体地,在投放效果评估阶段,可以利用本申请实施例中的方法可视化地分析流量分布,从而确定缺量的原因,实际在应用时,可以将该方法应用于广告投放效果监控分析平台。

进而用户在所需时,打开该广告投放效果监控分析平台,例如参阅图12所示,为本申请实施例中可视化展示结果界面示意图,在该平台上,用户可以选择所需分析的目标多媒体对象,在维度筛选,例如下单日为2020年10月1日,投放日期为2020-10-12,所查看时间10/01-10/12,统计周期粒度为天,并且还可以选择流量类型、流量查看指标选择等,以流量类型包括频控过滤、同优先级过滤、高优先级过滤和分配量的四个维度为例进行说明,如图12所示,即可以展示生成的可视化图形,该可视化图形例如为堆叠面积图,不同流量类型即堆叠面积图的不同层可以用不同颜色显示。

这样,根据合约广告订单召回的分层流量与合约广告缺量的相关性,依赖一个数据分析引擎,计算出整体的召回流量并以动态的方式将其可视化,通过可视化地缺量原因分析方法,在合约广告的售卖阶段和投放阶段,都可以可视地通过该模型获得合约广告缺量的原因,从而更加高效地解决缺量问题,极大提高合约广告收入挽回工作的效率。

本申请实施例中,根据可视化展示的分布结果,确定目标多媒体对象发生流量分配缺量的原因,具体本申请实施例中提供几种具体实施情况:

例如,运营人员从可视化图形中观察到投放前整体流量偏高,即各维流量类型所对应的流量之和偏高,投放前的整体流量高于投放日的整体流量,最后在投放日发生了缺量,即在投放日的分配量小于下单日的分配量,则运营人员可以做出判断,导致缺量的主要原因是库存预估偏高,导致在下单日预订多了,而实际投放日并不能满足其数量要求,进而运营人员可以尽快将这个结论反馈给预订端,能够及时降低因预订端的宽松预订策略带来的缺量风险。

又例如,运营人员从可视化图形中确定“频控过滤”类型的流量占比,在下单日和投放日相比差异较大,在投放日变得异常的高,最后在投放日发生了缺量,则可以判断,导致缺量的原因是频控约束前后不一致导致的,通常预估系统和投放系统所采用的业务逻辑是相同的,例如各维流量类型的策略相同,但是可能也会出现不一致的情况,这也可能是导致缺量的原因,进而运营人员可以根据该缺量原因,推动投放端和预订端对齐相关的逻辑,降低系统风险。

基于同一发明构思,本申请实施例中还提供了一种数据处理装置,该数据处理装置可以是硬件结构、软件模块、或硬件结构加软件模块。基于上述实施例,参阅图13所示,本申请实施例中一种数据处理装置,具体包括:

获得模块1300,用于分别针对各统计周期,获得符合目标多媒体对象的召回条件的各目标用户;

第一确定模块1310,用于针对所述各统计周期,分别确定相应的各目标用户在各维流量类型的分布结果,其中,所述各维流量类型表示所述目标多媒体对象所对应的流量分配逻辑,所述分布结果至少包括所述各维流量类型所对应分配的目标用户的数量;

处理模块1320,用于接收到终端针对所述目标多媒体对象的流量分布查询请求时,将在所述各统计周期中确定的分布结果发送给所述终端以进行展示;

第二确定模块1330,用于根据在所述各统计周期中所述各维流量类型所对应分配的目标用户的数量,确定所述目标多媒体对象发生流量分配缺量的缺量类型。

可选的,分别针对各统计周期,获得符合目标多媒体对象的召回条件的各目标用户时,获得模块1300具体用于:

在所述目标多媒体对象对应的预设生命周期中,分别获得在各统计周期中符合所述目标多媒体对象的召回条件的各目标用户;

其中,若所述目标多媒体对象为广告,则所述预设生命周期表示从所述目标多媒体对象的下单日开始,直至到投放日,所述各统计周期小于所述预设生命周期。

可选的,针对所述各统计周期,分别确定相应的各目标用户在各维流量类型的分布结果时,第一确定模块1310具体用于:

针对所述各统计周期,分别根据启发式方法,将相应的各目标用户分配给各多媒体对象,获得所述各目标用户与所述各多媒体对象的关联关系;

根据所述各目标用户与所述各多媒体对象的关联关系和各维流量类型,分别统计所述相应的各目标用户在各维流量类型下的分布结果。

可选的,将在所述各统计周期中确定的分布结果发送给所述终端时,处理模块1320具体用于:

根据在所述各统计周期中确定的分布结果,生成表征在所述各统计周期中分布结果的可视化图形,其中,所述分布结果中至少包括各维流量类型所对应分配的目标用户的数量,所述可视化图形的横坐标为时间,纵坐标为目标用户的数量,并所述横坐标的时间从所述目标多媒体对象的下单日开始,直至到投放日;

将所述可视化图形发送给所述终端。

可选的,第二确定模块1330具体用于:

分别确定在投放日之前所述各维流量类型所对应分配的目标用户的数量的变化趋势,以及在投放日所述各维流量类型所对应分配的目标用户的数量;

根据在投放日之前所述各维流量类型所对应分配的目标用户的数量的变化趋势,以及在投放日所述各维流量类型所对应分配的目标用户的数量,确定所述目标多媒体对象发生流量分配缺量的缺量类型。

可选的,进一步包括,调整模块1340用于:根据预设的发生流量分配缺量的缺量类型和调整策略的映射关系,确定所述目标多媒体对象发生流量分配缺量的缺量类型所对应的调整策略,并根据确定的调整策略而进行调整。

基于同一发明构思,本申请实施例中还提供了另一种数据处理装置,该数据处理装置可以是硬件结构、软件模块、或硬件结构加软件模块。基于上述实施例,参阅图14所示,本申请实施例中另一种数据处理装置,具体包括:

展示模块1400,用于响应于针对目标多媒体对象的流量分布查询操作,展示所述目标多媒体对象在各统计周期中确定的相应的各目标用户的分布结果,其中,所述分布结果至少包括各维流量类型所对应分配的目标用户的数量,在各统计周期中确定的各维流量类型所对应分配的目标用户的数量,用于确定所述目标多媒体对象发生流量分配缺量的缺量类型;

其中,所述各目标用户为服务器分别在各统计周期中,根据所述目标多媒体对象的召回条件而获得的,所述分布结果是服务器分别在各统计周期中,确定的所述相应的各目标用户在各维流量类型的分布结果,所述各维流量类型表示所述目标多媒体对象所对应的流量分配逻辑。

可选的,展示所述目标多媒体对象在各统计周期中分别确定的相应的各目标用户的分布结果时,展示模块1400具体用于:

接收所述服务器返回的可视化图形,其中,所述可视化图形是所述服务器根据在所述各统计周期中确定的分布结果而生成的,所述分布结果中至少包括各维流量类型所对应分配的目标用户的数量,所述可视化图形的横坐标为时间,纵坐标为目标用户的数量,并所述横坐标的时间从所述目标多媒体对象的下单日开始,直至到投放日;

分别按照所述各维流量类型对应的预设颜色,展示所述可视化图形。

基于上述实施例,参阅图15所示为本申请实施例中电子设备的结构示意图。

本申请实施例提供了一种电子设备,该电子设备可以是终端或服务器,本申请实施例以电子设备为服务器为例进行说明,该电子设备可以包括处理器1510(centerprocessingunit,cpu)、存储器1520、输入设备1530和输出设备1540等。

存储器1520可以包括只读存储器(rom)和随机存取存储器(ram),并向处理器1510提供存储器1520中存储的程序指令和数据。在本申请实施例中,存储器1520可以用于存储本申请实施例中任一种数据处理方法的程序。

处理器1510通过调用存储器1520存储的程序指令,处理器1510用于按照获得的程序指令执行本申请实施例中任一种数据处理方法。

基于上述实施例,本申请实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意方法实施例中的数据处理方法。

基于上述实施例,本申请实施例中,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述任意方法实施例中的数据处理方法。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1