一种互联网的数据处理方法和装置的制造方法

文档序号:9249236阅读:265来源:国知局
一种互联网的数据处理方法和装置的制造方法
【技术领域】
[0001] 本发明涉及互联网技术领域,尤其涉及一种互联网的数据处理方法和装置。
【背景技术】
[0002] 目前的互联网信息推送,主要是为实现互联网信息在一段时间内在某些定向条件 下的播放。该个过程可W用二部图来建模,如图1所示,左侧的供应(Supply)端表示各种 定向条件下的播放,不同Supply结点对应不同的权重Si,表示该定向条件i下的预估播放 量(或称播放次数),右侧的需求值emand)端表示信息推送需求(为描述方便,后续简称信 息推送任务或任务),包括预定义的互联网信息、定向条件和播放量等,不同Demand结点对 应不同的权重dj,表示任务j所需求的互联网信息播放次数。Si到dj的连接线表示Si对应 的定向条件符合任务j的dj.中的需求,每个连接线对应权重Xu,可W理解为在某一定向条 件的播放量Si到达时,展示任务j的互联网信息的概率为xy。Xu实质上对应了Supply端 播放量的库存在线分配方案,如何求解Xu是互联网信息推送的关键问题。
[0003] 定向条件有很多维度,如地域、内容、性别、年龄、时间、场景等,而每个维度又包含 很多属性,如北京、上海属于地域维度下的两个不同的定向属性。该样,不同的定向属性组 合之后的定向条件就会有数十亿种。如果直接全部计算每一个Xu用于线上服务,那么需要 存储维护大量的信息(空间复杂度为图1中Supply端到Demand端的连接线的数量),在实 际的应用中是不可行的。
[0004] 现有技术将xy的求解分为离线阶段和在线阶段该两个过程。离线阶段,根据预估 出的每个定向条件的库存信息W及任务信息得到如图1所示的二部图模型,根据模型计算 出每个任务对应的参数;在线阶段,当播放量到达时,得到所有符合该定向条件的任务,根 据离线阶段计算出的任务参数推导出每个任务的展示概率。具体的算法过程如下:
[0005] 离线阶段:
[000引 1)对所有的Demand结点按照d/sj进行降序排列得到分配顺序,其中,dj为任务j所需求的互联网信息播放次数,Sj.为所有满足dj.定向条件的Si的预估播放量总和;
[0007] 。对所有的Supp1y结点,初始化S=i-,即初始化馬为预估播放量;
[0008] 如按照Demand结点的分配顺序,计算Pj.使得
如果P^不 存在,则设置PJ=-;其中,PJ表示Si分配给任务j的播放次数占Si播放总数的比例,每 个Demand结点相对应的Supply结点都使用该比例,Bj表示所有满足Demand结点j定向条 件的Supply结点;
[0009] 并对所有满足Demand结点定向条件的Supply结点iGBj,更新其焉为
[0010] 在线阶段:
[0011]1)当Supply结点i的播放量到达时,得到所有符合该定向条件的任务,并按所述 分配顺序排序;
[0012] 2)对每个任务j,计算分配顺序排在j之前的任务所对应的概率和P,如果P> 1-PJ,则任务j被展示的概率为1-P,否则任务j被展示的概率为PJ。
[0013] 上述算法实质上是启发式的贪也算法,通过对任务分配顺序的调节,使得比较难 满足的任务优先分配,按照分配顺序生成每个任务的库存分配方案。当播放到达时,根据分 配方案得到对应任务的展示概率Xu。
[0014] 然而,现有算法无法保证得到一个相对的最优解,计算Xu的误差越大,会导致互 联网信息推送的效率和准确率越低,无法满足互联网信息的播放需求。因此,如何使计算的 Xy达到相对的最优解,从而保证互联网信息推送的效率和准确率,尽量满足互联网信息的 播放需求,是目前亟待解决的技术问题。

【发明内容】

[0015] 为解决现有存在的技术问题,本发明提供一种互联网的数据处理方法和装置。
[0016] 本发明提供一种互联网的数据处理方法,所述方法包括:
[0017] 在离线阶段,通过重复迭代的方式获得需求Demand结点约束条件的对偶参数、W 及供应Supply结点约束条件的对偶参数;
[001引根据所述Demand结点约束条件的对偶参数、W及Supply结点约束条件的对偶参 数,获得每个任务在相应定向条件下的播放概率;
[0019] 将每个任务中的互联网信息、W及每个任务在相应定向条件下的播放概率,分发 给所述相应定向条件下的Supply结点所处的互联网信息播放终端,指示相应终端按获得 的所述播放概率播放相应任务中的互联网信息。
[0020] 上述方案中,所述通过重复迭代的方式获得Demand结点约束条件的对偶参数、W 及Supply结点约束条件的对偶参数,包括:
[0021] 根据初始化的Demand结点约束条件的对偶参数计算所述Supply结点约束条件的 对偶参数,根据计算所得Supply结点约束条件的对偶参数计算Demand结点约束条件的对 偶参数;重复迭代所述Demand结点约束条件的对偶参数、Supply结点约束条件的对偶参数 预定次数,输出迭代后的Demand结点约束条件的对偶参数、W及Supply结点约束条件的对 偶参数。
[0022] 上述方案中,所述通过重复迭代的方式获得Demand结点约束条件的对偶参数、W 及Supply结点约束条件的对偶参数,包括:
[0023] a、对于所有任务j,初始化aJ= 0,aj.表示Demand结点约束条件的对偶参数;
[0024] b、对于所有定向条件i,计算目i使捐
如果无解或者目1<〇,则 设置目i= 0 ;其中,目i表示Supply结点约束条件的对偶参数,r(i)表示所有能够被的定 向条件i满足的Demand结点,
0u表示互联网信息的 均匀分布标准,Vj表示任务j对播放均匀分布的要求级别;
[002引 c、对于所有任务j,计算aj.使得
如果aj>Pj或者无解,则 设置aJ=pj.;其中,Si表示定向条件i下的预估播放量,dj.表示任务j的需求播放量,pj表示补偿代价;
[0026] 将所述步骤b和C迭代预定次数,得到迭代后输出的Demand结点约束条件的对偶 参数aj.、W及Supply结点约束条件的对偶参数目1。
[0027] 上述方案中,所述根据Demand结点约束条件的对偶参数、W及Supply结点约束条 件的对偶参数,获得每个任务在相应定向条件下的播放概率,包括:
[002引离线阶段,对于所有定向条件i,初始化i严Si表示定向条件i的预估播放量;
[0029] 对于所有的定向条件i,计算目i使得
如果无解或者目i< 0,则 设置目i= 0 ;
[0030] 对应每个任务j,按照分配顺序执行:
[0031] 计算弓J使焉
如果无解则设置^J=-;对于满足任 务j的所有定向条件i,更新马-min枉馬每-A)}用于下一任务的弓J计算,输出所 有任务的aj.、弓j.;其中,弓j.表示用于计算任务j在相应定向条件下播放概率的第一参数,r(j)表示所有满足任务j的Supply结点;
[003引在线阶段,在每个Si到达时,根据Qj.计算出目1,并由弓j.和目i计算得出每个任 务在相应定向条件下的播放概率。
[0033] 上述方案中,所述分配顺序为:
[0034] 对所有的Demand结点按照dj/sj进行降序排列,其中,dj表示任务j所需求的互联 网信息播放次数,Sj.表示所有满足dj.定向条件的Si的预估播放量总和。
[0035] 上述方案中,所述根据aJ计算出目1,并由弓j.和目i计算得出每个任务在相应定 向条件下的播放概率,包括:
[0036] 输入定向条件i和所有满足定向条件i的任务;
[0037] 设置馬=1,计算目i使得
如果无解或者目i< 0,则设置目i= 0 ;
[0038] 对于每个满足定向条件i的任务,按照分配顺序计算
巧 新馬用于下一个任务的Xy计算;其中,Xu表示任务j在定向条件i下的播放概率。
[0039] 本发明还提供一种互联网的数据处理装置,包括:
[0040] 对偶参数获得单元,用于在离线阶段,通过重复迭代的方式获得需求Demand结点 约束条件的对偶参数、W及供应Supply结点约束条件的对偶参数;
[0041] 播放概率获得单元,用于根据所述Demand结点约束条件的对偶参数、W及Supply 结点约束条件的对偶参数,获得每个任务在相应定向条件下的播放概率;
[0042] 分发单元,用于将每个任务中的互联网信息、W及每个任务在相应定向条件下的 播放概率,分发给所述相应定向条件下的Supply结点所处的互联网信息播放终端,指示相 应终端按获得的所述播放概率播放相应任务中的互联网信息。
[0043] 上述方案中,所述对偶参数获得单元进一步用于,根据初始化的Demand结点约束 条件的对偶参数计算所述Supply结点约束条件的对偶参数,根据计算所得Supply结点约 束条件的对偶参数计算Demand结点约束条件的对偶参数;重复迭代所述Demand结点约束 条件的对偶参数、Supply结点约束条件的对偶参数预定次数,输出迭代后的Demand结点约 束条件的对偶参数、W及Supply结点约束条件的对偶参数。
[0044] 上述方案中,所述对偶参数获得单元进一步用于,通过W下方式获得所述对偶参 数:
[0045] a、对于所有任务j,初始化aJ= 0,aj.表示Demand结点约束条件的对偶参数;
[0046] b、对于所有定向条件i,计算目i使得
如果无解或者目1<〇,则 设置目i= 0 ;其中,目i表示Supply结点约束条件的对偶参数,r(i)表示所有能够被的定 向条件i满足的Demand结点,
,0^表示互联网信息的 均匀分布标准,Vj表示任务j对播放均匀分布的要求级别;
[0047] C、对于所有任务j,计算aj.使得
如果aJ>Pj或者无解,贝IJ 设置aJ=pj.;其中,Si表示定向条件i下的预估播放量,dj.表示任务j的需求播放量,pj表示补偿代价;
[004引将所述步骤b和C迭代预定次
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1