一种基于机器学习的搜索引擎营销竞价方法及系统的制作方法

文档序号:10553037阅读:354来源:国知局
一种基于机器学习的搜索引擎营销竞价方法及系统的制作方法
【专利摘要】本申请公开了一种基于机器学习的搜索引擎营销竞价方法及系统,该方法包括:预先利用机器学习技术,对用户历史搜索信息和用户点击广告的痕迹信息进行处理,得到训练数据,并利用训练数据进行模型训练,得到用于预测关键词转化率的预测模型;其中,用户历史搜索信息包括用户搜索关键词和搜索到的广告文档;利用上述预测模型,计算目标关键词的转化率;利用目标关键词的成本值以及转化率,计算得到目标关键词的出价。本申请提高了关键词出价与广告推广效率之间的匹配程度,从而提升了广告主的广告投资回报率。
【专利说明】
一种基于机器学习的搜索引擎营销竞价方法及系统
技术领域
[0001] 本发明涉及搜索引擎营销技术领域,特别涉及一种基于机器学习的搜索引擎营销 竞价方法及系统。
【背景技术】
[0002] 搜索引擎竞价广告是当前互联网广告中最为成功的商业模式,它背后的核心技术 是竞价关键词技术。广告主能够通过在搜索引擎上购买与其推广内容相关的关键词,从而 在互联网搜索引擎上对旗下相关产品或服务进行推广。
[0003] 然而,广告主在以一定的价钱购买了某个关键词后,最终的广告推广效率往往无 法达到与关键词出价相匹配的程度,也即,广告的投资回报率较低。
[0004] 综上所述可以看出,如何提高关键词出价与广告推广效率之间的匹配程度,以提 升广告主的广告投资回报率是目前有待解决的问题。

【发明内容】

[0005] 有鉴于此,本发明的目的在于提供一种基于机器学习的搜索引擎营销竞价方法及 系统,提高了关键词出价与广告推广效率之间的匹配程度,从而提升了广告主的广告投资 回报率。其具体方案如下:
[0006] -种基于机器学习的搜索引擎营销竞价方法,包括:
[0007] 预先利用机器学习技术,对用户历史搜索信息和用户点击广告的痕迹信息进行处 理,得到训练数据,并利用所述训练数据进行模型训练,得到用于预测关键词转化率的预测 模型;其中,所述用户历史搜索信息包括用户搜索关键词和搜索到的广告文档;
[0008] 利用所述预测模型,计算目标关键词的转化率;
[0009] 利用所述目标关键词的成本值以及所述转化率,计算得到所述目标关键词的出 价。
[0010] 优选的,所述搜索引擎营销竞价方法,还包括:
[0011] 按照预设的数据更新周期,定期对所述用户历史搜索信息和所述痕迹信息进行更 新,并利用更新后的用户历史搜索信息和痕迹信息,重新进行模型训练,以对所述预测模型 进行更新。
[0012] 优选的,所述预先利用机器学习技术,对用户历史搜索信息和用户点击广告的痕 迹信息进行处理,得到训练数据的过程,包括:
[0013] 预先利用自然语言处理技术,对所述用户历史搜索信息中的广告文档进行分词处 理,并利用主成分分析法,对分词处理后得到的所有分词进行数据降维处理,得到相应的分 词集合;
[0014] 根据所述痕迹信息,并按照预设特征值确定规则,确定所述分词集合中每一分词 对应的特征值,得到相应的特征值集合;
[0015] 对所述特征值集合进行筛选,得到N个特征值,并确定所述N个特征值中每一特征 值对应的权重,将所述N个特征值以及对应的分词和权重确定为所述训练数据,其中,N为正 整数。
[0016]优选的,所述对所述特征值集合进行筛选,得到N个特征值,并确定所述N个特征值 中每一特征值对应的权重的过程,包括:
[0017] 对所述特征值集合中每一个特征值单独进行逻辑回归,得到每一个特征值对应的 初始权重;
[0018] 从所述特征值集合中筛选出所述N个特征值,其中,所述N个特征值中每一个特征 值对应的初始权重均不小于所述特征值集合中其余特征值对应的初始权重;
[0019] 对所述N个特征值再次进行逻辑回归,得到所述N个特征值中每一特征值对应的权 重。
[0020] 优选的,所述预设特征值确定规则为:
[0021] 若所述痕迹信息显示任一分词能够为相应的广告文档带来有效点击,则将该分词 的特征值确定为1,否则,将该分词的特征值确定为0。
[0022] 优选的,所述预设特征值确定规则为:
[0023]若所述痕迹信息显示任一分词能够为相应的广告文档带来有效点击,并且用户浏 览该广告文档的时间不小于预设时间,则将该分词的特征值确定为1;
[0024]若所述痕迹信息显示任一分词能够为相应的广告文档带来有效点击,并且用户浏 览该广告文档的时间小于所述预设时间,则将该分词的特征值确定为0.5;
[0025] 若所述痕迹信息显示任一分词未能为相应的广告文档带来有效点击,则将该分词 的特征值确定为0。
[0026] 优选的,所述预测模型为:
[0028] 其中,表示广告文档A中第i个特征值,Wl表示第i个特征值的 i 权重。
[0029] 优选的,所述利用所述目标关键词的成本值以及所述转化率,计算得到所述目标 关键词的出价的过程中,相应的计算公式为:
[0030] Pj = Cj*CTR/ ;
[0031] 其中,匕表示在任意一天内的第j个小时中,所述目标关键词对应的出价;Q表示在 任意一天时间内的第j个小时中,所述目标关键词对应的成本值;CTf表示所述目标关键词 的转化率,je{l,2,...,24}。
[0032]优选的,(^的计算公式为:
[0033] Cj = b*aj;
[0034] 其中,b表示用户为了一个有效点击所愿意承担的花费金额;^表示时间成本;其 中,a i县休衷tk为:
[0036]其中,%表示任意一天中的第j个小时内的有效点击量,T表示全天时间内的有效 点击量。
[0037] 本发明还公开了一种基于机器学习的搜索引擎营销竞价系统,包括:
[0038] 预测模型构建模块,用于预先利用机器学习技术,对用户历史搜索信息和用户点 击广告的痕迹信息进行处理,得到训练数据,并利用所述训练数据进行模型训练,得到用于 预测关键词转化率的预测模型;其中,所述用户历史搜索信息包括用户搜索关键词和搜索 到的广告文档;
[0039] 转换率计算模块,用于利用所述预测模型,计算目标关键词的转化率;
[0040] 出价计算模块,用于利用所述目标关键词的成本值以及所述转化率,计算得到所 述目标关键词的出价。
[0041] 本发明中,搜索引擎营销竞价方法包括:预先利用机器学习技术,对用户历史搜索 信息和用户点击广告的痕迹信息进行处理,得到训练数据,并利用训练数据进行模型训练, 得到用于预测关键词转化率的预测模型;其中,用户历史搜索信息包括用户搜索关键词和 搜索到的广告文档;利用上述预测模型,计算目标关键词的转化率;利用目标关键词的成本 值以及转化率,计算得到目标关键词的出价。可见,本发明中用于进行模型训练的训练数据 是通过利用机器学习技术,对用户历史搜索信息和用户点击广告的痕迹信息进行处理后得 到的,通过对该训练数据进行模型训练,可得到用于预测关键词转化率的预测模型。当需要 计算目标关键词的出价时,便可利用上述预测模型预测该目标关键词的转化率,进而结合 该目标关键词的成本,计算得到该目标关键词的出价,由此可见,在计算目标关键词的出价 时,考虑到了目标关键词的转化率对出价的影响,由于关键词的转化率是衡量广告推广效 率的重要指标,所以本发明计算的目标关键词的出价能较好地与广告推广效率相匹配,也 即,本发明提高了关键词出价与广告推广效率之间的匹配程度,从而提升了广告主的广告 投资回报率。
【附图说明】
[0042] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据 提供的附图获得其他的附图。
[0043]图1为本发明实施例公开的一种基于机器学习的搜索引擎营销竞价方法流程图;
[0044]图2为本发明实施例公开的一种基于机器学习的搜索引擎营销竞价系统结构示意 图。
【具体实施方式】
[0045]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0046]本发明实施例公开了一种基于机器学习的搜索引擎营销竞价方法,参见图1所示, 该方法包括:
[0047]步骤S11:预先利用机器学习技术,对用户历史搜索信息和用户点击广告的痕迹信 息进行处理,得到训练数据,并利用训练数据进行模型训练,得到用于预测关键词转化率的 预测模型;其中,用户历史搜索信息包括用户搜索关键词和搜索到的广告文档。
[0048]需要说明的是,上述用户历史搜索信息中包括用户输入的搜索关键词以及搜索到 的相应的广告文档。上述用户点击广告的痕迹信息包括对应的搜索关键词、广告文档的点 击事件以及广告文档的浏览时长。另外,上述关键词转化率是指与该关键词对应的广告文 档的有效点击率。
[0049] 步骤S12:利用上述预测模型,计算目标关键词的转化率。
[0050] 步骤S13:利用目标关键词的成本值以及转化率,计算得到目标关键词的出价。 [0051]另外,为了令上述预测模型能够适应可能随时间发生变化的用户搜索习惯和广告 浏览习惯,本发明可以进一步包括:按照预设的数据更新周期,定期对用户历史搜索信息和 用户点击广告的痕迹信息进行更新,并利用更新后的用户历史搜索信息和痕迹信息,重新 进行模型训练,以对预测模型进行更新。也即,定期搜集当前最新的用户历史搜索信息和痕 迹信息,然后利用这些信息对模型进行再训练,从而实现对预测模型的持续更新。
[0052]可见,本发明实施例中,用于进行模型训练的训练数据是通过利用机器学习技术, 对用户历史搜索信息和用户点击广告的痕迹信息进行处理后得到的,通过对该训练数据进 行模型训练,可得到用于预测关键词转化率的预测模型。当需要计算目标关键词的出价时, 便可利用上述预测模型预测该目标关键词的转化率,进而结合该目标关键词的成本,计算 得到该目标关键词的出价,由此可见,在计算目标关键词的出价时,考虑到了目标关键词的 转化率对出价的影响,由于关键词的转化率是衡量广告推广效率的重要指标,所以本发明 实施例计算的目标关键词的出价能较好地与广告推广效率相匹配,也即,本发明实施例提 高了关键词出价与广告推广效率之间的匹配程度,从而提升了广告主的广告投资回报率。 [0053]本发明实施例公开了一种具体的基于机器学习的搜索引擎营销竞价方法,相对于 上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的:
[0054]上一实施例步骤S11中,预先利用机器学习技术,对用户历史搜索信息和用户点击 广告的痕迹信息进行处理,得到训练数据的过程,具体包括:
[0055] 步骤S111:预先利用自然语言处理技术,对用户历史搜索信息中的广告文档进行 分词处理,并利用主成分分析法,对分词处理后得到的所有分词进行数据降维处理,得到相 应的分词集合;
[0056] 步骤S112:根据用户点击广告的痕迹信息,并按照预设特征值确定规则,确定分词 集合中每一分词对应的特征值,得到相应的特征值集合;
[0057]步骤S113:对特征值集合进行筛选,得到N个特征值,并确定上述N个特征值中每一 特征值对应的权重,将上述N个特征值以及对应的分词和权重确定为训练数据,其中,N为正 整数。
[0058]需要说明的是,上述步骤S111在利用自然语言处理技术进行分词处理时,可以采 用与中科院分词相同的分词方案。另外,在进行分词的过程中,可以对停用词进行过滤,以 删除一些类似于"的"、"了"之类的虚词和语气词,从而减少了数据噪音。
[0059] 上述训练数据中不仅包括了上述N个特征值,还包括这上述N个特征值中每个特征 值对应的分词以及每个分词对应的权重。其中,上述N可以是由人为根据实际需要进行设定 的数值,在此不对其进行具体限定。
[0060]进一步的,上述步骤S113中,对特征值集合进行筛选,得到N个特征值,并确定N个 特征值中每一特征值对应的权重的过程,包括:
[0061]步骤S1131:对特征值集合中每一个特征值单独进行逻辑回归,得到每一个特征值 对应的初始权重。
[0062]步骤S1132:从特征值集合中筛选出N个特征值,其中,上述N个特征值中每一个特 征值对应的初始权重均不小于特征值集合中其余特征值对应的初始权重。也即,上述N个特 征值是特征值集合中前N个最大的特征值。
[0063] 步骤S1133:对上述N个特征值再次进行逻辑回归,得到上述N个特征值中每一特征 值对应的权重。
[0064]需要说明的是,上述步骤S1131是对特征值集合中的每一个特征值单独进行逻辑 回归,而步骤SI 133则是同时对上述N个特征值进行逻辑回归。
[0065]另外,可以根据不同的实际需要,对上述预设特征值确定规则进行不同的设定。 [0066]例如,上述预设特征值确定规则可以为:若痕迹信息显示任一分词能够为相应的 广告文档带来有效点击,则将该分词的特征值确定为1,否则,将该分词的特征值确定为〇。
[0067]又例如,上述预设特征值确定规则可以为:若痕迹信息显示任一分词能够为相应 的广告文档带来有效点击,并且用户浏览该广告文档的时间不小于预设时间,则将该分词 的特征值确定为1;若痕迹信息显示任一分词能够为相应的广告文档带来有效点击,并且用 户浏览该广告文档的时间小于预设时间,则将该分词的特征值确定为0.5;若痕迹信息显示 任一分词未能为相应的广告文档带来有效点击,则将该分词的特征值确定为0。
[0068]本实施例中的预测模型具体为:
[0070] 其中,Z = ,fi(A)表示广告文档A中第i个特征值,Wi表示第i个特征值的 i 权重。
[0071 ]上一实施例步骤S13中,利用目标关键词的成本值以及转化率,计算得到目标关键 词的出价的过程中,相应的计算公式为:
[0072] ;其中,
[0073] 匕表示在任意一天内的第j个小时中,目标关键词对应的出价,jG {1,2, . . .,24};
[0074] Q表示在任意一天时间内的第j个小时中,目标关键词对应的成本值;
[0075] CTf表示目标关键词的转化率。
[0076] 进一步的,Cj的计算公式为:Cj = b*aj;
[0077] 其中,b表示用户为了一个有效点击所愿意承担的花费金额;^表示时间成本;其 中,aj具体表不为:
[0079] 其中,%表示任意一天中的第j个小时内的有效点击量,T表示全天时间内的有效 点击量。
[0080] 相应的,本发明实施例还公开了一种基于机器学习的搜索引擎营销竞价系统,参 见图2所示,该系统包括:
[0081] 预测模型构建模块21,用于预先利用机器学习技术,对用户历史搜索信息和用户 点击广告的痕迹信息进行处理,得到训练数据,并利用训练数据进行模型训练,得到用于预 测关键词转化率的预测模型;其中,用户历史搜索信息包括用户搜索关键词和搜索到的广 告文档;
[0082] 转换率计算模块22,用于利用预测模型,计算目标关键词的转化率;
[0083] 出价计算模块23,用于利用目标关键词的成本值以及转化率,计算得到目标关键 词的出价。
[0084] 关于上述各个模块更加具体的工作过程可参考前述实施例中的相关内容,在此不 再 赘述。
[0085] 可见,本发明实施例中,用于进行模型训练的训练数据是通过利用机器学习技术, 对用户历史搜索信息和用户点击广告的痕迹信息进行处理后得到的,通过对该训练数据进 行模型训练,可得到用于预测关键词转化率的预测模型。当需要计算目标关键词的出价时, 便可利用上述预测模型预测该目标关键词的转化率,进而结合该目标关键词的成本,计算 得到该目标关键词的出价,由此可见,在计算目标关键词的出价时,考虑到了目标关键词的 转化率对出价的影响,由于关键词的转化率是衡量广告推广效率的重要指标,所以本发明 实施例计算的目标关键词的出价能较好地与广告推广效率相匹配,也即,本发明实施例提 高了关键词出价与广告推广效率之间的匹配程度,从而提升了广告主的广告投资回报率。 [0086]最后,还需要说明的是,在本文中,术语"包括"、"包含"或者其任何其他变体意在 涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些 要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设 备所固有的要素。在没有更多限制的情况下,由语句"包括一个……"限定的要素,并不排除 在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0087]以上对本发明所提供的一种基于机器学习的搜索引擎营销竞价方法及系统进行 了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例 的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员, 依据本发明的思想,在【具体实施方式】及应用范围上均会有改变之处,综上所述,本说明书内 容不应理解为对本发明的限制。
【主权项】
1. 一种基于机器学习的捜索引擎营销竞价方法,其特征在于,包括: 预先利用机器学习技术,对用户历史捜索信息和用户点击广告的痕迹信息进行处理, 得到训练数据,并利用所述训练数据进行模型训练,得到用于预测关键词转化率的预测模 型;其中,所述用户历史捜索信息包括用户捜索关键词和捜索到的广告文档; 利用所述预测模型,计算目标关键词的转化率; 利用所述目标关键词的成本值W及所述转化率,计算得到所述目标关键词的出价。2. 根据权利要求1所述的基于机器学习的捜索引擎营销竞价方法,其特征在于,还包 括: 按照预设的数据更新周期,定期对所述用户历史捜索信息和所述痕迹信息进行更新, 并利用更新后的用户历史捜索信息和痕迹信息,重新进行模型训练,W对所述预测模型进 行更新。3. 根据权利要求1所述的基于机器学习的捜索引擎营销竞价方法,其特征在于,所述预 先利用机器学习技术,对用户历史捜索信息和用户点击广告的痕迹信息进行处理,得到训 练数据的过程,包括: 预先利用自然语言处理技术,对所述用户历史捜索信息中的广告文档进行分词处理, 并利用主成分分析法,对分词处理后得到的所有分词进行数据降维处理,得到相应的分词 集合; 根据所述痕迹信息,并按照预设特征值确定规则,确定所述分词集合中每一分词对应 的特征值,得到相应的特征值集合; 对所述特征值集合进行筛选,得到N个特征值,并确定所述N个特征值中每一特征值对 应的权重,将所述N个特征值W及对应的分词和权重确定为所述训练数据,其中,N为正整 数。4. 根据权利要求3所述的基于机器学习的捜索引擎营销竞价方法,其特征在于,所述对 所述特征值集合进行筛选,得到N个特征值,并确定所述N个特征值中每一特征值对应的权 重的过程,包括: 对所述特征值集合中每一个特征值单独进行逻辑回归,得到每一个特征值对应的初始 权重; 从所述特征值集合中筛选出所述N个特征值,其中,所述N个特征值中每一个特征值对 应的初始权重均不小于所述特征值集合中其余特征值对应的初始权重; 对所述N个特征值再次进行逻辑回归,得到所述N个特征值中每一特征值对应的权重。5. 根据权利要求3所述的基于机器学习的捜索引擎营销竞价方法,其特征在于,所述预 设特征值确定规则为: 若所述痕迹信息显示任一分词能够为相应的广告文档带来有效点击,则将该分词的特 征值确定为1,否则,将该分词的特征值确定为0。6. 根据权利要求3所述的基于机器学习的捜索引擎营销竞价方法,其特征在于,所述预 设特征值确定规则为: 若所述痕迹信息显示任一分词能够为相应的广告文档带来有效点击,并且用户浏览该 广告文档的时间不小于预设时间,则将该分词的特征值确定为1; 若所述痕迹信息显示任一分词能够为相应的广告文档带来有效点击,并且用户浏览该 广告文档的时间小于所述预设时间,则将该分词的特征值确定为0.5; 若所述痕迹信息显示任一分词未能为相应的广告文档带来有效点击,则将该分词的特 征值确定为0。7. 根据权利要求3所述的基于机器学习的捜索引擎营销竞价方法,其特征在于,所述预 测模型为:其中,fi(A)表示广告文档A中第i个特征值,Wi表示第i个特征值的权重。8. 根据权利要求1至7任一项所述的基于机器学习的捜索引擎营销竞价方法,其特征在 于,所述利用所述目标关键词的成本值W及所述转化率,计算得到所述目标关键词的出价 的过程中,相应的计算公式为: Pj = Cj*CTR'; 其中,門表示在任意一天内的第j个小时中,所述目标关键词对应的出价;Cj表示在任意 一天时间内的第j个小时中,所述目标关键词对应的成本值;CTR/表示所述目标关键词的转 化率,jG{l,2,...,24}。9. 根据权利要求8所述的基于机器学习的捜索引擎营销竞价方法,其特征在于,C非勺计 算公式为: Cj = ^Oj; 其中,b表示用户为了一个有效点击所愿意承担的花费金额;表示时间成本;其中,Qj 具体表示为:其中,表示任意一天中的第j个小时内的有效点击量,T表示全天时间内的有效点击 量。10. -种基于机器学习的捜索引擎营销竞价系统,其特征在于,包括: 预测模型构建模块,用于预先利用机器学习技术,对用户历史捜索信息和用户点击广 告的痕迹信息进行处理,得到训练数据,并利用所述训练数据进行模型训练,得到用于预测 关键词转化率的预测模型;其中,所述用户历史捜索信息包括用户捜索关键词和捜索到的 广告文档; 转换率计算模块,用于利用所述预测模型,计算目标关键词的转化率; 出价计算模块,用于利用所述目标关键词的成本值W及所述转化率,计算得到所述目 柄关键词的出价D
【文档编号】G06F17/30GK105912686SQ201610240342
【公开日】2016年8月31日
【申请日】2016年4月18日
【发明人】董启文
【申请人】上海珍岛信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1