基于搜索引擎的广告投放方法、装置以及搜索引擎系统与流程

文档序号:14923535发布日期:2018-07-13 07:55阅读:208来源:国知局

本发明涉及数据挖掘技术领域,尤其涉及一种基于搜索引擎的广告投放方法、装置以及搜索引擎系统。



背景技术:

随着信息时代的到来,互联网在生活中扮演着越来越重要的角色,广告投放也因此多了一种全新的方式。一种广告投放方法是通过搜索引擎进行广告的投放,在搜索业务中,搜索引擎的日搜索量多达数十亿次并且用户在使用搜索引擎时,所键入的内容都是他们感兴趣的,这样的场景是十分契合广告投放的。但是现行的通过搜索引擎进行广告的投放存在着一些缺陷。在大量的搜索中,总是存在着一些无效搜索,用户无法得到与其期望相匹配的结果,同时,就广告方面而言,传统的搜索引擎广告推荐方法一般通过第三方cookie,在进行搜索的时候,搜索引擎设置一个用户标识cookie,当访问了有搜索引擎推广广告的网页时候,此网页会根据之前留下的搜索关键词,生成广告链接,并展示给用户。但该方法涉及到隐私泄露问题,而且用户可以通过禁用cookie保护隐私,使广告推广变得不精准。



技术实现要素:

本发明的一个或多个实施例提供一种基于搜索引擎的广告投放方法、装置以及搜索引擎系统。

根据本公开的一个方面,提供一种基于搜索引擎的广告投放方法,包括:基于广告语义索引模型建立与预设的广告相对应的广告特征索引矩阵;其中,所述广告特征索引矩阵中的每一列向量或每一行向量为与一条广告相对应的广告特征向量;获取用户输入的查询文本信息,对所述查询文本信息进行分词处理,获得查询特征词;基于所述广告语义索引模型和所述查询特征词建立查询特征向量;计算每个广告特征向量与所述查询特征向量之间的语义相似度;基于所述语义相似度确定用于进行投放的广告。

可选地,所述基于广告语义索引模型建立与预设的广告相对应的广告特征索引矩阵包括:获取用于描述所述广告的标准类别描述信息;对所述标准类别描述信息进行分词处理,获得用于描述所述广告的描述特征词并生成分词词典;基于所述广告语义索引模型和所述描述特征词建立所述广告特征索引矩阵。

可选地,所述基于所述广告语义索引模型和所述描述特征词建立所述广告特征索引矩阵包括:生成所述描述特征词的集合,形成与所述广告相对应的词袋;根据所述集合中的所述描述特征词的数量确定所述广告特征向量的维数;根据词频-逆文档率tf-idf算法计算出每个描述特征词的权值,根据所述权值建立所述广告特征索引矩阵;其中,所述广告特征索引矩阵的行数为所述广告的数量,所述广告特征索引矩阵的列数为所述集合中的所述描述特征词的数量,所述广告特征索引矩阵中的每一列向量为与一条广告相对应的广告特征向量。

可选地,所述广告特征索引矩阵w为:

其中,所述w中的元素ωij是第i个描述特征词对于第j个标准类别描述信息的权值,第j个标准类别描述信息用于描述第j个广告;所述ωij=tfi,j×idfi;其中,

nij是第i个描述特征词在第j个标准类别描述信息中的出现次数,∑knkj是在第j个标准类别描述信息中所有描述特征词出现的次数之和;

其中,d为所述标准类别描述信息的总数,{j:ti∈dj}表示包含有第i个描述特征词的标准类别描述信息数目。

可选地,所述基于所述广告语义索引模型和所述查询特征词建立查询特征向量包括:基于所述分词词典对所述查询文本信息进行分词处理,获得所述查询特征词;基于所述查询特征词建立所述查询特征向量p0={p1,p2,…,pn}t,所述查询特征向量的维数为所述广告特征向量的维数;

其中,所述查询特征向量p0中的元素pi=tfi*idfi,

其中,mi是第i个查询特征词在所述查询文本信息中的出现次数,∑kmk是在所述查询文本信息中所有查询特征词出现的次数之和;idfi为与第i个查询特征词相同的所述描述特征词的逆文档率。

可选地,所述计算每个广告特征向量与所述查询特征向量之间的语义相似度包括:计算所述广告特征索引矩阵中的每一列向量或每一行向量与所述查询特征向量的余弦相似度。

可选地,所述基于所述语义相似度确定用于进行投放的广告包括:将计算获得的余弦相似度进行排序,基于排序结果选取与预设的广告推送数量阈值数量相同的所述广告特征向量;将选取的所述广告特征向量对应的广告推送给用户。

可选地,利用网络爬虫技术收集与所述广告相对应的信息,将此信息添加在用于描述此广告的标准类别描述信息中;对于所述标准类别描述信息进行分词处理,根据分词结果生成所述分词词典。

根据本发明的另一方面,提供一种基于搜索引擎的广告投放装置,包括:索引矩阵建立模块,用于基于广告语义索引模型建立与预设的广告相对应的广告特征索引矩阵;其中,所述广告特征索引矩阵中的每一列向量或每一行向量为与一条广告相对应的广告特征向量;查询向量生成模块,用于获取用户输入的查询文本信息,对所述查询文本信息进行分词处理,获得查询特征词;基于所述广告语义索引模型和所述查询特征词建立查询特征向量;相似度计算模块,用于计算每个广告特征向量与所述查询特征向量之间的语义相似度;广告投放确定模块,用于基于所述语义相似度确定用于进行投放的广告。

可选地,所述索引矩阵建立模块,用于获取用于描述所述广告的标准类别描述信息;对所述标准类别描述信息进行分词处理,获得用于描述所述广告的描述特征词并生成分词词典;基于所述广告语义索引模型和所述描述特征词建立所述广告特征索引矩阵。

可选地,所述索引矩阵建立模块,用于生成所述描述特征词的集合,形成与所述广告相对应的词袋;根据所述集合中的所述描述特征词的数量确定所述广告特征向量的维数;根据词频-逆文档率tf-idf算法计算出每个描述特征词的权值,根据所述权值建立所述广告特征索引矩阵;其中,所述广告特征索引矩阵的行数为所述广告的数量,所述广告特征索引矩阵的列数为所述集合中的所述描述特征词的数量,所述广告特征索引矩阵中的每一列向量为与一条广告相对应的广告特征向量。

可选地,所述广告特征索引矩阵w为:

其中,所述w中的元素ωij是第i个描述特征词对于第j个标准类别描述信息的权值,第j个标准类别描述信息用于描述第j个广告;所述ωij=tfi,j×idfi;其中,

nij是第i个描述特征词在第j个标准类别描述信息中的出现次数,∑knkj是在第j个标准类别描述信息中所有描述特征词出现的次数之和;

其中,d为所述标准类别描述信息的总数,{j:ti∈dj}表示包含有第i个描述特征词的标准类别描述信息数目。

可选地,所述查询向量生成模块,用于基于所述分词词典对所述查询文本信息进行分词处理,获得所述查询特征词;基于所述查询特征词建立所述查询特征向量p0={p1,p2,…,pn}t,所述查询特征向量的维数为所述广告特征向量的维数;

其中,所述查询特征向量p0中的元素pi=tfi*idfi,

其中,mi是第i个查询特征词在所述查询文本信息中的出现次数,∑kmk是在所述查询文本信息中所有查询特征词出现的次数之和;idfi为与第i个查询特征词相同的所述描述特征词的逆文档率。

可选地,所述相似度计算模块,用于计算所述广告特征索引矩阵中的每一列向量或每一行向量与所述查询特征向量的余弦相似度。

可选地,所述广告投放确定模块,用于将计算获得的余弦相似度进行排序,基于排序结果选取与预设的广告推送数量阈值数量相同的所述广告特征向量;将选取的所述广告特征向量对应的广告推送给用户。

可选地,所述索引矩阵建立模块,还用于利用网络爬虫技术收集与所述广告相对应的信息,将此信息添加在用于描述此广告的标准类别描述信息中;对于所述标准类别描述信息进行分词处理,根据分词结果生成所述分词词典。

根据本发明的又一方面,提供一种搜索引擎系统,包括如上所述的基于搜索引擎的广告投放装置。

根据本发明的又一方面,提供一种基于搜索引擎的广告投放装置,其中,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行如上所述的基于搜索引擎的广告投放方法。

根据本发明的再一方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该指令被一个或多个处理器执行时实现如上所述的方法的步骤。

本公开的基于搜索引擎的广告投放方法、装置以及搜索引擎系统,建立与预设的广告相对应的广告特征索引矩阵,获取用户输入的查询文本信息,建立查询特征向量,计算每个广告特征向量与广告特征索引矩阵的查询特征向量之间的语义相似度,基于语义相似度确定用于进行投放的广告;对用户键入的搜索摘要与广告的标准类别描述信息进行快速匹配,提高搜索摘要与广告主题的匹配度,可以实现快速精准的广告投放;预先形成广告库并采用相似度模型能够保证高效地进行匹配,达到了短时间内精准投放广告的目的,同时保证用户隐私,并能够提高用户的使用感受。

附图说明

为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为根据本公开的基于搜索引擎的广告投放方法的一个实施例的流程示意图;

图2为根据本公开的基于搜索引擎的广告投放方法的另一个实施例的流程示意图;

图3a至图3e为根据本公开的基于搜索引擎的广告投放方法的一个实施例的获取与用户输入的查询文本信息对应的广告的标准类别描述信息的结果示意图;

图4为根据本公开的基于搜索引擎的广告投放装置的一个实施例的模块示意图;

图5为根据本公开的基于搜索引擎的广告投放装置的另一个实施例的模块示意图。

具体实施方式

下面参照附图对本公开进行更全面的描述,其中说明本公开的示例性实施例。下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。

图1为根据本公开的基于搜索引擎的广告投放方法的一个实施例的流程示意图,如图1所示:

步骤101,基于广告语义索引模型建立与预设的广告相对应的广告特征索引矩阵。广告特征索引矩阵中的每一列向量或每一行向量为与一条广告相对应的广告特征向量。

步骤102,获取用户输入的查询文本信息,对查询文本信息进行分词处理,获得查询特征词。

步骤103,基于广告语义索引模型和查询特征词建立查询特征向量。

步骤104,计算每个广告特征向量与查询特征向量之间的语义相似度。

步骤105,基于语义相似度确定用于进行投放的广告。

上述实施例中的基于搜索引擎的广告投放方法,对用户键入的搜索摘要(即用户搜索时输入的查询文本信息)与广告的标准类别描述信息进行快速匹配,可以实现快速精准的广告投放。

在一个实施例中,基于广告语义索引模型建立与预设的广告相对应的广告特征索引矩阵可以有多种方法。例如,构建本地广告库,获取用于描述广告库中广告的标准类别描述信息。对标准类别描述信息进行分词处理,获得用于描述广告的描述特征词并生成分词词典。基于广告语义索引模型和描述特征词建立广告特征索引矩阵。

利用网络爬虫技术收集与广告相对应的信息,将扩充的信息添加在用于描述此广告的标准类别描述信息中,对于标准类别描述信息进行分词处理,根据分词结果生成分词词典。可以提前整理与广告库中的广告相关的标准类别描述信息,并按照广告的分类条目去扩充标准类别描述信息。用于描述广告的标准类别描述信息主要用于说明广告的类别,例如,在服务器端有一个广告类别是篮球服,篮球服广告对应的标准类别描述信息中的关键词为nba、篮球服等。如果出现了与nba相关的搜索词,把篮球服广告投放给搜索该词的用户。线上有一个用户搜索了科比,科比与nba是有关系的,但是广告的描述特征词只有一个nba条目,此时需要进行语义扩充。使用爬虫技术爬取与nba相关的词,构建与nba相关的语料库,如“科比”、“麦蒂”等相关词汇,将相关词汇添加到篮球服广告对应的标准类别描述信息中,作为描述特征词。线上匹配用户的搜索词“科比”就能与nba建立起关系。

例如,一个广告对应的标准类别描述信息为“淘宝购物”,扩充语义后,“淘宝购物”扩充为“淘宝购物笔记本”和“淘宝购物电视机”。利用网络爬虫技术获取并整合符合其含义的具体事物名称,构建新词,即对网络中新出现的名词整理收集。在搜索领域,每天都有各种各样的新词出现,而对于搜索摘要这样的短文本,其中每一个词都有可能是关键词,例如,“植物大战僵尸”,不能将词分成“植物”、“大战”、“僵尸”,否则会导致语义错误。建立自定义的分词词典,将一些特有名词,例如游戏名等加入到词典中,使分词更加准确。

图2为根据本公开的基于搜索引擎的广告投放方法的另一个实施例的流程示意图,如图2所示:

步骤201,获取用于描述广告的标准描述信息,对标准描述信息进行分词处理,获得用于描述广告的描述特征词并生成分词词典。

步骤202,根据tf-idf算法计算出每个描述特征词的权值,根据权值建立广告特征索引矩阵。

步骤203,基于分词词典对查询词条进行分词处理,获得查询特征词,基于查询特征词建立查询特征向量。

步骤204,计算广告特征索引矩阵中的每一列向量或每一行向量与查询特征向量的余弦相似度。

步骤205,将计算获得的余弦相似度进行排序,基于排序结果选取与预设的广告推送数量阈值数量相同的广告特征向量。

在一个实施例中,基于广告语义索引模型和描述特征词建立广告特征索引矩阵可以有多种方式。例如,生成描述特征词的集合,形成与广告相对应的词袋。根据集合中的描述特征词的数量确定广告特征向量的维数。根据词频-逆文档率tf-idf算法计算出每个描述特征词的权值,根据权值建立广告特征索引矩阵。广告特征索引矩阵的行数为广告的数量,广告特征索引矩阵的列数为集合中的描述特征词的数量,广告特征索引矩阵中的每一列向量为与一条广告相对应的广告特征向量。

广告特征索引矩阵w为:

其中,w中的元素ωij是第i个描述特征词对于第j个标准类别描述信息的权值,第j个标准类别描述信息用于描述第j个广告;ωij=tfi,j×idfi。

其中,nij是第i个描述特征词在第j个标准类别描述信息中的出现次数,∑knkj是在第j个标准类别描述信息中所有描述特征词出现的次数之和。

其中,d为标准类别描述信息的总数,{j:ti∈dj}表示包含有第i个描述特征词的标准类别描述信息数目。

例如,将“淘宝购物电视机”短语通过词典进行分词为淘宝、购物、电视机,形成词袋(包含所有的分词结果)。如果词袋中包含“淘宝”、购物、“电视机”、“笔记本”4个维度,那么广告的标准类别描述信息“淘宝购物电视机”和“淘宝购物笔记本”分别对应的向量(向量元素的权值为1或0)为:1,1,1,0和1,1,0,1。标准类别描述信息“淘宝购物电视机”和“淘宝购物笔记本”建立的广告特征索引矩阵由这两个向量组成。广告特征索引矩阵中每个维度上的权值衡量了该描述特征词在文本中的重要程度。

tf-idf(termfrequency–inversedocumentfrequency)是一种用于信息检索与数据挖掘的加权算法。tf-idf是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。

采用词频-逆文档率(tf-idf)值作为广告特征索引矩阵的元素的具体权值,词频(tf)越大说明该词在标准类别描述信息中出现的次数较多,认为该词比较重要,逆文档率(idf)越小说明该词在标准类别描述信息集合中包含该词的文本数越多,认为该词的重要性越小,因此通过计算tf*idf的值,最终确定各个维度上的权重,进而将标准类别描述信息集合表示成基于tf-idf的词矩阵。

在搜索领域,一条搜索摘要一般为40字左右,由于短文本信息量少,噪音影响较大,因此对短文本的自动分类相比长文本要困难的多。造成困难的根本原因是自然语言文本和对话在各个层次上广泛存在的各种各样的歧义性或多义性。而且在搜索领域,摘要文本形式多种多样,一条短文本中的每个词都有可能是关键词,产生歧义的可能性很大。

在一个实施例中,对用户输入所得的摘要条目进行向量化处理,基于分词词典对查询文本信息进行分词处理,获得查询特征词。基于查询特征词建立查询特征向量p0={p1,p2,…,pn}t,查询特征向量的维数为广告特征向量的维数;

查询特征向量p0中的元素pi=tfi*idfi。

mi是第i个查询特征词在查询文本信息中的出现次数,∑kmk是在查询文本信息中所有查询特征词出现的次数之和;idfi为与第i个查询特征词相同的描述特征词的逆文档率。例如,用户输入的查询文本信息为“淘宝笔记本”,进行分词处理,获得查询特征词为“淘宝”,“笔记本”,查询特征向量的维度为标准类别描述信息“淘宝购物电视机”和“淘宝购物笔记本”对应的两个向量的维度,维度为4。

计算查询特征向量中的查询特征词的词频:tf2=0,tf3=0,计算向量的计算向量中的查询特征词的逆文档率,分别与标准类别描述信息“淘宝购物电视机”和“淘宝购物笔记本”对应的两个向量的维度中相同的描述特征词的逆文档率相同,即根据pi=tfi*idfi,获得查询文本信息为“淘宝笔记本”的查询特征向量为

由于摘要文本只有一条,所以无法计算逆文档率,因此采用与查询特征词相同的描述特征词的逆文档率作为查询特征词的逆文档率,采用tf*idf作为向量矩阵元素中的具体权值。对某些特别的词,制定相应的预处理规则,例如查询特征向量“淘宝”可以视作与描述特征词“淘宝购物”相同。

在一个实施例中,计算每个广告特征向量与查询特征向量之间的语义相似度可以有多种方法。例如,计算广告特征索引矩阵中的每一列向量或每一行向量与查询特征向量的余弦相似度。将计算获得的余弦相似度进行排序,基于排序结果选取与预设的广告推送数量阈值数量相同的广告特征向量,将选取的广告特征向量对应的广告推送给用户。广告推送数量阈值数量可以为3、4等。

例如,查询特征向量a{x1,x2}t和一个广告特征向量b{y1,y2}t,则a与b之间的余弦相似度为cos(a,b),表示为其值越接近1越相似。

选取计算结果中阈值内的结果,在广告库中选择对应广告,回传用户,在其浏览器中显示,保障了广告信息的准确程度,采用的相似度模型保证能高效地进行匹配,达到了短时间内精准投放广告的目的。

如图3a所示,获取用户输入的查询文本信息“一次性筷子套装餐具三件套竹筷牙签勺子纸巾外卖餐具订制淘宝网”、“1987年春晚音乐冬天里的一把火演唱费翔”,基于所述分词词典对上述的两个查询文本信息进行分词处理。如图3b、3c所示,获取分词处理后的查询特征词的频度和逆文档率。如图3d、3e所示,计算以建立的广告特征索引矩阵中的每一列向量或每一行向量与“一次性筷子套装餐具三件套竹筷牙签勺子纸巾外卖餐具订制淘宝网”、“1987年春晚音乐冬天里的一把火演唱费翔”对应的查询特征向量的余弦相似度,将计算获得的余弦相似度进行排序,分别选取5个余弦相似度最高的广告特征向量对应的的标准类别描述信息,标准类别描述信息为“网络购物-家居家装-餐饮具”、“休闲娱乐-音乐”等,0.42345366、0.18338855等为余弦相似度值,分别将5个余弦相似度最高的标准类别描述信息对应的广告推送给用户,在浏览器中进行显示。

如图4所示,根据本公开提供一种基于搜索引擎的广告投放装置40,包括:索引矩阵建立模块41、查询向量生成模块42、相似度计算模块43和广告投放确定模块44。索引矩阵建立模块41基于广告语义索引模型建立与预设的广告相对应的广告特征索引矩阵;其中,广告特征索引矩阵中的每一列向量或每一行向量为与一条广告相对应的广告特征向量。

查询向量生成模块42获取用户输入的查询文本信息,对查询文本信息进行分词处理,获得查询特征词。查询向量生成模块42基于广告语义索引模型和查询特征词建立查询特征向量。相似度计算模块43计算每个广告特征向量与查询特征向量之间的语义相似度。广告投放确定模块44基于语义相似度确定用于进行投放的广告。

索引矩阵建立模块41利用网络爬虫技术收集与广告相对应的信息,将此信息添加在用于描述此广告的标准类别描述信息中。索引矩阵建立模块41对于标准类别描述信息进行分词处理,根据分词结果生成分词词典。

在一个实施例中,索引矩阵建立模块41获取用于描述广告的标准类别描述信息,对标准类别描述信息进行分词处理,获得用于描述广告的描述特征词并生成分词词典。索引矩阵建立模块41基于广告语义索引模型和描述特征词建立广告特征索引矩阵。

索引矩阵建立模块41生成描述特征词的集合,形成与广告相对应的词袋,根据集合中的描述特征词的数量确定广告特征向量的维数。索引矩阵建立模块41根据词频-逆文档率tf-idf算法计算出每个描述特征词的权值,根据权值建立广告特征索引矩阵;其中,广告特征索引矩阵的行数为广告的数量,广告特征索引矩阵的列数为集合中的描述特征词的数量,广告特征索引矩阵中的每一列向量为与一条广告相对应的广告特征向量。广告特征索引矩阵w为:

其中,w中的元素ωij是第i个描述特征词对于第j个标准类别描述信息的权值,第j个标准类别描述信息用于描述第j个广告;ωij=tfi,j×idfi;其中,

nij是第i个描述特征词在第j个标准类别描述信息中的出现次数,∑knkj是在第j个标准类别描述信息中所有描述特征词出现的次数之和;

其中,d为标准类别描述信息的总数,{j:ti∈dj}表示包含有第i个描述特征词的标准类别描述信息数目。

查询向量生成模块42基于分词词典对查询文本信息进行分词处理,获得查询特征词。查询向量生成模块42基于查询特征词建立查询特征向量p0={p1,p2,…,pn}t,查询特征向量的维数为广告特征向量的维数。

查询特征向量p0中的元素pi=tfi*idfi,

其中,mi是第i个查询特征词在查询文本信息中的出现次数,∑kmk是在查询文本信息中所有查询特征词出现的次数之和;idfi为与第i个查询特征词相同的描述特征词的逆文档率。

相似度计算模块43计算广告特征索引矩阵中的每一列向量或每一行向量与查询特征向量的余弦相似度。广告投放确定模块44将计算获得的余弦相似度进行排序,基于排序结果选取与预设的广告推送数量阈值数量相同的广告特征向量,将选取的广告特征向量对应的广告推送给用户。

在一个实施例中,本公开提供一种搜索引擎系统,包括如上任一实施例的基于搜索引擎的广告投放装置。

图5为根据本发明公开的基于搜索引擎的广告投放装置的另一个实施例的模块示意图。如图5所示,该装置可包括存储器51、处理器52、通信接口53以及总线54。存储器51用于存储指令,处理器52耦合到存储器51,处理器52被配置为基于存储器51存储的指令执行实现上述的基于搜索引擎的广告投放方法。

存储器51可以为高速ram存储器、非易失性存储器(non-volatilememory)等,存储器51也可以是存储器阵列。存储器51还可能被分块,并且块可按一定的规则组合成虚拟卷。处理器52可以为中央处理器cpu,或专用集成电路asic(applicationspecificintegratedcircuit),或者是被配置成实施本发明公开的基于搜索引擎的广告投放方法的一个或多个集成电路。

在一个实施例中,本公开还提供一种计算机可读存储介质,其中计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如上任一实施例涉及的基于搜索引擎的广告投放方法。本领域内的技术人员应明白,本公开的实施例可提供为方法、装置、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

至此,已经详细描述了本公开。为了避免遮蔽本公开的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。

上述实施例提供的基于搜索引擎的广告投放方法、装置以及搜索引擎系统,建立与预设的广告相对应的广告特征索引矩阵,获取用户输入的查询文本信息,建立查询特征向量,计算每个广告特征向量与查询特征向量之间的语义相似度,基于语义相似度确定用于进行投放的广告;对用户键入的搜索摘要与广告的标准类别描述信息进行快速匹配,提高搜索摘要与广告主题的匹配度,可以实现快速精准的广告投放;预先形成的广告库并采用相似度模型保证能够高效地进行匹配,达到了短时间内精准投放广告的目的,同时避免使用cookie,保证用户隐私,并能够提高用户的使用感受。

可能以许多方式来实现本公开的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和系统。用于方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。

本公开的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本公开限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本公开的原理和实际应用,并且使本领域的普通技术人员能够理解本公开从而设计适于特定用途的带有各种修改的各种实施例。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1