APP平台的广告索引关键词自动生成方法和装置与流程

文档序号:12271350阅读:276来源:国知局
APP平台的广告索引关键词自动生成方法和装置与流程

本发明涉及搜索技术领域,具体涉及一种APP平台的广告索引关键词自动生成方法和装置。



背景技术:

随着智能移动终端的发展,越来越多的用户在智能移动终端中下载各种APP(application,应用)使用。基于该种情况,APP平台应运而生,用户可以通过智能移动终端访问APP平台,比如通过智能移动终端中安装的APP分发应用去访问APP平台,从而可以从平台中下载各种APP。其中,APP分发应用比如各种手机助手。

而在APP平台中,为了能够为有推广需求的APP拥有者,如App供应商,可以将该APP拥有者的APP在APP搜索页面可以靠前展示,APP拥有者会为这些APP购买竞价词以作为广告索引关键词。

但是,APP供应商购买的竞价词可能与APP本身不匹配,使应用平台的搜索引擎在根据用户输入的搜索词进行检索时,可能返回实际上与该搜索词相关度很低的APP的信息,导致用户为了查找与其需求的APP时,需要进行更多的操作,比如翻页等操作,影响获取其需求的APP的效率。并且,对于APP供应商来说,由于其需要自己选择各种竞价词,操作繁琐。



技术实现要素:

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的APP平台的广告索引关键词自动生成装置和相应的APP平台的广告索引关键词自动生成方法。

依据本发明的一个方面,提供了一种APP平台的广告索引关键词自动生成方法,包括:

针对各APP的描述信息,计算各APP的主题分布;

根据搜索历史记录中搜索词与各APP的点击关系,计算各搜索词的主题分布;

针对每个搜索词,计算所述搜索词的主题分布与广告APP的主题分布 之间的主题相似度;

如果所述主题相似度大于主题阈值,则将所述搜索词作为所述广告APP的关键词;

根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词。

优选地,在针对每个搜索词,计算所述搜索词的主题分布与广告APP的主题分布之间的主题相似度之前还包括:

判断所述搜索词的搜索量是否大于搜索量阈值;

如果所述搜索词的搜索量大于搜索量阈值,则进入针对每个搜索词,计算所述搜索词的主题分布与广告APP的主题分布之间的主题相似度。

优选地,所述针对各APP的描述信息,计算各APP的主题分布,包括:

针对各APP的描述信息,根据潜在狄利克雷分配主题模型,计算各APP的主题分布。

优选地,在根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词之前,还包括:

直接从广告APP的名称和/或标签中,提取对应广告APP的关键词。

优选地,在根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词之前,还包括:

对于搜索下载记录中的各搜索词,计算搜索词和广告APP的名称之间的文本相似度;

如果所述文本相似度大于文本相似阈值,则获取所述搜索词作为关键词。

优选地,在根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词之前,还包括:

对于搜索历史记录的搜索下载记录中的各搜索词,判断所述搜索词的独立访问下载次数是否大于独立访问阈值,以及所述搜索词的类目与广告APP的类目是否属于同一个类目;

如果所述搜索词的独立访问下载次数大于独立访问阈值,以及所述搜 索词的类目与广告APP的类目属于同一个类目,则将所述搜索词作为关键词。

优选地,在根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词之前,还包括:

对于各一级类目下的APP,利用一级类目下的各APP的描述信息,采用分类器将各APP分为相应一级类目下的二级类目;

对每个搜索词,根据搜索历史记录中搜索词与各APP的点击关系,一级所述各APP所属的二级类目,计算所述搜索词所对应的二级类目;

根据广告APP所在的二级类目,获取对应该二级类目的各搜索词则作为关键词。

依据本发明的另外一个方面,提供了一种APP平台的广告索引关键词自动生成装置,包括:

APP主题分布计算模块,适于针对各APP的描述信息,计算各APP的主题分布;

搜索词主题分布计算模块,适于根据搜索历史记录中搜索词与各APP的点击关系,计算各搜索词的主题分布;

主题相似搜索词提取模块,适于针对每个搜索词,计算所述搜索词的主题分布与广告APP的主题分布之间的主题相似度;

第一关键词加入模块,适于如果所述主题相似度大于主题阈值,则将所述搜索词作为所述广告APP的关键词;

广告索引关键词构建模块,适于根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词。

优选地,在主题相似搜索词提取模块之前还包括:

搜索量判断模块,适于判断所述搜索词的搜索量是否大于搜索量阈值;如果所述搜索词的搜索量大于搜索量阈值,则进入主题相似搜索词提取模块。

优选地,所述针APP主题分布计算模块包括:

潜在狄利克雷分配主题模型计算模块,适于针对各APP的描述信息, 根据潜在狄利克雷分配主题模型,计算各APP的主题分布。

优选地,在广告索引关键词构建模块之前,还包括:

直接提取模块,适于直接从广告APP的名称和/或标签中,提取对应广告APP的关键词。

优选地,在广告索引关键词构建模块之前,还包括:

文本搜索词获取模块,适于对于搜索下载记录中的各搜索词,计算搜索词和广告APP的名称之间的文本相似度;

第二关键词加入模块,适于如果所述文本相似度大于文本相似阈值,则获取所述搜索词作为关键词。

优选地,在广告索引关键词构建模块之前,还包括:

独立访问搜索词提取模块,适于对于搜索历史记录的搜索下载记录中的各搜索词,判断所述搜索词的独立访问下载次数是否大于独立访问阈值,以及所述搜索词的类目与广告APP的类目是否属于同一个类目;

第三关键词加入模块,适于如果所述搜索词的独立访问下载次数大于独立访问阈值,以及所述搜索词的类目与广告APP的类目属于同一个类目,则将所述搜索词作为关键词。

优选地,在广告索引关键词构建模块之前,还包括:

APP类目细分模块,适于对于各一级类目下的APP,利用一级类目下的各APP的描述信息,采用分类器将各APP分为相应一级类目下的二级类目;

搜索词分类模块,适于对每个搜索词,根据搜索历史记录中搜索词与各APP的点击关系,一级所述各APP所属的二级类目,计算所述搜索词所对应的二级类目;

类目搜索词提取模块,适于根据广告APP所在的二级类目,获取对应该二级类目的各搜索词则作为关键词。

根据本发明的APP平台的广告索引关键词自动生成方法和装置,对于APP供应商需要推广的广告APP,在APP平台中,利用各个APP(其中包括广告APP)的文章计算各个APP的主题分布,并利用搜索词与APP的点 击关系,计算各个搜索词的主题分布,从而对于广告APP,可以计算广告APP与搜索词之间的主题相似度,将主题相似度大于主题阈值的作为该广告APP的关键词,从而可以在构建索引时将该关键词作为该广告APP的广告索引关键词,由此解决了APP供应商需要通过繁琐的操作选择广告索引关键词的问题,以及由于选择的广告索引关键词不恰当,导致其广告APP出现在与用户输入的搜索词相关度很低的搜索结果中的问题,取得了可以自动为APP供应商的广告APP自动选择广告索引关键词,减少APP供应商对广告索引关键词的选择过程,以及避免广告APP出现在与用户输入的搜索词相关度很低的搜索结果中,提高应用平台的用户体验,并且可以为用户输入的搜索词提供主题相似的APP,提高检索宽度的有益效果。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了根据本发明一个实施例的一种APP平台的广告索引关键词自动生成方法的流程图;

图1A示出了根据本发明一个实施例的一种广告APP的展示示例;

图2示出了根据本发明一个实施例的一种APP平台的广告索引关键词自动生成方法的流程图;

图3示出了根据本发明一个实施例的一种APP平台的广告索引关键词自动生成装置的结构框图;

图4示出了根据本发明一个实施例的一种APP平台的广告索引关键词自 动生成装置的结构框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

参考图1,示出了根据本发明一种实施例的APP平台的广告索引关键词自动生成方法的流程图,该方法具体可以包括以下步骤:

步骤101,针对各APP的描述信息,计算各APP的主题分布;

本发明实施例应用于APP平台,APP供应商可以在APP平台所注册的账户中上传APP。当然,供应商可以在去账户中指定APP为广告APP,并为其支付一定的价值数据,然后,APP平台即可获知该APP为广告APP。

在本发明实施例中,在计算各APP的主题分布时,其文章样本为各广告APP和非广告APP的描述信息。该描述信息可以理解为APP的详细介绍信息。

基于各个APP的描述信息,可以利用主题模型进行分析,将各个APP的主题分布计算出来。计算得到的APP的主题分布包括了广告APP的主题分布。主题分布可以理解为对于一个文章,其主题的概率分布,如对于文章1,其的主题1的概率为0.6,主题2的概率为0.3,得到一个主题向量(0.6,,0.4),就可以理解为文章1的主题分布。

步骤102,根据搜索历史记录中搜索词与各APP的点击关系,计算各搜索词的主题分布;

在用户的搜索过程中,可能其在搜索结果页面中点击查看APP的详细信息而未下载,也可能点击下载APP,由此形成了一系列的针对搜索词的点击关系。在本发明实施例中,所述点击关系可以只包括搜索词与查看的APP之间的点击关系,也可以只包括搜索词与下载的各APP之间的点击关 系,当然,还可以包括搜索词与查看的APP之间的点击关系、以及搜索词与下载的各APP之间的点击关系。

在本发明实施例可以根据搜索词与各APP的点击关系,和步骤101中各个APP的主题分布计算各搜索词的主题分布。即可以根据搜索词与各APP的点击关系,统计一个搜索词对每个APP的点击分布,比如搜索词1点击APP1占比0.8,点击APP2的占比为0.2,那么搜索词1的点击分布为APP2(0.8,0.2),其两项按序对应APP1、APP2。

比如搜索词1点击APP1占比0.8,点击APP2的占比为0.2,而APP1的主题分布为(0.6,0.4),APP2的主题分布为(0.7,0.3),那么搜索词的主题分布可以为((0.6+.07)*0.8,(0.4+0.3)*0.2);其中,主题分布的每项分别对应主题1、主题2。

步骤103,针对每个搜索词,计算所述搜索词的主题分布与广告APP的主题分布之间的主题相似度;如果所述主题相似度大于主题阈值,则进入步骤103;

在本发明实施例中,对于广告APP,可以从步骤101中提取其主题分布的向量,然后针对每个搜索词,可以提取其主题分布向量。由于两者都是向量,则可以计算两个向量之间的相似度。

在本发明实施例中,对于搜索词的主题分布和APP的主题分布之间的相似度,可以采用KL距离和/或JS距离计算。其中,KL距离为Kullback–Leibler divergence,又称相对熵,他对一个离散随机变量的两个概率分布P和Q来说,他们的KL散度定义为: ……公式(1)。

其中求log时,以2为底。

对于JS距离为Jensen–Shannon divergence,其为KL距离的优化方案,其公式为:

……公式(2),

其中……(公式3)。其中,D采用公式(1)计算。

JSD取值是0到1之间。越大代表两个主题分布越一致,相似性越高。

本发明的搜索词的主题分布和广告APP的主题分布分别对应P和Q。

当然,也还可以采用其他距离计算搜索词的主题分布与广告APP的主题分布之间的主题相似度,比如余弦距离。

本发明实施例优选的,同时采用余弦距离和JS距离,然后对该两个距离取平均值或者进行权重相加计算。如此,计算得到的相似度更为精确。

在本发明实施例中,可根据实际测试预设一个主题阈值,如果主题相似度大于主题阈值则进入步骤104。

步骤104,将所述搜索词作为所述广告APP的关键词;

对于与一个广告APP的主题相似度大于主题阈值搜索词,可以将该搜索词加入该广告APP的关键词集。

步骤105,根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词。

在本发明实施例在,APP平台可以设置两套索引,一套针对普通的APP构建的索引,而另一套针对广告APP构建的索引。而针对广告APP构建索引时,则利用步骤101-104得到的各广告APP的关键词集,去构造索引,关键词集中的关键词则构造为索引中的广告索引关键词。

当然,在实际应用中,对于具有同一个广告索引关键词的不同的广告APP,则可以将这些广告APP在广告索引关键词之后索引列表中进行排列。

而对于APP平台,在接收到用户输入的搜索词后,则可分别在针对普通APP的索引和针对广告APP的索引中进行搜索,在针对普通APP的第一搜索结果中,把针对广告APP的索引搜索的各个广告APP,在第一搜索结果中排序靠前展示。

在本发明实施例中,对于前述索引,在应用平台中会通过广告标识将其标记为广告APP,那么再检索到APP时,如果该APP有广告标识,则可 以将其提前展示。该广告标识如“推广”、“荐”。此外,本发明实施例中可以设置多种广告标识,不同的广告标识具备不同的展示权重。比如“推广”的展示权重高,“荐”展示权重低于“推广”的展示权重。如图1A,标识“推广”和“荐”字样的为广告APP,那么爱前进理财和有利网理财为广告app。搜索“理财”关键字展现上述广告app。

综上所述,APP平台的广告索引关键词自动生成方法和装置,对于APP供应商需要推广的广告APP,在APP平台中,利用各个APP(其中包括广告APP)的文章计算各个APP的主题分布,并利用搜索词与APP的点击关系,计算各个搜索词的主题分布,从而对于广告APP,可以计算广告APP与搜索词之间的主题相似度,将主题相似度大于主题阈值的作为该广告APP的关键词,从而可以在构建索引时将该关键词作为该广告APP的广告索引关键词,由此解决了APP供应商需要通过繁琐的操作选择广告索引关键词的问题,以及由于选择的广告索引关键词不恰当,导致其广告APP出现在与用户输入的搜索词相关度很低的搜索结果中的问题。本发明实施例可以自动为APP供应商的广告APP自动选择广告索引关键词,减少APP供应商对广告索引关键词的选择过程,以及避免广告APP出现在与用户输入的搜索词相关度很低的搜索结果中,提高应用平台的用户体验。

并且,针对目前技术中,搜索引擎根据与搜索词的文本相关性的检索,本发明可以为用户输入的搜索词提供主题相似的APP,提高了检索宽度。

参考图2,示出了根据本发明一种实施例的APP平台的广告索引关键词自动生成方法的流程图,该方法具体可以包括以下步骤:

步骤201,针对各APP的描述信息,根据潜在狄利克雷分配主题模型,计算各APP的主题分布;

在本发明实施例中,因为APP的描述信息实际上可以理解为一个文章,上述主题模型可以为LDA(Latent Dirichlet Allocation,潜在狄利克雷分配主题)模型,LDA是一种文档主题生成模型。所谓生成模型,就是说,认为一篇文章的每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语”这样一个过程得到。那么,如果我们要 生成一篇文档,它里面的每个词语出现的概率为:

因此,本发明实施例可以通过LDA模型可以对各个文章进行分析,得到对应各个描述信息的主题分布,即每个主题的概率分布,如主题1的概率为0.6,主题2的概率为0.3,得到一个向量(0.6,,0.4)。然后根据描述信息与APP的对应关系,即可得到APP的主题分布。

当然,本发明实施例中,对于APP主题分布的计算,还可以采用其他的主题模型进行,本发明不对其加以限制。

步骤202,根据搜索历史记录中搜索词与各APP的点击关系,计算各搜索词的主题分布;

步骤203,判断所述搜索词的搜索量是否大于搜索量阈值;如果所述搜索词的搜索量大于搜索量阈值,则进入步骤204;

在实际应用中,有些搜索词搜索量小有些搜索词搜索量大,对于要推广的APP来说,搜索量大的搜索词因为更容易被检索,所以更容易对相应APP进行推广,从而提高APP平台的广告APP的推广效率。因而本发明则在搜索历史记录中统计各个搜索词的搜索量,并预设搜索量阈值,如果对于搜索量大于搜索量阈值的搜索词,才进入步骤205。

步骤204,针对每个搜索词,计算所述搜索词的主题分布与广告APP的主题分布之间的主题相似度;如果所述主题相似度大于主题阈值,则进入步骤205;

步骤205,将所述搜索词作为所述广告APP的关键词;

优选地,在根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词之前,还包括:

步骤A11,直接从广告APP的名称和/或标签中,提取对应广告APP的关键词。

本发明实施例中,可以直接从与广告APP相关的文本信息中提取字/词等作为该广告APP的关键词。

具体的,步骤A11包括:

子步骤A111,将广告APP的名称进行分词操作,将分词结果作为类关键词。

在本发明实施例中,广告APP的身份信息包括名称,如“携程旅行”,那么本发明可以直接对该名称进行分词操作,“携程旅行”分词之后,分词结果为“携程”和“旅行”,那么可以将“携程”和“旅行”作为广告APP“携程旅行”的关键词。

和/或子步骤A112,将广告APP的名称转换为拼音串和/或或者由所述名称进行分词得到的分词结果转换为拼音串,将所述拼音串作为关键词;

对于广告APP的名称,可以将其直接转换为拼音如“xiechenglvxing”,或者将其分词结果转换为拼音,如“携程”的拼音为“xiecheng”,那么这些拼音可以作为该广告APP的关键词。

和/或子步骤A113,将广告APP的标签词作为关键词。

对于一个广告APP的预设的标签词,如“携程旅行”app的具有人工运营的标签词:“旅游”、“火车票”、“旅游攻略”、“机票”、“出行”、“酒店”,那么可以将这些标签词作为关键词。

优选地,在根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词之前,还包括:

步骤B11,对于搜索下载记录中的各搜索词,计算搜索词和广告APP的名称之间的文本相似度;

在实际应用中,用户在终端中输入了搜索词进行搜索,其可能点击下载APP也可能不下载APP,那么应用平台则可以记录各个搜索词的搜索下载情况,比如用户A搜索“理财”,在搜索结果页中下载了APP1,而用户B搜索“理财”,则可能在搜索结果页中下载了APP2,通过对大量用户的搜索下载行为的记录,则可得到对各搜索词的搜索下载记录。

具体实现中,该搜索下载记录以搜索下载日志的形式存储在应用平台中。

步骤B12,如果所述文本相似度大于文本相似阈值,则获取所述搜索词 作为关键词。

本发明实施例可以从搜索下载日志中提取各个已经使用的搜索词,计算该搜索词与广告APP的名称之间的文本相似度。如计算搜索词文本和广告APP名称文本之间的余弦距离。

本发明实施例可以针对文本相似度设置一个文本相似阈值,如果所述文本相似度大于文本相似阈值,则获取所述搜索词作为该广告APP的关键词。如果所述文本相似度小于文本相似阈值,则忽略该词。

优选地,在根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词之前,还包括:

步骤B21,对于搜索历史记录的搜索下载记录中的各搜索词,判断所述搜索词的独立访问下载次数是否大于独立访问阈值,以及所述搜索词的类目与广告APP的类目是否属于同一个类目;

步骤B22,如果所述搜索词的独立访问下载次数大于独立访问阈值,以及所述搜索词的类目与广告APP的类目属于同一个类目,则将所述搜索词作为关键词。

对于搜索下载日志中一个搜索词,可能有多个用户在终端展示的该搜索词的搜索结果中下载APP,而其存在同一个IP的终端下载了多个APP或者同一个APP下载了多次。而为了减少同一个IP的终端对搜索词下载权重的影响,本发明实施例则统计每个搜索词的独立访问下载次数,即UV(Unique Visitor)下载,即即使同一个IP的终端的下载了多次,其UV下载次数也只算一次。然后对于一个搜索词,统计有多少个IP的终端使用该搜索词的搜索结果下载了APP。

然后,本发明实施例设置了针对UV下载次数的独立访问阈值,如果判断搜索词的UV下载次数大于该独立访问阈值,则可判断所述搜索词的类目与广告APP的类目是否属于同一个类目,如果此时搜索词的类目与广告APP的类目属于同一个类目,则将该搜索词作为该广告APP的关键字。而对于一个搜索词,其独立访问下载次数小于等于独立访问阈值,以及其类目与广告APP的类目不属于同一个类目,可以忽略该搜索词。

当然,本发明实施例中对于广告APP也可与普通APP一样,对其进行分类。对于搜索词,也可以对其进行分类。具体的分类过程本发明不对其加以限制。当然可以采用如下步骤对APP和搜索词分类:

子步骤B211,对于各一级类目下的APP,利用一级类目下的各APP的描述信息,采用分类器将各APP分为相应一级类目下的二级类目;

在应用平台中预设的各种分类,该分类从一级分类开始,比如游戏了类、体育类。而实际上,对于一个一级类目下的APP,可以根据其APP的描述信息进行更细的分类。在实际应用中,可以利用贝叶斯分类器对描述信息进行分类,将一级类目下的各APP分到各二级类目下。

子步骤B212,对每个搜索词,根据搜索历史记录中搜索词与各APP的点击关系,一级所述各APP所属的二级类目,计算所述搜索词所对应的二级类目。

在用户的搜索过程中,可能其在搜索结果页面中点击查看APP的详细信息而未下载,也可能点击下APP。本发明实施例可以根据搜索词与各APP的点击关系,结合子步骤B211,的二级类目的APP,将各个搜索词也分到相应的二级类目下。当然广告APP也参与分类过程。

比如搜索词1点击二级类目1中的APP的次数的占比大于占比阈值,则将该搜索词归到该二级类目1下。

上述搜索词与各APP的点击关系,可以为搜索词与各APP的点击查看之间的关系,也可以为搜索词与各APP的点击下载之间的关系,当然也可以为搜索词与各APP的点击查看和点击下载之间的总的关系。

优选地,在根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词之前,还包括:

步骤C11,对于各一级类目下的APP,利用一级类目下的各APP的描述信息,采用分类器将各APP分为相应一级类目下的二级类目;

步骤C12,对每个搜索词,根据搜索历史记录中搜索词与各APP的点击关系,一级所述各APP所属的二级类目,计算所述搜索词所对应的二级类目;

步骤C11-C12与前述子步骤B211-B212类似。由于类似搜索词1点击二级类目1中的APP的次数的占比大于占比阈值,则将该搜索词归到该二级类目1下的情况,存在某个二级类目下,搜索词的点击占比很小,也即该搜索词是该二级类目的概率小,则可以将其从该二级类目中去除。

在将搜索词对应二级类目之后,将对应该二级类目的概率小的搜索词删除,将剩余的二级类目的搜索词生成为一个词包,然后在步骤C13中应用。

步骤C13,根据广告APP所在的二级类目,获取对应该二级类目的各搜索词则作为关键词。

对于广告APP,由于步骤C11计算了各个APP所在的二级类目,那么广告APP的二级类目也确定,步骤C12中确定了二级类目的关键词的词包,那么可以将该词包中的词作为该广告APP的关键词。

在本发明实施例中,对于一个APP,前述各种提取关键词的方式可以进行任意组合,本发明不对其加以限制。

在本发明实施例中,对于通过前述各种关键词获取方式组合得到的关键词,在步骤205中可首先进行归一化,将相同的关键词合并,得到最简的关键词集。

当然,对于前述用到搜索历史记录计算关键词的各种方式,每两种方式之间对搜索历史记录的使用都可以是独立的,相互之间不影响。

步骤206,根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词。

在本发明实施例在,APP平台可以设置两套索引,一套针对普通的APP构建的索引,而另一套针对广告APP构建的索引。而针对广告APP构建索引时,则利用步骤201-205得到的各广告APP的关键词集,去构造索引,关键词集中的关键词则构造为索引中的广告索引关键词。

综上所述,APP平台的广告索引关键词自动生成方法和装置,对于APP供应商需要推广的广告APP,在APP平台中,利用各个APP(其中包括广告APP)的文章计算各个APP的主题分布,并利用搜索词与APP的点击关 系,计算各个搜索词的主题分布,从而对于广告APP,可以计算广告APP与搜索词之间的主题相似度,将主题相似度大于主题阈值的作为该广告APP的关键词,从而可以在构建索引时将该关键词作为该广告APP的广告索引关键词,由此解决了APP供应商需要通过繁琐的操作选择广告索引关键词的问题,以及由于选择的广告索引关键词不恰当,导致其广告APP出现在与用户输入的搜索词相关度很低的搜索结果中的问题。本发明实施例可以自动为APP供应商的广告APP自动选择广告索引关键词,减少APP供应商对广告索引关键词的选择过程,以及避免广告APP出现在与用户输入的搜索词相关度很低的搜索结果中,提高应用平台的用户体验。

并且,针对目前技术中,搜索引擎根据与搜索词的文本相关性的检索,本发明可以为用户输入的搜索词提供主题相似的APP,提高了检索宽度。

再者,本发明实施例可以结合多种广告APP的关键词的获取方式,进一步提高了广告APP词包的宽度,使在检索过程中广告APP的推广范围更广。

最后,上述方式,可以提高广告APP的召回率,提高APP平台的收益。

参照图3,示出了根据本发明一种实施例的APP平台的广告索引关键词自动生成装置的结构图,该结构具体可以包括以下模块:

APP主题分布计算模块301,适于针对各APP的描述信息,计算各APP的主题分布;

搜索词主题分布计算模块302,适于根据搜索历史记录中搜索词与各APP的点击关系,计算各搜索词的主题分布;

主题相似搜索词提取模块303,适于针对每个搜索词,计算所述搜索词的主题分布与广告APP的主题分布之间的主题相似度;

关键词加入模块304,适于如果所述主题相似度大于主题阈值,则将所述搜索词作为所述广告APP的关键词;

广告索引关键词构建模块305,适于根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词。

参照图4,示出了根据本发明一种实施例的APP平台的广告索引关键词自动生成装置的结构图,该结构具体可以包括以下模块:

APP主题分布计算模块401,适于针对各APP的描述信息,计算各APP的主题分布,具体包括:

潜在狄利克雷分配主题模型计算模块4011,适于针对各APP的描述信息,根据潜在狄利克雷分配主题模型,计算各APP的主题分布。

搜索词主题分布计算模块402,适于根据搜索历史记录中搜索词与各APP的点击关系,计算各搜索词的主题分布;

搜索量判断模块403,适于判断所述搜索词的搜索量是否大于搜索量阈值;如果所述搜索词的搜索量大于搜索量阈值,则进入主题相似搜索词提取模块404。

主题相似搜索词提取模块404,适于针对每个搜索词,计算所述搜索词的主题分布与广告APP的主题分布之间的主题相似度;

关键词加入模块405,适于如果所述主题相似度大于主题阈值,则将所述搜索词作为所述广告APP的关键词;

广告索引关键词构建模块406,适于根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词。

优选地,在广告索引关键词构建模块之前,还包括:

直接提取模块,适于直接从广告APP的名称和/或标签中,提取对应广告APP的关键词。

优选地,在广告索引关键词构建模块之前,还包括:

文本搜索词获取模块,适于对于搜索下载记录中的各搜索词,计算搜索词和广告APP的名称之间的文本相似度;

第二关键词加入模块,适于如果所述文本相似度大于文本相似阈值,则获取所述搜索词作为关键词。

优选地,在广告索引关键词构建模块之前,还包括:

独立访问搜索词提取模块,适于对于搜索历史记录的搜索下载记录中的各搜索词,判断所述搜索词的独立访问下载次数是否大于独立访问阈 值,以及所述搜索词的类目与广告APP的类目是否属于同一个类目;

第三关键词加入模块,适于如果所述搜索词的独立访问下载次数大于独立访问阈值,以及所述搜索词的类目与广告APP的类目属于同一个类目,则将所述搜索词作为关键词。

优选地,在广告索引关键词构建模块之前,还包括:

APP类目细分模块,适于对于各一级类目下的APP,利用一级类目下的各APP的描述信息,采用分类器将各APP分为相应一级类目下的二级类目;

搜索词分类模块,适于对每个搜索词,根据搜索历史记录中搜索词与各APP的点击关系,一级所述各APP所属的二级类目,计算所述搜索词所对应的二级类目;

类目搜索词提取模块,适于根据广告APP所在的二级类目,获取对应该二级类目的各搜索词则作为关键词。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一本发明也不起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要 求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的APP平台的广告索引关键词自动生成设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出 替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

本发明公开了一种APP平台的广告索引关键词自动生成方法,包括:

针对各APP的描述信息,计算各APP的主题分布;

根据搜索历史记录中搜索词与各APP的点击关系,计算各搜索词的主题分布;

针对每个搜索词,计算所述搜索词的主题分布与广告APP的主题分布之间的主题相似度;

如果所述主题相似度大于主题阈值,则将所述搜索词作为所述广告APP的关键词;

根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词。

A2、根据A1所述的方法,其特征在于,在针对每个搜索词,计算所述搜索词的主题分布与广告APP的主题分布之间的主题相似度之前还包括:

判断所述搜索词的搜索量是否大于搜索量阈值;

如果所述搜索词的搜索量大于搜索量阈值,则进入针对每个搜索词,计算所述搜索词的主题分布与广告APP的主题分布之间的主题相似度。

A3、根据A1所述的方法,其特征在于,所述针对各APP的描述信息,计算各APP的主题分布,包括:

针对各APP的描述信息,根据潜在狄利克雷分配主题模型,计算各APP的主题分布。

A4、根据A1所述的方法,其特征在于,在根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词之前,还包括:

直接从广告APP的名称和/或标签中,提取对应广告APP的关键词。

A5、根据A1所述的方法,其特征在于,在根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词之前,还包括:

对于搜索下载记录中的各搜索词,计算搜索词和广告APP的名称之间的文本相似度;

如果所述文本相似度大于文本相似阈值,则获取所述搜索词作为关键词。

A6、根据A1所述的方法,其特征在于,在根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词之前,还包括:

对于搜索历史记录的搜索下载记录中的各搜索词,判断所述搜索词的独立访问下载次数是否大于独立访问阈值,以及所述搜索词的类目与广告APP的类目是否属于同一个类目;

如果所述搜索词的独立访问下载次数大于独立访问阈值,以及所述搜索词的类目与广告APP的类目属于同一个类目,则将所述搜索词作为关键词。

A7、根据A1所述的方法,其特征在于,在根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词之前,还包括:

对于各一级类目下的APP,利用一级类目下的各APP的描述信息,采用分类器将各APP分为相应一级类目下的二级类目;

对每个搜索词,根据搜索历史记录中搜索词与各APP的点击关系,一级所述各APP所属的二级类目,计算所述搜索词所对应的二级类目;

根据广告APP所在的二级类目,获取对应该二级类目的各搜索词则作为关键词。

本发明公开了B8、一种APP平台的广告索引关键词自动生成装置,包括:

APP主题分布计算模块,适于针对各APP的描述信息,计算各APP的主题分布;

搜索词主题分布计算模块,适于根据搜索历史记录中搜索词与各APP 的点击关系,计算各搜索词的主题分布;

主题相似搜索词提取模块,适于针对每个搜索词,计算所述搜索词的主题分布与广告APP的主题分布之间的主题相似度;

第一关键词加入模块,适于如果所述主题相似度大于主题阈值,则将所述搜索词作为所述广告APP的关键词;

广告索引关键词构建模块,适于根据所述关键词与广告APP的对应关系,构建对应广告APP的广告索引关键词。

B9、根据B8所述的装置,其特征在于,在主题相似搜索词提取模块之前还包括:

搜索量判断模块,适于判断所述搜索词的搜索量是否大于搜索量阈值;如果所述搜索词的搜索量大于搜索量阈值,则进入主题相似搜索词提取模块。

B10、根据B8所述的装置,其特征在于,所述针APP主题分布计算模块包括:

潜在狄利克雷分配主题模型计算模块,适于针对各APP的描述信息,根据潜在狄利克雷分配主题模型,计算各APP的主题分布。

B11、根据B8所述的装置,其特征在于,在广告索引关键词构建模块之前,还包括:

直接提取模块,适于直接从广告APP的名称和/或标签中,提取对应广告APP的关键词。

B12、根据B8所述的装置,其特征在于,在广告索引关键词构建模块之前,还包括:

文本搜索词获取模块,适于对于搜索下载记录中的各搜索词,计算搜索词和广告APP的名称之间的文本相似度;

第二关键词加入模块,适于如果所述文本相似度大于文本相似阈值,则获取所述搜索词作为关键词。

B13、根据B8所述的装置,其特征在于,在广告索引关键词构建模块之前,还包括:

独立访问搜索词提取模块,适于对于搜索历史记录的搜索下载记录中的各搜索词,判断所述搜索词的独立访问下载次数是否大于独立访问阈值,以及所述搜索词的类目与广告APP的类目是否属于同一个类目;

第三关键词加入模块,适于如果所述搜索词的独立访问下载次数大于独立访问阈值,以及所述搜索词的类目与广告APP的类目属于同一个类目,则将所述搜索词作为关键词。

B14、根据B8所述的装置,其特征在于,在广告索引关键词构建模块之前,还包括:

APP类目细分模块,适于对于各一级类目下的APP,利用一级类目下的各APP的描述信息,采用分类器将各APP分为相应一级类目下的二级类目;

搜索词分类模块,适于对每个搜索词,根据搜索历史记录中搜索词与各APP的点击关系,一级所述各APP所属的二级类目,计算所述搜索词所对应的二级类目;

类目搜索词提取模块,适于根据广告APP所在的二级类目,获取对应该二级类目的各搜索词则作为关键词。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1