一种广告信息搜索方法和系统与流程

文档序号:13396578阅读:207来源:国知局
一种广告信息搜索方法和系统与流程
本申请涉及网络技术领域,特别是涉及一种广告信息搜索方法和系统。

背景技术:
随着互联网的发展,互联网提供的信息已经越来越多样化,而通过互联网投放广告也成为广告客户的重要选择,在互联网中投放广告的服务不但可以为广告客户进行宣传,而且可以为用户提供更多的服务器信息。互联网搜索引擎作为信息服务器平台,通过搜索引擎投放广告也已经成为广告客户普遍采用的一种广告投放方式。互联网客户在搜索时,向搜索引擎提交查询词,搜索引擎将与查询词最相关的一组网页的链接作为搜索结果页面返回给用户端,用户可以点击这些链接去访问相关网页。现有技术中,在通过搜索引擎投放广告时,广告客户通过检索关键词竞价排名系统注册与其所要推广的广告链接网站或者网页密切相关的一组检索关键词;用户端输入查询词后,搜索引擎首先对所述查询词进行扩展得到候选词,然后选择候选词中与查询词最相关候选词作为检索关键词,然后依据扩展后的各检索关键词进行检索,如果广告客户注册的关键词与所述检索关键词匹配,那么即可进行展现。举例比如输入查询词“诺基亚手机”,可扩展“诺基亚”,“手机”,“诺基亚N97”,“诺基亚5230”等候选词,然后从这些候选词中选取与“诺基亚手机”相关性大于阈值的词作为检索关键词去进行检索。但在实际现有技术的现有技术中:首先,搜索引擎能够接收的搜索词的个数是存在上限,如果搜索词个数超过这个上限,搜索引擎的效率和性能就会受很大影响,即搜索引擎基于查询词进行扩展时,其选择的扩展后的检索关键词个数不会超过其能接收的最大个数;第二,对于广告的投放位置来说,实际中,即能够有效展示广告的投放位置是有限的;第三,对于各广告客户来说,实际中,广告客户一般根据实际情况对自己选择的一组检索关键词进行展示限定(比如展示时间段),那么,如果搜索引擎根据扩展的各检索关键词在广告库中搜索到该广告客户的广告,但此时不符合客户设定的展示条件(比如此时不在客户设定的展示时间段内),那么搜索引擎就不会召回该条广告放入广告信息搜索位置进行投放。基于上述情况,现有技术存在如下缺点:现有技术中搜索引擎基于客户输入的查询词扩展出的各检索关键词的只基于相关性考虑,在搜索引擎能接收的最优搜索词个数、有效广告信息搜索位置个数、和各广告客户对于其自身广告的展示条件的限制下,其扩展出的检索关键词中可能存在一个或几个检索关键词,在检索关键词广告索引库后无法召回广告进行展示,并且由于搜索引擎能接收的检索关键词有个数限制,如果搜索引擎扩展出了无法召回广告的检索关键词,该词就占据了检索资源,导致其他与查询词相关的检索词无法及时或者不能进入检索过程,影响了其他与所述查询词相关并且符合展示条件的广告的展示,使扩展后的检索关键词不能够充分利用有限的广告位置展示广告客户的广告。

技术实现要素:
本申请所要解决的技术问题是提供一种广告信息搜索方法和系统,解决现有技术中扩展词无法有效在检索关键词广告索引库后无法召回广告进行展示,广告的展示效率低的问题。为了解决上述问题,本申请公开了一种广告信息搜索方法,包括:将用户端输入的查询词进行扩展,获得扩展后的候选词集合;分析搜索引擎实时日志和/或当前时间的广告客户状态信息获得有效词集合;所述广告客户状态信息包括广告客户选择的关键词展示条件信息;所述有效词集合包括当前时间符合展示条件的关键词;利用所述有效词集合,过滤掉所述候选词集合中不在有效词集合中的词;选择过滤后的候选词集合中至少一个候选词检索广告信息。优选的,通过以下步骤获取用户状态信息:从数据存储服务器获取各广告客户对应的数据库表,所述数据库表包括广告客户的广告费用预算和广告客户的广告推广时间。优选的,所述数据库表包括广告客户的广告费用预算表和广告客户的广告推广时间表,分别对应广告客户的广告费用预算和广告推广时间。优选的,获取广告客户对应的数据库表后,包括:分析所述广告客户的广告费用预算表和广告客户的广告推广时间表,对于广告费用预算大于阈值且广告推广时间段包含所述当前时间的广告客户,将所述广告选择的关键词加入有效词集合。优选的,通过以下步骤分析搜索引擎实时日志获得有效词集合:从搜索引擎获取实时搜索日志;分析所述实时搜索日志中各检索关键词在当前时间段内是否返回广告给用户端;如果返回,则将对应检索关键词加入有效词集合。优选的,在利用所述有效词集合,过滤掉所述候选词集合中不在有效词集合中的词后,还包括:针对所述过滤后的候选词集合中的候选词,计算所述候选词与所述查询词的相关度;针对所述过滤后的候选词集合中的候选词,统计所述候选词的有效广告客户深度;所述有效广告客户深度为选择所述候选词并且在当前时间符合所述展示条件的广告客户的数量;结合所述候选词的相关度的权重和有效广告客户深度的权重对所述过滤后的候选词集合中的各候选词进行重排序。优选的,所述的数据库表还包括广告客户在线状态表。优选的,在利用所述有效词集合,过滤掉所述候选词集合中不在有效词集合中的词后,还包括:针对所述过滤后的候选词集合中的候选词,计算所述候选词与所述查询词的相关度;针对所述过滤后的候选词集合中的候选词,统计所述候选词的有效广告客户深度;所述有效广告客户深度为选择所述候选词并且在当前时间符合所述展示条件的广告客户的数量;统计选择所述候选词并且在当前时间符合所述展示条件的在线广告客户的数量;结合所述候选词的相关度的权重、有效广告客户深度的权重和在线广告客户数量对所述过滤后的候选词集合中的各候选词进行重排序。优选的,将用户端输入的查询词进行扩展,获得扩展后的候选词集合时包括:获取广告客户新选择的关键词,将所述关键词加入扩展词库;计算所述查询词与扩展词库中各关键词的相关性,当所述相关性大于阈值时,将所述关键词加入候选词集合。相应的,本申请公开了一种广告信息搜索系统,包括:查询词扩展模块,用于将用户端输入的查询词进行扩展,获得扩展后的候选词集合;有效词集合获取模块,用于分析搜索引擎实时日志和/或当前时间的广告客户状态信息获得有效词集合;所述广告客户状态信息包括广告客户选择的关键词展示条件信息;所述有效词集合包括当前时间符合展示条件的关键词;过滤模块,用于利用所述有效词集合,过滤掉所述候选词集合中不在有效词集合中的词;检索模块,用于选择过滤后的候选词集合中至少一个候选词检索广告信息。优选的,所述有效词集合获取模块包括:用户状态信息获取子模块,用于从数据存储服务器获取各广告客户对应的数据库表,所述数据库表包括广告客户的广告费用预算和广告客户的广告推广时间。优选的,所述数据库表包括广告客户的广告费用预算表和广告客户的广告推广时间表,分别对应广告客户的广告费用预算和广告推广时间。优选的,所述有效词集合获取模块还包括:用户状态分析子模块,用于分析所述广告客户的广告费用预算表和广告客户的广告推广时间表,对于广告费用预算大于阈值且广告推广时间段包含所述当前时间的广告客户,将所述广告选择的关键词加入有效词集合。优选的,所述有效词集合获取模块包括:实时日志获取子模块,用于从搜索引擎获取实时搜索日志;实时日志分析子模块,用于分析所述实时搜索日志中各检索关键词在当前时间段内是否返回广告给用户端;如果返回,则将对应检索关键词加入有效词集合。与现有技术相比,本申请包括以下优点:本申请在系统获取到用户端的查询词,并依据所述查询词扩展得到大量与所述查询词相关的候选词集合后,实时分析广告客户实时状态数据或搜索引擎实时日志,获得当前能够召回广告的关键词,并将所述关键词作为有效关键词加入有效词集合,然后利用该有效词集合筛选所述候选词集合,筛选后获得能够召回广告的候选词集合,然后对所述筛选后的各候选词进行重排序,获取其中排序靠前的至少一个检索关键词,至多到搜索引擎保持性能最优个数的检索关键词,然后基于上述检索关键词进行检索。上述方法中,通过实时的过滤掉不能召回广告的扩展的候选词,保证了当前时间输入至检索引擎的检索关键词能够及时召回广告进行展示,不影响广告的展示效率,能充分利用有限的展示资源展示广告。附图说明图1是本申请一种广告信息搜索方法的流程示意图;图2是本申请一种广告信息搜索系统的结构示意图;图3是本申请优选的一种广告信息搜索系统的结构示意图。具体实施方式为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。参照图1,示出了本申请一种广告信息搜索方法的流程示意图,具体可以包括:步骤110,将用户端输入的查询词进行扩展,获得扩展后的候选词集合。由于用户和广告客户的知识领域等的不对称,有时广告客户选择的关键词(即购买的竞价词)可能不完全符合用户的搜索时的组词习惯,从而导致不能最大可能的曝光广告客户试图推广的产品或广告,所以搜索引擎一般会对用户输入的查询词进行扩展,基于目前搜索引擎普遍采用的关键词广告索引方式(通过用户购买的竞价词匹配相应广告),在搜索引擎关键词广告扩展匹配中,一般是通过各种方法(增词,减词,替换等)在原始用户查询的基础上,在保证一定相关性前提下,扩展出一个或者多个的竞价词,然后通过将原词以及扩展出的竞价词作为新的查询进行广告匹配。在关键词广告中,在竞价词扩展匹配中除了相关性,一般会增加商业因素相关的评价方法,比如扩展PPC(pay-per-click,表示广告每次点击的扣费)高的词,客户深度(购买某个竞价词的用户数称为客户深度)高的词等等。一般,对于查询词的扩展方法有三种:一是短语匹配,按照相关性取用户查询词的子串作为推荐词,比如诺基亚手机,可以扩展诺基亚和手机,其中诺基亚相关性高于手机。二是包含扩展匹配,也就是扩展信息更丰富的词包含用户搜索的词,比如用户搜索手机,可以扩展三星手机,htc手机等,扩展的方法是原词进行分词,然后通过查词的倒排索引,找出包含原词的所有词,最后根据相关性取最好的N个词作为推荐结果。三是基于统计的关联推荐,根据网站的搜索日志,根据用户搜索行为查找相似的搜索词,进行聚类,推荐相关词。比如搜索手机可以推荐iphone。本申请对于用户端输入的查询词,也会对其进行扩展,首先获得扩展后的候选词集合。步骤120,分析搜索引擎实时日志和/或当前时间的广告客户状态信息获得有效词集合;所述广告客户状态信息包括广告客户选择的关键词展示条件信息;所述有效词集合包括当前时间符合展示条件的关键词。由于搜索引擎基于其性能的原因,有最大搜索词个数的限制,所以其只会选择其中相关性最高的检索词。对于现有技术获取到的各扩展词中,可能其中的广告客户已选择的关键词(即客户选择的竞价词),由于该广告客户对其自身需要推广的广告设置了展示条件,从而其选择的关键词也相应的存在展示条件,如果搜索引擎当前的展示环境不符合用户设置的展示条件,比如客户设置的广告展示时间段不包括当前的展示时间,或者客户当前的账户余额低于其设置的展示余额等,那么即使搜索引擎最终选择了该关键词,也无法召回该关键词对应的广告客户的广告进行展现,那么就浪费了搜索引擎的检索工作,降低了搜索引擎的效率。而本申请,对于前述得到的候选词集合,首先获取实时的有效词集合,所述的有效词集合包括当前时间符合展示条件的关键词,比如对于“诺基亚”,存在选择该词的广告客户,其设置的广告展示时间段包括当前的展示时间,同时其用于支付推广费用的账户余额大于其设置的阈值。其中,一般在搜索引擎进行推广一般可采用CPC(CostPerClick,网络广告每次点击费用)系统收取广告客户的费用。对于有效词集合的获取,一般通过分析搜索引擎实时日志和/或当前时间的广告客户状态信息获得有效词集合。优选的,通过以下步骤获取用户状态信息:步骤S11,从数据存储服务器获取各广告客户对应的数据库表,所述数据库表包括广告客户的广告费用预算和广告客户的广告推广时间。进一步的,包括:从数据存储服务器获取各广告客户对应的数据库表,所述数据库表包括广告客户的广告费用预算表和广告客户的广告推广时间表。本申请通过数据库表关联,一般情况下决定广告客户的广告是否上线的因素一般有两个,一是预算,即广告客户对自己账户余额限值的设定,比如当账户余额小于300时,不再允许广告被展现;二是推广时间,即广告客户对广告推广时间的设定,比如中午11点至下午1点。所以可从数据存储服务器获取各广告客户对应的数据库表进行分析,更进一步说所以可通过数据库表中的广告客户的广告费用预算表和广告客户的广告推广时间表获取有效词集合,即获取具有有效广告客户深度(有效广告客户深度:对于购买了一竞价词各广告客户,在某一时刻,可以通过该竞价词在线上进行展现的广告对应的广告客户数量,即在所述某一时刻,可通过所述竞价词从广告库召回进行展现的广告对应的广告客户数量)的关键词(竞价词)。优选的,获取广告客户对应的数据库表后,包括:步骤S12,分析所述广告客户的广告费用预算表和广告客户的广告推广时间表,对于广告费用预算大于阈值且广告推广时间段包含所述当前时间的广告客户,将所述广告客户选择的关键词加入有效词集合。即通过广告客户的广告费用预算表和广告客户的广告推广时间表的与广告客户选择的关键词的关联性,分析获取有效词集合。或者,通过以下步骤分析搜索引擎实时日志获得有效词集合:步骤S21,从搜索引擎获取实时搜索日志;步骤S22,分析所述实时搜索日志中各检索关键词在当前时间段内是否返回广告给用户端;步骤S23,如果返回,则将对应检索关键词加入有效词集合。在搜索引擎中,会实时记录用户搜索查询词,以及搜索引擎当时展现的广告,所以通过该方法可以获得该段时间段内用户查询词的实时返回广告数,也就是实时客户深度,在这个过程中,如果通过查询词及其扩展词实时返回过广告,那么这些词即可认为是有效词,将其加入有效词集合。步骤130,利用所述有效词集合,过滤掉所述候选词集合中不在有效词集合中的词。在得到有效词集合后,即可对所述候选词集合进行处理,过滤掉所述候选词集合中不在有效词集合中的词。如此,即可过滤掉没有客户深度的词,即不能召回广告客户的广告进行展现的词。比如,当前时间为14:00,对于关键词“诺基亚”,购买该词的广告客户有A、B、C:对于A来说,其设置的该关键词对应的广告展示时间为11:00-13:00,账户余额为1000,其设置的账户余额阈值为300;对于B来说,其设置的该关键词对应的广告展示时间为11:00-15:00,账户余额为100,其设置的账户余额阈值为400;对于C来说,其设置的该关键词对应的广告展示时间为18:00-21:00,账户余额为200,其设置的账户余额阈值为300;那么关键词“诺基亚”对于A来说,其展示条件中虽然其账户余额大于A设置的阈值300,但当前展示时间点不符合A的要求,所以关键词“诺基亚”不能召回A的对应“诺基亚”的广告进行展现;对于B来说其展示条件中虽然当前展示时间点符合B的要求,但其账户余额小于于B设置的阈值400,所以关键词“诺基亚”不能召回B的对应“诺基亚”的广告进行展现;对于C来说,其展示条件中当前展示时间点不符合C的要求,其账户余额小于C设置的阈值300,那么关键词“诺基亚”不能召回B的对应“诺基亚”的广告进行展现。另外优选的,在利用所述有效词集合,过滤掉所述候选词集合中不在有效词集合中的词后,还包括:步骤131,针对所述过滤后的候选词集合中的候选词,计算所述候选词与所述查询词的相关度;对于过滤后的候选词,可计算所述候选词与所述查询词的相关度,比如字面匹配文本相似度+主题相似度:字面文本相似度比如:“诺基亚手机”和“三星手机”,首先对两个词进行分词,打标签,“诺基亚/品牌”,“手机/产品”,“三星/品牌”,“手机/产品”,对于不同的标签其重要程度是不同的,比如产品标签大于品牌标签,大于修饰标签,然后根据两个词匹配的分词以及其标签,计算相似分数。主题相似度比如:基于网站本身的主题体系(比如数码产品,五金工具,体育,娱乐),通过计算用户搜索查询词后点击的信息,可以计算出每个查询词的主题倾向,每个查询词会有一个或者多个主题,根据匹配的主题数,计算二者的相似度。步骤132,针对所述过滤后的候选词集合中的候选词,统计所述候选词的有效广告客户深度;所述有效广告客户深度为选择所述候选词并且在当前时间符合所述展示条件的广告客户的数量;对于过滤后的候选词,因其是利用有效词集合筛选过的,那么每个候选词都会存在一个有效广告客户深度,即该词在当前时间能够召回进行展现的广告个数。比如,对于“笔记本电脑”,当前时间为12:00,购买该词的客户有M1,M2,M3,M4,M5;M1,M2,M3,M4,设置的该词对应广告的展示时间段包括12:00,并且M1,M2,M3,M4各自的账户余额大于其设置的最低阈值,而M5设置的该词对应广告的展示时间段不包括12:00,那么词“笔记本电脑”的有效广告客户深度为4。步骤133,结合所述候选词的相关度的权重和有效广告客户深度的权重对所述过滤后的候选词集合中的各候选词进行重排序。在实际中,排序时会对候选词与查询词的相关度设置权重,也会对该候选词的有效广告客户深度设置权重,那么结合所述候选词的相关度的权重和有效广告客户深度的权重可计算候选词的总权值,从而可基于各候选词的总权值进行排序。比如,相关性权重为a,有效广告客户深度权重为b,对于候选词P,其与查询词的相关性为m,其有效广告客户深度为n,那么词P的总权值W=a*m+b*n。另外,所述的数据库表还包括广告客户在线状态表。用于指示用户在线状态。优选的,在利用所述有效词集合,过滤掉所述候选词集合中不在有效词集合中的词后,还包括:步骤S31,针对所述过滤后的候选词集合中的候选词,计算所述候选词与所述查询词的相关度;步骤S32,针对所述过滤后的候选词集合中的候选词,统计所述候选词的有效广告客户深度;所述有效广告客户深度为选择所述候选词并且在当前时间符合所述展示条件的广告客户的数量;步骤S33,统计选择所述候选词并且在当前时间符合所述展示条件的在线广告客户的数量;步骤S34,结合所述候选词的相关度的权重、有效广告客户深度的权重和在线广告客户数量对所述过滤后的候选词集合中的各候选词进行重排序。本申请还可为候选词的在线状广告客户数量设置一个权重,将其加入总权值计算。步骤140,选择过滤后的候选词集合中至少一个候选词检索广告信息。优选的将前述排序后的候选词中,选取排序靠前的至少一个候选词在搜索引擎中检索广告信息。参照图2,其示出了本申请一种广告信息搜索系统的结构示意图,包括:查询词扩展模块210,用于将用户端输入的查询词进行扩展,获得扩展后的候选词集合;有效词集合获取模块220,用于分析搜索引擎实时日志和/或当前时间的广告客户状态信息获得有效词集合;所述广告客户状态信息包括广告客户选择的关键词展示条件信息;所述有效词集合包括当前时间符合展示条件的关键词;过滤模块230,用于利用所述有效词集合,过滤掉所述候选词集合中不在有效词集合中的词;检索模块240,用于选择过滤后的候选词集合中至少一个候选词检索广告信息。优选的,所述有效词集合获取模块包括:用户状态信息获取子模块,用于从数据存储服务器获取各广告客户对应的数据库表,所述数据库表包括广告客户的广告费用预算和广告客户的广告推广时间。所述数据库表包括广告客户的广告费用预算表和广告客户的广告推广时间表,分别对应广告客户的广告费用预算和广告推广时间。所述有效词集合获取模块还包括:用户状态分析子模块,用于分析所述广告客户的广告费用预算表和广告客户的广告推广时间表,对于广告费用预算大于阈值且广告推广时间段包含所述当前时间的广告客户,将所述广告选择的关键词加入有效词集合。所述有效词集合获取模块包括:实时日志获取子模块,用于从搜索引擎获取实时搜索日志;实时日志分析子模块,用于分析所述实时搜索日志中各检索关键词在当前时间段内是否返回广告给用户端;如果返回,则将对应检索关键词加入有效词集合。参照图3,其示出了本申请优选的一种广告信息搜索系统的结构示意图,包括:用户查询词处理服务器310,搜索引擎服务器320,数据存储服务器330;所述用户查询词处理服务器310,用于接收搜索引擎服务器320前端获得的用户的原始查询词,并获取所述对所述数据存储服务器330中存储的广告客户状态信息;和/或搜索引擎服务器320的实时搜索日志对查询词进行处理,并将处理得到的词返回搜索引擎服务器320。所述的用户查询词处理服务器310包括:查询词扩展模块,用于将用户端输入的查询词进行扩展,获得扩展后的候选词集合;有效词集合获取模块,用于当前时间的广告客户状态信息获得有效词集合;所述广告客户状态信息包括广告客户选择的关键词展示条件信息;所述有效词集合包括当前时间符合展示条件的关键词;过滤模块,用于利用所述有效词集合,过滤掉所述候选词集合中不在有效词集合中的词。所述搜索引擎服务器320,用于将用户输入的原始查询词输入用户查询词处理服务器310,依据用户查询词处理服务器310输送过来的检索词进行最终的广告检索。其中,所述搜索引擎服务器包括检索模块,用于选择过滤后的候选词集合中至少一个候选词检索广告信息。所述数据存储服务器330用于存储的广告客户状态信息。对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。以上对本申请所提供的一种广告信息搜索方法和系统,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1