信息对象的标题修正方法及装置和推送信息对象的方法_2

文档序号:8282261阅读:来源:国知局
象展示给用户。
[0057]本申请提供的方案包括确定信息对象的一个或多个关联关键词;分别对信息对象的每一关联关键词及信息对象的标题进行分词处理;确定信息对象的标题对应于每一关联关键词的缺失分词;所述缺失分词包括在该关联关键词中出现但在信息对象标题中未出现的分词;及将对应于每一关联关键词的缺失分词分别插入到所述信息对象的标题中,分别形成对应于各关联关键词的标题。通过本申请方案,自动、快速地实现了基于关键词的广告标题的生成,降低了维护成本,而且通过对关键词与广告标题间相关度的检查,以及通过双层转移模型,即缺失的词的类型(type)之间的转移模型,和缺失的词之间的转移模型,选择缺失分词在广告标题中的插入位置,保证了动态插入关键词后广告标题的通顺性,从而提高了广告质量和推广效果。
[0058]本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
【附图说明】
[0059]附图用来提供对本申请技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
[0060]图1为本申请信息对象的标题修正方法的流程图;
[0061]图2为本申请向用户推送信息的方法的流程图
[0062]图3为本申请信息对象的标题修正的装置的组成结构示意图。
【具体实施方式】
[0063]为使本申请的目的、技术方案和优点更加清楚明白,下文中将结合附图对本申请的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
[0064]在本申请一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
[0065]内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
[0066]计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0067]在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0068]图1为本申请信息对象的标题修正方法的流程图。该方法包括:
[0069]步骤100:确定信息对象的一个或多个关联关键词。
[0070]所述关联关键词包括信息发布方指定的与信息对象相关联的关键词。当用户输入的搜索词与信息对象的任一关联关键词匹配时,搜索引擎或信息发布系统向用户推送该信息对象。
[0071]步骤101:分别对信息对象的每一关联关键词及信息对象的标题进行分词处理。
[0072]本步骤中,信息对象的每一关联关键词可以包括一个或多个分词。对信息对象的每一关联关键词及信息对象的标题分别进行分词处理后,可以得到每一关联关键词的分词序列和信息对象的标题的分词序列。
[0073]步骤102:确定信息对象的标题对应于每一关联关键词的缺失分词;所述缺失分词包括在该关联关键词中出现但在信息对象标题中未出现的分词。
[0074]本步骤中,对于每一个关联关键词,判断所述关联关键词的分词序列中是否存在未在标题中出现,如果存在这样的分词,则确定该分词为信息对象的标题对应于该关联关键词的缺失分词。
[0075]步骤103:将对应于每一关联关键词的缺失分词分别插入到所述信息对象的标题中,分别形成对应于各关联关键词的标题。
[0076]不同关联关键词对应的标题可以不同。也就是说,在本申请实施例中为每一个用于与用户输入的搜索词匹配的关联关键词分别分配信息对象的标题。
[0077]可以理解地,在信息对象的各关联关键词中可能存在与所述信息对象相关度并不高的关联关键词,对于这部分关联关键词,可以不用进行所述信息对象的标题的修改。
[0078]因此,本申请实施例还可以包括:根据用户历史行为日志确定信息对象的关联关键词与所述信息对象的相关度;当信息对象的关联关键词与所述信息对象的相关度大于或等于设定的相关度阈值时,则执行步骤103将缺失分词分别插入到所述信息对象的标题中;否则,不执行步骤103。
[0079]其中,用户历史行为日志确定信息对象的关联关键词与所述信息对象的相关度的方法包括:
[0080]统计用户历史行为日志中用户搜索行为匹配到所述关联关键词时并向用户展示所述信息对象的次数,以及用户对基于所述搜索行为而展示的信息对象进行特定操作(t匕如点击浏览、收藏或保存等操作行为)的次数;及
[0081]根据计算所述展示次数与特定操作的次数的比值确定所述关联关键词与所述信息对象的相关度。
[0082]当所述展示次数与特定操作的次数的比值较高时,赋予所述关联关键词与所述信息对象较高的相关度值;当所述展示次数与特定操作的次数的比值较低时,赋予所述关联关键词与所述信息对象较低的相关度值。
[0083]当所述展示次数与特定操作的次数的比值大于或等于设定的第一阈值时,则确定所述关联关键词与所述信息对象的相关度大于或等于设定的相关度阈值。
[0084]当所述信息对象为商品信息时,本步骤中还可以根据确定关联关键词的类目和信息对象的类目是否一致,来确定缺失分词与广告标题的相关程度。确定关联关键词的类目和信息对象的类目是否一致包括:对关联关键词和信息对象分别进行分类,确定每一关联关键词的最相关类目与信息对象的最相关类目,如果该关联关键词与信息对象的最相关类目一致,则确定该关联关键词与信息对象的相关度满足设定的相关度阈值。
[0085]在步骤103中,将所述缺失分词插入到所述信息对象的标题时,根据所述缺失分词与所述标题中各位置上的分词的相关度确定所述缺失分词的插入位置。
[0086]所述缺失分词的插入位置的选择方法包括如下子步骤:
[0087]确定信息对象的标题中的可插入位置;
[0088]分别计算缺失分词和在所述标题中每一个可插入位置相邻的两个分词的同现频率;及
[0089]根据所述同现频率选择所述缺失分词的最佳插入位置。
[0090]具体的,在选择所述缺失分词的插入位置时还可以采用双层转移模型,即不仅考虑缺失分词与各标题分词同现次数的比较,也考虑缺失分词的类型(type)与标题中各分词的类型的同现次数的比较,以此选择缺失分词在所述标题中的最佳插入位置,以保证标题的通顺。
[0091]缺失分词分为产品词和非产品词两种类型,其中产品词是指如手机、电视机、裙子等能够体现产品类别的词,非产品词是指如双卡双待、等离子、中大童等不能体现产品类别的词。下面具体介绍各自的选择缺失分词在广告标题中的插入位置的具体方法:
[0092]以信息对象为广告为例,对于缺失的关联关键词,选择其在广告标题中的插入位置包括:
[0093]首先,对广告标题中的每一个位置pos,按照公式⑴计算其初始得分startscore (pos),
[0094]startscore (pos) =1.0/ (5+fabs (pos-j))(I)
[0095]在公式(I)中,j是广告标题中产品词的位置,fabs表示取绝对值运算。
[0096]如果在广告标题中存在多个产品词,选择fabs (pos-j)的值最小的那个来计算当前位置pos的初始得分startscore (pos);如果在广告标题中没有产品词,则广告标题中的每一个位置的初始得分startscore (pos)都为初始值1/15 ;如果当前位置pos在括号中,那么,该位置的初始得分startscore (pos)乘以a (例如0.5)后作为其初始得分,a是一个预先设置的打折因子,其取值在O到I之间的一个数,需要说明的是,由于不希望term插入到括号中,因此对括号中的位置的得分做了打折,即人为降低其得分。
[0097]接着,对广告标题中的每一个位置pos,按照公式⑴计算其最终得分score(pos),
[0098]score [pos] = startscore[pos]*co(term[pos-1], t) (2)
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1