信息对象的标题修正方法及装置和推送信息对象的方法_3

文档序号:8282261阅读:来源:国知局
[0099]*co (type [pos_l], type)
[0100]公式(2)中,t和type分别表示缺失的词及其类型,这里,词(term)是小粒度的词,例如“白色”,而“白色连衣裙”是关键词。term[p0S-l]是位于第(pos-Ι)个位置的词。当缺失的词t和term[pos-l]在关键词中出现即〈term[pos_l],t >是关联关键词中的一部分时,对C0(term[p0S-l],t)进行放大,将其乘以b,b是一个预先设置的大于I的数值。
[0101]其中,co(term[pos-l], t)表示缺失分词与位于第(pos-Ι)个位置的词的同现次数,其中,Co (type [pos-1], type)表示缺失分词的类型与位于第(pos_l)个位置的词的类型同现次数,type表示缺失分词的类型,如产品词、非产品词。同现次数参数是预先通过广告库的广告标题来统计并存储好的,具体的统计方法属于本领域技术人员的惯用技术手段,并不用于限定本申请的保护范围。根据上述计算,选择广告标题中的得分最大的位置maxpos作为该缺失分词在广告标题中的插入位置。如果通过上述计算后广告标题中的所有位置得分都为0,则表明不可插入,可返回该位置的最终得分为-1。
[0102]对于缺失的非产品类关键词,选择其在广告标题中的插入位置包括:
[0103]在关键词中查找与该缺失的词相关的产品词,
[0104]一方面,如果在关键词中查找到该缺失的词相关的产品词,那么,
[0105]寻找该相关的产品词在广告标题中出现的位置pos2,如果该位置pos2的得分不为-1 (-1表示没有找到),那么,
[0106]要是缺失的词位于相关的产品词的左边,那么,从位置pos2往左寻找插入位置insertpos, title[insertpos]到title[pos2]这个子串,与关键词中的缺失的词到产品词之间的这个子串相同,假设关键词是“ABC”,广告标题为“。。。BC0 0 0 , C”的位置为pos2,为了不让缺失关键词插入到BC之间,那么,insertpos从pos2_2开始,向左扫描,通过向左扫描,按照公式(3)计算每一个候选插入位置insertpos的得分,
[0107]score[insertpos] = startscore[insertpos]*co(term[insertpos-l], t)*co (t,term[insertpos_l]) (3)
[0108]氺co (type [insertpos_l],type)*co (type, type[insertpos])
[0109]公式(3)中,startscore[]的计算与公式(I) 一致。
[0110]如果关键词位于相关的产品词的右边,那么,从位置pos2往右寻找插入位置insertpos, title [pos2]到title [insertpos-1]这个子串,与关键词中的产品词到缺失词之间的这个子串相同。按照公式(4)计算插入位置insertpos的得分,
[0111]score[insertpos] = startscore[insertpos]^co(term[insertpos-1],t)^co (t,term[insertpos]) (4)
[0112]木co (type [insertpos-1],type) ^co (type, type [insertpos])
[0113]公式(4)中,startscore[]的计算与公式(I) 一致。
[0114]根据计算,选择广告标题中的得分最大的位置maxpos作为该缺失分词在广告标题中的插入位置。如果通过上述计算后广告标题中的所有位置得分都为0,则表明不可插入,可返回该位置的最终得分为-1。
[0115]另一方面,如果在缺失分词中未查找到与该非产品词相关的产品词,那么,对广告标题中的每一个位置pos,按照公式(I)计算其初始得分startscore (pos),然后对广告标题中的每一个位置pos,按照公式(5)计算其最终得分score (pos),
[0116]score [pos] = startscore [pos] *co (term[pos_l],t) *co (t, term[pos]) (5)
[0117]氺co(type[pos-1], type)*co (type, type[pos])
[0118]公式(5)中,当〈缺失词t, term[pos_l]>对或〈缺失词t, term[pos]>对在关联关键词中出现时,对co(term[pos-l], t)或co (t, term[pos]进行放大,将其乘以b, b是一个预先设置的大于I的数值。
[0119]根据计算结果,选择广告标题中的得分最大的位置maxpos作为该缺失分词在广告标题中的插入位置。如果通过上述计算后广告标题中的所有位置得分都为0,则表明不可插入,可返回该位置的最终得分为-1。
[0120]在步骤102的选择缺失分词在广告标题中的插入位置中,最重要的是计算关键系之间的转移关系,关键词的类型之间的转移关系。由于关键词及其类型都是使用分词和词性标注得到的结果,因此,可以通过对广告库中的所有广告标题进行分词和词性标注,得到任意两个关键词对〈terml, term2>的同现次数co (terml, term2),以及关键词类型对<typel, type2>的同现次数co (typel, type2),作为其转移关系。这个是线下预先统计的,通过广告库的广告标题来统计。
[0121]通过本申请方法,自动、快速地实现了基于关键词的广告标题的生成,降低了维护成本;而且通过对关键词与广告标题间相关度的检查,以及通过双层转移模型,即缺失的词的类型(type)之间的转移模型,和缺失的词(term)之间的转移模型,选择缺失分词在广告标题中的插入位置,保证了动态插入关键词后广告标题的通顺性,从而提高了广告质量和推广效果。
[0122]本申请方法还包括:在判断缺失分词是否能插入广告标题时,还可以进一步引入广告主偏好因素,比如广告主可以人工指定,或者根据关键词在这个广告标题中的展现点击情况来判断等。以及,
[0123]在计算term或type直接的转移概率时,可以进一步扩大数据规模,不仅采用广告库中的广告标题,还可以使用用户的查询集合等。这样能更好地保证了动态插入关键词后广告标题的通顺性。
[0124]本申请实施例也提供了一种向用户推送信息的方法,如图2所示,包括:
[0125]步骤200:接收用户输入的搜索词,确定用户输入的搜索词匹配的关联关键词,并确定所述关联关键词所关联的信息对象。
[0126]信息对象的关联关键词可以是预先由信息发布方通过搜索引擎或信息发布系统指定。通过指定信息对象的关联关键词,将信息对象与关联关键词建立对应的关联关系。
[0127]确定用户输入的搜索词与关联关键词的匹配可以是精确匹配,也可以是扩展匹配。这里的精确匹配是指用户输入的搜索词与某一关联关键词完全一致或互为同义词时的匹配情形。扩展匹配是指按照设定的扩展匹配算法用户输入的搜索词与某一关联关键词满足特定的相似度要求时的匹配情形。比如,用户输入的搜索词中的特定分词(如中心词、产品词等)与某一关联关键词相同时,可以认为用户输入的搜索词与该关联关键词形成扩展匹配。
[0128]步骤201:对所述关联关键词及信息对象的标题进行分词处理。
[0129]对所述关联关键词及信息对象的标题进行分词处理可以分别得到所述关联关键词的分词序列和信息对象的标题的分词序列。
[0130]步骤202:比较所述关联关键词的分词序列和所述标题的分词序列,将在所述关联关键词的分词序列中出现但未在所述标题的分词序列中出现的分词作为所述标题对应于所述关联关键词的缺失分词。
[0131]步骤203:将所述缺失分词插入到所述标题中,分别形成所述信息对象对应于所述关联关键词的修正后的标题。
[0132]根据关联关键词对信息对象的标题进行修改,将关联关键词中未曾出现在信息对象的标题的分词插入所述标题中。根据不同的关联关键词包括的分词的差别,可以分别得到所述信息对象的不同的标题。
[0133]步骤204:将标题修正后的信息对象返回给用户展示。
[0134]标题修正后的信息对象可以随用户输入的搜索词对应的搜索结果一同返回给用户,并在搜索结果页面上加载显示。
[0135]图3为本申请生成广告标题的装置的组成结构示意图,如图3所示,包括预处理单元、确定单元,以及生成单元,其中,
[0136]预处理单元,用于确定信息对象的一个或多个关联关键词,输出给分词单元;
[0137]分词单元,用于分别对信息对象的每一关联关键词及信息对象的标题分词,输出给确定单元;
[0138]确定单元,用于确定信息对象的标题对应于每一关联关键词的缺失分词,输出给确定单元;所述缺失分词包括在该关联关键词中出现但在信息对象标题中未出现的分词;
[
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1