信息展示的方法及设备的制作方法

文档序号:6501928阅读:92来源:国知局
信息展示的方法及设备的制作方法
【专利摘要】本申请提供一种信息展示的方法及设备,所述方法包括:根据历史日志,建立用户的喜好词项集合,并建立每个喜好词项与内容项的对应关系;基于词项的语义对当前的目标用户的喜好词项进行扩展,得到所述目标用户的扩展词项,将所述喜好词项和扩展词项作为所述目标用户对应的关联词项集合;以及按预定规则从所述关联词项集合中提取预定数量的词项作为所述目标用户的推荐词项,并向所述目标用户展示与所述推荐词项对应的内容项。通过采用本申请,可以有效利用用户自身的行为信息提取用户喜好词项,并且,基于语义对用户喜好词项进行扩展,使得每个用户都有充足的可能感兴趣的词项,解决用户喜好内容项稀疏带来的推荐精准度低的问题。
【专利说明】信息展示的方法及设备

【技术领域】
[0001] 本申请涉及计算机信息【技术领域】,尤其涉及一种信息展示的方法及设备。

【背景技术】
[0002] 当今计算机互联网快速发展,海量的互联网推送信息,造成用户无法快速准确地 定位到自己所需要的信息。于是,个性化展示推荐系统受到了各大互联网信息提供者的青 睐,它根据用户的喜好及点击行为等向用户展示其可能感兴趣的信息,进而大大提升了信 息的点击率(CTR)。因此,信息展示推荐系统和方法的优化帮助互联网站主提升其网站资源 的利用效率显得尤为重要,并且已成为目前各大网站的关注问题。
[0003] 目前,展示信息的推荐的主流实现方法是采用协同过滤技术,主要有基于用户 (user-based)协同过滤及基于内容项(item-based)协同过滤的两种方法。
[0004] 基于用户的协同过滤方法的步骤主要包括:(1)寻找与目标用户最相似的若干个 用户组成相近用户集合;(2)将相近集合中的用户喜好的内容或资源推荐给目标用户。
[0005] 基于内容项的协同过滤方法的步骤主要包括:(1)确定目标用户喜好的内容项; (2)分别寻找与其喜好内容项最相似的其他内容项,组成候选内容项集合;(3)将候选内容 项集合及目标用户本身喜好的内容项有效融合后,推荐给目标用户。
[0006] 上述两种基于协同过滤技术的信息展示方法,已被众多大型网站采用,为不同用 户进行个性化的推荐,而且收到了不错的效果,但是都存在一些不足。例如,只关注与用户 对推荐的内容项(item)的喜好程度,而没有利用内容项本身的内容属性,如标题、标签或关 键词等重要信息。或者是,没有有效地利用用户的历史行为数据。因为,用户对内容项的喜 好,往往通过用户对内容项的点击、打标签、评价等行为来衡定,而如用户搜索信息(Query) 这种强烈显示用户意图的信息却没能利用起来。此外,针对拥有大量用户搜索行为、少量用 户点击行为的网站来说,由于用户与对内容项的点击行为较少,会造成推荐的精度大幅度 下降,出现"稀疏性"问题。因此,这两种协同过滤信息展示方法就显得不适用了。


【发明内容】

[0007] 本申请的主要目的在于提供一种信息展示的方法及设备,以解决现有技术存在的 由于用户对网站推荐的内容项的点击行为少,而造成推荐精度较低的问题,其中:本申请提 供的一种信息展示的方法,包括:根据历史日志,建立用户的喜好词项集合,并建立每个喜 好词项与内容项的对应关系;基于词项的语义对当前的目标用户的喜好词项进行扩展,得 到所述目标用户的扩展词项,将所述喜好词项和扩展词项作为所述目标用户对应的关联词 项集合;以及按预定规则从所述关联词项集合中提取预定数量的词项作为所述目标用户的 推荐词项,并向所述目标用户展示与所述推荐词项对应的内容项。
[0008] 根据本申请的实施例,在该方法中,还包括:通过所述目标用户的cookie记录来 标识所述目标用户。
[0009] 根据本申请的实施例,在该方法中,根据历史日志,建立用户的喜好词项集合,并 建立每个喜好词项与内容项的对应关系包括:获得所述目标用户的历史行为信息;对所述 目标用户的历史行为信息进行分词处理以提取出一个或多个词项作为所述目标用户的喜 好词项,并形成所述目标用户的喜好词项集合;以及通过将词项与内容项进行匹配,将所述 目标用户的喜好词项集合中的每个词项与相关的内容项进行关联,并建立每个喜好词项与 内容项的对应关系表。
[0010] 根据本申请的实施例,在该方法中,根据历史日志,建立用户的喜好词项集合,并 建立每个喜好词项与内容项的对应关系包括:获得所述目标用户的历史行为信息和与所述 目标用户行为相似的其他用户的历史行为信息;对所述目标用户的历史行为信息和与所述 目标用户行为相似的其他用户的历史行为信息进行分词处理以提取出一个或多个词项作 为所述目标用户的喜好词项,并形成所述目标用户的喜好词项集合;以及通过将词项与内 容项进行匹配,将所述目标用户的喜好词项集合中的每个词项与相关的内容项进行关联, 并建立每个词项与内容项的对应关系表。
[0011] 根据本申请的实施例,在该方法中,所述历史行为信息包括如下信息中的一项或 多项:用户点击的内容项的标题或内容描述、用户搜索使用的关键词信息、用户浏览的网页 标签、用户收藏的内容项的标题或内容描述。
[0012] 根据本申请的实施例,在该方法中,基于词项的语义对所述目标用户的喜好词项 进行扩展,得到所述目标用户的扩展词项包括:将除所述目标用户外的其他用户的喜好词 项作为所述目标用户的备选词项;获取与所述目标用户的喜好词项语义相关的一个或多 个语义集合,将获取的每个语义集合作为一个潜在语义类;计算在每个潜在语义类下,所述 目标用户与其每个备选词项的相关程度,从而得到所述目标用户与其每个备选词项的相关 性;根据得到的所述目标用户与其每个备选词项的相关性,对所述目标用户的备选词项进 行排序;以及根据对所述备选词项进行排序的结果选取预定数量的备选词项作为所述目标 用户的扩展词项。
[0013] 根据本申请的实施例,在该方法中,按预定规则从所述关联词项集合中选取预定 数量的词项作为所述目标用户的推荐词项,并向所述目标用户展示与所述推荐词项对应的 内容项包括:对所述关联词项集合中的词项进行排序;根据所述排序的结果选取预定数量 的词项作为所述目标用户的推荐词项;以及向所述目标用户展示与所述用户的推荐词项对 应的内容项。
[0014] 根据本申请的实施例,在该方法中,对所述关联词项集合中的词项进行排序包括: 获取与所述目标用户的喜好词项语义相关的一个或多个语义集合,将获取的每个语义集合 作为一个潜在语义类;计算在每个潜在语义类下所述目标用户与其关联词项集合中每个词 项的相关程度,从而得到所述目标用户与其每个词项的相关性;以及根据得到的所述目标 用户与其每个词项的相关性,对所述目标用户的关联词项集合中的词项进行排序。
[0015] 根据本申请的实施例,在该方法中,对所述关联词项集合中的词项进行排序还包 括:对所述目标用户的喜好词项按照每个喜好词项在所述目标用户的行为中发生的权重进 行排序;对所述目标用户的扩展词项按照所述目标用户与其每个扩展词项的相关性进行排 序;以及按照对所述喜好词项进行排序的结果及对所述扩展词项进行排序的结果,将所有 喜好词项排至所有扩展词项之前。
[0016] 根据本申请的实施例,在该方法中,对所述目标用户的喜好词项进行排序包括:根 据所述每个喜好词项在所述目标用户行为中产生的次数及产生的时间来确定所述每个喜 好词项在所述目标用户的行为中发生的权重;按所述每个喜好词项在所述目标用户的行为 中发生的权重对所述目标用户的喜好词项进行排序。
[0017] 根据本申请的另一方面,提供一种信息展示的设备,包括:集合建立模块,用于根 据历史日志,建立用户的喜好词项集合,并建立每个喜好词项与内容项的对应关系;词项扩 展模块,用于基于词项的语义对当前的目标用户的喜好词项进行扩展,得到所述目标用户 的扩展词项,将所述喜好词项和扩展词项作为所述目标用户对应的关联词项集合;以及展 示模块,用于按预定规则从所述关联词项集合中提取预定数量的词项作为所述目标用户的 推荐词项,并向所述目标用户展示与所述推荐词项对应的内容项。
[0018] 与现有技术相比,根据本申请的技术方案,通过在用户层和内容项层之间建立一 个词项层,将用户历史行为信息分割成若干用户的喜好的词项,并且将各个词项与其最相 关的若干个内容项绑定到一起,有效地利用了用户自身的行为信息及用户喜好的内容项的 标题及内容属性信息。并且,本申请基于语义对用户的喜好词项进行扩展,从而使得每个 用户都有充足的可能感兴趣的词项,解决了用户喜好词项稀疏带来的推荐精准度较低的问 题。

【专利附图】

【附图说明】
[0019] 此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申 请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0020] 图1是本申请实施例涉及的信息展示的方法的流程图;
[0021] 图2是本申请实施例的图1中的步骤S101的具体流程图;
[0022] 图3是本申请实施例的图1中的步骤S101的另一实施方式的具体流程图;
[0023] 图4是本申请实施例的图1中的步骤S102的具体流程图;
[0024] 图5是本申请实施例通过引入潜在语义类建立用户与词项的关联的示意图;
[0025] 图6是本申请实施例的图1中的步骤S103的具体流程图;
[0026] 图7是本申请实施例的图6中的步骤S601的具体流程图;
[0027] 图8是本申请实施例的图6中的步骤S601的另一实施方式的具体流程图;
[0028] 图9是本申请实施例的图8中的步骤S801的具体流程图;以及
[0029] 图10是本申请实施例涉及的信息展示的设备1000的框图。

【具体实施方式】
[0030] 本申请的主要思想在于,提供一种信息展示的方法及设备,通过在用户层和内容 项层之间建立一个词项层,将用户历史行为信息分割成若干用户的喜好的词项,并与其最 相关的若干个内容项绑定到一起。并且,基于语义对用户的喜好词项进行扩展,从而使得每 个用户都有充足的可能感兴趣的词项,进而提高展示的内容项的点击率,解决用户喜好词 项稀疏带来的推荐精准度较低的问题。
[0031] 为使本申请的目的、技术方案和优点更加清楚,以下结合附图及具体实施例,对本 申请作进一步地详细说明。
[0032] 根据本申请的实施例,提供了一种信息展示的方法。
[0033] 参考图1,图1是本申请实施例涉及的信息展示方法的流程图。如图1所示,在步骤 S101中,根据历史日志,建立所用户的喜好词项集合,并建立每个喜好词项与内容项的对应 关系。所谓词项(term)就是自然语言中,具有基本语意特征的文字片段。用户输入的文字、 网页的标题、文章的内容、歌曲名称等等都可以认为是由词项组成的。每一种语言中的词项 是相对稳定的集合,单个词项包含的文字数量比用户搜索使用的关键词信息(Query)、语句 等包含的文字数量一般要小,可节约存储空间,同时词项比更小的语言元素(单个汉字或 英语中的字母)具有更丰富的表意性,因此,采用词项表述用户的兴趣或偏好。为有效利用 用户本身的行为及用户喜好的内容项(商品页面、广告信息、音视频节目、新闻、文档或其他 类型的信息)的自身内容属性,如用户搜索的信息,用户点击的页面信息等内容项的标题、 描述等,在用户与内容项(item)之间引入词项层,即建立目标用户的喜好词项的集合。
[0034] 图2为图1中的步骤S101的一种具体流程图,如图2所示,包括步骤S201-S203。
[0035] 在步骤S201中,获取所述目标用户的历史行为信息。所述用户的历史行为信息包 括用户历史行为中的行为对象(即用户行为所作用的对象)的描述信息,可以为如下信息中 的一项或多项:用户点击的内容项的标题或内容描述、用户搜索使用的关键词信息、用户浏 览的网页标签、用户收藏的内容项的标题或内容描述。
[0036] 本申请中,通过所述目标用户的cookie记录来标识所述目标用户。通过识别 Cookie信息,可以识别用户的唯一身份,还可以从cookie信息中获取目标用户的行为信 息。
[0037] 在步骤S202中,对所述目标用户的历史行为信息进行分词处理以提取出一个或 多个词项作为所述目标用户的喜好词项,并形成所述目标用户的喜好词项集合。上述用户 点击、收藏的内容项或标签、搜索使用的关键词信息等都可能为用户感兴趣的内容,将这些 内容的标题、标签或文字描述等通过分词处理从而分割成多个词项,并从中提取出若干核 心的词项,所提取出的词项可以为表示实际意义的所有词项或部分出现频率较高的词项 (即出现频率高于设定阈值的词项),将这些词项组成目标用户喜好的词项的集合。
[0038] 在步骤S203中,通过将词项与内容项进行匹配,将所述目标用户的喜好词项集合 中的每个词项与相关的内容项进行关联,并建立每个词项与内容项的对应关系表。
[0039] 可以通过词项与内容项的描述信息的匹配建立词项与内容项的关联关系。比如, 某一词项出现在内容项的标题中,可以视为词项与内容项的标题相匹配,也就是说,词项与 内容项有较高相关性,可建立目标内容项与词项之间的绑定关系,建立每个词项与内容项 的对应关系表。其中,根据词项与内容项的匹配,可以为一个词项对应多个相关的内容项, 还可以为多个词项对应一个相关的内容项,也可以为这两种关系的融合,即多对多的关系, 也就是说,每个词项对应多个不同的相关的内容项,而每个内容项也都对应多个不同的词 项。而建立的词项与内容的对应关系表,可以采用倒排索引的方式,以用户喜好词项作为索 弓丨,内容项作为索引的目标,即建立词项与内容项的倒排表。如此一来,当向目标用户进行 展示时,就可以展示与目标用户喜好的词项对应的内容项。
[0040] 可选地,步骤S101还可以采用聚类的方法提取用户喜好词项,也就是说,将与目 标用户行为相似的用户的历史行为信息也提取出来,与目标用户的历史行为信息一起作为 所述目标用户的历史行为信息。该步骤对于行为较少的用户而言效果更佳。具体实施流程 图可以参考图3。
[0041] 如图3所示,在步骤S301中,获得所述目标用户的历史行为信息和与所述目标用 户行为相似的其他用户的历史行为信息。
[0042] 在步骤S302中,对所述目标用户的历史行为信息和与所述目标用户行为相似的 其他用户的历史行为信息进行分词处理以提取出一个或多个词项作为所述目标用户的喜 好词项,并形成所述目标用户的喜好词项集合。
[0043] 在步骤S303中,通过词项与内容项的匹配,将所述目标用户的喜好词项集合中的 每个词项与相关的内容项进行关联,并建立每个词项与内容项的对应关系表。
[0044] 在步骤S102中,基于词项的语义对所述目标用户的喜好词项进行扩展,得到所述 目标用户的扩展词项,将所述喜好词项和扩展词项作为所述目标用户对应的关联词项集 合。如果用户行为过少,会导致从用户的行为中提取出用户的喜好词项不足,因此,可以采 用基于语义的主题模型方法来对用户喜好词项集合进行扩展,例如,可以采用概率潜在语 义分析模型PLSA (Probabilistic Latent Semantic Analysis)、隐含狄利克雷分配模型 LDA (Latent Dirichlet Allocation)等。参考图4,图4为图1中的步骤S102的一种具 体流程图,包括步骤S401-S405。
[0045] 如图4所示,在步骤S401中,将除所述目标用户外的其他用户的喜好词项作为所 述目标用户的备选词项。具体的,可以是将与目标用户具有相同的特定特征的其他用户的 喜好词项作为所述目标用户的备选词项。例如,对于某网站的某一目标用户,来源于该网站 的其他用户的喜好词项作为该用户的备选词项,这里,其他用户与所述目标用户具有的相 同的特定特征即为两者来源于同一网站。
[0046] 在步骤S402中,获取与所述目标用户的喜好词项语义相关的一个或多个语义集 合,将获取的每个语义集合作为一个潜在语义类。语义集合,即为类别或属性相同或者意义 相近的一些词项组成的集合,例如,"牛仔裤"、"休闲裤"、"哈伦裤"、"铅笔裤"等都属于裤子 类,因此它们可以组成一个语义集合"裤子""直筒牛仔裤"、"微喇牛仔裤"、"小脚牛仔裤" 等都属于牛仔裤,因此它们可以组成一个语义集合"牛仔裤","牛仔裙"、"衬衫"、"羊绒衫"、 "连衣裙"等都属于衣服,因此它们可以组成一个语义集合"衣服"。在用户与词项之间引入 潜在语义层,也就是说,在用户A与任意词项之间的联系中,引入一个或多个如上所述的语 义集合,这些语义集合可以为与目标用户A的喜好词项语义相关的语义集合,例如,某一用 户的喜好词项有"休闲裤",则可以引入与"休闲裤"类似的"牛仔裤"集合,或者由于"牛仔 裤"类与"牛仔裙"类都属于牛仔服饰类,因此,也可以引入"牛仔裙"集合。每个语义集合 可以作为一个潜在语义类,这样就引入了一个或多个潜在语义类。
[0047] 图5为通过引入潜在语义类建立用户与词项的关联的示意图,如图5所示,通过引 入潜在语义类1、潜在语义类2、潜在语义类3、…、潜在语义类K,建立用户1、用户2、用户 3、…、用户n-1、用户η与词项1、词项2、词项3、…、词项m-Ι、词项m的关联,通过这些潜 在语义类,使得用户不仅与自身行为中包含的词项有联系,且与其他用户的喜好词项同样 具有联系。
[0048] 在步骤S403中,计算在每个潜在语义类下,所述目标用户与其每个备选词项的相 关程度,从而得到所述目标用户与其每个备选词项的相关性。在引入了若干个潜在语义类 后,通过引入的潜在语义类,可以建立目标用户与其他用户喜好词项的联系,即目标用户与 其备选词项的联系,进而在每个潜在语义类下,计算目标用户与其备选词项的相关程度,从 而综合在每个潜在语义类下目标用户与备选词项的相关程度,得到目标用户与其任意备选 词项的相关性。
[0049] 例如,采用PLSA主题模型时,用户A与任意备选词项term B的相关性,即用户A 对备选词项term B的喜好程度,可由公式(1)来定义,即设潜在语义层一共有K个潜在语 义类,则可将用户A与备选词项term B之间的喜好程度,抽象到如下公式(1):
[0050]

【权利要求】
1. 一种信息展示的方法,其特征在于,包括: 根据历史日志,建立用户的喜好词项集合,并建立每个喜好词项与内容项的对应关 系; 基于词项的语义对当前的目标用户的喜好词项进行扩展,得到所述目标用户的扩展词 项,将所述喜好词项和扩展词项作为所述目标用户对应的关联词项集合;以及 按预定规则从所述关联词项集合中提取预定数量的词项作为所述目标用户的推荐词 项,并向所述目标用户展示与所述推荐词项对应的内容项。
2. 根据权利要求1所述的方法,其特征在于,还包括:通过所述目标用户的cookie记 录来标识所述目标用户。
3. 根据权利要求1所述的方法,其特征在于,根据历史日志,建立用户的喜好词项集 合,并建立每个喜好词项与内容项的对应关系包括: 获得所述目标用户的历史行为信息; 对所述目标用户的历史行为信息进行分词处理以提取出一个或多个词项作为所述目 标用户的喜好词项,并形成所述目标用户的喜好词项集合;以及 通过将词项与内容项进行匹配,将所述目标用户的喜好词项集合中的每个词项与相关 的内容项进行关联,并建立每个喜好词项与内容项的对应关系表。
4. 根据权利要求1所述的方法,其特征在于,根据历史日志,建立用户的喜好词项集 合,并建立每个喜好词项与内容项的对应关系包括: 获得所述目标用户的历史行为信息和与所述目标用户行为相似的其他用户的历史行 为信息; 对所述目标用户的历史行为信息和与所述目标用户行为相似的其他用户的历史行为 信息进行分词处理以提取出一个或多个词项作为所述目标用户的喜好词项,并形成所述目 标用户的喜好词项集合;以及 通过将词项与内容项进行匹配,将所述目标用户的喜好词项集合中的每个词项与相关 的内容项进行关联,并建立每个词项与内容项的对应关系表。
5. 根据权利要求3或4所述的方法,其特征在于,所述历史行为信息包括如下信息中的 一项或多项:用户点击的内容项的标题或内容描述、用户搜索使用的关键词信息、用户浏览 的网页标签、用户收藏的内容项的标题或内容描述。
6. 根据权利要求1所述的方法,其特征在于,基于词项的语义对所述目标用户的喜好 词项进行扩展,得到所述目标用户的扩展词项包括: 将除所述目标用户外的其他用户的喜好词项作为所述目标用户的备选词项; 获取与所述目标用户的喜好词项语义相关的一个或多个语义集合,将获取的每个语义 集合作为一个潜在语义类; 计算在每个潜在语义类下,所述目标用户与其每个备选词项的相关程度,从而得到所 述目标用户与其每个备选词项的相关性; 根据得到的所述目标用户与其每个备选词项的相关性,对所述目标用户的备选词项进 行排序;以及 根据对所述备选词项进行排序的结果选取预定数量的备选词项作为所述目标用户的 扩展词项。
7. 根据权利要求1所述的方法,其特征在于,按预定规则从所述关联词项集合中选取 预定数量的词项作为所述目标用户的推荐词项,并向所述目标用户展示与所述推荐词项对 应的内容项包括: 对所述关联词项集合中的词项进行排序; 根据所述排序的结果选取预定数量的词项作为所述目标用户的推荐词项;以及 向所述目标用户展示与所述用户的推荐词项对应的内容项。
8. 根据权利要求7所述的方法,其特征在于,对所述关联词项集合中的词项进行排序 包括: 获取与所述目标用户的喜好词项语义相关的一个或多个语义集合,将获取的每个语义 集合作为一个潜在语义类; 计算在每个潜在语义类下所述目标用户与其关联词项集合中每个词项的相关程度,从 而得到所述目标用户与其每个词项的相关性;以及 根据得到的所述目标用户与其每个词项的相关性,对所述目标用户的关联词项集合中 的词项进行排序。
9. 根据权利要求7所述的方法,其特征在于,对所述关联词项集合中的词项进行排序 还包括: 对所述目标用户的喜好词项按照每个喜好词项在所述目标用户的行为中发生的权重 进行排序; 对所述目标用户的扩展词项按照所述目标用户与其每个扩展词项的相关性进行排序; 以及 按照对所述喜好词项进行排序的结果及对所述扩展词项进行排序的结果,将所有喜好 词项排至所有扩展词项之前。
10. 根据权利要求9所述的方法,其中,对所述目标用户的喜好词项进行排序包括: 根据所述每个喜好词项在所述目标用户行为中产生的次数及产生的时间来确定所述 每个喜好词项在所述目标用户的行为中发生的权重; 按所述每个喜好词项在所述目标用户的行为中发生的权重对所述目标用户的喜好词 项进行排序。
11. 一种信息展示的设备,其特征在于,包括: 集合建立模块,用于根据历史日志,建立用户的喜好词项集合,并建立每个喜好词项与 内容项的对应关系; 词项扩展模块,用于基于词项的语义对当前的目标用户的喜好词项进行扩展,得到所 述目标用户的扩展词项,将所述喜好词项和扩展词项作为所述目标用户对应的关联词项集 合;以及 展示模块,用于按预定规则从所述关联词项集合中提取预定数量的词项作为所述目标 用户的推荐词项,并向所述目标用户展示与所述推荐词项对应的内容项。
12. 根据权利要求11所述的设备,其特征在于,所述设备还包括:标识模块,用于通过 所述目标用户的cookie记录来标识所述目标用户。
13. 根据权利要求11所述的设备,其特征在于,所述集合建立模块包括: 信息获得模块,用于获得所述目标用户的历史行为信息; 喜好词项提取模块,用于对所述目标用户的历史行为信息进行分词处理以提取出一个 或多个词项作为所述目标用户的喜好词项,并形成所述目标用户的喜好词项集合;以及 关联模块,用于通过将词项与内容项进行匹配,将所述目标用户的喜好词项集合中的 每个词项与相关的内容项进行关联,并建立每个喜好词项与内容项的对应关系表。
14. 根据权利要求11所述的设备,其特征在于,所述集合建立模块包括: 信息获得模块,用于获得所述目标用户的历史行为信息和与所述目标用户行为相似的 其他用户的历史行为信息; 词项提取模块,用于对所述目标用户的历史行为信息和与所述目标用户行为相似的其 他用户的历史行为信息进行分词处理以提取出一个或多个词项作为所述目标用户的喜好 词项,并形成所述目标用户的喜好词项集合;以及 关联模块,用于通过将词项与内容项进行匹配,将所述目标用户的喜好词项集合中的 每个词项与相关的内容项进行关联,并建立每个词项与内容项的对应关系表。
15. 根据权利要求13或14所述的设备,其特征在于,所述信息获得模块获得的所述历 史行为信息包括如下信息中的一项或多项:用户点击的内容项的标题或内容描述、用户搜 索使用的关键词信息、用户浏览的网页标签、用户收藏的内容项的标题或内容描述。
16. 根据权利要求11所述的设备,其特征在于,所述词项扩展模块还包括: 备选词项获得模块,用于将除所述目标用户外的其他用户的喜好词项作为所述目标用 户的备选词项; 潜在语义类获取模块,用于获取与所述目标用户的喜好词项语义相关的一个或多个语 义集合,将获取的每个语义集合作为一个潜在语义类; 相关性计算模块,用于计算在每个潜在语义类下,所述目标用户与其每个备选词项的 相关程度,从而得到所述目标用户与其每个备选的词项的相关性; 备选词项排序模块,用于根据得到的所述目标用户与其每个备选词项的相关性,对所 述目标用户的备选词项进行排序;以及 扩展词项选取模块,用于根据对所述备选词项进行排序的结果选取预定数量的备选词 项作为所述目标用户的扩展词项。
17. 根据权利要求11所述的设备,其特征在于,所述展示模块包括: 词项排序模块,用于对所述关联词项集合中的词项进行排序; 推荐词项选取模块,用于根据所述排序的结果选取预定数量的词项作为所述目标用户 的推荐词项;以及 内容项展示模块,用于向所述目标用户展示与所述用户的推荐词项对应的内容项。
18. 根据权利要求17所述的设备,其特征在于,所述词项排序模块包括: 获取模块,用于获取与所述目标用户的喜好词项语义相关的一个或多个语义集合,将 获取的每个语义集合作为一个潜在语义类; 计算模块,用于计算在每个潜在语义类下所述目标用户与其关联词项集合中每个词项 的相关程度,从而得到所述目标用户与其每个词项的相关性;以及 第一排序模块,用于根据得到的所述目标用户与其每个词项的相关性,对所述目标用 户的关联词项集合中的词项进行排序。
19. 根据权利要求17所述的设备,其中,所述词项排序模块还包括: 喜好词项排序模块,用于对所述目标用户的喜好词项按照每个喜好词项在所述目标用 户的行为中发生的权重进行排序; 扩展词项排序模块,用于对所述目标用户的扩展词项按照所述目标用户与其每个扩展 词项的相关性进行排序;以及 第二排序模块,用于按照所述喜好词项及扩展词项各自的排序结果,将所有喜好词项 排至所有扩展词项之前。
20.根据权利要求19所述的设备,其中,喜好词项排序模块包括: 权重确定子模块,用于根据所述每个喜好词项在所述目标用户行为中产生的次数及产 生的时间来确定所述每个喜好词项在所述目标用户的行为中发生的权重; 排序子模块,用于按所述每个喜好词项在所述目标用户的行为中发生的权重对所述目 标用户的喜好词项进行排序。
【文档编号】G06F17/30GK104111941SQ201310136190
【公开日】2014年10月22日 申请日期:2013年4月18日 优先权日:2013年4月18日
【发明者】吴黎霞 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1