内容提供装置、内容提供方法以及电子设备的制作方法

文档序号:6501530阅读:154来源:国知局
内容提供装置、内容提供方法以及电子设备的制作方法
【专利摘要】本发明提供了内容提供装置、内容提供方法以及电子设备,以克服现有的用于向用户提供内容的技术所提供的内容与用户的兴趣匹配度较低的问题。内容提供装置包括:获得单元,用于根据当前用户的浏览历史记录获得当前用户的浏览偏好分布,其中,浏览偏好分布用于反映相应的用户分别对各内容类别的关注度;类别确定单元,用于至少基于当前用户的浏览偏好分布来确定至少一个内容类别;以及结果确定单元,用于将与上述至少一个内容类别对应的记录内容确定为搜索结果提供给当前用户。内容提供方法用于执行能够实现内容提供装置的功能的处理。电子设备包括上述内容提供装置。本发明的上述技术能够应用于信息处理领域。
【专利说明】内容提供装置、内容提供方法以及电子设备

【技术领域】
[0001] 本发明涉及信息处理领域,尤其涉及内容提供装置、内容提供方法以及电子设备。

【背景技术】
[0002] 随着信息技术的发展,信息处理逐渐成为一个热门且不可或缺的领域。然而,由于 信息的丰富性和多样性,处理的目的和要求也不尽相同。
[0003] 其中,在一些情况下,用户期望能够在众多的资源中快速地确定其感兴趣的内容。 目前,在现有的用于向用户提供内容的技术中,其提供的内容往往与用户的兴趣之间的匹 配度较低。另外,一些传统的方法通常采用数据挖掘算法(如关联规则方法)向用户推荐内 容,但这些方法常常较为低效。


【发明内容】

[0004] 在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本 理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的 关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概 念,以此作为稍后论述的更详细描述的前序。
[0005] 鉴于此,本发明提供了内容提供装置、内容提供方法以及电子设备,以至少解决现 有的用于向用户提供内容的技术所提供的内容与用户的兴趣匹配度较低的问题。
[0006] 根据本发明的一个方面,提供了一种内容提供装置,该内容提供装置包括:获得单 元,用于根据当前用户的浏览历史记录获得当前用户的浏览偏好分布,其中,浏览偏好分布 用于反映相应的用户分别对各内容类别的关注度;类别确定单元,用于至少基于当前用户 的浏览偏好分布来确定至少一个内容类别;以及结果确定单元,用于将与上述至少一个内 容类别对应的记录内容确定为搜索结果提供给当前用户。
[0007] 根据本发明的另一个方面,还提供了一种内容提供方法,该内容提供方法包括:根 据当前用户的浏览历史记录获得当前用户的浏览偏好分布,其中,浏览偏好分布用于反映 相应的用户分别对各内容类别的关注度;至少基于当前用户的浏览偏好分布来确定至少一 个内容类别;以及将与上述至少一个内容类别对应的记录内容确定为搜索结果提供给当前 用户。
[0008] 根据本发明的另一个方面,还提供了一种电子设备,该电子设备包括如上所述的 内容提供装置。
[0009] 根据本发明的又一个方面,还提供了一种存储有机器可读取的指令代码的程序产 品,上述程序产品在执行时能够使上述机器执行如上所述的内容提供方法。
[0010] 此外,根据本发明的其他方面,还提供了 一种计算机可读存储介质,其上存储有如 上所述的程序产品。
[0011] 上述根据本发明实施例的内容提供装置、内容提供方法以及电子设备,其根据当 前用户的浏览历史记录来获得其对各个内容类别的浏览偏好分布,并基于此来确定至少 一个内容类别,以将与该至少一个内容类别对应的记录内容确定为搜索结果提供给当前用 户,能够获得至少以下益处之一:由于考虑了用户的浏览历史记录,能够使得所提供的内容 记录能够较符合用户的兴趣和/或兴趣;处理较为高效;通过利用未访问时间间隔以及内 容类别信息对各个记录内容进行分类,有利于样本统计,能够使得基于此而得到的后续结 果更为准确;通过基于未访问时间间隔的分组以及利用核密度估计算法的筛选相结合,能 够有效地过滤具有明显噪声特征的样本;能够使得最终计算的当前用户对每个内容类别的 关注度更加准确;以及使得得到的当前用户对各内容类别的浏览偏好分布更为准确。
[0012] 通过以下结合附图对本发明的最佳实施例的详细说明,本发明的这些以及其他优 点将更加明显。

【专利附图】

【附图说明】
[0013] 本发明可以通过参考下文中结合附图所给出的描述而得到更好的理解,其中在所 有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的 详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本 发明的优选实施例和解释本发明的原理和优点。在附图中:
[0014] 图1是示意性地示出根据本发明的实施例的内容提供装置的一种示例结构的框 图。
[0015] 图2是示意性地示出如图1所示的获得单元的一种可能的示例结构的框图。
[0016] 图3是示意性地示出如图2所示的第一分组子单元的一种可能的示例结构的框 图。
[0017] 图4是示意性地示出如图2所示的第一获得子单元的一种可能的示例结构的框 图。
[0018] 图5是示意性地示出如图2所示的第二获得子单元的一种可能的示例结构的框 图。
[0019] 图6是示意性地示出如图1所示的类别确定单元的一种可能的示例结构的框图。
[0020] 图7是示意性地示出如图6所示的相似用户确定子单元的一种可能的示例结构的 框图。
[0021] 图8是示意性地示出如图7所示的相似度获得模块的一种可能的示例结构的框 图。
[0022] 图9是示意性地示出根据本发明的实施例的内容提供装置的另一种示例结构的 框图。
[0023] 图10是示意性地示出如图9所示的预处理单元的一种可能的示例结构的框图。
[0024] 图11是示意性地示出根据本发明的实施例的内容提供方法的一种示例性处理的 流程图。
[0025] 图12是示意性地示出如图11所示的步骤S1120的一种示例性处理的流程图。
[0026] 图13是示意性地示出如图12所示的步骤S1210的一种示例性处理的流程图。
[0027] 图14是示意性地示出如图12所示的步骤S1220的一种示例性处理的流程图。
[0028] 图15是示意性地示出如图12所示的步骤S1230的一种示例性处理的流程图。
[0029] 图16是示意性地示出如图11所示的步骤S1130的一种示例性处理的流程图。
[0030] 图17是示出了可用来实现根据本发明的实施例的内容提供装置和内容提供方法 的一种可能的信息处理设备的硬件配置的结构简图。
[0031] 本领域技术人员应当理解,附图中的元件仅仅是为了简单和清楚起见而示出的, 而且不一定是按比例绘制的。例如,附图中某些元件的尺寸可能相对于其他元件放大了,以 便有助于提高对本发明实施例的理解。

【具体实施方式】
[0032] 在下文中将结合附图对本发明的示范性实施例进行描述。为了清楚和简明起见, 在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施 例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符 合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有 所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开 内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。
[0033] 在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本发明,在附图中 仅仅示出了与根据本发明的方案密切相关的装置结构和/或处理步骤,而省略了与本发明 关系不大的其他细节。
[0034] 本发明的实施例提供了一种内容提供装置,该内容提供装置包括:获得单元,用于 根据当前用户的浏览历史记录获得当前用户的浏览偏好分布,其中,浏览偏好分布用于反 映相应的用户分别对各内容类别的关注度;类别确定单元,用于至少基于当前用户的浏览 偏好分布来确定至少一个内容类别;以及结果确定单元,用于将与上述至少一个内容类别 对应的记录内容确定为搜索结果提供给当前用户。
[0035] 下面结合图1来详细描述根据本发明的实施例的内容提供装置的一个示例。
[0036] 如图1所示,根据本发明的实施例的内容提供装置100包括获得单元110、类别确 定单元120以及结果确定单元130。
[0037] 获得单元110用于根据当前用户的浏览历史记录获得当前用户的浏览偏好分布。
[0038] 在根据本发明的实施例的内容提供装置的一个实现方式中,用户(例如,当前用 户)的浏览历史记录例如可以包括关于该用户所浏览的网站的相关信息的记录内容。在一 个例子中,在网站本身可以记录用户的浏览日志的情况下,可以通过挖掘这些浏览日志来 获得用于反映用户浏览历史(例如,浏览的网站对应的网址、访问时间及所属的内容类别等 信息)的各条记录,即浏览历史记录。在另一个例子中,也可以通过特定数据库来记录用户 浏览过的网站的网址、该网站所属的内容类别以及访问时间等,通过对数据库中相关记录 的处理可以获得用户的上述"浏览历史记录"。
[0039] 在根据本发明的实施例的内容提供装置的另一个实现方式中,浏览历史记录也可 以包括关于用户(例如,当前用户)所浏览的其他浏览对象(例如除网站之外的其他浏览对 象)的相关信息的记录内容。在一个例子中,上述其他浏览对象可以是包含多个阅读分类 (其中,每个阅读分类例如相当于一个上述的内容类别)的关于图书和/或文章的阅读软件, 在这种情况下,用户(如当前用户)的浏览历史记录例如可以包括该用户浏览(阅读)过的图 书和/或文章对应的名称、浏览(阅读)时间及其所属阅读分类等信息。
[0040] 在下文中,将主要以针对用户浏览的网站的浏览历史记录为例来给出描述,但本 领域的技术人员应当理解,浏览历史记录并不限于此,例如也可以是针对除此(网站)之外 的其他浏览对象的浏览历史记录。
[0041] 用户(如当前用户)的浏览偏好分布用于反映相应的用户分别对各内容类别的关 注度。例如,"当前用户的浏览历史记录"用于反映当前用户对各内容类别的关注度。
[0042] 其中,这里所说的"各内容类别"例如可以是预先设定的多个内容类别,或者,也可 以是当前用户的浏览历史记录中的所有记录内容所属的各个内容类别(其中,重复的内容 类别记为同一个)。
[0043] 在一种实现方式中,每个记录内容所属的内容类别例如可以是预先设置的。例如, 对于用户浏览过的网站所属的内容类别(即,对应于浏览历史记录中的某条记录的内容所 属的内容类另lj)来说,当用户浏览某个网站时,网站的后台可以直接记录其访问内容(每条 记录)所属的类别至数据库,由此,可以根据该数据库中所记录的内容类别直接来获得每条 记录的内容类别。又如,对于上述包含多个阅读分类的阅读软件来说,用户在阅读某个图书 和/或文章时,其对应的阅读分类(如历史、科幻等)可以作为该图书和/或文章对应的内容 类别,这样,在用户阅读的同时可以记录其阅读内容的内容类别。
[0044] 在另一种实现方式中,以针对用户浏览的网站的浏览历史记录为例,可以从浏览 日志的URL地址中进行提取相关网站的内容类别。例如,用户的浏览历史记录中的每条记 录可以按照如下格式被记录:(用户,浏览时间,浏览地址)。例如,假设用U S(I来表示当前用 户,该当前用户US(I在时间?;浏览了网站%,其中,假设网站%的地址为ac^,则,这条记录 可以被记录为:(Us Q,TQ,ad。)。假设adO对应的地址adQ (URL地址)格式如下所示:
[0045] http://example.com/news/res_01
[0046] 在这个例子中,记录(US(I,?;,acU的内容所属的内容类别为"news"(即"新闻")。
[0047] 在根据本发明的实施例的内容提供装置的一种实现方式中,获得单元110可以包 括如图2所示的第一分组子单元210、第一获得子单元220和第二获得子单元230。
[0048] 其中,第一分组子单元210可以基于当前用户的浏览历史记录中的未访问时间间 隔来对当前用户的浏览历史记录中的记录内容进行分组,以得到多个组,可以将对当前用 户的浏览历史记录进行分组所获得的每个组作为第一记录内容组。这样,第一分组子单元 210通过对当前用户的浏览历史记录进行分组,能够得到多个第一记录内容组。
[0049] 针对某一用户(如当前用户)来说,其浏览历史记录会随着时间的推移而不断积 累,为了更为准确解决用户随着时间推移而产生的兴趣变化问题,可以对用户的浏览历史 记录进行分隔,即,分隔为多个组,然后对浏览历史记录的每个组进行处理,接着再关联各 个组之间的信息,能够有利于为挖掘用户最新的兴趣分布提供信息基础。
[0050] 图3示出了第一分组子单元210的一种可能的示例结构。
[0051] 如图3所示,第一分组子单元210可以包括间隔选择模块310和划分模块320。
[0052] 间隔选择模块310可以在当前用户US(I的浏览历史记录中的未访问时间间隔中选 择那些大于或等于预定时长的未访问时间间隔,这样,可以选择到一个或多个"未访问时间 间隔",作为多个"第一间隔"。其中,预定时长可以根据经验值来设定,也可以通过试验的方 法来确定,这里不再详述。
[0053] 划分模块320可以基于间隔选择模块310选择的那些"第一间隔"来将当前用户 UsQ的浏览历史记录划分为多个第一记录内容组。
[0054] 需要说明的是,如果当前用户US(I的浏览历史记录中不存在大于或等于预定时长 的未访问时间间隔,则可以不对该浏览历史记录进行分组。
[0055] 在一个例子中,假设当前用户US(I的浏览历史记录如表一所示,并假设在该例子中 上述预定时长为2小时。需要注意的是,在实际应用中,当前用户U S(I的浏览历史记录中所 包含的记录条数不限于表一中所示出的数量。
[0056] 表一:
[0057]

【权利要求】
1. 一种内容提供装置,包括: 获得单元,其用于根据当前用户的浏览历史记录获得所述当前用户的浏览偏好分布, 其中,所述浏览偏好分布用于反映相应的用户分别对各内容类别的关注度; 类别确定单元,其用于至少基于所述当前用户的浏览偏好分布来确定至少一个内容类 别;以及 结果确定单元,其用于将与所述至少一个内容类别对应的记录内容确定为搜索结果提 供给所述当前用户。
2. 根据权利要求1所述的内容提供装置,其中,所述获得单元包括: 第一分组子单元,其用于基于所述当前用户的浏览历史记录中的未访问时间间隔,对 其浏览历史记录中的记录内容进行分组,以得到多个第一记录内容组; 第一获得子单元,其用于获得所述当前用户在每个所述第一记录内容组中分别对所述 各内容类别的关注分数;以及 第二获得子单元,其用于基于所述当前用户在每个所述第一记录内容组中分别对所述 各内容类别的关注分数,获得所述当前用户分别对所述各内容类别的关注度,以得到所述 当前用户的浏览偏好分布。
3. 根据权利要求2所述的内容提供装置,其中,所述第一分组子单元包括: 间隔选择模块,其用于在所述当前用户的浏览历史记录中的未访问时间间隔中选择大 于或等于预定时长的未访问时间间隔,作为第一间隔;以及 划分模块,其用于基于所述第一间隔来将所述当前用户的浏览历史记录划分为多个第 一记录内容组。
4. 根据权利要求2或3所述的内容提供装置,其中,所述第一获得子单元包括: 分类模块,其用于将每个所述第一记录内容组中的记录内容按其对应的内容类别进行 分类;以及 关注分数确定模块,其用于针对每个所述第一记录内容组,获得该第一记录内容组中 每个内容类别下的记录内容数目在该第一记录内容组中所有记录内容总数中所占的比例, 以确定所述当前用户在该第一记录内容组中分别对每个内容类别的关注分数。
5. 根据权利要求2-4中任一项所述的内容提供装置,其中,所述第二获得子单元包括: 选择模块,其用于针对所述各内容类别中的每一个,利用核密度估计算法,在所述当前 用户在所有所述第一记录内容组中对该内容类别的关注分数中选择至少一个关注分数; 计算模块,其用于根据所述各内容类别中的每一个对应的所述至少一个关注分数来计 算所述当前用户对该内容类别的关注度;以及 分布获得模块,其用于根据所述当前用户分别对所述各内容类别的关注度来获得所述 当前用户对所述各内容类别的浏览偏好分布。
6. 根据权利要求1-5中任一项所述的内容提供装置,其中,所述类别确定单元包括: 相似用户确定子单元,其用于基于多个预定用户对所述各内容类别的浏览偏好分布分 别与所述当前用户的浏览偏好分布之间的相似性,在所述多个预定用户中确定所述当前用 户的至少一个相似用户;以及 类别获得子单元,其用于根据所述至少一个相似用户的浏览偏好分布,获得所述至少 一个相似用户最关注的前N1个内容类别,N1为正整数。
7. 根据权利要求6所述的内容提供装置,还包括用于预先获得所述多个预定用户对所 述各内容类别的浏览偏好分布的预处理单元,其中,所述预处理单元包括: 第二分组子单元,其用于基于所述多个预定用户中的每一个的浏览历史记录中的未访 问时间间隔,对该预定用户的浏览历史记录中的记录内容进行分组,以得到该预定用户对 应的多个第二记录内容组; 第三获得子单元,其用于获得所述多个预定用户中的每一个在该预定用户对应的每个 所述第二记录内容组中分别对所述各内容类别的关注分数;以及 第四获得子单元,其用于基于所述多个预定用户中的每一个在该预定用户对应的每个 所述第二记录内容组中分别对所述各内容类别的关注分数,获得该预定用户分别对所述各 内容类别的关注度,以得到该预定用户对所述各内容类别的浏览偏好分布。
8. 根据权利要求6或7所述的内容提供装置,其中,所述相似用户确定子单元包括: 相似度获得模块,其用于获得所述多个预定用户中的每一个对所述各内容类别的浏览 偏好分布与所述当前用户对所述各内容类别的浏览偏好分布之间的相似度,作为该预定用 户与所述当前用户之间的相似度;以及 相似用户选择模块,其用于选择与所述当前用户之间的相似度最高的至少一个所述预 定用户,作为所述当前用户的至少一个相似用户。
9. 一种内容提供方法,包括: 根据当前用户的浏览历史记录获得所述当前用户的浏览偏好分布,其中,所述浏览偏 好分布用于反映相应的用户分别对各内容类别的关注度; 至少基于所述当前用户的浏览偏好分布来确定至少一个内容类别;以及 将与所述至少一个内容类别对应的记录内容确定为搜索结果提供给所述当前用户。
10. -种电子设备,包括如权利要求1-8中任一项所述的内容提供装置。
【文档编号】G06F17/30GK104102650SQ201310118185
【公开日】2014年10月15日 申请日期:2013年4月7日 优先权日:2013年4月7日
【发明者】周恩策, 张军, 邹纲, 张沈斌, 皮冰锋, 于浩, 松尾昭彦 申请人:富士通株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1