针对用户进行个性化推荐的方法、用户建模设备及系统的制作方法

文档序号:7796439阅读:140来源:国知局
针对用户进行个性化推荐的方法、用户建模设备及系统的制作方法
【专利摘要】本发明公开了一种针对用户进行个性化推荐的方法、用户建模设备及相应系统,其中,所述方法包括:从信息模型数据库中提取用户所关注的名人的信息模型,其中,所述名人为社交网络中满足预定条件的人,所述信息模型数据库中存储有基于第一建模策略为所述名人建立的信息模型;根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型;获取根据所述用户模型提取的适合所述用户的信息,并向所述用户推荐该信息。根据用户所关注的名人的信息模型建立的用户模型能准确表征用户的兴趣,根据用户模型为用户推荐的信息能够准确匹配用户兴趣,因此,信息推荐的准确率高,并且解决了因用户缺少或没有历史行为而引起的冷启动问题。
【专利说明】针对用户进行个性化推荐的方法、用户建模设备及系统
【技术领域】
[0001]本发明涉及通信领域,更为具体而言,涉及一种针对用户进行个性化推荐的方法、用户建模设备及系统,所述系统包括针对用户进行个性化推荐的服务器系统和包括该服务器系统的网络系统。
【背景技术】
[0002]随着互联网技术的强势发展以及网络信息的大范围覆盖,用户在浏览信息时通常需要从海量信息中选择自己感兴趣的内容,这不仅浪费了用户时间,并且存在严重的信息浪费。例如,在电子商务系统中,商品个数、种类等快速增长,用户需要花费大量时间才能找到自己想要的商品信息,这无疑会影响用户体验。因此,根据用户可能的兴趣点向用户推荐信息(例如:商品、经济、体育方面的信息)的个性化信息推荐方法应运而生。
[0003]根据现有的信息推荐技术,需要读取用户的行为日志,通过对用户的历史行为进行分析确定最终推荐哪些信息。但是,一方面,用户行为属于隐式的用户反馈,基于用户行为确定最终推荐哪些信息并不能准确地匹配用户兴趣(例如,根据用户对新闻的点击行为很难确定用户是因为该新闻热门还是因为感兴趣而进行点击);另一方面,对于没有历史行为的用户根本无法采用现有技术进行准确的信息推荐,即无法解决业界所谓的冷启动问题。

【发明内容】

[0004]为了准确地向用户推荐信息,本发明实施方式提供了一种针对用户进行个性化推荐的方法、用户建模设备及系统。
[0005]一方面,本发明实施方式提供了一种针对用户进行个性化推荐的方法,包括:
[0006]从信息模型数据库中提取用户所关注的名人的信息模型,其中,所述名人为社交网络中满足预定条件的人,所述信息模型数据库中存储有基于第一建模策略为所述名人建立的信息模型;
[0007]根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型;
[0008]获取根据所述用户模型提取的适合所述用户的信息,并向所述用户推荐该信息。
[0009]在本发明的一种实施方式中,基于第一建模策略为所述名人建立的信息模型包括表示所述名人的个体属性和/或群体属性的组件。
[0010]由此,所述信息模型可以准确地表征所述名人,为后续建立可准确表征用户的用户模型提供了基础。
[0011]在本发明的另一种实施方式中,所述方法还包括:根据所述第一建模策略为所述名人建立信息模型,并将所述名人的信息模型存储至所述信息模型数据库。
[0012]由此,进行信息推荐的服务商(例如,信息推荐服务商)可以建立所述信息模型数据库。[0013]在本发明的另一种实施方式中,根据所述第一建模策略为所述名人建立信息模型包括:
[0014]从第三方信息平台获取所述名人的信息;
[0015]根据所述名人的信息建立所述名人的信息模型。
[0016]由此,能方便地获取建立所述名人的信息模型所需要的信息。
[0017]在本发明的另一种实施方式中,所述第三方信息平台包括网络百科全书,并且,从第三方信息平台获取所述名人的信息包括:
[0018]通过所述网络百科全书搜索所述名人,并从搜索结果中抓取关于所述名人的百科词条。
[0019]由此,能方便且准确地获取建立所述名人的信息模型所需要的信息。
[0020]在本发明的另一种实施方式中,所述根据所述名人的信息建立所述名人的信息模型包括:
[0021]解析所述百科词条的文本,对所述百科词条进行分词;
[0022]进行词频-逆向文件频率计算获得所述百科词条中的关键词和关键词权重,其中,所述关键词和关键词权重表示所述名人的个体属性;
[0023]通过利用支持向量机建立的分类模型确定所述名人的分类,其中,所述名人的分类表示所述名人的群体属性;
[0024]将所述关键词和关键词权重作为第一组件,并且将所述名人的分类作为第二组件,建立所述名人的信息模型。
[0025]由此,根据所述关键词和权重以及所述名人的分类建立的信息模型,能够更加准确地表征所述名人,使得后续根据所述名人的信息模型建立的用户模型能更加准确地表征所述用户。
[0026]在本发明的另一种实施方式中,根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型包括:
[0027]根据所述用户所关注的名人的信息模型,对所述名人的个体属性和/或群体属性进行聚类,确定所述用户所关注的个体属性和/或群体属性;
[0028]根据所述用户所关注的个体属性和/或群体属性建立所述用户模型。
[0029]由此,能够建立准确表征所述用户(例如,表征所述用户的兴趣点,包括兴趣词和兴趣分类)的用户模型。
[0030]相应的,本发明实施方式提供了一种针对用户进行个性化推荐的服务器系统,包括:
[0031]信息模型提取模块,用于从信息模型数据库中提取用户所关注的名人的信息模型,所述信息模型数据库存储有基于第一建模策略为社交网络中满足预定条件的名人建立的信息模型;
[0032]用户模型处理模块,用于根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型;
[0033]信息推荐服务器,用于根据所述用户模型提取适合所述用户的信息并向所述用户推荐该信息。
[0034]相应的,本发明实施方式还提供一种针对用户进行个性化推荐的网络系统,该网络系统包括上述的服务器系统。
[0035]另一方面,本发明实施方式还提供了一种针对用户进行个性化推荐的服务器系统,包括:
[0036]信息模型提取模块,用于从信息模型数据库中提取用户所关注的名人的信息模型,所述信息模型数据库存储有基于第一建模策略为社交网络中满足预定条件的名人建立的信息模型;
[0037]通信模块,用于将用户所关注的名人的信息模型发送至用户建模设备,以及用于接收从用户建模设备发送的用户模型,所述用户模型是根据所述用户所关注的名人的信息模型和第二建模策略建立的;
[0038]信息推荐服务器,用于根据所述用户模型提取适合所述用户的信息,并向所述用户推荐该信息。
[0039]相应的,本发明实施方式提供了一种用户建模设备,包括:
[0040]接收模块,用于接收由服务器系统发送的用户所关注的名人的信息模型,所述信息模型是基于第一建模策略建立的,所述名人为社交网络中满足预定条件的人;
[0041]用户模型处理模块,用于根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型,所述用户模型包括表示用户所关注的个体属性和/或群体属性的组件;
[0042]发送模块,用于将所述用户模型发送至所述服务器系统。
[0043]相应的,本发明实施方式还提供一种针对用户进行个性化推荐的网络系统,该网络系统包括上述的服务器系统和用户建模设备。
[0044]实施本发明的各种实施方式具有以下有益效果:
[0045]根据用户所关注的名人的信息模型建立的用户模型能够准确的表征用户的兴趣,根据所述用户模型向用户推荐的信息能够准确匹配用户兴趣,因此,推荐的信息的准确率高(此处的准确率可以理解为与用户兴趣的契合程度,或被用户点击、阅读、收藏、转发、分享、评论等的概率等),并且解决了因用户缺少或没有历史行为而引起的冷启动问题。
【专利附图】

【附图说明】
[0046]图1是根据本发明实施方式的针对用户进行个性化推荐的方法的流程图;
[0047]图2是根据本发明实施方式的针对用户进行个性化推荐的方法的流程图;
[0048]图3示出了图2所示的处理方式Sll的一种实施方式;
[0049]图4是根据本发明实施方式的为名人建立信息模型的方法的流程图;
[0050]图5示出了图1-4中所示的处理方式S13的一种实施方式;
[0051]图6示出了根据本发明实施方式的服务器系统的一例方框图;
[0052]图7示出了根据本发明实施方式的服务器系统的另一例方框图;
[0053]图8示出了图7中所示信息模型处理模块的方框图;
[0054]图9示出了根据本发明实施方式的服务器系统的再一例方框图;
[0055]图10示出了根据本发明实施方式的服务器系统的又一例方框图;
[0056]图11示出了根据本发明实施方式的用户建模设备的一例方框图;
[0057]图12示出了根据本发明实施方式的网络系统的一例方框图。【具体实施方式】
[0058]以下结合附图和【具体实施方式】对本发明的各个方面进行详细阐述。其中,众所周知的模块、单元及其相互之间的连接、链接、通信或操作没有示出或未作详细说明。并且,所描述的特征、架构或功能可在一个或一个以上实施方式中以任何方式组合。本领域技术人员应当理解,下述的各种实施方式只用于举例说明,而非用于限制本发明的保护范围。还可以容易理解,本文所述和附图所示的各实施方式中的模块或单元或处理方式可以按各种不同配置进行组合和设计。
[0059]图1是根据本发明实施方式的针对用户进行个性化推荐的方法的流程图。在本发明实施方式中,所述方法包括:
[0060]S12:从信息模型数据库中提取用户所关注的名人的信息模型,其中,所述名人为社交网络中满足预定条件的人,所述信息模型数据库中存储有基于第一建模策略为所述名人建立的信息模型。
[0061]S13:根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型。
[0062]S14:获取根据所述用户模型提取的适合所述用户的信息并向所述用户推荐该信
肩、O
[0063]其中,“社交网络”包括:用于进行信息交流、分享、评价、讨论、传播等行为的平台,示例性的,诸如微博、推特(twitter)、博客、人人网、开心网、论坛、社区、微信圈之类的信息
T D O
[0064]“满足预定条件的人”/ “名人”包括:在社交网络中具有一定知名度、影响力或权威性的人,换言之,“预定条件”包括:能从社交网络中区别出(或在一定程度上区别出)具有知名度、影响力或权威性的用户的条件。满足预定条件的人可以是,例如,微博中粉丝超过预定数目(例如:300万或500万等)的用户(例如,大V)、论坛或贴吧中等级达到预定级别的用户、在百度百科中有相应百科词条的人、以及网络社区或博客中文章点击数达到预定值的用户等等。
[0065]“信息模型”用于表征名人,包括用于表征所述名人的兴趣、爱好、经历、行业、位置区域等信息的组件。例如,基于所述第一建模策略为所述名人建立的信息模型可包括表示所述名人的个体属性和/或群体属性的组件,其中的个体属性可以包括所述名人的经历、兴趣或爱好等,其中的群体属性可以包括所述名人的行业、领域或国籍等。
[0066]“用户模型”用于表征用户,包括用于表征所述用户的兴趣、爱好等信息的组件。用户所关注的名人的兴趣、经历、行业等信息可以一定程度上反映或作为所述用户的兴趣爱好。
[0067]在S14中,根据用户模型提取的信息可以是信息的整体内容(例如:新闻内容),也可以是反映信息核心内容的诸如主题、标题之类(例如:新闻标题)。本发明对推荐给用户的信息的内容、形式等不做具体限制。
[0068]此外,可以通过用户的社交网络接口获取用户的关注名单,并根据该关注名单确定用户所关注的名人,本发明对此不做赘述。
[0069]此外,在建立所述用户模型之后,可以将所述用户模型存储至数据库中以由下文将提及的信息推荐服务器提取,或者直接将所述用户模型发送至信息推荐服务器,本发明对此不做赘述。
[0070]此外,可以通过名人之间的关注关系确定社交网络中哪些人属于名人。以微博用户为例,大V之间通常是互相关注的,这样,将预定数目且满足预定条件的大V作为种子集合,从这些大V所关注的用户中确定满足预定条件的大V并加入种子集合,如此重复迭代可以确定微博中满足预定条件的大V。
[0071]以上,对本发明提供的方法的整体流程以及部分特征进行了说明,下面结合实施例对本发明的方法的详细流程进行说明。
[0072]【实施例1】
[0073]在实施例1中,针对用户进行个性化推荐的方法包括上述图1所示的方法中的所有处理方式,其中,如图2所示,所述方法还包括:
[0074]Sll:根据第一建模策略为所述名人建立信息模型,并将所述名人的信息模型存储至所述信息模型数据库。
[0075]可选的,如图3所示,根据第一建模策略为所述名人建立信息模型可以通过以下第一方式实现:
[0076]Slll:从第三方信息平台获取所述名人的信息;
[0077]S112:根据所述名人的信息建立所述名人的信息模型。之后,可以将所述名人的信息模型存储至信息模型数据库。
[0078]对于上述第一方式的详细说明,请参照实施`例2。
[0079]可选的,根据第一建模策略为所述名人建立信息模型可以通过以下第二方式实现:
[0080]从第三方信息平台获取第一名人的信息;
[0081]根据所述第一名人的信息为所述第一名人建立信息模型;
[0082]根据第二名人所关注的第一名人的信息模型为所述第二名人建立信息模型(例如,参照实施例3中建立用户模型的方法)。
[0083]在上述第二方式中,“第一名人”和“第二名人”均指代“一类名人”。例如,第一名人可以指从第三方信息平台可获取其信息的名人,第二名人可以指从第三方信息平台不可获取其信息的名人。通过上述第二方式,并不会因为第三方信息平台没有关于所述第二名人的记载而无法为所述第二名人建立信息模型。
[0084]虽然,本实施例中基于第一建模策略建模,在本发明的其他实施例中也可以由人工基于第一建模策略建模,例如,人工从第三方信息平台浏览信息,然后基于浏览的信息建立信息模型,从存储有这样建立的信息模型的信息模型库中提取模型然后进行与本发明整体流程一致的处理,仍落在发明的保护范围内。
[0085]【实施例2】
[0086]在实施例2中,以所述第三方信息平台为网络百科全书为例对根据第一建模策略为所述名人建立信息模型的方法进行说明,如图4所示:
[0087]Slll 包括:
[0088]Sllll:通过所述网络百科全书搜索所述名人;
[0089]S1112:从搜索结果中抓取关于所述名人的百科词条。[0090]SI 12 包括:
[0091]S1121:解析所述百科词条的文本,对所述百科词条进行分词。
[0092]S1122:进行 tf-1df (term frequency -1nverse document frequency,词步页-逆向文件频率)计算获得所述百科词条中的关键词和关键词权重,其中,所述关键词和关键词权重表示所述名人的个体属性。
[0093]S1123:通过利用svm (Support Vector Machine支持向量机)建立的分类模型确定所述名人的分类,其中,所述名人的分类表示所述名人的群体属性。
[0094]S1124:将所述关键词和关键词权重作为第一组件,并且将所述名人的分类作为第二组件,建立所述名人的信息模型。
[0095]在S1124之后,可以将所述名人的信息模型存入信息模型数据库,并执行S12、S13和 S14。
[0096]在实施例2中,“网络百科全书”可以是诸如“百度百科”、“维基百科”之类的百科全书,也可以是相关网页信息。
[0097]在Slll中,虽然描述了直接从第三方信息平台抓取所述百科词条的方式,但Slll也可以通过以下方式实现:从存储所述名人的信息的数据库(例如:专门存储名人信息的数据库)中提取名人的信息,该数据库中的数据来源于第三方信息平台(例如,由网络信息收集器从第三方信息平台收集名人信息,并存储至该数据库);或者,接收由相应模块或装置发送的名人信息,所述相应模块或装置(例如上述网络信息收集器)用于从第三方信息平台收集名人信息并进行上述发 送操作;等。
[0098]在S1122中,在进行tf-1df计算获得所述关键词和关键词权重之后,可以根据关键词权重选取预定数目η (η为正整数)个关键词,例如,选取关键词权重排名前η (例如20)的关键词,然后对这η个词进行归一化处理,一种示例性的归一化公式如下:
【权利要求】
1.一种针对用户进行个性化推荐的方法,其特征在于,所述方法包括: 从信息模型数据库中提取用户所关注的名人的信息模型,其中,所述名人为社交网络中满足预定条件的人,所述信息模型数据库中存储有基于第一建模策略为所述名人建立的信息模型; 根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型; 获取根据所述用户模型提取的适合所述用户的信息,并向所述用户推荐该信息。
2.如权利要求1所述的方法,其特征在于,基于第一建模策略为所述名人建立的信息模型包括表示所述名人的个体属性和/或群体属性的组件。
3.如权利要求1所述的方法,其特征在于,所述方法还包括: 根据所述第一建模策略为所述名人建立信息模型,并将所述名人的信息模型存储至所述信息模型数据库。
4.如权利要求3所述的方法,其特征在于,根据所述第一建模策略为所述名人建立信息模型包括: 从第三方信息平台获取所述名人的信息; 根据所述名人的信息建立所述名人的信息模型。
5.如权利要求4所述的方法,其特征在于, 所述第三方信息平台包括网络百科全书; 所述从第三方信息平台获取所述名人的信息包括:` 通过所述网络百科全书搜索所述名人,并从搜索结果中抓取关于所述名人的百科词条。
6.如权利要求5所述的方法,其特征在于,所述根据所述名人的信息建立所述名人的信息模型包括: 解析所述百科词条的文本,对所述百科词条进行分词; 进行词频-逆向文件频率计算获得所述百科词条中的关键词和关键词权重,其中,所述关键词和关键词权重表示所述名人的个体属性; 通过利用支持向量机建立的分类模型确定所述名人的分类,其中,所述名人的分类表示所述名人的群体属性; 将所述关键词和关键词权重作为第一组件,并且将所述名人的分类作为第二组件,建立所述名人的信息模型。
7.如权利要求2或6所述的方法,其特征在于,根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型包括: 根据所述用户所关注的名人的信息模型,对所述用户所关注的名人的个体属性和/或群体属性进行聚类,确定所述用户所关注的个体属性和/或群体属性; 根据所述用户所关注的个体属性和/或群体属性建立所述用户模型。
8.一种针对用户进行个性化推荐的服务器系统,其特征在于,所述服务器系统包括: 信息模型提取模块,用于从信息模型数据库中提取用户所关注的名人的信息模型,所述信息模型数据库存储有基于第一建模策略为社交网络中满足预定条件的名人建立的信息模型; 用户模型处理模块,用于根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型; 信息推荐服务器,用于根据所述用户模型提取适合所述用户的信息,并向所述用户推荐该信息。
9.如权利要求8所述的服务器系统,其特征在于,基于第一建模策略为所述名人建立的信息模型包括表示所述名人的个体属性和/或群体属性的组件。
10.如权利要求8所述的服务器系统,其特征在于,还包括: 所述信息模型数据库,和/或 信息模型处理模块,用于根据所述第一建模策略为所述名人建立信息模型,并将所述名人的信息模型存储至所述信息模型数据库。
11.如权利要求10所述的服务器系统,其特征在于,所述信息模型处理模块包括: 网络信息收集子模块,用于从第三方信息平台获取所述名人的信息; 信息模型建立子模块,用于根据所述名人的信息建立所述名人的信息模型。
12.如权利要求11所述的服务器系统,其特征在于, 所述第三方信息平台包括网络百科全书; 所述网络信息收集子模块包括: 搜索单元,用于通过所述网络百科全书搜索所述名人, 信息抓取单元,用于从搜`索结果中抓取关于所述名人的百科词条以由信息模型处理模块进行处理。
13.如权利要求12所述的服务器系统,其特征在于,所述信息模型建立子模块包括: 词条预处理单元,用于解析所述百科词条的文本,对所述百科词条进行分词; 个体属性计算单元,用于进行词频-逆向文件频率计算获得所述百科词条中的关键词和关键词权重,其中,所述关键词和关键词权重表示所述名人的个体属性; 群体属性计算单元,用于通过利用支持向量机建立的分类模型确定所述名人的分类,其中,所述名人的分类表示所述名人的群体属性; 信息模型建立单元,用于将所述关键词和关键词权重作为第一组件,并且将所述名人的分类作为第二组件,建立所述名人的信息模型。
14.如权利要求9或13所述的服务器系统,其特征在于,所述用户模型处理模块包括: 属性聚类子模块,用于根据所述用户所关注的名人的信息模型,对所述用户所关注的名人的个体属性和/或群体属性进行聚类,确定所述用户所关注的个体属性和/或群体属性; 用户模型建立子模块,用于根据所述用户所关注的个体属性和/或群体属性建立所述用户模型。
15.一种针对用户进行个性化推荐的服务器系统,其特征在于,包括: 信息模型提取模块,用于从信息模型数据库中提取用户所关注的名人的信息模型,所述信息模型数据库存储有基于第一建模策略为社交网络中满足预定条件的名人建立的信息模型; 通信模块,用于将用户所关注的名人的信息模型发送至用户建模设备,以及用于接收从所述用户建模设备发送的用户模型,所述用户模型是由所述用户建模设备根据所述用户所关注的名人的信息模型和第二建模策略建立的;信息推荐服务器,用于根据所述用户模型提取适合所述用户的信息,并向所述用户推荐该信息。
16.如权利要求15所述的服务器系统,其特征在于,还包括 所述信息模型数据库,和/或 信息模型处理模块,用于根据所述第一建模策略为所述名人建立信息模型,并将所述名人的信息模型存储至所述信息模型数据库。
17.如权利要求16所述的服务器系统,其特征在于,所述信息模型处理模块包括: 网络信息收集子模块,用于从第三方信息平台获取所述名人的信息,所述第三方信息平台包括网络百科全书; 信息模型建立子模块,用于根据所述名人的信息建立所述名人的信息模型,所述名人的信息模型包括表示所述名人的个体属性和/或群体属性的组件。
18.一种用户建模设备,其特征在于,包括: 接收模块,用于接收由服务器系统发送的用户所关注的名人的信息模型,所述信息模型是基于第一建模策略建立的,所述名人为社交网络中满足预定条件的人; 用户模型处理模块,用于根据所述用户所关注的名人的信息模型和第二建模策略为所述用户建立用户模型; 发送模块,用于将所述用户模型发送至所述服务器系统。
19.如权利要求18所述的用户建模设备,其特征在于,所述用户模型处理模块包括: 属性聚类子模块,用于根据所述用`户所关注的名人的信息模型,对所述用户所关注的名人的个体属性和/或群体属性进行聚类,确定所述用户所关注的个体属性和/或群体属性; 用户模型建立子模块,用于根据所述用户所关注的个体属性和/或群体属性建立所述用户模型。
20.一种针对用户进行个性化推荐的网络系统,其特征在于, 包括:如权利要求8-14中任一项所述的服务器系统,或者包括:如权利要求15-17中任一项所述的服务器系统,和,如权利要求18或19所述的用户建模设备。
【文档编号】H04L29/06GK103870538SQ201410040954
【公开日】2014年6月18日 申请日期:2014年1月28日 优先权日:2014年1月28日
【发明者】李本阳, 秦锋剑, 宋奇 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1