一种基于推荐系统的兴趣探索方法及装置与流程

文档序号:11177246阅读:251来源:国知局
一种基于推荐系统的兴趣探索方法及装置与流程

本发明涉及智能控制领域,具体涉及一种基于推荐系统的兴趣探索方法及装置。



背景技术:

近年来,随着移动互联网和大数据技术的爆发性发展,智能推荐技术在越来越多的互联网产品上得到广泛应用,比如,新闻推荐(典型产品如今日头条),电影&书籍推荐(豆瓣),视频推荐(优酷,爱奇艺等),商品推荐(淘宝,口袋购物)。推荐技术面临的一个主要难点就是如何尽量全面的挖掘用户的兴趣和需求。具体来说,给定一个用户,基于一些数据挖掘手段(比如挖掘用户点击历史,网页浏览历史,社交网络信息),我们可以获取部分用户兴趣,从而解决推荐的冷启动(所谓冷启动是指:如何在没有大量用户数据的情况下设计个性化推荐系统并让用户对推荐结果满意从而愿意使用推荐系统,就是冷启动问题)问题。但是,一味满足已知的用户兴趣容易导致推荐范围变窄和用户满意度下降。

目前主流的推荐系统一般采用下列几种方式:

1、推荐的内容中插入一些兴趣扩展的内容:比如,假定推荐模型知道用户对于exo和鹿晗感兴趣,可以在推荐相关新闻时插入其它韩国明星的新闻。如果用户也点击了这些内容,系统就会把“韩国明星”的标签加入用户的兴趣模型。

2、给推荐的内容打上兴趣扩展标签:沿用上面的例子,系统可以在每一篇推荐出的exo相关文章后面打上“韩国明星”的标签,用户可以点击查看该标签下的内容并确认“喜欢”。得到用户确认后,系统就会把“韩国明星”标签加入用户的兴趣模型。

3、提供一个用于兴趣探索的入口:系统提供一个入口给用户,方便用户对现有内容感到厌倦的时候探索兴趣。沿用上面的例子,当用户想看看还有什么有意思的内容时可以进入“探索”入口浏览推荐的兴趣标签,如果对推荐出的“韩国明星”标签感兴趣,就可以点击确认,这时系统就会把“韩国明星”标签加入用户的兴趣模型。

对于上述几种常用的推荐方法具有如下缺点:

对于方法1)来说,因为是在推荐内容中直接插入兴趣探索的内容,如果兴趣探索内容选择的不好,会导致探索效率比较低,导致影响用户体验。

对于方法2)来说,虽然对用户体验伤害小,但是探索的范围有限。比如对于exo的文章,系统可以打上“韩国明星”的标签,但是如果用户已经对该标签表达过“喜欢”,更大范围的兴趣探索将会受到局限。比如如果系统想确认用户是否喜欢“日本明星”,就无法得到支持。

对于方法3)来说,相对于方法1)和方法2)比较最灵活,其既可以直接推荐“兴趣标签”,提高兴趣探索的效率;又能够不囿于文章的限制,推荐出用户看过的文章中未曾出现过的兴趣标签。但是方法3)需要用户主动使用探索功能,而对于推荐系统而言大部分用户处于被动的情况下获取推荐内容的,因此,方法3)中的探索功能使用率较低。

如何提供一种能够不依赖于用户主动使用探索功能,且避免直接以推荐内容为粒度的大范围探索而引起用户反感的用户兴趣探索方法成为本领域技术人员需要解决的技术问题。



技术实现要素:

本发明提供一种基于推荐系统的兴趣探索方法及装置,以解决现有技术中依赖于用户主动使用探索功能以及用户体验差的问题。

本发明提供一种基于推荐系统的兴趣探索方法,包括:

基于推荐页面展示预先构建的兴趣词;

根据对所述兴趣词的操作行为获取所述兴趣词对应的相关数据信息;

根据对所述相关数据信息的操作行为更新推荐模型,并通过更新后的所述推荐模型提供推荐数据。

优选的,所述预先构建的兴趣词包括:

在所述推荐系统的搜索日志中查找各分类下的搜索频率最高的检索词,形成检索词集合;

针对每一用户对所述检索词集合内的所述检索词进行筛选;

将筛选后的所述检索词作为兴趣词存储在所述用户的兴趣词数据中。

优选的,所述检索词集合包括:所述检索词和所述检索词对应的分类标签。

优选的,所述对所述检索词集合内的所述检索词进行筛选包括:

将所述检索词集合中的所述检索词所对应的分类标签分别与每一用户的兴趣标签进行匹配,若匹配,则选取所述分类标签对应的所述检索词,并进入所述将筛选后的所述检索词作为兴趣词存储在所述用户的兴趣词数据中的步骤,若不匹配,则删除所述检索词。

优选的,所述将筛选后的所述检索词作为兴趣词存储在所述用户的兴趣词数据中包括:

对所述筛选后的所述检索词进行排序。

优选的,所述对所述筛选后的所述检索词进行排序,包括:

计算所述检索词对应各个用户的检索分值;

按照所述检索分值对所述各个用户的所述检索词进行降序排列。

优选的,所述计算所述检索词对应各个用户的检索分值采用如下公式获得:

score(u,v)=w1×hot(v)+w2×relevance(u,v)+w3×fresh(u,v)

其中,所述u表示用户;所述v表示检索词;w1,w2和w3代表函数权重;hot(v)表示计算v热度的函数;relevance(u,v)表示u和v的相关度;fresh(u,v)表示v对于u的新鲜度。

优选的,所述对所述筛选后的所述检索词进行排序包括:

记录各个用户对所述检索词的操作行为的次数;

将所述次数与预先建立的排序模型中的数据进行匹配,获得所述检索词操作行为的概率值;

根据所述概率值对所述检索词进行降序排列。

优选的,所述对所述筛选后的所述检索词进行排序,将排序后的所述检索词作为所述兴趣词存储在用户兴趣词数据库中,包括:

对所述排序后的所述检索词进行过滤。

优选的,所述基于推荐页面展示预先构建的兴趣词包括:

将所述兴趣词组成兴趣词集合的形式,显示在所述推荐页面的推荐栏中。

优选的,所述基于推荐页面展示预先构建的兴趣词包括:

根据预先设定的轮播规则,将所述兴趣词在所述推荐页面的搜索框中进行单独轮播。

优选的,所述根据对所述相关数据信息的操作行为更新推荐模型,并通过更新后的所述推荐模型提供推荐数据包括:

根据对所述相关数据信息的操作行为生成相应的样本数据,并将所述样本数据加入至推荐模型的训练数据中;

所述推荐模型根据所述操作行为产生的所述相关数据信息,在所述推荐模型中添加所述操作行为的特征权重。

本发明还提供一种基于推荐系统的兴趣探索装置,包括:

展示单元,用于基于推荐页面展示预先构建的兴趣词;

获取单元,用于根据对所述兴趣词的操作行为获取所述兴趣词对应的相关数据信息;

更新单元,用于根据对所述相关数据信息的操作行为更新推荐模型,并通过更新后的所述推荐模型提供推荐数据。

优选的,所述展示单元包括:构建单元,所述构建单元包括:

查找单元,用于在所述推荐系统的搜索日志中查找各分类下的搜索频率最高的检索词,形成检索词集合;

筛选单元,用于针对每一用户对所述检索词集合内的所述检索词进行筛选;

存储单元,用于将筛选后的所述检索词作为兴趣词存储在所述用户的兴趣词数据中。

优选的,所述检索词集合包括:所述检索词和所述检索词对应的分类标签。

优选的,所述筛选单元包括:

匹配单元,用于将所述检索词集合中的所述检索词所对应的分类标签分别与每一用户的兴趣标签进行匹配,若匹配,则选取所述分类标签对应的所述检索词,并进入所述将筛选后的所述检索词作为兴趣词存储在所述用户的兴趣词数据中的步骤,若不匹配,则删除所述检索词。

优选的,所述筛选单元包括:

排序单元,用于对所述筛选后的所述检索词进行排序。

优选的,所述排序单元包括:

计算单元,用于计算所述检索词对应各个用户的检索分值;

排列单元,用于按照所述检索分值对所述各个用户的所述检索词进行降序排列。

优选的,所述排序单元包括:

记录单元,用于记录各个用户对所述检索词的操作行为的次数;

匹配单元,用于将所述次数与预先建立的排序模型中的数据进行匹配,获得所述检索词操作行为的概率值;

排列单元,用于根据所述概率值对所述检索词进行降序排列。

优选的,所述排序单元包括:过滤单元,用于对排序后的所述检索词进行过滤。

优选的,所述更新单元包括:

样本数据生成单元,用于根据对所述相关数据信息的操作行为生成相应的样本数据,并将所述样本数据加入至推荐模型的训练数据中;

特征权重添加单元,用于所述推荐模型根据所述操作行为产生的所述相关数据信息,在所述推荐模型中添加所述操作行为的特征权重。

本发明提供的一种基于推荐系统的兴趣探索方法,通过在推荐系统的推荐页面上直接展示预先构建的兴趣词,进而使得用于不依赖于主动使用探索功能获取推荐内容。另外,本发明是基于对推荐页面上兴趣词的操作行为来获取搜索结果,并根据对搜索结果的操作点击行为更新推荐模型,进而使得后续推荐效率更。

附图说明

为了更清楚地说明本实用新型实施例和现有技术中的技术方案,下面将对实施例和现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本实用新型的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明提供的一种基于推荐系统的兴趣探索方法的流程图;

图2是本发明提供的一种基于推荐系统的兴趣探索方法中兴趣词展示方式一的示意图;

图3是本发明提供的一种基于推荐系统的兴趣探索方法中兴趣词展示方式二的示意图;

图4是本发明提供的一种基于推荐系统的兴趣探索装置的结构示意图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施的限制。

请参考图1所示,图1是本发明提供的一种基于推荐系统的兴趣探索方法的流程图,该方法包括:

步骤s101:基于推荐页面展示预先构建的兴趣词。

所述在推荐系统的推荐页面上展示预先构建的兴趣词在本实施中可以有一下两种方式:

一种是,以兴趣词集合的形式显示在所述推荐页面的推荐栏中(如图2所示),当用户在刷新获取推荐内容时随机刷出兴趣词卡片,展示后的一段时间内该些兴趣词不会再被推荐,也就是在展示后的一段时间内该些兴趣不在展示在推荐页面的推荐栏中。

第二种是,根据预先设定的轮播规则,将所述兴趣词以单个兴趣词的形式在所述推荐页面的搜索框中单独轮播(如图3所示)。

所述预先设定的轮播规则,可以是设定所述兴趣词的轮播时间和/或所述兴趣词轮播的顺序,所述轮播的顺序可以是根据预先构建的兴趣词的排序顺序依次进行轮播。轮播时间可以是用户每次刷新获取新推荐内容时变化一次,一天后全部更新,一段时间内不会再推荐等等。

当然所述展示方式还可以是:在所述推荐页面上将预先构建的兴趣词以兴趣词集合(也可以称作为:兴趣词卡片)的形式显示在所述推荐页面的推荐栏中的同时,在所述推荐页面的搜索框内根据预先设定的轮播规则,将所述兴趣词在所述搜索框内进行轮播。

在本实施中,对于预先构建的兴趣词具体过程可以采用如下形式:

在所述推荐系统的搜索日志中查找各分类下的搜索频率最高的检索词,形成检索词集合;也就是说,在所述推荐系统中,查找所有用户搜索日志中各个分类下的搜索频率最高的检索词。

例如:如果查找搜索日志显示用户在【国际】和【财经】两个分类下,搜索频率最高的检索词是【印度换钞】,所述检索词【印度换钞】的分类就是【国际】【财经】,当然还可以有多个分类,例如:查找搜索日志中显示用户在【娱乐】和【体育】两个分类下,搜索频率最高的检索词是【体育明星拍戏】,所述检索词集合就可以包括:检索词【印度换钞】对应的【国际】和【财经】分类标签;检索词【体育明星拍戏】对应的【娱乐】和【体育】分类标签,上述仅为说明而举例,并非用于限定本发明。

根据搜索频率来查找所述检索词,是因为通常情况下搜索频率高的所述检索词对应的都是比较热门的信息,进而对应所述检索词的相关内容也会比较多,以保证用户兴趣探索的效率。

在本实施中,所述检索词集合包括:所述检索词以及所述检索词对应的分类标签。

针对每一用户对所述检索词集合内的所述检索词进行筛选;也就是说,对每个用户筛选出其对应的检索词,所述每个用户的检索词可以有多个。具体筛选的过程可以是,将所述检索词集合中的所述检索词对应的分类标签分别与每一用户的兴趣标签进行匹配,若匹配,则保留所述检索词并所述将筛选后的所述检索词作为兴趣词存储在所述用户的兴趣词数据中的步骤,若不匹配,则删除所述检索词。

例如:对于某一用户u1,其具有【国际】和【财经】的兴趣标签,将所述检索词集合中的分类标签与其兴趣标签进行比较,当兴趣标签与分类标签相同时,则将所述分类标签中对应的所述检索词【印度换钞】选取作为筛选后的检索词进行存储,然而分类标签为【娱乐】和【体育】与所述用户u1的兴趣标签【国际】和【财经】不同,因此所述分类标签【娱乐】和【体育】对应的所述检索词【体育明星拍戏】则不会被选取。

基于上述内容,将筛选后的所述检索词作为兴趣词存储在所述用户的兴趣词数据库中。

为了进一步提高每一用户对所述检索词的兴趣程度,还可以对所述筛选后的所述检索词进行排序。具体排序的过程可以采用如下方式进行:

计算所述检索词对应各个用户的检索分值;

按照所述检索分值对所述各个用户的所述检索词进行降序排列。

所述检索分值可以通过下列公式获得:

score(u,v)=w1×hot(v)+w2×relevance(u,v)+w3×fresh(u,v)

其中,所述u表示用户;所述v表示检索词;w1,w2和w3代表函数权重;hot(v)表示计算v热度的函数;relevance(u,v)表示u和v的相关度;fresh(u,v)表示v对于u的新鲜度。

所述检索词v的热度可以是在一段时间内所述用户u的搜索次数来表示;

所述用户u和所述检索词v的相关度可以是用所述检索词v的分类在所述用户u的兴趣标签中的相对权重表示;

所述检索词v对于所述用户u的新鲜度可以是用最近一段时间内所述用户u看过的文章标题中不包含所述检索词v的内容数量表示,所述fresh(u,v)值越高,说明所述用户u对于所述检索词v感觉新鲜程度较强。

对于所述筛选后的所述检索词进行排序的方式还可以通过用机器学习的方法实现,具体可以是:

记录各个用户对所述检索词的操作行为的次数;所述操作行为可以是点击行为。

将所述次数与预先建立的排序模型中的数据进行匹配,获得所述检索词操作行为的概率值;

根据所述概率值对所述检索词进行降序排列。

为防止某些兴趣词重复展示给用户,在对筛选后的检索词完成排序后,在对于同一个用户而言,一段时间内其最感兴趣的兴趣词可能是固定的情况,按照可能感兴趣的概率推荐,会导致重复推荐,因此,在本实施中还可以根据需要把一段时间内给用户展示过的兴趣词过滤掉,引起用户反感;过滤的时间可以设置为一天。

步骤s102:根据对所述兴趣词的操作行为获取所述兴趣词对应的相关数据信息。

所述步骤s102的具体实现过程是,用户对展示在推荐页面上的兴趣词进行的操作行为可以是点击兴趣词的操作行为,在用户对所述兴趣词进行点击后进入推荐页面的下一级页面,即:显示对所述兴趣词点击操作行为产生的与所述兴趣词相关内容的搜索结果页面,所述搜索结果页面可以通过搜索引擎获得。

在相关内容的搜索结果页面的基础上,用户会对相关内容的搜索结果页面进行点击操作进而进入想要获取的具体内容信息内观看,即:获取所述兴趣词对应的相关数据信息。

例如:用户点击了推荐系统在推荐页面上推荐的兴趣词【印度换钞】,并在相关内容的列表页面上显示了诸如:

《有人买不到菜有人自杀突然换钞啥体验?印度人来告诉你!》;

《印媒:“换钞死”已达48起》;

《印度“闪电换钞”致乱象丛生市场混乱引发社会动荡》;

……

……

《印度“大换钞”换出商机》。

用于基于上述给出的搜索结果页面上的相关内容,用户点击《有人买不到菜有人自杀突然换钞啥体验?印度人来告诉你!》和《印媒:“换钞死”已达48起》,对应该两条新闻展示出相关具体内容信息。

步骤s103:根据对所述相关数据信息的操作行为更新推荐模型,并通过更新后的所述推荐模型提供推荐数据。

所述步骤s103的具体实现过程可以是:

根据对所述相关数据信息的操作行为生成相应的样本数据,并将所述样本数据加入至推荐模型的训练数据中。

所述推荐模型将所述操作行为产生的所述相关数据信息作为样本数据,例如:用户对给定的文章的操作行为,所述操作行为可以是用户对该文章的点击操作,该点击操作所产生的相关数据信息;

本实施中,在所述推荐模型中添加所述操作行为的特征权重。所述特征权重可以是:{用户对【国际】新闻感兴趣的程度},{用户对【印度】感兴趣的程度},{用户对【换钞】该兴趣的程度},在随后的推荐中将符合上述特征权重的其它文章也更有可能被模型推荐出来,所述文章可能被模型推荐出来可以采用现有技术中众多的推荐模型的方法,因此,此处不再赘述。

本发明提供的一种基于推荐系统的兴趣探索方法,通过在推荐系统的推荐页面上直接展示预先构建的兴趣词,进而使得推荐系统不依赖用户主动使用探索功能获取用户更多的兴趣表达。另外,本发明是基于对推荐页面上兴趣词的操作行为来获取搜索结果,并根据对搜索结果的操作点击行为更新推荐模型,进而使得后续推荐效率更高,因为用户对某个关键词感兴趣但是未必对这个关键词的每一条内容都感兴趣。

以上公开了本发明一种基于推荐系统的兴趣探索方法的具体实现过程,与所述方法实施例相对应,本发明还提供一种基于推进系统的兴趣探索装置实施例。

请参看图4,其为本发明一种基于推荐系统的兴趣探索装置的结构示意图。该装置的具体实现过程基本与所述方法的具体实现过程相似,所以对所述装置的描述比较简单,具体相关之处可以参考方法部分的具体描述说明即可。下述描述的装置实施例仅仅是示意性的。

如图4所示,本发明提供一种基于推荐系统的兴趣探索装置,包括:

展示单元401,用于基于推荐页面展示预先构建的兴趣词;

所述展示单元401包括:构建单元,所述构建单元包括:

查找单元,用于查找搜索日志中各种分类下的搜索频率最高的检索词,形成检索词集合;

筛选单元,用于针对每一用户对所述检索词集合内的所述检索词进行筛选;

所述筛选单元包括:

匹配单元,用于将所述检索词集合中的所述检索词所对应的分类标签分别与每一用户的兴趣标签进行匹配,若匹配,则选取所述分类标签对应的所述检索词,并进入所述将筛选后的所述检索词作为兴趣词存储在所述用户的兴趣词数据中的步骤,若不匹配,则删除所述检索词。

所述筛选单元还包括:

排序单元,用于对所述筛选后的所述检索词进行排序。

所述排序单元包括:

计算单元,用于计算所述检索词对应各个用户的检索分值;

排列单元,用于按照所述检索分值对所述各个用户的所述检索词进行降序排列。

存储单元,用于将筛选后的所述检索词作为兴趣词存储在所述用户的兴趣词数据中。

或者所述排序单元包括:

记录单元,用于记录各个用户对所述检索词的操作行为的次数;

匹配单元,用于将所述次数与预先建立的排序模型中的数据进行匹配,获得所述检索词操作行为的概率值;

排列单元,用于根据所述概率值对所述检索词进行降序排列。

所述排序单元还可以包括:

过滤单元,用于对排序后的所述检索词进行过滤。

所述检索词集合包括:所述检索词和所述检索词对应的分类标签。

获取单元402,用于根据对所述兴趣词的操作行为获取所述兴趣词对应的相关数据信息。

更新单元403,用于根据对所述相关数据信息的操作行为更新推荐模型,并通过更新后的所述推荐模型提供推荐数据。

所述更新单元包括:样本数据生成单元和特征权重添加单元。

所述样本数据生成单元,用于根据对所述相关数据信息的操作行为生成相应的样本数据,并将所述样本数据加入至推荐模型的训练数据中;

所述特征权重添加单元,用于所述推荐模型根据所述操作行为产生的所述相关数据信息,在所述推荐模型中添加所述操作行为的特征权重。

本发明虽然以较佳实施例公开如上,但其并不是用来限定本发明,任何本领域技术人员在不脱离本发明的精神和范围内,都可以做出可能的变动和修改,因此本发明的保护范围应当以本发明权利要求所界定的范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1