信息推荐方法及服务器与流程

文档序号:11627710阅读:132来源:国知局
信息推荐方法及服务器与流程

本发明实施例涉及通信技术,尤其涉及一种信息推荐方法及服务器。



背景技术:

互联网技术的出现和普及,给用户带来了大量的信息,满足用户在信息时代对信息的需求,但随着网络的迅速发展而带来的信息大幅增长,使得用户在面对大量信息时无法从中找到对自己有用的部分信息,对信息的使用效率反而降低,从而产生信息超载(informationoverload)问题。信息推荐技术便是为解决该问题而产生的。

常用的信息推荐技术,实际是针对大用户群体确定推荐算法,并根据该推荐算法为大用户群体确定推荐信息,继而向大用户群体发送该推荐信息。

由于该信息推荐技术中,根据该推荐算法为大用户群体确定相同的推荐信息,因而,该推荐信息无法体现用户个性,信息推荐的准确率较低。



技术实现要素:

本发明实施例提供一种信息推荐方法及服务器,以提高信息推荐的准确率度。

第一方面,提供一种信息推荐方法,包括:

对多个用户进行分组,获得至少两个用户组;其中,每个用户组包括至少一个用户;

确定每个用户组对应的推荐策略;其中,推荐策略可包括每个用户组对应的推荐算法;

根据每个用户组对应的推荐策略生成每个用户组的推荐信息;

向至少一个用户对应的终端发送推荐信息。

可选的,对多个用户进行分组,获得至少两个用户组,可包括:

根据该多个用户中每个用户的数据特征,对该多个用户进行分组,获得 该至少两个用户组。

可选的,每个用户的数据特征包括:至少一种数据特征;

根据多个用户中每个用户的数据特征,对多个用户进行分组,获得至少两个用户组,可包括:

根据每个用户的至少一种数据特征,按照预设的数据特征顺序,对多个用户进行分组,得到至少两个用户组。

本发明实施例提供的信息推荐算法,可根据用户的至少一种数据特征,按照预设的数据特征顺序对该多个用户进行分组,可使得用户的分组更精确,使得对每个用户组内的用户采用的推荐算法相同,提高信息推荐的准确度。

可选的,每个用户的数据特征包括以下至少一种:

每个用户的历史记录数据、每个用户的标签数据、每个用户的属性数据和每个用户的社交数据。

其中,每个用户的历史记录数据包括:每个用户的所有历史记录数据和每个用户在预设时间段内的历史记录数据中的至少一种;每个用户的标签数据包括:每个用户的有效标签数量和每个用户的突出标签数量中的至少一种;每个用户的属性数据包括每个用户的性别、每个用户的年龄段、每个用户的身份中的至少一种;每个用户的社交数据包括每个用户的联系人数量、每个用户的紧密联系人数量、每个用户的主动联系次数中的至少一种;每个用户的紧密联系人为与每个用户的联系次数大于或等于预设次数阈值的联系人。

可选的,确定每个用户组对应的推荐策略,包括:

确定每个用户组的数据特征值所属的特征值范围;

将特征值范围对应的推荐算法作为每个用户组对应的推荐算法。

可选的,在确定每个用户组的数据特征值所属的特征值范围之前,该方法还可包括:

确定每个用户组的数据特征值。

可选的,每个用户组的数据特征包括以下至少一种:每个用户组的历史记录数据、每个用户组的标签数据、每个用户组的属性数据和每个用户组的社交数据;每个用户组的数据特征值包括:每个用户组的每种数据特征对应的特征值。

可选的,将特征值范围对应的推荐算法作为每个用户组对应的推荐算法 包括:

根据每个用户组的数据特征值所属的特征值范围,确定预设的推荐算法库中特征值范围对应的推荐算法,将确定的推荐算法作为每个用户组对应的推荐算法。

可选的,若每个用户组对应的推荐算法包括多个推荐算法;推荐策略包括:每个用户组对应的n种融合推荐算法;其中,每种融合推荐算法包括多个推荐算法和多个推荐算法对应的一个融合方式;

确定每个用户组对应的推荐策略,可包括:

根据每个用户组对应的推荐算法,和,预设的融合方式库中每个融合方式对推荐算法的使用条件,从推荐算法库中确定符合每个用户组对应的推荐算法的使用条件的n个融合方式为多个推荐算法对应的n个融合方式;

根据n个融合方式,分别对多个推荐算法进行融合,获得n种融合推荐算法。

可选的,根据每个用户组对应的推荐策略生成每个用户组的推荐信息,包括:

确定每个用户组对应的每种融合推荐算法的推荐准确度;

从n个融合推荐算法中确定最高推荐准确度的融合推荐算法,作为每个用户组的最优融合推荐算法;

根据每个用户组的最优融合推荐算法,生成每个用户组的推荐信息。

本发明实施例提供的信息推荐算法,通过确定每个用户组的最优融合推荐算法,继而根据该最优融合推荐算法生成该每个用户组的推荐信息,可使得每个用户组的信息推荐准确度最大化,保证信息推荐准确度。

第二方面,提供一种服务器,包括用于执行第一方面中的方法的模块。

第三方面,提供一种服务器,包括处理器,存储器,通信接口和总线,处理器与存储器、通信接口通过总线连接;存储器用于存储指令;处理器用于执行该指令;当处理器执行存储器存储的指令时,使得处理器执行第一方面所述的方法。

第四方面,提供了一种计算机可读存储介质,其中存储有可执行的程序代码,该程序代码用以实现第一方面所述的方法。

本发明实施例提供的信息推荐方法及服务器,可通过对多个用户进行分 组,获得至少两个用户组,确定该每个用户组对应的推荐策略,根据该每个用户组对应的推荐策略生成该每个用户组的推荐信息,并向该每个用户组中的至少一个用户对应的终端发送该推荐信息。由于该信息推荐方法可针对划分后的每个用户组确定推荐策略,继而确定该每个用户组的推荐信息,能够体现不同用户组间的用户个性,保证信息推荐的准确度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的信息推荐方法适用的信息推荐系统的架构图;

图2为本发明实施例提供的服务器对应的计算机结构示意图;

图3为本发明实施例提供的一种信息推荐方法的流程图;

图4为本发明实施例提供的另一种信息推荐方法的流程图;

图5为本发明实施例提供的一个用户组、融合推荐策略、数据组与推荐信息的推荐准确度的对应关系图;

图6为本发明实施例提供的服务器的结构示意图;

图7为本发明实施例提供的计算机可读存储介质的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明各实施例提供的信息推荐方法可适用于互联网技术领域,如电子商务或社交软件等领域中的信息推荐系统。图1为本发明实施例提供的信息 推荐方法适用的信息推荐系统的架构图。如图1所示,信息推荐系统中可包括服务器101和至少一个终端102。服务器101可以通过有线网络或无线网络与该至少一个终端102连接。该服务器101可以可执行本发明实施例提供的信息推荐方法为各终端102推荐对应的信息。服务器101可以为一个独立的服务器,也可以为若干服务器组成的服务器集群,或者是一个数据中心的服务器。该服务器101例如可以为信息推荐系统中业务服务器。终端102可以将服务器推荐的信息呈现给用户,终端101还可根据用户指令对该推荐信息进行对应操作,如响应或是不响应。该终端101例如可以为智能手机、平板计算机、电子阅读器、笔记本计算机或台式计算机等。

图2为本发明实施例提供的服务器对应的计算机结构示意图。如图2所示,服务器200可包括:处理器201、存储器202、网络接口203和通信总线204。处理器201、存储器202和网络接口203通过通信总线204进行连接通信。

其中,处理器201,可以为中央处理器(centralprocessingunit,简称cpu)。处理器201还可以为其他通用处理器、数字信号处理器(digitalsignalprocessing,简称dsp)、专用集成电路(applicationspecificintegratedcircuit,简称asic)、现场可编程门阵列(field-programmablegatearray,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器202,可以包括易失性存储器(volatilememory),例如随机存取存储器(random-accessmemory,简称ram);存储器202也可以包括非易失性存储器(non-volatilememory),例如只读存储器(read-onlymemory,简称rom),快闪存储器(flashmemory),硬盘(harddiskdrive,简称hdd)或固态硬盘(solid-statedrive,简称ssd);存储器202还可以包括上述种类的存储器的组合。

网络接口203,可以为接口电路,用于收发信息,网络接口203接收外部设备发送的信息后,给处理器201处理;另外,网络接口203可以通过有线通信或无线通信与网络和其他设备通信。

该图2的服务器200可以为上述图1中信息推荐系统中的服务器101。服务器200可通过处理器201确定推荐信息,通过网络接口203将推荐信息 发送至用户对应的终端。

具体可以是,处理器201可以通过调用存储器202中存储的程序或指令,执行本发明各实施例提供的信息推荐方法,从而获得各用户组的推荐信息,并将该各用户组的推荐信息通过通信总线204传输至网络接口203。网络接口203可将该各用户组的推荐信息发送至该各用户组的用户对应的终端。

图3为本发明实施例提供的一种信息推荐方法的流程图。该方法由如上所述的服务器200执行。如图3所示,该方法可包括:

s301、对多个用户进行分组,获得至少两个用户组;其中,每个用户组包括至少一个用户。

具体地,该多个用户可以为大用户群体中的多个用户。该大用户群体可以为未进行类型划分的用户群,该大用户群例如可以为用户个数大于1000的用户群。服务器可以是采用聚类算法(clusteringalgorithm),按照分组数目,根据该多个用户的数据对该多个用户进行分组。其中,同一用户组中用户数据的相似度在一个预设范围内。也就是说,同一用户组中用户的数据相似度较高,不同用户组的用户的数据相似度较低。该聚类算法例如可以为k-means聚类算法。该分组数目,即分组后的用户组个数,可以为预设的分组数目,也可以为服务器根据预设分组数目区间采用贝叶斯信息准则所确定的最优分组数目。

s302、确定该每个用户组对应的推荐策略,该推荐策略包括:该每个用户组对应的推荐算法。

s303、根据该每个用户组对应的推荐策略生成该每个用户组的推荐信息。

具体地,服务器可以是根据该每个用户组中用户的数据确定该每个用户组对应的推荐策略。同一用户组对应相同的推荐策略,不同用户组对应不同的推荐策略。该推荐策略用以生成推荐信息。

其中,该每个用户组对应的推荐算法可以从预设的推荐算法库中选择的。该预设的推荐算法库可包括基于内容(content-based)的推荐算法、基于用户(user-based)的协同过滤推荐算法、基于条目(item-based)的协同过滤推荐算法、基于标签的推荐算法、基于矩阵分解的协同过滤推荐算法、基于用户属性的推荐算法和基于社交的推荐算法等算法中至少一个推荐算法。

举例来说,该基于内容的推荐算法,例如可以是根据用户在当前时间之前感兴趣的业务内容确定推荐信息。若该每个用户组对应的推荐策略包括:基于内容的推荐算法,则该每个用户组的推荐信息可包括:与该每个用户组中各用户在当前时间之前感兴趣的业务内容相似度较高的业务内容。该业务 内容例如可以包括:用户通过文字、图片或视频形式表示的该用户所喜欢的业务条目(item)。

该基于用户的协同过滤推荐算法,例如可以是根据多个用户在当前时间之前感兴趣的业务内容,确定该用户与其他用户的相似度,并将与该用户的相似度较高的其他用户感兴趣的业务内容确定为该用户的推荐信息。举例来说,若用户a感兴趣的业务内容包括物品a和物品c,用户b感兴趣的业务内容包括物品b,用户c感兴趣的业务内容包括物品a、物品c和物品d,则用户c与用户a的相似度较高,该用户a的推荐信息可包括该用户c感兴趣的业务内容,如物品d。若该每个用户组的推荐策略包括:基于用户的协同过滤推荐算法,则该每个用户组的推荐信息可包括与该每个用户组中各用户的相似度较高的其他用户感兴趣的业务内容。该业务内容例如可以包括:用户通过文字、图片或视频形式表示的该用户所喜欢的业务条目,该用户与其他用户的相似度可以为该用户与该其他用户的喜好相似度。

该基于条目的协同过滤推荐,例如可以是根据多个用户在当前时间之前感兴趣的业务内容,确定与用户感兴趣的业务内容的相似度较高的业务内容,并将该相似度较高的业务内容确定为该用户的推荐信息。举例来说,若用户a感兴趣的业务内容包括物品a,用户b感兴趣的业务内容包括物品a、物品b和物品c,用户c感兴趣的业务内容包括物品a和物品c,则与物品a的相似度较高的业务内容为物品c,该用户a的推荐信息可包括该物品c。若该每个用户组的推荐策略包括:基于条目的协同过滤推荐算法,则该每个用户组的推荐信息可包括:与该每个用户组中各用户感兴趣的业务内容相似度较高的其他业务内容。

该基于标签的推荐算法,例如可以是根据用户在当前时间之前感兴趣的业务内容,确定该用户感兴趣的业务内容标签,并将具有该业务内容标签的业务内容确定为该用户的推荐信息。该业务内容标签例如可以为文字表述性标签,如“浪漫”、“80年代”等等。若该每个用户组的推荐策略包括:基于标签的推荐算法,则该每个用户组的推荐信息可包括:具有该每个用户组中各用户的业务内容标签的业务内容。

该基于矩阵分解的推荐算法,例如可以是在上述基于用户或基于条目的协同过滤的推荐算法中加入矩阵分解技术,对该多个用户在当前时间之前感 兴趣的业务内容组成的矩阵进行分解,获得用户信息和业务内容信息,继而根据用户信息和/或业务内容信息确定用户的的推荐信息,可解决数据稀疏性问题。

该基于用户属性的推荐算法,例如可以是将用户属性对应的所有用户感兴趣的业务内容确定为该用户的推荐信息。若该每个用户组的推荐策略包括:基于用户属性的推荐算法,则该每个用户组的推荐信息可包括:具有该每个用户组中各用户的属性对应的所有用户感兴趣的业务内容。

该基于社交的推荐算法,例如可以是根据该用户的社交情况,将该社交情况对应的所有用户感兴趣的业务内容确定为该用户的推荐信息。若该每个用户组的推荐策略包括:基于社交的推荐算法,则该每个用户组的推荐信息可包括:具有该每个用户组中各用户的社交情况对应的所有用户感兴趣的业务内容。

s304、向该至少一个用户对应的终端发送该推荐信息。

具体地,服务器可以是通过网络接口将该推荐信息发送至该至少一个用户对应的终端。

本发明实施例提供的信息推荐方法,可通过对多个用户进行分组,获得至少两个用户组,确定该每个用户组对应的推荐策略,根据该每个用户组对应的推荐策略生成该每个用户组的推荐信息,并向该每个用户组中的至少一个用户对应的终端发送该推荐信息。由于该信息推荐方法可针对划分后的每个用户组确定推荐策略,继而确定该每个用户组的推荐信息,能够体现不同用户组间的用户个性,保证信息推荐的准确度。

可选的,如上实施例所述的s301中对多个用户进行分组获得至少两个用户组,可以包括:

根据该多个用户中每个用户的数据特征,对该多个用户进行分组,获得该至少两个用户组。

可选的,该每个用户的数据特征可包括:至少一种数据特征。

如上所述的步骤中根据该多个用户中每个用户的数据特征,对该多个用户进行分组,获得该至少两个用户组可以包括:

根据该每个用户的该至少一种数据特征,按照预设的数据特征顺序,对该多个用户进行分组,得到该至少两个用户组。

具体地,服务器可以是根据该每个用户的该至少一种数据特征,按照该预设的数据特征顺序,对该多个用户进行逐级分组,继而获得该至少两个用户组。其中,根据该至少一种数据特征对该多个用户进行分组可以是采用聚类算法进行;根据不同数据特征进行分组所采用的聚类群分算法可以相同,也可不同。

举例来说,若该每个用户的数据特征包括3种数据特征;预设的数据特征顺序可以为数据特征1、数据特征2和数据特征3。那么,服务器可以是根据该预设的数据特征顺序,首先根据数据特征1对该多个用户进行一级分组,继而根据该数据特征2对该一级分组后的用户组进行二级分组,并根据该数据特征3对该二级分组后的用户组进行三级分组,继而获得该至少两个用户组。

以下以服务器根据一种数据特征采样聚类算法进行一级分组为例进行说明。若该一种数据特征包括:多种统计数据,则该服务器可根据这6种统计数据,使用聚类算法如k-means算法进行分组,从而将该多个用户划分为多个用户组。具体地,该服务器根据这6种统计数据使用k-means算法进行分组,具体过程可如下所示:

(1)随机选取k个用户的数据特征作为质心,k为预设的分组数目;

(2)测量剩余的每个用户到每个质心的距离,并把该每个用户归到最近的质心对应的用户组;

(3)重新计算已经得到的各个用户组的质心;

(4)迭代2~3步直至新的质心与原质心相等或小于预设阈值。

可选的,该每个用户的数据特征可包括以下至少一种:该每个用户的历史记录数据、该每个用户的标签数据、该每个用户的属性数据和该每个用户的社交数据。

具体地,如上所述的步骤中根据该每个用户的该至少一种数据特征,按照预设的数据特征顺序,对该多个用户进行分组,得到该至少两个用户组可以包括:根据用户的所有历史记录数据,对多个用户进行一级聚类,对该一级聚类后的用户组根据用户的近期历史记录数据进行二级聚类,对该二级聚类后的用户组根据用户的标签数据进行三级聚类,对该三级聚类后的用户组根据用户的属性数据进行四级聚类,对该四级聚类后的用户组根据用户的社 交数据进行最后一次的聚类,得到至少两个用户组。

其中,该每个用户的历史记录数据包括:该每个用户的所有历史记录数据和该每个用户在预设时间段内的历史记录数据中的至少一种。

该每个用户的标签数据包括:该每个用户的有效兴趣标签数量和该每个用户的突出兴趣标签数量中的至少一种。

该每个用户的属性数据包括该每个用户的性别、该每个用户的年龄段、该每个用户的身份中的至少一种。

该每个用户的社交数据包括该每个用户的联系人数量、该每个用户的紧密联系人数量、该每个用户的主动联系次数中的至少一种;该每个用户的紧密联系人为与该每个用户的联系次数大于或等于预设次数阈值的联系人。

具体地,该每个用户的所有历史记录数据例如可以为该每个用户从业务注册时间开始至当前时间的所有历史记录数据。该每个用户在预设时间段内的历史记录数据例如可以为该每个用户在距离当前时间最近的预设段内的历史记录数据,如该每个用户在距离当前时间最近的一周或是一个月内的历史记录数据。举例来说,若该信息推荐方法应用于电子商务领域的信息推荐系统中,则该每个用户的所有历史记录数据可包括:该每个用户的浏览历史记录数据、该每个用户的购买历史记录数据、该每个用户的收藏历史记录数据等至少一种。其中,该每个用户的浏览历史记录数据包括该每个用户的浏览物品的历史记录数据,或,该每个用户的浏览物品的条目的历史记录数据。该每个用户的购买历史记录数据包括:该每个用户所购买物品的历史记录数据,或,该每个用户所购买物品的条目的历史记录数据。该每个用户的收藏历史记录数据包括:该每个用户的收藏物品的历史记录数据,或,该每个用户的收藏物品的条目的历史记录数据。其中,该每个用户所浏览物品的历史记录数据,与,该每个用户所浏览物品的条目的历史记录数据,不同。该每个用户所收藏物品的历史记录数据,与,该每个用户所收藏物品的条目的历史记录数据,不同。该每个用户所购买物品的历史记录数据,与,该每个用户所购买物品的条目的历史记录数据,不同。以购买物品为例,如果一个用户多次购买同一个物品,则该用户的购买记录总数大于购买物品的条目数量。

该每个用户的有效兴趣标签数量可以为在预设有效期限内该每个用户的兴趣标签数量;该每个用户的突出兴趣标签数量可以为在该每个用户的有效 兴趣标签内,标签权重大于预设权重值的标签数量。每个标签可具有一个标签权重,该标签权重可用于表示该每个标签对用户的重要性。该标签权重越大,则该每个标签对该用户的重要性越大。该每个标签的标签权重可根据时间的变化进行调整。例如,用户观看的某个影片的类型的标签是一个月前生成的,后来用户不看这个类型的影片了,这个权重应该被调低。

该每个用户的性别可包括男或女。该每个用户的年龄段例如可包括:儿童、年轻人、中年人和老人中任一。该每个用户的身份可包括:学生、家庭主妇、上班族中任一。

该每个用户的联系人数量例如可以为该每个用户的通讯录或社交软件中的联系人总数量。该每个用户的紧密联系人为该每个用户的手机通讯录或社交软件中与该每个用户的联系次数大于或等于预设次数阈值的联系人。该每个用户的联系人数量、该每个用户的紧密联系人数量及该每个用户的主动联系次数可以为通过该每个用户的通信记录或社交记录中获得。

图4为本发明实施例提供的另一种信息推荐方法的流程图。如图4所示,该方法在上述实施例所述的方法的基础上,其中s302中确定该每个用户组对应的推荐策略,可以包括:

s401、确定该每个用户组的数据特征值所属的特征值范围。

s402、将该特征值范围对应的推荐算法作为该每个用户组对应的推荐算法。

具体地,若该每个用户组中每个用户的数据特征包括至少一种数据特征,则该每个用户组的数据特征值包括:至少一种数据特征对应的特征值。那么s401中可以是确定该至少一种数据特征中每种数据特征对应的数据特征值所属的特征值范围,该s402中可以是将该至少一种数据特征中各数据特征对应的数据特征值所属的特征值范围对应的推荐算法均作为该每个用户组对应的推荐算法。

可选的,在s401中确定该每个用户组的数据特征值所属的数据特征值范围之前,该方法还可包括:

s401a、确定该每个用户组的数据特征值。

可选的,该每个用户组的数据特征包括以下至少一种:该每个用户组的历史记录数据、该每个用户组的标签数据、该每个用户组的属性数据和该每 个用户组的社交数据;该每个用户组的数据特征值包括:该每个用户组的每种数据特征对应的特征值。

具体地,若该每个用户组的数据特征包括以下至少一种:该每个用户组的历史记录数据、该每个用户组的标签数据和该每个用户组的社交数据,则该每个用户组的每种数据特征对应的特征值包括:该每个用户组中所有用户的该种数据特征的平均值;若该每个用户组的数据特征包括:该每个用户组的属性数据,则该每个用户组的每种数据特征对应的特征值包括:该每个用户组中所有用户的属性数据范围。

举例来说,若该每个用户组的数据特征包括该每个用户组的历史记录数据,则该每个用户组的历史记录数据的特征值为该每个用户组中所有用户的历史记录数据的平均值。该每个用户组的历史记录数据包括:该每个用户组的所有历史数据和该每个用户组在预设时间段内所有历史记录数据中至少一种。该每个用户组的所有历史记录数据包括:该每个用户组的所有用户的浏览历史记录数据之和、该每个用户组的所有用户的购买历史记录数据之和、该每个用户组的所有用户的收藏历史记录数据之和等至少一种。

若该每个用户组的所有历史记录数据包括:该每个用户组的所有用户的浏览历史记录数据之和l、该每个用户组的所有用户的购买历史记录数据之和g,以及该每个用户组的所有用户的收藏历史记录数据k,若该每个用户组中的用户个数为n,那么该每个用户组的所有历史记录数据的特征值可以根据如下公式(1)获得。

(l+g+k)/n公式(1)

该每个用户组在预设时间段内历史记录数据包括:该每个用户组的所有用户在该预设时间段内的浏览历史记录数据之和l’、该每个用户组的所有用户在该预设时间段内的购买历史记录数据之和g’,以及该每个用户组的所有用户在该预设时间段内的收藏历史记录数据k’,若该每个用户组中的用户个数为n,那么该每个用户组的在该预设时间段内的历史记录数据的特征值可以根据如下公式(2)获得。

(l’+g’+k’)/n公式(2)

该实施例中以该每个用户组的数据特征包括该每个用户组的历史记录数据为例进行说明,该每个用户组的标签数据的特征值及社交数据的特征值的 确定方法与如上所述的确定该每个用户组的历史记录数据的特征值的过程类似,在此不再赘述。

举例来说,若该每个用户组的所有历史记录数据对应的特征值v1可以为该每个用户组的所有用户的所有历史记录数据的平均值。该每个用户组的近期历史记录数据对应的特征值v2可以为该每个用户组的所有用户的近期历史记录数据的平均值。该每个用户组的条目数据对应的特征值v3可以为该每个用户组的所有条目数据的平均值。该每个用户组的有效标签数据对应的特征值v4可以为该每个用户组的所有用户的有效标签数据的平均值。该每个用户组的突出标签数据对应的特征值v5可以为该每个用户组的所有用户的突出标签数据的平均值。该每个用户组的用户属性数据对应的特征值v6可以通过该每个用户组的所有用户的是否有用户属性数据表示。该每个用户组的联系人数量对应的特征值v7可以为该每个用户组的所有用户的联系人数量的平均值。该每个用户组的紧密联系人数量对应的特征值v8可以为该每个用户组的所有用户的紧密联系人数量的平均值。

如上所述的s401中确定该每个用户组的数据特征值所属的特征值范围可以是将该每个用户组的数据特征值与对应的特征值阈值进行比较,继而确定该每个用户组的数据特征值所属的特征值范围。该401例如可以是根据如下表1确定该每个用户组的数据特征值所属的特征值范围。

表1

可选的,如上所述的s402中将该特征值范围对应的推荐算法作为该每个 用户组对应的推荐算法可以包括:

根据该每个用户组的数据特征值所属的特征值范围,确定预设的推荐算法库中该特征值范围对应的推荐算法,将该确定的推荐算法作为该每个用户组对应的推荐算法。

具体地,该步骤中可以是根据该每个用户组的数据特征值所属的特征值范围,及该预设的推荐算法库中各算法对于数据特征的使用条件,确定该数据特征值对应的特征值范围不适用的推荐算法,继而将该预设推荐算法库中该不适用的推荐算法外的其他推荐算法确定为该特征值范围对应的推荐算法。

该预设的推荐算法库可包括基于内容的推荐算法、基于用户的协同过滤推荐算法、基于条目的协同过滤推荐、基于标签的推荐算法、基于矩阵分解的协同过滤推荐算法、基于用户属性的推荐算法和基于社交的推荐算法等算法中至少一个推荐算法。该基于内容的推荐算法的使用条件可以包括:每个用户组的每个用户的数据特征具有历史记录数据。该基于用户的协同过滤推荐算法和该基于条目的协同过滤推荐可包括:每个用户组的每个用户的数据特征具有历史记录数据,且,该每个用户组的历史记录数据的特征值大于或等于预设的历史记录数据特征值。该基于标签的推荐算法的使用条件包括:每个用户组的每个用户的数据特征具有标签数据。该基于矩阵分解的协同过滤推荐算法的使用条件包括:每个用户组的每个用户的数据特征具有历史记录数据。该基于用户属性的推荐算法的使用条件包括:该每个用户组的每个用户的数据特征具有属性数据。该基于社交的推荐算法的使用条件包括:该每个用户组的每个用户的数据特征具有社交数据,且,该每个用户组的社交数据的特征值大于或等于预设的社交数据特征值。

可选的,如上所述步骤根据该每个用户组的数据特征值所属的特征值范围,确定预设的推荐算法库中该特征值范围对应的推荐算法,将该确定的推荐算法作为该每个用户组对应的推荐算法可以包括:

根据该每个用户组的数据特征值所属的特征值范围确定该每个用户组的类型;根据该每个用户组的类型对应的推荐算法确定该每个用户组对应的推荐算法。

其中,确定该每个用户组的类型可以:根据该每个用户组的数据特征值 所属的特征值范围以及如上表1确定该每个用户组的类型;确定该每个用户组对应的推荐算法可以是:根据该每个用户组的类型,以及,推荐算法库中各推荐算法对用户组类型的使用条件,确定该每个用户组的类型对应的推荐算法。

其中,该推荐算法库中各推荐算法对用户组类型使用条件例如可以为如下表2所示。

表2

该表2中“x”可用于表示当前用户组类型不适用于对应推荐算法。

可选的,若该每个用户组对应的推荐算法包括多个推荐算法;该推荐策略包括:该每个用户组对应的n种融合推荐算法;其中,每种融合推荐算法包括该多个推荐算法和该多个推荐算法对应的一个融合方式。

可选的,如上所述的s302中确定该每个用户组对应的推荐策略,还可以包括:

s403、根据该每个用户组对应的推荐算法,和,预设的融合方式库中每 个融合方式对推荐算法的使用条件,从该推荐算法库中确定符合该每个用户组对应的推荐算法的使用条件的n个融合方式为该多个推荐算法对应的n个融合方式。

具体地,该预设的融合方式库可包括:加权型融合方式、交叉型融合方式、分级型融合方式及瀑布型融合方式中至少一个融合方式。

其中,该加权型融合方式,可以是通过对根据不同推荐算法所确定的推荐信息的评分进行加权,并将该加权后的推荐信息进行排序,确定该加权后的推荐信息的优先级,继而根据加权后的推荐信息的优先级,确定发送至每个用户组对应的推荐信息。其中,该加权采用的权重可以根据每个用户组中每个用户对于推荐信息的反馈信息进行动态调整。

该交叉型融合方式,可以是对根据不同推荐算法所确定的推荐信息按照预设的比例,确定为每个用户组对应的推荐信息。

该分级型融合方式,可以是根据每个用户组中每个用户对于推荐信息的反馈信息,确定对根据不同推荐算法所确定的推荐信息的优先级,继而根据推荐信息优先级,将最高优先级对应的至少一个推荐信息确定为该每个用户组对应的推荐信息。

该瀑布型融合方式,例如可以是将一个推荐算法确定的推荐信息作为另一个推荐算法的输入信息,继而确定该每个用户组对应的推荐信息。

其中,该加权融合方式对于推荐算法的使用条件可包括:根据推荐算法确定的推荐信息需包括预测评分信息。若一个推荐算法确定的推荐信息不包括预测评分信息,则该一个推荐算法不适用于与其他推荐算法采用该加权型融合方式。

该交叉型融合方式对于推荐算法的使用条件可包括:根据推荐算法确定的推荐信息的长度需大于待生成的该每个用户组对应的推荐信息的长度。

该分级型融合方式对于推荐算法的使用条件可包括:根据推荐算法确定的推荐信息的长度需小于待生成的该每个用户组对应的推荐信息的长度。

该瀑布型融合方式对于推荐算法的使用条件可包括:根据推荐算法确定的推荐信息的长度需大于待生成的该每个用户组对应的推荐信息的长度。

s404、根据该n个融合方式,分别对该多个推荐算法进行融合,获得该n种融合推荐算法。

可选的,如上所述的s303中根据该每个用户组对应的推荐策略生成该每个用户组的推荐信息,可以包括:

s405、确定该每个用户组对应的每种融合推荐算法的推荐准确度。

s406、从该n个融合推荐算法中确定最高推荐准确度的融合推荐算法,作为该每个用户组的最优融合推荐算法。

s407、根据该每个用户组的最优融合推荐算法,生成该每个用户组的推荐信息。

可选的,如上述s405中确定该每个用户组对应的每种融合推荐算法的推荐准确度,可以包括:

针对该每个用户组对应的n种融合推荐算法中的一种,根据该每个用户组的n组数据中的一组数据,生成该种融合推荐算法对应的推荐信息,该n组数据中不同组的数据对应的用户数相同;

根据该一组数据对应的用户对该推荐信息的反馈信息,确定该每个用户组对应的该种融合推荐算法的推荐准确度。

具体地,该n组数据可以是从该每个用户组的所有用户数据中随机选择的数据。该不同组的数据中同一种数据特征的差值在预设范围内。也就是说,该不同组的数据的数据特征相似,对应的用户数相同,因而,该n组数据可称为n组均等数据。

举例来说,图5为本发明实施例提供的一个用户组、融合推荐策略、数据组与推荐信息的推荐准确度的对应关系图。如图5所示,若一个用户组对应的推荐策略包括:融合推荐算法1、融合推荐算法2、融合推荐算法3、融合推荐算法4和融合推荐算法5。该一个用户组包括5组数据,即数据组1、数据组2、数据组3、数据组4及数据组5。根据该一个用户组的数据组1,采用融合推荐算法1可获得该融合推荐算法1对应的推荐信息;根据该数据组2采用融合推荐算法2可获得该融合推荐算法2对应的推荐信息;根据该数据组3采用融合推荐算法3可获得该融合推荐算法3对应的推荐信息;根据该数据组4采用融合推荐算法4可获得该融合推荐算法4对应的推荐信息;根据该数据组5采用融合推荐算法5可获得该融合推荐算法5对应的推荐信息。若该融合推荐算法1对应的推荐信息的推荐准确度为0.8,该融合推荐算法2对应的推荐信息的推荐准确度为0.3,该融合推荐算法3对应的推荐信息 的推荐准确度为0.4,该融合推荐算法4对应的推荐信息的推荐准确度为0.9,该融合推荐算法5对应的推荐信息的推荐准确度为0.5,因而,该一个用户组的最高推荐准确度为0.9,则该融合推荐算法4可以为该一个用户组的最优融合推荐算法。

可选的,该方法还可包括:

若最高推荐准确度小于预设准确度阈值的用户组的比例大于或等于预设阈值,对该多个用户进行重新分组;该最高推荐准确度小于预设准确度阈值的用户组的比例,可以为该最高推荐准确度小于预设准确度阈值的用户组的个数与该至少两个用户组的个数的比值;

确定该重新分组后的每个用户组的对应的推荐策略;

根据该重新分组后的每个用户组对应的推荐策略生成该重新分组后的每个用户组的推荐信息;

向该重新分组后的每个用户组中的用户对应的终端发送推荐信息。

可选的,其中,确定该重新分组后的每个用户组的对应的推荐策略,可以包括:

确定该重新分组后的每个用户组的数据特征值,是否在,原分组后的用户组的数据特征值所在的特征值范围内;

判断该原分组后的用户组的最高推荐准确度,是否大于或等于该预设准确度阈值;

若该重新分组后的每个用户组的数据特征值在该原分组后的用户组的数据特征值所在的特征值范围内,且,该原分组后的用户组的最高推荐准确度大于或等于该预设准确度阈值,则将该原分组后的用户组对应的推荐策略作为该重新分组后的每个用户组对应的推荐策略。

本发明实施例通过提供多种用户分组的实现方案、确定每个用户组对应的推荐策略的实现方案等可更好地保证用户分组更精确,推荐策略的确定更准确,更好地保证该信息推荐算法获得推荐信息的准确度。

本发明实施例提供的信息推荐方法,通过具体的实例对上述实施例所述的方法进行说明,有益效果与上述实施例类似,在此不再赘述。

本发明实施例还提供一种服务器。图6为本发明实施例提供的服务器的结构示意图。如图6所示,该服务器600可包括:分组模块601、确定模块 602、生成模块603和发送模块604。

其中,该分组模块601、确定模块602、生成模块603可通过如上图2所述服务器中的处理器201实现,处理器201可通过调用存储器202中存储的对应程序或执行,实现该分组模块601、确定模块602、生成模块603各模块的功能。发送模块604可通过如上图2所示的服务器中的网络接口203实现。

其中,分组模块601,用于对多个用户进行分组,获得至少两个用户组;其中,每个用户组包括至少一个用户。

确定模块602,用于确定该每个用户组对应的推荐策略;该推荐策略包括该每个用户组对应的推荐算法。

生成模块603,用于根据该每个用户组对应的推荐策略生成该每个用户组的推荐信息。

发送模块604,用于向该至少一个用户对应的终端发送该推荐信息。

可选的,分组模块601,用于根据该多个用户中每个用户的数据特征,对该多个用户进行分组,获得该至少两个用户组。

可选的,该每个用户的数据特征包括:至少一个数据特。

分组模块601,用于根据该每个用户的该至少一种数据特征,按照预设的数据特征顺序,对该多个用户进行分组,得到该至少两个用户组。

可选的,该每个用户的数据特征包括以下至少一种:

该每个用户的历史记录数据、该每个用户的标签数据、该每个用户的属性数据和该每个用户的社交数据。

其中,该每个用户的历史记录数据包括:该每个用户的所有历史记录数据和该每个用户在预设时间段内的历史记录数据中的至少一种;该每个用户的标签数据包括该每个用户的有效标签数量和该每个用户的突出标签数量中的至少一种。该每个用户的属性数据包括该每个用户的性别、该每个用户的年龄段、该每个用户的身份中的至少一种。该每个用户的社交数据包括该每个用户的联系人数量、该每个用户的紧密联系人数量、该每个用户的主动联系次数中的至少一种。该每个用户的紧密联系人为与该每个用户的联系次数大于或等于预设次数阈值的联系人。

可选的,确定模块602,确定该每个用户组的数据特征值所属的特征值范围,将该特征值范围对应的推荐算法作为该每个用户组对应的推荐算法。

可选的,确定模块602,还用于确定该每个用户组的数据特征值。

可选的,该每个用户组的数据特征包括以下至少一种:该每个用户组的历史记录数据、该每个用户组的标签数据、该每个用户组的属性数据和该每个用户组的社交数据;该每个用户组的数据特征值包括:该每个用户组的每种数据特征对应的特征值。

可选的,确定模块602,还用于根据该每个用户组的数据特征值所属的特征值范围,确定预设的推荐算法库中该特征值范围对应的推荐算法,将该确定的推荐算法作为该每个用户组对应的推荐算法。

可选的,若该每个用户组对应的推荐算法包括多个推荐算法;该推荐策略包括:该每个用户组对应的n种融合推荐算法;其中,每种融合推荐算法包括该多个推荐算法和该多个推荐算法对应的一个融合方式。

确定模块602,还用于根据该每个用户组对应的推荐算法,和,预设的融合方式库中每个融合方式对推荐算法的使用条件,从该推荐算法库中确定符合该每个用户组对应的推荐算法的使用条件的n个融合方式为该多个推荐算法对应的n个融合方式;根据该n个融合方式,分别对该多个推荐算法进行融合,获得该n种融合推荐算法。

可选的,确定模块602,还用于确定该每个用户组对应的每种融合推荐算法的推荐准确度;从该n个融合推荐算法中确定最高推荐准确度的融合推荐算法,作为该每个用户组的最优融合推荐算法;

生成模块603,还用于根据该每个用户组的最优融合推荐算法,生成该每个用户组的推荐信息。

本发明实施例提供的服务器,可用于执行上述实施例所述的信息推荐方法,有益效果与上述实施例类似,在此不再赘述。

本发明实施例还提供一种计算机可读存储介质。图7为本发明实施例提供的计算机可读存储介质的结构示意图。

如图7所示,该计算机可读存储介质700可存储有可执行的程序代码701。该程序代码701用以实现上述权利要求1-10中如上实施例一或二中任一所述的信息推荐方法。

本发明实施例提供的计算机可读存储介质,可存储的程序代码可用于实现上述实施例所述的信息推荐方法,有益效果与上述实施例类似,在此不再 赘述。

本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1