一种信息推荐方法及系统的制作方法

文档序号:6333089阅读:324来源:国知局
专利名称:一种信息推荐方法及系统的制作方法
技术领域
本申请涉及互联网应用技术领域,特别是涉及一种信息推荐方法及系统。
背景技术
随着互联网的不断发展,通过网站或即时通信等方式结识网友已经成为一种流行趋势。目前,很多网站或即时通信工具都具有好友信息推荐的功能,通过好友信息推荐,可以拓展用户群体,增进网友之间的交流和互动,也可以加强网站或即时通信工具对用户的粘性。现有技术中一种常用的好友信息推荐方式是根据当前已经存在的好友关系进行推荐,例如,当前,用户A和用户B具有好友关系,并且用户B和用户C具有好友关系,则系统会根据上述已存在的好友关系,将用户C的标识信息推荐给用户A,其中,用户标识信息可以在系统中唯一标识用户的身份,例如用户名、用户邮件账号、用户ID号码等。上述信息推荐方式的问题在于,系统向用户所推荐的只是“好友的好友”,却并不一定是用户真正感兴趣的好友。现有技术中另一种信息推荐方式是根据用户的属性信息进行推荐,例如,向用户推荐具有相同或相似爱好的用户作为好友。这种方式的实现依赖于用户属性信息的完整性和准确性,然而在实际应用中,很多用户在注册时往往并不注重这部分信息的填写,使得这种方案难以实施。综上所述,现有的推荐方案无法实现准确有效的好友信息推荐,而一旦向用户推荐了不合适的网友的信息,则很可能会降低用户的使用感受。从系统的角度而言,不合适的好友信息推荐必然会增加用户之间不必要的信息交互,从而导致为网站服务器或即时通信服务器增加额外的无效负担,以及网络带宽资源的额外浪费。

发明内容
为解决上述技术问题,本申请实施例提供一种信息推荐方法及系统,以提高用户的使用感受、减少用户之间不必要的信息交互,减轻系统服务器的负担,节省网络带宽资源占用。本申请实施例所提供的技术方案如下本申请实施例提供一种信息推荐方法,包括查询预置时间段内的用户行为数据;根据所查询的用户行为数据,获得用户的子类目兴趣度和/或用户的关键词兴趣度,并利用所获得的子类目兴趣度和/或关键词兴趣度,构成用户的兴趣度向量;利用向量夹角公式,计算当前用户兴趣度向量与其他用户兴趣度向量的相似性;根据相似性计算结果,选取与当前用户兴趣度向量相似性最高的至少一名用户, 将所选取的用户的标识信息,向当前用户进行推荐;其中,所述子类目兴趣度,用于表示用户对网站子类目访问兴趣度的相对关系;所述关键词兴趣度,用于表示用户对关键词使用兴趣的相对关系。
本申请实施例还提供一种信息推荐系统,包括查询单元,用于查询预置时间段内的用户行为数据;用户兴趣度获得单元,用于根据所述查询单元的查询结果,获得用户的子类目兴趣度和/或用户的关键词兴趣度,并利用所获得的子类目兴趣度和/或关键词兴趣度,构成用户的兴趣度向量;用户相似性计算单元,用于利用向量夹角公式,计算当前用户兴趣度向量与其他用户兴趣度向量的相似性;第一推荐单元,用于根据相似性计算结果,选取与当前用户兴趣度向量相似性最高的至少一名用户,将所选取的用户的标识信息,向当前用户进行推荐;其中,所述子类目兴趣度,用于表示用户对网站子类目访问兴趣度的相对关系;所述关键词兴趣度,用于表示用户对关键词使用兴趣的相对关系。本申请实施例提供的技术方案,利用用户在网站上的行为数据进行好友标识信息的推荐。行为数据是在用户访问网站时系统所要记录的必要信息,因此本申请方案不会为系统增加额外的负担。与现有的推荐方式相比,行为数据信息能够在客观上反映用户的兴趣及需求,也不需要依赖于用户个人的填写,因此本申请方案可以实现更为准确和有效的好友信息推荐,从而提高用户的使用感受、减少用户之间不必要的信息交互,减轻系统服务器的负担,节省网络带宽资源占用。


为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。图1为本申请实施例信息推荐方法的一种流程图;图2为本申请实施例信息推荐方法的第二种流程图;图3为本申请实施例信息推荐方法的第三种流程图;图4为本申请实施例信息推荐方法的第四种流程图;图5为本申请实施例信息推荐系统的结构示意图;图6为本申请实施例信息推荐系统的另一种结构示意图;图7为本申请实施例信息推荐系统的第三种结构示意图。
具体实施例方式为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本申请保护的范围。首先对本申请实施例的一种信息推荐方法进行说明,参见图1所示,包括以下步骤查询预置时间段内的用户行为数据,
根据所查询的用户行为数据,获得用户的子类目兴趣度和/或用户的关键词兴趣度,并利用所获得的子类目兴趣度和/或关键词兴趣度,构成用户的兴趣度向量;利用向量夹角公式,计算当前用户兴趣度向量与其他用户兴趣度向量的相似性;根据相似性计算结果,选取与当前用户兴趣度向量相似性最高的至少一名用户, 将所选取的用户的标识信息,向当前用户进行推荐;在上述方案中,“子类目兴趣度”的作用是表示用户对网站各个子类目访问兴趣度的相对关系,其中,在用户行为数据中,一般都记录着用户对每个网站子类目页面的点击/ 浏览次数、在每个子类目的停留时间、在每个子类目发布信息的次数等信息,这些信息都可以用来表示用户对子类目的兴趣。在实际应用中,可以利用上述任意一种信息数据值,或者多种信息数据值的加权,分别表示出用户对每个网站子类目的兴趣值,某个用户对每个网站子类目的兴趣值的数据集合,即构成了该用户的子类目兴趣度。类似地,“关键词兴趣度”的作用是表示用户对各种关键词使用兴趣度的相对关系,其中,在用户行为数据中,一般都记录着用户对各种关键词的使用场景、使用次数等信息,这些信息都可以用来表示用户对关键词的使用兴趣。在实际应用中,可以利用上述任意一种信息数据值,或者多种信息数据值的加权,分别表示出用户对每个关键词的兴趣值,某个用户对每个关键词的兴趣值的数据集合,即构成了该用户的关键词兴趣度。在本申请实施例的方案中,为系统中的每个用户构建一个兴趣度向量,然后根据用户间的兴趣度向量的相似性关系,判断用户之间是否有相似的兴趣,并以此作为推荐好友的依据。其中,用户的兴趣度向量可以单独根据子类目兴趣度构建、也可以单独根据关键词兴趣度构建,还可以同时使用以上两者进行构建。上述方案利用了用户在网站上的行为数据进行好友信息推荐。由于行为数据是在用户访问网站时系统所要记录的必要信息,因此本申请方案不会为系统增加额外的负担。与现有的推荐方式相比,行为数据信息能够在客观上反映用户的兴趣及需求,也不需要依赖于用户个人的填写,因此本申请方案可以实现更为准确和有效的好友信息推荐,从而提高用户的使用感受、减少用户之间不必要的信息交互,减轻系统服务器的负担,节省网络带宽资源占用。下面结合具体的实施方式,对本申请的信息推荐方案进行说明图1所示为本申请实施例一种信息推荐方法的流程图,包括以下步骤S101,查询预置时间段内的用户行为数据;本申请实施例方案,是基于用户的行为的历史数据,对用户之间的兴趣相似性进行分析,作为好友信息推荐的依据。对于网站或即时通信工具的每一个注册用户,系统都会记录用户的各种行为,并将这些行为记录在用户日志中,常见的用户行为数据包括用户的浏览行为数据(例如曾经浏览过哪些页面、浏览页面的次数、浏览页面的时间)、搜索行为数据(例如曾经使用过哪些搜索关键词、使用搜索关键词的次数)等等,当然,对于不同应用的网站或即时通信工具,所记录的具体行为数据的种类也各不相同。例如,对于电子商务网站而言,用户的行为数据还可以包括用户的卖、买行为数据等等,这些都可以体现出用户的个人兴趣,本领域技术人员也可以根据实际的应用需求,获取不同类型的用户行为数据, 本实施例对此并不进行限定。 本申请实施例方案中,通过用户日志获取用户的各种行为数据,在实际应用中,可以获取用户从注册时间开始至今的行为数据作为计算用户兴趣度的依据。而考虑到用户的兴趣很可能是随着时间阶段性变化的,因此也可以选择用户在最近一段时间(例如30天、 60天等等)的行为数据作为计算用户短期兴趣度的依据。本领域技术人员可以根据实际需求对所查询时间段进行设定。S102,根据所查询的用户行为数据,获得用户的子类目兴趣度和/或用户的关键词兴趣度,并利用子类目兴趣度和/或关键词兴趣度,构成用户的兴趣度向量;1)子类目兴趣度“子类目兴趣度”的作用是表示用户对网站各个子类目访问兴趣度的相对关系,例如,某网站共有两个子类目A、B,那么对于该网站而言,用户的子类目兴趣度中,应该同时体现用户对A、B两个子类目兴趣的相对关系。具体而言,用户的对单个子类目的兴趣,可以根据用户行为数据中的相关信息来表示,例如,根据用户行为数据可知用户1曾经浏览过子类目A下的网页2次、浏览过子类目B下的网页5次;用户2曾经浏览过子类目A下的网页3次、浏览过子类目B下的网页0次。那么可以将用户1的子类目兴趣度表示为O、5),将用户2的子类目兴趣度表示为 (3,0)。上述例子中,是以“用户浏览子类目下网页次数”这一行为数据来构建用户的子类目兴趣度,可以理解的是,在实际应用中,还可以用其他的行为数据来构建用户的子类目兴趣度,或者综合考虑多种行为数据来构建用户的子类目兴趣度,以电子商务网站应用为例, 可以采用以下的方式,计算用户对单个子类目的兴趣值用户对某子类目兴趣值=在该子类目下发布的商品数量拉+对该子类目下页面的浏览次数*0. 1+在该子类目下的回复次数*0. 4+在该子类目下的订单发放次数拉+在该子类目下的求购信息发布次数拉在上述方法中,利用到了电子商务网站中的5种行为数据,并且对每种行为数据赋予一定的权重,然后通过计算加权值,得到对单个子类目的兴趣值。通过上面的公式可以看出,结合电子商务网站的实际情况,对于发布商品、发布订单等买卖行为赋予了较高的权值,而对于浏览等行为赋予了较低的权值。当然,以上公式仅用于示意性说明,根据不同的应用需求,也可以设置其他的权重值,或者选择其他类型的行为数据,本申请实施例对此并不进行限定。分别计算出用户对每个子类目的兴趣值之后,这些兴趣值的集合也就构成了用户的子类目兴趣度。2)关键词兴趣度“关键词兴趣度”的作用是表示用户对各种关键词使用兴趣度的相对关系。在实际应用中,不同用户所使用过的关键词可能千差万别,为了便于统计,系统可以根据所有用户的历史搜索行为,选取出一定数量的使用频率较高、或者比较具有代表性的关键词作为统计的依据。例如,某网站选用个搜索关键词χ、γ、ζ作为关键词兴趣度的统计依据,那么对于该网站而言,用户的关键词兴趣度中,应该同时体现用户对X、Y、Z三个关键词使用兴趣的相对关系。
具体而言,用户的对单个关键词的使用兴趣,可以根据用户行为数据中的相关信息来表示,例如,根据用户行为数据可知用户1曾经使用关键词X进行搜索共2次、使用关键词Y进行搜索共3次、使用关键词Z进行搜索共4次;用户2曾经使用关键词X进行搜索共3次、使用关键词Y进行搜索共1次、使用关键词Z进行搜索共0次;那么可以将用户1的关键词兴趣度表示为0、3、4),将用户2的关键词兴趣度表示为(3、1、0)。当然,在实际应用中,所选用的关键词数量可能远大于3,上述例子仅用于示意性说明。上述例子中,是以“用户使用关键词进行搜索的次数”这一行为数据来构建用户的关键词兴趣度,可以理解的是,在实际应用中,还可以用其他的行为数据来构建用户的关键词兴趣度,或者综合考虑多种行为数据来构建用户的关键词兴趣度,以电子商务网站应用为例,可以采用以下的方式,计算用户对单个关键词的兴趣值用户对某关键词兴趣值=所发布的商品信息中包含该关键词的次数拉+所发布的求购信息中包含该关键词的次数拉+使用该关键词进行搜索的次数*0. 4在上述方法中,利用到了电子商务网站中的3种行为数据,并且对每种行为数据赋予一定的权重,然后通过计算加权值,得到对单个关键词的兴趣值。通过上面的公式可以看出,结合电子商务网站的实际情况,对于在买卖行为中使用关键词的行为赋予了较高的权值,而对于使用关键词进行搜索的行为赋予了较低的权值。当然,以上公式仅用于示意性说明,根据不同的应用需求,也可以设置其他的权重值,或者选择其他类型的行为数据,本申请实施例对此并不进行限定。分别计算出用户对每个关键词的兴趣值之后,这些兴趣值的集合也就构成了用户的关键词兴趣度。3)用户兴趣度向量本申请实施例中,利用子类目兴趣度和关键词兴趣度,构成用户的兴趣度向量,例如,根据前面的例子,可得到将用户1的兴趣度向量为K2、5),(2、3、4)]、用户2的兴趣度向量为[(3、0),(3、1、0)]。当然,可以理解的是,也可以仅采用子类目兴趣度或关键词兴趣度中的一种,直接构成用户的兴趣度向量,本实施例对此不再详细说明。S103,利用向量夹角公式,计算当前用户兴趣度向量与其他用户兴趣度向量的相似性;通过步骤S102,可以获得在网站中注册的所有用户的兴趣度向量。可以看出, 上述例子中,用户的兴趣度都是以一个5维向量的形式表示,根据多维欧氏空间中对向量夹角的定义,可以使用向量夹角公式来表示任意两个用户兴趣度向量之间的相似性,例如用户1的兴趣度向量为a,用户2的兴趣度向量为b,那么,向量a和向量b的相似性 similarity (a, b)可表示为Similarity (a, b) = cos (a, b)=(向量a与向量b的内积)/(向量a与向量b模的乘积)
根据上述公式可知,用户兴趣度向量相似性的取值范围为[_1,1],当取值为1时, 两个向量相同(向量夹角为0度),说明两个用户的兴趣也完全相同;而取值为-1时,两个向量相反(夹角为180度),说明两个用户间的兴趣也完全没有相似之处。假设用户1为当前用户,准备对用户1进行信息推荐,则系统分别计算出用户1与系统中其他用户兴趣度向量的相似性。S104,根据相似性计算结果,选取与当前用户兴趣度向量相似性最高的至少一名用户,将所选取的用户的标识信息,向当前用户进行推荐;得到当前用户与系统中其他用户兴趣度向量的相似性之后,可以按照相似性排列的大小顺序,选取相似性最高的一名或多名用户,将所选取的用户的标识信息,向当前用户进行推荐;当然,也可以预先设置一个相似性阈值,这个阈值的理论取值范围是(_1,1),考虑到相似性的实际意义,该阈值一般应该设置为大于0。如果某个用户与当前用户的相似性不小于该阈值,则可以对将这个用户的标识信息加入推荐列表中,推荐给当前用户。在实际应用中,可能推荐结果中的有些用户已经和当前用户具有好友关系了,这种情况下,系统可以将这些已经成为好友的用户的标识信息滤除,按照相似性排列的大小顺序,继续选择其他用户进行推荐。此外,考虑到向用户推荐的网友,应该是在网络中活动比较多的网友,因此,可以利用一种或多种用户历史行为数据的加权,构成“用户活跃度”,例如,定义用户活跃度=用户登录网站的次数*0. 2+用户登录网站的时长*0. 2+用户登录即时通信工具的次数*0. 1+用户登录即时通信工具的时长*0. 2+新增好友的数目*0.3其中,上述的即时通信工具,应该是与网站有所关联的即时通信工具,例如阿里巴巴网站所对应的贸易通(阿里旺旺),因此,用户在即时通信工具的相关行为信息,也可以反映出用户在网站的活跃程度。在上述方法中,利用到了电子商务网站中的5种行为数据,并且对每种行为数据赋予一定的权重,然后通过计算加权值,得到用户在一定时期内的活跃度,当然,以上公式仅用于示意性说明,根据不同的应用需求,也可以设置其他的权重值,或者选择其他类型的行为数据,本申请实施例对此并不进行限定。得到每个用户的活跃度之后,可以结合S103中的计算结果,在与当前用户兴趣度向量相似性较高的用户中,进一步选出活跃度较高的用户,将所选取的用户的标识信息,向当前用户进行推荐。当然,也可以预先设置一个活跃度阈值,如果某个用户活跃度不小于该阈值,则可以将这个用户的标识信息加入推荐列表中,推荐给当前用户。上述方法中,根据用户的行为数据,为系统中的每个用户构建一个兴趣度向量,然后根据用户间的兴趣度向量的相似性关系,判断用户之间是否有相似的兴趣,并以此作为推荐好友的依据。结合电子商务网站的实际情况,在本申请的另一个实施例中,还可以根据用户的买卖行为对用户类型进行划分,然后根据不同的用户类型分别进行信息推荐,参见图2所示,本申请实施例所提供的另一种信息推荐方法,可以包括以下步骤S101,查询预置时间段内的用户行为数据;
这部分内容与前一实施例中的SlOl基本类似,具体到本实施例而言,只是所获取的具体行为数据类型有所区别,这里不再重复说明。S105,根据所查询的用户历史行为数据,确定用户的类别;买卖行为是电子商务的网站中的一种特有的行为,本实施根据用户的买卖行为数据,将用户分为以下三类第一类用户(纯卖家用户)仅发布过商品供应信息、没有购买行为的用户;第二类用户(纯买家用户)没有发布过商品供应信息、仅有购买行为的用户;第三类用户(买卖用户)既发布过商品供应信息、又有购买行为的用户。S106,根据当前用户的类别,选取与其对应的推荐类别的至少一名用户,将所选取的用户的标识信息,向当前用户进行推荐;根据S105所确定的用户类别,采用以下原则进行信息推荐如果当前用户为纯卖家用户,则向其推荐纯买家用户作为网友;如果当前用户为纯买家用户,则向其推荐纯卖家用户作为网友;如果当前用户为买卖用户,那么,一种推荐方案是也向其推荐买卖用户作为网友; 另一种方案是,既向其推荐纯卖家用户,也向其推荐纯买家用户;在推荐过程中,还可以结合用户的兴趣商品类目进行推荐,即所推荐的网友应该是与当前网友具有相同或相似兴趣商品类目的,这里,可以利用步骤S102中对单一子类目兴趣值的计算方法,得到每名用户最感兴趣(兴趣值最高)的一个或多个类目。相应地,在推荐过程中,根据当前用户的类别,首先选取与其对应的推荐类别,然后进一步在推荐类别中,选取当前用户的具有相同偏好子类目的一名或多名用户,将所选取的用户的标识信息, 向当前用户进行推荐。特别地,对于买卖用户而言,其“购买兴趣类目”和“售卖兴趣类目” 可能并不一致,因此,当应用上述的同时推荐纯卖家用户和纯买家用户的方案时,可以根据当前用户的买卖行为,分别计算得到其“购买兴趣类目”和“售卖兴趣类目”,然后针对其“购买兴趣类目,,推荐相应的纯卖家用户、针对其“售卖兴趣类目,,推荐相应的纯买家用户。可以理解的是,这里同样可以结合考虑“用户活跃度”的因素,即在与当前用户的具有相同偏好子类目的用户中,进一步选出活跃度较高的用户,将所选取的用户的标识信息,向当前用户进行推荐。其中,用户活跃度的计算方式可以与S104中所述相同,这里不再重复描述。以上,提供了两种根据用户的行为数据进行信息推荐的具体方案,在实际应用中, 这两种方案可以分别单独使用,也可以共同使用,参见图3所示,该方法中,根据用户的兴趣度相似性和用户的类别,分别得到两组推荐结果,在步骤S107中,对这两组推荐结果进行综合处理,综合处理的方式可以是分将两组推荐结果分别展示给用户,并且告知每组结果的推荐依据,让用户根据个人需求进行选择;当然,也可以分别从两组推荐结果中各随机选取一部分,混合处理之后展示给用户。本实施例对具体的综合处理方式并不进行限定。参见图4所示,在本申请的另一个实施例中,将根据用户类别所选择的用户的集合,作为根据相似性计算结果所选择的用户的集合的补充数据集,向当前用户进行信息推荐。本实施例中S201-S204与前述的S101-S104相同,而在S205中,推荐系统判断根据相似性计算结果所推荐的好友数是否达到预定的推荐数量,如果没有达到,则继续执行后续步骤,根据用户类别进行好友信息推荐。例如,系统要求每次向当前用户推荐20个用户的标识信息作为选择,但是由于相似性阈值、活跃度阈值等条件限制,导致S204结果推荐的用户标识信息数并没有达到20, 此时将进一步执行S206-S207(与前述的S106-S107相同),然后,在S208中,将S207的推荐结果作为S204推荐结果的补充,作为最终的推荐结果反馈给当前用户。在补充数据集的实际实现中,可以为每个类目预先计算出每个100名活跃度高的纯买家用户、100名活跃度高的纯卖家用户、以及100名活跃度高的买卖用户作为候选。选择100这个数字远大于实际需要的推荐数量20,这样可以避免为不同用户提供的补足数据太过重复。在推荐过程中,根据当前用户的类型和偏好子类目,找到对应的推荐类型下的候选数据,随机选取需要的数目进行补足。在随机选取补足数据时,可以根据被推荐用户的ID 生成一个Hash函数,映射到1-100之间,然后根据这个映射的序号,选取在此序号后面需要的补足个数的数据。这样既保证了取数的随机性,又能够保证对相同的用户ID,取到的补足的推荐数据是相同的。最后,如果当前用户是新的注册用户,没有足够的行为数据可用于识别用户的兴趣或类型,这种情况下,作为对本申请方案的补充,可以根据用户的属性信息(例如来源地区等),随机从具有相同属性信息的100个活跃度高的用户中选取20名用户进行信息推荐。上述实施例所提供的方案,可应用于电子商务网站页面的好友信息推荐,如阿里巴巴人脉通应用;也可应用于即时通信工具的好友信息推荐,如阿里巴巴的贸易通;还可应用于移动通讯终端设备的应用程序。当然,结合不同的应用需求,也可以将本申请的方案应用与其他类型的网站或即时通信工具的好友信息推荐。以实现更为准确和有效的好友信息推荐,提高用户的使用感受、减少用户之间不必要的信息交互,减轻系统服务器的负担, 节省网络带宽资源占用。相应于上面的方法实施例,本申请还提供一种信息推荐系统,参见图5所示,该系统可以包括查询单元510,用于查询预置时间段内的用户行为数据,用户兴趣度获得单元520,用于根据所述查询单元510的查询结果,获得用户的子类目兴趣度和/或用户的关键词兴趣度,并利用所获得的子类目兴趣度和/或关键词兴趣度,构成用户的兴趣度向量;用户相似性计算单元530,用于利用向量夹角公式,计算当前用户兴趣度向量与其他用户兴趣度向量的相似性;第一推荐单元M0,用于根据相似性计算结果,选取与当前用户兴趣度向量相似性最高的至少一名用户,将所选取的用户的标识信息,向当前用户进行推荐;其中,所述子类目兴趣度,用于表示用户对网站各个子类目访问兴趣度的相对关系;所述关键词兴趣度,用于表示用户对各种关键词使用兴趣的相对关系。其中,所述用户兴趣度获得单元520,可以利用用户对多个网站子类目的兴趣值, 构成用户的子类目兴趣度向量。而用户对单个子类目的兴趣值,可以利用以下一种或多种用户历史行为数据的加权来获得在该子类目下发布的商品数量、对该子类目下页面的浏览次数、在该子类目下的回复次数、在该子类目下的订单发放次数、在该子类目下的求购信息发布次数。
此外,所述用户兴趣度获得单元520,可以利用用户对多个关键词的兴趣值,构成用户的关键词兴趣度向量。而用户对单个关键词的兴趣值,可以利用以下一种或多种用户历史行为数据的加权来获得所发布的商品信息中包含该关键词的次数、所发布的求购信息中包含该关键词的次数、使用该关键词进行搜索的次数。参见图6所示,本申请实施例所提供的信息推荐系统,还可以包括用户类别确定单元550,用于根据所述查询单元510的查询结果,确定用户的类别;第二推荐单元560,用于根据当前用户的类别,选取与其对应的推荐类别的至少一名用户,将所选取的用户的标识信息,向当前用户进行推荐;其中,用户类别包括第一类用户仅发布过商品供应信息、没有购买行为的用户;第二类用户没有发布过商品供应信息、仅有购买行为的用户;第三类用户既发布过商品供应信息、又有购买行为的用户;所述第一类用户对应的推荐类别为第二类用户;所述第二类用户对应的推荐类别为第一类用户;所述第三类用户对应的推荐类别为第三类用户、或第一类用户与第二类用户的组合。具体而言,所述第二推荐单元560,可以根据当前用户的类别,选取与其对应的推荐类别中的、且与当前用户的具有相同偏好子类目的至少一名用户,将所选取的用户的标识信息,向当前用户进行推荐;其中,所述偏好子类目为用户对该子类目的兴趣值大于预置门限值的子类目。更为具体地,所述第二推荐单元560,可以根据当前用户的类别,选取与其对应的推荐类别中的、且与当前用户的具有相同偏好子类目的、且用户活跃度最高至少一名用户, 将所选取的用户的标识信息,向当前用户进行推荐;其中,用户的活跃度,可以利用以下一种或多种用户历史行为数据的加权来获得登录网站的次数、时长、登录与所述网站关联的即时通信工具的次数、时长、新增的好友数目。参见图7所示,本申请实施例所提供的信息推荐系统,还可以进一步包括第三推荐单元570,用于对第一推荐单元540和第二推荐单元560的处理结果进行综合处理,然后向当前用户进行推荐,例如将所述第二推荐单元560所选择的用户的集合,作为所述第一推荐单元540所选择的用户的集合的补充数据集,向所述当前用户进行信息推荐。为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备 (可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。本申请可用于众多通用或专用的计算系统环境或配置中。例如个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。以上所述仅是本申请的具体实施方式
,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
权利要求
1.一种信息推荐方法,其特征在于,包括 查询预置时间段内的用户行为数据;根据所查询的用户行为数据,获得用户的子类目兴趣度和/或用户的关键词兴趣度, 并利用所获得的子类目兴趣度和/或关键词兴趣度,构成用户的兴趣度向量;利用向量夹角公式,计算当前用户兴趣度向量与其他用户兴趣度向量的相似性; 根据相似性计算结果,选取与当前用户兴趣度向量相似性最高的至少一名用户,将所选取的用户的标识信息,向当前用户进行推荐;其中,所述子类目兴趣度,用于表示用户对网站子类目访问兴趣度的相对关系;所述关键词兴趣度,用于表示用户对关键词使用兴趣的相对关系。
2.根据权利要求1所述的方法,其特征在于,所述获得用户的子类目兴趣度,包括利用用户对多个网站子类目的兴趣值,构成用户的子类目兴趣度向量;所述获得用户的关键词兴趣度,包括利用用户对多个关键词的兴趣值,构成用户的关键词兴趣度向量。
3.根据权利要求2所述的方法,其特征在于,利用以下一种或多种用户历史行为数据的加权,获得用户对单个子类目的兴趣值 在该子类目下发布的商品数量、对该子类目下页面的浏览次数、在该子类目下的回复次数、在该子类目下的订单发放次数、在该子类目下的求购信息发布次数。
4.根据权利要求2所述的方法,其特征在于,利用以下一种或多种用户历史行为数据的加权,获得用户对单个关键词的兴趣值 所发布的商品信息中包含该关键词的次数、所发布的求购信息中包含该关键词的次数、使用该关键词进行搜索的次数。
5.根据权利要求1所述的方法,其特征在于,所述选取与当前用户兴趣度向量相似性最高的至少一名用户,将所选取的用户的标识信息,向当前用户进行推荐,包括在与当前用户兴趣度向量相似性最高的至少一名用户中,进一步选取用户活跃度最高的至少一名用户,将所选取的用户的标识信息,向当前用户进行推荐;其中,利用以下一种或多种用户历史行为数据的加权,获得用户的活跃度 登录网站的次数、时长、登录与所述网站关联的即时通信工具的次数、时长、新增的好友数目。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括 根据所查询的用户历史行为数据,确定用户的类别;根据当前用户的类别,选取与其对应的推荐类别的至少一名用户,将所选取的用户的标识信息,向当前用户进行推荐; 其中,用户类别包括第一类用户仅发布过商品供应信息、没有购买行为的用户; 第二类用户没有发布过商品供应信息、仅有购买行为的用户; 第三类用户既发布过商品供应信息、又有购买行为的用户;所述第一类用户对应的推荐类别为第二类用户;所述第二类用户对应的推荐类别为第一类用户;所述第三类用户对应的推荐类别为第三类用户、或第一类用户与第二类用户的组合。
7.根据权利要求6所述的方法,其特征在于,所述根据当前用户的类别,选取与其对应的推荐类别的至少一名用户,将所选取的用户的标识信息,向当前用户进行推荐,包括根据当前用户的类别,选取与其对应的推荐类别中的、且与当前用户的具有相同偏好子类目的至少一名用户,将所选取的用户的标识信息,向当前用户进行推荐;其中,所述偏好子类目为用户对该子类目的兴趣值大于预置门限值的子类目。
8.根据权利要求7所述的方法,其特征在于,所述选取与当前用户的具有相同偏好子类目的至少一名用户,包括选取与当前用户的具有相同偏好子类目的、且用户活跃度最高的至少一名用户; 其中,利用以下一种或多种用户历史行为数据的加权,获得用户的活跃度 登录网站的次数、时长、登录与所述网站关联的即时通信工具的次数、时长、新增的好友数目。
9.根据权利要求6所述的方法,其特征在于,将根据用户类别所选择的用户的集合,作为根据相似性计算结果所选择的用户的集合的补充数据集,向所述当前用户进行信息推荐。
10.一种信息推荐系统,其特征在于,包括查询单元,用于查询预置时间段内的用户行为数据;用户兴趣度获得单元,用于根据所述查询单元的查询结果,获得用户的子类目兴趣度和/或用户的关键词兴趣度,并利用所获得的子类目兴趣度和/或关键词兴趣度,构成用户的兴趣度向量;用户相似性计算单元,用于利用向量夹角公式,计算当前用户兴趣度向量与其他用户兴趣度向量的相似性;第一推荐单元,用于根据相似性计算结果,选取与当前用户兴趣度向量相似性最高的至少一名用户,将所选取的用户的标识信息,向当前用户进行推荐;其中,所述子类目兴趣度,用于表示用户对网站子类目访问兴趣度的相对关系;所述关键词兴趣度,用于表示用户对关键词使用兴趣的相对关系。
11.根据权利要求10所述的系统,其特征在于,所述系统还包括用户类别确定单元,用于根据所述查询单元的查询结果,确定用户的类别; 第二推荐单元,用于根据当前用户的类别,选取与其对应的推荐类别的至少一名用户, 将所选取的用户的标识信息,向当前用户进行推荐; 其中,用户类别包括第一类用户仅发布过商品供应信息、没有购买行为的用户; 第二类用户没有发布过商品供应信息、仅有购买行为的用户; 第三类用户既发布过商品供应信息、又有购买行为的用户;所述第一类用户对应的推荐类别为第二类用户;所述第二类用户对应的推荐类别为第一类用户;所述第三类用户对应的推荐类别为第三类用户、或第一类用户与第二类用户的组合。
12.根据权利要求11所述的系统,其特征在于,该系统还包括第三推荐单元,用于将所述第二推荐单元所选择的用户的集合,作为所述第一推荐单元所选择的用户的集合的补充数据集,向所述当前用户进行信息推荐。
全文摘要
本申请公开了一种信息推荐方法及系统。一种信息推荐方法包括查询预置时间段内的用户行为数据;根据所查询的用户行为数据,获得用户的子类目兴趣度和/或用户的关键词兴趣度,并利用所获得的子类目兴趣度和/或关键词兴趣度,构成用户的兴趣度向量;利用向量夹角公式,计算当前用户兴趣度向量与其他用户兴趣度向量的相似性;根据相似性计算结果,选取与当前用户兴趣度向量相似性最高的至少一名用户,将所选取的用户的标识信息,向当前用户进行推荐信息。本申请方案可以实现更为准确和有效的信息推荐,从而提高用户的使用感受、减少用户之间不必要的信息交互,减轻系统服务器的负担,节省网络带宽资源占用。
文档编号G06F17/30GK102411596SQ20101029845
公开日2012年4月11日 申请日期2010年9月21日 优先权日2010年9月21日
发明者杨志雄, 苏宁军, 顾海杰 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1