信息推荐方法及装置的制造方法

文档序号:10512233阅读:225来源:国知局
信息推荐方法及装置的制造方法
【专利摘要】本发明公开的信息推荐方法,包括:获取预设时间段内的历史访问信息的属性标识;根据所述属性标识计算每两条所述历史访问信息的相似值;利用所述相似值确定待推荐信息;将所述待推荐信息发送到相应客户端。本发明还公开了一种信息推荐装置。与现有技术相比,本方案根据历史访问信息本身的属性确定待推荐信息,不依赖于用户群对信息的评分,从而不仅能够避免评分数量对推荐过程的影响,而且能够提高所推荐的信息的准确性,提高用户体验。
【专利说明】
信息推荐方法及装置
技术领域
[0001] 本发明涉及互联网技术领域,更具体而言,涉及一种信息推荐方法及装置。
【背景技术】
[0002] 基于大数据技术的发展,信息推荐作为提高用户体验的方式,被广泛应用在各个 领域。例如,用户通过电子商务平台筛选商品时,推荐系统可以根据用户的历史浏览记录, 为用户推荐相类似的商品;或者,用户观看电影时,推荐系统可以为用户推荐相类似的电影 等。
[0003] 通常,推荐系统在向用户推荐信息之前,对用户的历史访问信息或者用户正在访 问的信息进行分析和计算,并以计算结果为依据,从大量信息中筛选符合用户兴趣的信息 作为推荐信息。相关技术中,常用的推荐算法为协同过滤推荐算法,协同过滤推荐算法基于 用户历史访问信息的评分,或者用户当前正在访问的信息的评分确定用户的兴趣度,然后, 在用户群中查找与该用户的兴趣度相似的用户,综合查找到的相似用户对信息的评分,将 评分与该用户历史访问信息或者当前正在访问的信息的评分相同或者相近的信息确定为 推荐信息,并推荐给该用户。
[0004] 由此可见,协同过滤推荐算法通过用户对信息的评分确定用户对该信息的兴趣 度,因此,每条信息的评分数量应当达到一定量,才能够保证协同过滤推荐算法的可实施性 和准确性。然而,随着信息类型的增多,很多消息没有评分或者评分数量很少,例如,音乐, 从而无法根据评分推荐信息,或者所推荐的信息准确性差,导致用户体验差。

【发明内容】

[0005] 有鉴于此,本发明实施例提供了一种信息推荐方法及装置,能够解决由于评分数 量不足产生的无法根据评分推荐信息,或者所推荐的信息准确性差的问题。
[0006] 第一方面,本发明实施例提供了一种信息推荐方法,包括:获取预设时间段内的历 史访问信息的属性标识;根据所述属性标识计算每两条所述历史访问信息的相似值;利用 所述相似值确定待推荐信息;将所述待推荐信息发送到相应客户端。
[0007] 优选的,所述根据所述属性标识计算每两条所述历史访问信息的相似值,包括:按 照预设策略处理所述属性标识生成每条所述历史访问信息的特征信息;两两对比所述特征 信息,得到每两条所述特征信息的差量信息;按照预设规则计算所述差量信息得到每两条 所述历史访问信息的相似值。
[0008] 优选的,在按照预设策略处理所述属性标识生成每条所述历史访问信息的特征信 息之后,在两两对比所述特征信息,得到每两条所述特征信息的差量信息之前,还包括:采 集每条所述特征信息对应的历史访问信息的最后访问时间;按照所述最后访问时间为所述 特征信息添加权重,其中,所述权重随所述最后访问时间由旧到新顺次增大。
[0009] 优选的,所述按照预设策略处理所述属性标识生成每条所述历史访问信息的特征 信息,包括:读取所述属性标识所包含的属性值;按照预设条件配置每项所述属性值的权 重;使用预设特征模型计算所述配置有权重的属性值,得到所述属性标识对应的特征信息。
[0010]优选的,所述利用所述相似值确定待推荐信息,包括:确定目标属性标识,其中,所 述目标属性标识是属于同一账户的历史访问信息对应的属性标识;根据待选择属性标识与 所述目标属性标识的相似值计算每条所述待选择属性标识与所述目标属性标识的相似系 数;按照所述相似系数从大到小选择预设数量的所述待选择属性标识;将所选择的所述待 选择属性标识对应的历史访问信息确定为所述待推荐信息。
[0011]优选的,在获取预设时间段内的历史访问信息的属性标识之后,在根据所述属性 标识计算每两条所述历史访问信息的相似值之前,还包括:获取每条所述属性标识对应的 访问次数;当所述访问次数小于预设阈值时,删除所述属性标识。
[0012] 第二方面,本发明实施例还提供了一种信息推荐装置,包括:获取模块,用于获取 预设时间段内的历史访问信息的属性标识;计算模块,用于根据所述获取模块所获取的属 性标识计算每两条所述历史访问信息的相似值;确定模块,用于利用所述计算模块计算得 到的相似值确定待推荐信息;发送模块,用于将所述确定模块所确定的待推荐信息发送到 相应客户端。
[0013] 优选的,所述计算模块包括生成单元、对比单元和第一计算单元,其中,所述生成 单元,用于按照预设策略处理所述属性标识生成每条所述历史访问信息的特征信息;所述 对比单元,用于两两对比所述特征信息,得到每两条所述特征信息的差量信息;所述第一计 算单元,用于按照预设规则计算所述差量信息得到每两条所述历史访问信息的相似值。
[0014] 优选的,所述计算模块还包括采集单元和添加单元,其中,所述采集单元,用于采 集每条所述特征信息对应的历史访问信息的最后访问时间;所述添加单元,用于按照所述 最后访问时间为所述特征信息添加权重,其中,所述权重随所述最后访问时间由旧到新顺 次增大。
[0015] 优选的,所述生成单元包括读取子单元、配置子单元和计算子单元,其中,所述读 取子单元,用于读取所述属性标识所包含的属性值;所述配置子单元,用于按照预设条件配 置每项所述属性值的权重;所述计算子单元,用于使用预设特征模型计算所述配置有权重 的属性值,得到所述属性标识对应的特征信息。
[0016] 优选的,所述确定模块包括确定单元、第二计算单元和选择单元,其中,所述确定 单元,用于确定目标属性标识,其中,所述目标属性标识是属于同一账户的历史访问信息对 应的属性标识;所述第二计算单元,用于根据待选择属性标识与所述目标属性标识的相似 值计算每条所述待选择属性标识与所述目标属性标识的相似系数;所述选择单元,用于按 照所述相似系数从大到小选择预设数量的所述待选择属性标识;所述确定单元,还用于将 所选择的所述待选择属性标识对应的历史访问信息确定为所述待推荐信息。
[0017]优选的,还包括删除模块,其中,所述获取模块,还用于获取每条所述属性标识对 应的访问次数;所述删除模块,用于当所述获取模块所获取的访问次数小于预设阈值时,删 除所述属性标识。
[0018]由以上技术方案可知,为了解决相关技术的技术问题,本发明实施例所提供的信 息推荐方法及装置,首先获取预设时间段内的历史访问信息的属性标识,并根据属性标识 计算每两条所述历史访问信息的相似值,然后,本方案利用所得到的相似值确定待推荐信 息,并将所确定的待推荐信息发送到相应客户端,以向用户推荐该待推荐信息。很明显,本 发明实施例的技术方案,通过对历史访问信息的分析和比较得到历史访问信息之间相似 值,并进一步根据不同历史访问信息之间的相似值筛选出待推荐信息,与现有技术相比,本 方案根据历史访问信息本身的属性确定待推荐信息,不依赖于用户群对信息的评分,从而 不仅能够避免评分数量对推荐过程的影响,而且能够提高所推荐的信息的准确性,提高用 户体验。
【附图说明】
[0019] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施 例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获 得其他的附图。通过附图所示,本发明的上述及其它目的、特征和优势将更加清晰。在全部 附图中相同的附图标记指示相同的部分。并未刻意按实际尺寸等比例缩放绘制附图,重点 在于示出本发明的主旨。
[0020] 图1为本发明实施例提供的信息推荐方法的方法流程图;
[0021 ]图2为本发明实施例提供的信息推荐装置的结构示意图。
【具体实施方式】
[0022]其中,相关技术中,用户群对信息的评分可以反映用户的使用感受,对信息的兴趣 度等,因此,信息的评分数量越多,所反映的用户兴趣度越准确,如果信息的评分数量足够 多,可以通过评分得到用户的兴趣度,从而可以向用户推荐与之兴趣相似的信息。由此可 见,信息的评分数量对所推荐信息的准确性影响很大,为了避免评分数量不足对所推荐信 息准确性的影响,提出了本发明实施例的技术方案。
[0023]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0024]下面对本发明实施例的具体实施方法进行描述,请参见图1,图1为本发明实施例 提供的信息推荐方法的方法流程图,所述方法包括以下步骤:
[0025]步骤S101:获取预设时间段内的历史访问信息的属性标识。
[0026]其中,由于推荐系统向用户推荐信息时,需要从用户群的历史访问信息筛选信息, 而用户群的历史访问信息数据量庞大,将会导致更大的计算量,且用户的兴趣通常会随着 时间推移发生变化。因此,为了在降低数据处理量的基础上,准确的分析用户当前的兴趣, 推荐系统可以只从各个客户端获取预设时间段内的历史访问信息。需要说明的是,该预设 时间段是以当前时间为最新时间,向前顺延的时间长度。具体的,预设时间段可以是1个月 至6个月,可以根据信息的类型进行不同设定,本发明实施例对此不做限制。
[0027]需要指出的是,作为数据处理系统,推荐系统所处理的为系统能够识别的信息数 据,而客户端的历史访问信息为用户能够识别的信息,推荐系统无法识别,因此,推荐系统 可以从客户端获取历史访问信息的属性标识,以便于后续处理。其中,属性标识可以为历史 访问信息的属性值集合,包括历史访问信息的信息名称、作者、所属类型等属性值。
[0028] 为了便于管理,推荐系统可以按照用户账户将所获取的属性标识分别存储,例如, 对应每个用户账户可以设置一个文档,而与该账户对应的属性标识作为该文档的一个词语 或者段落对应存储。
[0029] 此外,如果某一用户在预设时间段内的历史访问信息数量相对较少,根据该用户 的历史访问信息可能无法分析得到该用户的兴趣度,因此,可以随机的向该用户推荐信息, 无须分析该用户的历史访问信息,因此,当用户的历史访问信息数量小于预设数量时,推荐 系统可以删除该用户对应的信息。
[0030] 类似的,由于历史访问信息中访问次数较少的信息无法反应用户的兴趣度,因此, 推荐系统在获取历史访问信息的属性标识之后,可以获取每条属性标识对应的访问次数, 如果访问次数小于预设阈值,则删除该属性标识,从而不仅能够降低推荐系统的数据处理 量,而且能够提高推荐信息的准确性。
[0031] 当然,上述仅为本发明的一个优选示例,根据信息的类型不同,如果属性标识对应 的访问时长相对较短时,该属性标识对应的历史访问信息同样无法反应用户的兴趣度,因 此,推荐系统可以读取属性标识对应的访问时长,如果访问时长小于一定值时,删除该属性 标识,本发明实施例此处不再详述。
[0032]需要说明的是,上述预设数量和预设阈值可以根据信息的类型进行具体设定,本 发明实施例对此不做限制。
[0033] 例如,在向用户推荐歌曲之前,推荐系统可以从各个客户端获取至今三个月内所 听歌曲对应的歌曲ID,其中,歌曲ID即为歌曲的属性标识,包括歌曲的名字、歌手、链接地 址、大小、唱片集和年代流派等属性值,并对应每个用户账号分别创建文档,将歌曲ID作为 文档的词语分别存储到其所属的账号所述的文档中。其中,在获取歌曲ID的过程中,可以对 应读取用户收听该歌曲的次数,或者每次收听的时长,如果收听该歌曲的次数相对较少,或 者每次收听时长较短时,删除该歌曲对应的歌曲ID。
[0034] 步骤S102:根据所述属性标识计算每两条所述历史访问信息的相似值。
[0035] 其中,基于上述描述可知,属性标识包括历史访问信息的属性值,而且属性值按照 一定的序列存储,当推荐系统获取属性标识之后,可以按照预设策略计算属性标识的属性 值,从而得到每条历史访问信息的特征信息,比对任意两条特征信息能够得到该两条特征 信息的差量信息,通过对差量信息的计算得到该两条特征信息所对应的历史访问信息的相 似值。
[0036] 具体的,根据上述描述可知,属性标识以词语或者段落的形式存储,而每个词语均 表示出特定的语境,而表示不同语境的词语均可以通过向量表示,因此,本实施例的技术方 案,可以通过计算属性标识中词语的向量,得到属性标识的特征信息,所以,在本实施例中, 还可以将计算属性标识的特征信息称作属性标识的特征向量。其中,计算属性标识特征向 量的算法可以是word2vec,word2vec提供特征向量的算法模型,在计算时,将属性标识中的 每个属性值代入特征向量的算法模型中,便能够得到属性标识的特征向量。
[0037]需要说明的是,在计算属性标识的特征向量时,可以得到历史访问信息的综合特 征向量,也可以根据需求计算得到突出某个属性的特征向量。例如,计算歌曲的综合特征向 量时,可以为歌曲ID中的各个属性值配置相同的权重,比如,全部设置为1,那么所得到的特 征向量为歌曲的综合特征向量。为了扩大特征向量的维度,从而实现以任意一个属性值为 重点筛选待推荐信息,本发明实施例还可以通过调整属性值的权重,突出想要体现的属性 值。例如,如果想要在特征向量中突出歌曲的词作者,并在后续筛选待推荐信息时,得到相 同词作者的歌曲,那么,在为各个属性值配置权重时,可以将词作者对应属性值的权重配置 的相对较大,比如,其他属性值的权重配置为1,而词作者对应的属性值的权重配置为5,从 而使得词作者对所得到的特征向量影响较大,所得到的特征向量中词作者的影响也比较突 出。
[0038] 由此可见,本发明实施例的技术方案在计算特征向量时,可以从多个维度进行计 算,不仅能够从多个角度计算信息之间的相似性,进一步的,还能够以多个属性值为重点筛 选待推荐信息,使待推荐信息的分类更加全面,提高用户体验。
[0039] 相应的,在计算特征向量过程中突出某个属性值的影响时,可以为根据该特征向 量筛选的推荐信息设置标签,标签的名字与突出的属性值对应的信息相对应,例如,根据突 出词作者的特征向量筛选得到的推荐信息,可以将词作者的名字设置为标签。
[0040] 此外,需要说明的是,由于用户的兴趣可能随时间变化,距离当前时间越近的历史 访问信息越能够准确的反应用户的兴趣度,因此,为了能够进一步提高推荐信息的准确性, 本实施例可以按照历史访问信息的访问时间序列,为每条历史访问信息的特征向量设置权 重,其中,特征向量的权重随时间的持续逐渐增大。具体的,在计算得到特征向量之后,可以 采集每个特征向量对应的最后访问时间,并按照最后访问时间为特征向量添加权重,其中, 所添加的权重随最后访问时间由旧到新顺次增大。
[0041]例如,当推荐系统计算得到三个月内的歌曲ID的特征向量之后,采集每个特征向 量对应的歌曲的最后一次收听时间,并按照最后一次收听时间为歌曲ID对应的特征向量添 加权重。其中,可以将距离当前时间一周之内的特征向量的权重设置为10,在此基础上,之 前一周之内的特征向量的权重可以设置为8,依此类推,本发明实施例此处不再详述。
[0042] 基于上述描述可知,特征向量反应历史访问信息的属性特征,而特征向量本身包 括特征值和向量空间上方向两个量化因素,因此,可以通过特征值和方向两个量化因素对 比不同历史访问信息的属性,将不同历史访问信息的相似性进行量化,从而能够为推荐信 息的筛选提供数据支持。
[0043] 具体的,可以对比两个特征向量的角度,得到两个特征向量的角度差,然后,可以 通过计算两特征向量之间角度差的余弦值,该余弦值用于表示两个特征向量对应的历史访 问信息的相似度。
[0044] 例如,歌曲A对应的特征向量为A = (A1,A2,……,An),歌曲B对应的特征向量为B = (B1,B2,……,Bn),二者的角度差为Θ,那么,歌曲A与歌曲B的相似值为:
[0046]由此可见,余弦值越接近1表明夹角Θ越接近〇度,那么,歌曲A与歌曲B的特征向量 相似度越高,进一步的,说明歌曲A与歌曲B的相似度越高。
[0047 ]需要说明的是,上述计算特征向量相似值的方法为余弦相似度算法,而余弦相似 度算法仅为本发明的一个优选示例,本发明实施例还可以使用其他合适的算法计算特征向 量的相似值,本发明实施例对此不做限制。
[0048 ]本步骤的技术内容,首先,根据历史访问信息的属性标识计算得到历史访问信息 的特征信息,从而将历史访问信息的属性和内容量化,然后,根据量化的内容计算每两条历 史访问信息的相似度,从而能够顺利、准确的得到每两条历史访问信息的相似度,能够为筛 选推荐信息提供充分的技术准备。
[0049] 步骤S103:利用所述相似值确定待推荐信息。
[0050] 其中,在确定待推荐信息之前,可以先确定目标用户,基于目标用户的历史访问信 息进行信息推荐,在本实施例中,推荐系统可以将目标用户对应的属性标识确定为目标属 性标识,从而明确待推荐信息的目标用户。由于预设时间段内的历史访问信息数量庞大,而 且目标用户所使用的客户端的界面尺寸有限,因此,可以从目标属性标识以外的属性标识 中,选择与目标属性标识相似程度高的属性标识所对应的历史访问信息进行推荐。本实施 例中,将目标属性标识以外的属性标识称为待选择属性标识。
[0051 ]由于目标属性标识有多个,每个目标属性标识对应多个相似的待选择属性标识, 而不同目标属性标识的相似待选择属性标识部分相同,或者全部不同,即使两个目标属性 标识对应的相似待选择属性标识部分相同,同一个待选择属性标识与两个目标属性标识的 相似值也不相同。例如,歌曲A和歌曲B的属性标识为目标属性标识,其中,与歌曲A的属性标 识相似的待选择属性标识包括:歌曲1、歌曲2、歌曲3和歌曲4的属性标识,而与歌曲B的属性 标识相似的待选择属性标识包括:歌曲2、歌曲4和歌曲5的属性标识。其中,歌曲2的属性标 识与歌曲A的属性标识的相似值为0.8,与歌曲B的属性标识的相似值为0.6;歌曲4的属性标 识与歌曲A的属性标识的相似值为0.5,与歌曲B的属性标识的相似值为0.7。
[0052] 由此可见,仅仅根据目标属性标识与待选择属性标识的相似值,无法得到待选择 属性标识与全部目标属性标识的相似程度,从而无法按照相似程度选择待推荐信息,因此, 本实施例进一步的,可以根据目标属性标识与待选择属性标识的相似值,计算得到每个待 选择属性标识与全部目标属性标识的相似系数。
[0053] 具体的,在确定目标属性标识之后,可以分别计算每个待选择属性标识与全部目 标属性标识的相似系数,计算得到的相似系数越大,表明该待选择属性标识与全部目标属 性标识的相似度越高,从而可以按照相似系数从大到小的次序,选择预设数量的待选择属 性标识,并将所选择的待选择属性标识对应的历史访问信息确定为待推荐信息。具体算法 参见下述公式:
[0055] 其中,u表示目标用户,i表示待选择属性标识,J表示目标属性标识集合,j表示目 标属性标识,sim( i,j)表示待选择属性标识i与目标属性标识j的相似值,r(u,i)表示待选 择属性标识i与目标属性标识集合J的相似系数。
[0056] 需要指出的是,所确定的待推荐信息的数量可以根据待推荐信息的类型具体确 定,例如,如果待推荐信息是歌曲,所确定的待推荐信息的数量可以是20到80,如果待推荐 信息是视频,所确定的待推荐信息的数量可以是10到30,本发明实施例对此不做限制。
[0057] 由本步骤的描述可知,计算得到每个待选择属性标识的相似系数,能够为精确的 筛选推荐信息提供可靠的技术数据,在不依赖于信息评分的情况下实现信息推荐,从而不 受信息评分的限制。
[0058] 步骤S104:将所述待推荐信息发送到相应客户端。
[0059] 其中,在上述描述的基础上,推荐系统将所确定的待推荐信息发送到目标用户对 应的客户端,客户端在接收到待推荐信息之后,可以在界面展示待推荐信息,以向目标用户 推荐相关信息。
[0060] 需要说明的是,推荐系统可以以信息组的形式将待推荐信息发送到客户端,每个 信息组设置一个标签,该标签为该组信息的特征表示,例如,推荐歌曲时,如果按照词作者 和歌曲年代等分别筛选得到待推荐歌曲,在发送时,可以将词作者相同的待推荐歌曲作为 一组,并将词作者作为该组歌曲的标签;将歌曲年代相类似的待推荐歌曲作为一组,并将歌 曲年代作为该组的标签,发送到客户端。客户端在接收到待推荐歌曲后,同样可以按照歌曲 组进行展示。
[0061] 此外,客户端可以是手机、平板电脑或者台式电脑等,本发明实施例此处不做限 制。
[0062] 综合上述,本发明实施例所提供的信息推荐方法,通过对历史访问信息的分析和 比较得到历史访问信息之间相似值,并进一步根据不同历史访问信息之间的相似值筛选出 待推荐信息,与现有技术相比,本方案根据历史访问信息本身的属性确定待推荐信息,不依 赖于用户群对信息的评分,从而不仅能够避免评分数量对推荐过程的影响,而且能够提高 所推荐的信息的准确性,提高用户体验。
[0063] 与上述实现方法相对应的,本发明实施例还提供了一种信息推荐装置,请参见图 2,图2为本发明实施例提供的信息推荐装置的结构示意图。
[0064]所述装置包括:获取模块11、计算模块12、确定模块13和发送模块14,其中,获取模 块11,用于获取预设时间段内的历史访问信息的属性标识;计算模块12,用于根据所述获取 模块11所获取的属性标识计算每两条所述历史访问信息的相似值;确定模块13,用于利用 所述计算模块12计算得到的相似值确定待推荐信息;发送模块14,用于将所述确定模块13 所确定的待推荐信息发送到相应客户端。
[0065]基于该实施例的描述,所述装置还包括删除模块,其中,在本实施例中,获取模块 11,还用于获取每条所述属性标识对应的访问次数;所述删除模块,用于当所述获取模块11 所获取的访问次数小于预设阈值时,删除所述属性标识。
[0066]在上述实施例的基础上,所述计算模块12具体包括生成单元、对比单元和第一计 算单元,其中,生成单元,用于按照预设策略处理所述属性标识生成每条所述历史访问信息 的特征信息;对比单元,用于两两对比所述特征信息,得到每两条所述特征信息的差量信 息;第一计算单元,用于按照预设规则计算所述差量信息得到每两条所述历史访问信息的 相似值。
[0067]在一个具体实施例中,所述生成单元可以包括读取子单元、配置子单元和计算子 单元,其中,所述读取子单元,用于读取所述属性标识所包含的属性值;所述配置子单元,用 于按照预设条件配置每项所述属性值的权重;所述计算子单元,用于使用预设特征模型计 算所述配置有权重的属性值,得到所述属性标识对应的特征信息。
[0068]基于上述实施例,在另一个实施例中,所述计算模块12还包括采集单元和添加单 元,其中,所述采集单元,用于采集每条所述特征信息对应的历史访问信息的最后访问时 间;所述添加单元,用于按照所述最后访问时间为所述特征信息添加权重,其中,所述权重 随所述最后访问时间由旧到新顺次增大。
[0069] 此外,确定模块13包括确定单元、第二计算单元和选择单元,其中,所述确定单元, 用于确定目标属性标识,其中,所述目标属性标识是属于同一账户的历史访问信息对应的 属性标识;所述第二计算单元,用于根据待选择属性标识与所述目标属性标识的相似值计 算每条所述待选择属性标识与所述目标属性标识的相似系数;所述选择单元,用于按照所 述相似系数从大到小选择预设数量的所述待选择属性标识;在本实施例中,所述确定单元, 还用于将所选择的所述待选择属性标识对应的历史访问信息确定为所述待推荐信息。
[0070] 所述装置中各个模块和单元的功能和作用的实现过程详见上述方法中对应的实 现过程,在此不再赘述。
[0071] 综合上述,为了解决相关技术的技术问题,本发明实施例所提供的信息推荐方法 及装置,首先获取预设时间段内的历史访问信息的属性标识,并根据属性标识计算每两条 所述历史访问信息的相似值,然后,本方案利用所得到的相似值确定待推荐信息,并将所确 定的待推荐信息发送到相应客户端,以向用户推荐该待推荐信息。很明显,本发明实施例的 技术方案,通过对历史访问信息的分析和比较得到历史访问信息之间相似值,并进一步根 据不同历史访问信息之间的相似值筛选出待推荐信息,与现有技术相比,本方案根据历史 访问信息本身的属性确定待推荐信息,不依赖于用户群对信息的评分,从而不仅能够避免 评分数量对推荐过程的影响,而且能够提高所推荐的信息的准确性,提高用户体验。
[0072] 以上所述仅是本发明的【具体实施方式】,应当指出,对于本技术领域的普通技术人 员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应 视为本发明的保护范围。
【主权项】
1. 一种信息推荐方法,其特征在于,包括: 获取预设时间段内的历史访问信息的属性标识; 根据所述属性标识计算每两条所述历史访问信息的相似值; 利用所述相似值确定待推荐信息; 将所述待推荐信息发送到相应客户端。2. 如权利要求1所述的信息推荐方法,其特征在于,所述根据所述属性标识计算每两条 所述历史访问信息的相似值,包括: 按照预设策略处理所述属性标识生成每条所述历史访问信息的特征信息; 两两对比所述特征信息,得到每两条所述特征信息的差量信息; 按照预设规则计算所述差量信息得到每两条所述历史访问信息的相似值。3. 如权利要求2所述的信息推荐方法,其特征在于,在按照预设策略处理所述属性标识 生成每条所述历史访问信息的特征信息之后,在两两对比所述特征信息,得到每两条所述 特征信息的差量信息之前,还包括: 采集每条所述特征信息对应的历史访问信息的最后访问时间; 按照所述最后访问时间为所述特征信息添加权重,其中,所述权重随所述最后访问时 间由旧到新顺次增大。4. 如权利要求1至3中任一权项所述的信息推荐方法,其特征在于,所述按照预设策略 处理所述属性标识生成每条所述历史访问信息的特征信息,包括: 读取所述属性标识所包含的属性值; 按照预设条件配置每项所述属性值的权重; 使用预设特征模型计算所述配置有权重的属性值,得到所述属性标识对应的特征信 息。5. 如权利要求1所述的信息推荐方法,其特征在于,所述利用所述相似值确定待推荐信 息,包括: 确定目标属性标识,其中,所述目标属性标识是属于同一账户的历史访问信息对应的 属性标识; 根据待选择属性标识与所述目标属性标识的相似值计算每条所述待选择属性标识与 所述目标属性标识的相似系数; 按照所述相似系数从大到小选择预设数量的所述待选择属性标识; 将所选择的所述待选择属性标识对应的历史访问信息确定为所述待推荐信息。6. 如权利要求1所述的信息推荐方法,其特征在于,在获取预设时间段内的历史访问信 息的属性标识之后,在根据所述属性标识计算每两条所述历史访问信息的相似值之前,还 包括: 获取每条所述属性标识对应的访问次数; 当所述访问次数小于预设阈值时,删除所述属性标识。7. -种信息推荐装置,其特征在于,包括: 获取模块,用于获取预设时间段内的历史访问信息的属性标识; 计算模块,用于根据所述获取模块所获取的属性标识计算每两条所述历史访问信息的 相似值; 确定模块,用于利用所述计算模块计算得到的相似值确定待推荐信息; 发送模块,用于将所述确定模块所确定的待推荐信息发送到相应客户端。8. 如权利要求7所述的信息推荐装置,其特征在于,所述计算模块包括生成单元、对比 单元和第一计算单元,其中, 所述生成单元,用于按照预设策略处理所述属性标识生成每条所述历史访问信息的特 征信息; 所述对比单元,用于两两对比所述特征信息,得到每两条所述特征信息的差量信息; 所述第一计算单元,用于按照预设规则计算所述差量信息得到每两条所述历史访问信 息的相似值。9. 如权利要求8所述的信息推荐装置,其特征在于,所述计算模块还包括采集单元和添 加单元,其中, 所述采集单元,用于采集每条所述特征信息对应的历史访问信息的最后访问时间; 所述添加单元,用于按照所述最后访问时间为所述特征信息添加权重,其中,所述权重 随所述最后访问时间由旧到新顺次增大。10. 如权利要求8所述的信息推荐装置,其特征在于,所述生成单元包括读取子单元、配 置子单元和计算子单元,其中, 所述读取子单元,用于读取所述属性标识所包含的属性值; 所述配置子单元,用于按照预设条件配置每项所述属性值的权重; 所述计算子单元,用于使用预设特征模型计算所述配置有权重的属性值,得到所述属 性标识对应的特征信息。11. 如权利要求7所述的信息推荐装置,其特征在于,所述确定模块包括确定单元、第二 计算单元和选择单元,其中, 所述确定单元,用于确定目标属性标识,其中,所述目标属性标识是属于同一账户的历 史访问信息对应的属性标识; 所述第二计算单元,用于根据待选择属性标识与所述目标属性标识的相似值计算每条 所述待选择属性标识与所述目标属性标识的相似系数; 所述选择单元,用于按照所述相似系数从大到小选择预设数量的所述待选择属性标 识; 所述确定单元,还用于将所选择的所述待选择属性标识对应的历史访问信息确定为所 述待推荐信息。12. 如权利要求7所述的信息推荐装置,其特征在于,还包括删除模块,其中, 所述获取模块,还用于获取每条所述属性标识对应的访问次数; 所述删除模块,用于当所述获取模块所获取的访问次数小于预设阈值时,删除所述属 性标识。
【文档编号】G06F17/30GK105868254SQ201510994503
【公开日】2016年8月17日
【申请日】2015年12月25日
【发明人】刘恋
【申请人】乐视网信息技术(北京)股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1