信息推荐方法、装置、计算机设备及存储介质与流程

文档序号:18943980发布日期:2019-10-23 01:23阅读:180来源:国知局
信息推荐方法、装置、计算机设备及存储介质与流程

本发明涉及互联网技术领域,尤其涉及一种信息推荐方法、装置、计算机设备及存储介质。



背景技术:

为了提高广告推荐的准确性以及针对性,出现了各种各样的信息推荐方法,传统上,通常是利用了用户的广告行为数据,也就是用户是否有对某个广告进行点击方式,得到用户的喜好广告类型,从而向该用户推荐相关类型的应用,起到广告的目的。但是,上述方式中,用户的广告重叠度较低,其广告行为数据进行推荐的方式比较稀疏,使得最后的信息推荐不具备针对性。



技术实现要素:

本发明实施例提供一种信息推荐方法、装置、计算机设备及存储介质,用于提高推荐信息的推荐的针对性。

本发明第一方面提供了一种信息推荐方法,包括:

获取用户针对所有第一应用的行为数据,所述行为数据包括搜索数据、点击数据和安装数据;

根据所述用户针对所有第一应用的搜索数据、点击数据和安装数据,计算所述用户对各个第一应用的兴趣度;

根据所述用户对各个第一应用的兴趣度确定各个第一应用对所述用户的用户特征的贡献度;

根据各个第一应用对应的应用描述文本,确定各个第一应用对应的tf-idf向量;

根据各个第一应用对应的tf-idf向量以及各个第一应用对所述用户的用户特征的贡献度确定所述用户的特征向量;

根据tf-idf向量以及各个第一应用对所述用户的用户特征的贡献度确定所述用户的特征向量;

根据所述用户的特征向量对所述用户进行聚类,得到用户分组;

计算所述用户分组中目标用户与其他用户之间的相似度,目标用户为所述用户分组中的任意一个用户,所述其他用户为所述用户分组中除所述目标用户外的其他用户;

根据用户分组内目标用户与其他用户之间的相似度,以及其他用户对第二应用的兴趣度,确定出所述目标用户对所述第二应用的兴趣度,所述第二应用为所述目标用户未发生过相关行为且所述其他用户发生过相关行为的应用;

根据所述目标用户对所述第二应用的兴趣度确定所述待推荐应用;

根据所述待推荐应用生成推荐信息并向所述目标用户推荐所述推荐信息。

可选地,所述根据用户分组内目标用户与其他用户之间的相似度,以及其他用户对第二应用的兴趣度,确定出所述目标用户对第二应用的兴趣度,包括:

通过如下公式确定出所述目标用户对第二应用的兴趣度:

其中,a表示目标用户,b表示其他用户,u表示所述用户分组内的所有用户,i表示第二应用,所述ra,i表示目标用户对第二应用i的兴趣度,sa,b表示目标用户a与其他用户b之间的相似度,rb,i表示其他用户对所述第二应用i的兴趣度。

可选地,所述根据所述用户针对所有第一应用的搜索数据、点击数据和安装数据,计算所述用户对各个第一应用的兴趣度,包括:

根据所述用户针对所有第一应用的搜索数据,确定所述用户对各个第一应用的搜索率;

根据所述用户针对所有第一应用的点击数据,确定所述用户对各个第一应用的点击率;

根据所述用户针对所有第一应用的安装数据,确定所述用户对各个第一应用的安装率;

根据所述用户对各个第一应用的搜索率、点击率和安装率对应计算所述用户对各个第一应用的兴趣度。

可选地,所述根据所述用户对各个第一应用的搜索率、点击率和安装率对应计算所述用户对各个第一应用的兴趣度,包括:

通过以下公式对应计算所述用户对各个第一应用的兴趣度:

ru,j=α×cu,j+β×su,j+γ×au,j;

其中,所述ru,j表示所述用户u对第一应用j的兴趣度,cu,i表示所述用户对第一应用j的点击率,所述α表示所述用户对第一应用j的点击率所对应的权重系数,su,j表示所述用户对第一应用j的搜索率,β表示所述用户对对第一应用j的搜索率所对应的权重系数,au,j表示所述用户对第一应用j的安装率,γ表示所述用户对第一应用j的安装率所对应的权重系数。

可选地,所述根据各个第一应用对应的tf-idf向量以及各个第一应用对所述用户的用户特征的贡献度确定所述用户的特征向量,包括:

将各个第一应用对应的tf-idf向量与各个第一应用对所述用户的用户特征的贡献度进行加权求和,得到所述用户的特征向量。

可选地,所述根据所述用户对各个第一应用的所述兴趣度确定各个第一应用对所述用户的用户特征的贡献度,包括:

根据所述用户对各个第一应用的兴趣度确定出兴趣度之和;

确定所述用户对各个第一应用的兴趣度与兴趣度之和的比值;

将所述用户对各个第一应用的兴趣度与兴趣度之和的比值,作为各个第一应用对所述用户的用户特征的贡献度。

本发明第二方面提供了一种信息推荐装置,包括:

获取模块,用于获取用户针对所有第一应用的行为数据,所述行为数据包括搜索数据、点击数据和安装数据;

第一计算模块,用于根据所述用户针对所有第一应用的搜索数据、点击数据和安装数据,计算所述用户对各个第一应用的兴趣度;

第二计算模块,用于根据所述用户对各个第一应用的兴趣度确定各个第一应用对所述用户的用户特征的贡献度;

第二获取模块,用于获取各个第一应用对应的应用描述文本

第一确定模块,用于根据各个第一应用对应的应用描述文本,确定各个第一应用对应的tf-idf向量;

第二确定模块,用于根据各个第一应用对应的tf-idf向量以及各个第一应用对所述用户的用户特征的贡献度确定所述用户的特征向量;

聚类模块,用于根据所述用户的特征向量对所述用户进行聚类,得到用户分组;

第三计算模块,用于计算所述用户分组中目标用户与其他用户之间的相似度,目标用户为所述用户分组中的任意一个用户,所述其他用户为所述用户分组中除所述目标用户外的其他用户;

第三确定模块,用于根据用户分组内目标用户与其他用户之间的相似度,以及其他用户对第二应用的兴趣度,确定出所述目标用户对所述第二应用的兴趣度,所述第二应用为所述目标用户未发生过相关行为且所述其他用户发生过相关行为的应用;

第四确定模块,用于根据所述目标用户对所述第二应用的兴趣度确定所述待推荐应用;

推荐模块,用于根据所述待推荐应用生成推荐信息并向所述目标用户推荐所述推荐信息。

可选地,所述第三确定模块,具体用于:

通过如下公式确定出所述目标用户对第二应用的兴趣度:

其中,a表示目标用户,b表示其他用户,u表示所述用户分组内的所有用户,i表示第二应用,所述ra,i表示目标用户对第二应用i的兴趣度,sa,b表示目标用户a与其他用户b之间的相似度,rb,i表示其他用户对所述第二应用i的兴趣度。

可选地,第一计算模块具体用于:

根据所述用户针对所有第一应用的搜索数据,确定所述用户对各个第一应用的搜索率;

根据所述用户针对所有第一应用的点击数据,确定所述用户对各个第一应用的点击率;

根据所述用户针对所有第一应用的安装数据,确定所述用户对各个第一应用的安装率;

根据所述用户对各个第一应用的搜索率、点击率和安装率对应计算所述用户对各个第一应用的兴趣度。

可选地,第一计算模块用于根据所述用户对各个第一应用的搜索率、点击率和安装率对应确定所述用户对各个第一应用的兴趣度,具体包括:

第一计算模块用于:

通过以下公式对应计算所述用户对各个第一应用的兴趣度:

ru,j=α×cu,j+β×su,j+γ×au,j;

其中,所述ru,j表示所述用户u对第一应用j的兴趣度,cu,i表示所述用户对第一应用j的点击率,所述α表示所述用户对第一应用j的点击率所对应的权重系数,su,j表示所述用户对第一应用j的搜索率,β表示所述用户对对第一应用j的搜索率所对应的权重系数,au,j表示所述用户对第一应用j的安装率,γ表示所述用户对第一应用j的安装率所对应的权重系数。

可选地,第二确定模块具体用于:

将所述tf-idf向量乘于各个第一应用对所述用户的用户特征的贡献度得到目标特征向量;

将所述目标特征向量中tf-idf值大于预设阈值的维度作为所述用户的特征向量。

可选地,第二计算模块具体用于:

根据所述用户对各个第一应用的兴趣度确定出兴趣度之和;

确定所述用户对各个第一应用的兴趣度与兴趣度之和的比值;

将所述用户对各个第一应用的兴趣度与兴趣度之和的比值,作为各个第一应用对所述用户的用户特征的贡献度。

本发明第三方面提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述信息推荐方法的步骤。

本发明第四方面一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述信息推荐方法的步骤。

上述信息推荐方法、装置、计算机设备及存储介质所实现的方案中,不仅采用了针对用户的点击数据和安装数据,还利用了用户针对应用的搜索数据,增加了能反应用户特征的数据维度,可弥补行为数据的稀疏性,提高了最后信息推荐的针对性。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一实施例中信息推荐方法的一个系统框架示意图;

图2是本发明一实施例中信息推荐方法的一流程示意图;

图3是本发明一实施例中信息推荐装置的一个结构示意图;

图4是本发明一实施例中计算机设备的一结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供的信息推荐方法,可应用在如图1的系统框架示意图,上述广告投放系统可应用任意一种应用app中,主要是针对输入法app的应用场景中,上述应用app安装在终端设备中,其中该终端设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,这里不做限定。终端设备可以获取搜索数据、点击数据和安装数据,从而通过上述各个维度的数据进行相关数据处理,最后获得待推荐应用并根据待推荐应用生成推荐信息,并在应用app中向用户推荐,下面对本方案进行详细的描述。

在一实施例中,如图2所示,提供一种信息推荐方法,包括如下步骤:

s10:获取用户针对所有第一应用的行为数据,所述行为数据包括搜索数据、点击数据和安装数据。

其中,第一应用泛指用户存在相关行为的应用,上述相关行为包括搜索行为、点击行为和/或安装行为,针对上述每一种行为,都对应有相关的行为数据,例如针对该第一应用的搜索数据、点击数据和安装数据,上述行为数据包括来了各种各样的记录信息,例如搜索数据,该搜索数据可以包含了用户在哪个时间节点对哪个第一应用进行搜索过,以及该第一应用的应用名称、应用描述短语等。在本发明实施例中,需先获取用户存在行为的所有第一应用的行为数据。需要说明的是,本发明所提供的信息推荐方法可应用于各种应用场景中,如在各种各样的应用app上利用推荐信息进行展示推荐,从而起到广告的作用。以一个实际的应用场景为例,设最后的推荐信息是在输入法app上展示并推荐的,则本发明中可获取上述输入法app的应用商店的搜索数据,以及用户通过在输入法app上展示的第一应用进行点击或安装所产生的安装数据、点击数据。

s20:根据所述用户针对所有第一应用的搜索数据、点击数据和安装数据,计算所述用户对各个第一应用的兴趣度。

在获取到用户针对所有第一应用的行为数据(搜索数据、点击数据和安装数据)之后,根据用户针对所有第一应用的搜索数据、点击数据和安装数据,计算所述用户对各个第一应用的兴趣度。也就是说,对于用户发生过上述相关行为的第一应用,都可以计算出用户对该第一用户的兴趣度。用户对第一应用的兴趣度表征了用户对第一应用的兴趣程度。

s30:根据所述用户对各个第一应用的兴趣度确定各个第一应用对所述用户的用户特征的贡献度。

在根据用户针对所有第一应用的搜索数据、点击数据和安装数据,计算所述用户对各个第一应用的兴趣度之后,根据用户对各个第一应用的所述兴趣度确定各个第一应用对所述用户的用户特征的贡献度。可以理解的是,用户对各个第一应用的兴趣度在一定程度上反映了用户的特征,因此,本发明实施例中,利用用户对各个第一应用的所述兴趣度计算各个第一应用对用户的用户特征的贡献度。

s40:获取各个第一应用对应的应用描述文本。

在本发明实施例中,需要获取各个第一应用对应的应用描述文本,可以理解的是,应用商店中,应用的应用描述信息一般包括应用名称和应用描述,因此,可以利用爬虫技术从应用商店中爬取到各个第一应用的应用描述短语,最后得到各个第一应用对应的应用描述短语,该应用描述短语包括了第一应用的规范性应用描述,最后根据各个第一应用的应用描述短语生成各个第一应用对应的应用描述文本。

在实际应用中,为了确定行为数据的可用性,可选地,会对所爬取的数据进行一定的清洗和处理,例如上述清洗和处理包括缩写还原,前缀词扩写,模糊匹配等处理,从而得到各个第一应用规范的应用描述短语。具体地,可将通过编辑距离计算的相似度大于一定阈值的应用描述短语作为第一应用的应用描述短语;或者将应用描述短语长度大于一定阈值应用描述短语作为第一应用的应用描述短语,具体这里不做限定。

另外需要说明的是,步骤s40与前述步骤s10-s30并无时序限定。

s50:根据各个第一应用对应的应用描述文本,确定各个第一应用对应的tf-idf向量。

在得到各个第一应用对应的应用描述文本之后,可以获取各个应用描述文本对应的tf-idf向量,也就是说,一个第一应用会对应一条应用描述文本,一条应用描述文本对应一个tf-idf向量。

s60:根据各个第一应用对应的tf-idf向量以及各个第一应用对所述用户的用户特征的贡献度确定所述用户的特征向量。

在得到各个第一应用对应的tf-idf向量以及各个第一应用对所述用户的用户特征的贡献度之后,根据tf-idf向量以及各个第一应用对所述用户的用户特征的贡献度确定所述用户的特征向量。

举个例子,假设有第一应用1、第一应用2、第一应用3,第一应用1、2、3均为所述用户存在行为的应用,则可经过上述方式分别计算出第一应用1对用户的用户特征的贡献度、第一应用2对用户特征的贡献度和第一应用3对用户特征的贡献度;以及得到包含上述第一应用1、2和3对应的应用描述文本的tf-idf向量之后,可分别将第一应用1、2和3对应的tf-idf向量,和各个第一应用1、2和3对用户特征的贡献度确定出用户的特征向量。需要说明的是,上述例子在这里只是为了便于说明而进举例说明,实际上,在建立用户的特征向量时,会参照大量的第一应用的相关数据(贡献度、应用描述文本对应的tf-idf向量)构建用户的特征向量,这不展开描述。

s70:根据所述用户的特征向量对所述用户进行聚类,得到用户分组。

在得到所有用户的特征向量之后,可以根据所有用户的特征向量对所有用户进行聚类,得到用户分组。由于用户数量及其庞大,因此计算用户的之间的相似度将十分耗时,因此,本发明实施例中通过聚类的方式将用户进行分组,也即在计算出用户的特征向量后,通过特征向量对用户聚类分成多成用户小组的目的,可减少后续步骤中计算用户之间的相似度的工作量,在减少计算量的同时保证了推荐的准确性。

s80:计算所述用户分组中目标用户与其他用户之间的相似度,目标用户为所述用户分组中的任意一个用户,所述其他用户为所述用户分组中除所述目标用户外的其他用户。

s90:根据用户分组内目标用户与其他用户之间的相似度,以及其他用户对第二应用的兴趣度,确定出所述目标用户对所述第二应用的兴趣度,所述第二应用为所述目标用户未发生过相关行为且所述其他用户发生过相关行为的应用。

需要说明的是,第二应用为目标用户未发生过相关行为(点击、安装或搜索行为)的应用,所述第二应用为所述其他用户发生过相关行为(点击、安装或搜索)的应用。在根据所述用户的特征向量对所述用户进行聚类,得到用户分组之后,针对各个用户分组,可根据用户分组内目标用户与其他用户之间的相似度以及其他用户对第二应用的兴趣度确定出所述目标用户对所述第二应用的兴趣度。

s100:根据所述目标用户对所述第二应用的兴趣度确定所述待推荐应用。

也就是说,对于各个用户分组的每个用户(目标用户),可以确定出用户对于未发生过相关行为的第二应用的兴趣度,从而推测出用户有兴趣的待推荐应用。

具体地,在本发明实施例中,将目标用户对第二应用的兴趣度排在前n位的第二应用作为待推荐应用,具体这里不做限定,示例性的,将目标用户对所述第二应用的兴趣度排在前1位、2位或3位的第二应用作为待推荐应用。

也就是说对于用户分组内的所有用户,均可通过上述方式计算出目标用户对于没有未发生行为(点击、安装或搜索行为)的第二应用的兴趣度,并将兴趣度排在靠前的第二应用作为目标用户的推荐应用。可见,本发明实施例提出了一种具体计算某个用户对于未存在行为的应用的兴趣度,且在计算时,考虑了用户组内相似用户发生存在行为的应用的兴趣度,有助于提高计算出的待推荐应用的准确性。

s110:根据所述待推荐应用生成推荐信息并向所述目标用户推荐所述推荐信息。

在确定出待推荐应用后,根据所述待推荐应用生成推荐信息并向所述目标用户推荐所述推荐信息。这样,针对各个用户分组内每个用户,均可确定出所述待推荐应用生成推荐信息并进行对应的推荐。

可见,上述信息推荐方法所实现的方案中,不仅采用了针对用户的点击数据和安装数据,还利用了用户针对用户的搜索数据,增加了能反应用户特征的数据维度,可弥补行为数据的稀疏性,提高了最后信息推荐的针对性,另外,还利用了聚类分组的方式对用户进行聚类,该方法能够在保证准确性的基础上减少计算量。

可选地,步骤s90中,也即根据用户分组内目标用户与其他用户之间的相似度,以及其他用户对第一应用的兴趣度,确定出所述目标用户对第二应用的兴趣度,具体是指:

通过如下公式确定出所述目标用户对第二应用的兴趣度:

其中,a表示目标用户,b表示其他用户,u表示所述用户分组内的所有用户,i表示第二应用,所述ra,i表示目标用户对第二应用i的兴趣度,sa,b表示目标用户a与其他用户b之间的相似度,rb,i表示其他用户对所述第二应用i的兴趣度。

在实际应用中,可基于上述搜索数据、点击数据和安装数据建立用户-应用矩阵列表,上述用户-应用矩阵列表包含了用户以及该用户存在搜索行为、安装行为和/或点击行为的应用列表。最后基于上述用户-应用矩阵列表中确定出所述用户分组内其他对所述第二应用有过相关行为的用户,且上述用户-应用矩阵列表可在使用过程中不断优化、更新。最后,在根据用户分组内目标用户与其他用户之间的相似度,以及其他用户对第二应用的兴趣度,确定出目标用户对第二应用的兴趣度时,可以根据上述用户-应用矩阵列表,确定出目标用户未发生过相关行为且其他用户发生过相关行为的第二应用。

可选地,步骤s20中,也即所述根据所述用户针对所有第一应用的搜索数据、点击数据和安装数据,计算所述用户对各个第一应用的兴趣度,具体包括如下步骤:

s21:根据所述用户针对所有第一应用的搜索数据,确定所述用户对各个第一应用的搜索率。

s22:根据所述用户针对所有第一应用的点击数据,确定所述用户对各个第一应用的点击率。

s23:根据所述用户针对所有第一应用的安装数据,确定所述用户对各个第一应用的安装率。

s24:根据所述用户对各个第一应用的搜索率、点击率和安装率对应确定所述用户对各个第一应用的兴趣度。

对于步骤s21,可以理解,根据所述用户针对所有第一应用的搜索数据,确定所述用户对各个第一应用的搜索率,具体可以通过下述方式得到:根据用户针对所有第一应用的搜索数据,确定用户对各个第一应用的搜索次数,用户对于某个第一应用的搜索率,先计算用户对该第一应用的搜索次数与该用户对其他第一应用的搜索次数的和的比率,将通过搜索次数得到的比率作为用户对于某个第一应用的搜索率。

对于步骤s22,可以理解,根据所述用户针对所有第一应用的点击数据,确定所述用户对各个第一应用的点击率,具体可以通过下述方式得到:根据用户针对所有第一应用的点击数据,确定用户对各个第一应用的点击次数,用户对于某个第一应用的点击率,先计算用户对该第一应用的点击次数与该用户对其他第一应用的点击次数的和的比率,将通过点击次数所得到的比率作为用户对于某个第一应用的点击率。

对于步骤s23,可以理解,根据所述用户针对所有第一应用的安装数据,确定所述用户对各个第一应用的安装率,具体可以通过下述方式得到:根据用户针对所有第一应用的安装数据,确定用户对各个第一应用的安装次数,用户对于某个第一应用的安装率,先计算用户对该第一应用的安装次数与该用户对其他第一应用的安装次数的和的比率,将通过安装次数所得到的比率作为用户对于某个第一应用的搜索率。

可选地,步骤s24中,也即所述根据所述用户对各个第一应用的搜索率、点击率和安装率对应确定所述用户对各个第一应用的兴趣度,具体包括如下步骤:

通过以下公式对应确定所述用户对各个第一应用的兴趣度:

ru,j=α×cu,j+β×su,j+γ×au,j;

其中,所述ru,j表示所述用户u对第一应用j的兴趣度,cu,i表示所述用户对第一应用j的点击率,所述α表示所述用户对第一应用j的点击率所对应的权重系数,su,j表示所述用户对第一应用j的搜索率,β表示所述用户对第一应用j的搜索率所对应的权重系数,au,j表示所述用户对第一应用j的安装率,γ表示所述用户对第一应用j的安装率所对应的权重系数。

需要说明的是,在实际应用中,在计算用户对各个第一应用的兴趣度时,分别对点击率,安装率和搜索率的数据范围进行归一化处理,将点击率,安装率和搜索率统一到[0,1],使得数据范围相同。另外需要说明的是,其中α,β,γ分别为点击、搜索和安装这三种行为在用户对第一应用的兴趣度反映上的权重系数,可根据实际情况进行配置,这里不做具体限定。

可选地,步骤s60中,也即根据各个第一应用对应的tf-idf向量以及各个第一应用对所述用户的用户特征的贡献度确定所述用户的特征向量,具体是指:将各个第一应用对应的tf-idf向量与各个第一应用对所述用户的用户特征的贡献度进行加权求和,得到所述用户的特征向量。

可以理解,在得到各个第一应用对应的tf-idf向量,以及各个第一应用对用户的用户特征的贡献度后,将各个第一应用对应的tf-idf向量与各个第一应用对所述用户的用户特征的贡献度进行加权求和,得到所述用户的特征向量,也就是说,可以将各个第一应用对应的tf-idf向量对应乘于各个第一应用对用户的用户特征的贡献度,并进行求和,从而得到用户的目标特征向量,利用所有第一应用的tf-idf向量,和所有第一应用对用户的用户特征的贡献度来构建用户的特征向量。另外,预设阈值可以根据经验值进行设计,这里不做具体限定。

需要说明的是,根据长尾效应,越冷门的应用越能体现出用户的特征,为了体现个性化推荐,本方案需要降低那些流行热门的第一应用对用户特征向量的贡献度,可从整体用户的应用点击,搜索及安装量排名靠前的应用中得出热门应用,并适当降低这些热门应用对用户特征的贡献度,以提高待推荐应用的针对性。

可选地,步骤s30中,也即所述根据所述用户对各个第一应用的所述兴趣度确定各个第一应用对所述用户的用户特征的贡献度,具体包括如下步骤:

s31:根据所述用户对各个第一应用的兴趣度确定出兴趣度之和。

s32:确定所述用户对各个第一应用的兴趣度与兴趣度之和的比值。

s33:将所述用户对各个第一应用的兴趣度与兴趣度之和的比值,作为各个第一应用对所述用户的用户特征的贡献度。

对于步骤s31-s32,可以理解,在确定出用户对各个第一应用的兴趣度,可以确定出用户对各个第一应用的兴趣度之间的和得到兴趣度之和,并将用户对各个第一应用的兴趣度与兴趣度之和的比值,作为各个第一应用对所述用户的用户特征的贡献度。也即第一应用对用户的用户特征贡献度=用户对该第一应用的兴趣度/用户对所有第一应用的兴趣度之和。

可选地,在一些实施方式中,步骤s70中,也即根据所述用户的特征向量对所述用户进行聚类,得到用户分组,具体可采用lda主题模型的方式,根据所述用户的特征向量对所述用户进行聚类,得到用户分组,也可采用其他的聚类方式,本发明实施例不做具体限定。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

在一实施例中,提供一种信息推荐装置,该信息推荐装置与上述实施例中信息推荐方法一一对应。如图3所示,该信息推荐装置包括第一获取模块101、第一计算模块102、第二计算模块103、第二获取模块104,第一确定模块105、第二确定模块106、聚类模块107、第三计算模块108、第三确定模块109、第四确定模块110和推荐模块111。各功能模块详细说明如下:

获取模块101,用于获取用户针对所有第一应用的行为数据,所述行为数据包括搜索数据、点击数据和安装数据;

第一计算模块102,用于根据所述用户针对所有第一应用的搜索数据、点击数据和安装数据,计算所述用户对各个第一应用的兴趣度;

第二计算模块103,用于根据所述用户对各个第一应用的兴趣度确定各个第一应用对所述用户的用户特征的贡献度;

第二获取模块104,用于获取各个第一应用对应的应用描述文本

第一确定模块105,用于根据各个第一应用对应的应用描述文本,确定各个第一应用对应的tf-idf向量;

第二确定模块106,用于根据各个第一应用对应的tf-idf向量以及各个第一应用对所述用户的用户特征的贡献度确定所述用户的特征向量;

聚类模块107,用于根据所述用户的特征向量对所述用户进行聚类,得到用户分组;

第三计算模块108,用于计算所述用户分组中目标用户与其他用户之间的相似度,目标用户为所述用户分组中的任意一个用户,所述其他用户为所述用户分组中除所述目标用户外的其他用户;

第三确定模块109,用于根据用户分组内目标用户与其他用户之间的相似度,以及其他用户对第二应用的兴趣度,确定出所述目标用户对所述第二应用的兴趣度,所述第二应用为所述目标用户未发生过相关行为且所述其他用户发生过相关行为的应用;

第四确定模块110,用于根据所述目标用户对所述第二应用的兴趣度确定所述待推荐应用;

推荐模块111,用于根据所述待推荐应用生成推荐信息并向所述目标用户推荐所述推荐信息。

可选地,所述第三确定模块,具体用于:

通过如下公式确定出所述目标用户对第二应用的兴趣度:

其中,a表示目标用户,b表示其他用户,u表示所述用户分组内的所有用户,i表示第二应用,所述ra,i表示目标用户对第二应用i的兴趣度,sa,b表示目标用户a与其他用户b之间的相似度,rb,i表示其他用户对所述第二应用i的兴趣度。

可选地,第一计算模块具体用于:

根据所述用户针对所有第一应用的搜索数据,确定所述用户对各个第一应用的搜索率;

根据所述用户针对所有第一应用的点击数据,确定所述用户对各个第一应用的点击率;

根据所述用户针对所有第一应用的安装数据,确定所述用户对各个第一应用的安装率;

根据所述用户对各个第一应用的搜索率、点击率和安装率对应计算所述用户对各个第一应用的兴趣度。

可选地,第一计算模块用于根据所述用户对各个第一应用的搜索率、点击率和安装率对应确定所述用户对各个第一应用的兴趣度,具体包括:

第一计算模块用于:

通过以下公式对应计算所述用户对各个第一应用的兴趣度:

ru,j=α×cu,j+β×su,j+γ×au,j;

其中,所述ru,j表示所述用户u对第一应用j的兴趣度,cu,i表示所述用户对第一应用j的点击率,所述α表示所述用户对第一应用j的点击率所对应的权重系数,su,j表示所述用户对第一应用j的搜索率,β表示所述用户对对第一应用j的搜索率所对应的权重系数,au,j表示所述用户对第一应用j的安装率,γ表示所述用户对第一应用j的安装率所对应的权重系数。

可选地,第二确定模块具体用于:

将各个第一应用对应的tf-idf向量与各个第一应用对所述用户的用户特征的贡献度进行加权求和,得到所述用户的特征向量。

可选地,第二计算模块具体用于:

根据所述用户对各个第一应用的兴趣度确定出兴趣度之和;

确定所述用户对各个第一应用的兴趣度与兴趣度之和的比值;

将所述用户对各个第一应用的兴趣度与兴趣度之和的比值,作为各个第一应用对所述用户的用户特征的贡献度。

关于信息推荐装置的具体限定可以参见上文中对于信息推荐方法的限定,在此不再赘述。上述信息推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是上述终端设备,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器,例如与提供应用app的外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种信息推荐方法。

在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:

获取用户针对所有第一应用的行为数据,所述行为数据包括搜索数据、点击数据和安装数据;

根据所述用户针对所有第一应用的搜索数据、点击数据和安装数据,计算所述用户对各个第一应用的兴趣度;

根据所述用户对各个第一应用的兴趣度确定各个第一应用对所述用户的用户特征的贡献度;

获取各个第一应用对应的应用描述文本;

根据各个第一应用对应的应用描述文本,确定各个第一应用对应的tf-idf向量;

根据各个第一应用对应的tf-idf向量以及各个第一应用对所述用户的用户特征的贡献度确定所述用户的特征向量;

根据所述用户的特征向量对所述用户进行聚类,得到用户分组;

计算所述用户分组中目标用户与其他用户之间的相似度,目标用户为所述用户分组中的任意一个用户,所述其他用户为所述用户分组中除所述目标用户外的其他用户;

根据用户分组内目标用户与其他用户之间的相似度,以及其他用户对第二应用的兴趣度,确定出所述目标用户对所述第二应用的兴趣度,所述第二应用为所述目标用户未发生过相关行为且所述其他用户发生过相关行为的应用;

根据所述目标用户对所述第二应用的兴趣度确定所述待推荐应用;

根据所述待推荐应用生成推荐信息并向所述目标用户推荐所述推荐信息。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

获取用户针对所有第一应用的行为数据,所述行为数据包括搜索数据、点击数据和安装数据;

根据所述用户针对所有第一应用的搜索数据、点击数据和安装数据,计算所述用户对各个第一应用的兴趣度;

根据所述用户对各个第一应用的兴趣度确定各个第一应用对所述用户的用户特征的贡献度;

获取各个第一应用对应的应用描述文本;

根据各个第一应用对应的应用描述文本,确定各个第一应用对应的tf-idf向量;

根据各个第一应用对应的tf-idf向量以及各个第一应用对所述用户的用户特征的贡献度确定所述用户的特征向量;

根据所述用户的特征向量对所述用户进行聚类,得到用户分组;

计算所述用户分组中目标用户与其他用户之间的相似度,目标用户为所述用户分组中的任意一个用户,所述其他用户为所述用户分组中除所述目标用户外的其他用户;

根据用户分组内目标用户与其他用户之间的相似度,以及其他用户对第二应用的兴趣度,确定出所述目标用户对所述第二应用的兴趣度,所述第二应用为所述目标用户未发生过相关行为且所述其他用户发生过相关行为的应用;

根据所述目标用户对所述第二应用的兴趣度确定所述待推荐应用;

根据所述待推荐应用生成推荐信息并向所述目标用户推荐所述推荐信息。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1