基于用户点击行为来向用户推荐图书的方法和系统的制作方法

文档序号：9579379阅读：1386来源：国知局

基于用户点击行为来向用户推荐图书的方法和系统的制作方法
【技术领域】
[0001] 本发明涉及一种基于用户点击行为来向用户推荐图书的方法和系统，属于数据业务领域。
【背景技术】
[0002] 在移动阅读日益发展并为广大用户逐渐接受的当下，准确把握移动终端用户的阅读偏好、快速将符合用户喜好的信息以直线距离推送到用户面前显得尤为重要。而在图书推荐领域中，用户通常会从大量的推荐图书中选择点击符合其偏好的图书来浏览和阅读，因此，通过对用户的图书点击行为进行分析，可以有效预测出用户对图书的个性化偏好，从而向用户推荐符合其偏好的图书。
[0003] 专利申请CN201210436266. 1(申请名称：推荐网络信息的方法和系统，申请日： 2012-11-05,申请人：腾讯科技（深圳）有限公司）提供了一种推荐网络信息的方法和系统。所述方法包括：根据网络信息的点击次数对网络平台中的网络信息进行划分得到信息集合和对应的评级；对信息集合中的网络信息进行特征抽取得到浏览行为特征，并根据所述浏览行为特征训练得到所述信息集合对应的分类模型；将更新的网络信息输入分类模型得到所属的信息集合；根据所述更新的网络信息所属的信息集合对应的评级进行所述更新的网络信息的推荐。该技术方案主要根据网络信息的点击次数和浏览行为来向用户推荐网络信息，并不涉及到基于用户点击行为来实现用户对图书的个性化偏好预测。
[0004] 因此，如何基于用户对图书的点击行为来对用户的个性化图书偏好进行预测，从而提高推荐点击率和提升推荐效果，仍是一个未解决的技术问题。

【发明内容】

[0005] 有鉴于此，本发明的目的是提供一种基于用户点击行为来向用户推荐图书的方法和系统，能基于用户对图书的点击行为来对用户的个性化图书偏好进行预测，从而提高推荐点击率和提升推荐效果。
[0006]为了达到上述目的，本发明提供了一种基于用户点击行为来向用户推荐图书的方法，包括有：
[0007]步骤一、选取若干位用户构成样本用户集，并为样本用户集中每位用户选取多本其点击和未点击过的推荐图书；
[0008]步骤二、抽取样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值，然后根据用户和推荐图书之间的关联特征值训练生成logistic分类模型，所述 logistic分类模型训练所使用的输入数据是样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值，输出数据是用户点击推荐图书的概率；
[0009]步骤三、逐一将目标用户和新推荐图书之间的关联特征值输入logistic分类模型从而得到目标用户点击新推荐图书的概率，并根据所述概率向目标用户选择新推荐图书。
[0010] 为了达到上述目的，本发明还提供了一种基于用户点击行为来向用户推荐图书的系统，包括有：
[0011] 样本构建装置，用于选取若干位用户构成样本用户集，并为样本用户集中每位用户选取多本其点击和未点击过的推荐图书；
[0012] 分类模型训练装置，用于抽取样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值，然后根据用户和推荐图书之间的关联特征值训练生成logistic 分类模型，所述logistic分类模型训练所使用的输入数据是样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值，输出数据是用户点击推荐图书的概率；
[0013] 图书推荐装置，用于逐一将目标用户和新推荐图书之间的关联特征值输入 logistic分类模型从而得到目标用户点击新推荐图书的概率，并根据所述概率向目标用户选择新推荐图书。
[0014] 与现有技术相比，本发明的有益效果是：本发明可以根据用户对现有推荐图书的点击和未点击行为，训练生成logistic分类模型，然后通过logistic分类模型计算得到目标用户点击新推荐图书的概率，从而有效提高推荐点击率和提升推荐效果；通过用户相似图书历史行为、相似度等关联特征值的计算，可以对用户的个性化图书偏好进行更精准的分析和预测。
【附图说明】
[0015] 图1是本发明一种基于用户点击行为来向用户推荐图书的方法的流程图。
[0016] 图2是推荐图书的用户相似图书历史行为、用户相似图书和推荐图书的相似度的具体计算流程图。
[0017] 图3是本发明一种基于用户点击行为来向用户推荐图书的系统的组成结构示意图。
[0018] 图4是分类模型训练装置的组成结构示意图。
【具体实施方式】
[0019] 为使本发明的目的、技术方案和优点更加清楚，下面结合附图对本发明作进一步的详细描述。
[0020] 如图1所示，本发明一种基于用户点击行为来向用户推荐图书的方法，包括有：
[0021] 步骤一、选取若干位用户构成样本用户集，并为样本用户集中每位用户选取多本其点击和未点击过的推荐图书；
[0022] 步骤二、抽取样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值，然后根据用户和推荐图书之间的关联特征值训练生成logistic分类模型，所述 logistic分类模型训练所使用的输入数据是样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值，输出数据是用户点击推荐图书的概率；
[0023] 步骤三、逐一将目标用户和新推荐图书之间的关联特征值输入logistic分类模型从而得到目标用户点击新推荐图书的概率，并根据所述概率向目标用户选择新推荐图书。
[0024] 步骤一中，为样本用户集中每位用户选取多本其点击和未点击过的推荐图书，还可以进一步包括有：
[0025] 步骤11、选取用户最新日期的图书推荐列表，并将用户最新日期的图书推荐列表中用户点击过的推荐图书按照点击时间进行排序，从而为用户挑选出多本点击时间最近的推荐图书；
[0026] 步骤12、采用skip-above(即跳略法）方式，即从用户点击的item(即图书）位置以上的展现图书中随机选取多本用户未点击过的推荐图书。值得一提的是，步骤11和步骤 12中所选取的点击和未点击过的推荐图书数量相同时，本发明所取得的技术效果最佳。
[0027] 步骤二和步骤三中，用户和推荐图书之间的关联特征值可以是图书推荐次数、用户换单次数、推荐率、历史图书数量、推荐图书的作家是否是名家、用户名家偏好值、推荐图书是否含有用户喜欢的字眼、用户雅标题倾向率、推荐图书雅俗分类、推荐图书的用户相似图书历史行为、用户相似图书和推荐图书的相似度等。其中，图书推荐次数是向用户推荐图书的次数；用户换单次数是用户的图书推荐列表在一段时期内的变化次数；推荐率是图书推荐次数和换单次数的比值；历史图书数量是用户阅读过的图书数量；图书推荐次数、用户换单次数、推荐率、历史图书数量、推荐图书的作家是否是名家、用户名家偏好值、推荐图书是否含有用户喜欢的字眼、用户雅标题倾向率、推荐图书雅俗分类这些值可以从用户的阅读历史记录、以及推荐图书的属性库中获取。如图2所示，推荐图书的用户相似图书历史行为、用户相似图书和推荐图书的相似度的计算过程可以进一步如下：
[0028] 步骤A1、提取推荐图书的所有关键字，将推荐图书的所有关键字的个数记为η;图书网站编辑可从推荐图书中挑选若干具有代表性的词语作为每本推荐图书的关键字；
[0029] 步骤Α2、构建推荐图书的用户相似图书集，所述用户相似图书集初始化为空，然后从用户的阅读历史记录中提取一本用户阅读过的历史图书；
[0030] 步骤A3、统计提取的历史图书所包含的推荐图书的关键字或与关键字相似的词语个数k，并计算所述历史图书和推荐图书的相似度：= 1然后判断所述相似度是否大 1

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：廖建新;应文佳;李曲;王超芸;彭刚;
技术所有人：杭州东信北邮信息技术有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。