基于用户点击行为来向用户推荐图书的方法和系统的制作方法_3

文档序号:9579379阅读:来源:国知局
推荐图书。2. 根据权利要求1所述的方法,其特征在于,步骤一中,为样本用户集中每位用户选取 多本其点击和未点击过的推荐图书,进一步包括有: 步骤11、选取用户最新日期的图书推荐列表,并将用户最新日期的图书推荐列表中用 户点击过的推荐图书按照点击时间进行排序,从而为用户挑选出多本点击时间最近的推荐 图书; 步骤12、采用skip-above方式,即从用户点击的item位置以上的展现图书中随机选取 多本用户未点击过的推荐图书。3. 根据权利要求1所述的方法,其特征在于,步骤二和步骤三中,用户和推荐图书之间 的关联特征值包括但不限于:图书推荐次数、用户换单次数、推荐率、历史图书数量、推荐图 书的作家是否是名家、用户名家偏好值、推荐图书是否含有用户喜欢的字眼、用户雅标题倾 向率、推荐图书雅俗分类、推荐图书的用户相似图书历史行为、用户相似图书和推荐图书的 相似度。4. 根据权利要求1所述的方法,其特征在于,当用户和推荐图书之间的关联特征值 包括有推荐图书的用户相似图书历史行为、用户相似图书和推荐图书的相似度时,还包括 有: 步骤A1、提取推荐图书的所有关键字,将推荐图书的所有关键字的个数记为η; 步骤Α2、构建推荐图书的用户相似图书集,所述用户相似图书集初始化为空,然后从用 户的阅读历史记录中提取一本用户阅读过的历史图书; 步骤A3、统计提取的历史图书所包含的推荐图书的关键字或与关键字相似的词语个数 k,并计算所述历史图书和推荐图书的相似度:然后判断所述相似度是否大于相似度 阈值,如果是,则将所述历史图书作为相似图书保存到推荐图书的用户相似图书集中,然后 继续下一步;如果否,则继续下一步; 步骤A4、判断是否已从用户的阅读历史记录中提取完所有用户阅读过的历史图书,如 果是,则继续下一步;如果否,则继续从用户的阅读历史记录中提取下一本用户阅读过的历 史图书,然后转向步骤A3; 步骤A5、从用户的阅读历史记录中读取用户相似图书集中所有相似图书对应的用户历 史行为和阅读时间,并按照阅读时间、和用户历史行为的优先级对所有相似图书进行排序, 最后从用户相似图书集中挑选出一本阅读时间最近、且用户历史行为的优先级最高的相似 图书,所挑选出的相似图书对应的用户历史行为即是推荐图书的用户相似图书历史行为, 所挑选出的相似图书和推荐图书的相似度即是用户相似图书和推荐图书的相似度。5. 根据权利要求4所述的方法,其特征在于,图书对应的用户历史行为包括有:浏览、 开始阅读、深度长期阅读、弃读,且将用户历史行为按优先级从高到低的次序进行排序为: 浏览〉开始阅读〉深度长期阅读〉弃读。6. 根据权利要求1所述的方法,其特征在于,步骤二中,对于logistic分类模型所使用 的训练样本来说,输出数据是样本用户集中每位用户点击推荐图书概率,其值为1或〇,即 当推荐图书是用户点击过的推荐图书时,其值为1 ;当推荐图书是用户未点击过的推荐图 书时,其值为〇,步骤三中,进一步包括有: 判断目标用户点击新推荐图书的概率是否大于或等于点击概率阈值,如果是,则将所 述新推荐图书写入用户的图书推荐列表中。7. -种基于用户点击行为来向用户推荐图书的系统,其特征在于,包括有: 样本构建装置,用于选取若干位用户构成样本用户集,并为样本用户集中每位用户选 取多本其点击和未点击过的推荐图书; 分类模型训练装置,用于抽取样本用户集中每位用户和其点击、未点击过的推荐图书 之间的关联特征值,然后根据用户和推荐图书之间的关联特征值训练生成logistic分类 模型,所述logistic分类模型训练所使用的输入数据是样本用户集中每位用户和其点击、 未点击过的推荐图书之间的关联特征值,输出数据是用户点击推荐图书的概率; 图书推荐装置,用于逐一将目标用户和新推荐图书之间的关联特征值输入logistic 分类模型从而得到目标用户点击新推荐图书的概率,并根据所述概率向目标用户选择新推 荐图书。8. 根据权利要求7所述的系统,其特征在于,样本构建装置进一步包括有: 点击图书选取单元,用于选取用户最新日期的图书推荐列表,并将用户最新日期的图 书推荐列表中用户点击过的推荐图书按照点击时间进行排序,从而为用户挑选出多本点击 时间最近的推荐图书; 未点击图书选取单元,用于采用skip-above方式,即从用户点击的item位置以上的展 现图书中随机选取多本用户未点击过的推荐图书。9. 根据权利要求7所述的系统,其特征在于,在分类模型训练装置中,用户和推荐图书 之间的关联特征值包括但不限于:图书推荐次数、用户换单次数、推荐率、历史图书数量、推 荐图书的作家是否是名家、用户名家偏好值、推荐图书是否含有用户喜欢的字眼、用户雅标 题倾向率、推荐图书雅俗分类、推荐图书的用户相似图书历史行为、用户相似图书和推荐图 书的相似度。10. 根据权利要求7所述的系统,其特征在于,当用户和推荐图书之间的关联特征值包 括推荐图书的用户相似图书历史行为、用户相似图书和推荐图书的相似度时,分类模型训 练装置中进一步包括有: 相似度计算单元,用于提取推荐图书的所有关键字,将推荐图书的所有关键字的个数 记为n,统计历史图书所包含的推荐图书的关键字或与关键字相似的词语个数k,并计算历 史图书和推荐图书的相似度:相似图书集构建单元,用于构建推荐图书的用户相似图书集,所述用户相似图书集初 始化为空,然后从用户的阅读历史记录中逐一提取每一本用户阅读过的历史图书,通过相 似度计算单元来计算推荐图书和所提取的历史图书的相似度,当相似度大于相似度阈值 时,则将所提取的历史图书作为相似图书保存到推荐图书的用户相似图书集中; 相似图书历史行为计算单元,用于从用户的阅读历史记录中读取用户相似图书集中所 有相似图书对应的用户历史行为和阅读时间,并按照阅读时间、和用户历史行为的优先级 对所有相似图书进行排序,最后从用户相似图书集中挑选出一本阅读时间最近、且用户历 史行为的优先级最高的相似图书,所挑选出的相似图书对应的用户历史行为即是推荐图书 的用户相似图书历史行为,所挑选出的相似图书和推荐图书的相似度即是用户相似图书和 推荐图书的相似度。11. 根据权利要求10所述的系统,其特征在于,图书对应的用户历史行为包括有:浏 览、开始阅读、深度长期阅读、弃读,且将用户历史行为按优先级从高到低的次序进行排序 为:浏览〉开始阅读〉深度长期阅读〉弃读。12. 根据权利要求7所述的系统,其特征在于,对于分类模型训练装置来说,logistic 分类模型的训练样本的输出数据是样本用户集中每位用户点击推荐图书概率,其值为1或 0,即当推荐图书是用户点击过的推荐图书时,其值为1 ;当推荐图书是用户未点击过的推 荐图书时,其值为〇,图书推荐装置进一步包括有: 点击概率判断单元,用于判断目标用户点击新推荐图书的概率是否大于或等于点击概 率阈值,如果是,则将所述新推荐图书写入用户的图书推荐列表中。
【专利摘要】一种基于用户点击行为来向用户推荐图书的方法和系统,方法包括:选取若干位用户构成样本用户集,并为样本用户集中每位用户选取多本其点击和未点击过的推荐图书;抽取样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值,然后根据用户和推荐图书之间的关联特征值训练生成logistic分类模型;逐一将目标用户和新推荐图书之间的关联特征值输入logistic分类模型从而得到目标用户点击新推荐图书的概率,并根据所述概率向目标用户选择新推荐图书。本发明属于数据业务领域,能基于用户对图书的点击行为来对用户的个性化图书偏好进行预测,从而提高推荐点击率和提升推荐效果。
【IPC分类】G06F17/30, G06K9/62
【公开号】CN105335491
【申请号】CN201510684976
【发明人】廖建新, 应文佳, 李曲, 王超芸, 彭刚
【申请人】杭州东信北邮信息技术有限公司
【公开日】2016年2月17日
【申请日】2015年10月20日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1