基于用户点击行为来向用户推荐图书的方法和系统的制作方法_2

文档序号:9579379阅读:来源:国知局
1 > 于相似度阈值?如果是,则将所述历史图书作为相似图书保存到推荐图书的用户相似图书 集中,然后继续下一步;如果否,则继续下一步,其中,相似度阈值可根据业务实际需要而设 定;
[0031] 步骤A4、判断是否已从用户的阅读历史记录中提取完所有用户阅读过的历史图 书?如果是,则继续下一步;如果否,则继续从用户的阅读历史记录中提取下一本用户阅读 过的历史图书,然后转向步骤A3 ;
[0032] 步骤A5、从用户的阅读历史记录中读取用户相似图书集中所有相似图书对应的用 户历史行为和阅读时间,并按照阅读时间、和用户历史行为的优先级对所有相似图书进行 排序,最后从用户相似图书集中挑选出一本阅读时间最近、且用户历史行为的优先级最高 的相似图书,所挑选出的相似图书对应的用户历史行为即是推荐图书的用户相似图书历史 行为,所挑选出的相似图书和推荐图书的相似度即是用户相似图书和推荐图书的相似度。
[0033] 图书对应的用户历史行为可以包括有:浏览、开始阅读、深度长期阅读、弃读。根据 对用户点击行为的影响程度,可以将用户历史行为按优先级从高到低的次序进行排序为: 浏览〉开始阅读〉深度长期阅读〉弃读。例如,当用户对推荐图书包括有浏览和开始阅读 两种用户历史行为时,由于浏览对用户点击的影响力大于开始阅读,因此,可以选取浏览作 为用户历史行为。
[0034] 步骤二和步骤三中,还可以将用户和推荐图书之间的关联特征值设置不同类型的 变量,其中分类特征值设定为因子型变量,数值特征值设定为数值型变量,如下表所示,例 如,推荐图书的用户相似图书历史行为分别是浏览、开始阅读、深度长期阅读、弃读、无时, 其值分别设置为1、2、3、4、0。
[0035]
[0036] 步骤二中,对于logistic分类模型所使用的训练样本来说,输出数据是样本用户 集中每位用户点击推荐图书概率,其值为1或〇,即当推荐图书是用户点击过的推荐图书 时,其值为1 ;当推荐图书是用户未点击过的推荐图书时,其值为〇。这样,步骤三中,进一 步包括有:判断目标用户点击新推荐图书的概率是否大于或等于点击概率阈值,如果是,则 将所述新推荐图书写入用户的图书推荐列表中,所述点击概率阈值可以根据实际情况而设 定,例如取值为0.5。
[0037] 如图3所示,本发明一种基于用户点击行为来向用户推荐图书的系统,包括有:
[0038] 样本构建装置,用于选取若干位用户构成样本用户集,并为样本用户集中每位用 户选取多本其点击和未点击过的推荐图书;
[0039] 分类模型训练装置,用于抽取样本用户集中每位用户和其点击、未点击过的推荐 图书之间的关联特征值,然后根据用户和推荐图书之间的关联特征值训练生成logistic 分类模型,所述logistic分类模型训练所使用的输入数据是样本用户集中每位用户和其 点击、未点击过的推荐图书之间的关联特征值,输出数据是用户点击推荐图书的概率;
[0040] 图书推荐装置,用于逐一将目标用户和新推荐图书之间的关联特征值输入 logistic分类模型从而得到目标用户点击新推荐图书的概率,并根据所述概率向目标用户 选择新推荐图书。
[0041] 所述样本构建装置还可以进一步包括有:
[0042] 点击图书选取单元,用于选取用户最新日期的图书推荐列表,并将用户最新日期 的图书推荐列表中用户点击过的推荐图书按照点击时间进行排序,从而为用户挑选出多本 点击时间最近的推荐图书;
[0043] 未点击图书选取单元,用于采用skip-above(即跳略法)方式,即从用户点击的 item(即图书)位置以上的展现图书中随机选取多本用户未点击过的推荐图书。
[0044] 在分类模型训练装置中,用户和推荐图书之间的关联特征值可以是图书推荐次 数、用户换单次数、推荐率、历史图书数量、推荐图书的作家是否是名家、用户名家偏好值、 推荐图书是否含有用户喜欢的字眼、用户雅标题倾向率、推荐图书雅俗分类、推荐图书的用 户相似图书历史行为、用户相似图书和推荐图书的相似度等。其中,图书推荐次数是向用户 推荐图书的次数,用户换单次数是用户的图书推荐列表在一段时期内的变化次数,推荐率 是图书推荐次数和换单次数的比值,历史图书数量是用户阅读过的图书数量,图书推荐次 数、用户换单次数、推荐率、历史图书数量、推荐图书的作家是否是名家、用户名家偏好值、 推荐图书是否含有用户喜欢的字眼、用户雅标题倾向率、推荐图书雅俗分类这些值可以从 用户的阅读历史记录、以及推荐图书的属性库中获取。如图4所示,分类模型训练装置中还 可以进一步包括有:
[0045] 相似度计算单元,用于提取推荐图书的所有关键字,将推荐图书的所有关键字的 个数记为n,统计历史图书所包含的推荐图书的关键字或与关键字相似的词语个数k,并计 算历史图书和推荐图书的相似度= 5 /?* 9
[0046] 相似图书集构建单元,用于构建推荐图书的用户相似图书集,所述用户相似图书 集初始化为空,然后从用户的阅读历史记录中逐一提取每一本用户阅读过的历史图书,通 过相似度计算单元来计算推荐图书和所提取的历史图书的相似度,当相似度大于相似度阈 值时,则将所提取的历史图书作为相似图书保存到推荐图书的用户相似图书集中,相似度 阈值可根据业务实际需要而设定;
[0047] 相似图书历史行为计算单元,用于从用户的阅读历史记录中读取用户相似图书集 中所有相似图书对应的用户历史行为和阅读时间,并按照阅读时间、和用户历史行为的优 先级对所有相似图书进行排序,最后从用户相似图书集中挑选出一本阅读时间最近、且用 户历史行为的优先级最高的相似图书,所挑选出的相似图书对应的用户历史行为即是推荐 图书的用户相似图书历史行为,所挑选出的相似图书和推荐图书的相似度即是用户相似图 书和推荐图书的相似度。
[0048] 值得一提的是,图书对应的用户历史行为可以包括有:浏览、开始阅读、深度长期 阅读、弃读。根据对用户点击行为的影响程度,可以将用户历史行为按优先级从高到低的次 序进行排序为:浏览〉开始阅读〉深度长期阅读〉弃读。例如,当用户对推荐图书包括有浏 览和开始阅读两种用户历史行为时,由于浏览对用户点击的影响力大于开始阅读,因此,可 以选取浏览作为用户历史行为。
[0049] 对于分类模型训练装置来说,logistic分类模型的训练样本的输出数据是样本用 户集中每位用户点击推荐图书概率,其值为1或〇,即当推荐图书是用户点击过的推荐图书 时,其值为1 ;当推荐图书是用户未点击过的推荐图书时,其值为〇。这样,图书推荐装置还 可以进一步包括有:
[0050] 点击概率判断单元,用于判断目标用户点击新推荐图书的概率是否大于或等于点 击概率阈值,如果是,则将所述新推荐图书写入用户的图书推荐列表中,所述点击概率阈值 的值可以根据实际情况而定,例如取值为〇. 5。
[0051] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精 神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
【主权项】
1. 一种基于用户点击行为来向用户推荐图书的方法,其特征在于,包括有: 步骤一、选取若干位用户构成样本用户集,并为样本用户集中每位用户选取多本其点 击和未点击过的推荐图书; 步骤二、抽取样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特 征值,然后根据用户和推荐图书之间的关联特征值训练生成logistic分类模型,所述 logistic分类模型训练所使用的输入数据是样本用户集中每位用户和其点击、未点击过的 推荐图书之间的关联特征值,输出数据是用户点击推荐图书的概率; 步骤三、逐一将目标用户和新推荐图书之间的关联特征值输入logistic分类模型从 而得到目标用户点击新推荐图书的概率,并根据所述概率向目标用户选择新
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1