基于用户点击行为来向用户推荐图书的方法和系统的制作方法_2

文档序号：9579379阅读：来源：国知局

1 > 于相似度阈值？如果是，则将所述历史图书作为相似图书保存到推荐图书的用户相似图书集中，然后继续下一步；如果否，则继续下一步，其中，相似度阈值可根据业务实际需要而设定；
[0031] 步骤A4、判断是否已从用户的阅读历史记录中提取完所有用户阅读过的历史图书？如果是，则继续下一步；如果否，则继续从用户的阅读历史记录中提取下一本用户阅读过的历史图书，然后转向步骤A3 ;
[0032] 步骤A5、从用户的阅读历史记录中读取用户相似图书集中所有相似图书对应的用户历史行为和阅读时间，并按照阅读时间、和用户历史行为的优先级对所有相似图书进行排序，最后从用户相似图书集中挑选出一本阅读时间最近、且用户历史行为的优先级最高的相似图书，所挑选出的相似图书对应的用户历史行为即是推荐图书的用户相似图书历史行为，所挑选出的相似图书和推荐图书的相似度即是用户相似图书和推荐图书的相似度。
[0033] 图书对应的用户历史行为可以包括有：浏览、开始阅读、深度长期阅读、弃读。根据对用户点击行为的影响程度，可以将用户历史行为按优先级从高到低的次序进行排序为：浏览〉开始阅读〉深度长期阅读〉弃读。例如，当用户对推荐图书包括有浏览和开始阅读两种用户历史行为时，由于浏览对用户点击的影响力大于开始阅读，因此，可以选取浏览作为用户历史行为。
[0034] 步骤二和步骤三中，还可以将用户和推荐图书之间的关联特征值设置不同类型的变量，其中分类特征值设定为因子型变量，数值特征值设定为数值型变量，如下表所示，例如，推荐图书的用户相似图书历史行为分别是浏览、开始阅读、深度长期阅读、弃读、无时，其值分别设置为1、2、3、4、0。
[0035]
[0036] 步骤二中，对于logistic分类模型所使用的训练样本来说，输出数据是样本用户集中每位用户点击推荐图书概率，其值为1或〇,即当推荐图书是用户点击过的推荐图书时，其值为1 ;当推荐图书是用户未点击过的推荐图书时，其值为〇。这样，步骤三中，进一步包括有：判断目标用户点击新推荐图书的概率是否大于或等于点击概率阈值，如果是，则将所述新推荐图书写入用户的图书推荐列表中，所述点击概率阈值可以根据实际情况而设定，例如取值为0.5。
[0037] 如图3所示，本发明一种基于用户点击行为来向用户推荐图书的系统，包括有：
[0038] 样本构建装置，用于选取若干位用户构成样本用户集，并为样本用户集中每位用户选取多本其点击和未点击过的推荐图书；
[0039] 分类模型训练装置，用于抽取样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值，然后根据用户和推荐图书之间的关联特征值训练生成logistic 分类模型，所述logistic分类模型训练所使用的输入数据是样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值，输出数据是用户点击推荐图书的概率；
[0040] 图书推荐装置，用于逐一将目标用户和新推荐图书之间的关联特征值输入 logistic分类模型从而得到目标用户点击新推荐图书的概率，并根据所述概率向目标用户选择新推荐图书。
[0041] 所述样本构建装置还可以进一步包括有：
[0042] 点击图书选取单元，用于选取用户最新日期的图书推荐列表，并将用户最新日期的图书推荐列表中用户点击过的推荐图书按照点击时间进行排序，从而为用户挑选出多本点击时间最近的推荐图书；
[0043] 未点击图书选取单元，用于采用skip-above(即跳略法）方式，即从用户点击的 item(即图书）位置以上的展现图书中随机选取多本用户未点击过的推荐图书。
[0044] 在分类模型训练装置中，用户和推荐图书之间的关联特征值可以是图书推荐次数、用户换单次数、推荐率、历史图书数量、推荐图书的作家是否是名家、用户名家偏好值、推荐图书是否含有用户喜欢的字眼、用户雅标题倾向率、推荐图书雅俗分类、推荐图书的用户相似图书历史行为、用户相似图书和推荐图书的相似度等。其中，图书推荐次数是向用户推荐图书的次数，用户换单次数是用户的图书推荐列表在一段时期内的变化次数，推荐率是图书推荐次数和换单次数的比值，历史图书数量是用户阅读过的图书数量，图书推荐次数、用户换单次数、推荐率、历史图书数量、推荐图书的作家是否是名家、用户名家偏好值、推荐图书是否含有用户喜欢的字眼、用户雅标题倾向率、推荐图书雅俗分类这些值可以从用户的阅读历史记录、以及推荐图书的属性库中获取。如图4所示，分类模型训练装置中还可以进一步包括有：
[0045] 相似度计算单元，用于提取推荐图书的所有关键字，将推荐图书的所有关键字的个数记为n，统计历史图书所包含的推荐图书的关键字或与关键字相似的词语个数k，并计算历史图书和推荐图书的相似度= 5 /?* 9
[0046] 相似图书集构建单元，用于构建推荐图书的用户相似图书集，所述用户相似图书集初始化为空，然后从用户的阅读历史记录中逐一提取每一本用户阅读过的历史图书，通过相似度计算单元来计算推荐图书和所提取的历史图书的相似度，当相似度大于相似度阈值时，则将所提取的历史图书作为相似图书保存到推荐图书的用户相似图书集中，相似度阈值可根据业务实际需要而设定；
[0047] 相似图书历史行为计算单元，用于从用户的阅读历史记录中读取用户相似图书集中所有相似图书对应的用户历史行为和阅读时间，并按照阅读时间、和用户历史行为的优先级对所有相似图书进行排序，最后从用户相似图书集中挑选出一本阅读时间最近、且用户历史行为的优先级最高的相似图书，所挑选出的相似图书对应的用户历史行为即是推荐图书的用户相似图书历史行为，所挑选出的相似图书和推荐图书的相似度即是用户相似图书和推荐图书的相似度。
[0048] 值得一提的是，图书对应的用户历史行为可以包括有：浏览、开始阅读、深度长期阅读、弃读。根据对用户点击行为的影响程度，可以将用户历史行为按优先级从高到低的次序进行排序为：浏览〉开始阅读〉深度长期阅读〉弃读。例如，当用户对推荐图书包括有浏览和开始阅读两种用户历史行为时，由于浏览对用户点击的影响力大于开始阅读，因此，可以选取浏览作为用户历史行为。
[0049] 对于分类模型训练装置来说，logistic分类模型的训练样本的输出数据是样本用户集中每位用户点击推荐图书概率，其值为1或〇,即当推荐图书是用户点击过的推荐图书时，其值为1 ;当推荐图书是用户未点击过的推荐图书时，其值为〇。这样，图书推荐装置还可以进一步包括有：
[0050] 点击概率判断单元，用于判断目标用户点击新推荐图书的概率是否大于或等于点击概率阈值，如果是，则将所述新推荐图书写入用户的图书推荐列表中，所述点击概率阈值的值可以根据实际情况而定，例如取值为〇. 5。
[0051] 以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。
【主权项】
1. 一种基于用户点击行为来向用户推荐图书的方法，其特征在于，包括有：步骤一、选取若干位用户构成样本用户集，并为样本用户集中每位用户选取多本其点击和未点击过的推荐图书；步骤二、抽取样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值，然后根据用户和推荐图书之间的关联特征值训练生成logistic分类模型，所述 logistic分类模型训练所使用的输入数据是样本用户集中每位用户和其点击、未点击过的推荐图书之间的关联特征值，输出数据是用户点击推荐图书的概率；步骤三、逐一将目标用户和新推荐图书之间的关联特征值输入logistic分类模型从而得到目标用户点击新推荐图书的概率，并根据所述概率向目标用户选择新

完整全部详细技术资料下载

当前第2页1 2 3