一种评分预测方法与系统的制作方法_2

文档序号:8396319阅读:来源:国知局
物品的预测评分,利用词向量方法的余弦相似度取与主题词相似的目标代 表词,并过滤无关词,根据评论内容预测评分同时从用户角度以及物品角度进行考虑,并加 之协同过滤算法得到组合推荐模型预测新的评分,使预测结果更加准确全面,从而在后续 根据历史评论向用户进行相似推荐时获得更好的用户体验。
【附图说明】
[0052] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据 提供的附图获得其他的附图。
[0053] 图1为本发明一种评分预测方法的流程图;
[0054] 图2为本发明一种评分预测方法的详细流程图;
[0055] 图3为本发明一种评分预测系统的结构示意图;
[0056] 图4为本发明一种评分预测系统的详细结构示意图。
【具体实施方式】
[0057] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0058] 本发明提供了一种评分预测方法,如图1所示,为本发明评分预测方法一具体实 施例的流程图,包括:
[0059] 步骤S101 :获取历史评分数据,利用协同过滤算法根据第一用户对所有物品的评 分平均分、预设用户范围中除第一用户以外其他各用户对第一物品的评分以及对预设物品 范围物品评分的平均分得到第一用户对第一物品的修正平均分;
[0060] 首先获取已知的历史评分数据,即用户已经评论过的物品的评分,根据协同过滤 算法中的一种Bias From Mean,设第一用户为u,第一物品为i,计算u对i的修正平均分 f3ui,计算公式如下:
[0061]
【主权项】
1. 一种评分预测方法,其特征在于,包括: 获取历史评分数据,利用协同过滤算法根据第一用户对所有物品的评分平均分、预设 用户范围中除第一用户W外其他各用户对第一物品的评分W及对预设物品范围物品评分 的平均分得到第一用户对第一物品的修正平均分; 获取历史评论数据,计算第一用户对第一物品的评论的多个预设主题的特征值,根据 所述特征值得到第一用户对第一物品的评论的特征表示; 根据第一用户对第一物品的评分、所述第一用户对第一物品的评论的特征表示和所述 第一用户对第一物品的修正平均分得到各主题的权重、所述修正平均分的权重W及误差偏 置; 确定要进行评分预测的第二用户W及第二物品; 利用协同过滤算法根据第二用户对所有物品的评分平均分、预设用户范围中除第二用 户W外其他各用户对第二物品的评分W及对预设物品范围物品评分的平均分得到第二用 户对第二物品的修正平均分. 计算第二用户对第二物品的评论的各主题的特征值,根据第二用户对第二物品的评论 的各主题的特征值、第二用户的评论集合和第二物品的评论集合得到第二用户各主题的特 征值W及第二物品各主题的特征值; 根据第二用户各主题的特征值W及第二物品各主题的特征值得到第二用户对第二物 品的板拟评论特征表不; 根据第二用户对第二物品的模拟评论特征表示、第二用户对第二物品的修正平均分、 所述各主题的权重、所述修正平均分的权重W及误差偏置计算出所述第二用户对第二物品 的预测评分; 其中,计算特征值包括: 将所述历史评论数据中的词表示为词向量; 根据所述词向量得到与各主题相似的对应的预设数目的目标代表词; 根据各主题对应的目标代表词与主题的余弦相似度计算历史评论数据中指定用户对 指定物品的评论的各主题的特征值。
2. 根据权利要求1所述的评分预测方法,其特征在于,根据第二用户各主题的特征值 W及第二物品各主题的特征值得到第二用户对第二物品的模拟评论特征表示包括: 将第二用户指定主题的特征值进行归一化,第二物品同一指定主题的特征值进行归一 化; 两次归一化的值进行点积得到第二用户对第二物品对应该指定主题的特征表示; 将第二用户对第二物品各主题的特征表示均归一化,得到第二用户对第二物品的模拟 评论特征表示。
3. 根据权利要求2所述的评分预测方法,其特征在于,根据所述词向量得到与各主题 相似的对应的预设数目的目标代表词包括: 找出各主题下有代表性的词; 将各主题对应的词向量依据与主题W及主题对应的有代表性的词的余弦相似度从高 到低排序; 去除无关词后取排序后的前预设数目的词向量得到各主题对应的预设数目的目标代 表词。
4. 根据权利要求3所述的评分预测方法,其特征在于,根据各主题对应的目标代表词 与主题的余弦相似度计算历史评论数据中指定用户对指定物品的评论的各主题的特征值 包括: 确定各主题对应的各目标代表词与主题的余弦相似度; 将对应同一主题的预设数目的各目标代表词的余弦相似度累加得到所述指定用户对 所述指定物品的各主题的特征值。
5. -种评分预测系统,其特征在于,包括: 评分获取模块,用于获取历史评分数据; 第一修正平均分获取模块,用于利用协同过滤算法根据第一用户对所有物品的评分平 均分、预设用户范围中除第一用户W外其他各用户对第一物品的评分W及对预设物品范围 物品评分的平均分得到第一用户对第一物品的修正平均分; 评论获取模块,用于获取历史评论数据; 特征值获取模块,用于计算指定用户对指定物品的各主题特征值; 第一特征表示获取模块,用于根据特征值得到第一用户对第一物品的评论的特征表 示; 中间值确定模块,用于根据第一用户对第一物品的评分、所述第一用户对第一物品的 评论的特征表示和所述第一用户对第一物品的修正平均分得到各主题的权重、所述修正平 均分的权重W及误差偏置; 预测确定模块,用于确定要进行评分预测的第二用户W及第二物品; 第二修正平均分获取模块,用于利用协同过滤算法根据第二用户对所有物品的评分平 均分、预设用户范围中除第二用户W外其他各用户对第二物品的评分W及对预设物品范围 物品评分的平均分得到第二用户对第二物品的修正平均分; 预测特征值获取模块,用于根据第二用户对第二物品的评论的各主题的特征值、第二 用户的评论集合和第二物品的评论集合得到第二用户各主题的特征值W及第二物品各主 题的特征值; 第二特征表示获取模块,用于根据第二用户各主题的特征值W及第二物品各主题的特 征值得到第二用户对第二物品的模拟评论特征表示; 评分预测模块,用于根据第二用户对第二物品的模拟评论特征表示、第二用户对第二 物品的修正平均分、所述各主题的权重、所述修正平均分的权重W及误差偏置计算出所述 第二用户对第二物品的预测评分; 其中,所述特征值获取模块包括: 词向量获取子模块,用于将所述历史评论数据中的词表示为词向量; 代表词获取子模块,用于根据所述词向量得到与各主题相似的对应的预设数目的目标 代表词; 特征值子模块,用于根据各主题对应的目标代表词与主题的余弦相似度计算历史评论 数据中指定用户对指定物品的评论的各主题的特征值。
6. 根据权利要求5所述的评分预测系统,其特征在于,所述第二特征表示获取模块包 括: 第一归一化子模块,用于将第二用户指定主题的特征值进行归一化,第二物品同一指 定主题的特征值进行归一化; 点积子模块,用于两次归一化的值进行点积得到第二用户对第二物品对应该指定主题 的特征表示; 第二归一化子模块,用于将第二用户对第二物品各主题的特征表示均归一化,得到第 二用户对第二物品的模拟评论特征表示。
【专利摘要】本发明公开了一种评分预测方法与系统,获取历史评论数据,使用基于词向量的方法构建主题词分布表,根据主题词分布表计算指定的第一用户对第一物品的评论特征表示,同时获取历史评分数据,计算指定的第一用户对第一物品的修正平均分作为特征之一,与主题特征一起作为线性回归模型的特征,计算出各个特征的权重和误差偏置,针对需要预测的第二用户对第二物品的评分,首先计算出第二用户对第二物品的评论特征表示和修正平均分,结合主题权重和误差偏置获得第二用户对第二物品的评分。利用词向量方法构建主题词表,根据评论内容预测评分同时从用户角度以及物品角度进行考虑,并加之协同过滤算法得到组合推荐模型,使预测结果更加准确全面。
【IPC分类】G06Q30-02
【公开号】CN104715399
【申请号】CN201510165907
【发明人】陈文亮, 马春平
【申请人】苏州大学
【公开日】2015年6月17日
【申请日】2015年4月9日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1