一种评分预测方法与系统的制作方法

文档序号：8396319阅读：295来源：国知局

一种评分预测方法与系统的制作方法
【技术领域】
[0001] 本发明涉及推荐系统领域，特别是涉及一种评分预测方法与系统。
【背景技术】
[0002] 推荐系统是根据用户的历史行为和兴趣特点，为用户推荐其感兴趣的信息或商品的系统。推荐系统一般通过评分预测来实现，即将预测评分高的商品推荐给用户。
[0003] 传统的推荐算法包括基于内容的推荐和协同过滤。基于内容的推荐是挖掘物品的描述性特征，然后根据用户的选择向用户推荐相似特征的物品，比如用户买了某品牌的衣月艮，则向他推荐该品牌的裤子。协同过滤是根据用户的历史行为，如对餐馆的评分行为，对商品的浏览行为等向用户推荐商品，一般分为基于用户的协同过滤和基于物品的协同过滤。基于用户的协同过滤通过计算用户相似度向相似用户推荐某商品；基于物品的协同过滤通过计算物品相似度向用户推荐与其购买过的商品相似的商品。
[0004] 但是上述传统的推荐算法均存在一定的局限性。基于内容的推荐算法过于依赖用户和物品的描述性的特征，无法利用用户的反馈信息。协同过滤算法以用户的历史行为为依据推测用户对物品的喜好，没有深层次挖掘用户或者物品的特征，例如，两个用户均对一家餐馆打出5分满分，但是评价角度可能不同，一个人认为菜肴美味，另一个觉得服务周到。
[0005] 目前出现了一些算法可以根据用户对物品的评论预测用户对物品的评分，但无法同时考虑评论信息中的用户角度和物品角度。

【发明内容】

[0006] 有鉴于此，本发明的主要目的在于提供一种评分预测方法与系统，可以根据历史评论综合用户角度与物品角度更准确地预测评分。
[0007] 为实现上述目的，本发明提供了一种评分预测方法，包括：
[0008] 获取历史评分数据，利用协同过滤算法根据第一用户对所有物品的评分平均分、预设用户范围中除第一用户以外其他各用户对第一物品的评分以及对预设物品范围物品评分的平均分得到第一用户对第一物品的修正平均分；
[0009] 获取历史评论数据，计算第一用户对第一物品的评论的多个预设主题的特征值，根据所述特征值得到第一用户对第一物品的评论的特征表示；
[0010] 根据第一用户对第一物品的评分、所述第一用户对第一物品的评论的特征表示和所述第一用户对第一物品的修正平均分得到各主题的权重、所述修正平均分的权重以及误差偏置；
[0011] 确定要进行评分预测的第二用户以及第二物品；
[0012] 利用协同过滤算法根据第二用户对所有物品的评分平均分、预设用户范围中除第二用户以外其他各用户对第二物品的评分以及对预设物品范围物品评分的平均分得到第二用户对第二物品的修正平均分；
[0013] 计算第二用户对第二物品的评论的各主题的特征值，根据第二用户对第二物品的评论的各主题的特征值、第二用户的评论集合和第二物品的评论集合得到第二用户各主题的特征值以及第二物品各主题的特征值；
[0014] 根据第二用户各主题的特征值以及第二物品各主题的特征值得到第二用户对第二物品的模拟评论特征表示；
[0015] 根据第二用户对第二物品的模拟评论特征表示、第二用户对第二物品的修正平均分、所述各主题的权重、所述修正平均分的权重以及误差偏置计算出所述第二用户对第二物品的预测评分；
[0016] 其中，计算特征值包括：
[0017] 将所述历史评论数据中的词表示为词向量；
[0018] 根据所述词向量得到与各主题相似的对应的预设数目的目标代表词；
[0019] 根据各主题对应的目标代表词与主题的余弦相似度计算历史评论数据中指定用户对指定物品的评论的各主题的特征值。
[0020] 优选地，根据第二用户各主题的特征值以及第二物品各主题的特征值得到第二用户对第二物品的模拟评论特征表示包括：
[0021] 将第二用户指定主题的特征值进行归一化，第二物品同一指定主题的特征值进行归一化；
[0022] 两次归一化的值进行点积得到第二用户对第二物品对应该指定主题的特征表示；
[0023] 将第二用户对第二物品各主题的特征表示均归一化，得到第二用户对第二物品的模拟评论特征表示。
[0024] 优选地，根据所述词向量得到与各主题相似的对应的预设数目的目标代表词包括：
[0025] 找出各主题下有代表性的词；
[0026] 将各主题对应的词向量依据与主题以及主题对应的有代表性的词的余弦相似度从尚到低排序；
[0027] 去除无关词后取排序后的前预设数目的词向量得到各主题对应的预设数目的目标代表词。
[0028] 优选地，根据各主题对应的目标代表词与主题的余弦相似度计算历史评论数据中指定用户对指定物品的评论的各主题的特征值包括：
[0029] 确定各主题对应的各目标代表词与主题的余弦相似度；
[0030] 将对应同一主题的预设数目的各目标代表词的余弦相似度累加得到所述指定用户对所述指定物品的各主题的特征值。
[0031] 本发明还提供了一种评分预测系统，包括：
[0032] 评分获取模块，用于获取历史评分数据；
[0033] 第一修正平均分获取模块，用于利用协同过滤算法根据第一用户对所有物品的评分平均分、预设用户范围中除第一用户以外其他各用户对第一物品的评分以及对预设物品范围物品评分的平均分得到第一用户对第一物品的修正平均分；
[0034] 评论获取模块，用于获取历史评论数据；
[0035] 特征值获取模块，用于计算指定用户对指定物品的各主题特征值；
[0036] 第一特征表示获取模块，用于根据特征值得到第一用户对第一物品的评论的特征表不；
[0037] 中间值确定模块，用于根据第一用户对第一物品的评分、所述第一用户对第一物品的评论的特征表示和所述第一用户对第一物品的修正平均分得到各主题的权重、所述修正平均分的权重以及误差偏置；
[0038] 预测确定模块，用于确定要进行评分预测的第二用户以及第二物品；
[0039] 第二修正平均分获取模块，用于利用协同过滤算法根据第二用户对所有物品的评分平均分、预设用户范围中除第二用户以外其他各用户对第二物品的评分以及对预设物品范围物品评分的平均分得到第二用户对第二物品的修正平均分；
[0040] 预测特征值获取模块，用于根据第二用户对第二物品的评论的各主题的特征值、第二用户的评论集合和第二物品的评论集合得到第二用户各主题的特征值以及第二物品各主题的特征值；
[0041] 第二特征表示获取模块，用于根据第二用户各主题的特征值以及第二物品各主题的特征值得到第二用户对第二物品的模拟评论特征表示；
[0042] 评分预测模块，用于根据第二用户对第二物品的模拟评论特征表示、第二用户对第二物品的修正平均分、所述各主题的权重、所述修正平均分的权重以及误差偏置计算出所述第二用户对第二物品的预测评分；
[0043] 其中，所述特征值获取模块包括：
[0044] 词向量获取子模块，用于将所述历史评论数据中的词表示为词向量；
[0045] 代表词获取子模块，用于根据所述词向量得到与各主题相似的对应的预设数目的目标代表词；
[0046] 特征值子模块，用于根据各主题对应的目标代表词与主题的余弦相似度计算历史评论数据中指定用户对指定物品的评论的各主题的特征值。
[0047] 优选地，所述第二特征表示获取模块包括：
[0048] 第一归一化子模块，用于将第二用户指定主题的特征值进行归一化，第二物品同一指定主题的特征值进行归一化；
[0049] 点积子模块，用于两次归一化的值进行点积得到第二用户对第二物品对应该指定主题的特征表示；
[0050] 第二归一化子模块，用于将第二用户对第二物品各主题的特征表示均归一化，得到第二用户对第二物品的模拟评论特征表示。
[0051] 应用本发明提供的评分预测方法与系统，获取历史评分数据以及历史评论数据，根据历史评分数据和评论数据计算指定的第一用户对第一物品的修正平均分以及第一用户对第一物品的特征表示，将计算出的修正平均分作为线性回归模型特征之一，利用准确性更高的多种算法的组合计算出预设的评论中各主题对于评分的权重、修正平均分的权重和误差偏置，最后利用各主题的权重与误差偏置，以及历史评论和评分中指定的需要预测的第二用户对第二物品的模拟评论特征表示和第二用户对第二物品的修正平均分计算出第二用户对第二

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈文亮;马春平;
技术所有人：苏州大学;
我是此专利的发明人

上一篇：一种基于android系统和VPDN的网络发票开具方法
上一篇：基于.net平台的中国化肥价格指数系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。