一种评分预测方法与系统的制作方法

文档序号:8396319阅读:295来源:国知局
一种评分预测方法与系统的制作方法
【技术领域】
[0001] 本发明涉及推荐系统领域,特别是涉及一种评分预测方法与系统。
【背景技术】
[0002] 推荐系统是根据用户的历史行为和兴趣特点,为用户推荐其感兴趣的信息或商品 的系统。推荐系统一般通过评分预测来实现,即将预测评分高的商品推荐给用户。
[0003] 传统的推荐算法包括基于内容的推荐和协同过滤。基于内容的推荐是挖掘物品的 描述性特征,然后根据用户的选择向用户推荐相似特征的物品,比如用户买了某品牌的衣 月艮,则向他推荐该品牌的裤子。协同过滤是根据用户的历史行为,如对餐馆的评分行为,对 商品的浏览行为等向用户推荐商品,一般分为基于用户的协同过滤和基于物品的协同过 滤。基于用户的协同过滤通过计算用户相似度向相似用户推荐某商品;基于物品的协同过 滤通过计算物品相似度向用户推荐与其购买过的商品相似的商品。
[0004] 但是上述传统的推荐算法均存在一定的局限性。基于内容的推荐算法过于依赖 用户和物品的描述性的特征,无法利用用户的反馈信息。协同过滤算法以用户的历史行为 为依据推测用户对物品的喜好,没有深层次挖掘用户或者物品的特征,例如,两个用户均对 一家餐馆打出5分满分,但是评价角度可能不同,一个人认为菜肴美味,另一个觉得服务周 到。
[0005] 目前出现了一些算法可以根据用户对物品的评论预测用户对物品的评分,但无法 同时考虑评论信息中的用户角度和物品角度。

【发明内容】

[0006] 有鉴于此,本发明的主要目的在于提供一种评分预测方法与系统,可以根据历史 评论综合用户角度与物品角度更准确地预测评分。
[0007] 为实现上述目的,本发明提供了一种评分预测方法,包括:
[0008] 获取历史评分数据,利用协同过滤算法根据第一用户对所有物品的评分平均分、 预设用户范围中除第一用户以外其他各用户对第一物品的评分以及对预设物品范围物品 评分的平均分得到第一用户对第一物品的修正平均分;
[0009] 获取历史评论数据,计算第一用户对第一物品的评论的多个预设主题的特征值, 根据所述特征值得到第一用户对第一物品的评论的特征表示;
[0010] 根据第一用户对第一物品的评分、所述第一用户对第一物品的评论的特征表示和 所述第一用户对第一物品的修正平均分得到各主题的权重、所述修正平均分的权重以及误 差偏置;
[0011] 确定要进行评分预测的第二用户以及第二物品;
[0012] 利用协同过滤算法根据第二用户对所有物品的评分平均分、预设用户范围中除第 二用户以外其他各用户对第二物品的评分以及对预设物品范围物品评分的平均分得到第 二用户对第二物品的修正平均分;
[0013] 计算第二用户对第二物品的评论的各主题的特征值,根据第二用户对第二物品的 评论的各主题的特征值、第二用户的评论集合和第二物品的评论集合得到第二用户各主题 的特征值以及第二物品各主题的特征值;
[0014] 根据第二用户各主题的特征值以及第二物品各主题的特征值得到第二用户对第 二物品的模拟评论特征表示;
[0015] 根据第二用户对第二物品的模拟评论特征表示、第二用户对第二物品的修正平均 分、所述各主题的权重、所述修正平均分的权重以及误差偏置计算出所述第二用户对第二 物品的预测评分;
[0016] 其中,计算特征值包括:
[0017] 将所述历史评论数据中的词表示为词向量;
[0018] 根据所述词向量得到与各主题相似的对应的预设数目的目标代表词;
[0019] 根据各主题对应的目标代表词与主题的余弦相似度计算历史评论数据中指定用 户对指定物品的评论的各主题的特征值。
[0020] 优选地,根据第二用户各主题的特征值以及第二物品各主题的特征值得到第二用 户对第二物品的模拟评论特征表示包括:
[0021] 将第二用户指定主题的特征值进行归一化,第二物品同一指定主题的特征值进行 归一化;
[0022] 两次归一化的值进行点积得到第二用户对第二物品对应该指定主题的特征表 示;
[0023] 将第二用户对第二物品各主题的特征表示均归一化,得到第二用户对第二物品的 模拟评论特征表示。
[0024] 优选地,根据所述词向量得到与各主题相似的对应的预设数目的目标代表词包 括:
[0025] 找出各主题下有代表性的词;
[0026] 将各主题对应的词向量依据与主题以及主题对应的有代表性的词的余弦相似度 从尚到低排序;
[0027] 去除无关词后取排序后的前预设数目的词向量得到各主题对应的预设数目的目 标代表词。
[0028] 优选地,根据各主题对应的目标代表词与主题的余弦相似度计算历史评论数据中 指定用户对指定物品的评论的各主题的特征值包括:
[0029] 确定各主题对应的各目标代表词与主题的余弦相似度;
[0030] 将对应同一主题的预设数目的各目标代表词的余弦相似度累加得到所述指定用 户对所述指定物品的各主题的特征值。
[0031] 本发明还提供了一种评分预测系统,包括:
[0032] 评分获取模块,用于获取历史评分数据;
[0033] 第一修正平均分获取模块,用于利用协同过滤算法根据第一用户对所有物品的评 分平均分、预设用户范围中除第一用户以外其他各用户对第一物品的评分以及对预设物品 范围物品评分的平均分得到第一用户对第一物品的修正平均分;
[0034] 评论获取模块,用于获取历史评论数据;
[0035] 特征值获取模块,用于计算指定用户对指定物品的各主题特征值;
[0036] 第一特征表示获取模块,用于根据特征值得到第一用户对第一物品的评论的特征 表不;
[0037] 中间值确定模块,用于根据第一用户对第一物品的评分、所述第一用户对第一物 品的评论的特征表示和所述第一用户对第一物品的修正平均分得到各主题的权重、所述修 正平均分的权重以及误差偏置;
[0038] 预测确定模块,用于确定要进行评分预测的第二用户以及第二物品;
[0039] 第二修正平均分获取模块,用于利用协同过滤算法根据第二用户对所有物品的评 分平均分、预设用户范围中除第二用户以外其他各用户对第二物品的评分以及对预设物品 范围物品评分的平均分得到第二用户对第二物品的修正平均分;
[0040] 预测特征值获取模块,用于根据第二用户对第二物品的评论的各主题的特征值、 第二用户的评论集合和第二物品的评论集合得到第二用户各主题的特征值以及第二物品 各主题的特征值;
[0041] 第二特征表示获取模块,用于根据第二用户各主题的特征值以及第二物品各主题 的特征值得到第二用户对第二物品的模拟评论特征表示;
[0042] 评分预测模块,用于根据第二用户对第二物品的模拟评论特征表示、第二用户对 第二物品的修正平均分、所述各主题的权重、所述修正平均分的权重以及误差偏置计算出 所述第二用户对第二物品的预测评分;
[0043] 其中,所述特征值获取模块包括:
[0044] 词向量获取子模块,用于将所述历史评论数据中的词表示为词向量;
[0045] 代表词获取子模块,用于根据所述词向量得到与各主题相似的对应的预设数目的 目标代表词;
[0046] 特征值子模块,用于根据各主题对应的目标代表词与主题的余弦相似度计算历史 评论数据中指定用户对指定物品的评论的各主题的特征值。
[0047] 优选地,所述第二特征表示获取模块包括:
[0048] 第一归一化子模块,用于将第二用户指定主题的特征值进行归一化,第二物品同 一指定主题的特征值进行归一化;
[0049] 点积子模块,用于两次归一化的值进行点积得到第二用户对第二物品对应该指定 主题的特征表示;
[0050] 第二归一化子模块,用于将第二用户对第二物品各主题的特征表示均归一化,得 到第二用户对第二物品的模拟评论特征表示。
[0051] 应用本发明提供的评分预测方法与系统,获取历史评分数据以及历史评论数据, 根据历史评分数据和评论数据计算指定的第一用户对第一物品的修正平均分以及第一用 户对第一物品的特征表示,将计算出的修正平均分作为线性回归模型特征之一,利用准确 性更高的多种算法的组合计算出预设的评论中各主题对于评分的权重、修正平均分的权重 和误差偏置,最后利用各主题的权重与误差偏置,以及历史评论和评分中指定的需要预测 的第二用户对第二物品的模拟评论特征表示和第二用户对第二物品的修正平均分计算出 第二用户对第二
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1