基于空间相近性的推荐系统评分预测与推荐算法

文档序号:10725102阅读:270来源:国知局
基于空间相近性的推荐系统评分预测与推荐算法
【专利摘要】本发明涉及一种基于空间相近性的推荐系统评分预测与推荐算法,将推荐系统中物品之间的相似度作为其在空间上布局的基础特征,并以其空间相近性进行物品相似作为选择依据,通过全面考察推荐系统商品、电影等物品之间的联系,借助物品网络在空间上的拓扑布局,实现更加精准的评分计算和推荐服务。提高了推荐系统推荐物品的多样性,并且使推荐的准确性得到提升。
【专利说明】
基于空间相近性的推荐系统评分预测与推荐算法
技术领域
[0001] 本发明涉及一种信息处理技术,特别涉及一种基于空间相近性的推荐系统评分预 测与推荐算法。
【背景技术】
[0002] 个性化服务作为热点问题被许多研究领域关注和研究。个性化服务的一个重要研 究内容是个性化推荐,它可以根据用户的兴趣寻找与之具有相似兴趣的物品集合,然后基 于物品之间的相似性推荐用户感兴趣的物品。使用个性化推荐技术向用户推荐适宜其自身 的电影、商品等等,使得用户可以迅速得到符合喜欢和选择倾向的物品信息,而这对于推荐 系统而言,既可以得到用户的信任,获得更多的青睐和使用,也使得系统推荐节省了用户在 大量浏览过程中所消耗的系统资源,从而节省带宽等运营成本,并更好的为用户服务。
[0003] 作为电子商务推荐系统中应用最成功的推荐技术,传统的协同过滤推荐算法存在 两方面问题。其仅仅依靠用户之间的相似度来选取目标用户的邻居,导致推荐精度较低,并 且在推荐时,存在推荐商品的多样性较差的缺点。
[0004] 因此,需要一种更为有效的且具有适当多样性的推荐系统,来实现方便而高效的 服务。

【发明内容】

[0005] 本发明是针对传统的推荐算法准确度低、系统易受攻击的问题,提出了一种基于 空间相近性的推荐系统评分预测与推荐算法,通过全面考察推荐系统商品、电影等物品之 间的联系,借助物品网络在空间上的拓扑布局,实现更加精准的评分计算和推荐服务。
[0006] 本发明的技术方案为:一种基于空间相近性的推荐系统评分预测与推荐算法,具 体包括如下步骤:
[0007] 1)建立当前推荐系统中的用户评分库:遍历当前用户,获得每个用户对所有电影 的评分记录,列出其中部分用户评分数据;
[0008] 2)用下面公式将用户评分数据归一化:
[00?0] 其中ria为用户Ui对物品a的评分,rimax和rimiIMf表用户Ui评分记录中的最高分和 最低分,若最高分与最低分相等,可将归一化值赋为〇,eiae [-1,1],eia为归一化后用户Ui 对物品a的评分值;
[0011] 3):目标用户山搜索物品a;
[0012] 4):计算物品之间的相似性,对于任意两个物品α和β,其相关性计算公式为:
[0014]其中m代表参与预测计算的用户数量,ka表示物品α的度,为用户对该物品评分的 次数,1^表示用户Ui的度,为该用户评分过的物品的个数,Sa{!表示物品α与物品β之间的相似 度,a ia代表用户Ui是否对物品α评过分,其取值为1或0,aia=l表示用户Ui对物品α评过分, aid = 0表示用户Ui没有对物品α评过分;
[00?5] 5):以物品之间相关性SccP作为物品之间关联的边,将物品作为节点构造网络,网络 中只存在物品,不存在用户,边的权值为Safi值;
[0016] 6):将所有物品均作为节点初始化置于空间(0,0)点,并在随后的算法步骤中分别 调整每个节点在空间上的位置;
[0017] 7):分别计算物品两两之间的引力与斥力:
[0018]计算斥力公式为:
[0020]其中c是可调节经验参数,可以影响拓扑布局的速度。d是物品a与物品b之间的空 间距离,Da、Db是在步骤5)中构造的物品网络中物品a与物品b的度值;物品a与物品b的引力 引力计算公式为:
[0022]其中Da是物品a在网络中的度值,Sag是物品a与b之间相关性,e是欧拉数;
[0023] 8):基于引力斥力计算结果,更新物品a与物品b在空间上的位置,新的坐标按照如 下公式更新:
[0024] X7 a = Xa+(Xa-Xb+9) 1 (fa+fr)
[0025] y7 a = ya+(ya-yb+9) · (fa+fr)
[0026] X7 b = Xb-(xa-Xb+9) · (fa+fr)
[0027] y7 b = yb-(ya-yb+9) · (fa+fr)
[0028]其中x' a是物品a新的x轴坐标,Xa是物品a在x轴上旧坐标,Θ是一个常数,
[0029] 当xa-xb辛0时,Θ = 0,xa_xb = 0时,Θ = 0 · 5,其他坐标含义类似;
[0030] 9):当(xa-xb+9)与(ya-yb+9)计算结果同时小于给定的ε,则判断物品a在空间的位 置便固定下来,在空间上布局算法在所有物品固定之后结束,否则,重复执行步骤7)和8), 完成在空间上的布局;
[0031] 10):完成空间上的布局后,对于目标用户Ui搜索或评分物品a,选定a在物品空间 上坐标(x a,ya),以r为半径,选定a的η个邻居,不包含a,要求用户Ui对其中的每一个都评过 分;
[0032] 11):依据下面公式对用户仏搜索或评分物品a进行预测:
[0034]其中€和> 分别是物品a与物品β的历史平均评分,η是物品a的邻居个数,<是 用户Ui对物品a的预测评分值,rig为用户Ui对物品β的评分,β属于物品a的η个邻居;
[0035] 12):将a的η个邻居中,评分预测最高的ρ项推荐给用户Ui。
[0036] 本发明的有益效果在于:本发明基于空间相近性的推荐系统评分预测与推荐算 法,将推荐系统中物品之间的相似度作为其在空间上布局的基础特征,并以其空间相近性 进行物品相似作为选择依据,提高了推荐系统推荐物品的多样性,并且使推荐的准确性得 到提升。
【附图说明】
[0037] 图1为本发明基于空间相近性的推荐系统评分预测与推荐算法流程图;
[0038] 图2为本发明物品在空间上布局算法流程图;
[0039] 图3为本发明电影推荐系统中,所有电影在空间上布局的示意图。
【具体实施方式】
[0040] 假设仏(在公式中用下标i表示)为电影推荐系统的用户,曾经对网站数据库中的 若干电影予以评分,分值分布在1-5之间。
[0041] 如图1所示基于空间相近性的推荐系统评分预测与推荐算法流程图,具体步骤如 下:
[0042] S1:建立当前推荐系统中的用户评分库:
[0043] 遍历当前用户,获得每个用户对所有电影的评分记录,列出其中部分用户评分数 据,如表1所示。
[0044] 表 1
[0046] S2:用下面公式将用户评分数据归一化:
[0048] 其中ria为用户Ui对电影a的评分,nmax和 riminR表用户Ui评分记录中的最高分和 最低分,若最高分与最低分相等,可将归一化值赋为〇,ei ae [-1,1],eicc为归一化后用户Ui 对电影a的评分值,与原值不同之处在于:其值域分布在正负1之间,并考虑了用户对不同电 影的总体评分数量,修正了用户对电影可能存在的偏见;得到如表2所示数据;
[0049] 表 2
[0051] S3:目标用户Ui搜索物品a(设a为电影3);
[0052] S4:计算物品之间的相似性,对于任意两个物品α和β,其相关性计算公式为:
[0054]其中ka表示物品α的度(为用户对该物品评分的次数),1^表示用户Ui的度(为该用 户评分过的物品的个数表示物品α对物品β的影响,可看作是物品α与物品β的相似度, 但物品相似度是有向的,即两个物品间的影响是不同的。此外,aia代表用户Ui是否对物品α 评过分,其取值为1或0,aia=l表示用户Ui对物品a评过分(无论评分多少),aia = 0表示用户 Ui没有对物品α评过分,m代表参与预测计算的用户数量。
[0055]按照相关性计算公式,进行电影相关性计算,可得电影之间相关性如表3所示:
[0056] 表3
[0057]
[0058] S5:以物品之间相关性Sa{!作为物品之间关联的边。将物品作为节点构造一个网络, 网络中只存在物品(不存在用户),当物品α与物品β之间相似性SaeX),则存在一条边从物品α 连接到物品β,边的权值为Safi值。
[0059] S6:将所有物品均作为节点初始化置于空间(0,0)点,并在随后的算法步骤中分别 调整每个节点在空间上的位置,本部分算法(S6-S9)如图2所示物品在空间上布局算法流程 图。
[0060] S7:分别计算物品两两之间的引力与斥力 [0061]计算斥力公式为:
[0063]其中c是可调节经验参数,可以影响拓扑布局的速度。d是物品a与物品b之间的空 间距尚,Da、Db是在步骤5中构造的物品网络中物品a与物品b的度值,其含义是:与物品α相似 性高的物品越多,D a越大。需要注意的是,该值与S4步骤中定义的ka度值不同,Da是S5步骤中 生成的网络,该网络中只有物品,ka表示物品α被用户评分的度,其值代表着用户对该物品 评分的次数,用户对α评分次数越多,ka越大。
[0064]物品a与物品b的引力引力计算公式为:
[0066]其中Da是物品a在网络中的度值,Sap是物品a与b之间相关性,e是欧拉数。
[0067] S8:基于引力斥力计算结果,更新物品a与物品b在空间上的位置,例如,对于物品 a与物品b,物品a的坐标为(xa,ya),物品b的坐标为(xb,yb)。它们新的坐标按照如下公式更 新:
[0068] X7 a = Xa+(xa-Xb+9) 1 (fa+fr)
[0069] y7 a = ya+(ya-yb+9) · (fa+fr)
[0070] X7 b = Xb-(xa-Xb+9) · (fa+fr)
[0071] y7 b = yb-(ya-yb+9) · (fa+fr)
[0072 ]其中X' a是物品a新的X轴坐标,Xa是物品a在X轴上旧坐标,Θ是一个常数,
[0073 ] 当Xa-Xb辛0时,Θ = 0,Xa-Xb = 0时,Θ = 〇 · 5,其他坐标含义类似。
[0074] S9:以物品a为例,当(xa-Xb+9)与(ya-yb+9)计算结果同时小于给定的ε(这个一个 预先给定的值,如0.5),说明物品在空间上只被移动了很小的位移,则物品a在空间的位置 便固定下来。在空间上布局算法在所有物品固定之后结束,否则,重复执行S7和S8步骤。完 成布局的电影网络在空间上的布局如图3所示。
[0075] S10:完成空间上的布局后,对于目标用户Ui搜索或者评分物品a,选定a在物品空 间上坐标(xa,ya),以r为半径(r初始值为0),选定a的的邻居(不包含a),因为r初始值很小, 所以其邻居初始数量为〇,因为需要不断增大r,直到r半径范围内包含了η个邻居,并符合Ui 对其中的每一个都评过分的要求。以图3中电影3为例,按照空间上距离的远近关系,电影3 的邻居从近处至远分别为:电影5,电影4,电影6,电影2,电影1。当电影3邻居选取η为1(实际 情况一般为50-100)时,因为用户Ui并没有看过电影5与电影4,因此选用电影6来预测用户 Ui对电影3的评分。
[0076] S11:依据下面公式对用户仏搜索或评分物品a进行预测:
[0078]其中€和&分别是物品a与物品邱勺历史平均评分,η是物品a的邻居个数,?f是用 户Ui对物品a的预测评分值,ri{!为用户Ui对物品β的评分,β属于物品a的邻居集合,其包含η 的物品(由S10确定)。通过计算,得到用户Ui对电影3的评分为3.75。同理,可以计算出并预 测用户对电影4的评分为4.166667;对电影5的评分为2.8。
[0079] S12:将a的η个邻居中,评分预测最高的p项推荐给用户Ui。当p = l时,向用户Ui推 荐电影4。
【主权项】
1. 一种基于空间相近性的推荐系统评分预测与推荐算法,其特征在于,具体包括如下 步骤: 1) 建立当前推荐系统中的用户评分库:遍历当前用户,获得每个用户对所有电影的评 分记录,列出其中部分用户评分数据; 2) 用下面公式将用户评分数据归一化:其中ria为用户化对物品a的评分,r/ax和ri"…代表用户化评分记录中的最高分和最低 分,若最高分与最低分相等,可将归一化值赋为〇,eiae [-1,1],eia为归一化后用户化对物 品a的评分值; 3) :目t不用户化捜索物品曰; 4) :计算物品之间的相似性,对于任意两个物品α和β,其相关性计算公式为:其中m代表参与预测计算的用户数量,ka表示物品α的度,为用户对该物品评分的次数, k康示用户化的度,为该用户评分过的物品的个数,sa康示物品α与物品β之间的相似度,aia 代表用户化是否对物品α评过分,其取值为1或0,aia=l表示用户化对物品α评过分,aia = 0 表示用户化没有对物品α评过分; 5) 物品之间相关性Sue作为物品之间关联的边,将物品作为节点构造网络,网络中只 存在物品,不存在用户,边的权值为Sue值; 6) :将所有物品均作为节点初始化置于空间(0,0)点,并在随后的算法步骤中分别调整 每个节点在空间上的位置; 7) :分别计算物品两两之间的引力与斥力: 计算斥力公式为:其中C是可调节经验参数,可W影响拓扑布局的速度。d是物品a与物品b之间的空间距 离,Da、化是在步骤5)中构造的物品网络中物品a与物品b的度值;物品a与物品b的引力引力 计算公式为:其中化是物品a在网络中的度值,Sap是物品a与b之间相关性,e是欧拉数; 8) :基于引力斥力计算结果,更新物品a与物品b在空间上的位置,新的坐标按照如下公 式更新:X'b = Xb-(Xa-Xb+目)· (fa+fr) y'b = yb-(ya-yb+目)·(fa+fr) 其中χ/ a是物品a新的X轴坐标,Xa是物品a在X轴上旧坐标,目是一个常数,当Xa-Xb声0时,目 =0,Xa-Xb = 0时,目=0.5,其他坐标含义类似; 9) :当(Xa-Xb+Θ)与(ya-yb+Θ)计算结果同时小于给定的ε,则判断物品a在空间的位置便 固定下来,在空间上布局算法在所有物品固定之后结束,否则,重复执行步骤7)和8),完成 在空间上的布局; 10) :完成空间上的布局后,对于目标用户化捜索或评分物品a,选定a在物品空间上坐 标(Xa,ya),Wr为半径,选定a的η个邻居,不包含曰,要求用户化对其中的每一个都评过分; 11) :依据下面公式对用户化捜索或评分物品a进行预测:其中和^分别是物品a与物品β的历史平均评分,η是物品a的邻居个数,是用户化 对物品a的预测评分值,即为用户化对物品β的评分,β属于物品a的η个邻居; 12) :将a的η个邻居中,评分预测最高的Ρ项推荐给用户化。
【文档编号】G06Q30/06GK106095978SQ201610443878
【公开日】2016年11月9日
【申请日】2016年6月20日
【发明人】艾均, 苏湛
【申请人】上海理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1