一种基于多通道去噪的社交网络活动推荐系统及方法

文档序号:37716577发布日期:2024-04-23 11:47阅读:13来源:国知局
一种基于多通道去噪的社交网络活动推荐系统及方法

本发明属于信息推荐和数据挖掘领域,具体涉及一种基于多通道去噪的社交网络活动推荐系统及方法。


背景技术:

1、一般来说,在社交推荐系统中,如果用户与物品的互动很少,系统会根据该用户朋友的互动来推断该用户的偏好,并产生更好的推荐,但是大部分情况下,用户之间的互动很少甚至存在用户中没有明显的互动关系的情况,同时用户参与活动的意愿不高涨,从而用户关系数据和用户活动互动数据缺失,导致社交推荐系统中依旧存在数据稀疏问题,因此在社交推荐系统中通常需要进行数据增强并补充相关的数据信息。

2、然而,另一个在社交推荐系统中很少被探索的重要问题是在社交推荐环境中存在冗余甚至嘈杂的社交关系。而不适宜的社交关系对于社交推荐来说可能是多余的,甚至是有害的。如果用这样的关系数据来描述整个社交网络的社交影响,不仅对数据计算带来负担,更重要的是对推荐准确性产生负面影响,因此导致推荐质量不高,但现有的技术中一般都不会考虑该问题。

3、中国专利“cn117235376a基于transformer编码器和深度学习的社交推荐系统”提供了一种基于transformer编码器和深度学习的社会化推荐技术,实现利用用户的社交信息数据准确的完成商品推荐的功能;其中,用户社交信息的序列特征采用transformer编码器提取实现,商品推荐采用深度学习多层感知机技术实现,但采用transformer编码器技术会导致局部信息的获取能力不强且顶层梯度容易消失;

4、中国专利“cn116842277a一种基于跨主题对比学习的社交推荐方法”提供了一种基于跨主题对比学习的社交推荐技术,获取推荐系统中的用户物品交互图;进行物品表示学习,并进行物品聚类划分主题;跨主题对比构建基于主题的社交关系;基于平衡理论,主题内基于sgcn信息传播;遵循扩展结构平衡理论,在不同主题下构建自监督任务的目标函数;在推荐任务中采用贝叶斯个性化排名损失,结合跨主题对比学习的目标函数和基于平衡理论的自监督任务目标函数,确定推荐系统的总损失函数;基于总损失函数训练推荐系统,得到考虑用户差异的推荐结果;

5、但是仅仅采用对比学习的方法无法保证数据表征的完整性和数据有效性,没有处理数据的冗余性和无效性。


技术实现思路

1、针对社交推荐系统中存在数据稀疏和社交关系冗余嘈杂的问题,本发明提出一种基于多通道去噪的社交网络活动推荐系统及方法;不仅能减少对大量的高维数据建模的成本,生成较为完整的用户表示,获取更为完整的数据信息,还能提高数据质量,减少社交关系冗余问题,充分提取高维数据的丰富信息,进行鲁棒去噪,能够提高实用性,明确目标对象,提高服务的关联性和准确性,从而实现提高社交网络平台系统推荐价值的目的。

2、一种基于多通道去噪的社交网络活动推荐系统,设置于计算机中,包括:社交活动数据处理模块、用户活动构建模块、用户信任关系构建模块、用户活动去噪模块、用户信任关系去噪模块、用户活动计算模块、用户信任值计算模块和用户推荐模块;

3、所述社交活动数据处理模块,获取社交活动数据,包括目标用户-其他用户和目标用户-活动数据,对目标用户-其他用户和目标用户-活动数据所对应的词条进行处理,构建矩阵;

4、所述用户活动构建模块提取经社交活动数据处理模块的目标用户-活动数据,并通过多通道构建方法得到目标用户-活动数据集合;

5、所述用户信任关系构建模块提取经社交活动数据处理模块的目标用户-其他用户的交互关系,包括点击关系,关注关系,浏览关系和分享关系,最终以多通道构建方法得到目标用户-其他用户数据集合;

6、所述用户活动去噪模块删去目标用户-活动数据集中冗余数据和与整体数据集偏差过大的数据即噪声;

7、所述用户信任关系去噪模块删去目标用户-其他用户数据集合中冗余数据和与整体数据集偏差过大的数据即噪声;

8、所述用户活动计算模块利用去噪后的目标用户-活动数据计算用户和活动的交互关系,确定目标用户与用户参与的活动的总体交互值;

9、所述用户信任值计算模块利用去噪后的目标用户-其他用户数据计算目标用户与其他用户之间的交互关系,确定目标用户与其他用户的总体信任值;

10、所述用户推荐模块对目标用户和用户未参与的新活动进行评分,将计算结果得分从大到小进行排序,提取前几名活动对目标用户进行推荐;

11、一种基于多通道去噪的社交网络活动推荐方法,基于上述一种基于多通道去噪的社交网络活动推荐系统实现,具体包括以下步骤:

12、步骤1、采用社交活动数据处理模块获取目标用户-其他用户和目标用户-活动数据,对其对应的词条构建目标用户-其他用户和目标用户-活动数据矩阵;

13、步骤2、采用用户活动构建模块和用户信任关系构建模块提取目标用户-活动数据和目标用户-其他用户数据,并通过多通道构建方法得到用户-活动数据集合和目标用户-其他用户数据集合;

14、步骤2-1、基于e-motif构建各通道的数据关系,即构建目标用户-其他用户关系、目标用户-活动关系、目标用户-其他用户潜在关系;以上关系中均用三角关系来进行建模;

15、其中目标用户-其他用户关系中以三个用户之间关系进行构建,每个用户之间存在不同的单向或双向关系,因此构建不同的三角关系,以m1-m7为同一种通道的不同三角关系进行表示;

16、目标用户-活动关系中以两个用户和一种活动之间关系进行构建,用户和活动之间存在不同的单向或双向关系,因此构建不同的三角关系,以m8-m9为同一种通道的不同三角关系进行表示;

17、目标用户-其他用户潜在关系中以两个用户及一种活动之间关系进行构建,与目标用户-活动关系不同的是,用户之间不存在明显关系,同样构建三角关系,以m10为一种通道进行计算;

18、m1-m10三角关系如下:

19、m1:用户a浏览用户b,用户b浏览用户c,用户c浏览用户a;

20、m2:用户a浏览用户b,用户b浏览用户c,用户c浏览用户b,用户c浏览用户a;

21、m3:用户a浏览用户b,用户b浏览用户c,用户c浏览用户b,用户c浏览用户a,用户a浏览用户c;

22、m4:用户a浏览用户b,用户b浏览用户a,用户b浏览用户c,用户c浏览用户b,用户c浏览用户a,用户a浏览用户c;

23、m5:用户a浏览用户b,用户b浏览用户c,用户a浏览用户c;

24、m6:用户b浏览用户a,用户b浏览用户c,用户c浏览用户a,用户a浏览用户c;

25、m7:用户a浏览用户b,用户c浏览用户b,用户c浏览用户a,用户a浏览用户c;

26、m8:用户a浏览用户c,用户a参与活动b,用户c浏览用户a,用户c参与活动b;

27、m9:用户a浏览用户c,用户a参与活动b,用户c参与活动b;

28、m10:用户a参与活动b,用户c参与活动b;

29、m1:c=(uu)⊙ut;对称矩阵am1=c+ct;

30、m2:c=(bu)⊙ut+(ub)⊙ut+(uu)⊙b;对称矩阵am2=c+ct;

31、m3:c=(bb)⊙u+(bu)⊙b+(ub)⊙b:对称矩阵am3=c+ct;

32、m4:c=(bb)⊙b;对称矩阵am4=c;

33、m5:c=(uu)⊙u+(uut)⊙u+(utu)⊙u;对称矩阵am5=c;

34、m6:c=(ub)⊙u+(utb)⊙ut+(utu)⊙b:对称矩阵am6=c;

35、m7:c=(bu)⊙u+(utb)⊙ut+(uut)⊙b;对称矩阵am7=c;

36、m8:c=rrt⊙b:对称矩阵am8=c+ct;

37、m9:c=rrt⊙u;对称矩阵am9=c;

38、m10:c=rrt;对称矩阵am10=c;

39、其中,b指的是双向社交网络的邻接矩阵,u指的是单向社交网络的邻接矩阵,r指的是用户-活动的关系邻接矩阵;

40、令b=s⊙st且u=s-b分别为双向和单向社交网络的邻接矩阵;s指目标用户-其他用户关系对称矩阵,同时使用amk表示基于e-motif的邻接矩阵,并且(amk)i,j=1表示顶点i和顶点j出现在mk的一个实例;由于两个顶点出现在mk的多个实例中,(amk)i,j的计算公式为:

41、(amk)i,j=#(i,j出现在mk的同一个实例中)

42、am10相对am1-am9密集,能过滤掉不必要的重复冗余活动数据;在计算am10时,热门项目即显示数据不反映用户的个性化偏好,并删除am10中小于阈值的项目以保持有效计算;对于对称形式,am=c,对于不对称图案,am=c+ct;显然,在不考虑自连接的情况下,am1到am7的求和等于hshst,因为hshst∈rm×m的每一个条目也表示有多少个社交三角形包含该条目的行、列索引所表示的节点对;am8到am9的和等于hjhjt,不采用自连接,am10等于hphpt;根据am1的计算,看出uu构造了一条连接三个顶点的单向路径,⊙u的运算使路径形成一个闭环;因为am10也包含am8和am9中的三角形,所以从am10删除冗余;最后使用aj=am8+am9和ap=am10-aj取代hshst,hjhjt,和hphpt;其中hs代表的社交通道(s)的超图矩阵,hj代表的联合通道(j)的超图矩阵,hp代表的交互通道(r)的超图矩阵;并将超图卷积定义为:

43、

44、为ac的对角矩阵;因此该式是超图卷积的简化代换;

45、步骤2-2、基于e-motif构建多通道的数据表征,通过使用多个通道设置,包括‘社交通道(s)’,‘联合通道(j)’和‘交互通道(r)’,以响应不同的模式,且通道的数量能进行调整;为了得到用户表征p(0),设计一个带有门控机制的预过滤器,定义:

46、

47、其中,是要学习的参数,c∈{s,j,p}表示通道,⊙表示点乘,σ为sigmod函数;门控机制采用乘法跳跃连接并通过学习非线性门控,通过维度重加权在特征上进行调整形成基本用户嵌入,最后获得特定通道的用户嵌入

48、步骤2-3、将超图卷积最终定义为:

49、

50、首先通过将hc替换为hs,hj和hp中的任何一个,由此借用超图卷积网络来学习相应通道中编码高阶信息的用户表征;

51、步骤3、重复步骤2获取所有目标用户的活动数据集合和用户信任数据集合;

52、步骤3-1、目标用户的活动数据表征和用户信任数据表征;

53、在通过l层传播用户嵌入后,将对每层获得的嵌入进行平均,形成最终的通道特定用户表示:以避免过度平滑问题;然后再使用注意机制选择性地聚合来自不同渠道特定用户嵌入的信息,形成综合用户嵌入;对于每个用户u,学习一个三元组(αs,αj,αp)来衡量三个特定信道嵌入对最终推荐性能的不同贡献;fatt注意函数的定义:

54、

55、α∈rd和watt∈rd×d是可训练的参数,并综合用户表示

56、步骤3-2、在目标用户-活动数据和目标用户-其他用户数据上执行图卷积来编码用户参与信息,并补充多通道超图卷积,该图卷积的定义:

57、

58、

59、是封闭的用户映射进行的图卷积,是综合用户嵌入,du∈rm×m和di∈rn×n的度矩阵为r和rt;

60、步骤4、采用用户活动去噪模块、用户信任关系去噪模块用于对用户-活动数据和用户-其他用户数据进行去噪,得到质量更好的用户活动集合,从而获取更为简单有效的数据表征;

61、步骤4-1、提出一个偏好引导的社交图去噪网络来解决社交推荐背景下的社交关系冗余问题,置信社交图去噪网络训练;给定一个预测两个用户之间的置信得分ru,v,链路预测问题的目标是最小化bce交叉损失函数:

62、

63、步骤4-2、在利用用户偏好作为社交图去噪的指导信号方面,为了更好地利用步骤3得到的图卷积,采用基于偏好的关系置信社交图去噪网络;为了确保用户偏好简单且有效的去噪,使用交互过程来表征用户间的关系置信度;数学上,ru,v计算如下:

64、

65、采用transformer模块,以trf函数进行表示,来用于建模用户交互过程的相似性;具体来说,输入是单个通道的数据嵌入(表示为sl(·))的连接,分别表示u和v的交互历史,每个通道数据嵌入都有固定的长度l;由于在计算社交关系置信度时不需要位置信息,因此不需要在transformer中应用位置编码;对于输出,在输入序列的末尾添加一个语义特征向量,并使用相应的transformer编码的嵌入向量采用mlp计算ru,v;

66、步骤5、采用用户活动计算模块、用户信任值计算模块确定目标用户-其他用户、目标用户-活动之间的信任值;

67、获得的用户嵌入p和项目嵌入q:

68、

69、p(0)和q(0)是随机初始化;

70、步骤6、采用用户推荐模块对目标用户和其他活动进行评分,将计算结果得分从大到小进行排序,提取前几名活动作为目标用户进行推荐;

71、采用贝叶斯个性化排名bpr损失,即成对损失,促使每一个观察项排名高于未被注意的同行项:

72、

73、其中φ表示推荐系统中的参数,是根据i所预测的评分,σ(·)则是sigmod函数;

74、每次将一个三元组,包括当前用户u、由用户u参与的正项目i以及从用户u不喜欢或不相干的负项目j进行随机采样的数据交由推荐系统mdhcn进行训练,推荐系统是对推荐列表中将排名项目i高于j的方向进行优化计算;此外,加入正则化参数l2与超参数λ,以减少训练误差。

75、本发明有益技术效果:

76、本发明提出了一种基于多通道去噪的社交网络活动推荐系统及方法,本发明针对目前基于图卷积的推荐方法存在的用户关系及用户-活动关系数据稀疏的问题,补充隐式语义信息和活动关系信息,利用超图卷积网络结构,采用多通道方式生成用户关系和用户-活动关系嵌入表示,并采用图注意力网络思想,针对每个邻居实体节点学习目标实体节点语义能力不同,利用注意力机制区分连接相邻节点的关系的重要程度,从而根据不同的重要程度将邻居节点信息聚合到目标实体中,增强了项目的嵌入表示,从而缓解数据稀疏的问题。

77、其次提出社交去噪模块进行数据去噪,为去除冗余及无用数据,增强数据有效性从而提高推荐准确性;其中社交去噪模块在利用用户偏好作为社交图去噪的指导信号方面,为了更好地利用有用的知识,该模块采用基于偏好的关系置信模型;为了确保用户偏好简单且有效的去噪,于是提出该模块使用交互过程来表征用户间的关系置信度从而实现社交关系的去噪,即基于偏好的显式关系和来自偏好学习的隐式关系共同监督,提升推荐准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1