基于模块化神经网络的动态推荐方法及系统

文档序号:37345937发布日期:2024-03-18 18:20阅读:10来源:国知局
基于模块化神经网络的动态推荐方法及系统

本发明属于动态推荐,具体涉及基于模块化神经网络的动态推荐方法及系统。


背景技术:

1、随着大数据和人工智能的迅猛发展,推荐系统在我们的日常生活中扮演着越来越重要的角色。推荐系统是一种利用用户的历史行为、偏好、特征等数据,为用户提供个性化的信息或产品的智能技术。推荐系统在电子商务、社交网络、新闻媒体等领域有着广泛的应用,可以帮助用户发现感兴趣的内容,提高用户的满意度和忠诚度,同时也可以为服务提供商增加流量和收入。

2、传统的推荐系统大多基于用户历史行为数据,如购买记录、浏览历史等,采用协同过滤或基于内容的推荐方法。然而,这些方法存在一定的局限性,如无法处理非结构化数据(如图像、音频)和难以适应用户偏好的动态变化。为了解决这些问题,需要一种基于神经网络的动态推荐方法。


技术实现思路

1、基于上述技术问题,本发明提供基于模块化神经网络的动态推荐方法及系统,该方法通过构建多模态深度神经网络提取更加全面的用户特征,动态调整推荐策略,提高推荐系统的效果和用户体验。

2、本发明提供基于模块化神经网络的动态推荐方法,所述方法包括:

3、步骤s1:采集用户数据;所述用户数据包括行为、图像和音频;

4、步骤s2:对所述用户数据进行多模态处理,得到用户潜在特征向量:

5、步骤s3:学习控制器并生成推荐器,计算用户偏好分数;

6、步骤s4:计算奖励值,更新所述控制器参数并优化所述推荐器,输出推荐结果;

7、步骤s5:设计隐私保护机制将所述推荐结果进行保护。

8、可选地,所述对所述用户数据进行多模态处理,得到用户潜在特征向量,具体包括:

9、构建多模态深度神经网络;所述多模态深度神经网络包括卷积神经网络、循环神经网络和多层感知器;

10、使用所述卷积神经网络处理所述图像,得到图像特征;使用所述循环神经网络处理所述音频,得到音频特征;使用所述多层感知器处理所述行为,得到行为特征;将所述图像特征、所述音频特征和所述行为特征进行拼接,得到用户特征向量;

11、将所述用户特征向量输入到注意力自编码器中进行特征表示,得到用户潜在特征向量,具体包括:

12、ei=f(hi,q)

13、

14、

15、z=fφ(uweighted)=sigmoid(weuweighted+be)

16、式中,ei为第i个模态特征向量的注意力得分;ej为第j个模态特征向量的注意力得分;hi为第i个模态特征向量;q为推荐任务查询向量;f为函数;αi为第i个模态特征向量权重;uweighted为加权用户特征向量;n为模态数量;z为用户潜在特征向量;φ为编码器参数;we和be分别为权重和偏置项。

17、可选地,所述学习控制器并生成推荐器,计算用户偏好分数,具体包括:

18、使用元学习算法学习控制器,生成神经网络结构作为推荐器;所述推荐器包括内容推荐模块、协同过滤推荐模块和知识图谱推荐模块;

19、所述内容推荐模块计算公式为:

20、

21、式中,ycbm为cbm模块用户对项目的偏好分数;z为用户潜在特征向量;ic为项目内容特征向量;wc和vc分别为权重矩阵;α和β分别为调节两个项重要性系数;σ为sigmoid激活函数;

22、所述协同过滤推荐模块计算公式为:

23、

24、式中,ycfm为cfm模块用户对项目的偏好分数;if为项目隐向量;wf和vf分别为权重矩阵;γ和δ分别为调节两个项重要性系数;

25、所述知识图谱推荐模块计算公式为:

26、

27、式中,ykgm为kgm模块用户对项目的偏好分数;ik为项目在知识图谱中的嵌入向量;wk和vk分别为权重矩阵;η和分别为调节两个项重要性系数;

28、用户偏好分数计算公式为:

29、y=ycbm+ycfm+ykgm

30、式中,y为用户偏好分数。

31、可选地,所述计算奖励值,更新所述控制器参数并优化所述推荐器,输出推荐结果,具体包括:

32、推荐器的奖励值计算公式为:

33、

34、式中,r为推荐器的奖励值;rrating为评分部分的奖励值;rclick为点击部分的奖励值;λ和μ为调节两部分重要性的系数;n为用户评分的项目数;m为用户点击的项目数;si为用户对第i个评分项目的评分;为用户对所有评分项目的平均评分;yj为推荐器对第j个点击项目的偏好分数;

35、动态选择推荐项目、推荐内容和推荐时机,输出推荐结果,具体包括:

36、所述推荐项目计算公式为:

37、

38、

39、式中,at为在时间步t选择的项目;a为所有项目的集合;为项目a的平均奖励;na为项目a被选择的次数;lnt为自然对数;t为总时间步;ra(t)为在时间步t选择项目a的奖励;

40、所述推荐内容计算公式为:

41、

42、式中,g为生成器,以随机向量v为输入,生成推荐内容x为输出;d为判别器,以推荐内容x为输入,输出概率值,表示x是真实的还是生成的;pdata(x)为真实推荐内容的分布;pv(v)为随机向量的分布;v(d,g)为价值函数,表示判别器和生成器的目标函数;

43、所述推荐时机计算公式为:

44、act=πθ(s)=softmax(fθ(s))

45、式中,πθ(s)为策略函数,以用户的状态s为输入,输出一个动作act的概率分布;θ为深度神经网络的参数;fθ为可学习函数,全连接层或者卷积层;softmax为归一化函数。

46、可选地,所述设计隐私保护机制将所述推荐结果进行保护,具体包括:

47、隐私保护机制公式为:

48、pr[mpd(da)=x]≤e∈pr[mpd(da′)=x]

49、式中,mpd为数据处理的机制;da和da′为两个相邻的数据集;x为推荐结果;pr[mpd(da)=x]和pr[mpd(da′)=x]分别为mpd在数据集da和da′得到输出x的概率;∈为调节参数,表示隐私保护程度;

50、∈参数调节公式为:

51、

52、式中,和ι为调节权重;sd为数据的敏感性,表示数据被泄露的风险;id为数据的重要性,表示数据对推荐效果的影响。

53、本发明还提供基于模块化神经网络的动态推荐系统,所述系统包括:

54、用户数据采集模块,用于采集用户数据;所述用户数据包括行为、图像和音频;

55、用户特征生成模块,用于对所述用户数据进行多模态处理,得到用户潜在特征向量:

56、用户偏好计算模块,学习控制器并生成推荐器,计算用户偏好分数;

57、推荐结果输出模块,用于计算奖励值,更新所述控制器参数并优化所述推荐器,输出推荐结果;

58、数据隐私保护模块,用于设计隐私保护机制将所述推荐结果进行保护。

59、可选地,所述用户特征生成模块,具体包括:

60、神经网络构建子模块,用于构建多模态深度神经网络;所述多模态深度神经网络包括卷积神经网络、循环神经网络和多层感知器;

61、特征向量生成子模块,用于使用所述卷积神经网络处理所述图像,得到图像特征;使用所述循环神经网络处理所述音频,得到音频特征;使用所述多层感知器处理所述行为,得到行为特征;将所述图像特征、所述音频特征和所述行为特征进行拼接,得到用户特征向量;

62、潜在特征表示子模块,用于将所述用户特征向量输入到注意力自编码器中进行特征表示,得到用户潜在特征向量,具体包括:

63、ei=f(hi,q)

64、

65、

66、z=fφ(uweighted)=sigmoid(weuweighted+be)

67、式中,ei为第i个模态特征向量的注意力得分;ej为第j个模态特征向量的注意力得分;hi为第i个模态特征向量;q为推荐任务查询向量;f为函数;αi为第i个模态特征向量权重;uweighted为加权用户特征向量;n为模态数量;z为用户潜在特征向量;φ为编码器参数;we和be分别为权重和偏置项。

68、可选地,所述用户偏好计算模块,具体包括:

69、推荐器生成子模块,用于使用元学习算法学习控制器,生成神经网络结构作为推荐器;所述推荐器包括内容推荐单元、协同过滤推荐单元和知识图谱推荐单元;

70、所述内容推荐单元计算公式为:

71、

72、式中,ycbm为cbm模块用户对项目的偏好分数;z为用户潜在特征向量;ic为项目内容特征向量;wc和vc分别为权重矩阵;α和β分别为调节两个项重要性系数;σ为sigmoid激活函数;

73、所述协同过滤推荐单元计算公式为:

74、

75、式中,ycfm为cfm模块用户对项目的偏好分数;if为项目隐向量;wf和vf分别为权重矩阵;γ和δ分别为调节两个项重要性系数;

76、所述知识图谱推荐单元计算公式为:

77、

78、式中,ykgm为kgm模块用户对项目的偏好分数;ik为项目在知识图谱中的嵌入向量;wk和vk分别为权重矩阵;η和分别为调节两个项重要性系数;

79、用户偏好分数计算公式为:

80、y=ycbm+ycfm+ykgm

81、式中,y为用户偏好分数。

82、可选地,所述推荐结果输出模块,具体包括:

83、奖励值计算子模块,推荐器的奖励值计算公式为:

84、

85、式中,r为推荐器的奖励值;rrating为评分部分的奖励值;rclick为点击部分的奖励值;λ和μ为调节两部分重要性的系数;n为用户评分的项目数;m为用户点击的项目数;si为用户对第i个评分项目的评分;为用户对所有评分项目的平均评分;yj为推荐器对第j个点击项目的偏好分数;

86、动态推荐子模块,动态选择推荐项目、推荐内容和推荐时机,输出推荐结果,具体包括:

87、所述推荐项目计算公式为:

88、

89、

90、式中,at为在时间步t选择的项目;a为所有项目的集合;为项目a的平均奖励;na为项目a被选择的次数;lnt为自然对数;t为总时间步;ra(t)为在时间步t选择项目a的奖励;

91、所述推荐内容计算公式为:

92、

93、式中,g为生成器,以随机向量v为输入,生成推荐内容x为输出;d为判别器,以推荐内容x为输入,输出概率值,表示x是真实的还是生成的;pdata(x)为真实推荐内容的分布;pv(v)为随机向量的分布;v(d,g)为价值函数,表示判别器和生成器的目标函数;

94、所述推荐时机计算公式为:

95、act=πθ(s)=softmax(fθ(s))

96、式中,πθ(s)为策略函数,以用户的状态s为输入,输出一个动作act的概率分布;θ为深度神经网络的参数;fθ为可学习函数,全连接层或者卷积层;softmax为归一化函数。

97、可选地,所述数据隐私保护模块,具体包括:

98、隐私保护机制公式为:

99、pr[mpd(da)=x]≤e∈pr[mpd(da′)=x]

100、式中,mpd为数据处理的机制;da和da′为两个相邻的数据集;x为推荐结果;pr[mpd(da)=x]和pr[mpd(da′)=x]分别为mpd在数据集da和da′得到输出x的概率;∈为调节参数,表示隐私保护程度;

101、∈参数调节公式为:

102、

103、式中,和ι为调节权重;sd为数据的敏感性,表示数据被泄露的风险;id为数据的重要性,表示数据对推荐效果的影响。

104、本发明与现有技术相比,具有以下有益效果:

105、本发明首先通过融合用户的行为、图像和音频等多种类型的数据,能够提供更为全面和精准的用户特征分析,强调多模态数据处理能力;其次利用元学习算法和注意力机制,能够适应用户偏好的实时变化,提供更加个性化的推荐,体现动态推荐适应性;然后融合内容推荐、协同过滤和知识图谱等多种推荐策略,使推荐结果更加丰富和准确,侧重综合推荐策略:最后通过设计的隐私保护机制,有效地保护用户数据和推荐结果的安全,降低数据泄露风险,起到隐私保护的作用。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1