基于联邦学习的大数据隐私保护方法及系统

文档序号：37889855发布日期：2024-05-09 21:33阅读：26来源：国知局

本发明涉及数据安全，尤其涉及基于联邦学习的大数据隐私保护方法及系统。

背景技术：

1、数据安全是一个专注于保护数据免受非授权访问和处理的领域，这一领域的核心任务是确保在存储、处理和传输大量数据时，个人和企业的隐私和敏感信息得到充分保护，随着大数据的兴起，个人和企业面临越来越多的数据安全挑战，包括数据泄露、未授权访问和数据滥用，数据安全领域集中研究和开发各种技术和策略，以确保数据的机密性、完整性和可用性。这包括数据加密、访问控制、网络安全策略和合规性监管，旨在创建一个安全的数据环境，同时允许数据的合理利用。

2、其中，大数据隐私保护方法是指一系列旨在保护大数据环境中处理的数据不受非授权访问和使用的技术和策略，这些方法的目的是在保持数据可用性和分析能力的同时，保护个人隐私和敏感信息，这些方法的效果在于使企业和组织能够在利用大数据带来的优势的同时，减少隐私泄露的风险，确保遵守隐私保护的法律和道德标准。

3、传统大数据隐私保护方法依赖单一算法或简单模型，难以适应复杂多变的数据类型和场景，导致敏感信息的识别不够准确，隐私保护效果有限，传统方法在动态调整隐私等级和识别异常行为方面的灵活性和效率较低，这些局限性使得传统方法在实际操作中面临数据保护不全面、安全风险管理不到位等问题，导致数据泄露和隐私侵犯的风险增加。

技术实现思路

1、本发明的目的是解决现有技术中存在的缺点，而提出的基于联邦学习的大数据隐私保护方法及系统。

2、为了实现上述目的，本发明采用了如下技术方案：基于联邦学习的大数据隐私保护方法，包括以下步骤：

3、s1：基于联邦学习环境，采用自然语言处理和卷积神经网络，对文本和图像数据进行分析，生成数据特征识别结果；

4、s2：基于所述数据特征识别结果，采用随机森林和梯度提升机，构建跨节点模型，生成联邦学习模型；

5、s3：基于所述联邦学习模型，采用决策树算法和贝叶斯网络，结合数据特征和使用情境，动态分配隐私等级，生成动态等级方案；

6、s4：基于所述动态等级方案，采用支持向量机和长短期记忆网络，分析节点的数据处理和共享行为模式，生成行为模式分析结果；

7、s5：基于所述行为模式分析结果，采用k-均值聚类和孤立森林算法，识别偏离正常模式的行为，生成异常行为检测结果；

8、s6：基于所述异常行为检测结果，采用强化学习和逻辑回归，优化隐私保护策略，结合当前环境和历史数据调整策略，生成优化隐私保护策略；

9、s7：基于所述优化隐私保护策略，采用图数据库技术和dijkstra算法，进行数据流追踪和溯源分析，结合关联规则学习和贝叶斯网络，进行风险评估，生成数据溯源和风险评估结果；

10、所述数据特征识别结果包括敏感信息识别结果、数据类型分类、潜在隐私风险评估，所述联邦学习模型具体指各节点的数据特征学习模型，包括模型参数、学习效果评估、跨节点的协同学习结果，所述动态等级方案包括隐私级别分类、数据访问权限设置和根据使用情境的动态调整规则，所述行为模式分析结果包括节点行为模式分析、异常行为预测指标和行为模式的风险评估，所述异常行为检测结果包括识别出的异常行为列表、异常程度评级和潜在的安全威胁分析，所述优化隐私保护策略包括策略调整内容、预期效果评估和差异化情境应用指南，所述数据溯源和风险评估结果包括数据泄露路径追踪结果、泄露原因分析、对泄露事件影响范围和潜在风险的定量评估。

11、作为本发明的进一步方案，基于联邦学习环境，采用自然语言处理和卷积神经网络，对文本和图像数据进行分析，生成数据特征识别结果的步骤具体为：

12、s101：基于联邦学习环境，采用jieba分词，进行文本数据分词，并使用tf-idf算法，生成文本特征数据集；

13、s102：基于联邦学习环境，使用opencv，进行图像预处理，并应用sift算法，生成图像特征数据集；

14、s103：基于所述图像特征数据集和文本特征数据集，采用数据融合技术，整合文本和图像特征，并通过卷积神经网络，生成综合特征分析结果；

15、s104：基于所述综合特征分析结果，使用自然语言处理和对象识别算法，识别关键信息，生成数据特征识别结果。

16、作为本发明的进一步方案，基于所述数据特征识别结果，采用随机森林和梯度提升机，构建跨节点模型，生成联邦学习模型的步骤具体为：

17、s201：基于所述数据特征识别结果，使用设计模式算法，确定联邦学习模型的结构，并通过交叉验证，确定模型有效性，生成模型结构设计方案；

18、s202：基于所述模型结构设计方案，采用随机森林算法，对模型的特征进行学习，并通过梯度提升机，优化学习效果，生成特征学习训练结果；

19、s203：基于所述特征学习训练结果，使用网格搜索，进行模型参数优化，并通过验证集进行测试，生成优化模型参数；

20、s204：基于所述优化模型参数，采用模型融合技术，整合跨节点学习结果，并进行一致性验证，生成联邦学习模型。

21、作为本发明的进一步方案，基于所述联邦学习模型，采用决策树算法和贝叶斯网络，结合数据特征和使用情境，动态分配隐私等级，生成动态等级方案的步骤具体为：

22、s301：基于所述联邦学习模型，使用德尔菲法，确定隐私等级标准，并通过专家评审保证标准全面性，生成隐私等级标准；

23、s302：基于所述隐私等级标准，应用k-均值聚类，进行数据分类，并使用贝叶斯网络，评估隐私敏感度，生成数据分类与评估结果；

24、s303：基于所述数据分类与评估结果，采用决策树算法，制定隐私等级的动态调整规则，并进行模拟测试，生成等级动态调整规则；

25、s304：基于所述等级动态调整规则，使用应用部署技术，实施隐私等级方案，并进行效果评估，生成动态等级方案。

26、作为本发明的进一步方案，基于所述动态等级方案，采用支持向量机和长短期记忆网络，分析节点的数据处理和共享行为模式，生成行为模式分析结果的步骤具体为：

27、s401：基于所述动态等级方案，采用主成分分析，进行数据降维处理，生成预处理数据集；

28、s402：基于所述预处理数据集，使用支持向量机，对节点行为特征进行分类分析，生成支持向量机分析结果；

29、s403：基于所述预处理数据集，应用长短期记忆网络，分析时间序列数据，捕捉行为模式中的时间依赖特性，生成长短期记忆网络分析结果；

30、s404：基于所述支持向量机分析结果和长短期记忆网络分析结果，采用数据融合技术和多维度分析方法，评估节点的异常行为，生成行为模式分析结果。

31、作为本发明的进一步方案，基于所述行为模式分析结果，采用k-均值聚类和孤立森林算法，识别偏离正常模式的行为，生成异常行为检测结果；的步骤具体为：

32、s501：基于所述行为模式分析结果，采用k-均值聚类算法，对行为模式进行群体划分，识别差异化行为群体，生成聚类分析结果；

33、s502：基于所述聚类分析结果，应用孤立森林算法，对异常行为进行检测，生成孤立森林检测结果；

34、s503：基于所述孤立森林检测结果，运用异常评分算法，对节点的行为进行量化评分，判定异常程度，生成异常评分结果；

35、s504：基于所述异常评分结果、聚类分析结果和孤立森林检测结果，采用数据融合技术和多维度分析方法，评估节点的异常行为，生成异常行为检测结果。

36、作为本发明的进一步方案，基于所述异常行为检测结果，采用强化学习和逻辑回归，优化隐私保护策略，结合当前环境和历史数据调整策略，生成优化隐私保护策略的步骤具体为：

37、s601：基于所述异常行为检测结果，采用统计分析方法，评估当前隐私保护策略的效果，生成策略效果评估结果；

38、s602：基于所述策略效果评估结果，使用q学习算法，进行策略优化试验，模拟差异化保护策略的效果，生成强化学习优化结果；

39、s603：基于所述强化学习优化结果，运用逻辑回归分析策略，进行量化评估，生成逻辑回归分析结果；

40、s604：基于所述逻辑回归分析结果，采用决策树算法，对隐私保护策略进行分析，并结合当前环境和历史数据进行优化，通过评估策略的效果和适用性，生成优化隐私保护策略。

41、作为本发明的进一步方案，基于所述优化隐私保护策略，采用图数据库技术和dijkstra算法，进行数据流追踪和溯源分析，结合关联规则学习和贝叶斯网络，进行风险评估，生成数据溯源和风险评估结果的步骤具体为：

42、s701：基于优化隐私保护策略，使用图数据库neo4j，进行数据流追踪，记录数据的流向和交互，生成数据流追踪结果；

43、s702：基于所述数据流追踪结果，应用dijkstra算法，分析数据流动的路径和节点，生成路径分析结果；

44、s703：基于所述路径分析结果，采用apriori算法，进行关联规则学习，分析数据流动的模式和关联性，生成关联规则分析结果；

45、s704：基于所述关联规则分析结果，采用贝叶斯网络，进行风险评估，分析数据泄露风险，生成数据溯源和风险评估结果。

46、基于联邦学习的大数据隐私保护系统，所述基于联邦学习的大数据隐私保护系统用于执行上述基于联邦学习的大数据隐私保护方法，所述系统包括文本图像特征处理模块、联邦模型训练模块、动态隐私调整模块、节点行为分析模块、异常行为识别与评分模块、策略优化与风险分析模块。

47、作为本发明的进一步方案，所述文本图像特征处理模块基于联邦学习环境，采用jieba分词和opencv进行文本和图像处理，结合tf-idf算法和sift算法提取关键特征，生成综合特征数据集；

48、所述联邦模型训练模块基于综合特征数据集，使用设计模式算法和交叉验证构建联邦学习模型结构，通过随机森林算法和梯度提升机进行特征学习，生成模型训练结果；

49、所述动态隐私调整模块基于模型训练结果，采用德尔菲法和k-均值聚类确定隐私等级标准，通过决策树算法制定动态调整规则，生成隐私等级调整方案；

50、所述节点行为分析模块基于隐私等级调整方案，运用主成分分析进行数据降维，应用支持向量机和长短期记忆网络分析节点行为，生成行为模式综合分析结果；

51、所述异常行为识别与评分模块基于行为模式综合分析结果，通过孤立森林算法识别异常行为，结合异常评分算法对行为进行量化评估，生成异常行为评分结果；

52、所述策略优化与风险分析模块基于异常行为评分结果，采用q学习算法和逻辑回归进行策略优化，结合图数据库neo4j和dijkstra算法进行数据溯源，使用apriori算法和贝叶斯网络进行风险分析，生成风险评估与策略优化结果。

53、与现有技术相比，本发明的优点和积极效果在于：

54、本发明中，通过采用联邦学习环境、结合自然语言处理和卷积神经网络对文本和图像数据进行深入分析，提高了数据特征的识别精度，从而在敏感信息的检测和隐私保护方面效果显著，随机森林和梯度提升机的应用增强了模型的预测能力和准确性，使跨节点学习更加高效，通过决策树算法和贝叶斯网络的结合，能够灵活地根据数据特征和使用情境动态分配隐私等级，从而提供更为精准的数据保护，支持向量机和长短期记忆网络的运用在分析节点行为模式上显示出高效性，而k-均值聚类和孤立森林算法则有效地识别了异常行为，提高了安全性，强化学习和逻辑回归的结合为优化隐私保护策略提供了强有力的支撑，而图数据库技术和dijkstra算法的应用，在数据溯源和风险评估方面实现了高效的风险管理和控制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘斌,陈伟思,曹丽明,方天客
技术所有人：厦门理工学院
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。