基于纵向联邦学习的大模型安全调用方法和装置

文档序号：37923083发布日期：2024-05-11 00:02阅读：9来源：国知局

本发明涉数据安全和大模型安全领域，尤其涉及一种基于纵向联邦学习的大模型安全调用方法和装置。

背景技术：

1、大模型的应用带来了数据安全和隐私保护方面的挑战。在当前大模型应用中，通常需要客户端将自己的原始数据上传到服务器进行推理调用。由于上传的数据可能包含敏感信息，如个人身份、财务数据或商业机密，因此数据保护变得至关重要。同时，模型参数的安全性也同样重要，因为训练好的模型参数具有较高的价值，参数泄露可能造成损失或被滥用、攻击等。

2、为了解决这些安全性问题，本发明提出了一种基于纵向联邦学习的大模型安全调用方法和装置，以解决现有技术中大模型调用时客户端和服务器端(持有大模型一方)均存在的数据安全性较低的问题。这种方法的核心思想是将大模型利用纵向联邦学习(例如splitnn等)分成两部分，以解决客户端输入数据和模型参数的安全性，并充分利用大模型服务器的算力。

技术实现思路

1、本发明提供一种基于纵向联邦学习的大模型安全调用方法和装置，用以解决现有技术中大模型调用时数据安全性较低的问题，提高大模型调用过程中的数据安全性。

2、本发明提供一种基于纵向联邦学习的大模型安全调用方法，所述方法包括：

3、基于纵向联邦学习技术，将目标大模型拆分为第一子模型和第二子模型，其中，所述第二子模型部署于服务器端；

4、利用预设的安全计算方法，将客户端的原始数据在所述第一子模型中进行安全计算，以得到所述第一子模型输出的计算结果；

5、所述第二子模型基于所述第一子模型的计算结果在明文条件下计算输出值，以获得所述大模型的计算结果，从而实现大模型的安全调用。

6、在一些实施例中，预设的安全计算方法为基于可信执行环境的计算方法，利用预设的安全计算方法，将客户端的原始数据在所述第一子模型中进行安全计算，以得到所述第一子模型输出的计算结果，具体包括：

7、客户端初始化tee，进行远程认证建立本地可信通道，并与服务器端协商生成对称/公钥密码，构建双方通信安全信道；

8、在获取服务器端发送的所述第一子模型参数后，在tee安全计算环境中解密模型参数；

9、在tee安全环境中，基于解密后的模型参数，将客户端的原始数据输入所述第一子模型进行计算，并将计算结果进行加密输出发送给服务器端，服务器端获得到所述第一子模型的计算结果。

10、在一些实施例中，所述第二子模型基于所述第一子模型的计算结果在明文条件下计算输出值获得推理结果，具体包括：

11、基于与所述客户端构建的双方通信安全信道，接收来自客户端所述第一子模型的加密计算结果，解密获得的计算结果；

12、将解密后的计算结果输入所述第二子模型，以得到所述第二子模型的输出值，从而完成大模型的安全调用。

13、在一些实施例中，预设的安全计算方法为基于同态加密(homomorphicencryption，he)的计算方法，利用预设的安全计算方法，将客户端的原始数据在所述第一子模型中进行安全计算，以得到所述第一子模型输出的计算结果，具体包括：

14、通过远程认证建立客户端和服务器端的可信通道，并接收服务器端发送的he的公钥；

15、客户端通过可信通道接收来自服务器端发送的通过he加密的第一子模型参数，将客户端的原始数据输入所述第一子模型中进行计算，以得到所述第一子模型输出的计算结果。

16、在一些实施例中，所述第二子模型基于所述第一子模型的计算结果在明文条件下计算输出值，具体包括：

17、与客户端完成远程认证，生成he的公钥和私钥，并将公钥发送给客户端；

18、使用纵向联邦学习方法将大模型拆分为第一子模型和第二子模型，并使用he公钥将所述第一子模型参数加密并发给客户端；

19、服务器端收到客户端发送的所述第一子模型计算结果后，用he私钥解密所述第一子模型计算结果获得明文计算结果；

20、将解密后的计算结果输入第二子模型，以得到输出值。

21、在一些实施例中，预设的安全计算方法为基于安全多方计算(secure multi-party computation，mpc)的计算方法，利用预设的安全计算方法，将客户端的原始数据在所述第一子模型中进行安全计算，以得到所述第一子模型输出的计算结果，具体包括：

22、通过远程认证建立客户端和服务器端的可信通道，并协商确定mpc协议，接收服务器端发送的所述第一子模型的第一参数；

23、将客户端的原始数据使用所述mpc协议拆分为第一数据组和第二数据组；

24、利用所述第一数据组在所述第一子模型中进行计算，以得到所述第一子模型输出的第一计算结果；

25、将所述第一计算结果和所述第二数据组发送给服务器。

26、在一些实施例中，所述第二子模型基于第一计算结果和所述第二数据组来计算恢复所述第一子模型，并基于所述第一子模型计算结果来计算所述第二子模型计算结果，具体包括：

27、使用所述mpc协议将所述第一子模型的参数拆分为第一参数和第二参数，并将所述第一参数发送给客户端；

28、服务器基于接收到的所述第二数据组和持有的所述第二子模型份额计算所述第一子模型的第二计算结果，并基于所述来自客户端的第一计算结果恢复所述第一子模型的计算结果；

29、将恢复后的所述第一子模型的计算结果输入第二子模型，以得到输出值。

30、在一些实施例中，所述第一子模型的网络层数远远小于所述第二子模型的网络层数，所述第一子模型是靠近输入层的前几层。

31、本发明还提供一种基于纵向联邦学习的大模型安全调用装置，所述装置包括：

32、模型拆分单元，用于基于纵向联邦学习技术，将目标大模型拆分为第一子模型和第二子模型，其中，所述第二子模型部署于服务器端，第一子模型位于客户端或安全计算环境中；

33、数据处理单元，用于利用预设的安全计算方法，将客户端的原始数据在所述第一子模型中进行安全计算，以得到所述第一子模型输出的计算结果；

34、计算推理单元，用于使所述第二子模型基于所述第一子模型计算结果在明文条件下计算输出值，完成所述大模型的安全调用。

35、本发明还提供一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现上述任一项所述基于纵向联邦学习的大模型安全调用方法。

36、本发明提供的基于纵向联邦学习的大模型安全调用方法和装置，通过基于纵向联邦学习技术，将目标大模型拆分为第一子模型和第二子模型，其中，所述第二子模型部署于服务器端；利用预设的安全计算方法，将客户端的原始数据在所述第一子模型中进行安全计算，以得到所述第一子模型输出的计算结果；所述第二子模型基于所述第一子模型的计算结果在明文条件下计算输出值，以获得所述大模型的计算结果，从而实现大模型的安全调用。该方法和装置通过将大模型纵向拆分成两个子模型，并将两个子模型分别布置在客户端和服务器端，客户端的原始数据经过安全计算后，再将计算结果传输至服务器端，服务器端经过安全计算后，将生成的调用指令发给大模型，从而实现大模型调用，实现了在客户端保护数据安全和模型方保护模型参数不共享的前提下进行大模型的调用。解决了现有技术中大模型调用时数据安全性较低的问题，提高了大模型调用过程中的数据安全性。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘洋,普艳红,邹恬圆
技术所有人：清华大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。