本发明涉及隐私保护,尤其涉及一种第三方大语言模型的访问方法及网关服务器。
背景技术:
1、随着chatgpt等大语言模型迅速发展,大量用户开始使用这些大语言模型的云端服务,例如进行代码开发以及辅助完成一些文档的撰写。用户在使用大模型的过程中,交互数据中可能包含各种个人或者企业的敏感信息,比如pii和企业的密钥等,在与大模型的交互过程中有可能会导致机密数据外泄。针对这一情况,行业内亟需一种有效的解决方案。
技术实现思路
1、本说明书的一个或多个实施例提供了一种第三方大语言模型的访问方法及网关服务器,能够实现在用户终端访问大模型的过程中,对用户敏感数据的识别及保护。
2、第一方面,提供了一种第三方大语言模型的访问方法,包括:
3、设置网关服务器;
4、利用所述网关服务器拦截用户终端发送的访问目标第三方大语言模型的访问请求;
5、利用所述网关服务器,根据所述访问请求在预先构建的敏感数据文本库中进行文本匹配检索,确定所述访问请求中是否存在敏感数据;
6、若所述访问请求中存在所述敏感数据,则利用所述网关服务器采用预先配置的脱敏策略对所述敏感数据进行脱敏处理。
7、作为第一方面所述方法的一种可选实施方式,利用所述网关服务器拦截用户终端发送的访问目标第三方大语言模型的访问请求,具体包括:
8、通过所述网关服务器监听所述用户终端发出的所有访问请求;
9、若所述访问请求中的访问地址与所述目标第三方大语言模的访问地址一致,则所述网关服务器拦截所述访问请求;
10、若所述访问请求中的访问地址与所述目标大模型的访问地址不一致,则所述网关服务器放行所述访问请求。
11、作为第一方面所述方法的一种可选实施方式,所述敏感数据文本库部署在所述网关服务器中;所述敏感数据文本库中存储有文档样本,所述文档样本具有敏感数据标签,所述敏感数据标签用于表征所述文当样本是否为敏感数据。
12、具体来说,利用所述网关服务器,根据所述访问请求在预先构建的敏感数据文本库中进行文本匹配检索,确定所述访问请求中是否存在敏感数据,具体包括:
13、针对所述敏感数据文本库中的每一个文档样本,确定所述文档样本与所述访问请求的相似度;
14、基于所述文档样本与所述访问请求的相似度,确定与所述访问请求的相似度大于预设相似度阈值的文档样本集合;
15、从所述文档样本集合中选取与所述访问请求的相似度最低的n个文档样本;
16、基于所述n个文档样本的敏感数据标签,确定所述访问请求中是否存在敏感数据。
17、第二方面,提供了一种网关服务器,用于对通信连接于所述网关服务器的用户终端的访问行为进行管控,包括:
18、拦截所述用户终端发送的访问目标第三方大语言模型的访问请求;
19、根据所述访问请求,在预先构建的敏感数据文本库中进行文本匹配检索,确定所述访问请求中是否存在敏感数据;
20、若所述访问请求中存在所述敏感数据,则采用预先配置的脱敏策略对所述敏感数据进行脱敏处理。
21、作为第二方面所述网关服务器的一种可选实施方式,所述网关服务器具体用于:
22、监听所述用户终端发出的所有访问请求;
23、若所述访问请求中的访问地址与所述目标第三方大语言模的访问地址一致,则拦截所述访问请求;
24、若所述访问请求中的访问地址与所述目标大模型的访问地址不一致,则放行所述访问请求。
25、作为第二方面所述网关服务器的一种可选实施方式,其中,所述敏感数据文本库部署在所述网关服务器本地;所述敏感数据文本库中存储有文档样本,所述文档样本具有敏感数据标签,所述敏感数据标签用于表征所述文当样本是否为敏感数据。
26、更具体的,所述网关服务器具体用于:
27、针对所述敏感数据文本库中的每一个文档样本,确定所述文档样本与所述访问请求的相似度;
28、基于所述文档样本与所述访问请求的相似度,确定与所述访问请求的相似度大于预设相似度阈值的文档样本集合;
29、从所述文档样本集合中选取与所述访问请求的相似度最低的n个文档样本;
30、基于所述n个文档样本的敏感数据标签,确定所述访问请求中是否存在敏感数据。
31、第三方面,提供了一种通信系统,包括:
32、用户终端、第三方大语言模型服务器以及上述的网关服务器;
33、所述用户终端通过所述网关服务器与所述第三方大语言模型服务器交互数据。
34、第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器实现上述的网关服务器的功能。
35、第五方面,提供了一种电子设备,包括:
36、一个或多个处理器;以及与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,使得所述电子设备实现上述的网关服务器的功能。
37、本说明书一个或多个实施例所述的第三方大语言模型的访问方法的有益效果在于,通过在用户终端一侧设置网关服务器来对用户终端访问第三方大语言模型服务器的访问请求进行拦截和识别,并利用网关服务器对识别出的敏感数据进行脱敏处理,实现对用户隐私数据的保护。
38、本说明书实施例所述的网关服务器、通信系统、计算机可读存储介质及电子设备也具有上述有益效果。
1.一种第三方大语言模型的访问方法,包括:
2.如权利要求1所述的方法,利用所述网关服务器拦截用户终端发送的访问目标第三方大语言模型的访问请求,具体包括:
3.如权利要求1所述的方法,所述敏感数据文本库部署在所述网关服务器中;所述敏感数据文本库中存储有文档样本,所述文档样本具有敏感数据标签,所述敏感数据标签用于表征所述文当样本是否为敏感数据。
4.如权利要求3所述的方法,利用所述网关服务器,根据所述访问请求在预先构建的敏感数据文本库中进行文本匹配检索,确定所述访问请求中是否存在敏感数据,具体包括:
5.一种网关服务器,用于对通信连接于所述网关服务器的用户终端的访问行为进行管控,包括:
6.如权利要求5所述的网关服务器,所述网关服务器具体用于:
7.如权利要求5所述的网关服务器,其中,所述敏感数据文本库部署在所述网关服务器本地;所述敏感数据文本库中存储有文档样本,所述文档样本具有敏感数据标签,所述敏感数据标签用于表征所述文当样本是否为敏感数据。
8.如权利要求6所述的网关服务器,所述网关服务器具体用于:
9.一种通信系统,包括:
10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器实现如权利要求5至8任一项所述的网关服务器的功能。
11.一种电子设备,包括: