大语言模型智能任务应用系统

文档序号：38038274发布日期：2024-05-17 13:26阅读：23来源：国知局

本技术涉及人工智能，特别涉及一种大语言模型智能任务应用系统。

背景技术：

1、随着chatgpt（chat generative pre-trained transformer，一种聊天机器人程序）发布，大语言模型的独特能力得到了充分的重视，应用开发者越来越倾向于将大语言模型集成到自己的应用中，用以完成一些复杂的智能任务。然而，由于大语言模型生成结果的不确定性和不准确性，仅依靠大语言模型本身能够提供的智能化服务非常有限。

2、相关技术如langchain等大语言模型应用框架，通过将大语言模型能力融入更复杂的计算流程中，用以完成更复杂的智能任务，提供更智能化的服务。

3、对话式大语言模型系统是一种以大语言模型为核心能力、能够提供对话式服务与用户进行交互的系统。它可以接受用户的输入，并生成相应的自然语言响应。用户可以通过简单的对话交互利用该系统完成各种简单的自然语言处理任务，例如语言理解、文本生成、机器翻译等。同时，用户也可以通过在输入内容中详细描述需求，利用对话式大语言模型系统完成知识问答、个性化推荐、代码编写等较复杂的智能任务。虽然该系统具备了大语言模型的核心能力，但受限于该系统较为单一的交互运行方式和较薄的后端设施，该系统难以支持用户快速、批量地完成具有一定复杂度的智能任务，并且不能够支持用户完成需要大量资料、超长上下文跨度的智能任务。

4、langchain是一个用于开发由语言模型驱动的应用程序的框架。它支持将大语言模型与外部数据源进行连接，并允许与大语言模型进行交互。它支持了多种复杂功能组件，例如文档知识库、数据库索引、命令执行器和接口调用器等。langchain围绕大语言模型的应用场景构建了一套应用开发框架和常用功能组件，开发者可以在这个框架内快速地开发较为复杂的智能任务应用。然而，langchain框架的核心始终是智能任务应用的快速构建，对于应用在规模化部署阶段的需求则不能满足。首先，langchain框架使用python这种弱类型脚本语言编写，脚本语言的特性决定了由它构建的应用存在天然的运行效率瓶颈，弱类型语言的特性决定了它在构建应用阶段能够进行的错误检查非常有限，也就是在运行阶段存在更大的错误风险。其次，langchain框架现阶段存在一些风险较大的安全漏洞，例如sql（structured query language，结构化查询语言）注入和命令穿透执行等，这在web应用程序中尤其危险，可能导致数据破坏和信息泄露风险。

5、综上，此类框架目前主要关注应用的快速开发，对应用本身的正确性和安全性等方面优化较少，因此由其搭建的智能任务应用尚不适用于实际的大规模部署场景。

技术实现思路

1、本技术提供一种大语言模型智能任务应用系统，以解决相关技术在部署阶段正确性、安全性不足的问题，通过分层系统设计和施加多种强类型约束，使得系统在具备易用性和可扩展性的同时，显著提升部署阶段的正确性和安全性。

2、本技术第一方面实施例提供一种大语言模型智能任务应用系统，包括：编程计算组件、基础组件、可复用组件和任务服务组件，其中，

3、所述编程计算组件，用于基于预设的强类型编程语言编写大语言模型智能任务应用系统的代码，并为所述基础组件、所述可复用组件和所述任务服务组件提供交互接口；

4、所述基础组件，用于基于预设的数据类型约束策略和预设的安全等级约束策略定义输入数据类型、输出数据类型、输入数据安全性级别和输出数据安全性级别，并基于所述输入数据安全性级别和所述输出数据安全性级别，利用所述交互接口与外部系统和/或外部数据源进行第一数据交互；

5、所述可复用组件，用于在构建工作流的图结构时，基于预设的校验策略，校验所有连通的节点的输入数据类型和输出数据类型是否匹配，并基于所述交互接口与所述外部系统和/或所述外部数据源进行第二数据交互；以及

6、所述任务服务组件，用于将工作流组合封装为智能任务，并提供向外的服务接口。

7、可选地，在一些实施例中，所述编程计算组件，包括：

8、强类型编程件，所述强类型编程件用于编写所述大语言模型智能任务应用系统的代码。

9、可选地，在一些实施例中，所述编程计算组件，还包括：

10、开发件，所述开发件用于为应用开发者提供开发环境；

11、算法库，所述算法库包括多种基础算法和数据结构；

12、并行计算框架，所述并行计算框架用于支持多线程计算，或者多进程计算，或者分布式计算。

13、可选地，在一些实施例中，所述开发件包括代码编辑器、编译器和调试器中的至少一种。

14、可选地，在一些实施例中，所述基础组件，包括：

15、组件输入输出数据类型约束件，用于定义所述输入数据类型和所述输出数据类型

16、组件输入输出安全等级约束件，用于定义和验证所述输入数据安全性级别和所述输出数据安全性级别。

17、可选地，在一些实施例中，所述基础组件，还包括：

18、数据处理件，用于对待处理数据进行数据清洗、数据转换和数据分析；

19、数据持久化件，所述数据持久化件用于对所述待处理数据进行持久化处理；

20、向外交互件，用于与所述外部系统和/或所述外部数据源进行第一数据交互；

21、大语言模型调用件，用于基于api调用策略和本地模型调用策略，调用各类大语言模型；

22、可视化件，用于提供数据可视化工具。

23、可选地，在一些实施例中，所述可复用组件，包括：

24、连通节点数据类型校验件，用于在构建所述工作流的图结构时，基于所述预设的校验策略，校验所有连通的节点中的下游节点的输入数据类型和上游节点的输出数据类型是否一致。

25、可选地，在一些实施例中，所述可复用组件，还包括：

26、流程管理件，用于定义所述工作流和/或执行所述工作流；

27、模板库，用于提供业务模板；

28、适配件，用于基于所述交互接口与所述外部系统和/或所述外部数据源进行所述第二数据交互。

29、可选地，在一些实施例中，所述任务服务组件向外提供的服务接口包括对话服务接口、知识库服务接口和智能体服务接口。

30、可选地，在一些实施例中，

31、所述编程计算组件设置于大语言模型智能任务应用系统的底层；

32、所述基础组件设置于所述编程计算组件上方；

33、所述可复用组件设置于所述基础组件上方；

34、所述任务服务组件设置于所述大语言模型智能任务应用系统顶层。

35、由此，通过编程计算组件基于预设的强类型编程语言编写大语言模型智能任务应用系统的代码，并为基础组件、可复用组件和任务服务组件提供交互接口；通过基础组件基于预设的数据类型约束策略和预设的安全等级约束策略定义输入数据类型、输出数据类型、输入数据安全性级别和输出数据安全性级别，并基于输入数据安全性级别和输出数据安全性级别，利用交互接口与外部系统和/或外部数据源进行第一数据交互；通过可复用组件在构建工作流的图结构时，基于预设的校验策略，校验所有连通的节点的输入数据类型和输出数据类型是否匹配，并基于交互接口与外部系统和/或外部数据源进行第二数据交互；通过任务服务组件将工作流组合封装为智能任务，并提供向外的服务接口。由此，解决了相关技术在部署阶段正确性、安全性不足的问题，通过分层系统设计和施加多种强类型约束，使得系统在具备易用性和可扩展性的同时，显著提升部署阶段的正确性和安全性。

36、本技术附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本技术的实践了解到。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：汪玉,宁雪妃
技术所有人：清华大学
我是此专利的发明人

上一篇：适用于多分辨率的低功耗微显示屏驱动电路及其驱动方法与流程
上一篇：一种化工气液分离设备

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。