一种基于大规模语言模型的家居环境任务分解方法及系统

文档序号：37658025发布日期：2024-04-18 20:31阅读：4来源：国知局

本发明属于人工智能，特别涉及一种基于大规模语言模型的家居环境任务分解方法及系统。

背景技术：

1、近年来，人工智能技术飞速发展，催生了大规模语言模型；大规模语言模型经过海量多元数据的深度训练，具备了为各种复杂任务制定行动策略的卓越能力。

2、目前，致力于研究的方向是，在家居环境中利用大规模语言模型将用户的高级自然语言命令转化为可行的操作步骤；示例性的，如将“带来水”分解为“拿起杯子”、“往杯子里倒水”、“走到桌子旁”、“将杯子放在桌子上”等一系列具体行动操作。

3、现有技术中，对于简单任务，大规模语言模型能够直接生成逻辑合理的动作序列；但是，由大规模语言模型生成的动作序列，并不总是能够在智能体所处的当前环境执行，生成的步骤并非始终适用于实际操作。上述问题主要是因为大规模语言模型仅在大型文本语料库上进行训练，缺少与具体环境的互动，生成的动作序列缺乏关于智能体当前环境和实际能力的上下文信息；因此，亟需一种新的任务分解方案。

技术实现思路

1、本发明的目的在于提供一种基于大规模语言模型的家居环境任务分解方法及系统，以解决上述存在的一个或多个技术问题。本发明具体公开了一种融合环境信息的任务分解方案，解决了大规模语言模型在生成操作步骤时缺少上下文信息的技术问题，能够更好应对任务的多样性和复杂性。

2、为达到上述目的，本发明采用以下技术方案：

3、本发明提供的一种基于大规模语言模型的家居环境任务分解方法，包括以下步骤：

4、获取待分解家居环境任务的名称；大规模语言模型获取所述待分解家居环境任务的名称，输出与待分解家居环境任务相关的物体名称；第一翻译语言模型获取所述与待分解家居环境任务相关的物体名称，输出物体名称在家居环境中的映射；

5、大规模语言模型获取所述待分解家居环境任务的名称、所述物体名称在家居环境中的映射以及与待分解家居环境任务最相似的任务的名称、分解结果，输出待分解家居环境任务的初步结果；通过第二翻译语言模型将初步结果的动作映射到家居环境允许的动作空间，获得待分解家居环境任务的最终分解结果。

6、本发明方法的进一步改进在于，所述待分解家居环境任务对应的家居环境图以节点和边的形式保存环境中的物体信息；

7、其中，每个节点均代表环境中的一个物体对象，包含对象名称、数字标识符、坐标、对象边界以及状态；每条边代表两个物体之间的空间关系。

8、本发明方法的进一步改进在于，所述第一翻译语言模型获取所述与待分解家居环境任务相关的物体名称，输出物体名称在家居环境中的映射的步骤具体包括：

9、所述第一翻译语言模型基于家居环境图，对获取的物体名称与环境中的物体名称oe做嵌入，得到向量和f(oe)；通过余弦相似度计算二者的语义距离，其中，f表示嵌入函数，表示物体名称向量的点积，和||f(oe)||分别表示向量和f(oe)的向量长度；

10、通过计算，得到物体名称在家居环境中的映射。

11、本发明方法的进一步改进在于，所述与待分解任务最相似的任务的名称、分解结果，是基于当前家居环境示例数据集获得的；

12、其中，所述示例数据集中存储有已执行过的、任务完成正确率高于预设阈值的任务信息；所述任务信息包括任务名称、作为分解结果的分解后任务序列。

13、本发明方法的进一步改进在于，所述通过第二翻译语言模型将初步结果的动作映射到家居环境允许的动作空间，获得待分解家居环境任务的最终分解结果的步骤包括：

14、使用第二翻译语言模型对初步结果的动作与环境允许的动作空间ae做嵌入，得到向量和f(ae)；通过余弦相似度计算二者的语义距离，其中，f表示嵌入函数，表示动作向量的点积，和||f(ae)||分别表示向量和f(ae)的向量长度；

15、通过计算，得到待分解家居环境任务的最终分解结果。

16、本发明提供的一种基于大规模语言模型的家居环境任务分解系统，包括：

17、环境观测单元，包括大规模语言模型和第一翻译语言模型；其中，所述大规模语言模型用于获取待分解家居环境任务的名称，输出与待分解家居环境任务相关的物体名称；所述第一翻译语言模型用于获取所述与待分解家居环境任务相关的物体名称，输出物体名称在家居环境中的映射；

18、推理分析单元，包括大规模语言模型和第二翻译语言模型；其中，所述大规模语言模型用于获取所述待分解家居环境任务的名称、所述物体名称在家居环境中的映射以及与待分解家居环境任务最相似的任务的名称、分解结果，输出待分解家居环境任务的初步结果；所述第二翻译语言模型用于将初步结果的动作映射到家居环境允许的动作空间，获得待分解家居环境任务的最终分解结果。

19、本发明系统的进一步改进在于，所述待分解家居环境任务对应的家居环境图以节点和边的形式保存环境中的物体信息；

20、其中，每个节点均代表环境中的一个物体对象，包含对象名称、数字标识符、坐标、对象边界以及状态；每条边代表两个物体之间的空间关系。

21、本发明系统的进一步改进在于，所述第一翻译语言模型中，获取所述与待分解家居环境任务相关的物体名称，输出物体名称在家居环境中的映射的步骤具体包括：

22、所述第一翻译语言模型基于家居环境图，对获取的物体名称与环境中的物体名称oe做嵌入，得到向量和f(oe)；通过余弦相似度计算二者的语义距离，其中，f表示嵌入函数，表示物体名称向量的点积，和||f(oe)||分别表示向量和f(oe)的向量长度；

23、通过计算，得到物体名称在家居环境中的映射。

24、本发明系统的进一步改进在于，所述与待分解任务最相似的任务的名称、分解结果，是基于当前家居环境示例数据集获得的；

25、其中，所述示例数据集中存储有已执行过的、任务完成正确率高于预设阈值的任务信息；所述任务信息包括任务名称、作为分解结果的分解后任务序列。

26、本发明系统的进一步改进在于，所述第二翻译语言模型中，将初步结果的动作映射到家居环境允许的动作空间，获得待分解家居环境任务的最终分解结果的步骤包括：

27、通过第二翻译语言模型对初步结果的动作与环境允许的动作空间ae做嵌入，得到向量和f(ae)；通过余弦相似度计算二者的语义距离，其中，f表示嵌入函数，表示动作向量的点积，和||f(ae)||分别表示向量和f(ae)的向量长度；

28、通过计算，得到待分解家居环境任务的最终分解结果。

29、与现有技术相比，本发明具有以下有益效果：

30、本发明提供了一种基于大规模语言模型的家居环境任务分解方法，该方法分为环境观测和模型推理两个步骤；其中，在环境观测步骤，利用大规模语言模型与第一翻译语言模型，对家居环境的信息进行提取分析，通过对当前场景的观察，获取丰富的环境信息，从而获取对环境的准确而全面的认知，提高对复杂任务的适应性和执行效率；在模型推理步骤，利用大规模语言模型与第二翻译语言模型，结合环境观测部分得到的环境信息内容与预设的动作空间，得到正确率更高、更适用于实际操作的任务分解结果。综上，本发明通过利用预训练的大规模语言模型的丰富先验知识，生成关于任务的详细指导，为系统提供了高度智能的决策支持，能够更好地应对任务的多样性和复杂性。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘妹琴,兰夏瑞琪,陈霸东
技术所有人：西安交通大学
我是此专利的发明人

上一篇：一种磁性材料夹持进料装置的制作方法
上一篇：螺旋藻采收过滤装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。