一种数据处理方法、装置、设备及存储介质与流程

文档序号：37726656发布日期：2024-04-23 12:07阅读：6来源：国知局

本申请涉及计算机，尤其涉及一种数据处理方法、装置、设备及存储介质。

背景技术：

1、随着互联网技术的发展，游戏逐渐成为了日常娱乐的常见方式，目前在很多游戏中经常添加一些智能体模型，或称之为ai角色，用于陪伴玩家角色完成游戏对局。通常而言，为了使得智能体模型能够顺利的完成游戏对局，需要通过机器学习的方式使得智能体模型具备完成游戏对局的能力。

2、目前是基于游戏中的一个游戏地图设计和训练一个智能体模型，游戏中的游戏地图数量较多，需要逐个设计和训练每个游戏地图对应的智能体模型，导致多个游戏地图的智能体模型的训练成本较高以及训练效率较低。

技术实现思路

1、本申请实施例提供一种数据处理方法、装置、设备及存储介质，可以提高智能体模型的训练效率以及降低智能体模型的训练成本。

2、本申请实施例一方面提供一种数据处理方法，包括：

3、根据虚拟游戏环境的m个游戏地图中每个游戏地图的参考位置，对每个游戏地图关联的绝对位置信息进行位置重构，得到每个游戏地图关联的相对位置信息；

4、根据m个游戏地图分别关联的地图关键信息，确定m个游戏地图分别对应的地图环境感知信息；

5、控制初始智能体模型，根据m个游戏地图分别对应的相对位置信息和地图环境感知信息，以及m个游戏地图分别对应的游戏参数，在m个游戏地图中执行对局任务，得到初始智能体模型在m个游戏地图中分别对应的任务执行结果；

6、根据m个游戏地图分别对应的任务执行结果，对初始智能体模型中的模型参数进行参数调整，得到通用智能体模型。

7、本申请实施例一方面提供一种数据处理装置，包括：

8、第一重构模块，用于根据虚拟游戏环境的m个游戏地图中每个游戏地图的参考位置，对每个游戏地图关联的绝对位置信息进行位置重构，得到每个游戏地图关联的相对位置信息；

9、第一确定模块，用于根据m个游戏地图分别关联的地图关键信息，确定m个游戏地图分别对应的地图环境感知信息；

10、第一执行模块，用于控制初始智能体模型，根据m个游戏地图分别对应的相对位置信息和地图环境感知信息，以及m个游戏地图分别对应的游戏参数，在m个游戏地图中执行对局任务，得到初始智能体模型在m个游戏地图中分别对应的任务执行结果；

11、第一调整模块，用于根据m个游戏地图分别对应的任务执行结果，对初始智能体模型中的模型参数进行参数调整，得到通用智能体模型。

12、本申请实施例一方面提供了一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，该计算机程序适于由处理器加载并执行，以使得具有该处理器的计算机设备执行本申请实施例提供的方法。

13、本申请实施例一方面提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行本申请实施例提供的方法。

14、本申请实施例提出一种通用智能体模型训练方法，通过根据m个游戏地图融合训练得到一个通用智能体模型，m为大于1的整数，该通用智能体模型具有较高的通用性和适应性，可以适应多个游戏地图，而不用针对不同游戏地图训练一个智能体模型，降低智能体模型的训练成本和提高智能体模型的训练效率。具体的，通过将m个游戏地图中每个游戏地图关联的绝对位置信息转化为相对位置信息，便于初始智能体模型更好地捕捉不同游戏地图间的共性，避免出现初始智能体模型在m个游戏地图中出现学习歧义和学习困难的问题。同时，通过每个游戏地图对应的地图环境感知信息，增强初始智能体模型在不同游戏地图上的寻路能力，弥补游戏地图迁移时导致游戏环境感知损失的问题。控制初始智能体模型，根据m个游戏地图分别对应的相对位置信息和地图环境感知信息，以及m个游戏地图分别对应的游戏参数，在m个游戏地图中执行对局任务，对初始智能体模型进行训练，得到通用智能体模型。这样，可以使初始智能体模型在m个游戏地图中学习通用对局知识和通用对局策略，实现训练得到的通用智能体模型应用于任意游戏地图，而不用针对不同游戏地图训练一个智能体模型，可以极大地降低智能体模型训练成本和提高智能体模型的训练效率。

技术特征：

1.一种数据处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述m个游戏地图中的第i个游戏地图关联的绝对位置信息包括第一绝对位置信息和第二绝对位置信息，所述第一绝对位置信息反映所述第i个游戏地图中的游戏元素在所述虚拟游戏环境中的实际位置，所述第二绝对位置信息反映所述初始智能体模型在所述第i个游戏地图中的实际位置；i为小于或者等于m的正整数；

3.根据权利要求2所述的方法，其特征在于，所述根据所述第i个游戏地图的参考位置，对所述第一绝对位置信息进行位置重构，得到所述第i个游戏地图中的游戏元素的相对位置信息，包括：

4.根据权利要求1所述的方法，其特征在于，所述m个游戏地图中的第i个游戏地图关联的地图关键信息包括所述第i个游戏地图的地图资源文件、所述第i个游戏地图的参考位置，以及所述初始智能体模型在所述第i个游戏地图中的实际位置；i为小于或者等于m的正整数；

5.根据权利要求4所述的方法，其特征在于，所述根据所述第i个游戏地图对应的可行走区域，生成所述第i个游戏地图对应的目标路径结构图，包括：

6.根据权利要求4所述的方法，其特征在于，所述根据所述第i个游戏地图的参考位置以及所述初始智能体模型在所述第i个游戏地图中的实际位置，确定所述初始智能体模型在所述目标路径结构图中的映射位置信息，包括：

7.根据权利要求1所述的方法，其特征在于，所述m个游戏地图中第i个游戏地图的游戏参数包括所述第i个游戏地图的地图标识和地图资源文件，以及所述初始智能体模型在所述第i个游戏地图中的对局状态参数；i为小于或者等于m的正整数；

8.根据权利要求7所述的方法，其特征在于，所述通过初始智能体模型，对所述第i个游戏地图对应的通用地图资源文件、相对位置信息、地图标识和地图环境感知信息，以及所述初始智能体模型在所述第i个游戏地图中的对局状态参数进行特征预处理，得到所述第i个游戏地图对应的游戏对局特征，包括：

9.根据权利要求7所述的方法，其特征在于，所述根据所述游戏对局特征，在所述第i个游戏地图中执行对局任务，得到所述初始智能体模型在所述第i个游戏地图对应的任务执行结果，包括：

10.根据权利要求1所述的方法，其特征在于，所述根据所述m个游戏地图分别对应的任务执行结果，对所述初始智能体模型中的模型参数进行参数调整，得到通用智能体模型，包括：

11.根据权利要求1所述的方法，其特征在于，所述方法还包括：

12.根据权利要求11所述的方法，其特征在于，所述方法还包括：

13.一种数据处理装置，其中在于，包括：

14.一种计算机设备，其特征在于，包括：处理器和存储器；

15.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，所述计算机程序适于由处理器加载并执行，以使得具有所述处理器的计算机设备执行权利要求1-12任一项所述的方法。

16.一种计算机程序产品或计算机程序，其特征在于，所述计算机程序产品或计算机程序包括计算机指令，所述计算机指令存储在计算机可读存储介质中，所述计算机指令适于由处理器读取并执行，以使得具有所述处理器的计算机设备执行权利要求1-12任一项所述的方法。

技术总结
本申请实施例公开了一种数据处理方法、装置、设备及存储介质，本申请实施例可应用于人工智能、智慧交通、辅助驾驶等各种场景。其中，数据处理方法包括：对每个游戏地图关联的绝对位置信息进行位置重构，得到相对位置信息；根据M个游戏地图分别对应的地图资源文件，确定M个游戏地图分别对应的地图环境感知信息；控制初始智能体模型，根据M个游戏地图分别对应的相对位置信息和地图环境感知信息，以及M个游戏地图分别对应的游戏参数，在M个游戏地图中执行对局任务；根据M个游戏地图分别对应的任务执行结果，对初始智能体模型进行参数调整，得到通用智能体模型。采用本申请，可以提高智能体模型的训练效率和训练成本。

技术研发人员：文荟俨,刘一锋,林上奥,刘戈,邱福浩,付强
受保护的技术使用者：腾讯科技（深圳）有限公司
技术研发日：
技术公布日：2024/4/22

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：文荟俨,刘一锋,林上奥,刘戈,邱福浩,付强
技术所有人：腾讯科技（深圳）有限公司
我是此专利的发明人

上一篇：一种镀膜玻璃包装设备的制作方法
上一篇：分子时钟装置、分子时钟频率控制方法和电子设备与流程