一种智能体学习方法、系统、设备及介质与流程

文档序号：36896772发布日期：2024-02-02 21:28阅读：13来源：国知局

本发明属于人工智能，具体涉及一种智能体学习方法、系统、设备及介质。

背景技术：

1、当前的人工智能算法，不论是基于卷积cnn还是基于transformer，都没有明确的自主的认知世界的能力，可能略粗糙地认为：当前的人工智能算法只是一种对人类已经形成的认知的模拟；人工智能算法能力的最大边界就是人类当前认知的边界；同时由于数据收集和模型训练的原因，在实际中其表现在诸多方面要弱于人类；而人类最强大的能力在于能够自主的去认知世界，而不是依赖前人的教导；由于当前的人工智能算法没有自主认知的能力，且要大量的数据进行训练才能实现相对稳定的能力，因此在实际中应用中如自动驾驶领域，智能体更多在人类也相对熟悉的环境中，如高速路、主干道等规则化道路上应用，无法在人类也不熟悉的全新路况下应用。

2、正是由于当前的人工智能算法没有自主认知的能力，其无法灵活的解决各种新问题、应对各类新情况，比如；训练数据中完全没有的样本情况，以及训练数据中只有极小数量的样本情况；这些问题在当前的人工智能的算法框架下无法被有效和稳定的解决，如果强行应用，能否很好解决是个很随机的情况。

3、当前人工智能算法大量使用了深度残差网络和反向传播算法，这种架构下的大参数模型训练时需要巨大的数据，如果参数过大但数据过小就很容易过拟合，成本非常高；随着模型参数量的指数增加，当前已经到万亿级，需要的数据及背后付出的成本非常巨大的，但反观人类的学习，其对数据的利用是非常高效的。

4、当前的人工智能模型的算法框架和参数量都是在设计的时候完全确定的，不可能在训练中和训练后进行修改，任何的修改都可能对于模型产生无法修复的破坏，如果要修改模型框架和参数量，只能进行重新的设计和训练，这些带来了巨大的成本。

5、因此，预期一种能够对外部世界具有更强的自主认知能力的改进的智能体学习方法。

技术实现思路

1、针对现有技术中存在的问题，本发明提供一种智能体学习方法、系统、设备及介质，基于正向压缩理论和多级抽象理论，对外部世界有更强的自主认知能力。

2、在第一方面，本发明实施例提供了一种智能体学习方法，包括以下步骤：

3、s1：智能体基于外部场景数据建立每个物理实体高维结构的有效认知，并经分割和渲染得到低维结构的有效认知；

4、s2：基于每个物理实体建立对应小模型，并在小模型中将该物理实体的低维结构的有效认知进行基于正向传播的特征认知，得到每个物理实体的特征向量；

5、s3：基于每个物理实体的特征向量建立对应抽象类，并基于抽象类之间的关联性得到多级抽象网络，由所述多级抽象网络输出决策值；

6、s4：智能体基于决策值以及从物理环境的变化中得到的奖励，修正所述多级抽象网络输出的决策值，以及与对应决策值对应的物理实体的特征向量和多级抽象网络；

7、s5：将修正后的物理实体的特征向量与当前的人类的语言建立对应性的关系，完成智能体学习。

8、进一步的，在所述步骤s1中智能体用于采集并输入不同目标场景的图像和视频数据，训练得到该目标场景的3d结构的深度神经网络；

9、基于全场景的所述深度神经网络分割场景中不同的物理实体对象，构建出不同的物体实体对应的深度神经网络，所述不同的物体实体对应的深度神经网络为每个物理实体高维结构的有效认知；

10、基于深度神经网络的渲染算法，渲染出不同视角的物理实体的2d图像，所述不同视角的物理实体的2d图像作为每个物理实体的低维结构的有效认知。

11、进一步的，所述深度神经网络为神经辐射场nerf的网络模型。

12、进一步的，在所述步骤s2中在小模型进行特征认知的过程中采用有机增长机制，所述有机增长机制为不断生成大量的小模型并有机组合成大模型的机制；所述有机增长机制在小模型无法有效识别更多新数据时，主动构建适用识别更多新数据的新的小模型。

13、进一步的，所述步骤s3中的多级抽象网络用于模拟世界模型，所述世界模型基于大模型用于模拟真实世界的规律性特征，所述规律性特征共同组成了对世界的认知；其中所述规律性特征包括：二维平面、三维空间和四维时空上的规律性特征。

14、进一步的，所述步骤s4中智能体基于决策值产生行动，所述奖励包括人类的监督反馈和真实世界的反馈。

15、进一步的，所述步骤s5中将修正后的物理实体的特征向量与当前的人类的语言建立对应性的关系，包括基于每个物理实体的特征向量对该物理实体进行命名，并基于更多外部场景数据对每个物理实体的特征向量进行优化，以及建立搜索和推荐机制。

16、在本发明实施例中，在第二方面，本发明实施例提供了一种智能体学习系统，包括：

17、预处理模块：智能体基于外部场景数据建立每个物理实体高维结构的有效认知，并经分割和渲染得到低维结构的有效认知；

18、小模型模块：基于每个物理实体建立对应小模型，并在小模型中将该物理实体的低维结构的有效认知进行基于正向传播的特征认知，得到每个物理实体的特征向量；

19、抽象网络模块：基于每个物理实体的特征向量建立对应抽象类，并基于抽象类之间的关联性得到多级抽象网络，由所述多级抽象网络输出决策值；

20、修正模块：智能体基于决策值以及从物理环境的变化中得到的奖励，修正所述多级抽象网络输出的决策值，以及与决策值对应的物理实体的特征向量和多级抽象网络；

21、输出模块：将修正后的物理实体的特征向量与当前的人类的语言建立对应性的关系，完成智能体学习。

22、在第三方面，本发明实施例提供一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述一种智能体学习方法的步骤。

23、在第四方面，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述一种智能体学习方法的步骤。

24、与现有技术相比，本发明具有以下有益的技术效果：

25、本发明提供一种智能体学习方法、系统、设备及介质，包括以下步骤：智能体基于外部场景数据建立每个物理实体高维结构的有效认知，并经分割和渲染得到低维结构的有效认知；基于每个物理实体建立对应小模型，并在小模型中将该物理实体的低维结构的有效认知进行特征认知，得到每个物理实体的特征向量；基于每个物理实体的特征向量建立对应抽象类，并基于抽象类之间的关联性得到多级抽象网络，由所述多级抽象网络输出决策值；智能体基于决策值以及从物理环境的变化中得到的奖励，修正所述多级抽象网络输出的决策值，以及与决策值对应的物理实体的特征向量和多级抽象网络；将修正后的物理实体的特征向量与当前的人类的语言建立对应性的关系，完成智能体学习；本技术能够自主的认知世界，不只是依赖人类提供的数据，尤其是不依赖人类标注好的数据，而是能够更好的利用从真实世界中感知到的数据；同时本技术能够更稳定和高效的解决零样本和小样本问题，不再单纯依赖“相似性”和“统计概率”进行泛化，而是建立更强大的多级抽象网络进行规律的提取和应用；本技术的模型结构和参数量不再是完全固定的，而是在有机增长机制的加持下，能够更灵活的增长或减少；且不再依赖庞大的人工收集的数据，少量的数据就可以进行训练，进入有机增长的模式。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王延祥,于宛平,邹晓敏
技术所有人：深圳市阿拉亚科技有限责任公司
我是此专利的发明人

上一篇：一种吸尘式板材切割机的制作方法
上一篇：一种采用齿轮齿条作为驱动机构的工作装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。