基于价值驱动生成智能体社会行为的方法及装置与流程

文档序号:36722739发布日期:2024-01-16 12:26阅读:34来源:国知局
基于价值驱动生成智能体社会行为的方法及装置与流程

本发明涉及社会仿真,尤其涉及一种基于价值驱动生成智能体社会行为的方法及装置。


背景技术:

1、社会仿真在于通过对智能体的个体及个体间交互关系的建模,研究群体动力学,探索个体与群体属性的相互作用。

2、相关技术可知,在当前的社会仿真过程中,往往采用正向建模方式,将建立好的社会规则应用到包括多个智能体的社会模拟系统中,并观察系统如何演化并发展。

3、然而,在现实社会中,现实社会中个体的目标价值往往会反作用于个体行为,从而影响现实社会关系的发展。因此,寻找一种能够更加贴近现实社会关系发展情况的智能体社会行为生成方法成为研究热点。


技术实现思路

1、本发明提供一种基于价值驱动生成智能体社会行为的方法及装置,实现了基于智能体的即时社会关系关联度和目标价值,反向指导并驱动生成智能体的优化后社会行为,从而更加贴近现实社会关系发展情况。

2、本发明提供一种基于价值驱动生成智能体社会行为的方法,所述方法包括:获取当前时间周期内所述智能体的初始社会行为;基于所述初始社会行为,确定所述智能体与其他智能体在当前时间周期内多个预设维度下的即时社会关系关联度,其中,所述初始社会行为与所述即时社会关系关联度存在对应关系;所述即时社会关系关联度表征所述智能体的社会价值;基于多个预设维度下的即时社会关系关联度和预先设置的目标价值,驱动生成所述智能体在当前时间周期内的优化后社会行为,其中,所述优化后社会行为对应的优化后社会价值趋向所述目标价值。

3、根据本发明提供的一种基于价值驱动生成智能体社会行为的方法,所述基于多个预设维度下的即时社会关系关联度和预先设置的目标价值,驱动生成所述智能体在当前时间周期内的优化后社会行为,具体包括:获取连续可微函数;基于各预设维度下的即时社会关系关联度和所述连续可微函数,得到与各预设维度下的即时社会关系关联度对应的连续可微即时社会关系关联度;基于各预设维度下的连续可微即时社会关系关联度,确定所述智能体的社会价值;基于所述社会价值和所述目标价值,得到价值差异下降梯度;基于所述价值差异下降梯度,驱动生成所述智能体在当前时间周期内的优化后社会行为。

4、根据本发明提供的一种基于价值驱动生成智能体社会行为的方法,所述基于所述社会价值和所述目标价值,得到价值差异下降梯度,具体包括:对所述社会价值和所述目标价值进行比较,得到价值差值;对所述价值差值做反向梯度计算,得到所述价值差异下降梯度。

5、根据本发明提供的一种基于价值驱动生成智能体社会行为的方法,所述基于所述价值差异下降梯度,驱动生成所述智能体在当前时间周期内的优化后社会行为,具体包括:基于所述价值差异下降梯度,确定所述初始社会行为的优化方向;基于所述优化方向和所述初始社会行为,驱动生成所述智能体在当前时间周期内的优化后社会行为。

6、根据本发明提供的一种基于价值驱动生成智能体社会行为的方法,所述基于各预设维度下的即时社会关系关联度和所述连续可微函数,得到与各预设维度下的即时社会关系关联度对应的连续可微即时社会关系关联度,具体包括:基于各预设维度下的即时社会关系关联度和所述连续可微函数,通过预先训练得到的可微分模拟器,得到与各预设维度下的即时社会关系关联度对应的连续可微即时社会关系关联度。

7、根据本发明提供的一种基于价值驱动生成智能体社会行为的方法,在所述驱动生成所述智能体在当前时间周期内的优化后社会行为之后,所述方法还包括:将所述优化后社会行为作为在所述下一时间周期内所述智能体的初始社会行为,并多次重复前述基于所述初始社会行为确定即时社会关系关联度至驱动生成所述智能体的优化后社会行为的步骤,直至最终得到的优化后社会行为对应的优化后社会价值与所述目标价值相匹配。

8、本发明还提供一种基于价值驱动生成智能体社会行为的装置,所述装置包括:获取模块,用于获取当前时间周期内所述智能体的初始社会行为;确定模块,用于基于所述初始社会行为,确定所述智能体与其他智能体在当前时间周期内多个预设维度下的即时社会关系关联度,其中,所述初始社会行为与所述即时社会关系关联度存在对应关系;所述即时社会关系关联度表征所述智能体的社会价值;生成模块,用于基于多个预设维度下的即时社会关系关联度和预先设置的目标价值,驱动生成所述智能体在当前时间周期内的优化后社会行为,其中,所述优化后社会行为对应的优化后社会价值趋向所述目标价值。

9、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的基于价值驱动生成智能体社会行为的方法。

10、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的基于价值驱动生成智能体社会行为的方法。

11、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述的基于价值驱动生成智能体社会行为的方法。

12、本发明提供的基于价值驱动生成智能体社会行为的方法及装置,通过获取当前时间周期内智能体的初始社会行为;并基于初始社会行为,确定智能体与其他智能体在当前时间周期内多个预设维度下的即时社会关系关联度;基于多个预设维度下的即时社会关系关联度和预先设置的目标价值,驱动生成智能体在当前时间周期内的优化后社会行为,其中,优化后社会行为对应的优化后社会价值趋向所述目标价值。从而实现了基于智能体的即时社会关系关联度和目标价值,反向指导并驱动生成智能体的优化后社会行为,进而更加贴近现实社会关系发展情况。



技术特征:

1.一种基于价值驱动生成智能体社会行为的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于价值驱动生成智能体社会行为的方法,其特征在于,所述基于多个预设维度下的即时社会关系关联度和预先设置的目标价值,驱动生成所述智能体在当前时间周期内的优化后社会行为,具体包括:

3.根据权利要求2所述的基于价值驱动生成智能体社会行为的方法,其特征在于,所述基于所述社会价值和所述目标价值,得到价值差异下降梯度,具体包括:

4.根据权利要求2或3所述的基于价值驱动生成智能体社会行为的方法,其特征在于,所述基于所述价值差异下降梯度,驱动生成所述智能体在当前时间周期内的优化后社会行为,具体包括:

5.根据权利要求2所述的基于价值驱动生成智能体社会行为的方法,其特征在于,所述基于各预设维度下的即时社会关系关联度和所述连续可微函数,得到与各预设维度下的即时社会关系关联度对应的连续可微即时社会关系关联度,具体包括:

6.根据权利要求1所述的基于价值驱动生成智能体社会行为的方法,其特征在于,在所述驱动生成所述智能体在当前时间周期内的优化后社会行为之后,所述方法还包括:

7.一种基于价值驱动生成智能体社会行为的装置,其特征在于,所述装置包括:

8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述的基于价值驱动生成智能体社会行为的方法。

9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的基于价值驱动生成智能体社会行为的方法。

10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的基于价值驱动生成智能体社会行为的方法。


技术总结
本发明提供一种基于价值驱动生成智能体社会行为的方法及装置,所述方法包括:获取当前时间周期内智能体的初始社会行为;基于初始社会行为,确定智能体与其他智能体在当前时间周期内多个预设维度下的即时社会关系关联度,其中,所述初始社会行为与即时社会关系关联度存在对应关系;即时社会关系关联度表征智能体的社会价值;基于多个预设维度下的即时社会关系关联度和预先设置的目标价值,驱动生成智能体在当前时间周期内的优化后社会行为,其中,优化后社会行为对应的优化后社会价值趋向目标价值。实现了基于智能体的即时社会关系关联度和目标价值,反向指导并驱动生成智能体的优化后社会行为,从而更加贴近现实社会关系发展情况。

技术研发人员:张振亮,封雪
受保护的技术使用者:北京通用人工智能研究院
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1