本发明涉及游戏控制,特别涉及游戏角色行为的控制方法、设备、介质和计算机程序产品。
背景技术:
1、现有游戏中受服务器端控制的游戏角色在面对类似场景时通常会表现出重复性、可预期的行为。即使是基于人工智能的控制方案,其往往也需要对游戏规则进行反复试探,这将花费更多的时间,并且这种游戏角色的行为表现不像真人一般自然。因此,需要一种游戏角色行为的控制方案,使得游戏角色的行为更自然平滑,还原现实场景中的真人表现。
技术实现思路
1、本发明的目的在于提供游戏角色行为的控制方法、设备、介质和计算机程序产品,可以使得游戏角色的行为更自然平滑,还原现实场景中的真人表现。
2、本发明公开了一种游戏角色行为的控制方法,所述方法用于电子设备,并且所述方法包括:
3、阶段确定步骤,确定所述游戏角色的一个或多个行为阶段,并且确定每个行为阶段的阶段目标;
4、行为生成步骤,基于每个行为阶段的阶段目标,生成对应的行为序列;
5、行为控制步骤,基于每个行为阶段的行为序列,控制所述游戏角色执行相应行为阶段下的行为序列中的行为。
6、可选地,所述阶段确定步骤包括:
7、建立状态地图,所述状态地图中的每个节点指示游戏过程中的对应状态;
8、确定当前状态和目标状态;
9、在所述状态地图中,确定从与所述当前状态对应的当前节点到与所述目标状态对应的目标节点的第一最优路径;
10、将所述第一最优路径划分为一个或多个路段,所述一个或多个行为阶段分别与所述一个或多个路段对应,并且每个行为阶段的阶段目标用于实现对应路段的状态变化。
11、可选地,所述建立状态地图包括:
12、确定固定变化状态,所述固定变化状态包括游戏时长以及游戏环境状态;
13、确定随机变化状态,所述随机变化状态包括所述游戏角色和其他游戏角色的角色状态;
14、将所述固定变化状态进行加权平均作为第一轴,并且将所述随机变化状态进行加权平均作为第二轴,从而建立所述状态地图。
15、可选地,监听所述当前状态,并且更新所述第一最优路径,从而更新所述一个或多个行为阶段和对应的阶段目标。
16、可选地,所述行为生成步骤包括:
17、获取每个阶段目标下的真实游戏角色的行为数据;
18、使用所述行为数据来训练对应阶段目标下的行为生成模型;
19、对于每个行为阶段的阶段目标,由对应阶段目标下的行为生成模型生成对应的行为序列。
20、可选地,当从第一行为阶段切换到第二行为阶段时,对所述游戏角色的行为进行平滑处理。
21、可选地,所述对所述游戏角色的行为进行平滑处理包括:
22、当控制所述游戏角色执行所述第一行为阶段下的第一行为序列中的行为时,监听所述游戏角色的行为;
23、基于所述第二行为阶段的阶段目标和监听到的行为,生成对应的第二行为序列;
24、在切换到所述第二行为阶段之后,控制所述游戏角色执行所述第二行为阶段下的所述第二行为序列中的行为。
25、可选地,所述对所述游戏角色的行为进行平滑处理包括:
26、对于所述游戏角色在切换到所述第二行为阶段之前的第一行为和在切换到所述第二行为阶段之后的第二行为,分别向所述第一行为和所述第二行为分配第一权重和第二权重,所述第一权重随时间逐渐减小,并且所述第二权重随时间逐渐增大;
27、基于所述第一权重和所述第二权重,对所述第一行为和所述第二行为进行加权平均;
28、基于所述第一行为和所述第二行为的加权平均结果,控制所述游戏角色从所述第一行为过渡到所述第二行为。
29、可选地,所述对所述游戏角色的行为进行平滑处理包括:
30、建立行为连接图,所述行为连接图中的每个节点指示所述游戏角色的对应行为;
31、对于所述游戏角色在切换到所述第二行为阶段之前的第一行为和在切换到所述第二行为阶段之后的第二行为,在所述行为连接图中确定从与所述第一行为对应的第一节点到与所述第二行为对应的第二节点的第二最优路径;
32、基于所述第二最优路径,控制所述游戏角色依次执行与所述第二最优路径上的节点对应的行为。
33、本发明公开了一种游戏角色行为的控制系统,所述系统包括:
34、阶段确定单元,确定所述游戏角色的一个或多个行为阶段,并且确定每个行为阶段的阶段目标;
35、行为生成单元,基于每个行为阶段的阶段目标,生成对应的行为序列;
36、行为控制单元,基于每个行为阶段的行为序列,控制所述游戏角色执行相应行为阶段下的行为序列中的行为。
37、可选地,所述阶段确定单元包括:
38、建立状态地图,所述状态地图中的每个节点指示游戏过程中的对应状态;
39、确定当前状态和目标状态;
40、在所述状态地图中,确定从与所述当前状态对应的当前节点到与所述目标状态对应的目标节点的第一最优路径;
41、将所述第一最优路径划分为一个或多个路段,所述一个或多个行为阶段分别与所述一个或多个路段对应,并且每个行为阶段的阶段目标用于实现对应路段的状态变化。
42、可选地,所述建立状态地图包括:
43、确定固定变化状态,所述固定变化状态包括游戏时长以及游戏环境状态;
44、确定随机变化状态,所述随机变化状态包括所述游戏角色和其他游戏角色的角色状态;
45、将所述固定变化状态进行加权平均作为第一轴,并且将所述随机变化状态进行加权平均作为第二轴,从而建立所述状态地图。
46、可选地,监听所述当前状态,并且更新所述第一最优路径,从而更新所述一个或多个行为阶段和对应的阶段目标。
47、可选地,所述行为生成单元包括:
48、获取每个阶段目标下的真实游戏角色的行为数据;
49、使用所述行为数据来训练对应阶段目标下的行为生成模型;
50、对于每个行为阶段的阶段目标,由对应阶段目标下的行为生成模型生成对应的行为序列。
51、可选地,当从第一行为阶段切换到第二行为阶段时,对所述游戏角色的行为进行平滑处理。
52、可选地,所述对所述游戏角色的行为进行平滑处理包括:
53、当控制所述游戏角色执行所述第一行为阶段下的第一行为序列中的行为时,监听所述游戏角色的行为;
54、基于所述第二行为阶段的阶段目标和监听到的行为,生成对应的第二行为序列;
55、在切换到所述第二行为阶段之后,控制所述游戏角色执行所述第二行为阶段下的所述第二行为序列中的行为。
56、可选地,所述对所述游戏角色的行为进行平滑处理包括:
57、对于所述游戏角色在切换前的第一行为和在切换后的第二行为,分别向所述第一行为和所述第二行为分配第一权重和第二权重,所述第一权重随时间逐渐减小,并且所述第二权重随时间逐渐增大;
58、基于所述第一权重和所述第二权重,对所述第一行为和所述第二行为进行加权平均;
59、基于所述第一行为和所述第二行为的加权平均结果,控制所述游戏角色从所述第一行为过渡到所述第二行为。
60、可选地,所述对所述游戏角色的行为进行平滑处理包括:
61、建立行为连接图,所述行为连接图中的每个节点指示所述游戏角色的对应行为;
62、对于所述游戏角色在切换前的第一行为和在切换后的第二行为,在所述行为连接图中确定从与所述第一行为对应的第一节点到与所述第二行为对应的第二节点的第二最优路径;
63、基于所述第二最优路径,控制所述游戏角色依次执行与所述第二最优路径上的节点对应的行为。
64、本发明公开了一种电子设备,所述电子设备包括处理器和存储有计算机可执行指令的存储器,所述处理器被配置为执行所述指令以实施游戏角色行为的控制方法。
65、本发明公开了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被一个或多个处理器执行以实施游戏角色行为的控制方法。
66、本发明公开了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现游戏角色行为的控制方法。
67、本发明实施方式与现有技术相比,主要区别及其效果在于:
68、根据本发明实施例的游戏角色行为的控制方案,通过确定行为阶段及其阶段目标,由服务器端操控的游戏角色的行为更具有多样性和目的性,贴近真实游戏角色的行为表现。不同阶段目标对应不同的行为序列,使得行为生成更容易训练,并且行为生成的速度比单纯的人工智能算法更快。游戏角色的行为更自然平滑,还原现实场景中的真人表现。