数字人的交互方法、装置、电子设备及存储介质与流程

文档序号：36315702发布日期：2023-12-08 02:04阅读：57来源：国知局

本公开涉及计算机，尤其涉及大语言模型、自然语言处理、数字人等人工智能，具体涉及一种数字人的交互方法、装置、电子设备及存储介质。

背景技术：

1、近年来，随着科技的进步，智能化的人机交互方式已逐渐成为国内外研究的热点，一些智能设备或者应用中设置有数字人，以通过数字人实现与用户的可视化交互，从而提高用户的人机交互体验。其中，数字人，是利用信息科学的方法对人体在不同水平的形态和功能进行虚拟仿真的计算机可视化形态，结合人工智能技术塑造的数字人已经在多个行业中广泛应用。

技术实现思路

1、本公开提供了一种数字人的交互方法、装置、电子设备及存储介质。

2、根据本公开的第一方面，提供了一种数字人的交互方法，包括：

3、获取询问语句及当前业务的类型；

4、根据所述当前业务的类型，确定目标提示词；

5、将所述询问语句及所述目标提示词输入预设大语言模型中，以获取所述预设大语言模型输出的答复语句；

6、基于所述答复语句，对所述当前业务的类型关联的目标数字人进行控制。

7、根据本公开的第二方面，提供了一种数字人的交互方法，包括：

8、获取训练数据集，其中，所述训练数据集中包括样本语句，及所述样本语句对应的第一标注数据，其中，所述第一标注数据包括所述样本语句对应的性格特征标签、和/或，情感特征标签；

9、将所述样本语句输入大语言模型中，以获取所述样本语句对应的第一预测结果；

10、基于所述第一预测结果与对应的第一标注数据之间的差异，对所述大语言模型进行微调，以获取预设大语言模型。

11、根据本公开的第三方面，提供了一种数字人的交互装置，包括：

12、第一获取模块，用于获取询问语句及当前业务的类型；

13、确定模块，用于根据所述当前业务的类型，确定目标提示词；

14、第二获取模块，用于将所述询问语句及所述目标提示词输入预设大语言模型中，以获取所述预设大语言模型输出的答复语句；

15、控制模块，用于基于所述答复语句，对所述当前业务的类型关联的目标数字人进行控制。

16、根据本公开的第四方面，提供了一种大语言模型的微调装置，包括：

17、第一获取模块，用于获取训练数据集，其中，所述训练数据集中包括样本语句，及所述样本语句对应的第一标注数据，其中，所述第一标注数据包括所述样本语句对应的性格特征标签、和/或，情感特征标签；

18、第二获取模块，用于将所述样本语句输入大语言模型中，以获取所述样本语句对应的第一预测结果；

19、微调模块，用于基于所述第一预测结果与对应的第一标注数据之间的差异，对所述大语言模型进行微调，以获取预设大语言模型。

20、根据本公开的第五方面，提供了一种电子设备，包括：

21、至少一个处理器；以及

22、与所述至少一个处理器通信连接的存储器；其中，

23、所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如第一方面所述的数字人的交互方法，或者，执行如第二方面所述的大语言模型的微调方法。

24、根据本公开第六方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行如第一方面所述的数字人的交互方法，或者，执行如第二方面所述的大语言模型的微调方法。

25、根据本公开的第七方面，提供了一种计算机程序产品，包括计算机指令，所述计算机指令在被处理器执行时实现如第一方面所述的数字人的交互方法的步骤，或者，执行如第二方面所述的大语言模型的微调方法。

26、本公开提供的数字人的交互方法、装置、电子设备及存储介质，存在如下有益效果：

27、本公开实施例中，先获取询问语句及当前业务的类型，之后根据所述当前业务的类型，确定目标提示词，并将所述询问语句及所述目标提示词输入预设大语言模型中，以获取所述预设大语言模型输出的答复语句，最后基于所述答复语句，对所述当前业务的类型关联的目标数字人进行控制。由此，可以通过当前业务的类型，确定目标提示词及目标数字人，从而使预设大语言模型可以基于目标提示词输出答复语句，并控制目标数字人播报与目标提示词关联的答复语句，提升用户人机交互的体验感。

28、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种数字人的交互方法，包括：

2.根据权利要求1所述的方法，其中，所述根据所述当前业务的类型，确定目标提示词，包括：

3.根据权利要求2所述的方法，其中，所述基于所述答复语句，对所述当前业务的类型关联的目标数字人进行控制，包括：

4.根据权利要求1所述的方法，其中，所述根据所述当前业务的类型，确定目标提示词，包括：

5.根据权利要求1所述的方法，其中，在所述基于所述答复语句，对所述当前业务的类型关联的目标数字人进行控制之前，还包括：

6.根据权利要求5所述的方法，其中，还包括：

7.根据权利要求6所述的方法，其中，在所述基于所述面部特征数据，生成与各业务类型的目标对象关联的数字人之后，还包括：

8.一种大语言模型的微调方法，包括：

9.根据权利要求8所述的方法，其中，在所述获取预设大语言模型之后，还包括：

10.根据权利要求9所述的方法，其中，所述基于每个所述验证语句对应的第二标注数据及对应的所述第二预测结果，确定所述预设大语言模型的预测准确度，包括：

11.根据权利要求10所述的方法，其中，所述根据所述第一数量、所述第二数量、及所述验证语句的总数量，确定所述预测准确度，包括：

12.一种数字人的交互装置，包括：

13.根据权利要求12所述的装置，其中，所述确定模块，具体用于：

14.根据权利要求13所述的装置，其中，所述控制模块，具体用于：

15.根据权利要求12所述的装置，其中，所述确定模块，具体用于：

16.根据权利要求12所述的装置，其中，还包括处理模块，用于：

17.根据权利要求16所述的装置，其中，还包括生成模块，用于：

18.根据权利要求17所述的装置，其中，微调模块，用于：

19.一种大语言模型的微调装置，包括：

20.根据权利要求19所述的装置，其中，还包括验证模块，用于：

21.根据权利要求20所述的装置，其中，所述验证模块，还用于：

22.根据权利要求21所述的装置，其中，所述验证模块，还用于：

23.一种电子设备，包括：

24.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法，或者执行权利要求8-11中任一项所述的方法。

25.一种计算机程序产品，包括计算机指令，所述计算机指令被处理器执行时实现权利要求1-7中任一项所述方法的步骤，或者实现权利要求8-11中任一项所述的方法的步骤。

技术总结
本公开提供了一种数字人的交互方法、装置、电子设备及存储介质，涉及计算机技术领域，尤其涉及大语言模型、自然语言处理、数字人等人工智能技术领域。具体实现方案为：获取询问语句及当前业务的类型；根据当前业务的类型，确定目标提示词；将询问语句及目标提示词输入预设大语言模型中，以获取预设大语言模型输出的答复语句；基于答复语句，对当前业务的类型关联的目标数字人进行控制。由此，可以通过当前业务的类型，确定目标提示词及目标数字人，从而使预设大语言模型可以基于目标提示词输出答复语句，并控制目标数字人播报与目标提示词关联的答复语句，提升用户人机交互的体验感。

技术研发人员：周润民
受保护的技术使用者：北京百度网讯科技有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周润民
技术所有人：北京百度网讯科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。