本发明涉及数字交互,具体涉及一种基于弱势人群的智能数字人交互方法、设备和介质。
背景技术:
1、随着人工智能技术、计算机图形学、传感器技术和计算硬件的不断发展,虚拟数字人已经在营销宣传、教育培训、医疗健康、娱乐游戏、智能客服等很多领域展开了应用。在技术发展过程中,数字人的功能越来越丰富,操作方法也变得更复杂,往往需要一定的培训和指导才能上手使用。尤其对于老年人、残障人士等弱势人群来讲,交互方式不够友好,操作界面也缺少必要的的引导功能。
2、例如,老年人对于页面的触控功能难以看清,操作流程不熟悉;盲人需要更便捷和智能化的语音交互能力,从而独立的完成数字人的操作;而对于聋哑人而言,一定的手语识别与交互能力可以提升用户的使用体验。上述的功能更多的提现在软件层面,硬件成本的投入几乎没有增加,主要依靠计算机图像建模(cg)、自然语言处理(nlp)、计算机视觉(cv)等技术的支撑。
技术实现思路
1、本发明为了克服以上技术的不足,提供了一种适用于数字人生成、弱势人群的友好交互等场景的交互方法、设备和介质。
2、本发明克服其技术问题所采用的技术方案是:
3、一种基于弱势人群的智能数字人交互方法,包括:
4、采集弱势人群的指令信息,将指令信息转换为文本信息;
5、根据文本信息中识别的交互信息匹配智能问答库中的内容,得到交互对应的应答文本信息;
6、将文本信息进行人工智能训练,得到数字人的视频和音频内容,将视频和音频内容发送到客户端进行组合渲染;
7、根据生成的数字人形象的交互视频和文本信息,在客户端进行渲染和内容播报。
8、进一步的,所述弱势人群为:老年人、聋哑人士、视力障碍人群、身体障碍人群;弱势人群的指令信息为:文本输入、手语动作、语音信息。
9、进一步的,根据弱势人群的手语动作视频,通过手语库匹配转换为文本信息,将弱势人群的语音信息降噪处理,降噪处理后通过自然语言处理转化为文本信息。
10、进一步的,文本输入包括拼音、五笔、笔画、语音、手写,文本输入支持词语联想、热词匹配、词语库配置、常用词历史记录;
11、手语动作分为国外手语语系及国内手语语系,国外手语语系包括:法国手语、英澳手语、阿拉伯手语、德国手语、日本手语;国内手语语系包括:普通手语、南方方言手语、北方方言手语;
12、语音信息包括汉语、英语、西班牙语、阿拉伯语、俄语、葡萄牙语、日语、英语、德语、国内方言,国内方言包括官话方言、吴语、闽语、湘语、客语、赣语、粤语、晋语、徽语。
13、进一步的,降噪处理的方法为:dsp语音消噪或谱减法或维纳滤波法。
14、进一步的,根据文本信息中识别的交互信息匹配智能问答库中的内容,得到交互对应的应答文本信息的方法为:
15、根据识别的交互信息,对转换后的文本内容进行预处理,预处理的方法依次为:文本清洗、敏感词过滤、分词标记、矢量化;
16、根据有关文本内容制度的规定,对识别到的交互信息进行敏感词过滤,其敏感问题做出标准化答案输出;
17、问答库采用关联问题推荐排序的方式进行匹配,映射问答库中的答案进行综合得分,获取得分排序最前的答案进行回答,如果没有关联的答案,则返回相关问题的提示信息。
18、进一步的,将文本信息进行人工智能训练,得到数字人的视频和音频内容,将视频和音频内容发送到客户端进行组合渲染的方法为:
19、根据问答库匹配的文本内容结合数字人的形象和动作库、音色、语种信息进行ai训练;
20、ai训练时分割数字人的形象和绿幕背景,同时对数字人的动作、唇形、表情、声音进行视频构建,使动作、唇形和声音对应,得到数字人形象的视频内容。
21、进一步的,根据生成的数字人形象的交互视频和文本信息,在客户端进行渲染和内容播报的方法为:
22、客户端对数字人交互视频、背景、组件进行渲染,得到一条完整的数字人播报内容的视频信息并通过播放器播报。
23、一种基于弱势人群的智能数字人交互设备,包括:
24、至少一个处理器,以及
25、与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
26、采集弱势人群的指令信息,将指令信息转换为文本信息;
27、根据文本信息中识别的交互信息匹配智能问答库中的内容,得到交互对应的应答文本信息;
28、将文本信息进行人工智能训练,得到数字人的视频和音频内容,将视频和音频内容发送到客户端进行组合渲染;
29、根据生成的数字人形象的交互视频和文本信息,在客户端进行渲染和内容播报。
30、一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
31、采集弱势人群的指令信息,将指令信息转换为文本信息;
32、根据文本信息中识别的交互信息匹配智能问答库中的内容,得到交互对应的应答文本信息;
33、将文本信息进行人工智能训练,得到数字人的视频和音频内容,将视频和音频内容发送到客户端进行组合渲染;
34、根据生成的数字人形象的交互视频和文本信息,在客户端进行渲染和内容播报。
35、本发明的有益效果是:
1.一种基于弱势人群的智能数字人交互方法,其特征在于,包括:
2.根据权利要求1所述的基于弱势人群的智能数字人交互方法,其特征在于:所述弱势人群为:老年人、聋哑人士、视力障碍人群、身体障碍人群;
3.根据权利要求2所述的基于弱势人群的智能数字人交互方法,其特征在于:根据弱势人群的手语动作视频,通过手语库匹配转换为文本信息,将弱势人群的语音信息降噪处理,降噪处理后通过自然语言处理转化为文本信息。
4.根据权利要求2所述的基于弱势人群的智能数字人交互方法,其特征在于:
5.根据权利要求3所述的基于弱势人群的智能数字人交互方法,其特征在于:降噪处理的方法为:dsp语音消噪或谱减法或维纳滤波法。
6.根据权利要求1所述的基于弱势人群的智能数字人交互方法,其特征在于,根据文本信息中识别的交互信息匹配智能问答库中的内容,得到交互对应的应答文本信息的方法为:
7.根据权利要求1所述的基于弱势人群的智能数字人交互方法,其特征在于,将文本信息进行人工智能训练,得到数字人的视频和音频内容,将视频和音频内容发送到客户端进行组合渲染的方法为:
8.根据权利要求1所述的基于弱势人群的智能数字人交互方法,其特征在于,根据生成的数字人形象的交互视频和文本信息,在客户端进行渲染和内容播报的方法为:
9.一种基于弱势人群的智能数字人交互设备,其特征在于,包括:
10.一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为: