本发明涉及数字辅助,尤其涉及一种交互方法和设备。
背景技术:
1、几十年来,电视是对人类最具影响力的娱乐设备,具有被动体验的特点。在本领域中实施了许多技术和创新,以提升这种被动体验。基于电视是需要尽可能少的用户交互的放松体验的假设,用户交互的频率和/或对遥控器按键的点击频率被认为是评估电视性能的基本指标。
技术实现思路
1、本发明的一个方面提供了一种交互方法。该方法包括:针对用户开始的对话,检测所述用户观看的当前节目;获取所述用户的输入并基于所述输入识别与所述用户交谈的角色;检索检测到的所述节目的脚本信息以及与克隆角色语音模型,所述克隆角色语音模型与识别到的所述角色相对应;基于所述脚本信息生成回答,所述脚本信息与识别到的所述角色相对应;利用与识别到的所述角色相对应的所述克隆角色语音模型向所述用户显示生成的所述回答。
2、本发明的另一个方面提供了一种交互设备,该设备包括存储器以及耦合到所述存储器的处理器。所述处理器配置为执行多个操作,所述操作包括:针对用户开始的对话,检测所述用户观看的当前节目;获取所述用户的输入并基于所述输入识别与所述用户交谈的角色;检索检测到的所述节目的脚本信息以及克隆角色语音模型,所述克隆角色语音模型与识别到的所述角色相对应;基于所述脚本信息生成回答,所述脚本信息与识别到的所述角色相对应;利用与识别到的所述角色相对应的所述克隆角色语音模型向所述用户显示生成的所述回答。
1.一种交互方法,所述方法应用于计算设备,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述检测用户观看的所述当前节目包括:
3.如权利要求1所述的方法,其特征在于,所述获取所述用户的所述输入并基于所述输入识别与所述用户交谈的所述角色包括:
4.如权利要求3所述的方法,其特征在于,
5.如权利要求1所述的方法,其特征在于,在所述使用与识别到的所述角色相对应的所述克隆角色语音模型向所述用户显示生成的所述回答之前,还包括:
6.如权利要求5所述的方法,其特征在于,所述基于检测到的所述用户的所述情绪,使用所述克隆角色语音模型来调整所述要显示的所述回答的情绪包括:
7.如权利要求5所述的方法,其特征在于,所述基于检测到的所述用户的所述情绪,使用所述克隆角色语音模型来调整所述要显示的所述回答的情绪包括:
8.如权利要求1所述的方法,其特征在于,所述用户观看的所述当前节目包括电影、电视秀、电视连续剧、电视戏剧、电视节目、喜剧、肥皂剧或新闻节目。
9.如权利要求1所述的方法,其特征在于,所述基于所述输入识别与所述用户交谈的所述角色包括:
10.如权利要求1所述的方法,其特征在于,还包括:
11.一种交互设备,其特征在于,包括:
12.如权利要求11所述的设备,其特征在于,所述检测所述用户观看的所述当前节目包括:
13.如权利要求11所述的设备,其特征在于,所述获取所述用户的所述输入并基于所述输入识别与所述用户交谈的所述角色包括:
14.如权利要求13所述的设备,其特征在于,所述将所述用户输入的所述声音转换为所述文本包括:使用语音识别模型将输入的所述声音转换为所述文本;以及
15.如权利要求11所述的设备,其特征在于,由所述处理器执行的所述多个操作还包括,在所述使用与识别到的所述角色相对应的所述克隆角色语音模型向用户显示生成的所述回答之前:
16.如权利要求15所述的设备,其特征在于,所述基于检测到的所述用户的所述情绪,使用所述克隆角色语音模型来调整所述要显示的所述回答的情绪包括:
17.如权利要求15所述的设备,其特征在于,所述基于检测到的所述用户的所述情绪,使用所述克隆角色语音模型来调整所述要显示的所述回答的情绪包括:
18.如权利要求11所述的设备,其特征在于,所述用户观看的所述当前节目包括电影、电视秀、电视连续剧、电视戏剧、电视节目、喜剧、肥皂剧或新闻节目。
19.如权利要求11所述的设备,其特征在于,所述基于所述输入识别与所述用户交谈的所述角色包括:
20.如权利要求11所述的设备,其特征在于,由所述处理器执行的所述多个操作还包括:针对丢失的所述脚本信息或丢失的所述克隆角色语音模型,向所述用户显示通知。