用于交互的虚拟人物对话的系统和方法_5

文档序号:9422873阅读:来源:国知局
个实 施例能够W多个形式作为程序产品分发,本公开平等地应用,不管用于实际影响分发的计 算机可读媒介的特定类型。
[0098] 除非说明书和权利要求书明确要求,否则,词语"包括"W及类似的词解释为包容 性的,不同于排外的或者详尽的意义,也就是说,是"包括但不限于"的意思。在此处使用的 术语"连接"、"禪合"或其他运类的变化,是指两个或更多元素之间直接或间接的连接或禪 合,要素之间的禪合联接可W是物理的,逻辑的,或者两者组合。另外,在本申请书中使用的 词语"在此"、"W上"、"W下"W及类似的词语,是将本申请作为一个整体而不是本申请的特 定部分。根据上下文内容,在上述详细的说明书中使用单数或复数的单词,可能也分别包括 复数或单数。词语"或者",关于一个列表的一个或多个项目,包含运个单词W下的所有皆 是:列表中的任何项目,列表中的所有项目,W及列表中的项目的任一组合。
[0099] 本发明实施例的上述详细描述不是穷尽或限制了上述
【发明内容】
的精确形式。本发 明的特定实施例W及示例是为了说明目的,不同的同等的修改,对于本领域技术人员是显 而易见时,可能依然属于本发明的范围。例如,当进程或块W-个给定的顺序呈现,可选的 实施例可能W不同顺序的步骤实行例程,或者具有不同顺序的块的运行系统。一些进程或 块可能会被删除,移动,增加,细分,组合,和/或修改W提供替代或变形。运些进程或块的 每个可能W不同方式实现。同样,当进程或块有时出现W串联执行时,运些进程或块可能替 代W并行执行,或者W不同时间执行。而且此处任何标注的特定数字仅仅是举例:其他实现 可能采用不同值或范围。
[0100] 本发明在此提供的内容可能适用于其他系统,不仅仅是在此描述的系统。上述不 同实施例的元素和操作可W组合成进一步的实施例。 阳101] 任何专利和申请W及上述其他参考,包括可能被列出在附随的归档文件,是通过 引用的方式合并于此。如果需要的话,本发明可修改W适用上述系统,功能,W及不同参考 的概念,来提供本发明的进一步实施例。 阳102] 可W根据上述详细说明对本发明进行修改。当上述说明描述了本发明的特定实施 例并描述了预期的最佳方式时,无论上述内容有多详细,操作方法可WW很多方式来实现。 虽然仍包含在本发明的主题中,本系统的细节在实施细节上可能有非常大的不同。如上所 述,当描述特定特征或本发明的内容时,使用的特定术语不应该隐含该术语在运里被重新 定义,来限定与该术语相应的特定特征或本
【发明内容】
。通常,在下述权利要求中使用的术语 不能将本发明限定为本说明书中公开的特定实施例,除非上述详细描述部分明确定义了该 术语。因此,本发明的实际范围不仅包括公开的实施例,还包括所有等同运用或实现本发明 的权利要求的方式。
【主权项】
1. 一种使用户参与与虚拟人物对话的方法,所述方法包括: 接收来自用户的音频输入,所述音频输入包括语音; 获取所述语音的文本描述; 基于所述文本描述确定应答音频输出;和 引发虚拟人物使用所确定的应答音频输出发言。2. 如权利要求1所述的方法,还包括: 接收包括来自用户的语音的多种音频输入,所述多种音频输入与一个或多个虚拟人物 的多种发言输出相关联。3. 如权利要求2所述的方法,其中所述多种音频输入包括由一个或多个虚拟人物提出 的问题的答案。4. 如权利要求2所述的方法,其中所述多种音频输入包括文字叙述且所述一个或多个 虚拟人物的多种发言输出包括即兴讲述或对所述叙述的评论。5. 如权利要求2所述的方法,其中所述多种音频输入包括在关于话题的对话中的陈 述。6. 如权利要求1所述的方法,其中所述获取所述语音的文本描述包括将所述音频输入 传输至专用的语音处理服务。7. 如权利要求1所述的方法,其中所述接收音频输入包括确定是否执行一个的"自动 声音活动监测"、"按住说话"、"轻击说话"或"轻击说话伴随静默监测"操作。8. 如权利要求7所述的方法,进一步包括更改图标以反映所确定的音频输入操作。9. 如权利要求1所述的方法,其中所述确定应答音频输出包括确定用户个性化元数 据。10. 如权利要求1所述的方法,所述方法进一步包括获取与所述应答音频输出相关联 的音素元数据以用于动画化一些人物的面部特征的目的。11. 如权利要求1所述的方法,进一步包括审视来自所述用户的多种回复并基于所述 审视执行更多的字符间的对话而非用户-字符的对话。12. 如权利要求1所述的方法,进一步包括将优先次序元数据与所述虚拟人物的每个 潜在的应答相关联并使用这些优先次序元数据使得可能的应答在其他应答之前被输出。13. 如权利要求1所述的方法,其中所述引发虚拟人物使用所确定的应答语音输出发 言包括引发所述虚拟人物提议使用用户设备拍摄照片。14. 如权利要求1所述的方法,进一步包括: 使用用户设备引发用户拍摄照片;和 发送所述照片至社交网络的一个或多个用户。15. -种使用户可视化参与与虚拟人物的对话的方法,包括: 检索与交互场景相关联的多个组件,所述交互场景由用户选择; 配置所述多个组件的至少一个代表所述场景中的虚拟人物;和 传输所述多个组件的至少一些至用户设备。16. 如权利要求15所述的方法,进一步包括检索与用户关联的个性化元数据并基于所 述个性化元数据更改所述多个组件的至少一个。17. 如权利要求15所述的方法,其中所述检索多个组件包括从数据库检索多个语音波 形。18. -种使用户参与与虚拟人物对话的计算机系统,所述系统包括: 显示器; 处理器; 通讯端口; 包含指令的存储器,其中所述指令被配置为引发所述处理器进行: 接收来自用户的音频输入,所述音频输入包括语音; 获取所述语音的文本描述; 基于所述文本描述确定应答音频输出;和 引发虚拟人物使用所确定的应答音频输出发言。19. 如权利要求18所述的计算机系统,其中所述接收音频输入包括确定是否执行一个 的"自动声音活动监测"、"按住说话"、"轻击说话"或"轻击说话伴随静默监测"操作。20. 如权利要求19所述的计算机系统,所述指令进一步被配置为引发所述处理器更改 图标以反映所确定的操作。21. 如权利要求18所述的计算机系统,其中确定应答音频输出包括确定用户个性化元 数据。22. 如权利要求18所述的计算机系统,所述指令进一步被配置以引发所述处理器获取 与所述应答音频输出相关联的音素元数据以用于动画化一些人物的面部特征的目的。23. 如权利要求18所述的计算机系统,所述指令进一步被配置以引发所述处理器审视 来自所述用户的多种回复并基于所述审视执行更多的字符间的对话而非用户-字符的对 话。24. 如权利要求18所述的计算机系统,所述指令进一步被配置为引发所述处理器将优 先次序元数据与所述虚拟人物的每个潜在的应答相关联并使用这些优先次序元数据使得 可能的应答在其他应答之前被输出。25. 如权利要求18所述的计算机系统,其中所述引发虚拟人物使用所确定的应答音频 输出发言包括引发所述虚拟人物提议使用用户设备拍摄照片。26. -种使用户参与与虚拟人物对话的计算机系统,所述计算机系统包括: 接收来自用户的音频输入的装置,所述音频输入包括语音; 确定所述语音的描述的装置; 基于所述描述确定应答音频输出的装置;和 引发虚拟人物使用所确定的应答音频输出发言的装置。27. 如权利要求26所述的计算机系统,其中所述音频输入接收装置包括麦克风、数据 包接收模块、WiFi接收器、蜂窝网络接收器、以太网连接器、无线电接收器、本地连接器或者 便携式存储器装置的接口中的一个。28. 如权利要求26所述的计算机系统,其中所述确定所述语音的描述的装置包括专用 语音处理服务器的连接器、自然语言处理程序,语音识别系统、隐马尔可夫模型或贝叶斯分 类器中的一个。29. 如权利要求26所述的计算机系统,其中所述确定应答音频输出的装置包括人工智 能引擎、机器学习分类器、决策树、状态转换图、马尔可夫模型或贝叶斯分类器中的一个。30.如权利要求26所述的计算机系统,其中所述虚拟人物语音装置包括扬声器、移动 装置上的扬声器的连接器、与用户设备通信的WiFi发射器、数据包传输模块、与用户设备 通信的蜂窝网络发射器、与用户设备通信的以太网连接器、与用户设备通信的无线电发射 器或与用户设备通信的本地连接器中的一个。
【专利摘要】多个公开的实施例是关于基于对话的人机交互的系统和方法。在一些实施例中,所述系统包括多个交互场景。用户可以访问每个场景并参与相关于与活跃场景关联的活动的虚拟人物的对话。在某些实施例中,中心服务器可以容纳与虚拟人物语音关联的多种波形,并且能动态地将所述波形传递给与人工智能操作相连的用户设备。在其他的实施例中,人物的语音通过使用文语转换系统被生成。
【IPC分类】G10L15/22, G06F3/048
【公开号】CN105144286
【申请号】CN201480022536
【发明人】奥伦·M·雅各布, 马丁·雷迪, 卢卡斯·R·A·艾夫斯, 罗伯特·G·坡德斯塔
【申请人】托伊托克有限公司
【公开日】2015年12月9日
【申请日】2014年3月7日
【公告号】CA2906320A1, US20140278403, WO2014159037A1
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1