用于与数字媒体内容交互的口语、面部和姿势通信设备和计算体系架构的制作方法

文档序号：20889503发布日期：2020-05-26 17:48阅读：来源：国知局

技术特征：

1.一种口语计算设备，包括：

存储器设备，在所述存储器设备上至少存储数据使能应用，所述数据使能应用包括多对对应的对话机器人和数字杂志模块，每对所述对应的对话机器人和数字杂志模块特定于用户账户和主题；

显示设备，用于显示当前选择的数字杂志；

麦克风，被配置为将用户的话语单词记录为音频数据；

处理器，被配置为使用所述对话机器人来识别与所述音频数据相关联的上下文数据，所述上下文数据包括所述当前选择的数字杂志；

数据通信设备，被配置为经由数据网络传输所述音频数据和所述上下文数据，以及作为响应，接收响应数据，其中所述响应数据是与所述主题有关的文章的文本；以及

音频扬声器，被所述处理器控制以输出从至少所述文章的所述文本导出的音频响应。

2.根据权利要求1所述的口语计算设备，还包括与所述处理器交换数据的图形处理单元(gpu)，所述图形处理单元被配置为使用并行线程计算来预处理所述音频数据以提取数据特征，以及所述数据通信设备与所述上下文数据和所述音频数据相关联地传输所提取的数据特征。

3.根据权利要求1所述的口语计算设备，其中，所述存储器设备还在其上存储一个或多个合成语音库，其中所述一个或多个合成语音库中的每个合成语音库包括一个或多个对应的人的语音参数特征，以及所述一个或多个合成语音库被所述处理器使用以生成所述音频响应。

4.根据权利要求1所述的口语计算设备，其中，所述存储器设备还在其上至少存储包括所述文章的作者的语音参数特征的合成语音库；所述处理器还被配置为根据所述文章的所述文本和所述合成语音库生成所述音频响应；以及所述音频扬声器以所述作者的合成语音来输出所述文章的所述文本。

5.根据权利要求1所述的口语计算设备，其中，所述存储器设备还在其上至少存储包括在所述文章中被采访或引用的人的语音参数特征的合成语音库；所述处理器还被配置为根据所述文章的所述文本的至少一部分和所述合成语音库生成所述音频响应；以及所述音频扬声器以所述被采访或被引用的人的合成语音输出所述文章的所述文本的至少所述部分。

6.根据权利要求1所述的口语计算设备，其中，所述存储器设备还在其上存储与所述多个数字杂志模块相关联的多个合成语音库。

7.根据权利要求1所述的口语计算设备，其中，所述存储器设备还在其上存储分别与所述多个数字杂志模块相关联的多个音频样式库，以及每个音频样式库包括被所述对话机器人使用以影响所述音频响应的一个或多个参数；以及所述参数包括以下中的一个或多个：音调；频率；响度；单词或短语被说出的速率；语音读音；词汇；语法；发声；节律和旋律。

8.根据权利要求1所述的口语计算设备，其中，所述音频响应包括所述文章的所述文本的摘要以及询问所述用户是否希望听到完整文章的问题。

9.根据权利要求8所述的口语计算设备，还接收对于所述问题的“是”响应，以及所述口语计算设备随后生成另一个音频响应，所述另一个音频响应包括经由所述音频扬声器完整读出所述文章的所述文本。

10.根据权利要求1所述的口语计算设备，其中，所述响应数据还包括视觉数据，所述视觉数据是使用所述显示设备，与所述音频响应一起输出的。

11.根据权利要求10所述的口语计算设备，其中，所述显示设备包括显示屏、或投影仪、或两者。

12.根据权利要求1所述的口语计算设备，其中，所述文章的所述文本的一部分被标记，以及所述计算设备输出所述音频响应包括以听觉强调的方式来播放所述文本的所述部分。

13.根据权利要求12所述的口语计算设备，其中，所述听觉强调包括通过调整以下听觉参数中的一个或多个来播放所述文本的所述部分：说话速度、响度和语调。

14.根据权利要求12所述的口语计算设备，其中，如果至少一定数量的其他用户已经作用于所述文章的所述文本的所述部分，则标记所述文本的所述部分。

15.根据权利要求1所述的口语计算设备，其中，所述用户账户与所述用户的特征数据集相关联；以及所述口语计算设备还被配置为下载具有与所述用户相似的特征数据集的另一个用户的新聊天机器人和新数字杂志模块。

16.根据权利要求1所述的口语计算设备，其中，所述音频数据包括针对一个或多个数据特征被分析的语音数据，所述一个或多个数据特征包括：文本、意义、情绪、文化、语言、用户的健康状态；以及所述一个或多个数据特征是与所述用户帐户相关联地存储的。

17.一种数据使能系统，包括：

云计算服务器，摄取源自一个或多个用户设备的音频数据，所述音频数据至少包括一个或多个用户的口语对话，以及所述云计算服务器被配置为应用机器学习计算来提取至少内容和情感数据特征；

数据科学服务器，与所述云计算服务器以及外部人工智能计算平台进行数据通信；

所述数据科学服务器包括多个用户简档，每个用户简档与多对对应的对话机器人和数字杂志模块相关联，以及每对所述对应的对话机器人和数字杂志模块特定于给定用户账户和给定主题；

所述数据科学服务器包括数据科学算法库，所述数据科学算法用于针对给定对话机器人和对应的数字杂志模块来处理所述内容和情感特征；以及

所述数据科学服务器将响应数据输出到所述云计算服务器，所述响应数据是响应于所述音频数据的；以及

所述云计算服务器将所述响应数据格式化为由给定用户设备可播放的音频数据格式，并传输格式化的响应数据。

技术总结
数字媒体内容的显示包括限制人与计算系统之间的交互的图形用户界面和预定义数据字段。提供一种口语通信设备和数据使能平台，用于摄取来自人们的口语对话数据以及使用机器学习来提供智能。在前端处，口语对话机器人或聊天机器人与用户进行交互。聊天机器人特定于定制的数字杂志，两者都会随着时间的推移朝着给定主题的用户演进。在后端处，数据使能平台具有摄取来自各种外部数据源的数据以及来自内部应用和数据库的数据的计算体系架构。这些数据和算法被应用于显现新数据、识别趋势、提供建议、推断新理解、预测动作和事件、以及自动地作用于该计算的信息。然后，聊天机器人向用户读出内容。

技术研发人员：斯图尔特·欧加瓦;林赛·斯帕克斯;西村宏一;威尔弗雷德·P·索
受保护的技术使用者：费赛特实验室有限责任公司
技术研发日：2018.08.10
技术公布日：2020.05.26

完整全部详细技术资料下载

当前第2页1 2