用于处理数据和输出用户反馈的口语通信设备和计算体系架构以及相关方法与流程

文档序号：20889497发布日期：2020-05-26 17:48阅读：来源：国知局

技术特征：

1.一种言语计算设备，包括：

存储器设备，在所述存储器设备上存储至少数据使能应用、对话机器人以及一个或多个合成语音库，所述数据使能应用包括与不同模式对应的多个模块，其中所述一个或多个合成语音库中的每个合成语音库包括一个或多个对应的人的语音参数特征；

输入传感器，被配置为将用户输入记录为言语数据；

处理器，被配置为使用所述对话机器人来识别与所述言语数据相关联的上下文数据，所述上下文数据包括与所述数据使能应用的当前激活的模块对应的当前模式；

数据通信设备，被配置为经由数据网络传输音频数据和所述上下文数据，以及作为响应，接收响应数据，其中所述响应数据包括给定的合成语音库的指示、文本数据和所述当前模式；所述处理器还被配置为使用所述对话机器人根据所述给定的合成语音库和所述文本数据生成音频响应，并将所述文本数据传播到当前未激活的一个或多个其他模块；以及

音频扬声器，所述音频扬声器被所述处理器控制以输出所述音频响应。

2.根据权利要求1所述的计算设备，其中，所述当前激活的模块是会议记录模块；所述言语数据包括主题；以及所述文本数据包括与所述主题相关的数据。

3.根据权利要求2所述的计算设备，其中，所述计算设备检测所述言语数据中的句子的停顿或结束中的至少一个，然后输出所述音频响应。

4.根据权利要求2所述的计算设备，其中，所述言语数据和所述文本数据被添加到会议记录文件。

5.根据权利要求2所述的计算设备，其中，所述数据通信设备与至少一个其他用户设备通信，以及所述计算设备还在与输出所述音频响应相同的给定时间段内，将关于所述主题的附加数据传输到所述其他用户设备。

6.根据权利要求2所述的计算设备，其中，所述输入传感器获得公共言语数据，所述计算设备还接收私有会议记录，以及所述计算设备还生成包括所述私有会议记录和公共记录的会议记录，所述公共记录是从所述公共言语数据和所述响应数据中的所述文本数据导出的。

7.根据权利要求6所述的计算设备，其中，所述私有记录和所述公共记录是按创建时间组织的。

8.根据权利要求6所述的计算设备，其中，所述数据通信设备与至少静默通信设备通信以获得私有言语数据；以及所述计算设备还根据所述私有言语数据生成所述私有会议记录。

9.根据权利要求1所述的计算设备，还包括视觉显示设备，以及所述响应数据还包括与所述音频响应一起输出的视觉数据。

10.根据权利要求9所述的计算设备，其中，所述视觉显示设备是投影仪。

11.根据权利要求1所述的计算设备，其中，所述言语数据包括主题；以及所述文本数据包括与所述主题相关的多篇新闻文章的摘要。

12.根据权利要求1所述的计算设备，其中，所述当前激活的模块是与所述用户的社交网络平台相关联的介绍模块；所述言语数据包括主题或实体；以及所述文本数据包括从所述社交网络平台获得的与所述主题或所述实体相关的名称的列表。

13.根据权利要求1所述的计算设备，其中，所述多个模块包括待办事项列表模块、机会模块、介绍模块、会议记录模块和新模块；以及其中所述多个模块中的当前激活的模块将所述文本数据传播到所述多个模块中的其他模块中的至少两个或更多个模块。

14.根据权利要求1所述的计算设备，其中，所述存储器设备还存储对话库，所述对话库包括由所述对话机器人使用以影响所述音频响应的一个或多个参数；以及所述参数包括以下中的一个或多个：音调、频率；响度；单词或短语被说出的速率；语音读音；词汇；语法；发声；节律；旋律；短语；以及问题。

15.根据权利要求1所述的计算设备，其中，所述言语数据包括主题；以及所述给定的合成语音库的指示是与作为所述主题的权威或专家的人相关联的。

16.根据权利要求1所述的计算设备，其中，所述言语数据包括主题和人的名字；所述给定的合成语音库的指示是与所述人相关联的；以及所述文本数据是与所述主题和所述人两者均相关。

17.根据权利要求1所述的计算设备，还包括与所述处理器交换数据的图形处理单元(gpu)，所述gpu被配置为使用并行线程计算来预处理所述音频数据以提取数据特征，以及所述数据通信设备与所述上下文数据和所述音频数据相关联地传输所提取出的数据特征。

18.一种数据使能系统，包括：

云计算服务器，摄取源自一个或多个用户设备的音频数据，所述音频数据至少包括一个或多个用户的口头对话，以及所述云计算服务器被配置为应用机器学习计算以提取至少内容和情感数据特征；

数据科学服务器，与所述云计算服务器、内部应用和数据库以及外部人工智能计算平台进行数据通信；

所述数据科学服务器包括数据科学算法库，所述数据科学算法用于使用从所述内部应用和数据库获得的内部数据以及从所述外部人工智能计算平台获得的外部数据来处理所述内容和情感特征；以及

所述数据科学服务器将响应数据输出到所述云计算服务器，所述响应数据是响应于所述音频数据；以及

所述云计算服务器将所述响应数据格式化为由给定用户设备可播放的音频数据格式，并传输格式化的响应数据。

技术总结
典型的图形用户界面和预定义的数据字段限制人与计算系统之间的交互。提供一种口语通信设备和数据使能平台，用于摄取来自人们的口语对话数据以及使用机器学习来提供智能。在前端处，口语对话机器人或聊天机器人与用户进行交互。在后端处，数据支持使能平台具有摄取来自各种外部数据源的数据以及来自内部应用和数据库的数据的计算体系架构。这些数据和算法应用于显现新数据、识别趋势、提供建议、推断新理解、预测动作和事件、并自动地作用于该计算的信息。然后，聊天机器人提供反映由数据使能平台计算的信息的音频数据。例如，系统和设备适用于各种行业。

技术研发人员：斯图尔特·欧加瓦;林赛·斯帕克斯;西村宏一;威尔弗雷德·P·索
受保护的技术使用者：费赛特实验室有限责任公司
技术研发日：2018.08.10
技术公布日：2020.05.26

完整全部详细技术资料下载

当前第2页1 2