人工智能脚本工具的制作方法

文档序号:6534626阅读:874来源:国知局
人工智能脚本工具的制作方法
【专利摘要】本发明为技术和非技术用户提供创建交互式合成角色内容的系统和方法。在一些实施例中,会话编辑器可以被配置为用于通过接收来自用户的一组会话规则以创建交互式合成角色的遍历脚本。这些规则可以被用于匹配用户说话或键入的特定词语或短语,或监测用户或合成角色的物理动作。每个会话可以包括由交互式合成角色所执行的回应。回应可以包括,例如,为合成角色产生可听的或文本的语音,执行一个或多个动画,播放一个或多个声音效果,从一个或多个数据源取得数据等。当由允许动态交互的合成角色执行该会话规则组时,遍历脚本可以从该会话规则组生成。在一些实施例中,遍历脚本可以由使用与会话规则相关的一个或多个导航指令的状态引擎来导航。
【专利说明】人工智能脚本工具
[0001] 相关申请的交叉引用
[0002] 本申请要求2012年7月25日提交的美国专利申请号13/558,206的优先权,其全 部内容通过引用方式被合并于此。

【技术领域】
[0003] 本发明的各种实施例通常涉及创建交互式合成角色的内容。更具体地,本发明的 各种实施例涉及人工智能(Al)脚本工具。

【背景技术】
[0004] 玩具已经存在了几千年。埃及、希腊和罗马的孩子玩的玩具,由石器、陶器、蜡、木 材和其他原始材料制成。最近,玩具由较新的材料,如塑料制成。然而,这些玩具是静态的, 留下孩子们用自己的想象力形成玩具的动态或个性。当孩子拉着线或按下按钮时,其他玩 具包括机械特性,允许简单的机械运动或一个单词或短语的朗诵。
[0005] 随着计算机、执行器和处理技术的普及,互动玩具和电脑游戏已经变得越来越普 遍。这些玩具能够感测环境,作出判断,并与孩子互动。然而,许多的玩具仅提供有限的简 单的线性互动。为这些玩具和游戏创建更复杂的内容仍然是困难的,因为有许多可能的输 入,每个可能需要不同的回应。
[0006] 创建可以接受这些输入并做出判断、推理、发展、交流,以及操控对象的系统在计 算机科学和机器人的分支广泛地被研宄。虽然目前一些玩具有更多的交互特性,这些玩具 仍然缺乏在人类中发现的各种性格特征。创建具有各种个性特征的合成角色更加困难。创 建脚本和内容的传统工具太简单以至于不能允许复杂的交互内容的高效创建。例如,常见 的脚本编写工具往往是线性的,不便于动态互动。正因为如此,许多挑战和低效在用于为人 工智能系统,诸如玩具和游戏创建内容的工具中被发现。
[0007] 概述
[0008] 本发明描述了使用人工智能脚本工具创建交互式合成角色的系统和方法。在一些 实施例中,一种方法包括:在显示设备上显示会话编辑器。会话编辑器可以被配置用于创建 交互式合成角色的遍历脚本。一组会话规则可以从用户接收。在一些实施例中,这些规则 可以由会话编辑器引导。谈话规则可以包括一个或多个交互的实体(例如,其他玩具,儿童 等)之间的多路通信。
[0009] 根据各种实施例,每个会话规则可以包括一个或多个回应,其可以包括由交互式 合成角色执行的动作。该回应可以包括,例如,合成角色说的可听或书写的单词,执行一个 或多个动画,播放一个或多个声音效果,从一个或多个数据源取得数据等。此外,在一些实 施例中,各种类别和/或年龄范围可以被分配到允许根据最终用户年龄产生不同的回应的 会话规则。
[0010] 遍历脚本可以从一组会话规则生成。当由合成角色执行时,该脚本允许该动态互 动可根据多个变量和/或随时间变化。在一些实施例中,遍历脚本可以由使用与会话规则 相关的一个或多个导航指令的状态引擎导航。一旦被创建,该脚本可以被存储在可以由各 种玩具和/或程序访问的数据库中。
[0011] 本发明的各种实施例提供了用于开发交互式合成角色内容的计算机执行的方法。 根据一些实施例,用户界面屏幕可以被显示在终端上(例如,计算机、移动设备等)。用户界 面屏幕可包括用于创建会话的会话规则编辑器。与用户输入(例如,动作、语音模式、互动 等)匹配的第一对话规则可从用户接收并且在用户界面屏幕上显示。在一些实施例中,基 于第一对话规则的第二会话规则可动态地填充在用户界面屏上。在其他实施例中,用户可 以输入第二会话规则。编辑器还可以允许用户将年龄或年龄范围、类别、导航指令、基于时 间的规则相关,和/或其它用于创建交互式体验的特征关联。
[0012] 在一些实施例中,用户界面屏幕可以包括允许用户浏览交互式聊天创建的会话的 模拟器。这个模拟器还可以提供的功能,允许用户调试当前会话,诸如通过每个规则和回应 视觉上步进,在会话中将断点设置在某些点,或迫使会话进入特定的路径。
[0013] 本发明的实施例还包括包含指令集的计算机可读存储介质,以使一个或多个处理 器执行本文所描述的方法、方法的变型,以及其它操作。
[0014] 本发明的各种实施例包括包括显示设备、输入/输出设备、存储器和处理器的系 统。处理器可以与显示输入/输出设备通信和可操作于执行存储在存储器中的指令。在一 些实施例中,处理器可执行指令可以使处理器传送显示数据到显示输入/输出设备以使图 形用户界面在显示设备上显示。图形用户界面可以包括交互式脚本编辑器,其中一组定制 规则和回应可以由用户输入。交互式脚本编辑器可用于在视觉上指示定制规则组之间的关 系,每个具有由交互式合成角色执行的回应或由交互式合成角色观察的环境刺激。每个由 交互式合成角色执行的回应可以在视觉上与具有触发回应的环境刺激(例如,数据输入、 环境观察,或者与交互式合成角色的互动)的相应的定制规则相关。
[0015] 本发明的一些实施例提供脚本编写应用,其被配置用于在图形用户界面窗口中呈 现会话规则。每个会话规则可以与合成角色执行的回应相关(例如,产生可听或文本的语 音、播放媒体剪辑、开始动画等)。图形用户界面窗口可以包括同一会话的多个视觉表示。 例如,在一个表示中,会话规则可分层呈现。在另一个表示中,对话模拟器能够使用状态引 擎来浏览被呈现的会话规则。脚本编写应用也可以包括建议引擎,其被配置用于接收会话 规则并且呈现对进一步会话规则的建议。
[0016] 随着多个实施例被公开,本发明的其它实施例从以下的详细说明对于本领域技术 人员将变得显而易见,其中显示并描述了本发明的说明性实施例。将要认识到的是,本发明 能够在不脱离本发明范围的情况下在各个方面做出修改。因此,附图和具体实施例应被认 为是说明性的而非限制性的。

【专利附图】

【附图说明】
[0017] 本发明的实施例将通过使用附图被描述并说明,其中:
[0018] 图1示出了用于为交互式合成角色创建脚本的计算环境,其中本发明的一些实施 例可于其中被利用;
[0019] 图2是根据本发明的一个或多个实施例的示例性脚本编辑器的屏幕截图;
[0020] 图3是根据本发明的各种实施例,示出人工智能脚本编写工具的示例性组件的框 图;
[0021] 图4是根据本发明的一些实施例,示出用于创建交互式体验的示例性操作集的流 程图;
[0022] 图5是根据本发明的一个或多个实施例,用于创建对话框的示例性的脚本编辑器 的屏幕截图;
[0023]图6是根据各种本发明的实施例的示例性树编辑器的屏幕截图;
[0024] 图7是根据本发明一些实施例,创建动画对话框的示例性树编辑器工具的屏幕截 图;
[0025] 图8是根据本发明的一些实施例,示出用于生成遍历脚本的示例性的操作集的流 程图;
[0026] 图9A和9B是根据本发明一些实施例,创建动画对话框的示例性的会话编辑器的 屏幕截图;
[0027] 图IOA和IOB是根据本发明一些实施例的不例性的同义词和填充窗口的屏幕截 图;
[0028] 图IlA和IlB是根据本发明的一些实施例,用于创建角色元数据和管理录制的内 容的示例性编辑器的屏幕截图;以及
[0029] 图12示出了本发明的一些实施例可利用的计算机系统的一个示例。
[0030] 附图并不必然按比例绘制。例如,附图中一些元件的尺寸可以扩大或缩小,以帮助 改善对本发明的实施例的理解。同样,出于对本发明的一些实施例的讨论的目的,一些组件 和/或操作可被分成不同的块或组合成单个的块。此外,虽然本发明可修改为各种修改和 替换形式,具体的实施例已通过附图中的示例的方式示出,并在之后被详细描述。然而,这 并不旨在将本发明限制于所描述的特定实施例。与此相反,本发明意在涵盖由所附权利要 求限定的落入本发明的范围之内的所有修改、等同物和替代。 具体实施例
[0031] 本发明的各种实施例通常涉及为交互式合成角色创建内容。更具体地,本发明的 各种实施例涉及人工智能脚本工具的系统和方法。脚本工具允许内容创造者更简便地产生 分层互动,以有效地模拟合成角色中的各种人类特征和能力(例如,交流,动作,知识等)。 其结果是,交互式合成角色对于最终用户变得更加有趣。
[0032] 根据本发明的一些实施例中,脚本工具可以包括各种编辑器、插件、模块和特性, 以帮助用户创建交互式内容。这些工具可用于创建分层脚本,其具有不同状态可以根据存 在的不同的条件进行遍历不同的状态。各种引擎和模块可以用于组合可用信息,包括不确 定和/或不完整的信息,并且确定如何遍历脚本。例如,不同的确定性和概率方法(例如, 贝叶斯网络,马尔科夫链,以及卡尔曼滤波方法)也可以使用。此外,神经网络和模糊逻辑 可以在一些实施例中使用。
[0033] 根据一些实施例,脚本工具可以包括树编辑器,其提供了分层会话的"树状"图。 例如,编辑器可以允许多个输入,诸如用户说:"你好,你怎么样? "和"嗨"。根据输入,不 同的回应可以被创建。例如,在"嗨"的情况下,"你好!"的回应可被使用。在"你好,你怎 么样? "的情况下,更详细的谈话可以通过询问用户他们怎么样,接着识别各种反应,诸如 "好"、"坏",或退回匹配其他(以给予一些回应,当我们的不理解用户所说的话的情况下) 回应来创建。
[0034] 在一些实施例中,脚本工具允许关键词被从提供的短语被选出。然后AI系统或角 色可以寻找AI系统或角色的用户的讲话中的这些关键词。这使得创意性的作家写出实际 的短语,然后只指定用于模式识别的关键词。短语中剩余的单词可以完全忽略或以其他方 式不再强调。例如,如果只有单词"爱"和"你"被强调,那么系统将从用户识别任何短语, 使用以此顺序的单词,诸如"哦,嗨,我是真的爱你的全部。"这提供了有用的技术,让创意用 户指定AI系统的模式匹配。
[0035] 一些实施例包括可用于通过使用不同的视觉和互动机制编辑相同底层数据的脚 本编辑器。脚本编辑器可允许从屏幕顶部向下穿过每个会话线程的对话自上而下显示。在 每个垂直层面,多个选项可以呈现,即会话可以采取不同音轨。脚本编辑器的一个优点是, 编辑器可以产生从屏幕顶部本到底部的线性脚本,并且对话框可以左右滑动,让用户向下 选择不同音轨的分层话。因此通过分层数据集呈现更加线性的图对是创意工作者而言比较 熟悉。
[0036] 尽管为了方便起见,本发明的实施例参照玩具和游戏的交互式合成角色被描述, 本发明的实施例同样适用于具有商业、军事、教育和/或其它应用的各种其它AI系统。这 里介绍的技术可以被实施为专用硬件(例如,电路),或者作为可编程电路与软件和/或固 件适当编程,或者作为专用和可编程电路的组合。因此,实施例可以包括计算机可读介质, 其上存储有可用于对计算机(或其他电子设备)编程以执行处理的指令。机器可读介质可 以包括,但不限于,软盘、光盘、光盘只读存储器(CD-ROM),以及磁光盘、只读存储器(ROM)、 随机存取存储器(RAM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器 (EEPROM)、磁卡或光卡、闪存,或其他类型的适于存储电子指令的介质/机器可读介质。
[0037] 术语
[0038] 术语的简要定义、缩写,以及在整个申请中使用的短语在下面给出。
[0039] 术语"连接"或"连结"和有关术语以操作感被使用,并不必然限制直接的物理连 接或连结。因此,例如,两个设备可直接或通过一个或多个中间通道或设备连结。作为另一 示例,设备可以以这样的方式连结,信息传递其间,而没有彼此共享任何物理连接。基于本 文提供的公开,本领域的普通技术人员之一将理解各种方式,其中连接或连结根据上述定 义存在。
[0040] 短语"在一些实施例中"、"根据各种实施例"、"示出的实施例中"、"在其他实施例 中"等通常指特定的特征、结构或特性,如下短语被包括在本发明至少一种实施例中,并且 可以被包括在本发明一个以上的实施例中。此外,这些短语并不必然指代相同的实施例或 不同的实施例。
[0041] 如果说明书规定组件或特性"可能(may) "、"可以(can) "、"可以(could) "或"可 能(might) "被包括或有特点,特定的组件或特性并不需要被包括或有特点。
[0042] 术语"模块"是指广义上的软件、硬件或固件(或其任何组合)的组件。模块通常 是功能组件,其可以通过使用指定的输入生成有用的数据或其他输出。模块可以是或可以 不是独立的。应用程序(也称为"应用")可以包括一个或多个模块,或者一个模块可以包 括一个或多个应用程序。
[0043] 概述
[0044] 图1示出了用于为交互式合成角色创建脚本的计算环境100,其中本发明的一些 实施例可于其中被利用。图1示出的实施例显示多个客户端IlOa-IlOn运行能够为交互式 合成角色创造定制的内容的脚本编写应用120a-120n。客户端IlOa-IlOn可以是web浏览 器、应用或能够使用网络130来访问人工智能(Al)服务器140的系统。AI服务器140可 以运行的服务器端应用程序150,其被通信地连结到脚本数据库160和声音数据库170。月艮 务器端应用程序150也可用于促进脚本编写应用120a-120n所需的一些或全部的处理。此 夕卜,服务器端应用150可以承载基于附加订阅的组件以增强脚本编写应用120a-120n中的 特性。
[0045] 脚本数据库160可以被用于存储由脚本编写应用120a_120n创建的内容。各种玩 具、游戏或系统可以从脚本数据库160经由网络130取得。声音数据库中170存储录音(例 如,媒体剪辑,演员朗读各种短语或对话部分的录音,或声音效果)。存储在脚本数据库160 中的内容可以链接到这些录音中的一个,或者可以包括副本。
[0046] 网络130可以是任何一组能够交换信息的互连设备。在一些实施例中,网络130 可以少到局域网(LAN)上若干个人计算机或大到因特网。在一些情况下,网络130可以包 括多个网络(私人和/或公共),即使多个异构网络,诸如一个或多个边界网络、语音网络、 宽带网络、服务提供商网络、互联网服务提供商(ISP)网络和/或公共交换电话网(PSTN), 经由可操作于促进不同网络之间的通信的网关相互连接。
[0047] 图2是根据本发明的一个或多个实施例的示例性脚本编辑器200的屏幕截图。脚 本编辑器200可以是桌面应用或云计算应用。脚本编辑器200的各种实施例允许用户在视 觉上一组角色制作会话内容。为此应用程序可以包括以下功能的一个或多个:1)深度基于 主题的会话(支持嵌套规则和回应,或答辩状);2)匹配一系列用户输入的灵活规则(例 如,"我爱你"匹配"嘿,我真的爱你");3)用户提问和陈述之间的差异;4)处理否定的规则, 所以"我爱你"不匹配"我不爱你"(例如,排除"不");5)支持特定年龄的对话;6)支持不 同玩具的个性(例如,情感模式、海盗模式、运动模式等);7)处理重复(即,用户重复同样 的事情);8)支持退回主题,试图重新取回对主题的控制或者引导讲故事;9)支持同义词或 概念,即,"肉"也匹配"鸡肉"、"牛肉"或"猪肉";10)支持基于时间的规则,允许玩具的性格 随使用时间演变;11)支持指定对作为用户移动玩具的物理姿态的回应;12)支持触发动画 或声音效果;13)管理需要由配音员录制的所有短语;和/或14)版本控制,包括存储在非 现场数据库的内容。
[0048] 如图2中所示的实施例,脚本编辑器200中的主窗口可以包括会话规则编辑器 210、类别列表220,以及聊天窗口 230。会话规则编辑器210允许用户为当前所选的类别创 建所有会话规则和回应。会话规则编辑器210能够是用户输入规则匹配用户说的事物,其 次是AI系统或角色可以提供的潜在回应。每个这些回应可包括后续规则和回应以继续会 话。在分层视图中示出的规则代表可被作为脚本的单个主题的会话的各种线程。
[0049] 分类列表220允许所有单个角色的内容可以跨任何数量的类别,诸如介绍、游戏、 故事、数学等。聊天窗口 230允许用户通过键入单词来测试最新的内容,以及看玩具将以给 定的会话规则如何作出回应。各种按钮可以用来快速创建内容。此外,搜索框240可用于 跨一些或全部类别进行搜索,以找到特定的互动。脚本编辑器200可以不被用于将所有内 容作为脚本。例如,在一些实施例中,一些内容可以直接使用底层存储格式,诸如XML脚本。
[0050] 图3是根据本发明的各种实施例,示出人工智能脚本编写工具的示例性组件的框 图300。如图3所示,用户310 (例如,工程师、剧作家、小说家、作家或艺术家)可以通过图 形用户界面320访问AI脚本工具。AI脚本工具可以访问各种功能,允许用户更便捷地创 建内容。会话规则模块330和回应模块340可以允许脚本工具的用户创建定制会话规则或 从一组预编程规则中选择。例如,会话规则模块330和回应模块340可以被用于允许脚本 工具的用户在合成角色中创建一个或多个动作以回应已被侦测到的一系列情况、回应或输 入。
[0051] 在一些实施例中,角色模块350可以为脚本工具的用户提供创建不同类型的角色 或特定内容的指南。例如,如果用户正在创建海盗主题的角色,角色模块350可以提供关于 会话风格、流和方向的模板或指南。在一些情况下,一个或多个声音效果(例如,媒体剪辑、 录制的短语等)可以从声音效果数据库360取得。这可以用于为用户提供可创建的内容类 型。此外,脚本工具的用户能够重用新使已经被创建的媒体剪辑。对于教育角色,一组特定 的教育内容,可能被需要或要求(例如,由第三方)包括合成角色的内容。图形用户接口 320还可以提供视觉指示,哪些内容已被包括和哪些内容仍需要被包括。
[0052] 建议模块370可以通过图形用户界面320为脚本工具的用户提供建议的会话规 贝1J。建议模块370可以具有来自角色模块350的输入或包含已经在脚本工具中被创建的任 何内容(例如,一个或多个先前会话规则)。建议也可以是来自于用户与AI系统先前的互 动。此外,在一些情况下,脚本工具可以允许为用户提供会话中会话流或特定内容点的大 纲。这些也可以作为对建议模块370的输入被提供。通过使用一种或多种这些输入或信息, 建议模块370可以生成可被呈现给脚本工具的用户的建议的会话规则或模板。用户可以忽 略、选择或编辑建议的会话规则或模板。
[0053] 一旦用户已经完成生成该会话规则,脚本生成器380可以将规则转换成可以由合 成角色遵循的脚本。这些脚本可以存储在数据库390中。由脚本生成器380创建的脚本可 具有与回应关联的多个状态。一组条件或导航指令与每个状态相关。为了从一个状态到另 一个过渡或导航,导航指令必须令人满意。脚本生成器380可以提供各种一致性检查。例 如,脚本生成器380可以检查脚本中没有状态孤立于其他(即,在脚本使用期间,它永远不 会被达到)。如果发生这种情况,它可以被标记到脚本工具的用户310。
[0054] 图4是根据本发明的一些实施例,示出用于创建交互式体验的示例性操作集400 的流程图。图4中示出的操作可以由本文公开的一个或多个硬件组件、处理器、引擎或模块 执行。例如,一个或多个操作可以由建议模块370执行。
[0055] 显示操作410期间,具有脚本编辑器的图形用户界面屏幕可被显示在显示设备 上。在接收操作420期间,指令从用户接收以创建会话规则。接收会话后,在建议操作430 期间,第二规则可以被动态地建议。许多不同的因素和/或输入可以被用于确定被建议的 会话规则。示例包括,但不限于,合成角色的用户的年龄范围、角色类型、内容类型、先前会 话规则、合成角色的能力、特定内容点、内容需求、从与AI系统的先前的用户互动收集的输 入,和/或其它输入或因素。在编辑操作440期间,用户可以根据需要编辑会话规则。
[0056] 图5是根据本发明的一个或多个实施例,用于创建对话框的示例性的脚本编辑器 500的屏幕截图。如图5所示,脚本编辑器500包括会话规则编辑器,提供了一些列以定制 规则如何被匹配,或何时回应可以被使用。在图5所示的实施例中,脚本编辑器500提供了 视觉和交互机制用于创建内容。有从屏幕顶部向下穿过每个会话线的会话自上而下显示。 在每一个垂直的水平,我们显示所有可用的选项,即会话可以采用不同的音轨。
[0057] 在这个示例中,用户已经选择句子"我真的很抱歉听到这些"(第四行),并且系统 显示(例如,高亮、色彩或以其他方式强调)将用户带到那个叙述的所有对话框条目。这个 工具的一个优点是,该工具可以制造从屏幕的顶部到底部的线性外观,左右滑动对话框,让 用户选择不同分层会话向下的音轨。它也可以沿着使得它们在彼此的顶部垂直地堆叠的路 径对齐所有规则和回应。
[0058] 图6是根据各种本发明的实施例的示例性树编辑器600的屏幕截图。脚本工具的 各种实施例可包括树编辑器600,它提供分层会话的"树状"图。例如,编辑器可以允许多个 输入,诸如用户说:"你好,你怎么样? "和"嗨"。根据输入,不同的回应可以被创建。例如, 在"嗨"的情况下,"你好"可被使用。在"你好,你怎么样? "的情况下,更详细的谈话可以 通过询问用户他们怎么样,接着识别各种反应,诸如"好"、"坏",或退回匹配其他(以给予一 些回应,当我们的不理解用户所说的话的情况下)回应来创建。
[0059] 在一些实施例中,关键字可以从提供的短语选出。由AI系统生成的合成角色可以 在用户所说的内容中寻找关键词。这种关键字选择的类型允许创意性作家写出来实际的短 语,然后只指定用于模式识别的关键词。短语中剩余的单词可以完全忽略或不再强调。例 如,如果只有单词"爱"和"你"被强调,那么系统将从用户识别任何短语,使用以此顺序的 单词,诸如"哦,嗨,我是真的爱你的全部。"这提供了有用的技术,让创意用户指定AI系统 的模式匹配。
[0060] 图7是根据本发明一些实施例,创建动画对话框的示例性树编辑器工具700的屏 幕截图。图7中的树编辑工具700显示了用于在应用中执行操作,在屏幕上播放动画或播 放声音样本的附加的线。作为本发明的各种实施例允许被脚本化地所有类型的内容,而且 在许多情况下,该内容不仅包括对话框,还包括完整的多媒体体验。
[0061] 图8是根据本发明的一些实施例,示出用于生成遍历脚本的示例性的操作集800 的流程图。这些操作的一个或多个,用于生成可由处理器、模块和/或组件诸如脚本生成器 380。在接收操作810期间,一组会话规则从用户接收。会话规则定义具有回应(例如,讲 话、播放媒体剪辑、动画等)的不同状态和条件用于在状态之间移动的情况(或导航指令)。
[0062] 确定操作820确定导航指令组。在本生成操作830期间,遍历脚本从这些生成。 确定操作840确定是否需要任何更新。例如,脚本可以进行审查,以确定一组需要的内容是 否已被包括。在其他情况下,脚本可以进行审查,以确保与特定的角色类型或年龄组的一致 性。尽管如此,确定操作850还可以确定脚本中达到一个或多个状态是否有任何问题。如 果需要任何更新,那么确定操作840分支到请求要求操作850,其中请求被生成为用户更新 会话规则。如果确定操作840判定为不需要更新,则确定操作840分支到存储操作860,其 中脚本是存储在数据库中。
[0063] 图9A和9B是根据本发明一些实施例,创建动画对话框的示例性的会话编辑器的 屏幕截图。如这些实施例所示,会话规则编辑器可以提供多个列以定制规则如何匹配,或何 时回应当可被使用。例如,用户可以指定通过使用特定年龄的用户的特定的回应,或者为特 定的玩具个性(刻薄、善良、可憎等)提供回应。
[0064] 图IOA和IOB是根据本发明一些实施例的不例性的同义词和填充窗口的屏幕截 图。图IOA中的同义词窗口允许用户为匹配规则的单词指定所有同义词(或概念)。选择 那些能在规则匹配的话。这个特征的一个优点是,它允许用户编写可以匹配许多不同的变 化的单独的规则。同义词可以在每个规则中通过使用特殊字符(例如,?)重复使用。如 示例中所示,规则中的文本"?肉"也将匹配"牛肉"、"猪肉"、"羊肉"、"鸡肉",以及"肉"本 身。
[0065] 会话填充窗口允许用户创建各种填充单词或短语使合成角色可以任意使用以解 决技术限制,诸如网络滞后、机器人语音合成、听不到用户回应等。一些填充类别可以由脚 本工具来定义,用户简单地为每个类别提供了一组可能说的事物。在其他实施例中,定制的 类别可以由用户创建。
[0066] 图IlA和IlB是根据本发明的一些实施例,用于创建角色元数据和管理录制的内 容的示例性编辑器。图IlA示出了角色属性编辑器,允许用户指定描述角色的不同的元数 据。编辑器也可以用于为合成角色指定默认状态,诸如将要定制内容,初始的个性或默认年 龄范围(直到它知道用户的实际年龄)。
[0067] 图IlB示出了预录制内容编辑器,其可被用于管理合成角色可以说的所有事物的 预录制音频内容。预录制内容编辑器能够搜索并找到需要被录制的所有回应。在一些实施 例中,预录制内容编辑器可以显示录制的所有回应、所有那些已经被记录,以及侦测可能是 副本的短语的方法,和可以被合并以减少数录音数量的录制列表。
[0068] 也许在不同的编辑器中,附加功能可以被使用简化录制内容的过程,将其切割成 各个MP3文件,剪切,改变比特率,以及将每个文件与适当的回应关联。在很多情况下,这里 所描述的各种脚本工具可能并不负责所有脚本对话内容。在脚本工具之外创建的其他元素 可能包括:1)自动生成的规则,诸如从有/无问题的列表;2)需要编码技能的逻辑谜题,如 数学游戏或猜我想到的数字;和/或3)涉及的可被下载的数据表的游戏,诸如知道世界所 有首都。根据一个或多个实施例,脚本工具可以提供插入、编辑,或与外部内容交互的界面。 在一些实施例中,脚本工具可以提供对我们从用户收集的转录录音组的访问,以建议会话 主题。
[0069] 示例性计算机系统概述
[0070] 本发明的实施例包括各种步骤和操作,这已在上面描述。各种的这些步骤和操作 可以由硬件部件执行,或者可以在机器可执行指令中体现,其可以被用于使以指令编程的 通用或专用处理器执行的步骤。可替代地,这些步骤可以通过硬件、软件和/或固件的组合 来执行。因此,图12示出了本发明的一些实施例可利用的计算机系统的一个示例。根据这 个示例,该计算机系统包括总线1205、至少一个处理器1210、至少一个通信端口 1215、主存 储器1220、可移动存储介质1225、只读存储器1230,以及大容量存储1235。
[0071] 处理器1210可以是任何已知的处理器,诸如,但不限于,1】批丨@安腾?或 Itanium2? 处理器,或AMD? Opieron?或AthlonMP?处理器,或Moloro丨a?处理 器产品线。通信端口 1215可以是任何一个RS-232端口,与基于调制解调器的拨号连接、 10/100以太网端口,或者使用铜缆或光纤的千兆端口一起使用。通信端口 1215可以根据网 络,诸如局域网(LAN)、广域网(WAN),或者计算机系统1200连接任何网络进行选择。
[0072] 主存储器1220可以是随机存取存储器(RAM),或本领域中公知的任何其它动态存 储设备。只读存储器1230可以是任何静态存储设备,诸如可编程只读存储器(PROM)芯片, 用于存储静态信息诸如用于处理器1210的指令。
[0073] 大容量存储设备1235可以被用于存储信息和指令。例如,硬盘,如SCSI驱动器、 光盘的Adaptec?家族,磁盘阵列,如RAID驱动器的Adaptec?家族,或者任何其他大容量 存储设备的阵列。
[0074] 总线1205可通信地将处理器1210与其他内存、存储和通信模块连结。根据所使 用的存储设备,总线1205可以是PCI/PCI-X或基于SCSI的系统总线。
[0075] 可移动存储介质1225可以是任何类型的外部硬盘驱动器、软盘驱动器、 IOMEGA?Zip驱动器、只读存储器-光盘(CD-ROM)、可重复擦写-光盘(CD-RW)、只读存 储器-数字视频盘(DVD-ROM)。
[0076] 以上描述的组件意在例举某些类型的可能性。它们仅是示例性的实施例,上述示 例决不应该限制本发明的范围。
[0077] 总之,本发明提供了新颖的系统、方法和布置用于为合成角色创建定制的交互内 容。虽然本发明的一个或多个实施例的详细描述已经在上面给出,各种替代、修改和等同 物,在不改变本发明精神的情况下,对本领域技术人员将是显而易见的。例如,虽然上面描 述的实施例涉及具体的特征,本发明的范围还包括具有特征的不同组合的实施例,以及不 包括所有描述的特征的实施例。因此,本发明的范围旨在涵盖落在本权利要求书的范围之 内的所有这样的替代、修改和变化,以及所有的等同物。因此,以上描述不应被视为限制由 所附的权利要求书限定的本发明的范围。
【权利要求】
1. 一种系统,用于为交互式合成角色创建定制脚本,所述系统包括: 显示设备,可操作于显示图形用户界面; 显示输入/输出设备,与所述显示设备通信; 处理器,与所述显示输入/输出设备通信,并且可操作于执行存储在存储器中的指令; 以及 所述存储器具有处理器可执行指令,其中所述处理器可执行指令使所述处理器传送显 示数据到所述显示输入/输出设备,以使所述图形用户界面被显示在所述显示设备上,其 中所述图形用户界面包括交互式脚本编辑器,透过所述交互式脚本编辑器一组定制规则和 回应可由用户输入,其中每个所述定制规则代表可能引起零个或更多回应的环境刺激,并 且其中所述交互式脚本编辑器的一部分在视觉上地表示由所述交互式合成角色所执行的 所述定制规则组和所述相关的回应之间的关系。
2. 根据权利要求1所述的系统,其中所述环境刺激因素包括数据输入、环境观察,或与 所述交互式合成角色的互动。
3. 根据权利要求2所述的系统,其中数据输入包括从远程源收集的当前天气状况,一 天中的时间,一周中的日期,位置,孩子的年龄,或以前的互动模式。
4. 权利要求2所述的系统,其中所述环境观测包括多个观察的声音、当前噪声水平、物 件存在,或第二交互式合成角色的侦测。
5. 根据权利要求1所述的系统,其中所述回应包括声音效果。
6. 根据权利要求5所述的系统,其中声音效果包括所述定制回应、媒体剪辑,或现场扬 声器组中的一个的文本的语音模拟阅读。
7. 根据权利要求1所述的系统,其中所述图形用户界面进一步包括字符界面以根据所 选字符建议脚本的方向。
8. 根据权利要求1所述的方法,其中所述回应包括动画。
9. 一种用于开发交互式合成角色内容的计算机执行的方法,所述方法包括: 在终端上显示用户界面屏幕,所述用户界面屏幕包括用于创建会话的会话规则编辑 器; 接收来自用户的第一会话规则,以与用户输入进行匹配; 在所述用户界面屏幕上显示所述第一会话规则;以及 动态填充所述用户界面屏幕上的第二会话规则,其中所述第二会话规则最初基于所述 第一会话规则,并且可以由用户编辑。
10. 根据权利要求9的方法所述的计算机执行方法,其中所述第二会话规则包括由交 互式合成角色所执行的回应。
11. 根据权利要求9的方法所述的计算机执行方法,其中所述第一会话规则包括年龄 相关。
12. 根据权利要求9的方法所述的计算机执行方法,其中所述第一会话规则包括环境 刺激。
13. 根据权利要求12的方法所述的计算机执行方法,其中所述环境刺激包括由所述交 互式合成角色观察的语音。
14. 根据权利要求9的方法所述的计算机执行方法,其中所述第一会话规则包括导航 指令,以指示状态引擎将从第一会话规则移动到另一会话规则的条件。
15. 根据权利要求13的方法所述的计算机执行方法,其中所述导航指令包括基于时间 的规则,以允许所述状态引擎随时间导航到不同会话规则。
16. 根据权利要求9的方法所述的计算机执行方法,其中所述用户界面屏幕允许所述 用户将类别与所述会话关联。
17. 根据权利要求9的方法所述的计算机执行方法,其中所述用户界面屏幕包括模拟 器输入,以允许所述用户导航为所述交互式合成角色所创建的会话内容。
18. -种方法包括: 在显示设备上显示被配置用于为交互式合成角色创建遍历脚本的会话编辑器; 接收来自用户的一组会话,其中每个会话规则包括由所述交互式合成角色执行的一个 或多个回应; 生成来自所述会话规则组的所述遍历脚本,其中所述遍历脚本可以由状态引擎导航; 以及 在数据库中存储所述遍历脚本。
19. 权利要求18的方法,其中会话规则组包括多于一个交互实体的多路通信。
20. 根据权利要求18所述的方法,进一步包括当所述状态引擎将过渡到另一会话规则 时,将导航指令与每个会话规则指示条件关联。
21. 根据权利要求18所述的方法,还包括确定一个或多个回应何时包括由配音员所录 制的短语。
22. 根据权利要求18所述的方法,进一步包括将类别与所述遍历脚本关联。
23. 根据权利要求18所述的方法,进一步包括将年龄范围与每个所述会话规则或回应 关联。
24. 根据权利要求18所述的方法,其中由所述交互式合成角色执行的一个或多个回应 包括为所述交互式合成角色产生可听或文本语音,执行一个或多个动画,或播放一个或多 个声音效果。
25. -种配置用于呈现人工智能(AI)系统的会话的脚本编写应用,其包括图形用户界 面窗口中的会话规则和回应,其中每个会话规则与由所述AI系统所执行的零个或更多回 应,或行动相关。
26. 根据权利要求25所述的脚本编写应用,其中所述图形用户界面窗口被配置用于通 过能够使用状态引擎导航所述会话规则的对话框模拟器分层地呈现所述会话的第一视觉 表示,或呈现所述会话的第二视觉表示。
27. 根据权利要求25所述的脚本编写应用,其中所述图形用户界面由创意性非技术的 用户使用。
28. 根据权利要求27所述的脚本编写应用,其中所述创意性非技术的用户是剧本作 家、小说家、作家,或艺术家。
29. 根据权利要求25所述的脚本编写应用,其中当回应中的一个超过特定的长度时, 所述图形用户界面给用户提供视觉反馈。
30. 根据权利要求25所述的脚本编写应用,其中所述图形用户界面提供反馈给用户以 表明一个或多个回应可能不能够由所述AI系统显示其全部。
31. 根据权利要求25所述的脚本编写应用,其中所述回应包括监测特定语音输入。
32. 根据权利要求25所述的脚本编写应用,其中所述回应包括使所述AI系统执行行动 或动作。
33. 根据权利要求25所述的脚本编写应用,其中所述反应包括播放媒体剪辑。
34. 根据权利要求25所述的脚本编写应用,进一步包括被配置用于接收所述会话规 贝1J,并且在所述图形用户界面窗口呈现建议插件的建议引擎,其中所述建议插件被配置用 于为进一步的会话规则提供建议。
35. 根据权利要求25所述的脚本编写应用,进一步配置用于创建和再使用会话规则和 回应、或模板的泛型集合,其中所述模板提供初始起点以为所述AI系统创建新内容。
36. 根据权利要求25所述的脚本编写应用,进一步配置用于为所述AI系统中的一个或 多个所述回应创建、导入或关联多个包含配音员录制的音频文件。
【文档编号】G06F3/048GK104508629SQ201380039543
【公开日】2015年4月8日 申请日期:2013年7月25日 优先权日:2012年7月25日
【发明者】马丁·雷迪, 奥伦·M·雅各布, 罗伯特·G·坡德斯塔, 卢卡斯·R·A·艾夫斯, 凯瑟琳·黑尔 申请人:托伊托克有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1