根据用户数据输入提供信息的终端设备、程序和服务器设备的制造方法

文档序号:10517921阅读:676来源:国知局
根据用户数据输入提供信息的终端设备、程序和服务器设备的制造方法
【专利摘要】提供了一种减轻用户在通过语音发出指令时所经历的困难的方法。如果用户在终端设备上执行预定操作,则终端设备显示对话画面并且等待语音指令。当自开始显示对话画面以用于等待状态起过去了预定时间段而用户没有发出语音指令时,终端设备显示根据用户的属性或用户所在的环境的属性来提示语音质量的文本。即使用户不确定语音指令的内容,也可根据所显示的提示来发出语音指令。因此允许流畅地发出语音指令。
【专利说明】
根据用户数据输入提供信息的终端设备、程序和服务器设备
技术领域
[0001]本发明涉及一种根据用户对终端设备的数据输入向用户提供信息的机制。
【背景技术】
[0002]存在一种使得终端设备能够执行符合其用户通过语音(speech)发出的指令的处理的机制(以下,此机制称作“语音代理系统”)。
[0003]例如,非专利文献I介绍了由语音代理系统执行的任务的示例。其中一个示例是响应于用户向智能电话中发出的语音:“搜索这里附近的出租车!”,使得智能电话显示可向用户的当前位置派遣出租车的出租车公司的信息的任务。
[0004]引用列表
[0005]非专利文献
[0006]非专利文献1:NTT D0C0M0公司的 “What you can do with Shabette Concier”。于2013年10月18 曰从http://www.nttdocom0.c0.jp/service/informat1n/shabette_concier/feature/index.html 检索。

【发明内容】

[0007]技术问题
[0008]语音代理系统使用户能够通过语音来指示终端设备执行期望的处理。通常,与通过字符输入等发出指令相比,通过语音发出指令(以下称作“语音指令”)不太费事。然而,不熟悉语音指令的用户可能不知道他/她应该发出哪种语音以使得终端设备准确地执行符合指令的处理。即使熟悉语音指令的用户也不可能马上想出针对他/她所期望的处理的指令的可取语音的内容。
[0009]鉴于上述问题,本发明的目的是减轻用户在发出语音指令时所经历的困难。
[0010]问题的解决方案
[0011]为了解决所述问题,本发明提供一种终端设备,该终端设备包括:属性获取单元,其获取表示用户的属性或者用户周围的环境的属性的属性数据;语句获取单元,其获取表示提示用户发出语音指令的语句的提示语句数据,该提示语句数据与属性数据所表示的属性相对应;显示控制单元,其指示显示设备显示由提示语句数据表示的语句;语音数据获取单元,其获取语音数据,该语音数据表示由用户响应于显示设备显示由提示语句数据表示的语句而发出的语音;处理标识数据获取单元,其获取处理标识数据,该处理标识数据标识与语音数据所表示的指令相对应的处理;以及处理执行单元,其执行由处理标识数据标识的处理。
[0012]上述终端设备还可包括向服务器设备发送属性数据和语音数据的发送单元,并且所述终端设备可被配置如下:语句获取单元从服务器设备接收作为对发送单元发送的属性数据的回复而发送的提示语句数据;并且处理标识数据获取单元从服务器设备接收作为对发送单元发送的语音数据的回复而发送的处理标识数据。
[0013]上述终端设备可被配置如下:发送单元向服务器设备发送提示语句标识数据,该提示语句标识数据标识表示当语音数据获取单元获取语音数据时由显示设备显示的语句的提示语句数据;并且处理标识数据获取单元从服务器设备接收作为对语音数据和提示语句标识数据的发送的回复而发送的处理标识数据,所述处理标识数据标识与语音数据表示的指令和提示语句标识数据所标识的语句的组合相对应的处理。
[0014]上述终端设备可被配置如下:属性获取单元获取表示用户所发出的语音的语音数据作为属性数据。
[0015]本发明还提供一种服务器设备,该服务器设备包括:接收单元,其从终端设备接收属性数据,该属性数据表示终端设备的用户的属性或者用户周围的环境的属性;语句获取单元,其获取表示提示用户发出语音指令的语句的提示语句数据,该提示语句数据与属性数据所表示的属性相对应;发送单元,其向终端设备发送提示语句数据,其中,所述接收单元接收在发送单元发送提示语句数据之后从终端设备发送的语音数据;语音识别单元,其识别语音数据所表示的指令;以及处理标识数据生成单元,其生成标识与所述指令对应的处理的处理标识数据。所述发送单元向终端设备发送处理标识数据,作为对接收单元接收到的语音数据的回复。
[0016]上述服务器设备还可包括存储控制单元,并且服务器设备可被配置如下:接收单元从多个终端设备中的每一个接收属性数据和语音数据;所述存储控制单元使得存储设备将接收单元从各个终端设备接收到的属性数据与指令语句数据彼此关联地存储,所述指令语句数据表示由接收单元从终端设备接收到的语音数据表示并且由语音识别单元识别的指令的语句;并且所述语句获取单元利用与通过接收单元从所述多个终端设备中的一个接收到的属性数据具有预定关系的属性数据关联地存储在存储设备中的指令语句数据,生成待从发送单元发送到所述多个终端设备中的所述一个终端设备的提示语句数据。
[0017]上述服务器设备可被配置如下:所述存储控制单元使存储设备将指令语句数据与时间数据彼此关联地存储,所述时间数据表示指令语句数据所表示的指令的发出时间;并且所述语句获取单元基于存储在存储设备中的多条指令语句数据以及与所述多条指令语句数据关联地存储的时间数据来指定表示随着时间过去而使用频度增加的指令的指令语句数据,并且利用所指定的指令语句数据来生成待从发送单元发送的提示语句数据。
[0018]上述服务器设备可被配置如下:所述存储控制单元使存储设备将指令语句数据与终端标识数据彼此关联地存储,所述指令语句数据由语音识别单元从语音数据生成,并且所述终端标识数据标识已发送语音数据的终端设备;并且所述语句获取单元生成提示与标识所述多个终端设备中的一个的终端标识数据关联地存储在存储设备中的指令语句数据所表示的指令不具有预定相似性的指令的提示语句数据,作为待从发送单元发送到所述多个终端设备中的所述一个终端设备的提示语句数据。
[0019]上述服务器设备还可包括获取处理间相关性数据的相关性数据获取单元,该处理间相关性数据表示多个处理项目中包括的两个任意处理项目之间的相关性的大小,并且服务器设备可被配置如下:所述接收单元接收从终端设备发送的语音数据作为属性数据;所述语音识别单元识别由属性数据表示的指令;所述处理标识数据生成单元生成处理标识数据,该处理标识数据标识与属性数据所表示的指令相对应的处理项目;并且所述语句获取单元基于与属性数据所表示的指令所对应的处理项目的相关性的大小从所述多个处理项目当中选择一个处理项目,并且获取表示提示针对所选择的一个处理项目的指令的语句的提示语句数据,作为与属性数据所表示的属性相对应的提示语句数据,所述大小由处理间相关性数据表示。
[0020]本发明还提供一种使计算机执行下列处理的程序:获取表示用户的属性或者用户周围的环境的属性的属性数据的处理;获取表示提示用户发出语音指令的语句的提示语句数据的处理,该提示语句数据与所述属性数据所表示的属性相对应;指示显示设备显示由提示语句数据表示的语句的处理;获取语音数据的处理,该语音数据表示由用户响应于显示设备显示由提示语句数据表示的语句而发出的语音;获取处理标识数据的处理,该处理标识数据标识与语音数据所表示的指令对应的处理;以及通过处理标识数据来标识的处理。
[0021]本发明的效果
[0022]本发明提示用户发出与用户的属性或者用户周围环境的属性对应的语音指令。用户可参考提示的内容来考虑语音的内容。这减轻了用户发出语音指令时经历的困难。
【附图说明】
[0023]图1示出根据实施方式的语音代理系统的总体配置。
[0024]图2示出根据实施方式的终端设备的硬件组件。
[0025]图3示出根据实施方式的终端设备的功能组件。
[0026]图4示出根据实施方式的服务器设备的硬件组件。
[0027]图5示出根据实施方式的服务器设备的功能组件。
[0028]图6示出根据实施方式的服务器设备所使用的属性数据库的结构。
[0029]图7示出根据实施方式的服务器设备所使用的同义词数据库的结构。
[0030]图8示出根据实施方式的服务器设备所使用的相关性数据库的结构。
[0031]图9示出根据实施方式的服务器设备所使用的日志数据库的结构。
[0032]图1OA示例性地示出根据实施方式的显示在终端设备的显示器上的画面。
[0033]图1OB示例性地示出根据实施方式的显示在终端设备的显示器上的画面。
[0034]图1OC示例性地示出根据实施方式的显示在终端设备的显示器上的画面。
[0035]图1lA示例性地示出根据实施方式的显示在终端设备的显示器上的画面。
[0036]图1lB示例性地示出根据实施方式的显示在终端设备的显示器上的画面。
[0037]图1lC示例性地示出根据实施方式的显示在终端设备的显示器上的画面。
[0038]图1lD示例性地示出根据实施方式的显示在终端设备的显示器上的画面。
[0039]图12示出由根据实施方式的语音代理系统执行的一系列处理。
[0040]图13示出根据实施方式的服务器设备使用的指令语句列表的结构。
[0041]图14A示例性地示出根据变型例的显示在终端设备的显示器上的画面。
[0042]图14B示例性地示出根据变型例的显示在终端设备的显示器上的画面。
[0043]图14C示例性地示出根据变型例的显示在终端设备的显示器上的画面。
[0044]图15示出根据变型例的服务器设备所使用的处理间相关性数据库的结构。
[0045]图16示出根据变型例的服务器设备所使用的模型语句数据库的结构。
[0046]图17示出根据变型例的终端设备的功能组件。
[0047]图18示出根据变型例的服务器设备的功能组件。
[0048]图19示出由根据变型例的语音代理系统执行的一序列处理。
[0049]图20A示例性地示出根据变型例的显示在终端设备的显示器上的画面。
[0050]图20B示例性地示出根据变型例的显示在终端设备的显示器上的画面。
[0051]图20C示例性地示出根据变型例的显示在终端设备的显示器上的画面。
[0052]图20D示例性地示出根据变型例的显示在终端设备的显示器上的画面。
[0053]图20E示例性地示出根据变型例的显示在终端设备的显示器上的画面。
[0054]附图标记列表
[0055]I 语音代理系统
[0056]11 终端设备
[0057]12 服务器设备
[0058]19 通信网络
[0059]101 存储器
[0060]102 处理器
[0061]103 通信 IF
[0062]104 触摸显示器
[0063]105 麦克风
[0064]106 时钟
[0065]107 GPS 单元
[0066]109 总线
[0067]111 属性获取单元
[0068]112 发送单元
[0069]113 语句获取单元
[0070]114 显示控制单元
[0071]115 语音数据获取单元
[0072]116 处理标识数据获取单元
[0073]117 处理执行单元
[0074]121 接收单元
[0075]122 语音识别单元
[0076]123 处理标识数据生成单元
[0077]124 发送单元
[0078]125 存储控制单元
[0079]126 定时器单元
[0080]127 语句获取单元
[0081]201 存储器
[0082]202 处理器
[0083]203 通信 IF
[0084]209 总线
[0085]321 相关性数据获取单元
[0086]1041 显示器
[0087]1042 触摸屏
【具体实施方式】
[0088][实施方式]
[0089]下面描述根据本发明的实施方式的语音代理系统I。图1示出语音代理系统I的总体构造。语音代理系统I包括由用户携带的终端设备ll-ι至ll-η以及服务器设备12。终端设备11-1至ll-η的数量根据使用语音代理系统I的用户的数量而任意地改变。以下,当不需要与其余终端设备11-1至ll-η相区分时,终端设备11-1至ll-η中的任一个被称作“终端设备11”。当用户向终端设备11发出了语音指令时,服务器设备12解释用户的语音的含义,并且指示终端设备11执行必要处理。尽管在图1中服务器设备12被描绘为单个设备,服务器设备12可由例如彼此协作的多个设备组成。终端设备11和服务器设备12可经由通信网络19彼此执行数据通信。
[0090]终端设备11包括与例如配备有触摸显示器的普通平板个人计算机相同的硬件组件。另选地,终端设备11可以是其它类型的计算机中的任一个。图2示出平板个人计算机的硬件组件作为终端设备11的示例性硬件组件。图2中示例性地示出的终端设备11包括存储器101、处理器102、通信接口(IF)103、触摸显示器104、麦克风105、时钟106和全球定位系统(GPS)单元107作为硬件组件。这些组件经由总线109彼此连接。
[0091]存储器101是包括易失性半导体存储器、非易失性半导体存储器等的存储设备。它存储操作系统(OS)、应用程序和各种类型的数据(例如,用户数据),并且用作由处理器102执行的数据处理的工作区域。处理器102是诸如中央处理单元(CPU)和图形处理单元(GPU)的处理设备。通信IF 103是经由通信网络19与服务器设备12执行各种类型的无线数据通信的接口。
[0092]触摸显示器104包括显示器1041和触摸屏1042。显示器1041是诸如液晶显示器的显示设备,并且显示字符、图形、照片等。例如,触摸屏1042为电容式触摸屏。它是输入装置,当手指或相似的指点器触摸或者变得与输入装置相邻时,其通过指定触摸或相邻的位置来接受用户操作。在以下描述中,为了方便起见,触摸或相邻被简称作“触摸”。
[0093]显示器1041和触摸屏1042被层叠。当用户利用指点器触摸显示在显示器1041上的图像时,指点器实际触摸触摸屏1042,并且指定触摸的位置。依照OS和应用程序,处理器102基于触摸屏1042所指定的位置来指定用户利用指点器触摸所意图的操作的内容。
[0094]麦克风105是拾取声音并且生成声音数据的声音拾取设备。在语音代理系统I中,麦克风105拾取用户的语音并且生成语音数据。时钟106是连续测量自参考时间起逝去的时间段并生成指示当前时间的时间数据的设备。GPS单元107是从多个卫星接收信号,基于所接收的信号来指定终端设备11的当前位置(也就是说,用户的当前位置),并且生成指示所指定的位置的位置数据的设备。
[0095]在包括上述硬件组件的终端设备11中,处理器102执行符合存储在存储器101中的程序的处理。结果,终端设备11充当包括图3所示的功能组件的设备。
[0096]终端设备11包括属性获取单元111、发送单元112、语句获取单元113、显示控制单元114、语音数据获取单元115、处理标识数据获取单元116和处理执行单元117作为功能组件。
[0097]属性获取单元111获取表示终端设备11的用户的属性或者用户周围的环境的属性的属性数据。作为示例,在本实施方式中,表示用户的性别、年龄和当前位置以及当前时间的数据用作属性数据。用户的性别和年龄是用户的属性的示例,而用户的当前位置和当前时间是用户周围的环境的属性的示例。表示用户的性别和年龄的数据利用例如触摸屏1042通过用户操作被输入至终端设备11,属性获取单元111获取用户由此输入的数据。另一方面,属性获取单元111获取例如由GPS单元107生成的位置数据作为表示用户的当前位置的数据。在本实施方式中,表示当前时间的数据(时间数据)由服务器设备12生成以用于使用,因此属性获取单元111无需获取时间数据。
[0098]发送单元112向服务器设备12发送由属性获取单元111获取的属性数据。发送单元112还向服务器设备12发送由语音数据获取单元115获取的语音数据。
[0099]提示语句获取单元113通过从服务器设备12接收提示语句数据来获取提示语句数据,提示语句数据表示提示终端设备11的用户发出语音指令的语句。显示指令单元114指示显示器1041显示由语句获取单元113获取的提示语句数据所表示的语句。
[0100]语音数据获取单元115从麦克风105获取语音数据,语音数据表示用户所发出的并且由麦克风105拾取的语音。上述发送单元112向服务器设备12发送由语音数据获取单元115获取的语音数据。处理标识数据获取单元116获取从服务器设备12发送的处理标识数据,处理标识数据是对从发送单元112发送的语音数据的回复。由处理标识数据获取单元116获取的处理标识数据标识与从发送单元112向服务器设备12发送的语音数据所表示的指令相对应的处理。作为示例,在本实施方式中,处理标识数据利用标识功能的功能ID和指定该功能的具体处理的参数的组合来标识处理。
[0101]处理执行单元117执行由处理标识数据获取单元116获取的处理标识数据所标识的处理。
[0102]现在将描述服务器设备12的组件。服务器设备12具有与可经由通信网络19与外部设备执行数据通信的普通计算机相同的硬件组件。图4示出服务器设备12的硬件组件。具体地,服务器设备12包括存储器201、处理器202和通信IF 203作为硬件组件。这些组件经由总线209彼此连接。
[0103]存储器201是包括易失性半导体存储器、非易失性半导体存储器等的存储设备。它存储OS、应用程序以及诸如用户数据的各种类型的数据,并且用作处理器202的数据处理的工作区域。处理器202是诸如CPU和GPU的处理设备。通信IF 203是经由通信网络19与其它设备执行各种类型的数据通信的接口。
[0104]服务器设备12通过执行符合存储在存储器201中的程序的处理来充当包括图5所示的功能组件的设备。服务器设备12包括接收单元121、语音识别单元122、处理标识数据生成单元123、发送单元124、存储控制单元125、定时器单元126和语句获取单元127作为功能组件。
[0105]接收单元121接收从各个终端设备11发送的属性数据。接收单元121还接收从各个终端设备11发送的语音数据。
[0106]语音识别单元122通过已知的语音识别处理来识别由接收单元121接收到的语音数据所表示的指令,并且生成表示所识别的指令的语句的指令语句数据。处理标识数据生成单元123生成处理标识数据,处理标识数据标识与语音识别单元122所生成的指令语句数据对应的处理。
[0107]发送单元124向发送用于生成处理标识数据的语音数据的终端设备11发送由处理标识数据生成单元123生成的处理标识数据。发送单元124还向发送用于获取提示语句数据的属性数据的终端设备11发送由语句获取单元127获取的提示语句数据。
[0108]存储控制单元125使存储器201彼此关联地存储下列项目:由接收单元121从终端设备11中的一个接收到的属性数据、由语音识别单元122利用接收单元121从同一个终端设备11接收到的语音数据生成的指令语句数据、以及表示指令语句数据所表示的指令的发出时间的时间数据(由定时器单元126生成)。
[0109]定时器单元126生成表示当前时间的时间数据。提示语句获取单元127通过利用诸如从各种终端设备11接收到并被存储在存储器201中的属性数据以及与这些属性数据关联地存储在存储器201中的指令语句数据的数据生成提示语句数据,来获取与由接收单元121从终端设备11中的一个接收到的属性数据所表示的属性相对应的提示语句数据。
[0110]现在将描述存储在终端设备11和服务器设备12中的数据的结构。终端设备11的存储器101存储标识终端设备11的终端标识数据以及表示用户的性别和年龄的数据。例如,当终端设备11首次启动根据本实施方式的程序时,从服务器设备12获取到终端标识数据。表示用户的性别和年龄的数据例如由用户利用触摸屏1042输入。
[0111]服务器设备12的存储器201存储属性数据库、同义词数据库、相关性数据库和日志数据库。属性数据库管理终端设备11的用户的属性数据。同义词数据库管理同义词数据,同义词数据表示基本关键字(基础关键字)和与基础关键字同义的关键字(同义关键字)之间的对应关系。相关性数据库管理相关性数据,相关性数据表示各种关键字与各种功能之间的相关性的大小。日志数据库管理与终端设备11的用户所发出的语音指令有关的日志数据。
[0112]图6示出属性数据库的示例性结构。属性数据库是与终端设备11对应的记录的集合,并且具有[终端标识数据]、[性别]、[年龄]和[位置]作为数据字段。以下,[(数据字段名称)]表示由数据字段名称指定的数据字段。在这些字段中,存储有与其字段名称对应的数据。从终端设备11发送给服务器设备12的数据在适当的定时(例如,当终端设备11首次启动根据本实施方式的程序时)被存储到[终端标识数据]、[性别]和[年龄]中。[年龄]根据需要来更新。[位置]在适当的定时(例如,当终端设备11进入等待语音指令的状态(稍后描述)时)基于从终端设备11发送给服务器设备12的位置数据频繁地更新。
[0113]图7示出同义词数据库的示例性结构。同义词数据库是与各种基础关键字相对应的记录的集合,并且具有[基础关键字]和[同义关键字]作为数据字段。以下,[(数据字段名称)]表示由该数据字段名称指定的数据字段。在各个数据字段中,存储有与其数据字段名称对应的数据。注意,与一个基础关键字关联的同义关键字的数量变化。
[0114]图8示出相关性数据库的示例性结构。相关性数据库是与关键字对应的记录的集合,并具有[关键字]、[类型]、[功能ID]、[功能名称]、[参数]和[分数]作为数据字段。
[0115]在[关键字]中,存储有表示关键字(存储在同义词数据库中的基础关键字中的一个)的文本数据。在[类型]中,存储有表示关键字的类型的文本数据。例如,在图8中,“食物名称”被存储在第一记录的[类型]中作为关键字“拉面”的类型。
[0116]标识功能的功能ID被存储在[功能ID]中。表示功能的名称的文本数据被存储在[功能名称]中。以下,各个功能被称作功能“(功能名称)”。
[0117]表示用于功能的参数的类型的文本数据被存储在[参数]中。例如,在图8中,存储在第一记录的[参数]中的“食物名称,当前位置”所表示的数据指示具有类型“食物名称”和当前位置的关键字被用于功能“餐馆搜索”。
[0118]代表表示关键字与功能之间的相关性的大小的数值数据的分数被存储在[分数]中。注意,相关性数据库中的各个记录可将多组数据存储在[功能ID]、[功能名称]、[参数]和[分数]中。
[0119]图9示出日志数据库的示例性结构。日志数据库是与各种终端设备11的用户所发出的语音指令对应的记录的集合,并且具有[终端标识数据]、[时间]、[位置]、[指令语句]和[处理标识数据]作为数据字段。发送表示语音指令的语音数据的终端设备11的终端标识数据被存储在[终端标识数据]中。表示语音指令的发出时间的数据被存储在[时间]中。表示在发出语音指令的时候用户(即,终端设备11)的位置的数据被存储在[位置]中。表示语音数据所指示的指令的语句的指令语句数据被存储在[指令语句]中。标识与语音指令对应的处理的处理标识数据被存储在[处理标识数据]中。
[0120]下面描述由具有上述组件的语音代理系统I执行的任务。图1OA至图1OC和图1lA至图1lD示例性地示出在语音代理系统I中当用户发出语音指令时显示在终端设备11的显示器1041上的画面。图1OA至图1OC示出当自终端设备11开始等待用户的语音指令起过去了预定时间段(例如,10秒)之前用户发出语音指令时显示在显示器1041上的画面的转变。另一方面,图1lA至图1lD示出当自终端设备11开始等待用户的语音指令起过去了预定时间段用户未发出语音指令时显示在显示器1041上的画面的转变。
[0121]图1OA示出在等待用户的语音指令的同时显示在显示器1041上的对话画面。在等待状态期间,对话画面显示例如语句“有什么需要帮助么?”作为提示用户发出语音指令的规定提示语句。如果如图1OB所示在该对话画面显示在显示器1041上期间用户发出语音指令,则终端设备11执行与语音指令相对应的处理,并且如图1OC所示在显示器1041上显示与语音指令相对应的画面(处理执行画面)。
[0122]类似于图10A,图1lA示出等待状态的对话画面。如果自等待状态的对话画面开始显示起过去了预定时间段(例如,10秒)而用户未发出语音指令,则如图1lB所示,在显示器1041上显示提示用户发出语音指令的新提示语句。该提示语句根据终端设备11的用户的性别和年龄(用户的属性)以及用户的当前位置和当前时间(用户周围的环境的属性)来生成。因此,有很高的概率此提示语句与用户希望发出的语音指令的内容有共同点。如果如图1lC所示用户发出语音指令,则终端设备11执行与语音指令对应的处理,并且如图1lD所示,在显示器1041上显示与语音指令对应的处理执行画面。
[0123]图12示出用户发出语音指令时由语音代理系统I执行的一系列处理。下面参照图
12描述由语音代理系统I执行的处理。
[0124]首先,当用户在终端设备11上执行预定操作时,终端设备11的显示控制单元114使显示器1041显示等待状态的对话画面(图1OA或图11A)(步骤S101)。随着等待状态的开始,终端设备11的属性获取单元111从GPS单元107获取表示终端设备11的当前位置(S卩,用户的当前位置)的位置数据。发送单元112将属性获取单元111所获取的位置数据与存储在存储器101中的终端标识数据一起发送给服务器设备12(步骤S102)。
[0125]在对话画面被显示在显示器1041上期间维持终端设备11与服务器设备12之间建立的通信连接。在建立通信连接时,一旦服务器设备12识别出终端设备11,它可随后经由通信连接一直识别终端设备11,直至通信连接被解除。因此,在步骤S102中终端设备11向服务器设备12发送终端标识数据之后,在下面描述的处理中,无需再次向服务器设备12发送终端标识数据。
[0126]服务器设备12的接收单元121接收从终端设备11发送的终端标识数据和位置数据(步骤S103)。存储控制单元125从存储器201读出属性数据库(图6),并且将接收单元121所接收的位置数据存储(通过覆写)在把由接收单元121在步骤S103中接收到的终端标识数据存储在[终端标识数据]中的记录的[位置]中。存储控制单元125使存储器201存储如此更新的属性数据库(步骤S104)。
[0127]在步骤S104之后,继续执行步骤S105至S108的处理。由于这些处理中所使用的数据的一部分是在下面描述的步骤Slll至S121的处理中生成的,所以现在将首先描述步骤Sm 至 Sm。
[0128]随着等待状态开始,与步骤S102的处理并行地,终端设备11的语音数据获取单元115等待从麦克风105输出表示用户的语音的语音数据。如果用户发出语音指令(步骤Slll为“是”),则麦克风105输出语音数据,并且语音数据获取单元115获取语音数据(步骤
5112)。发送单元112向服务器设备12发送由语音数据获取单元115获取的语音数据(步骤
5113)0
[0129]当服务器设备12的接收单元121接收到从终端设备11发送的语音数据时(步骤
5114),语音识别单元122识别由语音数据表示的语音的内容,并且生成表示所识别的内容的语句的口头语句数据(表示同义词转换之前的指令语句的指令语句数据)(步骤S115)。例如,如图1OB中示例性地示出的,如果用户发出语音指令“告诉我新宿站的位置”,则语音识别单元122生成表示语句“告诉我新宿站的位置”的口头语句数据。
[0130]随后,处理标识数据生成单元123依照存储在同义词数据库(图7)中的同义词数据,将包含在由语音识别单元122生成的口头语句数据所表示的语句中的关键字(同义关键字)转换为基础关键字,并且生成表示转换后的语句(指令语句)的指令语句数据(步骤S116)。例如,假设在步骤S115中生成表示语句“告诉我新宿站的位置”的口头语句数据。在这种情况下,同义关键字“告诉我……的位置”被转换为基础关键字“请告诉我……的位置”,并且在步骤S116中生成表示语句“请告诉我新宿站的位置”的指令语句数据。
[0131]随后,处理标识数据生成单元123指定与在步骤S116中生成的指令语句数据所表示的指令语句相对应的处理,并且生成标识所指定的处理的处理标识数据(步骤S117)。具体地,处理标识数据生成单元123首先提取包含在指令语句数据所表示的指令语句中的关键字。随后,对于所提取的各个关键字,处理标识数据生成单元123从相关性数据库(图8)提取在[关键字]中存储有所述关键字的记录。随后,对于存储在所提取的一个或更多个记录的[功能ID]中的各个功能ID,处理标识数据生成单元123获得存储在[分数]中的分数的总和。
[0132]例如,假设在步骤S116中生成表示语句“请告诉我新宿站的位置”的指令语句数据。在这种情况下,处理标识数据生成单元123提取“请告诉我……的位置”和“新宿站”作为关键字。随后,处理标识数据生成单元123从相关性数据库提取在[关键字]中存储有“新宿站”的记录(图8中的第四记录)以及在[关键字]中存储有“请告诉我……的位置”的记录(图8中的第五记录)。然后,对于所提取的这些记录的[功能ID]中存储的“F0356”、“F2527”等中的每一个,处理标识数据生成单元123获得存储在[分数]中的数值的总和。结果,例如,与指令语句对应的功能的分数被指定如下:由功能ID“F0356”标识的功能“换乘导航”的分数为“14”,由功能ID “F2527”标识的功能“地图显示”的分数为“18”。
[0133]处理标识数据生成单元123指定按照上述方式指定最高分数的功能作为与指令语句对应的功能。随后,处理标识数据生成单元123从提取自指令语句数据的关键字当中提取具有存储在与所指定的功能关联的相关性数据的[参数]中的数据所表示的类型的关键字。然后,处理标识数据生成单元123生成处理标识数据,该处理标识数据包括标识按照上述方式指定的功能的功能ID并且包括所提取的关键字(如果有的话)作为参数。例如,处理标识数据生成单元123生成包括功能“地图显示”的功能ID“F2537”和参数“新宿站”的处理标识数据作为与指令语句“请告诉我新宿站的位置”关联的处理标识数据。
[0134]发送单元124向发送语音数据的终端设备11发送由处理标识数据生成单元123生成的处理标识数据,作为对由接收单元121在步骤S114中接收到的语音数据的回复(步骤S118)。终端设备11的处理标识数据获取单元116接收从服务器设备12发送的处理标识数据(步骤SI 19)。处理执行单元117执行由处理标识数据获取单元116接收到的处理标识数据标识的处理(步骤S120)。结果,图1OC中示例性地示出的处理执行画面显示在显示器1041上。
[0135]另一方面,与步骤S118的处理并行地,服务器设备12的存储控制单元125更新日志数据库(图9)(步骤S121)。具体地,存储控制单元125从存储器101读出日志数据库,并且增加新的记录。随后,存储控制单元125将在步骤S103中接收到的终端标识数据和位置数据、在步骤S116中生成的指令语句数据以及在步骤S117中生成的处理标识数据分别存储在增加的记录的[终端标识数据]、[位置]、[指令语句]和[处理标识数据]中。存储控制单元125还从定时器单元126获取表示此时的当前时间的时间数据,并且将该时间数据存储在[时间]中。存储控制单元125使存储器201存储如此更新的日志数据库。
[0136]在这种情况下,确切地说,由存储在[时间]中的时间数据表示的时间比语音指令的发出时间晚了执行步骤S112至S117所需的时间段。然而,由于之间的差异几乎可忽略,所以此时间数据被用作表示语音指令的发出时间的数据。类似地,确切地说,由存储在[位置]中的位置数据指示的位置可不同于在发出语音指令的时候用户的位置。然而,由于之间的差异也几乎可忽略,所以此位置数据被用作表示在发出语音指令的时候用户的位置的数据。为了将表示更准确的时间和位置的数据存储在日志数据库中,例如,终端设备11可包括定时器单元并且向服务器设备12发送表示步骤S112中语音数据的获取时间的时间数据以及在步骤S112中获取语音数据的时候由GPS单元107生成的位置数据,并且服务器设备12可将这些数据存储在日志数据库中。
[0137]每当各种终端设备11中的任一个的用户发出语音指令时,执行步骤S121的处理。结果,日志数据库(图9)存储与各种终端设备11上发出的语音指令有关的许多日志数据。存储在日志数据库中的日志数据被用于生成下面所述的提示语句数据。
[0138]现在描述步骤S104之后的步骤S105至S108的处理。在步骤S104中存储控制单元125更新了属性数据库(图6)之后,语句获取单元127从日志数据库(图9)提取与由属性与终端设备11的用户的属性相似的用户过去发出的语音指令有关的日志数据(步骤S105)。
[0139]具体地,语句获取单元127使用[终端标识数据]作为键(key)将日志数据库(图9)与属性数据库(图6)组合,并且从与属性数据库组合的日志数据库提取具有下列特征的记录:存储在[性别]中的数据表示与在步骤S104中更新的属性数据相同的性别、由存储在[年龄]中的数据表示的年龄与更新的属性数据中的年龄的差异为预定阈值或更小(例如,年龄大或小五岁或更小)、由存储在[位置]中的数据表示的位置与更新的属性数据中的位置相距预定阈值或更小(例如,Ikm或更小)、由存储在[时间]中的数据表示的时间与更新的属性数据中的时间的差异为预定阈值或更小(例如,早或晚一个小时或更短)(不考虑日期)。
[0140]随后,语句获取单元127利用在步骤S105中提取的记录来生成提示语句数据(步骤S106)。具体地,首先,语句获取单元127将记录分组,使得一个组中的记录在[处理标识数据]中存储相同的数据。然后,语句获取单元127对各个组中所包括的记录的数量进行计数。另外,对于各个组,语句获取单元127将包括在组中的记录的[指令语句]中所存储的整个数据当中数最大的数据指定为该组的代表性指令语句数据。结果,语句获取单元127生成图13中示例性地示出的数据表(以下称作“指令语句列表”)。指令语句列表具有[处理标识数据]、[指令语句]和[数量]作为数据字段。[指令语句]存储表示用于发出用于由存储在[处理标识数据]中的数据标识的处理的指令的代表性指令语句。[数量]存储表示已针对存储在[处理标识数据]中的数据所标识的处理发出指令的次数的数据。
[0141]提示语句获取单元127按照存储在[数量]中的数据所指示的数量的降序从指令语句列表选择预定数量的(例如,10个)记录,并且利用存储在所选择的记录的[指令语句]中的指令语句数据生成例如表示语句“最近经常查询‘XXX’”的提示语句数据(“XXX”表示各个指令语句数据所表示的指令语句)。注意,由语句获取单元127生成的提示语句数据所表示的语句的格式不限于上述示例。例如,指令语句数据本身可被生成为提示语句数据。另选地,表示通过检索指令语句数据所表示的语句的一部分并且将所提取的部分嵌入模型语句中而生成的语句的数据可被生成为提示语句数据。
[0142]发送单元124将语句获取单元127所生成的提示语句数据作为对由接收单元121在步骤S103中接收到的终端标识数据和位置数据的回复发送给发送这些数据的终端设备11(步骤S107)。终端设备11的提示语句获取单元113接收从服务器设备12发送的提示语句数据(步骤S108)。
[0143]因此,终端设备11从服务器设备12获取与用户的属性和用户周围环境的属性对应的预定数量的(例如,10)提示语句数据。在这种状态下,如果自终端设备11进入等待语音指令的状态起过去了预定时间段(例如,10秒)而没有发出语音指令(步骤S131为“是”),则显示控制单元114例如从在步骤S108中接收到的所述预定数量的提示语句数据当中随机地选择一条提示语句数据,并且使得显示器1041显示呈现所选择的那条提示语句数据所表示的语句的对话画面(步骤S132)。结果,在显示器1041上显示了图1lB中示例性地示出的对话画面。
[0144]随后,如果用户发出语音指令(步骤Slll为“是”),则重复步骤S112至S121的处理,并且图1lD中示例性地示出的处理执行画面显示在显示器1041上。另一方面,如果自用户发出语音指令起或者自显示在显示器1041上的提示语句改变起过去了预定时间段而没有发出语音指令(步骤S131为“是”),则重复步骤S132的处理,并且在显示器1041上显示呈现新的提示语句的对话画面。
[0145]如上所述,当用户意图发出语音指令,但是没有马上想起语音指令的内容时,语音代理系统I向用户呈现与用户的属性和用户周围环境的属性对应的提示语句。这使得用户能够容易地发出语音指令。
[0146][变型例]
[0147]上述语音代理系统I是本发明的实施方式,并且可以在本发明的技术构思的范围内按照各种方式来修改。现在将描述这些变型例。下面,将主要聚焦于变型例与实施方式之间的不同来描述变型例,与实施方式相似的组件和任务的描述将被适当地省略。另外,在根据以下变型例的语音代理系统的组件当中,与根据实施方式的语音代理系统I的组件相同或对应的组件被给予与之相同的标号。需要注意,两个或更多个实施方式与以下变型例可适当地组合。
[0148](I)为了生成提示语句数据,语句获取单元127可基于分别存储在日志数据的[时间]和[指令语句]中的时间数据和指令语句数据,从存储在日志数据库(图9)中的整个指令语句数据当中指定表示在例如当前时间与过去的时间点之间的预定时间段内随着时间过去而使用频度增加的指令的指令语句数据。然后,语句获取单元127可利用所指定的指令语句数据生成提示语句数据。
[0149]此变型例有很高的概率向用户呈现表示许多用户最近频繁使用的示例语音指令的提示语句。因此,此变型例对于想要获得此时吸引许多其他用户的注意力的热点话题信息的用户而言是可取的。
[0150](2)提示语句获取单元127可生成提示语句数据,该提示语句数据要发送给例如终端设备Il-X以使得所生成的提示语句数据提示对于终端设备Il-X的终端标识数据关联地存储在日志数据库(图9)中的特定指令语句数据所表示的指令而言没有预定相似性的指令。
[0151]在此变型例的具体示例中,语句获取单元127提取与终端设备11 - X的终端标识数据关联地存储在日志数据库中的处理标识数据,并且利用在[处理标识数据]中存储有包括所提取的处理标识数据中所包括的功能ID的处理标识数据的日志数据以外的日志数据来生成提示语句数据。在这种情况下,向终端设备Il-X的用户呈现提示语句,该提示语句提示执行使用与他/她在过去通过语音指令所使用的任何功能不同的功能的处理的语音指令。因此,给予用户使用他/她过去从来没有使用过的功能的机会。
[0152]在此变型例的另一具体示例中,语句获取单元127从存储在日志数据库中的整个日志数据中排除在[终端标识数据]中存储有终端设备Il-X的终端标识数据的日志数据,并且仅利用与不同于终端设备Il-X的终端设备11有关的日志数据来生成提示语句数据。当存储在日志数据库中的日志数据的条数较少时,生成要发送给终端设备I1-X的提示语句数据有很高的概率使用与过去在终端设备Il-X上发出的语音指令有关的日志数据中所包括的指令语句数据。这种不便不会发生于前述具体示例中。
[0153]用户知道他/她在过去发出过的语音指令,发出相似的语音指令通常没有困难。因此,鉴于本发明的目的,向用户呈现提示与他/她在过去发出过的语音指令相同或相似的语音指令的提示语句是不可取的。本变型例降低了这种不便的发生概率。
[0154](3)当在图12的步骤S132中提示语句显示在显示器1041上期间用户发出语音指令时,例如,提示语句标识数据可与语音数据一起被发送给服务器设备12,该提示语句标识数据标识表示在发出语音指令的时候所显示的提示语句的提示语句数据。在服务器设备12中,处理标识数据生成单元123可生成处理标识数据,该处理标识数据标识与指令语句数据所表示的指令(语音数据所表示的指令)和由提示语句标识数据标识的提示语句数据所表示的语句的组合对应的处理。
[0155]图14A至图14C示例性地示出在本变型例中显示在显示器1041上的画面。图14A中示例性地示出的画面显示以下提示语句最近经常查询‘秋叶原剧场是什么?图12的步骤S132)。如果如图14B所示,用户响应于此提示语句说出例如“我也对这感兴趣”,则发送单元112向服务器设备12发送表示用户的语音指令“我也对这感兴趣”的语音数据以及表示提示语句“最近经常查询‘秋叶原剧场是什么?’”的提示语句数据(图12的步骤S113)。
[0156]在服务器设备12中,处理标识数据生成单元123将包括在指令语句“我也对这感兴趣”中的“这”指定为包括在提示语句“最近经常查询‘秋叶原剧场是什么? ’”中的“秋叶原剧场”。然后,它生成语句“我也对秋叶原剧场感兴趣”以及与此语句对应的处理标识数据(图12的步骤S117)。另选地,处理标识数据生成单元123可通过简单地提取包含在指令语句“我也对这感兴趣”和提示语句的引号(‘’)内的部分(‘秋叶原剧场是什么?’部分)中的关键字来指定与语音指令对应的处理。在终端设备11中,处理执行单元117执行如此生成的处理标识数据所标识的处理。结果,如图14C所示,在显示器1041上显示与语音指令对应的处理执行画面。
[0157]在上述示例中,从终端设备11向服务器设备12发送提示语句数据。在本变型例中,从终端设备11发送给服务器设备12的数据是标识提示语句的数据(提示语句标识数据)就足够了,提示语句数据是这种数据的示例。因此,例如,服务器设备12可向终端设备11发送附有提示语句标识数据的各个提示语句数据(图12的步骤S107),代替提示语句数据,终端设备11可向服务器设备12发送附于提示语句数据的提示语句标识数据。
[0158]在本变型例中,当用户想要发出与提示语句所表示的示例语音指令相同或相似的语音指令时,用户无需读出示例语音指令,而是可按照更自然讲话的形式向终端设备11发出语音指令。
[0159](4)在实施方式中,用户的性别和年龄用作用于生成提示语句数据的用户属性。另夕卜,用户的当前位置和当前时间用作用于生成提示语句数据的用户周围环境的属性。在本发明中,用于生成提示语句数据的用户的属性和用户周围环境的属性不限于上面刚提及的那些,可使用各种类型的其它属性。
[0160]例如,除了性别和年龄以外或者代替性别和年龄,用户的兴趣爱好和职业、在过去发出过语音指令的次数(表示发出语音指令的技能)、在过去发出语音指令的频度等可构成用于生成提示语句数据的用户的属性。
[0161]另外,除了当前位置和当前时间以外或者代替当前位置和当前时间,例如,用户所在区域的当前天气和气温、表示用户是在家、办公室还是另一地点的信息、表示今天是不是周末或放假的信息等可构成用于生成提示语句数据的用户周围环境的属性。
[0162](5)用户在过去(例如,最近)发出过的语音指令用作表示用户的兴趣爱好或要求的属性。因此,用户在过去发出过的语音指令可构成用于生成提示语句数据的用户的属性。在此变型例中,服务器设备12的存储器201存储处理间相关性数据库和模型语句数据库。处理间相关性数据库针对可由终端设备11执行的多个处理项目当中的各个任意处理对,管理表示处理对之间的相关性的大小的处理间相关性数据。模型语句数据库管理表示与各个处理项目对应的提示语句的模型的模型语句数据。
[0163]图15示出处理间相关性数据库的示例性结构。在变型例中,作为示例,将假设逐功能地指定处理间相关性。因此,处理间相关性数据库是与可由终端设备11执行的多个处理项目一对一关联的记录的集合,并且具有[第一功能]和[第二功能]作为数据字段。[第一功能]具有[功能ID]和[功能名称]作为子字段,其中分别存储有第一功能的功能ID和功能名称。对于多个第二功能(与第一功能具有相关性的所有其它功能)中的每一个,[第二功能]具有[功能ID]、[功能名称]和[分数]作为子字段,其中分别存储有第二功能的功能ID、第二功能的功能名称以及代表表示第一处理与第二处理之间的相关性的大小的数值的分数。
[0? 64]例如,图15的第一行中示例性地示出的数据表示:表示由功能ID “F1025”标识的功能“餐馆搜索”和由功能ID“F0356”标识的功能“换乘导航”之间的相关性的大小的分数为“10”。
[0165]图16示出模型语句数据库的示例性结构。模型语句数据库是与可由终端设备11执行的多个处理项目一对一关联的记录的集合,并且具有以下数据字段:存储有功能ID的[功能ID]、存储有功能名称的[功能名称]以及存储有表不提不功能的提不语句的t旲型的t旲型语句数据的[模型语句]。
[0166]例如,图16的第一行中示例性地示出的数据表示:与功能ID“F0356”所标识的功能“换乘导航”关联的模型语句是“想要坐火车去(地点)”。这里,“(地点)”表示具有包括“地点”(参见图8)的类型的关键字被插入其中。
[0167]图17示出根据本变型例的终端设备31的功能组件。终端设备31获取语音数据作为属性数据。因此,终端设备31包括作为单个组件的属性获取单元111和语音数据获取单元115,而不进行区分。
[0168]图18示出根据本变型例的服务器设备32的功能组件。服务器设备32包括从例如存储器201读出处理间相关性数据库(图15)并且获取处理间相关性数据的相关性数据获取单元 321 ο
[0169]依照处理间相关性数据,服务器设备32的语句获取单元127基于例如与最近由处理标识数据生成单元123生成的处理标识数据所标识的处理项目的相关性的大小,从可由终端设备31执行的多个处理项目当中选择一个处理项目,并且针对所选择的处理项目生成提示指令的提示语句数据。
[0170]图19示出在本变型例中由语音代理系统I执行的一系列处理。需要注意,在图19中,与图12的步骤相同或对应的步骤被给予与之相同的标号。
[0171]在本变型例中,首先,终端设备31的用户在对话画面开始显示之后发出语音指令(步骤S101)。然后,终端设备31和服务器设备32执行与语音指令对应的一系列处理(步骤S112至S120),并且终端设备31执行与语音指令对应的处理。
[0172]需要注意,在本变型例中,在生成标识与语音指令对应的处理的处理标识数据(步骤S117)之后,服务器设备32生成提示语句数据(步骤S301),并且将处理标识数据与在步骤S301中生成的提示语句数据一起发送(步骤S118)。终端设备31接收响应于语音数据的发送(步骤S113)而与处理标识数据一起从服务器设备32发送的提示语句数据(步骤S119)。在步骤S119中接收到的提示语句数据稍后用于显示提示语句(步骤S132)。
[0173]下面描述在步骤S301中服务器设备32生成提示语句数据的示例性过程。首先,相关性数据获取单元321在处理间相关性数据库(图15)中搜索在[第一功能]的[功能ID]中存储有由处理标识数据生成单元123在步骤SI 17中生成的处理标识数据中所包括的功能ID的记录,并且将此记录传递给语句获取单元127。
[0174]提示语句获取单元127从接收自相关性数据获取单元321的记录的[第二功能]中所包括的数据当中选择与表示最大数值的[分数]关联的[功能ID]中所存储的功能ID,作为标识与对应于用户最近所发出的语音指令的功能具有最大相关性的功能的功能ID。随后,语句获取单元127在模型语句数据库(图16)中搜索与所选择的功能ID对应的记录,并且获取存储在搜索到的记录的[模型语句]中的模型语句数据。
[0175]随后,如果由处理标识数据生成单元123在步骤S117中生成的处理标识数据中所包含的关键字包括类型与模型语句数据所表示的“(地点)”等匹配的关键字,则语句获取单元127用该关键字取代“(地点)”等中的字符串。表示替换后的语句的数据用作提示语句数据。在步骤S301中服务器设备32生成提示语句数据的示例性过程的描述这样结束。
[0176]图20A至图20E示例性地示出在本变型例中显示在终端设备31的显示器1041上的画面的转变。在对话画面上,首先,用户发出语音指令(图20A),并且终端设备31执行与语音指令对应的处理(图20B)。随后,如果用户有一段时间没有向终端设备31发出语音指令,则显示器1041显示提示语音指令的提示语句(图20C)。此提示语句提示针对与对应于用户最近发出过的语音指令的处理具有高相关性的处理的指令。如果用户根据提示语句的提示发出新的语音指令(图20D),则终端设备31与该新的语音指令对应的处理(图20E)。
[0177](6)在实施方式中,没有关于用于生成提示语句数据的日志数据所指示的语音指令的发出时间的新/旧状态的特别限制,存储在日志数据库中的整个日志数据是步骤S105(图12)中的提取目标。另选地,在存储在日志数据库中的整个日志数据当中,例如,仅与当前时间与过去的时间点之间的预定时间段(例如,一年)内发出过的语音指令有关的日志数据可用于生成提示语句数据。
[0178](7)在生成提示语句数据时,语句获取单元127可从存储在日志数据库中的整个日志数据排除在[处理标识数据]中存储有包括特定功能ID的处理标识数据的日志数据,并且仅使用不包括该特定功能ID的日志数据。
[0179]当发出用于执行使用特定类型的功能(例如,日程管理)的处理的指令时,用户可大量使用他/她自己所特定的词语(例如,他/她的熟人的姓名)。因此,包括在与该类型的功能有关的指令语句数据中的信息对其他用户而言可能无用,或者从个人信息的保护角度可能不可取。通过本变型例,可避免这种不便。
[0180](8)在实施方式中,为了生成提示语句数据(图12的步骤S106),语句获取单元127基于属性数据中的相似性将从日志数据库提取的日志数据所指示的指令语句数据分组,使得一个组中的每一个指令语句数据都与同一的处理标识数据关联。然后,对包括在各个组中的日志数据的条数进行计数,包括最大数量的日志数据的组中的指令语句数据(代表指令语句数据)用于生成提示语句数据。这是语句获取单元127用来选择用于生成提示语句数据的指令语句数据的方法的具体示例,并且可被各种类型的其它方法代替。
[0181]可基于其它标准来进行分组。例如,代替将与相同处理标识数据关联的指令语句数据归类到一个组中,表示包含相同关键字的指令语句的指令语句数据可被归类到一个组中。另外,在选择用于生成提示语句数据的指令语句数据组时,按照日志数据的条数的降序选择预定数量的组的方法可被例如以下方法代替:按照日志数据的条数的降序排除预定数量的组(例如,第一组至第五组),并且按照日志数据的条数的降序从剩余组(例如,第六组和随后的组)进行选择。这防止了仅许多用户频繁发出的语音指令(例如,“现在天气如何?”)作为提示语句被重复地呈现给用户的不便情况。此外,在过去的预定时间段内由语句获取单元127用来生成提示语句数据的指令语句数据可不用于生成新的提示语句数据(要被发送给同一终端设备11)。这防止了相同或相似的提示语句被重复地呈现给同一用户的不便情况。
[0182](9)在实施方式中,服务器设备12的语句获取单元127通过使用从日志数据库提取的日志数据中所包括的指令语句数据生成提示语句数据来获取提示语句数据。提示语句获取单元127可不生成提示语句数据,并且可通过从例如存储器201读出提示语句数据或者从外部设备接收提示语句数据来获取提示语句数据。例如,语句获取单元127可基于属性数据的相似性来检索从日志数据库提取的日志数据中所包括的指令语句数据,并且原样获取检索到的指令语句数据作为提示语句数据。
[0183](10)在实施方式中,服务器设备12执行语音识别处理(图12的步骤S115)以及指定与语音指令对应的处理的处理(图12的步骤S116和S117)。这些处理中的一个或二者可由终立而设备11执灯。
[0184](11)在实施方式中,分别被示例性地描述为显示器1041、触摸屏1042和麦克风105的显示设备、输入装置和声音拾取设备全部被内置于终端设备11中。然而,它们中的至少一个可被配置为不同于终端设备11的外部设备。另外,在实施方式中,终端设备11所使用的各种类型的数据被存储在内置于终端设备11中的存储器101中。然而,这些数据的全部或一部分可被存储在外部存储设备中。类似地,代替存储器201,服务器设备12所使用的各种类型的数据的全部或一部分可被存储在外部存储设备中。
[0185](12)在实施方式中,终端设备11在进入等待语音指令的状态时向服务器设备12发送终端标识数据和位置数据(图12的步骤S102和S103),这些数据的发送触发了生成和发送提示语句数据的处理(图12的步骤S104至S108)。这些处理不限于在终端设备11进入等待语音指令的状态的时刻执行。例如,每当预定时间段过去时,或者在检测到终端设备11移动了预定距离或更长距离的时刻,终端设备11可向服务器设备12发送位置数据。另外,当终端设备11需要显示提示语句(图12的步骤S131为“是”)时,终端设备11可向服务器设备12发送对提示语句数据的请求,并且可以响应于该请求来执行生成和发送提示语句数据的处理(图12的步骤S104至S108)。
[0186](13)在实施方式或变型例中,在跟随在终端设备11从服务器设备12接收到提示语句数据之后(跟随在图12的步骤S108或图19的步骤S119之后)并且在用户响应于提示语句的显示而发出语音指令(图12的步骤S132或者图19的步骤S132)之前的时间段内,终端设备11可执行提示语句提示的处理的至少一部分作为后台处理。
[0187]在实施方式的变型中,在图12所示的一系列处理中,服务器设备12在步骤S106中基于例如在步骤S105中从日志数据库(图9)提取的日志数据的[处理标识数据]中所存储的数据来指定提示语句数据以及标识与提示语句数据对应的处理的处理标识数据。然后,在步骤S107中,服务器设备12向终端设备11发送提示语句数据以及所指定的处理标识数据。当在步骤S108中终端设备11接收到提示语句数据以及处理标识数据时,终端设备11在后台执行由所接收的处理标识数据所标识的处理,而不等待用户的语音指令。
[0188]在变型例(5)的变型中,在图19所示的一系列处理中,服务器设备12在步骤S118中发送提示语句数据以及处理标识数据,终端设备11在步骤S119中接收提示语句数据以及处理标识数据。因此,在步骤S119的处理之后,终端设备11在后台执行由所接收的处理标识数据所标识的处理,而不等待用户的语音指令。
[0189]随后,如果响应于提示语句,用户如提示语句所提示地发出语音指令,则终端设备11显示已在后台执行的处理的结果。
[0190]在此变型例中,符合提示语句所提示的语音指令的处理在发出语音指令之前已经执行。因此,当用户如提示语句所提示的发出语音指令时,更快速地向用户呈现处理的结果O
[0191]需要注意,用户未必就发出提示语句所提示的语音指令。例如,在图1lA至图1lD的示例中,响应于表示示例性语句“告诉我附近的好披萨餐馆”的提示语句,用户发出语音指令“那么告诉我附近的好咖喱餐馆”。在这种情况下,对应于提示语句的处理与对应于语音指令的处理具有不同的参数和相同的功能。因此,在这种情况下同样,如果在发出语音指令之前在后台激活此功能(在图1lA至图1lD的示例中,功能“餐馆搜索”),则处理的结果可被马上显示。
[0192]在变型例的另一变型中,当用户响应于提示语句发出语音指令时,终端设备11可显示符合语音指令的处理结果,而无需访问服务器设备12。在这种情况下,为了识别用户如提示语句所提示而发出的语音指令,终端设备11包括与包括在服务器设备12中的语音识别单元122和处理标识数据生成单元123相似的组件。当用户如提示语句所提示的发出语音指令时,终端设备11识别语音数据所表示的语音并且生成指令语句数据以及处理标识数据(与图12或图19的步骤S115至S117的处理相似的处理),而无需向服务器设备12发送语音数据。如果由如此生成的处理标识数据标识的处理(与语音数据对应的处理)与在后台执行的处理匹配,则终端设备11马上显示已经执行的处理的结果。
[0193]在此变型例中,即使当用户如提示语句所提示的发出语音指令时终端设备11无法与服务器设备12通信,终端设备11也向用户呈现符合语音指令的处理的结果。
[0194](14)终端设备11可包括扬声器,可经由扬声器来读出提示语句。在这种情况下,作为功能组件,终端设备11包括:语音数据生成单元,其生成语音数据,该语音数据表示通过读出提示语句数据所表示的语句而形成的语音;以及语音数据输出单元,其将语音数据输出给扬声器。语音数据输出单元与显示控制单元114发出用于显示提示语句的指令同时将语音数据输出给扬声器。结果,提示语句不仅被显示,而且以语音的形式被呈现给用户。
[0195](15)在实施方式中,终端设备11和服务器设备12通过使普通计算机执行符合根据本发明的程序的处理来实现。另选地,终端设备11和服务器设备12中的一方或二者可被配置为所谓的专用设备。
[0196]本发明将被理解为系统(其示例是语音代理系统)、构成该的终端设备和服务器设备、由这些设备执行的处理的方法、使得计算机充当这些设备的程序以及记录有该程序的计算机可读非暂时性记录介质。需要注意,根据本发明的程序可经由记录介质或者经由诸如互联网的网络提供给计算机。
【主权项】
1.一种终端设备,该终端设备包括: 属性获取单元,该属性获取单元获取表示用户的属性或者所述用户周围的环境的属性的属性数据; 语句获取单元,该语句获取单元获取提示语句数据,所述提示语句数据表示提示所述用户发出语音指令的语句,并且所述提示语句数据与所述属性数据表示的所述属性对应;显示控制单元,该显示控制单元使显示设备显示由所述提示语句数据表示的语句; 语音数据获取单元,该语音数据获取单元获取语音数据,所述语音数据表示所述用户响应于所述显示设备显示由所述提示语句数据表示的语句而发出的语音; 处理标识数据获取单元,该处理标识数据获取单元获取处理标识数据,所述处理标识数据标识与所述语音数据表示的指令对应的处理;以及 处理执行单元,该处理执行单元执行由所述处理标识数据标识的处理。2.根据权利要求1所述的终端设备,该终端设备还包括: 发送单元,该发送单元向服务器设备发送所述属性数据和所述语音数据,其中所述语句获取单元接收作为对所述发送单元发送所述属性数据的回复而从所述服务器设备发送的所述提示语句数据,并且 所述处理标识数据获取单元接收作为对所述发送单元发送所述语音数据的回复而从所述服务器设备发送的所述处理标识数据。3.根据权利要求2所述的终端设备,其中 所述发送单元向所述服务器设备发送提示语句标识数据,所述提示语句标识数据标识表示当所述语音数据获取单元获取了所述语音数据时由所述显示设备显示的语句的所述提示语句数据,并且 所述处理标识数据获取单元接收作为对所述语音数据和所述提示语句标识数据的发送的回复而从所述服务器设备发送的所述处理标识数据,所述处理标识数据标识与所述语音数据所表示的指令和所述提示语句标识数据所标识的语句的组合对应的处理。4.根据权利要求1至3中任一项所述的终端设备,其中 所述属性获取单元获取表示所述用户发出的语音的所述语音数据作为所述属性数据。5.一种服务器设备,该服务器设备包括: 接收单元,该接收单元从终端设备接收属性数据,所述属性数据表示所述终端设备的用户的属性或者所述用户周围的环境的属性; 语句获取单元,该语句获取单元获取提示语句数据,所述提示语句数据表示提示所述用户发出语音指令的语句的,并且所述提示语句数据与所述属性数据表示的所述属性对应; 发送单元,该发送单元向所述终端设备发送所述提示语句数据,其中,在所述发送单元发送所述提示语句数据之后,所述接收单元接收从所述终端设备发送的语音数据; 语音识别单元,该语音识别单元识别所述语音数据所表示的指令;以及处理标识数据生成单元,该处理标识数据生成单元生成标识与所述指令对应的处理的处理标识数据,并且 其中,作为对所述接收单元接收到的所述语音数据的回复,所述发送单元向所述终端设备发送所述处理标识数据。6.根据权利要求5所述的服务器设备,该服务器设备还包括 存储控制单元,其中 所述接收单元从多个终端设备中的每一个接收所述属性数据和所述语音数据, 所述存储控制单元使存储设备将所述接收单元从各个终端设备接收到的所述属性数据与指令语句数据彼此关联地存储,所述指令语句数据表示由所述接收单元从所述终端设备接收到的所述语音数据表示并且被所述语音识别单元识别的指令的语句,并且 所述语句获取单元利用与如下的属性数据关联地存储在所述存储设备中的指令语句数据生成待从所述发送单元向所述多个终端设备中的所述一个终端设备发送的提示语句数据,其中该属性数据与由所述接收单元从所述多个终端设备中的一个终端设备接收到的属性数据具有预定关系。7.根据权利要求6所述的服务器设备,其中 所述存储控制单元使所述存储设备将指令语句数据与时间数据彼此关联地存储,所述时间数据表示所述指令语句数据所表示的指令的发出时间,并且 所述语句获取单元基于存储在所述存储设备中的多条指令语句数据以及与所述多条指令语句数据关联地存储的时间数据来指定表示随着时间过去而使用频度增加的指令的指令语句数据,并且利用所指定的指令语句数据来生成待从所述发送单元发送的提示语句数据。8.根据权利要求6或7所述的服务器设备,其中 所述存储控制单元使所述存储设备将指令语句数据与终端标识数据彼此关联地存储,所述指令语句数据由所述语音识别单元根据语音数据生成,并且所述终端标识数据标识发送所述语音数据的终端设备,并且 所述语句获取单元生成提示如下指令的提示语句数据,作为待从所述发送单元向所述多个终端设备中的一个终端设备发送的提示语句数据,其中该指令与和标识所述多个终端设备中的一个终端设备的终端标识数据关联地存储在所述存储设备中的指令语句数据所表示的指令不具有预定相似性。9.根据权利要求5所述的服务器设备,该服务器设备还包括: 相关性数据获取单元,该相关性数据获取单元获取处理间相关性数据,所述处理间相关性数据表示多个处理项目中包括的两个任意处理项目之间的相关性的大小,其中所述接收单元接收从所述终端设备发送的所述语音数据作为所述属性数据, 所述语音识别单元识别由所述属性数据表示的指令, 所述处理标识数据生成单元生成处理标识数据,所述处理标识数据标识与所述属性数据所表示的指令对应的处理项目,并且 所述语句获取单元基于所述处理间相关性数据所表示的、与对应于所述属性数据所表示的指令的处理项目之间的相关性的大小,从所述多个处理项目当中选择一个处理项目,并且获取表示如下语句的提示语句数据作为与所述属性数据所表示的属性对应的提示语句数据,该语句提示用于所选择的一个处理项目的指令。10.—种使计算机执行下列操作的程序: 获取表示用户的属性或者所述用户周围的环境的属性的属性数据; 获取提示语句数据,所述提示语句数据表示提示所述用户发出语音指令的语句,所述提示语句数据与所述属性数据所表示的属性对应; 在显示设备上显示所述提示语句数据所表示的语句; 获取语音数据,所述语音数据表示由所述用户响应于所述显示设备显示由所述提示语句数据表示的语句而发出的语音; 获取处理标识数据,所述处理标识数据标识与所述语音数据所表示的指令对应的处理;以及 基于所述处理标识数据来标识处理。
【文档编号】G10L15/22GK105874531SQ201480072290
【公开日】2016年8月17日
【申请日】2014年12月24日
【发明人】栗栖俊治, 柘植结旗
【申请人】株式会社Ntt都科摩
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1