应答装置、应答装置的控制方法、及控制程序与流程

文档序号:18516641发布日期:2019-08-24 09:30阅读:234来源:国知局
应答装置、应答装置的控制方法、及控制程序与流程

本发明是关于对于用户的输入句子生成应答句子的应答装置等。



背景技术:

从以往,正在研究开发接受来自用户输入句子的输入句子并且对其生成应答句子的装置、系统。例如,在下述的专利文献1中,公开了从用户发言检测到的名称与存储在非易失性存储器中的各人物的名称之间的相似性来判断由该名称表示的人物,并将与该人物相关的发言作为对用户的答复返回的技术。

现有技术文献

专利文献

专利文献1:日本国公开专利公报“特开2004-334591号公报(2004年11月25日公开)。



技术实现要素:

本发明所要解决的技术问题

但是,上述以往技术中,存在不能生成根据用户意图的应答句子的情况。例如,当用户发言包括其单词语义等不明的未知单词时,上述以往技术不能返回符合该未知单词的内容的答复。此外,一般来说,对于同一个人物可能存在多个不类似的叫法时,但是上述现有技术在这种情况下,不能返回适当的答复。

本发明的一个方面的目的在于,实现可以根据用户意图生成应答句子的应答装置等。

用于解决技术问题的方案

为解决上述的课题,本发明的一种方面所涉及的应答装置是对于输入句子生成应答句子的应答装置,该应答装置的构成为具备:

检测部,其在所述输入句子中含有未知单词时检测关联单词,其中,所述未知单词是没有与用于生成所述应答句子的规定的信息相关联的单词,所述关联单词是同一句子中使用的单词即共同单词与所述未知单词相同的已知单词;应答句子生成部,其生成与所述检测部检测出的所述关联单词关联的内容的应答句子。

为解决上述的课题,本发明的一种方面所涉及的应答装置,该应答装置的构成具备,检测部,其在所述输入句子中含有具有其他称呼的单词的情况、在所述输入句子中具有与所述单词相关联的句子的情况中至少符合一种的情况下检测关联称呼,所述关联称呼是同一句子中使用的单词即共同单词与所述单词相同的称呼;应答句子生成部,其生成与所述检测部检测出的关联称呼关联的内容的应答句子。

为解决上述的课题,本发明的一种方面所涉及的应答装置的控制方法,是对于输入句子生成应答句子的应答装置的控制方法,该方法包含有,检索步骤,在所述输入句子中含有未知单词时检索关联单词,其中,所述未知单词是没有与用于生成所述应答句子的规定的信息相关联的单词,所述关联单词是同一句子中使用的单词即共同单词与所述未知单词相同的已知单词;应答句子生成步骤,生成与所述检测步骤检测出的关联单词关联的内容的应答句子。

为解决上述的课题,本发明的一种方面所涉及的应答装置的控制方法,是对于输入句子生成应答句子的应答装置的控制方法,该方法包含有,检测步骤,在所述输入句子中含有具有其他称呼的单词的情况、所述输入句子中具有与该单词相关联的句子的情况中至少符合一种的情况下检测关联称呼,所述关联称呼是同一句子中使用的单词即共同单词与所述单词相同的称呼;应答句子生成步骤,生成与所述检测步骤检测出的关联称呼关联的内容的应答句子。

有益效果

根据本发明的一方面,得到可以根据用户的意图生成应答句子的效果。

附图说明

图1是示出本发明的第一实施方式所涉及的应答装置的主要部分构成的一例的框图。

图2是示出对话记录db(database,数据库)的一例的图。

图3是说明关联单词的检索方法的图。

图4是说明关联名称的检索方法的图。

图5是基于“妈妈”和“小百合”表示同一个人物的推测重建图4中的各个单词之间的关联的图。

图6是示出上述应答装置从接受语音输入到应答语音输出为止所执行的处理的一例的流程图。

图7是示出在推测未知单词的分类之后检索场景时由上述应答装置执行的处理的一例的流程图。

图8是示出在检索关联名称的基础上检索场景时由上述应答装置执行的处理的一例的流程图。

具体实施方式

[第一实施方式]

[应答装置的构成]

基于图1说明本实施方式涉及的应答装置。图1是示出应答装置1的主要部分构成的一例的框图。应答装置1是对于用户的输入句子生成应答句子的装置。在本实施方式中,说明应答装置1将用户语音发出的消息作为输入句子,并且语音输出与该输入句子对应的应答句子的例子。在下文中,输入句子和应答语句有统称记载为“输入输出句子”的情况。当记载为“输入输出句子”时,其指的是输入句子以及输出句子中的任一方或双方。此外,输入句子和应答句子中的至少一个可以是文本信息。当应答句子是文本信息时,应答语句的输出可以通过显示或打印来执行。

应答装置1具备整体地控制应答装置1的各部的控制部10、存储应答装置1使用的各种数据的存储部20、接受语音输入的语音输入部30以及输出语音的语音输出部40。此外,在控制部10中,包括语音识别部11、语素分析部12、关联单词检索部(检测部)13、类别推测部14、场景检索部15、应答句子生成部16以及语音合成部17。并且,存储部20存储词典21、对话记录db(数据库)22和场景db23。

语音识别部11对输入到语音输入部30的语音执行语音识别,并且作为该语音识别的结果生成文本数据。也就是说,语音识别部11生成输入句子的文本数据。

语素分析部12对作为语音识别结果的输入句子的文本数据进行语素分析。在语素分析中,输入句子的文本数据被分成语素,并且基于词典21向各个语素赋予词类、词类的意思、类别等信息。同一类别中的单词具有与该类别对应的相同属性。此外,同一类别中的句子具有与该类别对应的相同属性。哪些单词被分类为哪些类别,哪些句子被分类到哪些类别,以及如何定义每个类别是预先确定的。语素分析结果与输入句子的文本数据一起存储在对话记录db22等中,并且由关联单词检索部13等各部利用。

当输入句子中包括未知单词时,关联单词检索部13检索在句子中使用方法与该未知单词相同的已知单词作为关联单词。更详细地,关联单词检索部13从对话记录db22等数据库检索与未知单词组合使用的单词作为共同单词,并且从上述数据库检测与该共同单词组合使用的已知单词作为关联单词。换而言之,关联单词检索部13检测与未知单词有相同的共同单词的关联单词。此外,未知单词是没有与应答装置1用于生成应答句子的规定的信息相关联的单词。作为上述规定的信息列举例如单词含义和该单词所属的类别。在本实施方式中,未在词典21中登记为词条的单词被视为未知单词。未在词典21中登记为词条的,新单词、造词、缩写词等也包括在未知单词的范畴中。此外,已知单词是与上述规定的信息相关联的单词。在本实施方式中,在词典21中登记为词条的单词中,单词含义、类别也登记在词典21中了。也就是说,在本实施方式中,在词典21中登记为词条的单词被视为已知单词。

此外,当输入句子中包含具有其他称呼的单词时,关联单词检索部13检索在句子中使用方法与上述单词相同的称呼作为关联称呼。换而言之,关联单词检索部13检测与具有其他称呼的单词有相同的共同单词的关联称呼。在下文中,说明具有其他称呼的单词是表示人物的普通名词的示例。这些普通名词至少有被称为其他称呼的表示该人物的专有名词。此外,由于上述单词是表示人物的普通名词,因此在以下说明中,上述关联称呼被称为关联名称。此外,具有其他称呼的单词只要具有其他称呼即可,并不限于此例。此外,检测关联称呼的上述处理,可以设置与关联单词检索部13不同的处理模块,并由该模块执行。

类别推测部14从输入句子的上下文推测未知单词的类别。更详细地,类别推测部14将输入句子中的未知单词的共同单词的类别判断为未知单词的类别。进一步详细地,未知单词是输入句子的主语并且共同单词是谓语时,该谓语如果是表示主语的状态或者性质的单词,则类别推测部14判断未知单词的类别与该共用语为同样的类别。也就是说,当输入句子具有诸如“就未知单词>是<a>词的句子构造时,类别推测部14判断未知单词的类别与“断未的类别相同。例如,当“红球”是未知单词时,如果输入句子是“红球是苹果”,则类别推测部14判断“红球”的类别与“苹果”的类别(例如,水果)相同。由此,即使新的苹果品种出现在对话中时,也可以继续苹果相关的对话。

同样地,当输入句子具有诸如“样地,是<未知单词>知的句子结构时,类别推测部14判断未知单词的类别与“断未的类别相同。例如,如果输入句子是“制作点心用的苹果是红球”时,则类别推测部14判断“红球”的类别与“苹果”的类别(例如,水果)相同。

此外,类别推测部14根据被输入输入句子之前的输出句子的类别判断未知单词的类别。更详细地,在问候语一样的由一分节构成的输入句子含有未知单词时,类别推测部14判断该未知单词的类别与上一个输出句子的类别相同。例如,如果应答装置1语音输出“早安(类别:问候语)”之后的输入语句是“chi-su(未知单词)”,则类别推测部14判断“chi-su”的类别为问候语。由此,对于“chi-su”之类的未知单词,也可以返回例如“今天也是好天气呢”等适当的应答句子。

场景检索部15在场景db23中检索用于生成应答句子的场景。此外,本实施方式中的“场景”定义了应答句子的内容的概要,并且包括用于生成应答句子的模板。对于场景检索方法,与场景db23的详细一同后述。

应答句子生成部16生成应答句子。对于应答句子的生成方法将进行后述,但是关联单词检索部13检测到关联单词时,应答句子生成部16生成与该关联单词关联的内容的应答句子。此外,当关联单词检索部13检测到关联名称时,应答句子生成部16生成与该关联名称相关的内容的应答句子。

语音合成部17将由应答句子生成部16生成的应答句子合成为语音数据。合成的语音数据从语音输出部40输出语音。

词典21是用于语素分析的。词典21可以具有例如词条与其对应的词类、单词含义等相对应的数据构造。作为词典21可以应用包含可以对输入句子进行语素分析的信息的任意的词典。语素分析部12将未包含在词典21中词条的单词判断为未知单词。语素分析部12未判断为未知单词的单词是已知单词。

对话记录db22是存储应答装置1的输入句子以及应答装置1的输出句子的数据库。例如,对话记录db22可以具有如图2所示的数据构造。图2是示出对话记录db22的一例的图。此外,图中的(a)的表是对话记录db22,同图中的(b)是随附对话记录db22的节点db(数据库),同图中的(c)是随附节点数据库的节点连接db(数据库)。

图2的(a)中示出的对话历史db22是将输入输出句子、用户、系统、日期时间、位置信息、类别、父类别、意图以及节点连接的记录相关联的表。“输入输出句子”是输入句子或输出句子的文本数据。此外,“用户”记录表示它是否是来自用户的发言,“系统”记录表示它是否是来自系统,即应答装置1的发言。在图示的例子中,“1”表示肯定,“0”表示否定。也就是说,“苹果是红色的”是来自用户的发言即输入句子,“大阪的纪念品是章鱼烧呢”是应答装置1的话语或输出句子。“日期时间”表示发出“输入输出句子”的日期和时间,“位置信息”表示发出“输入输出句子”的地点。“类别”是“输入输出句子”的内容的类别,“父类别”是上述“类别”的父(上位的)类别。“意图”是对“输入输出句子”的内容进行行为分析的结果,例如,除了“肯定”、“建议”,“问题”、“愿望”等也是“意图”。“节点连接”表示输入输出句子中包括的节点的节点db中的条目。

图2的(b)示出的节点db是将节点号码、节点、读法、类别、父类别、词类以及附属信息的记录相关联的表。“节点号码”是节点的条目号码。“节点”是包含在输入输出句子中的单词、“读法”表示该单词的读法。“类别”是单词的类别、“父类别”是上述“类别”的父(上位的)类别、词类表示单词的词类。“附属信息”表示在输入输出句子中使用单词的方式,即什么(what)、何时

(when)、何处(where)、谁(who)、怎样(怎样地)(how)以及做(do)中的任一项。

图2的(c)示出的节点连接db是将助词、节点1、以及节点2的记录相关联的表。“节点1”和“节点2”是通过节点db的条目号码表示的由“助词”连接的单词。例如,在图2的(c)的第一行的记录中,“节点1点是“1”、“节点2”是“2”、助词是“是”。

这表示同图的(b)的“苹果”(节点号码1)和“红色的”(节点号码2)通过“助词”的“是”连接。

语素分析部12使用词典21进行输入输出句子的语素分析,以指定上述各个数据库中的各个记录的值。也就是说,指定类别(整个输入输出句子)、父类别(整个输入输出句子)、意图、节点连接、节点、读法、类别(单个节点)、父类别(单个节点)、词性、附属信息以及助词的值。

由此,节点db和节点连接db是在多个输入输出句子中存储单词与单词组合的数据库。对详细将进行后述,但是关联单词检索部13从这些数据库中检测与未知单词(或者具有其他称呼的单词)组合的共同单词。此外,关联单词检索部13从这些数据库中检测与在上述检测到的共同单词组合的已知单词(称呼)以作为关联单词(关联称呼)。

场景db23是存储用于生成应答句子的场景的数据库。场景db23具有能够对应各种适用条件检索场景的数据构造。例如,场景db23可以是针对各个场景而将该场景的适用条件和应答句子的模板相关联的数据构造。上述适用条件可以是输入句子的类型、输入句子含有的单词、以及与输入句子含有的单词关联的单词等相关条件。

此外,场景的应用条件可以包括基于输入句子的条件(下文中称为输入句子条件)、基于过去的输入输出句子的存储内容的条件(下文中称为存储条件)。在这种情况下,场景检索部15参考语音识别结果以及语素分析结果来判断是否满足输入句子条件。输入句子条件例如可以是整个输入句子的类别是规定类别,并且输入句子包含规定单词的条件。此外,输入句子条件可以包括输入输入句子的日期和时间、地点以及单词类别中的至少一个。此外,在这种情况下,场景检索部15参考对话记录db、节点db、以及节点连接db来判断是否满足存储条件。存储条件可以是规定的类别的单词、与规定的单词连接的条件。另外,规定的单词和规定的单词连接、规定类别的单词和规定类别(既可以和先前的类别不一样,也可以一样)的单词连接等也是可以的。此外,可以在存储条件中包括日期时间、地点等。

例如,假设场景db23中包括以下场景。

输入句子条件:输入句子的类别为“水果·水果加工品”,并且包括“红色的”的单词。存储条件:“水果·水果加工品”类别的单词与“红色的”一词连接。

模板:“<mnode1>也是红色的”

在这种情况下,场景检索部15从输入句子的语音识别结果以及语素分析结果判断输入句子满足上述输入句子条件,同时还从对话记录db22、节点db以及节点连接db中判断如果满足条件,则检测到该场景。例如,当用户发言“苹果是红色的”时,从语音识别结果以及语素分析结果,该发言所涉及的输入句子判断为类别是“水果·水果加工品”,包含“红色的”。也就是说,场景检索部15判断该输入句子满足上述场景的输入句子条件。此外,在这种情况下,如果句子“草莓是红色的”被存储在对话记录db22中,则从节点db和节点连接db判断类型为“水果·水果加工品”的单词与“红色的”相连接。也就是说,场景检索部15判断上述场景的存储条件也满足。由此,场景检索部15从场景db23中检测该场景。然后,应答句子生成部16将该场景的模板中的<mnode1>的部分,插入判断记忆条件时检测的单词(属于水果·水果加工品的类别,在节点连接db中与“红色的”连接的单词)“草莓”。由此,生成“草莓也是红色的”的应答句子。此外,在对话记录db22中进一步存储有“樱桃是红色的”的句子的情况下,也能够生成“樱桃也是红色的”的应答句子。如果检测到有多个单词可以插入<mnode1>部分时,则可以预先确定决定要插入的单词的方法。

[关联单词的检索]

由于考虑到与相同的词汇(组合使用)连接的单词的类别也相同的可能性较高,关联单词检索部13基于与未知单词连接的单词,检索与未知单词的类别相同的可能性较高的关联单词。基于图3对此进行说明。图3是说明关联单词的检索方法的图。

同图中在椭圆中记载了存储在对话记录db22中的单词(语素)及其语素分析的结果。此外,连接椭圆和椭圆的线段表示由该线段连接的椭圆内的单词组合使用,而在该线段上的圆内记载了连接这些单词的助词。在这个例子中,只有“红球”是未知单词,所有其他单词都是已知单词。

在图示的例子中,“红球”是未知单词。此外,“红球”与“买”、“红色的”、“甜的”相连接,并与这些单词组合使用。由此,关联单词检索部13首先指定“买”、“红色的”、“甜的”三个单词为“红球”组合使用的词作为共同单词。

然后,关联单词检索部13检索具有上述指定的共同单词的其他单词。关联单词检索部13通过该检索,将“红色的”作为共同单词检测到“苹果”、“草莓”、“糖果”,并且将“甜的”作为共同单词检测到“苹果”、“糖果”。其中,“草莓”与“红球”的共同单词只有“红色的”一个因此不作为关联单词。此外,“糖果”也只有一个共同单词因此不作为关联单词。另一方面,“苹果”与“红球”有多个共同单词(“红色的”和“甜的”)因此作为关联单词。换而言之,“苹果”与“红球”共有“红色的”以及“甜的”两种性质,因此作为“红球”的关联单词。进一步换而言之,关联单词检索部13针对于未知单词检测多种类型的共同单词,并且与该多种种类的共同单词中的至少两个种类组合使用的已知单词作为关联单词进行检测。

由此,关联单词检索部13可以将“苹果”检测为“红球”的关联单词。此外,由于“苹果”是已知单词,因此可以指定“苹果”的类别。然后,由于“苹果”和“红球”具有共同性质,因此可以推测出类别也是相同的。例如,如果“苹果”的类别是水果时,则“红球”的类别也可以视为是水果。

此外,以下将说明使用图2示出的各个db检测关联单词的方法。首先,关联单词检索部13从节点db(图2的(b))检测“节点”是“红球”的记录,并从该记录中确定“红球”的节点号码。接下来,关联单词检索部13从节点连接db(图2的(c))检测与上述指定节点号码相关联的多个节点号码。关联单词检索部13将这些节点号码的单词指定为共同单词。

接下来,关联单词检索部13对于上述检测到的多个节点号码(共同单词的节点号码),各自在节点连接db中检测与该节点号码相关联的节点号码(成为关联单词候选的词的节点号码)。然后,在检测到的节点号码中提取与共同单词的多个节点号码中至少两个组合的节点号码。此外,也可以将与共同单词节点号码的一个组合的节点号码添加到提取对象。最后,关联单词检索部13从节点db指定上述提取的节点号码的节点,并将该节点的单词检测为关联单词。

由此,具有关联单词检索部13的应答装置1对于未知单词即“红球”,可以从水果的场景生成应答句子,并且实现与用户的自然的会话。例如,当存在“[水果]在冷冻时好吃”的场景时,应答装置1对于用户关于“红球”的输入句子,可以返回“红球在冷冻时好吃”的应答句子。

此外,在图3的例子中,当“草莓”的共同单词包含“甜的”时,由于“草莓”和“红球”也共有两个共同单词,因此“草莓”也被检测为关联单词。此外,虽然图中未示出,但是在“樱桃”的名词的共同单词也包含“甜的”、“红色的”时,“樱桃”也被检测为关联单词。如上所述,即使当检测到多个关联单词时,如果各个关联单词的类别相同(本实施方式中都是“水果”),则可以将该类别直接视为未知单词的类别。

另一方面,图示的“糖果”的共同单词包含“红色的”时,“糖果”也被检测为关联单词。“糖果”的类别是“点心”,不同于“苹果”的类别“水果”。在这种情况下,关联单词检索部13可以检索“水果”的类别的名词和“点心”的名词中,其他具有与“红球”相同的共同单词的单词,并且适用检测到的名词的类别。例如,在图示的例子中,作为“水果”类别的“草莓”具有作为与“红球”的共同单词“红色的”。另一方面,“点心”类别的单词除了“糖果”以外,没有其他单词。由此,关联单词检索部13可以将“水果”适用为“红球”的类别。此外,也可以在场景检索部15侧执行决定关联单词的类别的处理。

如上所述,应答装置1还对自然会话中经常出现的,缩写词、新造词等一样的无法指定类别的未知单词,推测并分配类别。由此,可以从适当的场景生成应答句子。

[关联名称的检索]

基于图4对关联名称的检索进行说明。图4是说明关联名称的检索方法的图。关联名称的检索与关联单词的检索大致相同,但是在考虑到发出输入输出句子的时间段以及地点进行检索这一点上与关联单词的检索不同。

同图中在椭圆中记载了存储在对话记录db22中的单词(语素)及其语素分析的结果。此外,连接椭圆和椭圆的线段表示由该线段连接的椭圆内的单词组合使用,而在该线段上的圆内记载了连接这些单词的助词。进一步的,矩形内记载了在应答装置1中输入的含有椭圆内的单词的输入句子(应答装置1输出输出句子)的时间以及地点。

在图示的例子中,“妈妈”是表示人物的普通名词。首先,关联单词检索部13指定“妈妈”的共同单词为“草莓”、“选择”、“烹饪”此三者。

然后,关联单词检索部13检索具有上述指定的共同单词的,并且发出的地点以及时间段与含有“妈妈”的输入句子相同的,表示人名的其他单词。可以推断,共同单词相同的称呼是同一人物的称呼。进一步的,当含有发出该称呼的输入输出句子的地点以及时间段与发出输入句子的地点与时间段相同时,发出这些句子的状况相同,因此这些句子中含有的称呼是同一人物的称呼的可能性很高。因此,根据上述检索,可以将与“妈妈”同一人物的称呼检测为关联名称。此外,地点以及时间段的任一方可以用作关联名称的检索条件。此外,上述“表示人名的其他单词”可以是表示人名的专有名词,也可以是表示人名的其他的普通名词。进一步的,可以不含有是否表示人名、是否为普通名词、是否为专有名词等检索条件,而是广泛地将全部名词作为关联名词的检索对象。

例如,在图示例子中,关联单词检索部13将“草莓”作为共同单词,检测出表示人名的专有名词“小百合”。此外,在图示例子中,发出“妈妈”在“洗衣服”的输入句子的时间为8:00,地点是自家,并且发出“小百合”在“洗衣服”的输入句子的时间为8:30,地点是自家。由此,关联单词检索部13判断发出这些输入句子的地点以及时间段是相同的,并且判断“洗衣服”也是“小百合”和“妈妈”的共同单词。

此外,可以预先确定时间段的区分。例如,如果规定了5:00~10:00的时间段,则8:00和8:30任一者都包含在该时间段中,因此可以判断时间段是相同的。此外,对于地点也可以根据例如纬度·经度的范围进行区分。例如,如果在应答装置1中预先登记了“自家”的纬度·经度的范围,则通过在输入输入句子时从gps(全球定位系统)等取得的表示应答装置1的位置的纬度·经度信息,可以判断该输入是在自家进行的,还是在其他地方进行的。当然,判断地点以及时间段是否共同的方法不限于这些方法,例如,如果时间差在规定时间以内,则可以判断时间段(时间)是相同的。同样地,如果纬度·经度的差异在规定值以内,则可以判断地点是相同的。

进一步,关联单词检索部13判断“烹饪”也与“洗衣服”同样是“小百合”和“妈妈”的共同单词。根据以上的处理,关联单词检索部13将“小百合”检测为具有多个与“妈妈”相同的共同单词的关联名称。

此外,以下将说明使用图2示出的各个db检测关联单词的方法。首先,关联单词检索部13从节点db(图2的(b))检测“节点”是“妈妈”的记录,并从该记录中指定“妈妈”的节点号码。接下来,关联单词检索部13从节点连接db(图2的(c))检测与上述指定节点号码相关联的多个节点号码。关联单词检索部13将这些节点号码的单词指定为共同单词。此外,关联单词检索部13从对话记录db22(图2的(a))中,指定发出含有这些节点号码的单词的输出句子的时间段以及地点。

接下来,关联单词检索部13对于上述检测到的多个节点号码(共同单词的节点号码),各自在节点链接db中,检测与该节点号码相关联的节点号码(成为关联名称候选的单词的节点号码)。此外,检测对象是在上述指定的时间段以及地点发出的输出句子包含的节点的节点号码。然后,在检测到的节点号码中,提取与共同单词的多个节点号码中至少两个组合的节点号码。最后,关联单词检索部13从节点db指定上述提取的节点号码的节点,并将该节点的单词检测为关联名称。

[指定关联名称的意义]

通过指定关联名称,并存储在对话记录db22中,可以生成与含有该关联名称的各个输入输出句子关联的应答句子。基于图5对此进行说明。图5是基于“妈妈”和“小百合”表示同一人物的推测重建图4中的各个单词之间的关联的图。

如果“妈妈”和“小百合”被认为是表示同一个人时,则含有“妈妈”的输入输出句子可以被认为是对于“小百合”的输入输出句子,同样地含有“小百合”的输入输出句子可以被认为是对于“妈妈”的输入输出句子。例如,如图4所示,基于“小百合”“喜欢”“温泉”的输入句子,可以被视为“妈妈”“喜欢”“温泉”。由此,当输入句子含有“妈妈”时,可以生成与喜欢温泉关联的应答句子。例如,对应“妈妈明天休息”的输入句子,也可以生成“去妈妈喜欢的温泉吧”的应答句子。由此,用户没有必要对同一人物使用固定的称呼。也就是说,可以减少用户在选择输入句子的单词时的负担。

此外,当关联单词检索部13检测到表示人物的普通名词的关联名称时,优选地存储该普通单词与关联名称之间的对应关系。由此,可以避免对于同一人物生成同样的应答句子并使用户感到多余。例如,当“妈妈”和“小百合”是同一个人时,在生成并输出“妈妈,生日快乐”的应答句子之后,可以避免进一步生成并输出“小百合小姐,生日快乐”的应答句子。

[处理流程(语音输入接受~应答语音输出)]

基于图6说明由应答装置1执行的处理的流程(应答装置的控制方法)。图6是示出应答装置1从接受语音输入到应答语音输出所执行的处理的一例的流程图。

在s1中,语音输入部30接受用户发出的语音,即接收用户说出的消息的语音输入。该语音由语音识别部11进行语音识别并生成文本数据。然后,语素分析部12对该文本数据进行语素分析。其结果为,以上述的方式被记录在对话记录db22等中。此外,还一并记录接受语音输入的时间和地点。此外,可以通过利用例如gps等来指定地点。

在s2中,关联单词检索部13判断在上述语素分析结果中是否含有未知单词。此处,如果判断含有未知单词时(s2中的“是”),则进入s3的处理,如果判断不含有未知单词时(s2中的“否”),则进入s11的处理。

在s3(检测步骤)中,关联单词检索部13检索在s2中被判断为含有的未知单词的关联单词。在随后的s4中,关联单词检索部13判断在上述检索中是否检测到关联单词。此处,如果判断为检测到时(s4中的是),则进入s5的处理,如果判断没有检测到时(s4中的否),则进入s6的处理。

在s5中,场景检索部15对属于由关联单词检索部13检测到的关联单词的类别的场景进行检索,并且其后处理进入s7。此外,详细内容将基于图7后述,但是在s6中,在推测类别的基础上进行场景检索,并且其后处理进入s7。

在s7中,场景检索部15判断在上述检索中是否检测到场景。此处,如果判断为检测到场景时(s7中的“是”),则进入s8的处理,如果判断没有检测到时(s7中的“否”),则进入s9的处理。

在s8(应答句子生成步骤)中,应答句子生成部16使用由场景检索部15检测到的场景生成应答句子,并且其后处理进入s10。如果通过在s3中的检索中检测到关联单词,则在s8中生成的应答句子的内容成为与关联单词相关联。此外,如果在s12的处理中检测到关联名称,则在s8中生成的应答句子的内容成为与关联名称相关联。

在s9中,应答句子生成部16在没有检测到场景的情况下生成预先准备的应答句子,并且其后处理进入s10。这样的应答句子,例如可以在场景db23中预先登记。

在s10中,语音合成部17将由应答句子生成部16在s8或者s9中生成的应答句子合成语音数据,并且将合成的语音数据输出到语音输出部40。由此,图示的处理结束。

在s11中,关联单词检索部13判断在语素分析结果中是否含有表示人物的普通名词。此处,如果判断含有表示人物的普通名词时(s11中的“是”),则进入s12的处理,如果判断不含有表示人物的普通名词时(s11中的“否”),则进入s13的处理。

详细内容将基于图8后述,但是在s12中,在检索了上述普通名词的关联名称的基础上进行场景检索,并且其后处理进入s7。另一方面,在s13中,场景检索部15基于语素分析结果、与其关联的输入输出文(存储在对话记录db22等中)检索场景,并且其后处理进入s7。s7以后的处理如上所述。

[处理流程(类别推测~场景检索)]

基于图7说明图6的s6的处理的详细。图7是示出在推测未知单词的分类的基础上检索场景时由应答装置1执行的处理的一例的流程图。

在s21中,类别推测部14,从输入句子中的未知单词的前后的上下文,或者是被输入输入句子之前应答装置1输出的输出句子与该输入句子的上下文推测(判断)未知单词的类别。具体的判断方法如上所述。在随后的s22中,类别推测部14确定是否可以推测(判断)类别,如果可以推测(判断)(s22中的“是”),则进入s23的处理,如果不能推测(判断)(s22中的“否”),则进入s24的处理。

在s23中,场景检索部15在由类别推测部14推测的类别中进行检索场景,并且其后处理进入图6的s7。另一方面,在s24中,场景检索部15,以输入句子中的未知单词直接作为未知单词检索场景,并且其后处理进入图6的s7。例如,在s24中,可以检索与输入句子全部的类别、输入句子中的未知单词以外的单词的类别等关联的场景。

[处理流程(关联名称检索~场景检索)]

基于图8详细说明图6的s12的处理。图8是示出在检索关联名称的基础上检索场景时由应答装置1执行的处理的一例的流程图。

在s31(检测步骤)中,关联单词检索部13检索使用时间以及使用地点与在s11中被判断为含有的普通名词相同的关联名称。在随后的s32中,关联单词检索部13判断在上述检索中是否检测到关联名称。此处,如果判断为检测到时(s32中的“是”),则进入s33的处理,如果判断没有检测到是(s32中的“否”),则进入s34的处理。

在s33中,场景检索部15对检测到的关联名称关联的场景进行检索,并且其后处理进入图6的s7。例如,在s33中,场景检索部15也可以对应语素分析结果、含有输入句子的语素的输入输出句子(存储在对话记录db22等中)、关联名称以及含有关联名称的输入输出句子(存储在对话记录db22等中)中的至少任一个进行场景检索。例如,假设输入句子包含表示人物的名词和单词“休息”,并且在场景db23中存储由相关联了如下条件的场景:包含有关联名称的输入输出句子中有“<关联名称>喜欢<c>”(c的类别是地域)。此外,假设该场景的模板是“去<d>喜欢的<c>吧”(d是表示输入句子中的人的名词)。在这种情况下,如果输入“妈妈明天休息”的输入句子,场景检索部15检测上述场景,并且应答句子生成部16由此生成“去妈妈喜欢的<c>吧”的应答句子。

另一方面,在s34中,场景检索部15不考虑关联名称而进行场景检索,并且其后处理进入图6的s7。例如,在s34中,可以检索对应于语素分析结果和与其关联的过去的输入输出句子的场景。

〔第二实施方式〕

在上述实施方式中,作为将应答句子的内容作为与关联单词关联的内容的例子,说明了使用关联单词的类别中检测到的场景生成应答句子的例子。但是,检测到关联单词时生成的应答句子只要是与关联单词关联的内容的句子即可,并不受上述的例子限定。例如,应答句子中也可以含有关联单词,如对于“在卖红球(未知单词)”的输入句子,生成“红球是苹果(关联单词)的同伴吗?”的应答句子等。此外,也可以生成未知单词置换为关联单词的应答句子,如对于上述输入句子,生成“我很喜欢苹果”。

同样地,在上述实施方式中,作为将应答句子的内容作为与关联名称关联的内容的例子,说明了在含有关联名称作为主语的输入输出句子中,生成含有“喜欢”与助词“是”连接的单词的应答句子的例子。但是,检测到关联名称时生成的应答句子,只要是与关联名称关联的内容的句子即可,并不受上述的例子限定。例如,应答句子中也可以含有关联单词,如对于“遇到妈妈了”的输入句子,生成“妈妈是小百合小姐吗?”的应答句子等。

此外,在上述实施方式中,说明了输入句子中含有具有其他称呼的单词(作为具体例子示出表示人物的普通单词的例子)时,检索关联名称的例子,但是即使输入句子不含有上述单词,只要有与该单词关联的句子即可检索关联名称。例如,假设场景db23中包括以下场景。

输入句子条件:输入句子中含有“表示时间(时机)的单词”和“休息”的单词。

存储条件:“表示家人的单词”、<mnode1>和“喜欢”的单词相连接。

模板:去“表示家人的单词”喜欢的“<mnode1>”

然后,假设对话记录db22中存储有“小百合”、“温泉”、“喜欢”的连接,并且被输入“明天休息”的输入句子。该输入句子不含有表示人物的普通名词。

在上面的例子中,“小百合”是否是“表示家人的单词”不清楚时,但是通过检索“表示家人的词语”即“妈妈”的关联名称,若检测到“小百合”的关联名称,“小百合”也可以视为“表示家人的单词”。由此,对应上述输入句子,也可以生成“去妈妈喜欢的温泉吧”的应答句子。

〔第三实施方式〕

应答装置1,还可以具有对于与用户进行语音对话功能以外的功能。例如,应答装置1可以是具有自立行走功能等的人形机器人。另外,携带电话、智能手机、平板终端、个人计算机、家用电器(例如电视、冰箱、空调、吸尘器等)、汽车导航装置等中的具有上述应答装置1的功能的机器,也包含在本公开中“应答装置”的范畴内。本公开中的“应答装置”优选地是家人等特定人物使用的装置。

〔第四实施方式〕

上述各个实施方式的应答装置1的功能也可以通过应答系统实现,所述应答系统可以由多个可以通过网络通信连接的装置组成。该应答系统可以构成为具备:服务器(应答装置),其例如具有相当于语素分析部12、关联单词检索部13、类别推测部14、场景检索部15,应答句子生成部16和语音合成部17的功能;语音输入输出装置,其具备语音输入部30以及语音输出部40。在这种情况下,语音输入输出装置接受用户输入的输入句子,并将该输入句子发送到服务器。然后,服务器生成对该输入句子的应答句子,并发送到语音输入输出装置,从而从语音输入输出装置输出该应答句子。在该应答系统中、语音识别部11、语素分析部12、以及语音合成部17等可以设置在语音输入输出装置侧。此外,可以设置多个服务器,并且上述各个功能模块可以分散地配置在这些服务器中。

[变形例]

在上述实施方式中,当输入句子包含表示人物的普通名词时,示出了检索该关联名称的例子,但是上述“表示人物的普通名词”可以置换为任何“具有其他称呼的单词”。例如,当输入句子包括表示人物的专有名词时,可以检索其关联名称。因为对于表示人物的专有名词,具有其他称呼的情况也很多。此外,例如,也可以应用在人物的名字以外的物品的名字、宠物的名字。例如,当某个会话中包含的专有名词(名称)可以被推断为动物时,如果发生该会话的地点在自家附近,则可以认为该专有名词表示宠物的名字。在这种情况下,也可以生成使用宠物的类别的场景的应答句子、使用关于宠物的对话记录的应答句子。另一方面,如果发生该会话的地点远离自家或在动物园,则该专有名词可以简单地视为动物的名字。

对话记录db22是除了存储对应答装置1的输入句子以及应答装置1的输出句子以外,还可以存储各种各样的句子。例如,可以存储从书籍中取出的句子,也可以存储从因特网上的各种信息源(例如,新闻网站等)取出的句子。但是,为了防止应答内容被通用化,从新闻网站、书籍取出的句子,优选只保留表示客观的事实的句子,例如“a是b”。

[通过软件的实现例]

应答装置1的控制模块(尤其是关联单词检索部13、类别推测部14、场景检索部15、以及应答句子生成部16)可以通过形成于集成电路(ic芯片)等的逻辑电路(硬件)实现,也可以使用cpu(centralprocessingunit:中央处理单元)通过软件实现。

在后一种情况下,应答装置1具备:cpu,其执行作为实现各功能的软件的程序的命令;rom(readonlymemory:只读存储器)或者存储装置(将它们称为“记录介质”),其以计算机(或者cpu)可读取的方式记录有上述程序和各种数据;以及展开上述程序的ram(randomaccessmemory:随机存取存储器)等。并且,计算机(或者cpu)从上述记录介质读取并执行上述程序,由此达到本发明的目的。上述记录介质能使用“非暂时性有形介质”,例如能使用带、碟、卡、半导体存储器、可编程逻辑电路等。此外,上述程序可以经由能够发送该程序的任意传输介质(通信网络,广播波等)提供给计算机。并且,本发明的一个方式也可以以该程序通过电子传输来具体化、并嵌入在载波中的数据信号的形态来实现。

[总结]

根据本发明的第一方面所涉及的应答装置,是对于输入句子生成应答句子的应答装置,该应答装置的构成具备,检测部,其在所述输入句子中含有未知单词时检测关联单词,其中,所述未知单词是没有与用于生成所述应答句子的规定的信息相关联的单词,所述关联单词是同一句子中使用的单词即共同单词与所述未知单词相同的已知单词;应答句子生成部,其生成与所述检测部检测出的所述关联单词关联的内容的应答句子。

根据上述构成,当输入句子中包含未知单词时,检测关联单词,并生成与关联单词关联的内容的应答句子。此处,由于关联单词具有与未知单词相同的共同单词,因此与未知单词能具有同一或类似的语义、类别。并且,由于关联单词是已知单词,因此用于生成应答句子的规定的信息(例如语义、类别)也是已知的。由此,通过添加输入句子中包含的未知单词的语义、类别等,可以得到根据用户的意图生成应答句子的效果。

本发明的第二方面所涉及的应答装置,在上述第一方面中,所述检测部从存储多个句子中的单词和单词的组合的数据库中,检索与所述未知单词组合的共同单词,并且从所述数据库中检索与所述共同单词组合的已知单词以作为所述关联单词。

与相同的共同单词组合使用的单词,在语义、类别等可能相似,因此根据上述构成,可以生成与输入句子中包含的未知单词的语义、类别等关联的应答句子。此外,在上述数据库中存储什么样的单词和单词的组合并不特别限定,例如,可以存储在过去(上述输入句子之前)输入到应答装置的句子,以及在过去的应答装置输出的句子中的单词和单词的组合。此外,上述数据库中,还可以存储上述输入句子中的单词和单词的组合。

本发明的第三方面所涉及的应答装置,在上述第二方面中,上所述检测部检测多个所述共同单词,并且检测与所述多个共同单词中的至少两个组合的已知单词以作为所述关联单词。

未知单词和已知单词中相同的共同单词的种类越多,这些单词的语义、类别等类似的可能性越高,因此根据上述的构成,可以提高生成的与输入句子中含有的未知单词的语义、类别等关联的应答句子的准确度。

本发明的第四方面所涉及的应答装置,在上述第一到三方面任一个方面中,还具备类别推测部,其在所述检测部无法检测到所述关联单词时,将所述输入句子中的所述未知单词的所述共同单词的类别判断为与所述未知单词的类别;所述应答句子生成部在各个类别中预先存储的多个模板中,使用与所述类别推测部判断的类别相关联的模板生成所述应答句子。

未知单词的共同单词,与未知单词的类别可能相同。由此,根据上述构成,可以正确地判断未知单词的类别并生成适当内容的应答句子。

本发明的第五方面所涉及的应答装置,在上述第一到三方面任一个方面中,还具备类别推测部,其在所述检测部无法检测到所述关联单词时,根据在输入所述输入句子之前从所述应答装置输出的输出句子的类别判断该未知单词的类别的;所述应答句子生成部在各个类别中预先存储的多个模板中,使用与所述类别推测部判断的类别相关联的模板生成所述应答句子。

输出句子与紧随其后的输入句子的内容通常具有关联性,因此可以从之前的输出句子的类别中,指定其随后的输入句子的类别。此外,如果可以指定输入句子的类别,则有可以指定输入句子中含有的未知单词的类别的情况。由此,根据上述构成,可以正确地判断未知单词的类别并生成适当内容的应答句子。

本发明的第六方面所涉及的应答装置,是对于用户的输入句子生成应答句子的应答装置,该应答装置的构成具备,检测部,其在所述输入句子中含有具有其他称呼的单词的情况、在所述输入句子中具有与所述单词相关联的句子的情况中至少符合一种的情况下检测关联称呼,所述关联称呼是同一句子中使用的单词即共同单词与所述单词相同的称呼;

应答句子生成部,其生成与所述检测部检测出的关联称呼关联的内容的应答句子。

根据上述构成,输入句子中含有具有其他称呼的单词时,与共同单词相同的称呼检测为关联称呼,并且生成与该关联称呼关联的内容的应答句子。此处,由于关联称呼是共同单词与上述单词相同的称呼,因此该单词可能具有其他称呼。由此,通过添加输入句子中包含的单词的其他称呼,可以得到根据用户的意图生成应答句子的效果。

本发明的第七方面所涉及的应答装置,在上述第六方面中,所述检测部可从存储多个句子中的单词和单词的组合、发出所述句子的地点以及时间段中至少一项的数据库中,检测发出的地点以及时间段中至少一项与所述输入句子相同的所述关联称呼。

由于发出场所以及时间段中的至少一项与输入句子相同的句子中使用的关联称呼,是输入句子中含有的单词的其他称呼的可能性较高,因此根据上述构成,可以检测出更高准确度的关联称呼。然后由此,可以提高根据用户意图生成的应答句子的准确度。

本发明的第八方面所涉及的应答装置的控制方法,是对于输入句子生成应答句子的应答装置的控制方法,该方法含有,检索步骤,在所述输入句子中含有未知单词时检索关联单词,其中,所述未知单词是没有与用于生成所述应答句子的规定的信息相关联的单词,所述关联单词是同一句子中使用的单词即共同单词与所述未知单词相同的已知单词;应答句子生成步骤,生成与所述检测步骤检测出的关联单词关联的内容的应答句子。

本发明的第九方面所涉及的应答装置的控制方法,是对于输入句子生成应答句子的应答装置的控制方法,该方法含有,检测步骤,在所述输入句子中含有具有其他称呼的单词的情况、所述输入句子中具有与该单词相关联的句子的情况中至少符合一种的情况下检测关联称呼,所述关联称呼是同一句子中使用的单词即共同单词与所述单词相同的称呼;应答句子生成步骤,生成与所述检测步骤检测出的关联称呼关联的内容的应答句子。

本发明的各方面的应答装置也可以利用计算机实现,在这种情况下,通过使计算机作为上述应答装置所具备的各部(软件要素)进行动作从而使上述应答装置由计算机实现的应答装置的控制程序以及记录有该程序的计算机可读取的记录介质也纳入本发明的范畴。

本发明不限于上述各实施方式,能在权利要求所示的范围中进行各种变更,将在不同的实施方式中分别公开的技术手段适当组合而得到的实施方式也包含于本发明的技术范围。而且,能够通过组合各实施方式分别公开的技术方法来形成新的技术特征。

附图标记说明

1应答装置

13关联单词检索部(检测部)

14类别推测部

16应答句子生成部

22对话记录db(数据库)

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1