意图估计装置以及意图估计方法

文档序号:8435844阅读:255来源:国知局
意图估计装置以及意图估计方法
【技术领域】
[0001]本发明涉及对用自然语言输入的文本的内容与预先设计的意图的何种意图相符进行估计的意图估计装置以及意图估计方法。
【背景技术】
[0002]近年来,语音输入人说出的言语并使用其识别结果来执行操作的方法备受瞩目。该技术已被用作移动电话或汽车导航等的语音接口,作为基本方法有如下方法:预先将系统假定的语音识别结果与操作对应起来,在语音识别结果为假定的内容的情况下执行操作。该方法与以往的手动操作相比,能够通过语音的发话直接操作,因此作为快捷功能有效地发挥作用。另一方面,用户为了执行操作需要发出系统正在等待的言语,当系统处理的功能不断增加时,应该记忆的言语增加。另外,一般而言,在充分理解操作说明书后再使用的用户较少,其结果是存在如下问题:有时用户不清楚为了进行多种操作需要如何发话,实际上除了有限的功能以外无法通过语音进行操作。
[0003]作为其解决方法公开有如下方法:并不直接将语音识别结果与操作建立联系,而是根据用户的发话内容理解用户的意图进行操作。在其一种实现方法中,先将预先收集到的发话例句与操作(以下,称作学习数据)对应起来,再根据用户的言语通过统计学习方法将用户希望的操作(以下,称作意图)模型化,并利用该模型针对用户输入估计意图(以下,称作统计意图估计)。统计意图估计的具体处理是,首先,从学习数据的发话例句提取用于学习的术语(term);然后,将该术语集合和正确的意图作为输入学习数据,并通过统计学习算法,学习各术语与正确意图的权重并输出模型。
[0004]用于学习的术语一般是从对发话例句进行语素分析而得到的数据提取出单词或单词串。例如,从“〇〇駅〔行? ( OO eki ni ikitai (想去〇〇站))”这一发话例句,能够得到“〇〇駅(OOeki)(专有名词:设施)/C (ni)(助词)/行? (iki)(动词:连用形)/ fc U (tai)(助动词)”这样的语素分析结果。在得到语素分析结果时,提取“ $设施$、行< (iku) ”(专有名词的设施转换成$设施$这一特殊符号,动词转换成原形)这样的术语、“ $ 设施 $—t乙(ni)、id—行 ? (ni_iki)、行 ? U (iki_tai) ” 这样的 2 个连续的语素术语。
[0005]其结果是,针对“$设施 $、行 < (iku)、$ 设施 $—? 二 (ni)、i 乙—行 § (ni_iki)、行各—fcU (iki_tai)”的术语,生成以“目的地设定[目的地=$设施$]”(主意图是目的地设定,设定的目的地是$设施$ )的方式表现的正确意图,并基于由根据大量的发话数据而生成的术语串和正确意图构成的学习数据生成模型。作为用于生成模型的方式,利用机器学习算法。机器学习算法是针对全部学习数据,以最多地生成正确意图的方式对输入术语与正确意图的权重进行机器学习。因此,对于从与学习数据类似的发话得到的术语组合,能够得到输出正确意图的可能性高的模型。作为该机器学习方式,例如能够使用最大熵法。
[0006]通过使用基于这样的机器学习算法而生成的模型对用户输入进行意图估计,即使针对并非预先假定的输入的输入,也能够灵活地估计操作意图,因此,即使是不记得正式措辞的用户的发话,也能够适当地理解意图而执行操作。另一方面,通过接受这样的自由输入,系统的灵活性增加,用户进行更多种发话的可能性增大。
[0007]作为假定的多种发话,大致分成以下2类。
[0008](a)针对一个操作使用了更多种单词的输入
[0009](b)将由多个操作组成的要求作为一个块输入
[0010]在上述(a)的情况下,能够通过进一步增加学习数据而处理多种发话。另一方面,在(b)的情况下,由于学习数据本来与一个意图对应,因此,在包含多个意图的情况下,无法进行组合适当意图而成的处理。
[0011]因此,专利文献I中公开有如下的发话意图识别装置:使用作为一个意图而学习到的模型,针对包含一个或多个意图的输入求出适当的意图串。该发话意图识别装置针对输入语素作为学习数据预先准备成为意图划分的语素串,与上述意图理解同样地估计存在分割可能性的点并使该分割点的分割可能性与各分割要素的意图可能性匹配,从而估计最大似然意图串。
[0012]现有技术文献
[0013]专利文献
[0014]专利文献1:日本特开2000-200273号公报

【发明内容】

[0015]发明要解决的课题
[0016]然而,上述专利文献I中公开的技术是针对语素串作为学习数据给予分割点候选,学习其可能性,并针对实际的用户输入进行分割点估计,作为用于学习这些分割点的数据,很难集中多种输入,实际上只是对学习数据中的作为语素串的分割点进行预测,可认为其与基于语言性质判定分割点的可能性的情况并无多大区别。
[0017]因此,对于基于分割点估计多个意图,不仅要求分割点的正确性,其关键恰恰在于单独估计针对分割后的各部分输入的正确意图后选择最大似然意图,并返回将其连接而成的意图串,但是,存在无法验证该发话整体中的多个意图的妥当性的课题。
[0018]这意味着无法进行关于意图连续性的评价,由于以下所示的(C)?(e)的原因而无法得到妥当的意图串。
[0019](C)在无法大量准备学习数据的情况下,意图估计精度降低,因此,存在整体的意图串的精度降低的可能性。
[0020](d)由于有时输入中接受前方的部分而后方的发话被省略,因此,在该情况下,有时后方的发话的意图与用户的意图串不一致。
[0021](e)在输入为语音的情况下,由于将语音识别结果作为输入,因此,无法将包含误识别时的估计错误根据意图间的匹配性排除。
[0022]本发明正是为了解决上述课题而完成的,其目的在于,即使在进行了包含多个意图的输入的情况下,通过预先记述意图间的关系,按照意图间的关系来生成最适合的意图串O
[0023]用于解决课题的手段
[0024]本发明的意图估计装置具有语素分析部和意图串估计部,所述语素分析部进行输入语言的语素分析而转换成语素串,所述意图串估计部具有:意图估计单位提取部,其将语素分析部转换后的语素串分割成部分语素,并提取估计意图的单位即意图估计单位;意图估计部,其对构成意图估计单位提取部提取出的各意图估计单位的部分语素的意图进行估计;以及意图共现权重计算部,其计算基于意图估计部估计出的意图间的关系的意图共现权重,所述意图串估计部使用意图估计部估计出的I个或者多个意图生成与输入语言相当的意图串,使用表示所生成的意图串的似然性的评分、和针对构成所生成的意图串的意图由意图共现权重计算部计算出的意图共现权重,生成与输入语言对应的意图估计结果。
[0025]发明效果
[0026]根据本发明,即使在进行了包含多个意图的输入的情况下,也能够按照该多个意图间的关系来生成最适合的意图串。
【附图说明】
[0027]图1是示出实施方式I的意图估计装置的构成的框图。
[0028]图2是示出实施方式I的意图估计装置的意图层次图数据蓄积部蓄积的意图层次图数据的一个例子的图。
[0029]图3是示出实施方式I的意图估计装置的从输入语音提取意图估计单位的处理的具体例的图。
[0030]图4是示出实施方式I的意图估计装置的意图估计部的处理的图。
[0031]图5是示出实施方式I的意图估计装置的意图估计部的处理的图。
[0032]图6是示出实施方式I的意图估计装置的意图串估计部的处理的图。
[0033]图7是示出实施方式I的意图估计装置的意图串估计部的处理的图。
[0034]图8是示出实施方式I的意图估计装置的动作的流程图。
[0035]图9是示出实施方式2的意图估计装置的构成的框图。
[0036]图10是示出实施方式2的意图估计装置的意图串转换表蓄积部蓄积的意图串转换表的一个例子的图。
[0037]图11是示出实施方式2的意图估计装置的从输入语音提取意图估计单位的处理的具体例的图。
[0038]图12是示出实施方式2的意图估计装置的意图估计部的处理的图。
[0039]图13是示出实施方式2的意图估计装置的意图串估计部的处理的图。
[0040]图14是示出实施方式2的意图估计装置的动作的流程图。
[0041]图15是示出实施方式3的意图估计装置的从输入语音提取意图估计单位的处理的具体例的图。
[0042]图16是示出实施方式3的意图估计装置的意图估计部的处理的图。
[0043]图17是示出实施方式3的意图估计装置的意图估计部的处理的图。
[0044]图18是示出实施方式3的意图估计装置的意图串估计部的处理的图。
[0045]图19是示出实施方式3的意图估计装置的意图串估计部的处理的图。
[0046]图20是示出实施方式4的意图估计装置的从输入语音提取意图估计单位的处理的具体例的图。
[0047]图21是示出实施方式4的意图估计装置的意图估计部的处理的图。
[0048]图22是示出实施方式4的意图估计装置的意图串估计部的处理的图。
【具体实施方式】
[0049]以下,为了更详细地说明本发明,根据附图对用于实施本发明的方式进行说明。
[0050]实施方式I
[0051]以下以适用于导航系统的意图估计装置为例进行说明。而且下文中,将与用户发出或输入的语言对应的用户希望的操作称作“意图”。
[0052]图1是示出实施方式I的意图估计装置的构成的框图。
[0053]意图估计装置10由语音识别部1、语素分析部2以及意图串估计部3构成。另外,意图串估计部3具有意图估计单位提取部4、意图估计模型蓄积部5、意图估计部6、意图层次图数据蓄积部7以及意图共现权重计算部8。
[0054]语音识别部I针对输入至意图估计装置10的输入语音进行语音识别处理,并返回语音识别结果。语素分析部2将语音识别结果作为输入进行语素分析,并返回语素分析结果。意图估计单位提取部4根据语素分析结果,估计应该作为意图估计的单位进行分割的位置而分割成部分语素,基于语言的语法制约提取意图估计单位。意图估计模型蓄积部5是蓄积进行意图估计时参照的意图估计模型的数据库。意图估计部6参照意图估计模型蓄积部5中蓄积的意图估计模型,针对意图估计单位提取部4分割出的各个意图估计单位输出部分意图估计结果和部分评分(score)。
[0055]意图层次图数据蓄积部7是蓄积计算意图串的妥当性时参照的意图层次图数据的数据库。意图共现权重计算部8参照意图层次图数据蓄积部7中蓄积的意图层次图数据计算意图共现权重,该意图共现权重表示针对意图估计部6估计出的部分意图估计结果的意图串的妥当性。这里,意图共现表示针对输入估计出多个意图的情况,意图共现权重是针对估计出的多个意图表示各自的妥当性的值。意图串估计部3针对从语素分析部2输入的语素分析结果,基于意图估计单位提取部4、意图估计部6以及意图共现权重计算部8的输出结果,取得意图串估计结果和最终评分,输出带有最适合于输入语音的最终评分的意图串估计结果。
[0056]图2是示出实施方式I的意图估计装置的意图层次图数据蓄积部7蓄积的意图层次图数据的一个例子的图。
[005
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1