意图估计装置以及意图估计方法_6

文档序号:8435844阅读:来源:国知局
输入了 “Stop at OO Dome thenX XLand”这样的发话时的语音识别结果到提取意图估计单位的例子。
[0199]语音识别结果161是语音识别部I对输入语音31进行语音识别的结果。具体而言,示出以评分“0.7”求出“Stop at O O Dome thenX XLand”的语音识别结果例,示出进行了与发话相符的识别的情况。语素分析结果162是语素分析部2对语音识别结果161进行语素分析的结果。意图估计单位提取结果163是意图估计单位提取部4针对语素分析结果162提取出意图估计单位的结果。在意图估计单位提取结果163中示出3个提取模式163a、163b、163c。
[0200]图21是示出实施方式4的意图估计装置的意图估计部6的处理的图。更详细地说,示出基于图20所示的意图估计单位提取结果163的部分意图的估计。
[0201]术语串164表示从意图估计单位提取结果163生成的部分意图估计中使用的术语串。另外,示出基于提取模式163a、163b、163c的提取模式h、1、j以及非提取模式k。实线箭头165以及部分评分166是针对各意图估计单位进行意图估计的结果例。虚线箭头以及分割点采用权重的构成与实施方式3相同。
[0202]图22是示出实施方式4的意图估计装置的意图串估计部3的处理的图。更详细地说,示出基于图21所示的部分意图估计结果的组合的最终评分的计算例。
[0203]是针对语音识别结果161通过部分意图估计结果的组合计算最终评分的例子,与实施方式3相同地示出语音识别评分171、部分评分172、整体评分173、分割权重174、分割权重评分175、意图共现权重176以及最终评分177。意图串178示出针对全部的分割模式表不最适合的意图估计结果的意图串。
[0204]接下来,对实施方式4的意图估计装置的动作进行说明。此外,示出实施方式4的意图估计装置的动作的流程图与实施方式2的图14所示的流程图相同。因此,参照图2、图10以及图20?图22所示的具体例对实施方式2的图14所示的流程图进行说明。此外,以下假定进行语音输入的情况进行说明。
[0205]首先,作为语音输入,输入“Stop at O O Dome then X X Land”,作为步骤STl,语音识别部I进行语音识别,图20所示的语音识别结果161得到评分0.7。也可预料到生成语音识别结果161以外的识别结果的情况,但是,不会对实施方式4的发明点造成影响因而省略说明。当生成语音识别结果161时,进行步骤ST2的语素分析以及步骤ST3的意图估计单位的提取,得到图20所示的意图估计单位提取结果163。
[0206]接着,意图估计部6作为步骤ST4,提取出图21所示的术语串164后计算部分意图估计结果以及部分评分。接下来,意图串估计部3作为步骤ST5,使用意图串估计单位生成与语音识别结果161的整体一致的意图串,并计算整体评分。由此,得到图22所示的提取模式、与该提取模式相应的部分评分、以及基于部分评分的整体评分。
[0207]接下来,意图串转换部12作为步骤STl I,从部分意图串中检索与图10所示的意图串转换规则一致的置换模式,在存在一致的置换模式的情况下,依据意图串转换规则转换相应的意图串。
[0208]具体而言,在图22所示的意图串178的情况下,由提取模式i的部分意图串以及提取模式h的部分意图串构成,该意图串178与图10所示的意图串转换规则81—致,因此以如下方式转换。
[0209]转换前:经由地设定[设施=$设施$—1],设施检索[设施=$设施$ — 2]
[0210]转换后:经由地设定[设施=$设施$ — I],目的地设定[设施=$设施$ — 2]
[0211]接下来,作为步骤ST6,意图串估计部3计算分割权重评分175,对该分割权重评分175乘以意图共现权重计算部8计算出的意图共现权重176以及语音识别评分,计算最终评分177。最后,意图串估计部3作为步骤ST7,输出最终评分177最大的意图串178的“经由地设定[设施=$设施$ — I]、目的地设定[设施=$设施$ — 2] ”,作为最适合用户的输入语音的意图串估计结果。
[0212]如上所述,根据该实施方式4,构成为具有蓄积有表示意图串的置换模式的意图串转换表的意图串转换表蓄积部11、和参照该意图串转换表蓄积部11中蓄积的意图转换表在出现相应的意图串的情况下依据置换模式置换意图串的意图串转换部12,因此,即使在用户的发话中进行了省略的情况下,也能够得到最适合用户的输入语音的意图串估计结果O
[0213]此外,在上述的实施方式I?实施方式4中,以日语以及英语为例示出了得到意图串估计结果的结构,但是,通过按照各个语言变更与意图提取单位相关的提取方法,能够适用于德语以及汉语等各种语言。
[0214]另外,在上述的实施方式I?实施方式4中,是通过特定的符号(空间等)划分单词的语言的情况,在难以对语言的构造进行分析的情况下,还可以构成为通过模式匹配这样的方法针对输入的自然语言文本进行$设施$、$住所$等的提取处理后直接执行意图估计处理。
[0215]另外,在上述的实施方式I?实施方式4中,以输入为语音输入的情况为例进行了说明,但时,即使在作为输入手段不使用语音识别而是采用基于键盘等输入手段的文本输入的情况下,也能够期待相同的效果。
[0216]另外,在上述的实施方式I?实施方式4中,示出将具有高分割权重评分的上位2个候选作为评价处理对象的例子,但是,并不限定评价处理对象数。另外,在语音识别结果不仅为文本、还通过语素单位输出的情况下,还可以构成为省略进行语素分析的手段而直接提取意图估计术语进行处理。
[0217]另外,在上述的实施方式I?实施方式4中,以作为意图估计的方法假定基于最大熵法的学习模型的例子进行了说明,但是,并不限定意图估计的方法。
[0218]另外,在上述的实施方式I?实施方式4中,作为各部分意图估计对象的组合,使用仅仅第I位意图的组合进行了说明,但是,也可以针对某恒定的评分以上的全部候选生成候选并计算意图串估计结果。
[0219]另外,在上述的实施方式I?实施方式4中,以适用于导航系统的情况为例进行了说明,但是,只要是进行意图估计的系统即可,能够适用于各种情况。
[0220]此外,本发明能够在其发明的范围内,进行各实施方式的自由组合、或各实施方式的任意构成要素的变形、或在各实施方式中省略任意的构成要素。
[0221]工业上的可利用性
[0222]如上所述,本发明的意图估计装置以及意图估计方法能够适用于具有语音识别功能的导航装置等,即使在进行了包含多个意图的输入的情况下,也能够按照多个意图间的关系生成最适合的意图串。
[0223]标号说明
[0224]1:语音识别部;2:语素分析部;3:意图串估计部;4:意图估计单位提取部;5:意图估计模型蓄积部;6:意图估计部;7:意图层次图数据蓄积部;8:意图共现权重计算部;10:意图估计装置;11:意图串转换表蓄积部;12:意图串转换部。
【主权项】
1.一种意图估计装置,其根据用户的语言输入估计所述用户的意图,其特征在于,该意图估计装置具有语素分析部和意图串估计部, 所述语素分析部进行所述输入的语言的语素分析而转换成语素串, 所述意图串估计部具有: 意图估计单位提取部,其将所述语素分析部转换后的语素串分割成部分语素,并提取估计所述意图的单位即意图估计单位; 意图估计部,其对构成所述意图估计单位提取部提取出的各意图估计单位的部分语素的意图进行估计;以及 意图共现权重计算部,其计算基于所述意图估计部估计出的意图间的关系的意图共现权重, 所述意图串估计部使用所述意图估计部估计出的I个或者多个意图生成与所述输入的语言相当的意图串,使用表示所生成的所述意图串的似然性的评分、和针对构成所生成的所述意图串的所述意图由所述意图共现权重计算部计算出的意图共现权重,生成与所述输入的语言对应的意图估计结果。
2.根据权利要求1所述的意图估计装置,其特征在于, 所述意图共现权重计算部参照根据所述意图间的关系性将该意图层次化而定义的意图层次图数据,使用对构成各层次的所述各意图定义的权重来计算所述意图共现权重。
3.根据权利要求2所述的意图估计装置,其特征在于, 所述意图层次图数据具有下位意图将上位意图进一步具体化的关系性, 所述意图共现权重计算部参照所述意图层次图数据,在构成所述意图串估计部生成的所述意图串的连续的2个意图存在共同的上位意图的情况下,使用对该上位意图定义的权重来计算所述意图共现权重。
4.根据权利要求2所述的意图估计装置,其特征在于, 所述意图层次图数据具有下位意图将上位意图进一步具体化的关系性, 所述意图共现权重计算部参照所述意图层次图数据,在构成所述意图串估计部生成的所述意图串的连续的2个意图存在上位与下位的关系的情况下,将预先设定的值作为所述意图共现权重。
5.根据权利要求1所述的意图估计装置,其特征在于, 该意图估计装置具有: 意图串转换表,其保持有根据构成所述意图串的连续的所述意图间的关系性对所述意图进行转换的意图串转换规则, 意图串转换部,其根据所述意图串转换规则,对构成所述意图串估计部生成的所述意图串的连续的所述意图中的、具有与所述意图串转换表中记载的意图串转换规则相符合的关系性的所述意图进行转换。
6.一种意图估计方法,根据用户的语言输入估计所述用户的意图,其特征在于,该意图估计方法具有如下步骤: 语素分析部进行所述输入的语言的语素分析而转换成语素串; 意图估计单位提取部将所述转换后的语素串分割成部分语素,并提取估计所述意图的单位即意图估计单位; 意图估计部对构成所述提取出的各意图估计单位的部分语素的意图进行估计; 意图共现权重计算部计算基于所述估计出的意图间的关系的意图共现权重;以及意图串估计部使用所述估计出的I个或者多个意图生成与所述输入的语言相当的意图串,使用表示所生成的所述意图串的似然性的评分、和针对构成所生成的所述意图串的所述意图由所述意图共现权重计算部计算出的意图共现权重,生成与所述输入的语言对应的意图估计结果。
【专利摘要】具有:语素分析部(2),其进行输入语言的语素分析而转换成语素串;以及意图串估计部(3),该意图串估计部(3)具有:意图估计单位提取部(4),其将语素串分割成部分语素,并提取估计意图的单位即意图估计单位;意图估计部(6),其对构成提取出的各意图估计单位的部分语素的意图进行估计;以及意图共现权重计算部(8),其计算基于意图间的关系的意图共现权重,该意图串估计部(3)使用意图估计部(6)估计出的1个或者多个意图生成与输入语言相当的意图串,使用表示所生成的意图串的似然性的评分和针对构成所生成的意图串的意图由意图共现权重计算部(8)计算出的意图共现权重,生成与输入语言对应的意图估计结果。
【IPC分类】G06F17-27
【公开号】CN104756100
【申请号】CN201380055883
【发明人】藤井洋一, 石井纯
【申请人】三菱电机株式会社
【公开日】2015年7月1日
【申请日】2013年10月9日
【公告号】DE112013005742T5, US20150255064, WO2014083945A1
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1