意图估计装置以及意图估计方法_5

文档序号：8435844阅读：来源：国知局

载有作为语音识别结果例113的意图串模式在全部的文节中进行分割时的最终评分。另外，提取模式b+c的意图串149记载有将复句结构的各句作为一个块时的最终评分。
[0160]图19示出针对语音识别结果例114的最终评分的计算例，该语音识别结果例114的语音识别评分151示为“0.4”。另外，术语串131、整体评分152、分割权重153、分割权重评分154、意图共现权重155以及最终评分156与图18中说明的构成相同。另外，提取模式b' +c'的意图串157记载有将复句结构的各句作为一个块时的最终评分。
[0161]接下来，对实施方式3的意图估计装置的动作进行说明。此外，示出实施方式3的意图估计装置的动作的流程图与实施方式I的图8所示的流程图相同。因此，参照图2以及图15至图19所示的具体例，对实施方式I的图8所示的流程图进行说明。此外，以下假定进行语音输入的情况进行说明。
[0162]首先，作为语音输入，输入图15所示的输入语音111的“Stop at OO Dome, thendrive to X X Land”，针对该输入语音111，作为步骤STl，语音识别部I进行语音识别，得到语音识别结果112。在语音识别结果112中，语音识别结果例113的“Stop at OO Dome，then listen to the ΛΛ Rad1”得到评分0.6，语音识别结果例 114 的“Stop at O O Dome,then drive to X X Land”得到评分0.4。该语音识别结果例113、114被输出至语素分析部2。
[0163]语素分析部2作为步骤ST2，基于已知的语素分析手法进行语音识别结果例113、114的语素分析，并生成图15所示的语素分析结果115。在图15的例子中，在语素分析结果115中记载有表层的语素和词类以及活用形，但是，也可以输出除此以外的详细的词类分类、语素的原形、语素的语意标签等的信息，最低限度包含语素的原形。
[0164]语素分析结果115由2个语素分析结果例116、120构成，并分别输出至意图估计单位提取部4。
[0165]意图估计单位提取部4作为步骤ST3，基于语言的语法特征，提取语素分析结果例116,120的全部的意图估计单位。例如，在英语的语素分析结果例116的情况下，首先，提取“stop(动词)/at (介词)”、“〇〇 Dome (名词:P0I) ”、“then (副词)/drive (动词)/to (介词)”、“the (冠词)/ ΛΛ Rad1 (名词:无线电台)”这4个文节作为意图估计单位。
[0166]接下来，作为语法制约，基于体言与用言相关的性质，提取依存关系成立的文节的组作为一个意图估计单位。进而由于存在用言的连体形与后续的体言相关、用言的连用形与后续的用言相关的性质，因此基于该性质进行意图估计单位的扩展。通过反复上述过程，从而生成有可能在语法方面具有语意的语素串并作为意图估计单位提取。
[0167]图15的意图估计单位提取结果例116所示的、提取模式117是以文节为单位的语素串的意图估计单位，提取模式118是由使名词与紧前的动词连接的2个文节构成的意图估计单位，提取模式119是将提取模式118的2个文节进一步汇总而得到的意图估计单位。
[0168]在步骤ST3的意图估计单位的提取处理结束时，意图估计部6作为步骤ST4，针对各意图估计单位提取出意图估计中使用的术语后进行意图估计，并保持其评分。图16所示的术语串121示出各意图估计和意图估计中使用的术语。
[0169]对于术语而言，可以考虑(I)将语素作为单独的术语使用的方法、(2)将名词、动词、形容词等限定的单词作为单独的术语使用的方法、
[0170](3)将单独语素以及η个连锁语素作为术语使用的方法、(4)将单独语素以及与之附带的附属的语意符号连锁语素作为术语使用的方法等，但是，在本实施方式3中，出于简单的目的，假定提取名词、动词、形容词等限定的单词的原形进行说明。但是，设施、住所等名词为多个单词串而视为一个块。另外，“〇〇Dome”、“X XLand”、“AA Rad1”、住所、设施类型名、品牌名等的术语会出现多种术语，因此，很难直接构建意图估计模型，因此，将基于上位概念的符号共同化，使用“ $设施$ ”$住所$ ”$无线电台$ ”、“ $类型名$ ”、
品牌名$ ”等的术语。
[0171]例如，图16的提取模式b的实线箭头122所示的意图估计单位，表示针对“stopat OO Dome (在〇〇Dome停)”，作为意图估计术语发送“stop (停)”、“ $设施$ — I”这2个术语，表示作为其部分意图估计结果，“经由地设定[设施=$设施$ — I] ”被意图估计成部分评分“0.95”。
[0172]图16的实线箭头122、123、124表示针对步骤ST3中提取的意图估计单位的部分意图估计结果，虚线箭头125、126表示针对步骤ST3中未提取的意图估计单位的部分意图估计结果，是与涵盖语音识别结果例113整体的意图估计单位相关的部分意图估计结果。这里，对虚线箭头125、126所示的意图估计单位的部分意图估计结果进行计算的理由是由于存在输入语音未必构成文法方面正确的语法的可能性。特别是，在输入语音被语音识别的情况下，用户的发话以未充分使用冠词、介词的形式进行的情况较多，若假定语法方面严密的输入，则有可能在意图估计单位中产生遗漏。并且，还有可能在语音识别结果中包含识别错误，优选在评价全部的可能性后再选择认为最适合的意图串。
[0173]在求出各意图估计单位的部分意图估计结果时，意图串估计部3作为步骤ST5，使用意图估计单位生成与语音识别结果例113、114的整体一致的意图串，并计算整体评分。将图16所示的提取模式a、b、c、d以及非提取模式e、f、g组合而生成与语音识别结果例113的整体一致的意图串，图18示出生成的意图串的部分评分142。在部分评分142中，区域O相当于图16中用实线标记的部分意图的部分评分。另外，区域P相当于语法方面正当性低而在图16中用虚线标记的部分意图的部分评分。在该区域P中，本实施方式I中，作为意图估计部分罚分对部分意图估计结果的部分评分乘以“0.9”。另外，通过在各提取模式下将部分意图的部分评分全部相乘而计算整体评分143。
[0174]另外，基于图16所示的分割采用权重127，以如下方式计算图18所示的各提取模式的分割权重144。
[0175]意图串148的情况下:
[0176]0.4X0.6X0.4 = 0.096
[0177]在提取模式a的情况下，由于使用全部的分割点，因此将各点的分割采用权重127相乘。
[0178]意图串149的情况下:
[0179](1.0-0.4) X 0.6 X (1.0-0.4) = 0.216
[0180]在提取模式b+c的情况下，由于仅使用第2个分割点，因此，除了第2个点以外，将从1.0减去分割采用权重127的结果相乘。
[0181]使用如上所述计算出的分割权重144，作为“(整体评分143) X (分割权重144) ”计算分割权重评分145。参照计算出的分割权重评分145，作为语音识别结果例113的意图理解结果，求出提取模式b+c所示的“经由地设定[设施=$设施1”、“无线电再现[对象=$无线电台$ — I] ”作为最高的分割权重评分“0.197”。另一方面，语音识别结果例114也相同地如图19所示，作为意图理解结果，求出提取模式b' +c'所示的“经由地设定[设施=$设施$— 1”、“目的地设定[设施=$设施$ — 2] ”作为最高的分割权重评分 “0.195”。
[0182]以往是计算在该提取模式b+c和提取模式b' +c'的意图理解结果即分割权重评分中取更高评分的提取模式b+c所示的“经由地设定[设施=$设施$ — I]、无线电再现[对象=$无线电台$— I] ”，作为针对输入语音111的意图估计结果。
[0183]并且，作为评价的方法，也可考虑将对语音识别评分141、151乘以分割权重评分
145、154的结果作为最终评分的方法，但是，在对语音识别评分141与语音识别评分151进行比较时，语音识别结果例113的语音识别评分141是更高的值，因此，无论任何情况都是提取模式b+c所示的“经由地设定[设施=$设施$ — I]、无线电再现[对象=$无线电台I]”成为最终的意图估计结果。这是由于不存在考虑到意图间关系的条件因而语音识别结果被最优先地评价而导致的。
[0184]因此，在该实施方式3的意图估计装置10中，作为步骤ST6，意图串估计部3为了对意图的妥当性进行评价，例如将进行以下所示的计算而得到的结果作为意图共现权重
146、155，并与分割权重评分145、154相乘。
[0185](I)按顺序提取连续的2个意图，计算2个意图的关系。
[0186](a)在存在2个意图的上位.下位的关系的情况下恒定的权重(例如，0.7)
[0187](b)在2个意图具有共同的上位意图的情况下，对其节点赋予的权重
[0188](2)将通过(I)求出的权重的积作为最终的权重，即作为最终评分147、156。
[0189]在上述(I)的计算中，通过对标准的意图连锁关系赋予1.0，对更紧密连接的意图连锁关系赋予比1.0大的值，对于矛盾的意图连锁关系赋予比1.0小的值，从而进行加分、减分。
[0190]例如，在提取模式b+c所示的“经由地设定[设施=$设施$ — I]、无线电再现[对象=$无线电台$— I] ”的情况下，共同的上位意图是图2所示的节点21的“根”，因此，对该节点21赋予的意图共现权重为“0.5”。在对全部的意图串计算该处理时，成为图18以及图19所示的意图共现权重146、155。使用这样计算出的意图共现权重基于以下的式子计算最终评分。
[0191](最终评分)=(分割权重评分)X(意图共现权重)X (语音识别评分)
[0192]参照最终评分147、156的计算结果，具有最高的最终评分的是提取模式b' +c'所示的意图串157，作为步骤ST7，输出该意图串157作为最适合用户的输入语音111的意图串估计结果。
[0193]如上所述，根据该实施方式3，构成为具有计算表示意图间的关系的意图共现权重的意图共现权重计算部8和计算分割权重评分并对计算出的分割权重评分乘以意图共现权重以及语音识别评分的意图串估计部3，因此能够考虑意图间的关系，输出最适合输入语音的意图串估计结果。因此，即使在进行了包含多个意图的输入的情况下，也能够基于意图间的关系生成最适合的意图串，并作为意图串估计结果输出。
[0194]实施方式4
[0195]在上述实施方式2中将使用语言设为日语进行了说明，在该实施方式4中将使用语言设为英语进行说明。此外，以下以适用于导航系统的意图估计装置为例进行说明。
[0196]另外，在以下的说明中，使用实施方式2所示的意图估计装置(参照图9)进行说明。另外，意图估计装置10的意图层次图数据蓄积部11蓄积图10所示的意图层次图数据。并且，假定基于图14所示的流程图进行意图估计处理的情况进行说明。
[0197]图20是示出实施方式4的意图估计装置的从输入语音提取意图估计单位的处理的具体例的图。
[0198]图20中示出从作为输入语音

完整全部详细技术资料下载

当前第5页1 2 3 4 5 6