语音对话支持装置和语音对话支持方法_2

文档序号:8528155阅读:来源:国知局
入模式(在该实例中,语音输入模式)。
[0055]在该状态下,当日本人说话时,识别语音。因此,在用于日本人的显示21中显示识别结果文本作为对话日志,并且在用于美国人的显示22中显示翻译的结果文本作为对话曰志。
[0056](每个单元的细节)
[0057]下面将以处理顺序描述每个单元的细节。
[0058](输入单元)
[0059]输入单元11指示具有多种输入模式的设备、屏幕部分或功能。在第一实施例中,假设输入单元11包括语音输入模式111、手写输入模式112、地图输入模式113和数字小键盘输入模式。列出的输入模式仅是实例,并且本发明并不限于这些输入模式。可以使用用户用于针对终端执行输入操作的任何手段。
[0060]在语音输入模式111中,使用麦克风设备捕获用户发出的语音,在屏幕上显示音量指示符等,并且获得使用语音识别功能将语音转换为文本的结果。
[0061]在手写输入模式112中,使用触摸屏设备接收用户的指点或手势位置,并且获得使用手写字符识别功能将位置转换为文本的结果。
[0062]在地图输入模式113中,在屏幕上显示地图,使用触摸屏设备接收用户的指点位置,并且获得诸如被触摸位置的地名、建筑物名称之类的文本。
[0063]在数字小键盘输入模式中,在屏幕上显示计算器之类的按钮,使用触摸屏设备接收用户的指点位置,并且获得对应于被触摸数字的文本。
[0064](翻译单元)
[0065]翻译单元12将输入单元11输入的文本翻译成其它语言。将翻译后的文本用作要在屏幕的倾听者侧显示的文本(图2)。
[0066]可以使用任何翻译手段。可应用任何方法,例如通用传输方法、基于实例的方法、基于统计的方法和用于已知机器翻译技术的中间语言方法。
[0067](主题确定单元)
[0068]主题确定单元13从输入句提取表示当前主题的一个或多个关键字。这些关键字将被称为主题关键字。
[0069]目标句可以是输入单元11输入的句子本身,或是翻译单元12的翻译结果。此外,可从输入句和翻译结果两者提取主题关键字,并且计算它们的“与”或“或”。
[0070]在该实例中,假设当日语句子是输入时,原封不动地从输入句提取主题关键字,并且当英语句子是输入时,从句子的翻译结果提取主题关键字。
[0071]作为提取主题关键字的实际方法,例如可以使用以下方法:其中在字典中保存固定单词,并且提取句子中与保存在字典中的一个单词匹配的单词。
[0072]图3示出字典31的一个实例。字典31将主题关键字和属于它的单词彼此关联。作为字典31的索引,可以使用如图3中所示的单词字符串,或者可以使用正则表达式。
[0073]例如,如果将上述方法应用于图2中所示的对话,则输入句是“I’m planning tosightsee in this area.(我计划在这个地区游览一下)”,并且输入句的翻译结果是“Konoshuhen no kanko wo suru yotei desu.”。通过将翻译结果与主题关键字字典相比较,发现“kono shuhen”和“kanko”被保存为附属单词。因此,“shuhen”和“kanko”被提取为主题关键字。
[0074]作为另一种方法,例如可以使用以下项:一种方法,其使用诸如形态分析或tf.idf之类的现有技术,在句组中提取特有的名词词组;或者一种方法,其使用公知的命名实体提取方法提取适当的名词,并且确定其语义属性。注意,tf.idf是一种技术,其将单词在一个具有相关信息的文档中的出现频率tf乘以表示所有文档中的多少个文档包括该单词的度量的逆向idf。
[0075]此外,在公知的主题划分方法中,公开一种方法,其比较包括在文本中的单词并且自动检测主题中断。可使用该方法提取单词。
[0076]注意,主题关键字的保存期只需是在输入其中包含主题关键字的句子之后直到输入预定数量的句子为止的周期,或者是直到经过预定时间为止的周期。备选地,上述主题划分方法可以用于清除每个主题中断的主题关键字。
[0077](临时答案类别确定单元)
[0078]类别确定单元14判定输入句是问题句还是答案句。如果存在问题句和紧接在问题句之后的答案句,则类别确定单元14提取句子组合作为问题对。
[0079](问题句模式确定)
[0080]使用确定问题句的句子模式的已知方法,判定输入句是否是问题句。类别确定单元14确定图4中所示的哪个句子模式41对应于输入句。如果确定问题句模式,则可以将输入句确定为问题句;否则,不将输入句确定为问题句。此外,如果被处理的输入句紧接在问题句之后,则可以将输入句确定为答案句。
[0081]例如,在图2中所示的问题句“Dokoni ikundesuka”的情况下,问题句的格式是“where (哪里)”。
[0082](从问题句估计临时答案类别)
[0083]此外,如果输入句是问题句,则类别确定单元14基于问题句的格式和主题确定单元13提取的主题关键字,估计临时答案类别。临时答案类别是被假设作为答案的单词的类另IJ。例如,将单词的语义属性用作类别。
[0084]类别确定单元14具有在树结构或网络结构中管理的类别。图5示出类别树的一个实例(实际上,不通过树而是通过标记管理类别)。
[0085]例如,在图2中所示的问题句“Dokoni ikundesuka”的情况下,问题句的格式是“where”(何处),并且主题关键字是“shuhen”(该关键字根据实现系统的位置而发展,并且例如可以是“Japan(日本)”等)和“kanko”。因此,从类别树提取与位置关联的子树,并且通过“Japan”和“kanko”搜索类别。因此,获得“Japanese sightseeing spot name ( H本观光景点名称)”作为临时答案类别。
[0086]注意,如果问题句的句子模式是“ Yes/No (是/否)”,则采取“ Yes (是)”或“No (否)”作为答案,并且因此不获得临时答案类别。
[0087](问题对似然性确定单元)
[0088]当确定输入句是答案句时,确定单元15基于答案句估计答案内容的类别。
[0089]通过将基于问题句获得的临时答案类别与基于答案句估计的答案类别相比较,计算问题对的似然性,即,指示问题对对应性的准确性的指标。
[0090]在图2中所示的实例中,假设在问题之后,美国人使用语音输入模式回答“I’mgoing to Kawasak1.(我要去川崎。)”,并且语音识别将答案错误地识别为“I’m going togo to call Osak1.(我要去拜访大崎。)”。在这种情况下,屏幕如图6中所示,并且获得“I’m going to go to call Osak1.” 作为答案句。
[0091]问题对包括(问题)“Dokoniikundesuka”和(答案)“I’m going to go tocall Osak1.”,并且临时答案类别是“Japanese sightseeing spot name”,如上所述。确定单元15获得针对问题句的答案句的准确性。
[0092](必需表的实例)
[0093]确定单元15具有图7中所示的答案模板字典71。
[0094]答案模板字典71是这样一种字典:其用于保存可以是答案句的句子作为具有空白处的模板。图7中由符号〈和〉括起来的部分指示空白部分。在空白部分中,描述类别名称(或类别组合)。空白部分对应于答案句中的答案。
[0095]例如,模板“Iwould like to go to〈place>” 指不答案句 “I would like to goto Kawasaki (我想要去川崎)”或 “ I would like to go to the toilet (我想要去洗手间)”中的“Kawasaki (川崎)”或“the toilet (洗手间)”是回答者想要回答的答案内容。
[0096](问题对似然性计算方法)
[0097]图8是示出确定单元15计算问题对似然性的实际方法的流程图。
[0098]下面将根据图8描述计算问题对似然性的方法。
[0099]当获得答案句时,确定单元15估计答案类别。确定单元15解析答案句(步骤ST8a),并且判定结果是否指示名词词组(步骤ST8b)。如果指示名词词组(是),则确定单元15分析整个答案句的语义属性(步骤ST8c)。语义属性分析结果指示答案类别。例如,如果答案句是“Kawasaki City (川崎市)”,则答案类别是“Japanese place name (city)(日本地名(城市))”。
[0100]如果解析结果在步骤STSb中指示答案句不是名词词组(否),则确定单元15在答案模板字典71中搜索与答案句匹配的模板(步骤ST8d),并且判定是否存在匹配模板(项目Ti)(步骤ST8e)。如果未发现匹配模板(否),则确定单元15不能指定答案类别,并且获得“不确定(uncertain) ” (步骤ST8f)。
[0101]如果在步骤STSe中发现匹配模板(是),则确定单元15标识答案句中对应于模板的空白部分的位置(步骤ST8g)。例如,如果使用示例性答案句“I’m going to go tocall Osak1.” 执行搜索,则获得 “I’m going to go to〈place>.,,,“call Osaki(拜访大崎)”与模板的空白部分(〈place〉)匹配并且是答案部分。
[0102]确定单元15分析所获得的答案部分的语义属性(步骤ST8h)。如此获得的结果指示答案类别。在上述实例中,“call Osaki”不是名词词组而是动词词组。因此,答
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1