语音对话支持装置和语音对话支持方法_4

文档序号：8528155阅读：来源：国知局

子提取主题关键字，并且保存它们。
[0142]例如，假设日本店员和美国顾客使用安装在日本商店中的语音对话支持装置进行有关纪念品的对话。在这种情况下，获得诸如与“kaimono”(购物)关联的“omiyage”(纪念品)之类的关键字作为主题关键字。
[0143](当输入问题和答案时)
[0144]当输入问题句时，类别确定单元14基于问题句估计临时答案类别。例如，假设美国人就给定纪念品输入问题“How much is it?(多少钱？)”。因为该问题的句子模式是“How much(多少钱)”，并且主题关键字是“kaimono”，所以临时答案类别是金额。
[0145]如果日本人方从未输入金额，则累积单元16未存储临时答案类别的记录，并且所述装置等待输入答案句。当输入了答案句时，确定单元15基于答案句估计答案类别，并且计算问题对似然性。确定单元15还使用问题对似然性更新累积单元16中的值。
[0146]假设日本人使用语音输入模式回答“500(Gohyaku) - en desu”，并且语音识别技术导致识别错误以输入答案句“Konnyaku-en desu”。在这种情况下，将部分“Konnyaku”标识为答案。作为语义属性分析的结果，不期望地将答案类别确定为“food(食物)”。因此，问题对似然性较低。更新累积单元16中的日本用户/语音输入/ “amount (金额)”的值。
[0147]评分单元17基于问题对似然性，计算答案输入模式的得分。如果计算的得分值较低，则屏幕生成单元18生成用于提示用户使用备选输入模式再次回答的屏幕。在上述实例中，问题对似然性较低，并且语音输入/金额的得分较低。因此，生成并呈现用于提示用户使用数字小键盘作为备选输入模式再次回答的屏幕。
[0148]当重新输入答案并获得新答案句时，确定单元15重新计算问题对似然性，并且更新累积单元16中的答案输入模式和答案类别的值。如果使用数字小键盘正确输入金额，则问题对似然性变得较高。因此，累积单元16中的日本用户/数字小键盘/ “amount”的值高于日本用户/语音输入/ “amount”的值。
[0149](当输入与之前相同的临时答案类别的问题并且尚未输入答案时)
[0150]当输入问题句并且累积单元16已经存储临时答案类别的记录时，评分单元17计算每种输入模式的得分，而无需等待答案句。屏幕生成单元18基于得分生成用于输入答案的屏幕，并且将屏幕呈现给进行回答的用户。
[0151]在上述实例之后，当美国人就另一种产品再次输入问题“How much is it?”时，临时答案类别是“amount”，并且累积单元16存储日本用户/数字小键盘/ “amount”的记录和日本用户/语音输入/“amount”的记录。数字小键盘输入模式的得分高于语音输入模式的得分，并且因此屏幕生成单元18生成答案屏幕，其中默认选择数字小键盘输入模式，并且将屏幕呈现给日本人方。日本用户可以使用数字小键盘输入金额，而不使用具有高失败概率的语音输入模式。
[0152](第一实施例的效果)
[0153]如上所述，根据第一实施例，因为根据问题和实际输入的答案提供最佳答案输入模式，所以用户可以可靠地输入答案，从而允许顺利对话。
[0154]此外，一旦在给定答案输入模式下发生故障，该模式的优先级将降低。因此，可降低同一用户重复同一错误的可能性。
[0155](第二实施例)
[0156]下面将参考附图描述第二实施例，重点关注与第一实施例的区别。
[0157]在第二实施例中，将解释应用语音对话支持装置的语音翻译应用，类似于上述第一实施例。
[0158]与第一实施例的区别是具有以下功能:允许用户额外地手动输入主题关键字的功能；当输入问题句时自动生成能够是答案的单词选项并且将它们呈现给用户的功能；以及保存诸如说话者的职位(例如，顾客或店员)、性别和年龄之类的信息，并且更改答案输入模式的优先级的功能。
[0159](整体布置)
[0160]图15是示出根据第二实施例的语音对话支持装置的布置的框图。注意在图15中，与图1中相同的参考标号表示相同的部分，并且将省略其详细描述。
[0161]根据第二实施例的语音对话支持装置除了包括第一实施例中的组件之外，还包括主题输入单元1301、选项生成单元1302和说话者简档累积单元1303。
[0162]主题输入单元1301呈现用户用于输入额外主题的屏幕，并且为主题确定单元13提供输入的额外主题关键字。当类别确定单元14确定问题句时，选项生成单元1302基于临时答案类别生成选项作为答案候选者。说话者简档累积单元1303保存用户的职位、使用的语言和性别，作为说话者简档信息。
[0163]此外，输入单元11具有选项输入模式，其呈现多个选项并接受用户的选择输入。评分单元17除了第一实施例中的评分之外，还使用生成的选项和说话者简档计算得分。
[0164](屏幕布置)
[0165]图16示出根据第二实施例的语音翻译应用的屏幕的一个实例。
[0166]除了上述第一实施例的屏幕之外，还准备屏幕1401，其用于在日本人方的显示上输入主题。在这种情况下，例如，在屏幕1401上显示“asobu”(游玩)、“miru”(观光)、“shokuji” (进餐)和 “shukuhaku” (住宿)。
[0167](每个单元的细节)
[0168](输入单元)
[0169]除了上述第一实施例之外，第二实施例中还包括选项输入模式。
[0170]输入单元11在选项输入模式下在屏幕上显示某些选项作为按钮，使用触摸屏设备获得用户的指点位置，并且获得在被触摸按钮的选项上显示的文本作为输入内容。
[0171](说话者简档累积单元)
[0172]说话者简档累积单元1303累积有关每个用户的职位、年龄和性别的信息。用户的职位例如指示商店中的顾客或店员。图17示出在说话者简档累积单元1303中累积的说话者简档1501的一个实例。
[0173]可以通过任何方法获得说话者简档1501。在日本的某个商店中，日本用户的职位是店员，并且美国用户的职位是顾客。店员的年龄和性别可以事先输入，并且顾客的年龄和性别只需在开始对话时由店员输入。备选地，提供一种基于输入语音时的语音信息来估计年龄和性别的方法。
[0174](主题输入单元)
[0175]主题输入单元1301呈现用于允许用户输入额外主题关键字的屏幕。具体地说，假设为在对话中采取主动的用户(例如在店员和顾客之间的对话中的店员)提供该功能。还假设通过参考在说话者简档累积单元1303中累积的“职位”项，确定被提供该功能的用户。
[0176]作为确定能够是输入的主题的方法，除了如图16中所示的使用预定选项的方法之外，还存在允许用户输入优选关键字的方法，以及使用过去所用主题关键字的历史的方法。
[0177]例如，在图16中，仅从输入句提取“kanko(福岛)”和“Tokyo(东京)”作为主题关键字。日本用户可以通过主题输入单元1301选择“asobu”。这旨在将主题限制为东京的观光景点名称，尤其是诸如主题公园之类的交互式设施，而不是进餐等。
[0178]主题确定单元13除了确定从输入句提取的主题关键字之外，还确定包括主题输入单元1301输入的额外主题关键字的主题关键字。
[0179](选项生成单元)
[0180]当类别确定单元14将输入句确定为问题句时，选项生成单元1302基于句子模式生成临时答案类别和问题句的主题关键字(可以是答案的选项)。作为生成选项的方法，例如，可以使用用于在问答系统中生成答案的公知技术。作为一种简单的方法，选项生成单元1302可以准备数据库1601，其存储每个临时答案类别的选项(如图18中所示)，并且搜索数据库1601。
[0181](答案输入模式评分单元)
[0182]当输入了问题句，并且进行回答的用户/临时答案类别的对应记录存在于累积单元16中但没有进行回答的用户/选项输入/临时答案类别的对应记录时，评分单元17使用所生成的选项，以虚拟方式计算选项输入模式的得分。
[0183]得分计算方法类似于问题对似然性计算方法。即，使用第一实施例中的g(S，I, t)=SXWlXl/to因为基于临时答案类别生成选项，所以选项的答案类别与临时答案类别一致，并且因此获得类别得分S = Sa= 1.0，从而从图9产生W1= 1.2。
[0184]实际上，因为尚未以选项输入模式执行输入操作，所以输入操作所用的时间不确定。相反，预计当生成的选项数量较小时，选择所用的时间较短，并且当选项数量较大时，选择所用的时间较长。因此，根据选项数量，以虚拟方式确定t的值。
[0185]简单地说，如果选项数量小于给定阈值，则设置t = 0a。备选地，如果选项数量大于阈值，则设置t = 0b。注意，可以设置0a〈0b(例如，Oa= 2.0并且Ob= 5.0)。S卩，如果选项数量小于阈值，则根据SaX W1X l/0a获得得分。
[0186]可以使用根据选项数量的等式t = h (选项数量)，而不使用确定阈值的方法。例如，可以使用h(选项数量)=0.5X选项数量+1.0。
[0187]此外，使用在说话者简档1501中累积的信息调整得分。例如，职位是“shopassistant (店员)”，其中可能发生识别错误的语音输入模式和手写输入模式的得分减少。当年龄高时，因为倾向于发生语音识别引起的识别错误，所以语音输入模式的得分减少，并且选项数量的阈值改变。
[0188](处理过程)
[0189]下面将参考图16中所示的对话实例描述处理过程。
[0190]例如，假设美国人说出“I’ d like to go

完整全部详细技术资料下载

当前第4页1 2 3 4 5