声音识别装置的制作方法

文档序号：2823177阅读：219来源：国知局

专利名称：声音识别装置的制作方法
技术领域：
本发明涉及一种利用声音来操作例如导航装置等设备的声音识别装置，特别涉及一种利用声音操作来进行与手动操作相同的步序的技术。
背景技术：
在利用声音对设备进行操作的情况下，若用户的发音模糊，则无法唯一决定操作内容。为了解决该问题，以往一般使用如下方法由设备呈现作为声音识别结果的候选项，用户从该候选中选择并确定正确的候选。然而，存在如下问题该方法中要转移至手动操作中不存在的声音操作所特有的画面，因此用户难以获知操作的步序。为了解决这种因发音的模糊性而引起的问题，专利文献1披露了如下的信息输入输出装置用户可利用声音对解释结果进行修正，用户还可利用声音对解释结果的候选进行选择。该信息输入输出装置中，输入解释候选暂定输出部生成用于使用户从由输入装置得到的各解释候选中选择候选的暂定呈现信息。定时器部随着暂定呈现信息的输出而开始计时动作，在经过预定时间后产生定时器信号。解释信息选择·确定部在从声音识别装置输入用于选择候选的声音信息时，或者在从定时器部产生定时器信号时，从各解释候选中选择一个候选，提供给信息处理装置以作为解释信息。输出合并部对来自信息处理装置的输出信息和来自输入解释候选集合暂定输出部的暂定呈现信息进行合并，将其提供给输出装置以作为对用户的输出信息。专利文献1 日本专利特开平10-91309号公报然而，在上述的专利文献1所披露的技术中，存在如下问题由于不知道正确的声音命令，因此用户的发音内容变得模糊，用户难以利用声音对其进行修正。

发明内容
本发明是为了解决上述问题而完成的，其课题在于提供一种能以相同的步序进行手动操作和声音操作的声音识别装置。为了解决上述问题，本发明所涉及的声音识别装置包括声音输入装置，该声音输入装置输入所发出的按钮名称的声音并将其转换成电信号；声音识别处理部，该声音识别处理部根据从声音输入装置作为电信号发送来的声音信号来执行声音识别处理；候选按钮检测部，该候选按钮检测部对具有与由声音识别处理部得到的识别结果有部分一致的按钮名称的按钮进行检测以作为候选按钮；显示控制部，该显示控制部在由候选按钮检测部检测出多个候选按钮的情况下，生成表示如下状态的画面，该状态为选择该多个候选按钮中的至少一个按钮；及显示装置，该显示装置显示由显示控制部生成的画面。根据本发明所涉及的声音识别装置，由于采用如下结构对具有与声音识别的结果有部分一致的按钮名称的按钮进行检测以作为候选按钮，在检测出多个候选按钮的情况下，在画面上显示选择该多个候选按钮中的至少一个按钮的状态且用户可按下按钮，因此即使用户的发音模糊，也能以与手动操作相同的步序进行声音操作。

图1是表示本发明的实施方式1所涉及的声音识别装置的结构的方框图。图2是以从识别声音开始直到将识别结果呈现给用户为止的声音操作处理为中心、来表示本发明的实施方式1所涉及的声音识别装置的动作的流程图。图3是用于说明本发明的实施方式1所涉及的声音识别装置中检测出一个候选按钮的情况下的动作的图。图4是用于说明本发明的实施方式1所涉及的声音识别装置中检测出多个候选按钮的情况下的动作的图。图5是以操作未完成时从追加操作开始直到操作完成为止的声音操作处理为中心、来表示本发明的实施方式1所涉及的声音识别装置的动作的流程图。图6是以操作未完成时发出按钮名称以外的声音而使操作完成的声音操作处理为中心、来表示本发明的实施方式1所涉及的声音识别装置的动作的流程图。图7是表示本发明的实施方式2所涉及的声音识别装置的结构的方框图。图8是以从识别声音开始直到将识别结果呈现给用户为止的声音操作处理为中心、来表示本发明的实施方式2所涉及的声音识别装置的动作的流程图。
具体实施例方式下面，为了更详细地说明本发明，根据附图对用于实施本发明的方式进行说明。实施方式1.图1是表示本发明的实施方式1所涉及的声音识别装置的结构的方框图。该声音识别装置包括声音输入装置11、声音识别处理部12、候选按钮检测部13、手动操作装置14、显示控制部15、显示装置16、各种功能执行部17、响应声音生成部18及声音输出装置19。声音输入装置11例如由话筒构成，将用户发出的声音转换成电信号，作为声音信号发送到声音识别处理部12。声音识别处理部12根据从声音输入装置11发送来的声音信号来执行声音识别处理。声音识别处理包含从所输入的声音信号中检测出发音的区间的声音区间检测处理、将由声音区间检测处理检测出的声音信号转换成声响参数的声响分析处理、根据由声响分析处理得到的声音的最小单位来选出并识别最大似然度的音素候选的概率运算处理、及对由概率运算处理得到的音素和存储单词等的词典进行比较来决定识别结果的比对处理。在声响分析处理中，例如利用LPC (Linear Predictor Coefficient 线性预测系数)梅尔倒谱或MFCC(Mel Frequency Cepstrum Coefficient 梅尔频率倒谱系数)等，将所输入的声音信号转换成特征向量序列，推定声谱的轮廓(波谱包络)。在概率运算处理中，例如利用HMM(Hidden MarkovModel 隐马尔可夫模型)等，使用根据所输入的声音由声响分析处理提取出的声响参数，进行声音信号的音素编码，并与预先准备的标准音素模型进行比较，选出最大似然度的音素候选。在比对处理中，通过将音素候选与词典进行比较，从而选择似然度较高的单词。声音识别处理部12中利用上述处理得到的识别结果被发送到候选按钮检测部13及显示控制部15。候选按钮检测部13对由声音识别处理部12得到的识别结果、和从显示控制部15获取到的所有按钮的名称(以下称为“按钮名称”)、即该声音识别装置中所准备的所有画面上存在的所有按钮的按钮名称进行比较，对具有与识别结果有部分一致的按钮名称的按钮进行检测以作为候选按钮。例如，识别结果为“YYY”，在准备了 “XXXXXX”、“YYYABC”、 “YYYDEF”及“ZUUZ”以作为按钮名称的情况下，具有与“YYY”有部分一致的诸如“YYYABC” 及“YYYDEF”的按钮名称的两个按钮被检测作为候选按钮。这里，识别结果和按钮名称有部分一致是指声音操作有模糊的情况。此外，识别结果和按钮名称完全一致是指进行了正确的声音操作的情况，候选按钮检测部13将表示完全一致的意思通知显示控制部15及各种功能执行部17(图1中省略了通知的路径)。在这种情况下，进行与利用手动操作装置14按下按钮的情况相同的动作。表示由该候选按钮检测部13检测出的候选按钮的信息作为候选按钮数据被发送到显示控制部15、各种功能执行部17及响应声音生成部18。手动操作装置14例如在用户按下显示在显示装置16的画面上的按钮时使用。该手动操作装置14可由设置在声音识别装置的前面板上的操作按钮、产生与该操作按钮相同的信号的远程控制器(遥控器)、载放在显示装置16的画面上的触摸屏、或者它们的组合来构成。通过操作该手动操作装置14而产生的操作按钮数据被发送到显示控制部15及各种功能执行部17。显示控制部15根据从候选按钮检测部13发送来的候选按钮数据或从手动操作装置14发送来的操作按钮数据，生成用于将图像显示在显示装置16的画面上的画面数据，发送到该显示装置16。另外，显示控制部15根据从各种功能执行部17发送来的显示数据，生成用于将处理结果显示在显示装置16的画面上的画面数据，发送到显示装置16。此外，显示控制部15如上所述，存储有由该声音识别装置准备的所有画面上存在的所有按钮的按钮名称，由候选按钮检测部13读出。该显示控制部15包括按钮控制部1 及画面转移部15b。按钮控制部1 改变画面上的按钮的显示方式。例如，按钮控制部1 执行如下处理通过使画面上的候选按钮的颜色或亮度发生变化，或者使该候选按钮产生闪烁，或者使候选按钮的大小或形状发生变化，从而进行增强显示。利用该增强显示，可将画面上所选择的按钮告诉用户，因此容易引导至下一操作。画面转移部1 执行如下处理在从候选按钮检测部13发送来的候选按钮数据表示检测出一个候选按钮的情况下，转移至与按下该候选按钮时相同的画面、即用于执行对所按下的候选按钮所分配的功能的画面。另外，画面转移部1 执行如下处理在从候选按钮检测部13发送来的候选按钮数据表示检测出多个候选按钮、且这些候选按钮存在于正在显示中的画面内的情况下，转移至表示如下状态的画面，该状态为如下状态的画面，该状态为选择多个候选按钮中的至少一个按钮，在不存在于正在显示中的画面内的情况下，转移至存在候选按钮的画面。表示利用该画面转移部1 转移后的画面的画面数据被发送到显示装置16。显示装置16例如由LCD (Liquid Crystal Display :液晶显示器)构成，根据从显示控制部15发送来的画面数据，显示图像。各种功能执行部17执行如下处理用于实现对从候选按钮检测部13发送来的候选按钮数据所表示的候选按钮所分配的功能、或者对从手动操作装置14发送来的操作按钮数据所表示的操作按钮所分配的功能。在该各种功能执行部17中实现的功能中，例如包含HFT(Hands Free Telephone 免提电话)或AV(Audio Visual 音频视频)等功能。另外，各种功能执行部17中，若实现功能的处理结束，则生成用于将这个意思告诉用户的消息数据，发送到响应声音生成部18，并且生成表示处理结果的显示数据，发送到显示控制部15。响应声音生成部18在从候选按钮检测部13发送来候选按钮数据的情况下，生成用于朗读该候选按钮数据所表示的候选按钮的按钮名称的声音信号，并且生成与从各种功能执行部17发送来的消息数据对应的声音信号。由该响应声音生成部18生成的声音信号被发送到声音输出装置19。声音输出装置19例如由扬声器构成，输出与从响应声音生成部18发送来的声音信号对应的声音。利用这些响应声音生成部18及声音输出装置19，由于可将画面上所选择的按钮告诉用户，因此容易弓I导至下一操作。接下来，说明如上述那样构成的本发明的实施方式1所涉及的声音识别装置的动作。首先，以从识别声音开始直到将识别结果呈现给用户为止的声音操作处理为中心，一边参照图2所示的流程图，一边进行说明。该声音操作处理中，首先，输入声音(步骤ST11)。即，声音输入装置11将用户发出的声音转换成电信号，作为声音信号发送到声音识别处理部12。接下来，进行声音识别 (步骤STU)。S卩，声音识别处理部12根据从声音输入装置11发送来的声音信号来执行声音识别处理，将识别结果发送到候选按钮检测部13。接下来，检测候选按钮(步骤STi;3)。即，候选按钮检测部13对从声音识别处理部12发送来的识别结果、和从显示控制部15获取到的所有画面上存在的所有按钮名称进行比较，对具有与识别结果有部分一致的按钮名称的按钮进行检测以作为候选按钮。表示由该候选按钮检测部13检测出的候选按钮的候选按钮数据被发送到显示控制部15、各种功能执行部17及响应声音生成部18。此外，该步骤ST13中，在一个候选按钮都未检测出的情况下，虽然省略图示，但声音操作处理结束。接下来，调查候选按钮数量是否比“1”多(步骤ST14)。S卩，显示控制部15调查从候选按钮检测部13发送来的候选按钮数据所表示的候选按钮的数量是否比“1”多。该步骤ST14中，若判断为候选按钮数量不比“1”多、即候选按钮数量为一个，则接下来进行画面转移(步骤ST15)。S卩，显示控制部15的画面转移部1 转移至与按下候选按钮时相同的画面。由此，例如，如图3所示，在菜单画面上显示有按钮名称“XXXXXX”、 “YYYABC”、“ZZZDEF”及“ZZZZZZ”的状态下用户发出“YYY”的声音、且仅检测出“YYYABC，，以作为候选按钮的情况下，转移至YYYABC功能画面。此时，响应声音生成部18生成声音信号，该声音信号用于朗读从候选按钮检测部 13发送来的候选按钮数据所表示的候选按钮的按钮名称以使用户进行确认，并发送到声音输出装置19。声音输出装置19输出与从响应声音生成部18发送来的声音信号对应的声音。由此，从声音输出装置19以模仿发音的方式输出“YYYABC”这一确认声音。接下来，执行各种功能(步骤ST16)。S卩，各种功能执行部17执行如下处理用于实现对从候选按钮检测部13发送来的候选按钮数据所表示的候选按钮所分配的功能。然后，在处理结束的情况下，生成表示操作完成通知的消息数据，发送到响应声音生成部18，并且生成表示处理结果的显示数据，发送到显示控制部15。显示控制部15根据从各种功能执行部17发送来的显示数据，生成画面数据，发送到显示装置16。接下来，生成响应声音(步骤ST17)。即，响应声音生成部18生成与从各种功能执行部17发送来的表示操作完成通知的消息数据对应的声音信号，发送到声音输出装置19。接下来，向用户进行呈现(步骤ST18)。S卩，显示装置16进行与从显示控制部15 发送来的画面数据对应的显示。由此，在显示装置16的画面上显示处理结果。另外，声音输出装置19输出与从响应声音生成部18发送来的声音信号对应的声音。由此，利用声音输出表示操作完成的意思的通知。之后，声音操作处理结束。上述步骤ST14中，若判断为候选按钮数量比“ 1 ”多、即候选按钮数量为多个，则接下来进行画面转移(步骤ST19)。S卩，显示控制部15的画面转移部1 转移至与选择识别结果为最大似然度的候选按钮时相同的画面。由此，例如，如图4所示，在菜单画面上显示有按钮名称“XXXXXX”、“YYYABC”、“YYYDEF”&“ZZZZZZ”的状态下用户发出“YYY”的声音、且检测出“YYYABC”及“YYYDEF”以作为候选按钮的情况下，转移至选择最大似然度的候选按钮“YYYABC”的状态。在这种情况下，可采用如下结构转移至与不仅是选择最大似然度的候选按钮、而且还选择多个候选按钮中的至少一个按钮时相同的画面。此时，响应声音生成部18生成声音信号，该声音信号用于使用户确认从候选按钮检测部13发送来的候选按钮数据所表示的候选按钮的数量，并发送到声音输出装置19，声音输出装置19输出与从响应声音生成部18发送来的声音信号对应的声音。由此，从声音输出装置19利用声音输出例如“有两个候选”这一消息。接下来，进行增强显示(步骤ST20)。即，显示控制部15的按钮控制部1 执行如下处理通过使最大似然度的候选按钮的颜色或亮度发生变化，或者使该候选按钮产生闪烁，或者使候选按钮的大小或形状发生变化，从而进行增强显示。此外，按钮控制部15a也可采用如下结构以使最大似然度的候选按钮以外的按钮采用不醒目的方式进行显示，以取代对最大似然度的候选按钮进行增强显示。另外，按钮控制部1 也可采用如下结构对多个候选按钮的所有按钮进行增强显示。接下来，生成响应声音(步骤ST21)。即，响应声音生成部18生成与表示操作未完成的意思的消息数据对应的声音信号，发送到声音输出装置19。接下来，向用户进行呈现(步骤ST18)。S卩，显示装置16进行与从显示控制部15 发送来的画面数据对应的显示。由此，在显示装置16的画面上显示对最大似然度的候选按钮进行增强显示的菜单画面。另外，声音输出装置19输出与从响应声音生成部18发送来的声音信号对应的声音。由此，利用声音输出表示操作未完成的意思的通知。之后，声音操作处理结束。接下来，以在操作未完成的情况下、从进行追加操作开始直到操作完成为止的声音操作处理为中心，一边参照图5所示的流程图，一边进行说明。该声音操作处理可应对通过识别声音的声音操作和通过按下按钮的手动操作中的任一操作。首先，说明通过按下按钮的手动操作的情况。在与手动操作对应的声音操作处理中，首先，按下按钮(步骤ST31)。即，用户在选择多个候选按钮的状态下，操作手动操作装置14，按下显示在显示装置16的画面上的按钮。通过操作该手动操作装置14而产生的操作按钮数据被发送到显示控制部15及各种功能执行部17。接下来，进行画面转移(步骤ST3》。即，显示控制部15的画面转移部1 转移至为了执行与所按下的操作按钮对应的功能所准备的功能画面。接下来，执行各种功能(步骤ST33)。即，各种功能执行部17执行如下处理用于实现对从手动操作装置14发送来的操作按钮数据所表示的按钮所分配的功能。然后，在处理结束的情况下，生成表示操作完成通知的消息数据，发送到响应声音生成部18。接下来，生成响应声音(步骤ST34)。即，响应声音生成部18生成与从各种功能执行部17发送来的表示操作完成通知的消息数据对应的声音信号，发送到声音输出装置19。声音输出装置19输出与从响应声音生成部18发送来的声音信号对应的声音。由此，利用声音输出表示操作完成的意思的通知。之后，声音操作处理结束。此外，步骤ST33中，在生成表示处理结果的数据的情况下，所生成的显示数据被发送到显示控制部15。显示控制部15根据从各种功能执行部17发送来的显示数据，生成画面数据，发送到显示装置16。显示装置16进行与从显示控制部15发送来的画面数据对应的显示。由此，在显示装置16的画面上显示处理结果。接下来，说明通过识别声音的声音操作的情况。在与声音操作对应的声音操作处理中，首先，进行声音识别(步骤ST41)。该步骤ST41的处理与图2所示的流程图的步骤 ST12的处理相同。在该步骤ST41所进行的声音识别中，可采用如下结构仅将上次声音操作时检测出的候选按钮的按钮名称设为等待词汇(可识别的词汇)。根据该结构，容易进行候选按钮的识别。接下来，检测候选按钮(步骤ST4》。该步骤ST42的处理与图2所示的流程图的步骤ST13的处理相同。接下来，调查候选按钮数量是否比“1”多(步骤ST43)。S卩，显示控制部15调查从候选按钮检测部13发送来的候选按钮数据所表示的候选按钮的数量是否比 “1”多。该步骤ST43中，若判断为候选按钮数量不比“1”多、即候选按钮数量为一个，则程序前进至步骤ST32，进行上述的画面转移。S卩，显示控制部15的画面转移部1 转移至与按下候选按钮时相同的画面。之后，执行上述的处理。另一方面，上述步骤ST43中，若判断为候选按钮数量比“1”多、即候选按钮数量为多个，则接下来进行画面转移(步骤ST44)。该步骤ST44的处理与图2所示的流程图的步骤ST19的处理相同。接下来，进行增强显示(步骤ST40。该步骤ST45的处理与图2所示的流程图的步骤ST20的处理相同。接下来，生成响应声音(步骤ST46)。该步骤ST46的处理与图2所示的流程图的步骤ST21的处理相同。之后，程序返回步骤ST31或步骤ST41，重复上述的处理。接下来，以在操作未完成的情况下、发出按钮名称以外的声音以使操作完成的声音操作处理为中心，一边参照图6所示的流程图，一边进行说明。该声音操作处理中，首先，进行上次操作的反馈(步骤ST51)。S卩，响应声音生成部18生成表示上次操作的反馈的消息的声音信号，发送到声音输出装置19。声音输出装置19输出与从响应声音生成部18发送来的声音信号对应的声音。由此，利用声音输出 “〇X〇X可以吗”这一消息。用户响应该消息，发出“是”、“不”、“下一个”或“上一个”
等声音。接下来，进行声音识别(步骤ST52)。S卩，声音识别处理部12根据从声音输入装置 11发送来的声音信号来执行声音识别处理，将识别结果发送到显示控制部15。接下来，调查是否识别出与按下“是”等按钮时相当的词汇(步骤ST53)。S卩，显示控制部15调查从声音识别处理部12发送来的识别结果是否表示与按下“是”等按钮时相当的词汇。此外，可采用如下结构与按下“是”等按钮时相当的词汇中，包含诸如“是的”或 “好的”等同义的肯定的词汇。该步骤ST53中，若判断为未识别出与按下“是”等按钮时相当的词汇，例如，若判断为识别出诸如“不”、“上一个”或“下一个”的否定的词汇，则对下一个或上一个候选按钮进行增强显示(步骤STM)。S卩，显示控制部15的按钮控制部1 执行如下处理通过使下一个或上一个候选按钮的颜色或亮度发生变化，或者使该候选按钮产生闪烁，或者使候选按钮的大小或形状发生变化，从而进行增强显示。之后，程序返回步骤ST51，重复上述的处理。另一方面，步骤ST53中，若判断为识别出与按下“是”等按钮时相当的词汇，则接下来进行画面转移(步骤ST5Q。即，显示控制部15的画面转移部1 转移至与按下下一个或上一个候选按钮时相同的画面。接下来，执行各种功能(步骤ST56)。该步骤ST56的处理与图2所示的步骤ST16 的处理相同。接下来，生成响应声音(步骤ST57)。该步骤ST57的处理与图2所示的步骤 ST17的处理相同。如上所述，在显示装置16的画面上显示处理结果，并且利用声音输出表示操作完成的意思的通知。之后，声音操作处理结束。如上所述，根据本发明的实施方式1所涉及的声音识别装置，由于采用如下结构对具有与声音识别的结果有部分一致的按钮名称的按钮进行检测以作为候选按钮，在检测出多个候选按钮的情况下，在画面上显示选择该多个候选按钮中的至少一个按钮的状态且用户可按下按钮，因此即使用户的发音模糊，也能以与手动操作相同的步序进行声音操作。另外，由于不显示为了解决模糊而频繁进行的诸如候选列表显示的声音操作特有的画面，因此不会损害简单易懂的性能。实施方式2.图7是表示本发明的实施方式2所涉及的声音识别装置的结构的方框图。该声音识别装置采用如下结构对上述的实施方式1所涉及的声音识别装置追加操作历史累计部 20及候选按钮筛选部21。另外，由候选按钮检测部13检测出的表示候选按钮的信息变更成发送到候选按钮筛选部21。操作历史累计部20累计利用声音操作进行操作的按钮的操作历史。更详细而言，操作历史累计部20对于所有的按钮存储将按钮名称和操作次数作为一对的操作历史，在从候选按钮检测部13发送来的表示候选按钮的信息表示检测出一个候选按钮的情况下，将与该候选按钮的按钮名称对应的操作次数加1。利用候选按钮筛选部21来参照存放于该操作历史累计部20的操作历史。候选按钮筛选部21在从候选按钮检测部13发送来的表示候选按钮的信息表示检测出多个候选按钮的情况下，参照操作历史累计部20，在多个候选按钮中选择操作最频繁的候选按钮。由该候选按钮筛选部21筛选出的候选按钮被发送到显示控制部15、各种功能执行部17及响应声音生成部18，以作为候选按钮数据。接着，以从声音识别开始直到向用户呈现识别结果为止的声音操作处理为中心，一边参照图8所示的流程图，一边说明采用上述那样结构的实施方式2所涉及的声音识别装置的动作。此外，在执行与图2的流程图所示的实施方式1所涉及的声音识别装置的处理相同或相当的处理的步骤中，标注与图2中使用的标号相同的标号，并简化说明。该声音操作处理中，首先，输入声音(步骤ST11)。接下来，进行声音识别(步骤 ST12)。接下来，检测候选按钮(步骤ST13)。接下来，调查候选按钮数量是否比“1”多(步骤 ST14)。该步骤ST14中，若判断为候选按钮数量不比“1”多、即候选按钮数量为一个，则存放候选按钮的操作历史(步骤ST61)。即，操作历史累计部20将与从候选按钮检测部13发送来的表示候选按钮的信息所表示的候选按钮的按钮名称对应的操作次数加1。接下来，进行画面转移(步骤STK)。接下来，执行各种功能(步骤ST16)。接下来，生成响应声音(步骤ST17)。接下来，向用户进行呈现(步骤ST18)。之后，声音操作处理结束。上述步骤ST14中，若判断为候选按钮数量比“ 1 ”多、即候选按钮数量为多个，则接下来对候选按钮进行筛选(步骤ST6》。S卩，候选按钮筛选部21参照操作历史累计部20，在从候选按钮检测部13发送来的表示候选按钮的信息所表示的多个候选按钮中选择操作最频繁的候选按钮以进行筛选。由该候选按钮筛选部21筛选出的表示候选按钮的信息被发送到显示控制部15、各种功能执行部17及响应声音生成部18，以作为候选按钮数据。接下来，进行画面转移(步骤ST19)。接下来，进行增强显示(步骤ST20)。接下来，生成响应声音(步骤ST21)。接下来，向用户进行呈现(步骤ST18)。之后，声音操作处理结束。此外，上述的图8所示的流程图中，虽然说明了对图2的流程图所示的实施方式1 所涉及的声音识别装置的声音操作处理采用候选按钮筛选的情况，但对于图5的流程图所示的实施方式1所涉及的声音识别装置中进行的声音操作处理也可采用候选按钮筛选。在这种情况下，在图5所示的流程图的步骤ST32之前执行步骤ST61所示的存放候选按钮的操作历史的处理，在步骤ST44之前执行步骤ST62所示的候选按钮筛选处理。同样地，对于图6的流程图所示的实施方式1所涉及的声音识别装置中进行的声音操作处理也可采用候选按钮筛选。在这种情况下，在图6所示的流程图的步骤ST55之前执行步骤ST61所示的存放候选按钮的操作历史的处理。如上所述，根据本发明的实施方式2所涉及的声音识别装置，由于将用户操作可能性高的按钮选择作为候选按钮并进行增强显示，因此可减少执行目的操作为止的用户操作次数。此外，上述的实施方式2所涉及的声音识别装置可变形如下。S卩，显示控制部15 将预先存储有的表示按钮配置(按钮在画面上如何排列)的按钮配置信息发送到候选按钮筛选部21。候选按钮筛选部21参照从显示控制部15发送来的按钮配置信息，判断为从候选按钮检测部13发送来的候选按钮是连续配置的情况下，选择最开头的候选按钮。由该候选按钮筛选部21选择出的候选按钮被发送到显示控制部15、各种功能执行部17及响应声音生成部18，以作为候选按钮数据。根据该结构，在候选按钮是连续配置的情况下，由于选择最开头的候选按钮并进行增强显示，因此容易知道用户的下一操作。工业上的实用性
如上所述，本发明所涉及的声音识别装置，为了使得能以相同的步序进行手动操作和声音操作，采用如下结构，包括声音输入装置，该声音输入装置输入所发出的按钮名称的声音并将其转换成电信号；声音识别处理部，该声音识别处理部根据从声音输入装置作为电信号发送来的声音信号来执行声音识别处理；候选按钮检测部，该候选按钮检测部对具有与由声音识别处理部得到的识别结果有部分一致的按钮名称的按钮进行检测以作为候选按钮；显示控制部，该显示控制部在由候选按钮检测部检测出多个候选按钮的情况下，生成表示如下状态的画面，该状态为选择该多个候选按钮中的至少一个按钮；及显示装置，该显示装置显示由显示控制部生成的画面，因此适用于利用声音来操作导航装置等设备的声音识别装置等。
权利要求
1.一种声音识别装置，其特征在于，包括声音输入装置，该声音输入装置输入所发出的按钮名称的声音并将其转换成电信号；声音识别处理部，该声音识别处理部根据从所述声音输入装置作为电信号发送来的声音信号来执行声音识别处理；候选按钮检测部，该候选按钮检测部对具有与由所述声音识别处理部得到的识别结果有部分一致的按钮名称的按钮进行检测以作为候选按钮；显示控制部，该显示控制部在由所述候选按钮检测部检测出多个候选按钮的情况下，生成表示如下状态的画面，该状态为选择该多个候选按钮中的至少一个按钮；及显示装置，该显示装置显示由所述显示控制部生成的画面。
2.如权利要求1所述的声音识别装置，其特征在于，包括画面转移部，该画面转移部在由候选按钮检测部检测出的候选按钮不存在于正在显示中的画面上的情况下，转移至存在该候选按钮的画面，显示控制部生成表示如下状态的画面，该状态为选择由所述画面转移部转移到的画面上的候选按钮。
3.如权利要求2所述的声音识别装置，其特征在于，显示控制部包括按钮控制部，该按钮控制部通过使画面上所选择的候选按钮的颜色或亮度发生变化，或者使该候选按钮产生闪烁，从而进行增强显示。
4.如权利要求2所述的声音识别装置，其特征在于，显示控制部包括按钮控制部，该按钮控制部通过使画面上所选择的候选按钮的大小或形状发生变化，从而进行增强显示。
5.如权利要求1所述的声音识别装置，其特征在于，包括响应声音生成部，该响应声音生成部生成声音信号，该声音信号朗读由候选按钮检测部检测出的候选按钮的按钮名称；及声音输出装置，该声音输出装置根据由所述响应声音生成部生成的声音信号，利用声音来输出候选按钮的按钮名称。
6.如权利要求1所述的声音识别装置，其特征在于，包括候选按钮筛选部，该候选按钮筛选部在通过参照预先存储于显示控制部的表示按钮的配置的按钮配置信息从而判断为由候选按钮检测部检测出的多个候选按钮是连续配置的情况下，筛选为最开头的候选按钮，所述显示控制部生成表示如下状态的画面，该状态为选择由所述候选按钮筛选部筛选出的候选按钮。
7.如权利要求1所述的声音识别装置，其特征在于，包括操作历史累计部，该操作历史累计部累计操作历史；及候选按钮筛选部，该候选按钮筛选部从由候选按钮检测部检测出的多个候选按钮中，根据来自所述操作历史累计部的操作历史来筛选候选按钮，显示控制部生成表示如下状态的画面，该状态为选择由所述候选按钮筛选部筛选出的候选按钮。
全文摘要
本发明的声音识别装置包括声音输入装置(11)，该声音输入装置(11)输入所发出的按钮名称的声音并将其转换成电信号；声音识别处理部(12)，该声音识别处理部(12)根据从声音输入装置作为电信号发送来的声音信号来执行声音识别处理；候选按钮检测部(13)，该候选按钮检测部(13)对具有与由声音识别处理部得到的识别结果有部分一致的按钮名称的按钮进行检测以作为候选按钮；显示控制部(15)，该显示控制部(15)在由候选按钮检测部检测出多个候选按钮的情况下，生成表示如下状态的画面，该状态为选择该多个候选按钮中的至少一个按钮；及显示装置(16)，该显示装置(16)显示由显示控制部生成的画面。
文档编号G10L15/28GK102105929SQ20098012920
公开日2011年6月22日申请日期2009年4月23日优先权日2008年7月30日
发明者井上让, 古本友纪, 竹里尚嘉申请人:三菱电机株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：井上让
技术所有人：三菱电机株式会社
我是此专利的发明人