语音识别装置、识别结果显示装置及显示方法

文档序号:9492982阅读:638来源:国知局
语音识别装置、识别结果显示装置及显示方法
【技术领域】
[0001]本发明涉及对用户发出的语音进行识别并显示识别结果的语音识别装置、显示进行语音识别后的识别结果的识别结果显示装置及使该识别结果显示于显示装置的显示方法。
【背景技术】
[0002]作为语音识别方法,已知有对用户发出的语音进行识别并显示该识别结果的方法。
例如在专利文献1中揭示了以下内容:在对用户发出的语音进行识别,并显示该识别结果的语音识别装置中,若用户发话,则将作为其语音的识别结果的快捷按键显示于显示画面的左下方附近,若用户按下该快捷按键,则执行快捷功能。
现有技术文献专利文献
[0003]专利文献1
日本专利特开2008-14818号公报

【发明内容】

发明所要解决的技术问题
[0004]但是,例如在专利文献1所示的现有的语音识别装置中存在以下问题:S卩,在显示快捷按键时,若用户重新发话,则在显示该新的识别结果的情况下,会消去之前所显示的快捷按键,之后再显示新按键,因而会出现在用户要选择所希望的识别结果的瞬间该按键发生移动或该按键消失而改变为其他的识别结果的按键的情况,从而导致发生用户所不希望发生的动作。
[0005]本发明是为了解决上述问题而完成的,其目的在于提供一种在用户要选择显示于画面的识别结果的情况下,不更新识别结果而能选择所希望的识别结果的语音识别装置、识别结果显示装置及使该识别结果显示于显示装置的显示方法。
解决技术问题所采用的技术方案
[0006]为了达成上述目的,本发明提供一种语音识别装置,该语音识别装置对用户发出的语音进行识别并显示识别结果,其特征在于,包括:语音获取部,该语音获取部检测并获取所述用户发出的语音;语音识别部,该语音识别部在所述语音识别装置起动的期间始终参照语音识别词典来识别所述语音获取部所获取的语音数据,并输出识别结果;操作按键生成部,该操作按键生成部生成操作按键,该操作按键具有对应于所述语音识别部所输出的识别结果的功能;显示部,该显示部显示所述操作按键生成部所生成的操作按键;显示控制部,该显示控制部控制所述显示部的所述操作按键的显示内容;以及操作按键显示更新停止/重新开始部,该操作按键显示更新停止/重新开始部基于所述用户是否要操作显示于所述显示部的操作按键,来对所述显示控制部输出指示所述操作按键的显示内容的更新停止及重新开始的指示信号,所述操作按键显示更新停止/重新开始部在判断为所述用户要操作显示于所述显示部的操作按键的情况下,输出指示所述操作按键的显示内容的更新停止的指示信号,所述显示控制部从所述操作按键显示更新停止/重新开始部接收到了所述操作按键的显示内容的更新停止的指示信号的情况下,对所述显示部进行指示,以使显示于所述显示部的操作按键的显示更新停止。
发明效果
[0007]根据本发明,在判断为用户要选择显示于画面的识别结果的情况下,不进行显示部上的识别结果的显示更新,从而不会发生在用户要选择识别结果的瞬间该识别结果消失或者变为其他识别结果的情况,因而能防止出现用户所不希望的动作,能提高用户的便利性。
【附图说明】
[0008]图1是表示实施方式1的语音识别装置的一个示例的框图。
图2是表示显示部的操作按键显示区域中显示有操作按键的画面例的图。
图3是表示操作按键显示区域中仅能显示一个操作按键的情况下的操作按键的显示更新方法的图。
图4是表示操作按键显示区域中能显示二个操作按键的情况下的操作按键的显示更新方法的图。
图5是表示操作按键显示区域中仅能显示一个操作按键的情况下的操作按键的生成及显示处理的流程图。
图6是表示操作按键显示区域中能显示多个操作按键的情况下的操作按键的生成及显示处理的流程图。
图7是表示即使在未生成操作按键的情况下也消去已显示的操作按键的处理的流程图。
图8是表示操作按键显示更新停止/重新开始部进行操作按键的显示更新停止/重新开始的指示输出的处理的流程图。
图9是表示实施方式2的语音识别装置的一个示例的框图。
图10是表示操作按键显示更新停止/重新开始部根据语音识别进行操作按键的显示更新停止/重新开始的指示输出的处理的流程图。
图11是表示通过滚动来显示从操作按键显示区域被消去的操作按键的情况下的画面例的图。
图12是表示在显示更新停止中对作为显示履历而存储的操作按键进行一览显示的画面例的图。
图13是表示实施方式3的导航系统的概要的图。
【具体实施方式】
[0009]下面,参照附图,对本发明的实施方式进行详细说明。
本发明涉及识别用户发出的语音的语音识别装置,在该语音识别装置起动的情况下始终对语音进行识别。在下面的实施方式中,以将本发明的语音识别装置应用于搭载在车辆等移动体的导航装置的情况为例进行说明,但也可以用于车辆以外的其他移动体用的导航装置,可以适用于导航系统的伺服器。另外,也能应用于安装于智能手机、平板电脑、移动电话等移动信息终端等的导航系统的应用等。
[0010]实施方式1.图1是表示本发明的实施方式1的语音识别装置的一个示例的框图。该语音识别装置包括:控制部1,麦克风2、语音获取部3、语音识别词典4、语音识别部5、操作按键生成部6、显示控制部7、显示部8、操作按键显示更新停止/重新开始部9、指示输入部10、摄像机11、视线检测部12、及姿势检测部13。
[0011]麦克风2获取用户发出的语音(集声)。麦克风2例如是全方向性(或无方向性)的麦克风、将多个全方向性(或无方向性)的麦克风排列成阵列状以调整方向特性的阵列麦克风、仅在一个方向上具有方向性且无法调整方向特性的单一方向性麦克风等。
[0012]语音获取部3获取由麦克风2获取的用户发话、即输入的语音,且例如利用PCM (Pulse Code Modulat1n:脉冲编码调制)进行 A/D (Analog/Digital:模拟 / 数字)转换。
[0013]语音识别部5从经过语音获取部3进行了数字化后的语音信号中检测出符合用户所说内容的语音区间,提取出该语音区间的语音数据的特征量,基于该特征量使用语音识别词典4进行识别处理,从而输出识别结果。识别处理使用例如HMM(Hidden Markov Model:隐马尔可夫模型)法之类的一般方法即可。
[0014]然而,在搭载于车载导航系统等的语音识别功能中,通常用户会对系统明确表示(指示)发话的开始。因此,可以将指示语音识别开始的按钮(以下称为“语音识别开始指示部”)显示于触摸面板或设置于方向盘。于是,在语音识别开始指示部被用户按下之后,对所发出的语音进行识别。即,语音识别开始指示部输出语音识别开始信号,若语音识别部接收该信号,则在接收该信号后从由语音获取部获取的语音数据中检测出符合用户所说内容的语音区间,由此来进行上述识别处理。
[0015]然而,本实施方式1的语音识别部5即使没有上述那样的由用户发出的语音识别开始指示,也始终对用户发话的内容进行识别。即,语音识别部5即使没有接收到语音识别开始信号,在组装有该语音识别装置的导航装置被启动的情况下,也始终反复进行以下处理,即:从语音获取部3所获取的语音数据中检测出符合用户所说内容的语音区间,提取出该语音区间的语音数据的特征量,并基于该特征量使用语音识别词典4来进行识别处理,从而输出语音识别结果。在下述的实施方式中也一样。
[0016]指示输入部10接收用户手动输入的指示,即接收用户进行的各种操作的指示。该指示可以列举出利用设置于导航装置的硬件开关、显示部8上所设定并显示的触摸开关(包含后述的操作按键)、或者识别设置于方向盘等的遥控器或单独的遥控器的指示的识别装置所作出的指示。
[0017]操作按键生成部6生成操作按键,该操作按键具有对应于语音识别部5所输出的识别结果的功能。
显示控制部7进行以下指示输出:S卩,将操作按键生成部6所生成的操作按键显示于显示部8,改变操作按键的显示位置,删除显示了规定时间的操作按键等,由此控制操作按键的显示更新,并且判断显示部8中的操作按键的显示更新是否为停止中。另外,管理显示于显示部8的操作按键的相关信息,例如操作按键名称、操作按键在显示部8上的显示位置等。
[0018]显示部8是一体显示型触摸面板,例如由IXD (Liquid Crystal Display:液晶显示器)和接触式传感器构成,根据来自显示控制部7的指示在画面上进行描绘。此外,触摸面板可以是使用感压方式、电磁感应方式、静电电容方式、或对上述方式进行组合的方式等中任意一种。另外,也可以使用有机EL显示器来代替IXD。
[0019]控制部1对整个语音识别装置的动作进行控制。另外,基于从指示输入部10输入的用户指示、由语音识别部5输出的识别结果,来执行各种功能。例如,若用户手动或通过语音选择显示于显示部8的操作按键(识别结果),则执行分配给所选择的操作按键的功會泛。
[0020]在以下说明中,语音识别部5始终从用户语音中识别例如“加油站”、“便利店”这样的设施所属的种类名(以下称为设施种类名)并输出识别结果,操作按键生成部6生成具有检索属于该识别结果的种类的设施的功能(以下称为“种类检索功能”)的操作按键。
[0021]如图2的操作按键61,62那样,该操作按键由显示控制部7显示于显示部8的规定区域(以下称为“操作按键显示区域”)。
图2是表示在显示有地图等的显示画面(显示部8)的操作按键显示区域60中显示有操作按键61、62的画面例的图。若用户选择该操作按键61或62,则控制部1执行与所选择的操作按键相对应的种类检索。设定为在语音识别部5中根据现有技术即关键词识别来识别设施种类名。
[0022]可以不利用关键词识别来识别设施种类名,而使用如下方法:利用大词汇连续语音识别来进行所有识别,对识别结果进行形态分析,以提取出设施种类名。
[0023]语音识别部5也可以识别例如艺术家名、专辑名、乐曲标题名、用于操作车载导航系统的命令等。在该情况下,分配给操作按键的功能例如可以是按照艺术家名、专辑名、乐曲标题名等检索乐曲的功能,也可以是对应于命令的功能。
[0024]此处,举出具体例来说明显示控制部7对于显示部8上的操作按键的显示更新方法的一个例子。
图3是表示操作按键显示区域60较小,仅能在该显示区域中显示一个操作按键的情况下的操作按键的显示更新方法的图。
[0025]图3(a)表示操作按键显示部60中未显示有操作按键的状态,在该状态下,若识别出例如“想去便利店”这一语音,并生成对应于“便利店”的操作按键,则显示控制部7对显示部8进行指示输出以显示操作按键61 (图3 (b))。
[0026]之后,若识别出“能否经过银行”这样的语音,生成对应于“银行”的操作按键,则显示控制部7对显示部8进行指示输出,以在消去之前已显示的“便利店”操作按键61之后,显示“银行”操作按键62(图3(c))。此外,即使不生成新的操作按键,显示控制部7也对显示部8进行指示输出,以在不对所显示的操作按键进行任何操作的情况下,消去从显示开始起经过了规定时间后的操作按键。
[0027]另外,作为其他的显示更新方法,说明能在操作按键显示区域60显示多个操作按键(使用图4的以下说明中,设为两个操作按键)的
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1