语音识别装置及显示方法

文档序号:9204089阅读:482来源:国知局
语音识别装置及显示方法
【技术领域】
[0001]本发明涉及对用户说出的语音进行识别并显示识别结果的语音识别装置、以及使该识别结果显示于显示装置的显示方法。
【背景技术】
[0002]作为语音识别方法,已知有对用户说出的语音进行识别并显示该识别结果的方法。
在例如专利文献I中记载了以下内容:在识别用户说出的语音并显示该识别结果的语音识别装置中,基于使用者可操作的设备的利用状况、使用者的生物体信息等来推定使用者的负荷量,在其负荷量较大时(即,使用者对显示单元的显示进行视觉识别的频率较低时),使得容易显示识别结果,在其负荷量较小时(即,使用者对显示单元的显示进行视觉识别的频率较高时),使得不易显示识别结果。
现有技术文献专利文献
[0003](专利文献I)
日本专利特开2008 - 14818号公报

【发明内容】

发明所要解决的技术问题
[0004]然而,在例如专利文献I所示的现有语音识别装置中,仅能基于使用者的负荷来调整识别结果的输出频率,因而存在以下问题:即,即使显示了对于使用者而言较为重要的地图信息,但仍会显示语音识别结果,因而会妨碍使用者获取重要信息。
[0005]本发明是为了解决上述问题而完成的,其目的在于提供一种能根据识别结果相对于语音识别结果以外的显示信息的显示优先度,来调整语音识别结果的输出的语音识别装置、以及将该识别结果显示于显示装置的显示方法。
用于解决技术问题的技术手段
[0006]为了达成上述目的,本发明的语音识别装置中,识别用户说出的语音并显示识别结果,其特征在于,包括:
语音获取部,该语音获取部检测并获取所述用户所说出的语音;
语音识别部,该语音识别部在所述语音识别装置起动期间始终参照语音识别词典,来识别所述语音获取部所获取的音频数据,基于规定的判定匹配度来输出识别结果;
显示部,该显示部显示所述语音识别部所输出的识别结果;
显示控制部,该显示控制部输出指示,从而使所述语音识别部所输出的识别结果显示于所述显示部的规定的识别结果显示区域;
显示优先度计算部,该显示优先度计算部计算所述规定的识别结果区域中的所述识别结果的显示优先度;以及识别结果输出控制部,该识别结果输出控制部基于所述显示优先度计算部所计算出的显示优先度来确定所述规定的判定匹配度,并设定于所述语音识别部。
发明效果
[0007]基于本发明的语音识别装置,能根据识别结果相对于语音识别结果以外的显示信息的显示优先度,来调整语音识别结果的输出,因此不会因显示识别结果而妨碍用户获取对其而言较为重要的其他信息,因而提高了便利性。
【附图说明】
[0008]图1是表示使用实施方式I的语音识别装置的导航装置的一个示例的框图。
图2是表示实施方式I的语音处理部的结构的一个示例的框图。
图3是表示在显示部上显示有地图画面的状态下、在显示部内的左边部分的识别结果显示区域中显示了识别结果即操作按钮的画面例的图。
图4是表示地图画面、本车前进方向、及识别结果显示区域的关系的图。
图5是表示本车前进方向上的信息和识别结果的显示优先度调整量的对应的一个示例的表。
图6是表示在显示部中显示有地图画面的状态下、停车场等设施图标显示于识别结果显示区域中的画面例的图。
图7是表示设施图标的个数与显示优先度调整量的对应的表。
图8是表示每个道路类别的识别结果的显示优先度调整量的一个示例的表。
图9是表示每个地域类别的识别结果的显示优先度调整量的一个示例的表。
图10是表示每个地图显示比例尺的识别结果的显示优先度调整量的一个示例的表。
图11是表示在显示部中显示了地图画面的状态下、引导信息或警告信息显示于识别结果显示区域中的画面例的图。
图12是表示引导信息/警告信息与识别结果的显示优先度调整量相对应的一个示例的表。
图13是表示相对于识别结果的内容与所显示的显示画面的组合的、识别结果的显示优先度调整量的一个不例的表。
图14是表示识别结果的显示优先度与判定匹配度的关系的图。
图15是表示语音识别结果即操作按钮的显示处理的流程图。
图16是表示操作按钮显示后的处理的流程图。
图17是表示判定匹配度的设定的处理的流程图。
图18是表示在显示部上显示了地图画面的状态下、因本车的前进方法与显示于识别结果显示区域的识别结果即操作按钮之间的关系而引起的画面迀移例的图。
图19是表示实施方式2的语音处理部的结构的一个示例的框图。
图20是表示语音识别词典切换信息存储部中所存储的现有优先度、语音识别词典名、识别单词数相对应的一个示例的表。
图21是表示实施方式2的语音识别装置的处理的流程图。
图22是表示实施方式3的语音处理部的结构的一个示例的框图。
图23是表示识别结果的显示优先度与识别对象单词数的关系的图。 图24是表示识别单词候补存储部中所存储的识别对象候补的单词的读法与识别顺序相对应的一个示例的表。
图25是表示实施方式3的语音识别装置的处理的流程图。
图26是表示实施方式4的导航系统的概要的图。
【具体实施方式】
[0009]下面,参照附图,对本发明的实施方式进行详细说明。
本发明是识别用户说出的语音的语音识别装置,在该语音识别装置起动的情况下始终对语音进行识别。在下面的实施方式中,以将本发明的语音识别装置适用于搭载在车辆等移动体的导航装置中的情况为例进行说明,但也可以适用于安装在车辆以外的其他移动体用的导航装置上,可以适用于导航系统的伺服器。另外,也能适用于安装在智能手机、平板电脑、移动电话等携带信息终端等的导航系统的应用等中。
[0010]实施方式I
图1是表示适用了本发明的实施方式I的语音识别装置的导航装置的一个示例的框图。该导航装置包括:控制部1、GPS接收机2、自主巡航传感器3、当前位置检测部4、交通信息收发部5、路径计算部6、指引引导部7、麦克风8、语言处理部9、语音合成部10、地图信息存储部11、地图信息获取部12、指示输入部13、显示控制部14、显示部15、语音控制部16、扬声器17。
[0011]控制装置I对整个导航装置的动作进行控制。
GPS接收机2用于适用于根据来自GPS卫星的电波来测定移动体的当前位置的卫星巡航系统。
自主巡航传感器3适用根据方位传感器、行驶距离传感器等来检测移动体的当前位置、方位的自主巡航系统。
[0012]当前位置检测部4接收GPS接收机2及自主巡航传感器3的信号,并用卫星巡航系统和自主巡航系统且基于后述的地图信息来进行匹配,以检测本车的当前位置和前进方向。此外,也可以仅采用任一方的巡航系统。
[0013]交通信息收发部5接收由FM多路广播、无线电信标、光信标所提供的交通信息(以 VICS(Vehicle Informat1n&Communicat1n System:车辆信息和通信系统 / 注册商标)为代表)、DSRC(Dedicate Short Range Communicat1n:特定短距离通信)所提供的堵塞信息等。另外,发送与本车相关的信息例如当前位置等探测信息。
[0014]路径计算部6基于用户通过后述的指示输入部13、语音操作而设定的地点,由当前位置检测部4检测出的位置信息,由后述的地图信息获取部12所获取的地图信息,来计算从当前位置到所设定的地点为止的最佳路径(以下成为“推荐路径”)。
指引引导部7基于地图信息获取部12所获取的地图信息,生成车辆沿着路径计算部6所计算出的路径进行移动时用于引导的指引引导图及指引引导消息。
[0015]麦克风8获取用户说出的语音(集声)。麦克风8例如是全方向性(或无方向性)的麦克风、将多个全方向性(或无方向性)的麦克风排列成阵列状以调整方向特性的阵列麦克风、仅在一个方向上具有方向性且无法调整方向特性的单一方向性麦克风等。
[0016]语言处理部9处理麦克风8所获取的语音,此处进行语音识别。详细情况将参照图2在后面进行描述。
语音合成部10基于所输入的字符或字符串来生成合成语音。对于语音合成,例如使用“古井贞熙「语音信息处理」第4章”所揭示的方法。
[0017]地图信息存储部11中存储有例如与道路相关的“道路信息”,与设施相关的“设施信息”(类别、名称、位置等)、“各种文字信息”(地名、设施名、交叉路口名、道路名等)、以及表示设施.道路编号等的“各种图标信息”、以及指引引导部中所使用的指引用信息(规定的主要场所的位置信息、该重要场所的绘图信息、以及语音引导信息等)数据。地图信息存储部可以是例如HDD (Hard Disk Drive:硬盘驱动)、使用半导体元件的SD卡等存储器、也可以是存在于网络上的通过通信网络获取道路数据等信息的结构(地图数据获取部)。
[0018]地图信息获取部12接收到地图信息获取指示、设施信息获取指示等时,检索地图信息存储部11来获取必要信息。
对于指示输入部13,由用户手动输入指示。该指示可以列举出利用设置于导航装置的硬件开关、后述的显示器上所设定并显示的触摸开关、或者对设置于方向盘等的遥控器或单独的遥控器的指示进行识别的识别装置等作出的指示等。
[0019]显示控制部14从地图信息获取部12、当前位置检测部4、交通信息收发部5、路径计算部6、指引引导部7、视频处理部9获取必要信息,在后述的显示部15中生成要描绘的信息,向显示部15输出指示以显示该信息。
[0020]显示部15是显示一体型触摸面板,例如由IXD (Liquid Crystal Display:液晶显示器)和接触式传感器构成,根据来自显示控制部14的指示来在画面上进行描绘。此外,触摸面板可以是使用感压方式、电磁感应方式、静电电容方式、或对上述方式进行组合的方式等中任意一种。另外,也可以使用有机EL显示器来代替IXD。
[0021]语音控制部16向扬声器17输出指示,以使其输出来自指引引导部7的指引用语音信息、语音合成部10所生成的合成语音。
扬声器17基于语音控制部16的指示来输出语音。
[0022]接着,对语音控制部9的详细情况进行说明。图2是表示实施方式I的语音处理部9的结构的一个示例的框图。如图2所示,语音处理部9包括语音获取部18、语音识别部19、语音识别词典20、显示优先度计算部21、识别结果输出控制部22。
[0023]语音获取部18获取由麦克风8获取的用户语音、即输入的音频,并利用PCM(PulseCode Modulat1n:脉冲编码调制)进行A/D (Analog/Digital:模拟/数字)转换。
[0024]语音识别部19从经过语音获取部18进行了数字化后的音频信号中检测出符合用户所说内容的音频区间,提取出该音频区间的音频数据的特征量,基于该特征量利用语音识别词典20进行识别处理,从而输出具有规定判定匹配度以上(或大于规定判定匹配度)的匹配度的识别结果。作为识别处理,使用例如HMM(Hidden Markov Model:隐马尔可夫模型)法之类的一般方法即可。
[0025]然而,在搭载于车载导航系统等的语音识别功能中,通常用户会对系统明确表示(指示)发话的开始。因此,可以将指示语音识别开始的按钮(以下成为“语音识别开始指示部”)显示于触摸面板或设置于方向盘。于是,在语音识别开始指示部被用户按下之后,对所
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1