语音识别装置及导航装置制造方法

文档序号：2825358阅读：272来源：国知局

语音识别装置及导航装置制造方法【专利摘要】本发明所涉及的语音识别装置包括：语音获取部（1），该语音获取部（1）对所输入的语音进行数字转换，并作为语音数据来获取该数据；语音数据存储部（2），该语音数据存储部（2）对语音获取部（1）所获取的语音数据进行存储；第一～第M语音识别部，该第一～第M语音识别部从语音数据存储部（2）所存储的语音数据中检测语音区间，提取出语音区间的语音数据的特征量，基于所提取出的特征量并参照识别词典来进行识别处理；语音识别切换部（4），该语音识别切换部（4）对第一～第M语音识别部进行切换；识别控制部（5），该识别控制部（5）对语音识别切换部（4）所进行的语音识别部的切换进行控制，以获取切换后的语音识别部的识别结果；以及识别结果选择部（6），该识别结果选择部（6）从识别控制部（5）所获取的识别结果中选择提示给用户的提示对象的识别结果。【专利说明】语音识别装置及导航装置【
技术领域：
】[0001]本发明涉及语音识别装置及包括该装置的导航装置。【
背景技术：
】[0002]在现有的车载导航装置中，一般具有语音输入Ι/F以实现对地址、设施名称进行语音识别的功能。然而，由于安装作为车载导航装置的硬件的工作存储器及运算能力的限制、识别率的问题，有时难以将地址、设施名称等大量的词汇作为一次性识别的对象。[0003]对此，例如在专利文献I中，公开了一种将语音识别对象进行分割以分多次实施识别的语音识别装置。在该装置中，将语音识别对象进行分割并依次进行语音识别，若识别结果的识别分值(匹配度)在阈值以上，则确定其识别结果并结束处理。另外，当识别分值在上述阈值以上的识别结果一个也没有时，将所获得的识别结果中识别分值最高的识别结果作为最终的识别结果。[0004]这样，能通过将语音识别对象进行分割来防止识别率的下降。另外，由于在识别结果的识别分值为阈值以上的时刻结束处理，因此，能缩短识别处理所需的时间。[0005]现有技术文献[0006]专利文献[0007]专利文献1:[0008]日本专利特开2009-230068号公报【
发明内容】[0009]发明所要解决的技术问题[0010]在专利文献I所代表的现有技术中，例如在通过语法型或听写型等不同的语音识别处理来依次进行识别的情况下，无法单纯比较识别结果各自的识别分值(匹配度)。因此，当识别分值在上述阈值以上的识别结果一个也没有时，存在以下问题:即，无法选择所获得的识别结果中识别分值最高的识别结果，从而无法对用户提示识别结果。[0011]本发明是为了解决上述那样的问题而完成的，其目的在于获得一种能正确提示由不同的语音识别处理所获得的识别结果、并能力图缩短识别处理时间的语音识别装置及包括该装置的导航装置。[0012]解决技术问题所采用的技术方案[0013]本发明所涉及的语音识别装置包括:获取部，该获取部对所输入的语音进行数字转换，并作为语音数据获取该数据；语音数据存储部，该语音数据存储部对获取部所获取的语音数据进行存储；多个语音识别部，该多个语音识别部从语音数据存储部所存储的语音数据中检测语音区间，提取出语音区间的语音数据的特征量，基于所提取出的特征量并参照识别词典来进行识别处理；切换部，该切换部对多个语音识别部进行切换；控制部，该控制部对切换部所进行的语音识别部的切换进行控制，以获取切换后的语音识别部的识别结果；以及选择部，该选择部从控制部所获取的识别结果中选择提示给用户的提示对象的识别结果。[0014]发明效果[0015]根据本发明，具有以下效果:即，能正确地提示由不同的语音识别处理所获得的识别结果，并能力图缩短识别处理时间。【专利附图】【附图说明】[0016]图1是表示包括本发明的实施方式I所涉及的语音识别装置的导航装置的结构的框图。[0017]图2是表示实施方式I所涉及的语音识别装置所进行的语音识别处理的流程的流程图。[0018]图3是表示每个语音识别部的识别分值为上位至第2位的识别结果的显示例的图。[0019]图4是表示利用每个语音识别部各自不同的方法所选出的识别结果的显示例的图。[0020]图5是表示本发明的实施方式2所涉及的语音识别装置的结构的框图。[0021]图6是表示本发明的实施方式3所涉及的语音识别装置的结构的框图。[0022]图7是表示实施方式3所涉及的语音识别装置所进行的语音识别处理的流程的流程图。[0023]图8是表示本发明的实施方式4所涉及的语音识别装置的结构的框图。[0024]图9是表示实施方式4所涉及的语音识别装置所进行的语音识别处理的流程的流程图。[0025]图10是表示本发明的实施方式5所涉及的语音识别装置的结构的框图。[0026]图11是表示实施方式5所涉及的语音识别装置所进行的语音识别处理的流程的流程图。【具体实施方式】[0027]下面，为了对本发明进行更加详细的说明，参照附图对本发明的实施方式进行说明。[0028]实施方式1.[0029]图1是表示包括本发明的实施方式I所涉及的语音识别装置的导航装置的结构的框图。在图1中，示出了实施方式I所涉及的导航装置将实施方式I所涉及的语音识别装置应用于搭载在作为移动体的车辆上的车载用导航装置的情况。作为语音识别装置的结构，其包括:语音获取部1、语音数据存储部2、语音识别部3、语音识别切换部4、识别控制部5、识别结果选择部6以及识别结果存储部7，作为进行导航的结构，包括:显示部8、导航处理部9、位置检测部10、地图数据库(DB)11以及输入部12。[0030]语音获取部I是对利用麦克风等输入的规定期间的语音进行模数转换、并作为例如PCM(PulseCodeModulation:脉冲编码调制)格式的语音数据来获取该数据的获取部。语音数据存储部2是对由语音获取部I所获取的语音数据进行存储的存储部。[0031]语音识别部3由例如进行语法型或听写型等不同的语音识别处理的多个语音识别部(以下记载为第一?第M语音识别部)所构成。[0032]第一?第M语音识别部根据各语音识别算法，从语音获取部I所获取的语音数据中检测出属于用户说话内容的语音区间，提取出该语音区间中的语音数据的特征量，基于所提取出的特征量，一边参照识别词典，一边进行识别处理。[0033]语音识别切换部4是根据来自识别控制部5的切换控制信号来对第一?第M语音识别部进行切换的切换部。识别控制部5是对语音识别切换部4所进行的语音识别部的切换进行控制、以获取切换后的语音识别部的识别结果的控制部。识别结果选择部6是从识别控制部5所获取的识别结果中选出要输出的识别结果的选择部。识别结果存储部7是对识别结果选择部6所选择的识别结果进行存储的存储部。[0034]显示部8是显示存储于识别结果存储部7的识别结果或导航处理部9的处理结果的显示部。导航处理部9是进行路线计算、路线引导及地图显示等导航处理的功能结构部。例如，导航处理部9利用位置检测部10所获取的本车的当前位置、实施方式I所涉及的语音识别装置或输入部12所输入的目的地以及地图数据库(DB)11所存储的地图数据，来计算从当前的本车位置到目的地的路线。然后，导航处理部9对通过路线计算获得的路线进行指引引导。另外，导航处理部9利用本车的当前位置及地图DBll所存储的地图数据，将包含本车位置的地图显示于显示部8。[0035]位置检测部10是根据GPS(GlobalPositioningSystem:全球定位系统)电波等的分析结果来获取本车的位置信息(纬度经度)的功能结构部。另外，地图DBll是登录有导航处理部9所使用的地图数据的数据库。地图数据中包括地形图数据、住宅地图数据及道路网络等。输入部12是接受用户所进行的目的地的设定输入或各种操作的功能结构部，例如由搭载在显示部8的画面上的触摸面板等来实现。[0036]下面，对动作进行说明。[0037]图2是表示实施方式I所涉及的语音识别装置所进行的语音识别处理的流程的流程图。首先，语音获取部I对利用麦克风等所输入的规定期间的语音进行Α/D转换，并作为例如PCM格式的语音数据来获取该数据(步骤ST10)。语音数据存储部2对语音获取部I所获取的语音数据进行存储(步骤ST20)。[0038]接着，识别控制部5将变量N初始化为I(步骤ST30)。其中，N是可取I?M的值的变量。然后，识别控制部5向语音识别切换部4输出将语音识别部3切换成第N语音识别部的切换控制信号。语音识别切换部4根据来自识别控制部5的该切换控制信号，将语音识别部3切换成第N语音识别部(步骤ST40)。[0039]第N语音识别部从语音数据存储部2所存储的语音数据中检测出属于用户说话内容的语音区间，提取出该语音区间中的语音数据的特征量，基于该特征量，一边参照识别词典，一边进行识别处理(步骤ST50)。[0040]识别控制部5从第N语音识别部获取识别结果，将该识别结果中的第I位的识别分值(匹配度)与规定阈值进行比较，判定是否在该阈值以上(步骤ST60)。此外，上述规定阈值是用于判定是否切换至其它语音识别部来继续进行识别处理，对第一?第M语音识别部分别设定上述规定阈值。[0041]当第I位的识别分值在上述阈值以上时(步骤ST60是”)，识别结果选择部6从识别控制部5所获取的第N语音识别部的识别结果中、选出要以后述方法来输出的识别结果(步骤ST70)。之后，显示部8显示识别结果选择部6所选择的、存储于识别结果存储部7中的识别结果(步骤ST80)。[0042]另一方面，当第I位的识别分值小于阈值时(步骤ST60否”)，识别结果选择部6从识别控制部5所获取的第N语音识别部的识别结果中、选出要以后述方法来输出的识别结果(步骤ST90)。[0043]接着，识别结果选择部6将所选择的识别结果存储于识别结果存储部7(步骤ST100)。若识别结果选择部6将识别结果存储于识别结果存储部7，则识别控制部5将变量N进行+I递增(步骤ST110)，并判定变量N的值是否超过语音识别部的个数M(步骤ST120)。[0044]在变量N的值超过语音识别部个数M的情况下(步骤ST120是”)，显示部8输出识别结果存储部7所存储的第一~第M语音识别部的识别结果(步骤ST130)。显示部8也可以根据每个语音识别部的识别结果的顺序来输出识别结果。在变量N的值为语音识别部个数M以下的情况下(步骤ST120否”)，返回步骤ST40的处理。由此，利用切换后的语音识别部来重复上述处理。[0045]这里，对步骤ST70和步骤ST90举具体例子来进行说明。[0046]识别结果选择部6从识别控制部5所获取的识别结果中选择识别分值为上位的识别结果。[0047]作为选择方法，例如可以如上所述那样选择识别分值为第I位的识别结果，也可以选择识别控制部5所获取的所有识别结果。[0048]另外，也可以选择从识别分值的上位到X位所包含的识别结果。[0049]此外，还可以选择与第I位的识别分值之差为规定值以下的识别结果。[0050]此外，即使是从识别分值的上位到X位所包含的识别结果，或是与第I位的识别分值之差为规定值以下的识别结果，也可以不选择识别分值小于预定阈值的识别结果。[0051]图3是表示每个语音识别部的识别分值从上位到第2位的识别结果的显示例的图。在图3中，所谓“语音识别处理1”，表示是例如第一语音识别部的识别结果，“语音识别处理2”表示是例如第二语音识别部的识别结果。关于“语音识别处理3”、“语音识别处理4”、……也相同。每个语音识别部的识别分值(匹配度)为上位到第2位的识别结果依次排列并进行显示。[0052]图4是表示利用每个语音识别部各自不同的方法所选择的识别结果的显示例的图。在图4中，关于第一语音识别部(“语音识别处理I”)的识别结果，选择识别分值为上位到第2位的识别结果并进行显示。另外，关于第2语音识别部(“语音识别处理2”)，选择所有的识别结果并进行显示。[0053]这样，在步骤ST70和步骤ST90中，每个语音识别部对识别结果的选择方法也可以不同。[0054]用户例如利用输入部12来选择显示于显示部8的识别结果，从而从识别结果存储部7读取自身所说的目的地的识别结果，并将其输出至导航处理部9。导航处理部9例如利用位置检测部10所获取的本车的当前位置、从识别结果存储部7读取的目的地的识别结果以及地图DBll所存储的地图数据，来计算从当前的本车位置到目的地的路线，并对所获得的路线进行指引引导。[0055]如上所述，根据本实施方式1，包括:语音获取部1，该语音获取部I对所输入的语音进行数字转换，并作为语音数据来获取该数据；语音数据存储部2，该语音数据存储部2对语音获取部I所获取的语音数据进行存储；第一~第M语音识别部，该第一~第M语音识别部从语音数据存储部2所存储的语音数据中检测出语音区间，提取出语音区间的语音数据的特征量，基于所提取出的特征量并参照识别词典来进行识别处理；语音识别切换部4，该语音识别切换部4对第一~第M语音识别部进行切换；识别控制部5，该识别控制部5对语音识别切换部4所进行的语音识别部的切换进行控制，以获取切换后的语音识别部的识别结果；以及识别结果选择部6，该识别结果选择部6从识别控制部5所获取的识别结果中、选择出提示给用户的提示对象的识别结果。通过采用上述结构，即使在由于是由不同的语音识别处理所得的识别结果而无法单纯比较识别结果各自的识别分值、从而无法决定识别分值最高的识别结果的情况下，也能将各语音识别处理所得的识别结果提示给用户。[0056]实施方式2.[0057]图5是表示本发明的实施方式2所涉及的语音识别装置的结构的框图。在图5中，实施方式2所涉及的语音识别装置包括:语音获取部1、语音数据存储部2、语音识别部3、语音识别切换部4、识别控制部5、识别结果选择部6A、识别结果存储部7、以及识别结果选择方法变更部13。识别结果选择部6A根据来自识别结果选择方法变更部13的选择方法控制信号，从识别控制部5所获取的识别结果中选择要输出的识别结果。识别结果选择方法变更部13是对第一~第M语音识别部的每一个、分别接受识别结果选择部6A对识别结果的选择方法的指定、并将变更为用户所指定的选择方法的选择方法控制信号输出至识别结果选择部6A的功能结构部。此外，在图5中，对与图1相同的结构要素标注相同标号并省略说明。[0058]下面，对动作进行说明。[0059]识别结果选择方法变更部13将识别结果的选择方法的指定用画面显示于显示部8，并提供接受用户的指定的HMI(HumanMachineInterface:人机接口)。[0060]例如，显示通过用户操作来将第一~第M语音识别部分别与选择方法对应的指定用画面。由此，对于识别结果选择部6A，预先对每个语音识别部设定选择方法。用户可以根据喜好来指定每个语音识别部的选择方法，另外，也可以根据语音识别装置的使用状况来对每个语音识别部指定各自的选择方法。此外，在对每个语音识别部预先设定有重要度的情况下，也可以以多选择重要度较高的语音识别部的识别结果的方式来指定选择方法。此外，对于语音识别部也可以不指定选择方法，即指定不输出该语音识别部的识别结果。[0061]实施方式2所涉及的语音识别装置的语音识别与上述实施方式I所示的图2的流程图相同。但是，在步骤ST70和步骤ST90中，识别结果选择部6A利用识别结果选择方法变更部13所设定的选择方法来选择识别结果。例如，对于识别控制部5从第一语音识别部所获取的识别结果，选择识别分值为第I位的识别结果，对于从第二语音识别部所获取的识别结果，选择所有的识别结果。这样，在实施方式2中，用户能决定每个语音识别部的识别结果的选择方法。其他处理与上述实施方式I相同。[0062]如上所述，根据本实施方式2，包括识别结果选择方法变更部13，该识别结果选择方法变更部13接受从识别控制部5所获取的识别结果中选择提示给用户的提示对象的识别结果的选择方法的指定，并利用所指定的选择方法对识别结果选择部6A的识别结果的选择方法进行变更。通过采用上述结构，用户能指定识别结果选择部6A对识别结果的选择方法，例如能重点提示根据使用状况认定为最合适的语音识别处理的结果。[0063]实施方式3.[0064]图6是表示本发明的实施方式3所涉及的语音识别装置的结构的框图。如图6所示，实施方式3所涉及的语音识别装置包括:语音获取部1、语音数据存储部2A、语音识别部3、语音识别切换部4、识别控制部5、识别结果选择部6、识别结果存储部7以及语音区间检测部14。此外，在图6中，对与图1相同的结构要素标注相同标号并省略说明。[0065]语音数据存储部2A是对由语音区间检测部14所检测到的语音区间的语音数据进行存储的存储部。另外，语音区间检测部14是从语音获取部I所获取的语音数据中检测出属于用户说话内容的语音区间中的语音数据的语音区间检测部。此外，第一~第M语音识别部从存储于语音数据存储部2A的语音数据中提取出特征量，基于该特征量，一边参照识别词典，一边进行识别处理。这样，在实施方式3中，第一~第M语音识别部不分别单独实施语音区间检测处理。[0066]下面，对动作进行说明。[0067]图7是表示实施方式3所涉及的语音识别装置所进行的语音识别处理的流程的流程图。首先，语音获取部I对利用麦克风等所输入的规定期间的语音进行Α/D转换，并作为例如PCM格式的语音数据来获取该数据(步骤ST210)。接着，语音区间检测部14从语音获取部I所获取的语音数据中检测出属于用户说话内容的区间的语音数据(步骤ST220)。语音数据存储部2A对由语音区间检测部14所检测到的语音数据进行存储(步骤ST230)。[0068]接着，识别控制部5将变量N初始化为I(步骤ST240)。然后，识别控制部5向语音识别切换部4输出将语音识别部3切换成第N语音识别部的切换控制信号。语音识别切换部4根据来自识别控制部5的该切换控制信号，将语音识别部3切换成第N语音识别部(步骤ST250)。[0069]第N语音识别部从存储于语音数据存储部2A中的每个语音区间的语音数据中提取出特征量，基于该特征量，一边参照识别词典，一边进行识别处理(步骤ST260)。以下的步骤ST270至步骤ST340的处理与上述实施方式I的图2中的步骤ST60至步骤ST130的处理相同，因此省略说明。[0070]如上所述，根据实施方式3，包括:语音获取部1，该语音获取部I对所输入的语音进行数字转换，并作为语音数据来获取该数据；语音区间检测部14，该语音区间检测部14从语音获取部I所获取的语音数据中检测出属于用户说话内容的语音区间；语音数据存储部2A，该语音数据存储部2A对语音区间检测部14所检测到的每个语音区间的语音数据进行存储；第一~第M语音识别部，该第一~第M语音识别部提取出语音数据存储部2A所存储的语音数据的特征量，基于所提取出的特征量并参照识别词典来进行识别处理；语音识别切换部4，该语音识别切换部4对第一~第M语音识别部进行切换；识别控制部5，该识别控制部5对语音识别切换部4所进行的语音识别部的切换进行控制，以获取切换后的语音识别部的识别结果；以及识别结果选择部6，该识别结果选择部6从识别控制部5所获取的识别结果中选择提示给用户的提示对象的识别结果。[0071]通过采用这样的结构，由于第一~第M语音识别部不实施语音区间检测，因此，能缩短识别处理所需的时间。[0072]实施方式4.[0073]图8是表示本发明的实施方式4所涉及的语音识别装置的结构的框图。如图8所示，实施方式4所涉及的语音识别装置包括:语音获取部1、语音数据存储部2、语音识别部3A、语音识别切换部4、识别控制部5、识别结果选择部6以及识别结果存储部7。此外，在图8中，对与图1相同的结构要素标注相同标号并省略说明。[0074]在语音识别部3A中，第一~第M语音识别部利用各个语音识别算法中不同识别精度的语音识别方法来实施识别处理。即，在第N(N=I~M)语音识别部中，实施不同精度的语音识别方法，对于该语音识别方法，该语音识别部的语音识别算法不变，但影响该语音识别精度的变量发生了变更。例如，在各语音识别部中，用识别精度较低但处理时间较短的语音识别方法N(a)、以及识别精度较高但处理时间较长的语音识别方法N(b)来实施识别处理。此外，作为影响语音识别精度的变量，可以举出提取语音区间的特征量时的帧周期、声响模型的混合分布数、声响模型的模型数、或者它们的组合等。[0075]通过下述方法来规定识别精度较低的语音识别方法，即在上述变量中，通过使提取语音区间的特征量时的帧周期大于规定值、使声响模型的混合分布数少于规定值、使声响模型的模型数少于规定值、或者这些措施的组合来进行规定。[0076]另外，与此相反，通过下述方法来规定识别精度较高的语音识别方法，即使提取语音区间的特征量时的帧周期缩短至上述规定值以下、使声响模型的混合分布数增加至上述规定值以上、使声响模型的模型数增加至上述规定值以上、或利用这些措施的组合来进行规定。[0077]此外，第一~第M语音识别部中影响语音识别方法的识别精度的上述变量，也可以由用户进行适当设定来决定识别精度。[0078]下面，对动作进行说明。[0079]图9是表示实施方式4所涉及的语音识别装置所进行的语音识别处理的流程的流程图。首先，语音获取部I对利用麦克风等所输入的规定期间的语音进行A/D转换，并作为例如PCM格式的语音数据来获取该数据以(步骤ST410)。语音数据存储部2对语音获取部I所获取的语音数据进行存储(步骤ST420)。[0080]接着，识别控制部5将变量N初始化为I(步骤ST430)。此外，N是可取I~M的值的变量。然后，识别控制部5向语音识别切换部4输出将语音识别部3A切换成第N语音识别部的切换控制信号。语音识别切换部4根据来自识别控制部5的该切换控制信号，将语音识别部3A切换成第N语音识别部(步骤ST440)。[0081]第N语音识别部利用识别精度较低的语音识别方法，从语音数据存储部2所存储的语音数据中检测属于用户说话的语音区间，提取出该语音区间的特征量，基于该特征量，一边参照识别词典，一边进行识别处理(步骤ST450)。接着，若识别结果选择部6将识别结果存储于识别结果存储部7，则识别控制部5将变量N进行十I递增(步骤ST460)，并判定变量N的值是否超过语音识别部的个数M(步骤ST470)。这里，当变量N的值为语音识别部个数M以下时(步骤ST470否”)，返回步骤ST440的处理。利用切换后的语音识别部来重复上述处理。[0082]另外，当变量N超过语音识别部的个数M时(步骤ST470是”)，识别控制部5从第N语音识别部获取识别结果，将识别结果中的第I位的识别分值(匹配度)与规定的阈值进行比较，判定是否存在该阈值以上的K个语音识别部(步骤ST480)。由此，从第一~第M语音识别部中、筛选出可利用识别精度较低的语音识别方法获得第I位的识别分值为阈值以上的识别结果的K个语音识别部L(I)~L(K)。[0083]识别控制部5将变量η初始化为I(步骤ST490)。此外，η是可取I~K的值的变量。[0084]接着，识别控制部5将切换成步骤ST480中所选择的语音识别部L(I)~L(K)中的语音识别部L(η)的切换控制信号输出至语音识别切换部4。语音识别切换部4根据来自识别控制部5的该切换控制信号，将语音识别部3Α切换成语音识别部L(η)(步骤ST500)。[0085]语音识别部L(η)利用识别精度较高的语音识别方法，从语音数据存储部2所存储的语音数据中检测出属于用户说话内容的语音区间，提取出该语音区间中的语音数据的特征量，基于该特征量，一边参照识别词典，一边进行识别处理(步骤ST510)。识别控制部5在每次语音识别部L(η)的识别处理结束时，都获取其识别结果。[0086]接着，识别结果选择部6以与上述实施方式I相同的方法(图2的步骤ST70和步骤ST90)，从识别控制部5所获取的第N语音识别部的识别结果中选择要输出的识别结果(步骤ST520)。识别结果选择部6将所选择的识别结果存储于识别结果存储部7(步骤ST530)。[0087]若识别结果选择部6将识别结果存储于识别结果存储部7，则识别控制部5将变量η进行+I递增(步骤ST540)，并判定变量η的值是否超过步骤ST480中所选出的语音识别部的个数即K(步骤ST550)。这里，在变量η的值为步骤ST480中所选出的语音识别部的个数K以下的情况下(步骤ST550否”)，返回步骤ST500的处理。由此，利用切换后的语音识别部来重复上述处理。[0088]在变量η的值超过步骤ST480中所选出的语音识别部的个数K的情况下(步骤ST550是”)，显示部8输出识别结果存储部7所存储的语音识别部L(I)~L(K)的识别结果(步骤ST560)。显示部8也可以根据语音识别部L(I)~L(K)的识别结果的顺序来输出识别结果。[0089]如上所述，根据本实施方式4，语音识别部3Α的第一~第M语音识别部能进行精度不同的识别处理，识别控制部5—边基于识别结果的识别分值对语音识别部筛选出进行识别处理的语音识别部，一边以使得精度呈阶梯状提高的方式使所述语音识别部进行识别处理。利用这样的结构，例如能将识别精度较低但处理时间较短的语音识别方法、与识别精度较高但处理时间较长的语音识别方法进行组合，在多个语音识别处理中以精度较低的方法来进行识别，对其中识别分值较高的语音识别处理以精度较高的方法来进行精密的识别。由此，无需对所有的识别处理进行精密的识别，因此，能缩短整个识别处理的时间。[0090]实施方式5.[0091]图10是表示本发明的实施方式5所涉及的语音识别装置的结构的框图。如图10所示，实施方式5所涉及的语音识别装置包括:语音获取部1、语音数据存储部2、语音识别部3、语音识别切换部4、识别控制部5以及识别结果确定部15。识别结果确定部15是接受用户基于显示部8所显示的识别结果候选项所进行的识别结果的选择、并将所选出的识别结果候选项确定为最终的识别结果的确定部。例如，识别结果确定部15将识别结果的选择用画面显示于显示部8的画面上，并提供ΗΜΙ，该HMI用于基于识别结果选择用画面，利用触摸面板或硬键、按钮等输入装置，来选择识别结果候选项。此外，在图10中，对与图1相同的结构要素标注相同标号并省略说明。[0092]下面，对动作进行说明。[0093]图11是表示实施方式5所涉及的语音识别装置所进行的语音识别处理的流程的流程图。首先，语音获取部I对利用麦克风等所输入的规定期间的语音进行A/D转换，并作为例如PCM格式的语音数据来获取该数据(步骤ST610)。语音数据存储部2对语音获取部I所获取的语音数据进行存储(步骤ST620)。[0094]接着，识别控制部5将变量N初始化为I(步骤ST630)。此外，N是可取I?M的值的变量。然后，识别控制部5向语音识别切换部4输出将语音识别部3切换成第N语音识别部的切换控制信号。语音识别切换部4根据来自识别控制部5的该切换控制信号，将语音识别部3切换成第N语音识别部(步骤ST640)。[0095]第N语音识别部从语音数据存储部2所存储的语音数据中检测出属于用户说话的语音区间，从而提取出该语音区间中的语音数据的特征量，基于该特征量，一边参照识别词典，一边进行识别处理(步骤ST650)。识别控制部5从第N语音识别部中获取识别结果，并将其输出至显示部8。从识别控制部5输入识别结果后，显示部8根据识别结果确定部15的控制，将所输入的识别结果作为识别结果候选项来进行显示(步骤ST660)。[0096]显示部8显示识别结果候选项后，识别结果确定部15处于等待用户选择识别结果的选择等待状态，并判定用户是否对显示部8所显示的识别结果候选项进行了选择(步骤ST670)。这里，若用户对识别结果候选项进行了选择(步骤ST670是”)，则识别结果确定部15将用户所选择的识别结果候选项确定为最终的识别结果(步骤ST680)。由此，识别处理结束。[0097]另一方面，若用户未对识别结果候选项进行选择(步骤ST670否”)，则识别控制部5将变量N进行+I递增(步骤ST690)，并判定变量N的值是否超过语音识别部的个数M(步骤ST700)。[0098]在变量N的值超过语音识别部个数M的情况下(步骤ST700是”)，识别处理结束。另外，在变量N的值为语音识别部个数M以下的情况下(步骤ST700否”)，返回步骤ST640的处理。由此，利用切换后的语音识别部来重复上述处理。[0099]如上所述，根据实施方式5，包括:语音获取部1，该语音获取部I对所输入的语音进行数字转换，并作为语音数据获取该数据；语音数据存储部2，该语音数据存储部2对语音获取部I所获取的语音数据进行存储；第一?第M语音识别部，该第一?第M语音识别部从语音数据存储部2所存储的语音数据中检测语音区间，提取出语音区间的语音数据的特征量，基于所提取出的特征量并参照识别词典来进行识别处理；语音识别切换部4，该语音识别切换部4对第一?第M语音识别部进行切换；识别控制部5，该识别控制部5对语音识别切换部4所进行的语音识别部的切换进行控制，以获取切换后的语音识别部的识别结果；以及识别结果确定部15，该识别结果确定部15接受用户从识别控制部5所获取的提示给用户的识别结果中、作出的对识别结果的选择，并将用户所选择的识别结果确定为最终的识别结果。利用这样的结构，能在进行所有识别处理前将用户所选择并指定的识别结果确定为最终的识别结果，因此，能缩短整个识别处理的时间。[0100]此外，在上述实施方式I?5中，示出了用显示部8来显示识别结果的情况，但不一定局限于用显示部8的画面显示来向用户提示识别结果。例如，也可以利用扬声器等语音输出装置来对识别结果进行语音指弓I。[0101]另外，上述实施方式I中示出了将本发明所涉及的导航装置应用到车载用导航装置的情况，但除了车载用途以外，也可以应用于移动电话终端或移动信息终端(PDA:PersonalDigitalAssistance:个人数字助理)。[0102]此外，也可以应用于车辆、铁路、船舶或飞机等移动体中由人携带使用的PND(PortableNavigationDevice:便携式导航装置)等中。[0103]此外，除了上述实施方式I以外，也可以将上述实施方式2?5所涉及的语音识别装置应用于导航装置。[0104]此外，本发明可以在该发明的范围内对各实施方式进行自由组合，或对各实施方式的任意结构要素进行变形、或在各实施方式中省略任意的结构要素。[0105]工业上的实用性[0106]本发明所涉及的语音识别装置能正确地提示由不同的语音识别处理所获得的识另IJ结果，并能力图缩短识别处理时间，因此，适用于要求识别处理的迅速性和识别结果的正确性的车载用导航装置的语音识别。[0107]标号说明[0108]I语音获取部[0109]2、2A语音数据存储部[0110]3、3A语首识别部[0111]4语音识别切换部[0112]5识别控制部[0113]6、6A识别结果选择部[0114]7识别结果存储部[0115]8显示部[0116]9导航处理部[0117]10位置检测部[0118]11地图数据库(DB)[0119]12输入部[0120]13识别结果选择方法变更部[0121]14语音区间检测部[0122]15识别结果确定部【权利要求】1.一种语音识别装置，其特征在于，包括:获取部，该获取部对所输入的语音进行数字转换，并作为语音数据来获取该数据；语音数据存储部，该语音数据存储部对所述获取部所获取的语音数据进行存储；多个语音识别部，该多个语音识别部从所述语音数据存储部所存储的语音数据中检测语音区间，提取出所述语音区间的语音数据的特征量，基于所提取出的所述特征量并参照识别词典来进行识别处理；切换部，该切换部对所述多个语音识别部进行切换；控制部，该控制部对所述切换部所进行的语音识别部的切换进行控制，以获取切换后的语音识别部的识别结果；以及选择部，该选择部从所述控制部所获取的识别结果中选择提示给用户的提示对象的识别结果。2.一种语音识别装置，其特征在于，包括:获取部，该获取部对所输入的语音进行数字转换，并作为语音数据来获取该数据；语音区间检测部，该语音区间检测部从所述获取部所获取的语音数据中检测出属于用户说话内容的语音区间；语音数据存储部，该语音数据存储部对所述语音区间检测部所检测到的每个语音区间的语音数据进行存储；多个语音识别部，该多个语音识别部提取出所述语音数据存储部所存储的语音数据的特征量，基于所提取出的所述特征量并参照识别词典来进行识别处理；切换部，该切换部对所述多个语音识别部进行切换；控制部，该控制部对所述切换部所进行的语音识别部的切换进行控制，以获取切换后的语音识别部的识别结果；以及选择部，该选择部从所述控制部所获取的识别结果中选择提示给用户的提示对象的识别结果。3.一种语音识别装置，其特征在于，包括:获取部，该获取部对所输入的语音进行数字转换，并作为语音数据来获取该数据；语音数据存储部，该语音数据存储部对所述获取部所获取的语音数据进行存储；多个语音识别部，该多个语音识别部从所述语音数据存储部所存储的语音数据中检测语音区间，提取出所述语音区间的语音数据的特征量，基于所提取出的所述特征量并参照识别词典来进行识别处理；切换部，该切换部对所述多个语音识别部进行切换；控制部，该控制部对所述切换部所进行的语音识别部的切换进行控制，以获取切换后的语音识别部的识别结果；以及确定部，该确定部接受用户从所述控制部所获取的提示给用户的识别结果中、作出的对识别结果的选择，并将用户所选择的识别结果确定为最终的识别结果。4.如权利要求1或2所述的语音识别装置，其特征在于，所述语音识别装置包括变更部，该变更部接受对从所述控制部所获取的识别结果中选择提示给用户的提示对象的识别结果的选择方法的指定，并利用所指定的选择方法来变更所述选择部对识别结果的选择方法。5.如权利要求1至4的任一项所述的语音识别装置，其特征在于，所述多个语音识别部均能进行精度不同的识别处理，所述控制部一边基于识别结果的识别分值来对所述语音识别部筛选出进行识别处理的语音识别部，一边以使得精度呈阶梯状提高的方式使所述语音识别部进行识别处理。6.一种导航装置，其特征在于，包括如权利要求1至5的任一项所述的语音识别装置，所述导航装置利用所述语音识别部的识别结果来进行导航处理。【文档编号】G10L15/32GK103650034SQ201180071882【公开日】2014年3月19日申请日期:2011年7月5日优先权日:2011年7月5日【发明者】石井纯,山崎道弘申请人:三菱电机株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：石井纯;山崎道弘
技术所有人：三菱电机株式会社
我是此专利的发明人