语音识别装置、具有语音识别装置的车辆及其控制方法_5

文档序号：9598804阅读：来源：国知局

，例如，0.8，并且将对应于相对较短名称的第二候选组的第二权重值设置成较大的值，例如，1.2。
[0179]此外，如果讲话长度长于或者等于例如1200ms，则语音识别装置100可将对应于相对较长名称的第一候选组的第一权重值设置成较高的值，例如，1.5，并且将与相对较短名称对应的第二候选组的第二权重值设置成较小的值，例如，0.9。通过大数据分析可获取可靠性权重值。
[0180]在操作S653至S655中，语音识别装置100可将可靠性权重值分别施加给第一至第三候选组。在图14中，示出了同时将可靠性权重值分别施加给第一至第三候选组的实例，然而，语音识别装置100可顺次将可靠性权重值施加给第一至第三候选组。
[0181 ] 再次参考图9，在操作S656中，语音识别装置100可根据可靠性程度布置和显示第一至第三候选组。语音识别装置100可将已施加有可靠性权重值的第一至第三候选组进行组合以创建组合候选组，并且根据可靠性程度排列组合的候选组。
[0182]然后，语音识别装置100可在显示单元220上显示组合候选组中具有高度可靠性的候选项。此时，显示单元220上所显示的候选项可以是具有高于预定标准的可靠性程度的候选项；然而，候选项不局限于此。例如，如图16所示，语音识别装置100可显示通过N条最佳搜索而查找到的具有最高可靠性程度的5个候选项。
[0183]再次参考图9，在操作S670中，VAD装置250可向用户所选择的电话号码拨打电话。S卩，VAD装置250可向对应于用户所选择的名称的电话号码拨打电话。
[0184]图17是用于描述根据本公开的实施方式的在通过根据讲话者的讲话长度施加可靠性权重值搜索电话号码时，识别速率提高的示图。
[0185]图17示出了当平均信噪比(SNR)为lldb时关于包括1000个电话号码的电话簿，对10个讲话者的语音识别的结果。
[0186]如图17所示，通过根据讲话长度施加权重值，单音节的识别速率增加11%以上，并且通过将名称分割成名和姓所创建的分割名称的识别速率增加55.4%。
[0187]因此，通过提供使用根据人的讲话长度的可靠性权重值的语音识别装置，可以改进包括语音识别装置的车辆、以及控制车辆的方法以及语音识别速率的方法。
[0188]具体地，可以改进诸如短于预定长度的单音节等语音的识别速率。
[0189]尽管已经示出并且描述了本公开的数个实施方式，然而，本领域技术人员应当认识到，在不背离本公开的原理和精神的前提下，可以对这些实施方式做出改变，权利要求及其等同物限定本公开的范围。
【主权项】
1.一种语音识别装置，包括: 上下文模型，通过对识别目标上下文进行建模来创建所述上下文模型；和语音识别器，被配置为基于声学模型和所述上下文模型创建对应于所接收的语音信号的候选组，并且将高可靠性权重值施加给具有与讲话长度对应的音节长度的候选项。2.根据权利要求1所述的语音识别装置，进一步包括显示单元，所述显示单元被配置为显示其中根据可靠性程度排列一个或者多个候选项的所述候选组。3.根据权利要求1所述的语音识别装置，其中，如果所述讲话长度短于或者等于阈值长度，则所述语音识别器将高可靠性权重值施加给与短于或者等于参考音节长度的音节长度对应的候选项。4.根据权利要求1所述的语音识别装置，进一步包括模型创建器，所述模型创建器被配置为根据音节长度对所述识别目标上下文进行分类并且创建针对各个音节长度的所述上下文模型。5.根据权利要求4所述的语音识别装置，其中，所述语音识别器创建用于针对音节长度而创建的上下文模型的候选组，并且根据对应于所述讲话长度的所述音节长度分别将不同的权重值施加给所述候选组。6.根据权利要求1所述的语音识别装置，其中，所述识别目标上下文是电话簿。7.—种车辆，包括: 上下文模型，通过对电话簿中包括的每个名称进行建模来创建所述上下文模型；和语音识别器，被配置为基于声学模型和所述上下文模型创建对应于所接收的语音信号的电话号码候选组，并且将根据讲话长度确定的不同可靠性权重值分别施加给所述电话号码候选组中的电话号码候选项。8.根据权利要求7所述的车辆，进一步包括显示单元，被配置为显示其中根据可靠性程度排列一个或者多个电话号码候选项的所述电话号码候选组。9.根据权利要求7所述的车辆，其中，所述语音识别器施加所述可靠性权重值，使得所述电话号码候选组中的具有对应于所述讲话长度的音节长度的电话号码候选项具有高度可靠性。10.根据权利要求7所述的车辆，其中，如果所述讲话长度短于阈值长度，则所述语音识别器施加所述可靠性权重值，以使得所述电话号码候选组中的单音节的电话号码候选项具有高度可靠性。11.根据权利要求7所述的车辆，其中，如果所述讲话长度长于阈值长度，则所述语音识别器施加所述可靠性权重值，以使得所述电话号码候选组中的单音节的电话号码候选项具有低度可靠性。12.根据权利要求7所述的车辆，进一步包括模型创建器，被配置为根据每个名称的音节长度对所述电话簿进行分类并且创建用于各个音节长度的上下文模型。13.根据权利要求12所述的车辆，其中，所述模型创建器将所述名称分割成名和姓以创建分割的上下文模型。14.根据权利要求12所述的车辆，其中，所述模型创建器将所述名称转换成音素并且将所述名称建模成语音网格形式。15.根据权利要求12所述的车辆，其中，所述语音识别器从各个上下文模型创建对应于所述语音信号的电话号码候选组，并且将高权重值施加给具有对应于所述讲话长度的音节长度的电话号码候选组。16.根据权利要求7所述的车辆，其中，所述语音识别器基于所述声学模型识别所述语音信号的音素串，并且在所述上下文模型中搜索对应于识别的音素串的一个或者多个电话号码候选项，以创建所述电话号码候选组。17.根据权利要求7所述的车辆，进一步包括讲话长度测量单元，被配置为从所述语音信号检测讲话开始BoS和讲话结束EoS并且基于所述BoS和所述EoS测量所述讲话长度。18.—种车辆的控制方法，包括: 从通过对电话簿中包括的每个名称进行建模所创建的上下文模型创建与所接收的语音信号对应的电话号码候选组；根据用户的讲话长度确定可靠性权重值；并且根据电话号码候选项的音节长度施加所述可靠性权重值。19.根据权利要求18所述的控制方法，其中，确定所述可靠性权重值包括基于讲话开始BoS与讲话结束EoS之间的差测量所述讲话长度。20.根据权利要求18所述的控制方法，其中，确定所述可靠性权重值包括确定所述可靠性权重值以使得具有对应于所述讲话长度的音节长度的电话号码候选项具有高度可靠性。21.根据权利要求18所述的控制方法，其中，确定所述可靠性权重值包括确定所述可靠性权重值，以使得如果所述讲话长度短于或者等于阈值长度，则单音节的电话号码候选项具有高度可靠性。22.根据权利要求18所述的控制方法，其中，确定所述可靠性权重值包括确定所述可靠性权重值，以使得如果所述讲话长度长于或者等于阈值长度则单音节的电话号码候选项具有低度可靠性。23.根据权利要求18所述的控制方法，其中，创建所述电话号码候选组包括: 从所述语音信号检测特征向量；并且根据所述特征向量从声学模型识别所述语音信号的音素串。24.根据权利要求23所述的控制方法，其中，创建所述电话号码候选组包括基于关于所述音素串的可靠性程度创建所述电话号码候选组。25.根据权利要求23所述的控制方法，其中，所述电话号码候选组具有高于或者等于关于所述音素串的预定标准的可靠性程度。26.根据权利要求18所述的控制方法，其中，施加所述可靠性权重值包括: 根据可靠性程度排列所述电话号码候选组中的一个或者多个电话号码候选项；并且显示具有根据所述可靠性程度排列的所述电话号码候选项的所述电话号码候选组。27.根据权利要求18所述的控制方法，进一步包括: 接收对应于用户讲话的语音信号；并且对所述语音信号进行预处理。28.根据权利要求18所述的控制方法，进一步包括根据名称长度对所述电话簿进行分类并且创建用于所述名称长度中的每个的上下文模型。29.根据权利要求28所述的控制方法，其中，创建所述上下文模型包括:将每个名称转换成音素串；并且基于所述音素串创建语音网格。30.一种车辆，包括: 多个上下文模型，通过根据名称长度对电话簿进行分类创建所述多个上下文模型；候选组搜索单元，被配置为从相应上下文模型创建对应于所接收的语音信号的上下文候选组；权重施加单元，被配置为将不同的可靠性权重值分别施加给所述上下文候选组，以使得从对应于用户的讲话长度的上下文模型所创建的上下文候选组具有高度可靠性；以及显示单元，被配置为根据可靠性程度排列和显示施加了所述可靠性权重值的所述上下文候选组。
【专利摘要】本发明公开了语音识别装置、具有语音识别装置的车辆及其控制方法。该语音识别装置，包括：上下文模型，通过为识别目标上下文建模而创建上下文模型；和语音识别器，语音识别器被配置为基于声学模型和上下文模型创建对应于所接收的语音信号的候选组，并且将高可靠性权重值施加给具有对应于讲话长度的音节的长度的候选项。
【IPC分类】G10L15/187, G10L15/26
【公开号】CN105355202
【申请号】CN201410844441
【发明人】房圭燮
【申请人】现代自动车株式会社, 起亚自动车株式会社
【公开日】2016年2月24日
【申请日】2014年12月30日
【公告号】US20160057261

完整全部详细技术资料下载

当前第5页1 2 3 4 5