语音识别装置、具有语音识别装置的车辆及其控制方法

文档序号：9598804阅读：478来源：国知局

语音识别装置、具有语音识别装置的车辆及其控制方法
【专利说明】语音识别装置、具有语音识别装置的车辆及其控制方法
[0001]相关申请的交叉引用
[0002]本申请要求于2014年8月22日提交给韩国知识产权局的韩国专利申请第2014-0109822号的权益，通过引用将其所公开的内容结合于此。
技术领域
[0003]本公开的实施方式涉及一种语音识别装置、具有语音识别装置的车辆以及控制车辆的方法。
【背景技术】
[0004]通常，当驾驶员在驾驶过程中使用蜂窝电话打电话时，驾驶员应在用其手握持蜂窝电话的同时执行若干次按压按钮的操作，并且然后，将蜂窝电话放到其耳朵上以与另一方通话。
[0005]S卩，当驾驶员在驾驶过程中打电话时，尽管驾驶员不会同时使其双手脱离方向盘，但驾驶员必须使其一只手脱离方向盘以握持蜂窝电话。
[0006]在这种情况下，驾驶员的视野变窄并且由此不能看到车辆周围的行人，可能出现摇晃，并且踩踏制动器的反应速度也变慢，从而导致交通事故增加。
[0007]为了克服这些问题，已经开发并且广泛使用了免提设备或者蓝牙设备。免提设备或者蓝牙设备收集驾驶员的语音，以对与驾驶员的通信执行语音识别，将识别的语音传输至蜂窝电话，并且通过扬声器输出由蜂窝电话接收的另一方的语音。然而，为了拨打或者应答电话，驾驶员仍必须手动操纵蜂窝电话。
[0008]因此，用于利用语音应答电话或者利用语音进行特定电话号码的呼叫的语音识别技术经常应用于车辆。

【发明内容】

[0009]因此，本公开的一方面提供一种用于根据人的讲话长度施加可靠性权重值的语音识别装置、包括语音识别装置的车辆、以及控制车辆的方法。
[0010]本公开的其他方面将在下面的描述中进行部分阐述，并且部分从所述描述中是显而易见的或通过对本公开的实践获悉的。
[0011]根据本公开的一方面，一种语音识别装置包括:上下文模型，通过为识别目标上下文建模创建上下文模型；和语音识别器，语音识别器被配置为基于声学模型和上下文模型创建对应于接收的语音信号的候选组，并且将高可靠性权重值施加给具有对应于讲话长度的音节长度的候选项。
[0012]语音识别装置可进一步包括显示单元，显示单元被配置为显示其中根据可靠性程度排列一个或者多个候选项的候选组。
[0013]语音识别装置可进一步包括模型创建器，模型创建器被配置为根据音节长度对识别目标上下文进行分类，并且创建用于各个音节长度的上下文模型。
[0014]语音识别器可创建用于为音节长度创建的上下文模型的候选组，并且根据对应于讲话长度的音节长度分别将不同的权重值施加给候选组。
[0015]如果讲话长度短于或者等于阈值长度，则语音识别器可将高可靠性权重值施加给对应于短于或者等于参考音节长度的音节长度的候选项。
[0016]根据本公开的另一方面，一种车辆包括:上下文模型，通过为电话簿中包括的每个名称建模创建上下文模型；和语音识别器，语音识别器被配置为基于声学模型和上下文模型创建对应于接收的语音信号的电话号码候选组，并且将根据讲话长度确定的不同可靠性权重值分别施加给电话号码候选组中的电话号码候选项。
[0017]车辆可进一步包括显示单元，显示单元被配置为显示其中根据可靠性程度排列一个或者多个电话号码候选项的电话号码候选组。
[0018]语音识别器可施加可靠性权重值以使得电话号码候选组中具有对应于讲话长度的音节长度的电话号码候选项具有高度可靠性。
[0019]如果讲话长度短于阈值长度，则语音识别器可施加可靠性权重值使得电话号码候选组中的单音节的电话号码候选项具有高度可靠性。
[0020]如果讲话长度长于阈值长度，则语音识别器可施加可靠性权重值使得电话号码候选组中的单音节的电话号码候选项具有低度可靠性。
[0021]车辆可进一步包括模型创建器，模型创建器被配置为根据每个名称的音节长度对电话簿进行分类并且创建用于各个音节长度的上下文模型。
[0022]模型创建器可将名称分割成名和姓以创建分割的上下文模型。
[0023]模型创建器可将名称转换成音素并且将名称建模成语音网格形式。
[0024]语音识别器可从各个上下文模型创建对应于语音信号的电话号码候选组，并且将高权重值施加给具有对应于讲话长度的音节长度的电话号码候选组。
[0025]语音识别器可基于声学模型识别语音信号的音素串，并且在上下文模型中搜索对应于识别的音素串的一个或者多个电话号码候选项，以创建电话号码候选组。
[0026]车辆可进一步包括讲话长度测量单元，讲话长度测量单元被配置为从语音信号中检测讲话开始(BoS)和讲话结束(EoS)，并且基于BoS和EoS测量讲话长度。
[0027]根据本公开的另一方面，一种车辆的控制方法包括:从通过为电话簿中包括的每个名称建模而创建的上下文模型创建对应于接收的语音信号的电话号码候选项；并且根据用户的讲话长度确定可靠性权重值；并且根据电话号码候选项的音节长度施加可靠性权重值。
[0028]确定可靠性权重值可包括基于讲话开始(BoS)与讲话结束(EoS)之间的差测量讲话长度。
[0029]确定可靠性权重值可包括确定可靠性权重值以使得具有对应于讲话长度的音节长度的电话号码候选项具有高度可靠性。
[0030]确定可靠性权重值可包括确定可靠性权重值以使得如果讲话长度短于或者等于阈值长度则单音节的电话号码候选项具有高度可靠性。
[0031]确定可靠性权重值可包括确定可靠性权重值以使得如果讲话长度长于或者等于阈值长度则单音节的电话号码候选项具有低度可靠性。
[0032]创建电话号码候选组可包括:从语音信号检测特征向量；并且根据特征向量从声学模型识别语音信号的音素串。
[0033]创建电话号码候选组可包括:基于关于音素串的可靠性长度创建电话号码候选组。
[0034]电话号码候选组可具有高于或者等于关于音素串的预定标准的可靠性程度。
[0035]施加可靠性权重值可包括:根据可靠性程度排列电话号码候选组中的一个或者多个电话号码候选项；并且显示具有根据可靠性程度排列的电话号码候选项的电话号码候选组。
[0036]控制方法可进一步包括:接收对应于用户讲话的语音信号；并且对语音信号进行预处理。
[0037]控制方法可进一步包括:根据名称长度对电话簿进行分类；并且创建用于各个名称长度的上下文模型。
[0038]创建上下文模型可包括:将每个名称转换成音素串；并且基于音素串创建语音网格。
[0039]根据本公开的另一方面，车辆包括:多个上下文模型，通过根据名称长度对电话簿进行分类而创建多个上下文模型；候选组搜索单元，候选组搜索单元被配置为从相应上下文模型创建对应接收的语音信号的上下文候选组；权重施加单元，权重施加单元被配置为将不同的可靠性权重值分别施加给上下文候选组，以使得从对应于用户讲话长度的上下文模型所创建的上下文候选组具有高度可靠性；以及显示单元，显示单元被配置为根据可靠性程度排列并且显示施加了可靠性权重值的上下文候选组。
【附图说明】
[0040]从结合附图对实施方式进行的以下描述中，本公开的这些方面和/或其他方面将变得更加显而易见并且更易于理解，附图中:
[0041]图1是根据本公开的实施方式的语音识别装置的控制框图；
[0042]图2是根据本公开的实施方式的语音识别装置的语音识别器的控制框图；
[0043]图3是根据本公开的实施方式的包括模型创建器的语音识别装置的控制框图；
[0044]图4是示意性示出了根据本公开的实施方式的车辆的外观的立体图；
[0045]图5示意性示出了根据本公开的实施方式的车辆的内部；
[0046]图6是根据本公开的实施方式的包括语音识别装置的车辆的控制框图；
[0047]图7是用于描述根据本公开的实施方式的车辆的语音活动检测(VAD)装置的操作的流程图；
[0048]图8示出了用于认证用户终端的画面的实施例；
[0049]图9是描述通过根据本公开的实施方式的语音识别装置进行的呼叫连接的流程图；
[0050]图10是用于描述创建电话簿上下文模型的方法的实例的流程图；
[0051]图11是用于描述对电话簿中包括的电话号码进行分类的方法的实例的示图；
[0052]图12示出了用于语音识别的导向画面的实施例；
[0053]图13是用于描述创建电话号码候选组的方法的实例的流程图；
[0054]图14是用于描述施加可靠性权重值的方法的实例的流程图；
[0055]图15不出了列出可靠性权重值的实例的表格；
[0056]图16示出了显示语音识别的结果的画面的实例；并且
[0057]图17是用于描述根据本公开的实施方式的在根据讲话者的语音讲话长度施加可靠性权重值来搜索电话号码时改进识别速率的示图。
【具体实施方式】
[0058]通过参考下面结合附图所描述的实施方式，本公开的优点和特征以及实现各种优点和特征的方法将变得显而易见。然而，本公开并不受这些实施方式限制，而是可被实施为多种不同的形式。提供这些实施方式以使得本发明的公开内容变得完整并且允许本领域普通

完整全部详细技术资料下载

当前第1页1 2 3 4 5

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：房圭燮;
技术所有人：现代自动车株式会社;起亚自动车株式会社;
我是此专利的发明人