用于特别是在车辆中的语音识别的装置及方法

文档序号:9371992阅读:294来源:国知局
用于特别是在车辆中的语音识别的装置及方法
【专利说明】用于特别是在车辆中的语音识别的装置及方法
[0001]说明书
[0002]本发明涉及一种用于特别是在车辆中的语音识别的装置及方法。
[0003]通常,语音识别系统使用给定的、特定的用户语音样式(Benutzersprachprofil),以便能够处理某一用户的音频信号。在这方面,讨论中的用户所说的音素被鉴定,以使该音素的识别可以产生符合用户,或者所述用户的说话方式或语音样本的效果。音素构成语言声音的最小意义区分(kleinsten bedeutungsunterscheidenden)单元,例如在德语中被制作成大约40个不同的音素来使用。
[0004]音素的鉴别通常使用各种滤波器生效,通过滤波器使用不同频率极限和时间极限来处理个各自的输入信号。结果被用作语音识别系统中的参数,使用例如由隐马尔可夫模型(ein Hidden-Markov-Modells,HMM)构成或由人工神经网络(kUnstliche neuronaleNetz)构成。因此,讨论中的对用户的特定的回应和适应会受到所述用户各自发音的影响,以及还会受到任何可能的语音特性的影响,例如方言或口音、说母语的人的发音等。
[0005]当使用语音识别系统时,问题便出现了,S卩,通常当启动使用新系统时,需要一定的时间来适应用户,特别是例如在这种情况下,当这种适应不得不在每一次启动车辆时重新再进行一次时,车辆中的语音识别显示出费力或恼人。另外,对于用户来说必要的学习阶段是艰巨的,由于后者不得不在适当的情况下反复发布命令,或发现他/她本身接收到不正确或不理想的系统回应,同样还有可能的是有必要时常反复发布一系列命令。
[0006]除了其他方面以外,EP I 678 008 BI公开了一种用于使用多个外部装置为车辆装置选择用户语音样式的系统,语音识别系统被连接至储存有多个用户语音样式的存储器。包含语音识别系统的控制模块使用从外部装置接收到的标识符来从多个用户语音样式中选择某一用户语音样式。被选择的用户语音样式被语音识别系统用于处理来自用户的音频信号。
[0007]关于现有技术的进一步状态,仅通过举例的方式参照专利US 8,447,598 B2和DE10 2006 056 286 Al。
[0008]本发明的目的在于提供一种用于特别是在车辆中的语音识别的装置及方法,该装置及方法在允许可靠的语音识别的同时避免反复学习阶段的必要。
[0009]通过依据独立权利要求1的技术特征的装置以及依据相关的权利要求10的技术特征的方法来达到本目的。
[0010]—种依据本发明的用于特别是在车辆中的语音识别的装置,拥有用于处理用户的音频信号的处理单元,其中该处理是基于分配给这个用户的用户语音样式来进行的,该装置配置用于执行以下步骤:
[0011]-在外部存储器中储存用户语音样式,该外部存储器只分配给这个用户并且位于处理单元外部;以及
[0012]-在每次重启装置时自动检索储存于这个外部存储器中的用户语音样式,自动检索到的用户语音样式通信至处理单元,用于在用户的未来音频信号处理中使用。
[0013]特别地,本发明所基于的概念是,将用户语音样式存储在只分配给这个用户的并且位于处理单元外部的存储器(其在一定程度上构成“个性化系统”或“个性化存储器”)中,该语音样式包含涉及某一用户的发音或语音样本的先前学习的参数。这个个性化系统随后可以将讨论中的参数传送至装置的处理单元用于每次重启时的语音识别(也就是说,例如,特别是在启动机动车辆的发动机之后),以使用于语音识别的装置的反复“训练”的需要停止应用。
[0014]此外,储存在外部存储器中的用户语音样式可以不断地以有利的方式来适应,前提是例如在包含于储存的用户语音样式中的语音样本与当前给定的情况下检测到的用户的语音行为之间出现了重大的或过度的差异,这种改变归因于例如用户的压力、疲劳或疾病。根据本发明,这种适应可以特别迅速地生效,由于在用户语音样式第一次被储存之后,先前所学习的音素的基本集合已经可用并且仅仅需要在每次新的系统启动时从外部存储器或个性化系统中检索。任何可能的修正或适应可以在实际“音素空间”的“子空间”或子集中进行,这个子空间实质上小于总体可用的“音素空间”,使得能够实质上更快速地生效并且对于用户来说几乎是不知不觉的。
[0015]由于外部存储器或个性化系统一一其中存储有学习到的语音参数或音素(即,各自的用户语音样式),并在每一次重启时从中检索学习到的语音参数或音素(即,各自的用户语音样式)一一尤其是手提式设备,所以本发明使得任意语音识别系统一一并且同时例如装备有这种系统的车辆一一通过利用各自的参数来适应讨论中的用户成为可能。因此,特别地,例如对于某一车辆没有限制,相反地各自的适应以及相应的语音识别同样可以在任何时候任何车辆中以稳健的、可靠的以及方便于各自用户的方式生效。特别地,这允许在租用车辆中、公司车辆中、所谓的车辆共享的情况下等应用。在这种情况下,各自的语音识别系统处于启用位置以直接地并方便地听从驾驶员或用户各自的命令,而无需先前的训练阶段。
[0016]本发明的另一优势存在于它的实施可以不需要额外的硬件支出和相关的费用这样的事实,这是由于可以使用已经可用的数据转换模块,并且各自音素的处理已经是各自的现存的语音识别系统的主要部分。
[0017]依据一个实施例,分配给用户的存储器被设置在移动和便携式存储装置中,特别是在车钥匙、钥匙环吊坠、内存臂环或诸如此类之中。在进一步的实施例中,分配给用户的存储器还可以是在云存储器中的存储区。
[0018]根据一个实施例,装置进一步配置用于通过数据的无线传输来完成用户语音样式的储存和检索,其此外进一步地,尤其在每一种情况下均可利用加密保护和/或密码保护生效。在这种情况下,数据的传输可以被限制在有限数量的音素,以便避免超出各自的通信通道或数据传输通道的容量。
[0019]根据一个实施例,装置进一步配置用于完成用户语音样式对用户的当前语音样本的自动适应。
[0020]根据一个实施例,装置进一步配置用于适应用户语音样式,根据获取的用户当前情况,该用户语音样式被通信至处理单元用于在用户的未来音频信号的处理中使用。
[0021]根据一个实施例,装置进一步配置用于适应用户语音样式,如果在用户音频信号的处理过程中检测到连贯音素的下降的分离性(Separierbarkeit
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1