语音识别系统中的语音假象补偿系统和方法

文档序号：9328311阅读：765来源：国知局

语音识别系统中的语音假象补偿系统和方法
【技术领域】
[0001]技术领域总体上涉及语音系统，并且更详细地涉及用于在存在语音假象的情况下改善声音识别的方法和系统。
【背景技术】
[0002]车辆语音对话系统(或"语音系统")尤其基于车辆乘客发出的语音执行语音识另O。语音发声通常包括指令，这些指令与车辆的一个或多个特征以及车辆可获取的其它系统通信或控制它们。语音系统响应于语音发声产生语音指令，并且在有些情况下，这些语音指令是响应于语音系统产生的，需要更多信息以便执行语音识别。
[0003]在许多语音识别系统中，向用户提供由设在车辆内的语音生成系统产生的提示符。在这样的系统(例如声音〃干扰〃系统)中，用户可能在系统还没有足够快地停止其语音输出的情形中的提示符期间开始发音。因此，对于简短瞬间，两者都在发音。用户然后可能停止发音，然后要么继续，要么重复先前所说的。在后一种情形中，来自用户的语音发声可能包括在开始发声时的语音假象(在这种情况下，称作"口吃"效果)，使得用户的语音命令难以或不能被解析。这样的错误降低了识别准确度和用户满意度，并且还能增加驾驶员的分心程度。
[0004]因此，期望提供改善的方法和系统，用于在存在语音假象的情况下改善语音识别。此外，本发明的其它的合乎需要的要素和特征将通过随后的详细说明和附上的权利要求变得明显，参照附图以及前述的技术领域和【背景技术】。

【发明内容】

[0005]根据一个实施例的一种语音识别方法包括产生语音提示符，响应于该语音提示符接收来自用户的口头发声，其中，该口头发声包括语音假象，并且补偿该语音假象。
[0006]根据一个实施例的一种语音识别系统包括构造成为用户产生语音提示符的语音生成模块和构造成响应于该语音提示符接收来自用户的包括语音假象的口头发声并且补偿该语音假象的语音理解系统。
[0007]本发明提供下列技术方案。
[0008]技术方案1.一种语音识别方法，包括:
产生语音提示符；
响应于该语音提示符接收来自用户的口头发声，该口头发声包括语音假象；以及补偿该语音假象。
[0009]技术方案2.如技术方案I所述的方法，其中，该语音假象是口吃假象。
[0010]技术方案3.如技术方案I所述的方法，其中，补偿语音假象包括提供包括语音假象为语音分量的识别语法。
[0011]技术方案4.如技术方案I所述的方法，其中补偿该语音假象包括修正口头发声以消除语音假象。
[0012]技术方案5.如技术方案4所述的方法，其中，修正口头发声包括消除发生在相对于语音提示符结尾的预定时间之前的口头发声的一部分。
[0013]技术方案6.如技术方案4所述的方法，其中，修正口头发声包括消除口头发声的一部分，其符合由后跟着大致沉默的语音短脉冲构成的模式。
[0014]技术方案7.如技术方案4所述的方法，其中，修正口头发声包括根据口头发声的第一部分与类似于该第一部分的口头发声的后续部分的比较结果消除口头发声的一部分。
[0015]技术方案8.—种语音识别系统，包括:
构造成为用户产生语音提示符的语音生成模块；和
构造成响应于该语音提示符接收来自用户的包括语音假象的口头发声并且构造成补偿该语音假象的语音理解系统。
[0016]技术方案9.如技术方案8所述的语音识别系统，其中，该语音假象是干扰口吃假象。
[0017]技术方案10.如技术方案9所述的语音识别系统，其中，该语音理解系统通过提供包括语音假象为语音分量的识别语法补偿语音假象。
[0018]技术方案11.如技术方案8所述的语音识别系统，其中，该语音理解系统通过修正口头发声以消除语音假象来补偿该语音假象。
[0019]技术方案12.如技术方案11所述的语音识别系统，其中，修正口头发声包括消除发生在相对于语音提示符结尾的预定时间之前的口头发声的一部分。
[0020]技术方案13.如技术方案11所述的语音识别系统，其中，修正口头发声包括消除口头发声的一部分，其符合由后跟着大致沉默的语音短脉冲构成的模式。
[0021]技术方案14.如技术方案11所述的语音识别系统，其中，修正口头发声包括根据口头发声的第一部分与类似于该第一部分的口头发声的后续部分的比较结果消除口头发声的一部分。
[0022]技术方案15.—种非暂时性计算机可读介质，承载构造成促使处理器执行下列步骤的软件指令:
产生语音提示符；
响应于该语音提示符接收来自用户的口头发声，该口头发声包括语音假象；和补偿该语音假象。
[0023]技术方案16.如技术方案15所述的非暂时性计算机可读介质，其中，补偿语音假象包括提供包括语音假象为语音分量的识别语法。
[0024]技术方案17.如技术方案15所述的非暂时性计算机可读介质，其中补偿该语音假象包括修正口头发声以消除语音假象。
[0025]技术方案18.如技术方案17所述的非暂时性计算机可读介质，其中，修正口头发声包括消除发生在相对于语音提示符结尾的预定时间之前的口头发声的一部分。
[0026]技术方案19.如技术方案17所述的非暂时性计算机可读介质，其中，修正口头发声包括消除口头发声的一部分，其符合由后跟着大致沉默的语音短脉冲构成的模式。
[0027]技术方案20.如技术方案17所述的非暂时性计算机可读介质，其中，修正口头发声包括根据口头发声的第一部分与类似于该第一部分的口头发声的后续部分的比较结果消除口头发声的一部分。
【附图说明】
[0028]下文将连同下列附图一起描述示范性实施例，其中，相同的数字代表相同的元件，并且其中:
图1是根据各个示范性实施例的包括语音系统的车辆的原理框图。
[0029]图2是概念图，示出根据各个示范性实施例的所产生的语音提示符和得到的口头友尸。
[0030]图3是概念图，示出根据各个示范性实施例的用于所产生的语音提示符和得到的口头发声的语音假象补偿。
[0031]图4是概念图，示出根据各个示范性实施例的用于所产生的语音提示符和得到的口头发声的语音假象补偿。
[0032]图5是概念图，示出根据各个示范性实施例的用于所产生的语音提示符和得到的口头发声的语音假象补偿。
[0033]图6是概念图，示出根据各个示范性实施例的用于所产生的语音提示符和得到的口头发声的语音假象补偿。
[0034]图7-12是流程图，示出根据各个实施例的语音假象补偿方法。
【具体实施方式】
[0035]本文描述的主题总体上涉及用于接收和补偿口头发声的系统和方法，这种口头发声包括响应于语音提示符从用户接收到的语音假象(例如口吃假象)。补偿语音假象可以包括，例如，运用包括语音假象为语音分量的识别语法，或者以各种方式修正口头发声以消除语音假象。
[0036]下列详细说明本质上仅仅是示范性的并且不意图限制应用和使用。此外，不意图受到前述技术领域、【背景技术】、
【发明内容】
或之后的详细说明中出现的任何明确或暗示理论的限制。本文使用的术语〃模块〃指的是专用集成电路(ASIC)、电子电路、执行一个或多个软件或固件程序的处理器(共享的、专用的或分组的)、组合逻辑电路和/或提供所描述功能的其它合适的部件。
[0037]现在参照图1，根据本文所描述主题的示范性实施例，口头对话系统(或简称为〃语音系统〃)10设在车辆12内。通常，语音系统10为一个或多个车辆系统提供语音识别、对话管理和语音生成，通过构造成由一个或多个用户40 (例如驾驶员，乘客等等)操作(或以其它方式交互)的人机通信界面(HMI)模块14。这样的车辆系统可以包括例如电话系统16、导航系统18、媒体系统20、远程信息处理系统22、网络系统24和可以包括语音从属应用的任何其它车辆系统。在一些实施例中，一个或多个车辆系统可通信地连接到网络(例如，专有网络、4G网络等等)，提供与一个或多个后端服务器26的数据通信。<

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：C.R.汉森;T.J.格罗斯特;U.温特;
技术所有人：通用汽车环球科技运作有限责任公司;
我是此专利的发明人

上一篇：用于协调语音识别的系统和方法
上一篇：具有自适应语音处理的安全警报系统的制作方法