一种提高汽车声控系统语音识别率的方法

文档序号:3936249阅读:673来源:国知局
专利名称:一种提高汽车声控系统语音识别率的方法
技术领域
本发明属于汽车电器控制技术领域,涉及汽车语音声控的语音识别系统,尤其涉及一种提高汽车声控系统语音识别率的方法,用于汽车语音声控系统的语音识别。
背景技术
在现阶段,用来提高语音识别系统识别率的方法,往往就在算法或硬件设备上做文章。随着汽车市场的快速扩张,汽车消费人群队伍的不断膨胀,汽车消费人群的结构发生巨大变化,从繁华的城市到广袤的乡村,从ECO白领到平民打工,从高等教育高学历到义务教学低学历,这一消费人群对汽车性能的追求寄予同样的渴望。但是,在广大车主中发音不是很标准,中国是疆域辽阔多民族的大国,不说民族语言和各地乡音千差万别,就大区域来说,比如中国北方的普通话和南方的普通话的发音受乡音的影响,区别较大,就是北京人的发音土话重了,与标准普通话也有较大差别,特别在翘舌音,前鼻音和后鼻音上存在较大的差异。这是一个影响汽车语音识别系统识别率的不可回避的重要因素,它直接关系到汽车语音识别系统识别率的大问题。在算法或硬件设备上汽车语音识别系统识别率,同时如何采用多种方法进一步提高语音识别系统识别率,这是中国汽车行业乃至世界各大汽车企业十分关注的重要课题。已有技术的语言识别,如申请号200810103679. 1,名称为“基于命令词表的汽车电器语音控制方法”的发明专利,该方法包括生成一个语音词表和噪声词表; 语音识别引擎记录驾驶员的说话声音;把所述语音词表和噪声词表进行合并;合并后加载到一个语音识别引擎中,从所述语音词表选出读音与驾驶员的说话声音最相近的词语;根据语音识别引擎输出的词语,对驾驶员的说话意图进行识别,识别的结果为确定的电器控制命令;将得到的电器控制命令转换成CAN总线控制信号,输出到CAN总线上,用以对电器进行控制。该控制方法虽然对汽车驾驶环境下的噪声有较强的抑制能力,但存在以下不足 (1)存在驾驶员的说话语音对汽车语音识别系统识别率的影响。(2)不能对驾驶员以外的多名车内乘员的语音进行识别。(3)从所述语音词表选出读音与驾驶员的说话声音最相近的词语,对驾驶员的说话意图进行识别的可靠性没有实质性的提高。目前汽车市场上,已有一些汽车品牌用声控技术来控制车辆执行一些动作,如播放音乐、打开阅读灯等。汽车语音控制系统的发展一直处于上升的好势头,已有技术如本集团的申请号20092031M18的“汽车娱乐语音控制系统”等专利见诸于世。现有技术中汽车语音控制系统的语音识别系统的可靠性和语音识别概率一直是个核心技术问题。其中语音指令的关键词的识别和确定就有很多问题,以声控电器对象为空调为例,两个基础关键词分别是“打开空调”和“关闭空调”,这两个关键词本身就有两个词相同,这会很大程度上降低系统识别的可靠性,甚至会出现误操作。

发明内容
本发明的目的是为了克服已有技术存在的不足,提出一种提高汽车语音识别系统识别率的方法,改善影响汽车语音识别系统识别率的语音差异因素,能对驾驶员以外的多名车内乘员的语音进行识别,以及提高汽车语音识别系统识别率。本发明的目的是通过以下的技术方案来实现。一种提高汽车语音识别系统识别率的方法,它包括以下步骤
步骤一、为汽车声控系统配置语音提示模块,语音提示模块共用汽车音响系统的放音部件,语音提示模块输出语音提示信号能对汽车音响系统播放的娱乐信号实施分时控制;
步骤二、汽车声控系统的语音识别模块还配置采用分级输入和分级识别的语音指令分级方法的流程;通过将语音指令分级,使在同一级的语言指令中尽量少出现相同的字或发音相近的字,这样就能够大大提高语音识别可靠性;
步骤三、汽车声控系统的语音识别模块还配置采用分级语音指令鲁棒性识别方法的流程;用于实现语音不精确的条件下,使语音识别模块能保持预期的识别概率,从而能够大大提高汽车声控系统语音识别的识别率。所述的方法,其在于所述步骤二的语音指令分级方法流程包括以下步骤
(1)通过按键或非按键,启动汽车声控系统;
(2)语音提示模块输出语音提示信号“欢迎使用第一级语音指令”,包括“小秘书欢迎您”,语音提示信号通过音响系统的放音部件播放“第一级关键词词组”的内容;
(3)语音声控系统采集车乘人员发送的“第一级关键词”语音信号;
(4)语音识别模块对“第一级关键词”语音信号作语音识别,完成对第一级语音指令的确认;若判断为“否”,判定接收的语音不是第一级语音指令,返回(3)等待采集车乘人员发送的“第一级关键词”语音;若判断为“是”,判定接收的语音是第一级语音指令,执行下一步流程(5);
(5)语音提示模块根据第一级关键词的不同关键词,输出第二级语音指令的不同语音提示信号,包括“第二级语音指令可用指令开、停或关”,“可用指令升、停或降”,语音提示信号通过音响系统的放音部件播放“第二级关键词词组”的相应语音提示内容;
(6)语音声控系统采集车乘人员发送的“第二级关键词”语音信号;
(7)语音识别模块对“第二级关键词”作语音识别,完成对第二级语音指令的确认;若判断为“否”,判定接收的语音不是第二级语音指令,返回(6)等待采集车乘人员发送的“第二级关键词”语音;若判断为“是”,判定接收的语音是第二级语音指令,执行下一步流程;
(8)语音声控系统输出由第一级语音指令、第二级语音指令组合的控制信号,由系统控制模块完成对应声控电器的控制;
(9)结束流程;
通过将语音指令分级,使在同一级的语言指令中尽量少出现相同的字或发音相近的字,这样就能够大大提高语音识别可靠性。 所述的方法,其在于所述分级语音指令鲁棒性识别的方法包括以下步骤
(1)启动语音声控系统;
(2)语音声控系统初始化;
1)定义并建立相近于语音指令精确拼音模型的鲁棒性非精确拼音模型数据库简称语音指令鲁棒性拼音模型数据库;虑到常见的语音指令的带口语语音与标准语音的差异因素,以语音指令关键词的标准语音为基础的精确拼音模型,建立语音指令鲁棒性拼音模型数据库,其目标是在语音指令发音不精确的条件下,使语音识别模块能保持预期的准确识别率,从而提高语音声控系统语音识别的可靠性和稳定性。2)确定鲁棒性拼音模型数据库的非精确相近性准则,包括
a.将翘舌音的语音拼音与非翘舌音的语音拼音判定为相近;
b.将前鼻音的语音拼音与非前鼻音的语音拼音判定为相近;
c.将后鼻音的语音拼音与非后鼻音的语音拼音判定为相近;
3)定义第一级语音指令的第一级关键词词组,构建第一级关键词词组的各个关键词标准语音精确拼音模型及其鲁棒性拼音模型;
建立包含第一级关键词词组的语音指令第一级关键词子库简称第一级关键词子库,每个“第一级关键词”拼音模型包括一个精确拼音模型与若干个相近的鲁棒性拼音模型;
4)定义第二级语音指令的第二级关键词词组,构建第二级关键词词组的关键词标准语音精确拼音模型及其鲁棒性拼音模型;
建立包含第二级关键词词组的语音指令第二级关键词子库简称第二级关键词子库,每个“第二级关键词”拼音模型包括一个精确拼音模型与若干个相近的鲁棒性拼音模型;
(3)语音识别识别模块接收指令人发出的第一级语音指令;
(4)语音识别模块先调用“第一级关键词子库”作语音指令鲁棒性匹配识别,与每个第一级关键词的一个精确拼音模型与若干个相近的鲁棒性拼音模型作比对,以“或”符合判定为“匹配”;若判定为“否”,返回步骤(3);若判定为“是”,转步骤(5);
(5)输出匹配的第一级语音指令的关键词代码;
(6)语音识别识别模块接收指令人发出的第二级语音指令;
(7)语音识别模块先调用“第一级关键词子库”作语音指令鲁棒性匹配识别,与每个第一级关键词的一个精确拼音模型与若干个相近的鲁棒性拼音模型作比对,以“或”符合判定为“匹配”;若判定为“否”,返回步骤(6);若判定为“是”,转步骤(8);
(8)输出匹配的第二级语音指令的动作关键词代码;
语音识别模块后调用“第二级关键词子库”作语音指令鲁棒性匹配识别,与每个第二关键词的一个精确拼音模型与若干个相近的鲁棒性拼音模型作比对,以“或”符合,则判定为 “匹配”,输出该第二关键词的代码值;
(9)匹配的第一级与第二级语音指令关键词作组合处理第一级关键词的代码值与第二级关键词的代码值组合,构成组合语音指令代码;
(10)输出匹配的组合语音指令代码的控制信号;
(11)结束流程。当语音指令中有翘舌音或前鼻音和后鼻音的词,如“升”的标准发音为“sheng”,这是翘舌后鼻音的词,与之相近的非标准发音的有非翘舌音“sen”和非翘舌音“seng”,在它们的非标准发音不与别的语音指令相混淆的前提下,将上述标准发音的“sheng”和非标准发音的“sen”和“seng”汇集于同一语音指令中,以此类推,构建成兼顾北方区域普通话和南方区域普通话的汽车语音指令数据库,该数据库中每个语音指令是包括多个相近语音词的或集合,语音识别系统分别提取该或集合的多个相近语音词,一一识别,并对多个相近语音词的识别结果作“或”处理。从而能够大大提高语音识别系统的识别率。所述的方法,其在于所述步骤一的分时控制是以语音提示模块输出语音提示信号生成分时控制信号,分时控制信号对音响系统的娱乐信号实施分时使能控制。所述的方法,其在于所述第一级语音指令包括DVD音响、空调、阅读灯、车窗、天窗、后视镜、后备箱以及其它控制对象名称,并给每个第一级语音指令分配一个代码。所述的方法,其在于所述第二级语音指令包括与第一级语音指令中控制对象名称相匹配的动作关键词,并给每个第二级语音指令分配一个代码。所述的方法,其在于,所述第一级语音指令代码与第二级语音指令代码相关联, 一、二级语音组合指令代码由两者代码组合构成;用于实施对相应电器的相关控制。所述的方法,其在于所述第二级语音指令的动作关键词允许与多个第一级语音指令相匹配。所述的方法,其在于所述第二级语音指令的动作关键词包括开启及其同义词开、 打开、开开、播放、接听、导航;停止及其同义词停、停下、停播;关闭及其同义词关、关上、退出、断开。鉴于语音指令的带口语语音与标准语音的差异因素,以语音指令关键词的标准语音为基础的精确拼音模型,建立语音指令鲁棒性拼音模型数据库,其目标是在语音指令发音不精确的条件下,使语音识别模块能保持预期的准确识别率,从而提高语音声控系统语音识别的可靠性和稳定性。本发明的实质性效果
1、本发明方法有效改善影响汽车语音识别系统识别率的语音差异因素,
2、本发明方法以语音指令鲁棒性拼音模型数据库为识别比对样本,能使语音识别模块有效改善影响汽车语音识别系统识别率的语音差异因素,保持预期的准确识别率,提高汽车语音识别系统语音识别的可靠性和稳定性。3、本发明方法允许对包括驾驶员在内的多名车内乘员,进行语音指令识别,符合广大汽车消费人群的实际使用需求。4、采用本发明方法可以应用于各自档次的汽车的电器声控系统。


图1本发明语音指令分级方法逻辑流程图。图2本发明分级语音指令的鲁棒性方法逻辑流程图。图3本发明实施例语言指令分级方法的流程图。图4本发明实施例分级声控语音指令鲁棒性识别方法的流程图。
具体实施例方式下面通过实施例并结合附图对本发明的技术方案作进一步的详细说明。通常汽车语音识别系统的构成包括语音传感器、语音识别模块、命令执行模块和语音提示模块,本发明的提高汽车语音识别系统识别率的方法是基于已有技术的汽车语音识别系统。本发明提高汽车语音识别系统识别率的语音指令分级方法流程如图1所示。语音指令分级方法流程包括以下步骤
SlOl通过按键,启动语音声控系统;S102语音声控系统的语音提示模块发送语音提示欢迎使用第一级语音指令“第一级关键词词组”(关键词词组包括全部汽车语音声控对象的名称);
S103语音声控系统通过语音传感采集车乘人员发送的“第一级关键词”语音信号; S104语音识别模块对语音指令的第一级关键词进行识别和确认;若识别和确认为 “否”,返回S103 ;若识别和确认为“是”,转S105 ;
S105语音声控系统的语音提示模块继续发送语音提示欢迎使用第二级语音指令“第二级关键词词组”(关键词词组包括与全部汽车语音声控对象的控制动作名);
S106语音声控系统继续通过语音传感采集车乘人员发送的“第二级关键词”语音信
号;
S107语音识别模块对语音指令的第二级关键词进行识别和确认;若识别和确认为 “否”,返回S106 ;若识别和确认为“是”,转S108 ;
S108语音声控系统组合第一级和第二级语音指令,并输出控制信号字到命令执行模
块;
S109结束流程。本发明提高汽车语音识别系统识别率的分级语音指令鲁棒性识别方法的流程,参见图2。分级语音指令鲁棒性识别方法的流程包括以下步骤
S201通过按键,启动语音声控系统;
S202语音声控系统初始化,包括
S203定义并建立语音指令鲁棒性拼音模型数据库;
S204确定鲁棒性拼音模型数据库的非精确相近性准则;
S205定义第一级语音指令的第一级关键词词组并建立语音指令第一级关键词子库; S206定义第二级语音指令的第二级关键词词组并建立语音指令第二级关键词子库; S207语音识别模块接收车乘人员发送的第一级语音指令;
S208语音识别模块用第一级关键词子库对第一级语音指令作鲁棒性匹配识别;若匹配识别为“否”,返回S207 ;若匹配识别为“是”,转S209,同时,转S210 ; S209输出匹配的第一级语音指令代码值,送到S213 ; S210语音识别模块继续接收车乘人员发送的第二级语音指令; S211语音识别模块用第二级关键词子库对第二级语音指令作鲁棒性匹配识别;若匹配识别为“否”,返回S210 ;若匹配识别为“是”,转S212 ; S212输出匹配的第二级语音指令代码值,送到S213 ; S213语音识别模块对匹配的第一级和第二级语音指令代码作组合处理; S214输出匹配的组合语音指令代码的控制信号; S215结束流程。图3给出了本发明实施例语音指令分级方法的流程图。将语音指令根据一定的原则进行分级,使分级后的每一级语音指令基本没有相近的关键词,本发明通过将模块与动作分为两级,图3所示,将原本同一级的4个关键词“打开空调”和“关闭空调”,“阅读灯亮”和“阅读灯灭”分为二级第一级为“空调”和“阅读灯”,第二级根据针对第一级指令各有2个关键词为“打开”或“关闭”,“亮”或“灭”。对其它声控电动模块的语音指令分级动作,都可以用这种语音指令分级方法来实
图4给出了本发明实施例分级声控语音指令鲁棒性识别方法的流程图。 汉语拼音所述的翘舌音的韵符包括发音时舌尖是向上翘的zh ch sh r。所述的前鼻音的韵符包括an,en,in,im,所述的后鼻音的韵符包括ang,eng, ing,ong0当声控系统的指令语音关键词中有翘舌后鼻音的”升” “sheng”,将没有翘舌或后鼻音的相近的“shen”,“Sen”,“Seng”三个语音都识别为关键词“升”,这样车主用户即使发音分不出翘舌音、后鼻音或前鼻音等情况,也不会识别不了或无法识别的问题,从而提高语音识别系统识别率。本发明实施例分级声控语音指令鲁棒性识别流程,以“空调”、“阅读灯,,为第一级语音指令关键词,第二级语音指令“打开”或“关闭”、“亮”或“灭”来作说明性描述。(1)通过按键或非按键,启动汽车声控系统;
(2)语音提示模块输出语音提示信号“欢迎使用第一级语音指令DVD音响、空调、阅读灯、车窗、天窗、后视镜以及其它控制对象名称”,对每个第一级语音指令分配代码,语音提示信号通过音响系统的放音部件播放;
(3)系统语音识别模块接收车乘人员发送的第一级语音指令“空调”、“阅读灯”、“……,, 并识别和确认,输出第一级语音指令确认信号送到语音提示模块;
(4)语音提示模块输出语音提示信号可用第二级语音指令“打开”或“关闭”、“亮”或 “灭,,、……
(5)系统语音识别模块接收车乘人员发送的第二级语音指令“打开”或“关闭”、“亮”或 “灭”、……并识别和确认;输出第二级语音指令确认信号到语音识别模块;
(6)语音识别模块输出第一、二级语音组合指令“空调打开”/“空调关闭”、“阅读灯亮”/ “阅读灯灭”、“……”到声控系统的控制执行模块;
(7)执行第一、二级语音组合指令的组合;
(8)输出第一、二级语音组合指令对应的电器控制信号。本领域技术人员可以理解,在不背离本发明广义范围的前提下,对上述实施例作出若干改动。因而,本发明并不仅限于所公开的特定实施例。其范围应当涵盖所附权利要求书限定的本发明核心及保护范围内的所有变化。
权利要求
1.一种提高汽车声控系统语音识别率的方法,它包括以下步骤步骤一、为汽车声控系统配置语音提示模块,语音提示模块共用汽车音响系统的放音部件,语音提示模块输出语音提示信号能对汽车音响系统播放的娱乐信号实施分时控制;步骤二、汽车声控系统的语音识别模块还配置采用分级输入和分级识别的语音指令分级方法的流程;通过将语音指令分级,使在同一级的语言指令中尽量少出现相同的字或发音相近的字,这样就能够大大提高语音识别可靠性;步骤三、汽车声控系统的语音识别模块还配置采用分级语音指令鲁棒性识别方法的流程;用于实现语音不精确的条件下,使语音识别模块能保持预期的识别概率,从而能够大大提高汽车声控系统语音识别的识别率。
2.根据权利要求1所述的方法,其特征在于,所述步骤二的语音指令分级方法流程包括以下步骤(1)通过按键或非按键,启动汽车声控系统;(2)语音提示模块输出语音提示信号“欢迎使用第一级语音指令”,包括“小秘书欢迎您”,语音提示信号通过音响系统的放音部件播放“第一级关键词词组”的内容;(3)语音声控系统采集车乘人员发送的“第一级关键词”语音信号;(4)语音识别模块对“第一级关键词”语音信号作语音识别,完成对第一级语音指令的确认;若判断为“否”,判定接收的语音不是第一级语音指令,返回(3)等待采集车乘人员发送的“第一级关键词”语音;若判断为“是”,判定接收的语音是第一级语音指令,执行下一步流程(5);(5)语音提示模块根据第一级关键词的不同关键词,输出第二级语音指令的不同语音提示信号“继续使用第二级语音指令”,包括可用指令开、停或关”,“可用指令升、停或降”, 语音提示信号通过音响系统的放音部件播放“第二级关键词词组”的相应语音提示内容;(6)语音声控系统采集车乘人员发送的“第二级关键词”语音信号;(7)语音识别模块对“第二级关键词”作语音识别,完成对第二级语音指令的确认;若判断为“否”,判定接收的语音不是第二级语音指令,返回(6)等待采集车乘人员发送的“第二级关键词”语音;若判断为“是”,判定接收的语音是第二级语音指令,执行下一步流程 (8);(8)语音声控系统输出由第一级语音指令、第二级语音指令组合的控制信号,由系统控制模块完成对应声控电器的控制;(9)结束流程;通过将语音指令分级,使在同一级的语言指令中尽量少出现相同的字或发音相近的字,这样就能够大大提高语音识别可靠性。
3.根据权利要求1所述的方法,其特征在于,所述分级语音指令鲁棒性识别的方法包括以下步骤(1)启动语音声控系统;(2)语音声控系统初始化;1)定义并建立相近于语音指令精确拼音模型的鲁棒性非精确拼音模型数据库简称语音指令鲁棒性拼音模型数据库;2)确定鲁棒性拼音模型数据库的非精确相近性准则,包括a.将翘舌音的语音拼音与非翘舌音的语音拼音判定为相近;b.将前鼻音的语音拼音与非前鼻音的语音拼音判定为相近;c.将后鼻音的语音拼音与非后鼻音的语音拼音判定为相近;3)定义第一级语音指令的第一级关键词词组,构建第一级关键词词组的各个关键词标准语音精确拼音模型及其鲁棒性拼音模型;建立包含第一级关键词词组的语音指令第一级关键词子库简称第一级关键词子库,每个“第一级关键词”拼音模型包括一个精确拼音模型与若干个相近的鲁棒性拼音模型;4)定义第二级语音指令的第二级关键词词组,构建第二级关键词词组的关键词标准语音精确拼音模型及其鲁棒性拼音模型;建立包含第二级关键词词组的语音指令第二级关键词子库简称第二级关键词子库,每个“第二级关键词”拼音模型包括一个精确拼音模型与若干个相近的鲁棒性拼音模型;(3)语音识别识别模块接收指令人发出的第一级语音指令;(4)语音识别模块先调用“第一级关键词子库”作语音指令鲁棒性匹配识别,与每个第一级关键词的一个精确拼音模型与若干个相近的鲁棒性拼音模型作比对,以“或”符合判定为“匹配”;若判定为“否”,返回步骤(3);若判定为“是”,转步骤(5);(5)输出匹配的第一级语音指令的关键词代码;(6)语音识别识别模块接收指令人发出的第二级语音指令;(7)语音识别模块先调用“第一级关键词子库”作语音指令鲁棒性匹配识别,与每个第一级关键词的一个精确拼音模型与若干个相近的鲁棒性拼音模型作比对,以“或”符合判定为“匹配”;若判定为“否”,返回步骤(6);若判定为“是”,转步骤(8);(8)输出匹配的第二级语音指令的动作关键词代码;语音识别模块后调用“第二级关键词子库”作语音指令鲁棒性匹配识别,与每个第二关键词的一个精确拼音模型与若干个相近的鲁棒性拼音模型作比对,以“或”符合,则判定为 “匹配”,输出该第二关键词的代码值;(9)匹配的第一级与第二级语音指令关键词作组合处理第一级关键词的代码值与第二级关键词的代码值组合,构成组合语音指令代码;(10)输出匹配的组合语音指令代码的控制信号;(11)结束流程。
4.根据权利要求1所述的方法,其特征在于,所述步骤一的分时控制是以语音提示模块输出语音提示信号生成分时控制信号,分时控制信号对音响系统的娱乐信号实施分时使能控制。
5.根据权利要求2所述的方法,其特征在于,所述第一级语音指令包括DVD音响、空调、 阅读灯、车窗、天窗、后视镜、后备箱以及其它控制对象名称,并给每个第一级语音指令分配一个代码。
6.根据权利要求2所述的方法,其特征在于,所述第二级语音指令包括与第一级语音指令中控制对象名称相匹配的动作关键词,并给每个第二级语音指令分配一个代码。
7.根据权利要求5或6所述的方法,其特征在于,所述第一级语音指令代码与第二级语音指令代码相关联,一、二级语音组合指令代码由两者代码组合构成;用于实施对相应电器的相关控制。
8.根据权利要求7所述的方法,其特征在于,所述第二级语音指令的动作关键词允许与多个第一级语音指令相匹配。
9.根据权利要求6或7所述的方法,其特征在于,所述第二级语音指令的动作关键词包括开启及其同义词开、打开、开开、播放、接听、导航;停止及其同义词停、停下、停播;关闭及其同义词关、关上、退出、断开。
全文摘要
本发明公开一种提高汽车语音识别系统识别率的方法,包括以下步骤1、为汽车声控系统配置语音提示模块,输出语音提示信号对汽车音响系统播放的娱乐信号实施分时控制;2、汽车声控系统的语音识别模块还配置采用分级输入和分级识别的语音指令分级方法的流程;3、汽车声控系统的语音识别模块还配置采用分级语音指令鲁棒性识别方法的流程。本发明方法有效改善影响汽车语音识别系统识别率的语音差异因素,保持预期的准确识别率,提高汽车语音识别系统语音识别的可靠性和稳定性。本发明方法可以应用于各自档次的汽车的电器声控系统。
文档编号B60R25/00GK102332265SQ201110164289
公开日2012年1月25日 申请日期2011年6月20日 优先权日2011年6月20日
发明者丁武俊, 张方伟, 朱祝阳, 潘之杰, 熊想涛, 赵福全, 邓健, 陈冰, 陈文强 申请人:浙江吉利控股集团有限公司, 浙江吉利汽车研究院有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1