一种对用户语音识别结果反馈的命令词识别自适应优化方法

文档序号：2826324阅读：234来源：国知局

一种对用户语音识别结果反馈的命令词识别自适应优化方法
【专利摘要】一种对用户语音识别结果反馈的命令词识别自适应优化方法，将全部支持的命令词分为两组，用户常用命令词和用户不常用命令词；将两组命令词分别构建常用命令词网络和非常用词识别网络；将输入的语音信号送入常用命令词网络进行识别，同时将识别过程中提取出的语音特征数据送入缓存；如果识别结果达到设定的置信度门限，则直接输出识别结果，并反馈识别结果以调整该命令词权重；否则直接从缓存中将数据取出送入非常用词识别网络进行识别；如果进入非常用词识别网络进行识别，则若识别结果达到设定的置信度门限，否则拒识；并反馈识别结果以调整该命令词权重。本发明能够根据不同用户的使用习惯自动优化命令词识别网络，提升了识别效果和拒识效果。
【专利说明】一种对用户语音识别结果反馈的命令词识别自适应优化方法
【技术领域】
[0001]本发明涉及一种语音识别方法，特别是一种对用户语音识别结果反馈的命令词识别自适应优化方法。
【背景技术】
[0002]命令词语音识别系统主要是完成对预先定义的命令词集合进行自动语音识别的功能。用户在使用该系统时，需要先把定义的命令词集合送入识别系统，然后识别系统会将该命令词集合中的每个命令词转化成相应的声学音素序列，再将这些音素序列组合成一个图网络，我们称之为识别网络。
[0003]有了构建好的命令词识别网络后，用户在使用识别系统时只需要说出命令词集合中的语音命令，并送入识别系统，识别系统就会根据语音数据的声学音素去识别网络中匹配出最优的路径，从而再根据网络路径中的声学音素序列反推出具体的命令词文本信息，从而给出识别结果。
[0004]现有的命令词语音识别技术都是事先定义全部能够支持的命令词，然后构建整个语音识别网络。这种方式下识别网络是固定的，不能根据不同用户的使用习惯给出更加精确的网络。特别是当命令词数目过大时，识别效果和拒识效果都会明显下降。

【发明内容】

[0005]本发明技术解决问题:克服现有技术的不足，提供一种对用户语音识别结果反馈的命令词识别自适应优化方法，能够根据不同用户的使用习惯自动优化命令词识别网络，提升了识别效果和拒识效果。
[0006]本发明技术解决方案:一种对用户语音识别结果反馈的命令词识别自适应优化方法，本发明首先将全部支持的命令词分为两组，一组词为用户常用命令词，另一组为不常用命令词；然后将两组命令词分别构建语音识别网络；用户在使用语音识别系统时，首先会在常用命令词网络中进行匹配，如果识别结果达到一个定义的得分门限，则直接返回识别结果；否则会转到不常用的识别网络中继续进行匹配，直到获得结果。在用户使用语音识别系统的过程中对每次识别结果的正确性给出确认，称用户接受一次识别结果为正向反馈，拒绝为反向反馈；随后语音识别系统会记录每次用户给出正向反馈的识别结果和其出现的频度；最后，通过统计用户使用的反馈信息，重新构建识别网络和调整网络路径权重。
[0007]具体实现如下:
[0008](I)首先给支持的所有命令词进行权重评分(该评分为根据经验得来)，每个命令词都会有一个权重分，然后根据评分将全部命令词分为两组，一组词为用户常用命令词，另一组为用户不常用命令词；
[0009](2)然后将两组命令词分别构建语音识别网络，即常用命令词网络和非常用词识别网络:先把常用命令词集合送入识别系统，然后识别系统会将该命令词集合中的每个命令词转化成相应的声学音素序列，再将这些音素序列组合成一个图网络，即为常用词识别网络；再把非常用词命令词集合送入识别系统，然后识别系统会将该命令词集合中的每个命令词转化成相应的声学音素序列，再将这些音素序列组合成一个图网络，即为非常用词识别网络。
[0010](3)将输入的语音信号送入常用命令词网络进行识别，同时将识别过程中提取出的语音特征数据送入缓存；
[0011](4)如果识别结果达到设定的置信度门限，则直接输出识别结果，并反馈识别结果以调整该命令词权重；否则，则直接从缓存中将数据取出送入非常用词识别网络进行识别；
[0012](5)如果进入非常用词识别网络进行识别，则若识别结果达到设定的置信度门限，输出识别结果，否则拒识；并反馈识别结果以调整该命令词权重；
[0013]所述调整该命令词权重过程为:接收识别结果反馈，对识别结果命令词进行权重调整；如果为正向反馈，则权重增加，如果为反向反馈则权重减小；根据调整后的权重重新进行命令词分组；所述正向反馈是指对每次识别结果的正确性给出确认，即用户接受一次识别结果为正向反馈，拒绝则为反向反馈。
[0014]本发明与现有技术相比的优点在于:现有的命令词语音识别技术都是事先定义全部能够支持的命令词，然后构建整个语音识别网络。这种方式下识别网络是固定的，不能根据不同用户的使用习惯给出更加精确的网络。特别是当命令词数目过大时，识别效果和拒识效果都会明显下降。本发明事先将命令词分为常用命令词和非常用命令词，并分别构建识别网络，通过识别结果的反馈，对每个命令词的权重进行调整，可以根据用户习惯进行命令词识别网络的优化，提升识别和拒识效果，提高了识别效率。
【专利附图】

【附图说明】
[0015]图1为本发明中语音识别过程流程图；
[0016]图2为本发明中词汇网络权重调整流程图。
【具体实施方式】
[0017]下面结合流程图详细说明识别过程和词汇分组自优化调整过程。
[0018]如图1所示，本发明具体实现步骤如下:
[0019](I)首先给支持的所有命令词进行权重评分(该评分为根据经验得来)，每个命令词都会有一个权重分，然后根据评分将全部命令词分为两组，一组词为用户常用命令词，另一组为用户不常用命令词；
[0020](2)然后将两组命令词分别构建语音识别网络，即常用命令词网络和非常用词识别网络:先把常用命令词集合送入识别系统，然后识别系统会将该命令词集合中的每个命令词转化成相应的声学音素序列，再将这些音素序列组合成一个图网络，即为常用词识别网络；再把非常用词命令词集合送入识别系统，然后识别系统会将该命令词集合中的每个命令词转化成相应的声学音素序列，再将这些音素序列组合成一个图网络，即为非常用词识别网络。
[0021]例如，对于一个经常使用语音识别系统拨打电话的用户来说，“打电话给”就是一个使用频率比较高的命令词，那么这个命令词在初始的权重分就会比较高，被分入常用命令词；而“查天气”可能使用的频率没那么高，初始的权重分也比较低，会被分入非常用命令词。
[0022](3)将输入的语音信号送入常用命令词网络进行识别，同时将识别过程中提取出的语音特征数据送入缓存；
[0023](4)如果识别结果达到设定的置信度门限，则直接输出识别结果，并反馈识别结果以调整该命令词权重；否则，则直接从缓存中将数据取出送入非常用词识别网络进行识别；
[0024](5)如果进入非常用词识别网络进行识别，则若识别结果达到设定的置信度门限，输出识别结果，否则拒识；并反馈识别结果以调整该命令词权重。
[0025]结合图2，所述词汇分组自优化调整过程为:接收识别结果反馈，对识别结果命令词进行权重调整；如果为正向反馈，则权重增加，如果为反向反馈则权重减小；根据调整后的权重重新进行命令词分组；所述正向反馈是指对每次识别结果的正确性给出确认，即用户接受一次识别结果为正向反馈，拒绝则为反向反馈。
[0026]上述过程存在于步骤(4)、(5)中，在接收到识别反馈结果后即开始自动调整命令词权重分并重新构建常用词和非常用词识别网络。
[0027]例如:用户对语音识别系统说“查天气”，识别系统会进行录音并提取其中的语音特征数据。先将特征数据送入常用命令词网络与命令词进行比对和匹配，而置信度门限就是匹配相似度的一种度量。这时，如果常用命令词网络中有达到置信度门限的命令词，那么输出识别结果，这时用户可以判断此输出结果是否自己想要得到的结果，如果是，则接受识别结果，同时系统会给这个识别结果命令词一个正向反馈，即增加权重分；如果不是用户想要的结果，则拒绝接受识别结果，系统会给这个识别结果命令词一个负向反馈，即减小这个命令词的权重分。
[0028]但是，如果常用命令词网络中没有匹配程度达到置信度门限的命令词，则将“查天气”这个命令词的语音特征数据送入非常用词网络进行识别。同样的，如果有达到置信度门限的命令词，则输出识别结果由用户判断是否接受结果，同样会根据用户的接受与否对识别出的这个命令词进行权重分数的调整，接受则为正向反馈，不接受则为负向反馈。
[0029]如果非常用词网络中也没有达到置信度门限的命令词，则系统对“查天气”这个命令词进行拒识，即不输出结果，同时提示无法识别。
[0030]在完成一次识别的过程后，命令词识别网络中的命令词权重分发生了变化。这时会根据现在的权重分重新生成常用词识别网络和非常用词识别网络，等待下一次识别。
[0031]本发明未详细阐述部分属于本领域公知技术。
[0032]以上所述，仅为本发明部分【具体实施方式】，但本发明的保护范围并不局限于此，任何熟悉本领域的人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。
【权利要求】
1.一种对用户语音识别结果反馈的命令词识别自适应优化方法，其特征在于实现如下: (1)将全部支持的命令词分为两组，一组词为用户常用命令词，另一组为用户不常用命令词； (2)将两组命令词分别构建语音识别网络，即常用命令词网络和非常用词识别网络； (3)将输入的语音信号送入常用命令词网络进行识别，同时将识别过程中提取出的语音特征数据送入缓存； (4)如果识别结果达到设定的置信度门限，则直接输出识别结果，并反馈识别结果以调整该命令词权重；否则，则直接从缓存中将数据取出送入非常用词识别网络进行识别； (5)如果进入非常用词识别网络进行识别，则若识别结果达到设定的置信度门限，输出识别结果，否则拒识；并反馈识别结果以调整该命令词权重。
2.根据权利要求1所述一种对用户语音识别结果反馈的命令词识别自适应优化方法，其特征在于:所述步骤(I)中的对支持的所有命令词进行权重评分，根据权重评分将全部命令词分为用户常用命令词和用户非常用命令词。
3.根据权利要求1所述一种对用户语音识别结果反馈的命令词识别自适应优化方法，其特征在于:所述步骤(2)中的非常用词识别网络构建为:把定义好的非常用词命令词集合送入识别系统，然后识别系统会将该命令词集合中的每个命令词转化成相应的声学音素序列，再将这些音素序列组合成一个图网络，即为非常用词识别网络。
4.根据权利要求1所述一种对用户语音识别结果反馈的命令词识别自适应优化方法，其特征在于:所述步骤(4)、(5)中的调整该命令词权重的过程为:接收识别结果反馈，对识别结果命令词进行权重调整；如果为正向反馈，则权重增加，如果为反向反馈则权重减小；根据调整后的权重重新进行命令词分组；所述正向反馈是指对每次识别结果的正确性给出确认，即用户接受一次识别结果为正向反馈，拒绝则为反向反馈。
【文档编号】G10L15/00GK103531197SQ201310473360
【公开日】2014年1月22日申请日期:2013年10月11日优先权日:2013年10月11日
【发明者】张伟, 梅珂, 陈盛, 鹿晓亮, 单言丰申请人:安徽科大讯飞信息科技股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张伟;梅珂;陈盛;鹿晓亮;单言丰
技术所有人：安徽科大讯飞信息科技股份有限公司
我是此专利的发明人

上一篇：语音增强方法
上一篇：利用纹理特征与随机森林的快速抗噪鸟鸣声识别方法