一种语音识别的方法

文档序号：2827827阅读：363来源：国知局

一种语音识别的方法
【专利摘要】一种语音识别方法，包括以下步骤：第一步，录入声音；第二步，分析录入信息的特性；获取用户的场景信息，根据所述场景信息匹配语法模型或语言模型；根据所述匹配的语法模型或语言模型进行模式匹配算法，得到语音识别结果。第三步，获取录音者的声音数据，判别语法模型和语言模型；第四步，所述根据所述匹配的语法模型或语言模型进行模式匹配算法。上述语音识别的方法，根据用户的场景信息匹配语法模型或语言模型，能在进行模式匹配算法时根据用户的场景信息改变语法模型或语言模型的参数，使得模式匹配算法所采用的语法模型或语言模型适应用户的交互场景，因此能提高语音识别的准确度。
【专利说明】一种语音识别的方法

【技术领域】
[0001]本发明涉及软件技术，尤其涉及一种语音识别的方法。

【背景技术】
[0002]语音识别是将人的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或字符序列等。传统的语音识别方法是采集语音，再对采集到的语音进行特征提取，特征提取是指将语音波形经过线性或非线性运算后得到一组矢量，然后通过模式匹配算法，将矢量转换为和模型最接近的发音单元序列，进而转换为语音识别结果。然而，传统的这种语音识别方法仅根据采集到的语音和固定的声学模型和语言模型(或者语法模型)进行模式匹配，识别准确度不高，为此，我们提出一种语音识别的方法。

【发明内容】

[0003]一种语音识别方法，包括以下步骤:
第一步，录入声音；
第二步，分析录入信息的特性；
获取用户的场景信息，根据所述场景信息匹配语法模型或语言模型；根据所述匹配的语法模型或语言模型进行模式匹配算法，得到语音识别结果；
第三步，获取录音者的声音数据，判别语法模型和语言模型；
第四步，所述根据所述匹配的语法模型或语言模型进行模式匹配算法，得到语音识别结果的步骤为:根据所述匹配的语法模型、语言模型和发音字典进行模式匹配算法，得到语首识别结果。
[0004]优选的，所述方法还包括根据所述位置信息和场景信息匹配发音字典的步骤。
[0005]优选的，所述录音者的声音数据为当时所处环境的所有的声音信息。
[0006]优选的，所述位置信息为用户的终端设备自动检测提供的地理位置或GPS定位信息，所述场景信息为用户交互过程中的场景变化数据。
[0007]优选的，所述位置信息为用户主动提供或修改的地理位置或GPS定位信息，所述场景信息为用户主动设定或更改的场景变化数据。
[0008]优选的，所述方法还包括获取用户的位置信息，根据所述位置信息匹配语法模型或语言模型的步骤。
[0009]上述语音识别的方法，根据用户的场景信息匹配语法模型或语言模型，能在进行模式匹配算法时根据用户的场景信息改变语法模型或语言模型的参数，使得模式匹配算法所采用的语法模型或语言模型适应用户的交互场景，因此能提高语音识别的准确度。

【专利附图】

【附图说明】
[0010]图1为发明的流程框图。

【具体实施方式】
[0011]一种语音识别方法，包括以下步骤:
第一步，录入声音。
[0012]第二步，分析录入信息的特性，获取用户的场景信息，根据所述场景信息匹配语法模型或语言模型；根据所述匹配的语法模型或语言模型进行模式匹配算法，得到语音识别结果。优选的，所述方法还包括获取用户的位置信息，根据所述位置信息匹配语法模型或语言模型的步骤。优选的，所述方法还包括根据所述位置信息和场景信息匹配发音字典的步骤。
[0013]第三步，获取录音者的声音数据，判别语法模型和语言模型；优选的，录音者的声音数据为当时所处环境的所有的声音信息。
[0014]第四步，所述根据所述匹配的语法模型或语言模型进行模式匹配算法，得到语音识别结果的步骤为:根据所述匹配的语法模型、语言模型和发音字典进行模式匹配算法，得到语音识别结果。优选的，所述位置信息为用户的终端设备自动检测提供的地理位置或GPS定位信息，所述场景信息为用户交互过程中的场景变化数据。优选的，所述位置信息为用户主动提供或修改的地理位置或GPS定位信息，所述场景信息为用户主动设定或更改的场景变化数据。
【权利要求】
1.一种语音识别方法，包括以下步骤: 第一步，录入声音；第二步，分析录入信息的特性；获取用户的场景信息，根据所述场景信息匹配语法模型或语言模型；根据所述匹配的语法模型或语言模型进行模式匹配算法，得到语音识别结果；第三步，获取录音者的声音数据，判别语法模型和语言模型；第四步，所述根据所述匹配的语法模型或语言模型进行模式匹配算法，得到语音识别结果的步骤为:根据所述匹配的语法模型、语言模型和发音字典进行模式匹配算法，得到语首识别结果。
2.根据权利要求1所述的一种语音识别方法，其特征在于:所述方法还包括根据所述位置信息和场景信息匹配发音字典的步骤。
3.根据权利要求1所述的一种语音识别方法，其特征在于:所述录音者的声音数据为当时所处环境的所有的声音信息。
4.根据权利要求1所述的一种语音识别方法，其特征在于:所述位置信息为用户的终端设备自动检测提供的地理位置或GPS定位信息，所述场景信息为用户交互过程中的场景变化数据。
5.根据权利要求1所述的一种语音识别方法，其特征在于:所述位置信息为用户主动提供或修改的地理位置或GPS定位信息，所述场景信息为用户主动设定或更改的场景变化数据。
6.根据权利要求1所述的一种语音识别方法，其特征在于:所述方法还包括获取用户的位置信息，根据所述位置信息匹配语法模型或语言模型的步骤。
【文档编号】G10L15/06GK104240698SQ201410492475
【公开日】2014年12月24日申请日期:2014年9月24日优先权日:2014年9月24日
【发明者】朱龙腾申请人:上海伯释信息科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱龙腾
技术所有人：上海伯释信息科技有限公司
我是此专利的发明人