一种语音识别方法和设备的制作方法

文档序号:2825465阅读:361来源:国知局
一种语音识别方法和设备的制作方法
【专利摘要】本发明实施例公开了一种语音识别方法和设备,其中方法包括:获取用户指定的文本文件,并按照预定规则从文本文件中提取命令词得到命令词列表;将命令词列表与命令词库相比较,确认命令词列表中是否包含新命令词,所述新命令词为命令词列表中包含而命令词库中不包含的命令词;如果命令词列表中包含新命令词,则根据新命令词生成对应的新发音词典并训练得到新语言模型;将新语言模型合并到与命令词库对应的语言模型库中;接收语音,根据与命令词库对应的声学模型、发声词典和语言模型库进行语音识别。以上方案,采用在线获取的命令词和在线内容紧密相关,所以命令词数量有限,远远小于常用词汇的数量,在保证命令词的高识别率并且模型文件较小。
【专利说明】一种语音识别方法和设备
【技术领域】
[0001]本发明涉及电学【技术领域】,特别涉及一种语音识别方法和设备。
【背景技术】
[0002]人类利用语言相互交流信息,语言包括:语音和文字两种表现方式。通过语音相互传递信息,是人类最重要的基本功能之一。随着信息技术的发展,人与机器之间也需要进行大量的信息交换,目前计算机已经开始模拟人类交流信息的过程。
[0003]人类交流信息的过程包括:1、自然语言生成:将大脑产生的思想转换成语言;2、语音合成:将语言转换成语音;3、语音识别:识别表达语言的语音内容;4、自然语言理解:理解语音所表达的语言意义。其中前两点是说者执行过程,后两点是听者执行过程。其中,语音识别是上述过程中的“识别表达语言的语音内容”,对于设备而言就是:识别人类所说的语音,并将其转化成文字。以下将就几个方面对语音识别进行说明。
[0004]一、设备语音识别基本原理:
[0005]语音识别是一种模式识别系统,语音识别包含如下步骤:
[0006]1、语言输入;
[0007]2、预处理;
[0008]3、特征提取,作为两个分支分别进入4的训练类聚以及5?7的识别操作;
[0009]4、训练类聚得到模板库;
[0010]5、使用模板库的参考模式执行相似度比较;
[0011]6、执行识别过程中对5中结果进行失真检测,然后进入7 ;
[0012]7、输出识别结果。
[0013]其中,预处理部分包括语音信号的采样、滤波等处理,特征提取的作用是从语音信号中提取出几组能描述其信号特征的参数,如能量、共振峰、倒谱系数等,以便于训练和识另O。建立语音识别系统的过程是,先用大量语音进行训练得到模板库,然后读取模板库的模板,和待识别语音进行相似度比较,得到识别结果。
[0014]以下对本申请文件提到的名词说明如下:
[0015]训练(Training):预先分析出语音特征参数,制作语音模板(Template)并存放在语音参数库中,模板也可以叫做模型,主要有两种模型:声学模型(AM,acoustic model)和语言模型(LM,language model)。声学模型用以从声音信号中识别出“音”,而语言模型用以把音转换成“字”。
[0016]识别(Recognition):待识语音经过与训练时相同的分析,得到语音参数,将它与库中的参考模板一一比较,并采用判决的方法找出最接近语音特征的模板,得出识别结果,这里的识别结果表现为文字的形式。
[0017]失真测度(Distortion Measures):在进行比较时要有个标准,这就是计量语音特征参数矢量之间的“失真测度”。失真测度是语音识别过程中的比较,失真测度的计算公式有多种,例如:计算语音特征参数矢量之间的距离,更具体地:语音特征参数矢量A(xl,yl)和语音特征参数矢量B (x2,y2)间的失真测度
【权利要求】
1.一种语音识别方法,其特征在于,包括: 获取用户指定的文本文件,并按照预定规则从文本文件中提取命令词得到命令词列表; 将命令词列表与命令词库相比较,确认命令词列表中是否包含新命令词,所述新命令词为命令词列表中包含而命令词库中不包含的命令词; 如果命令词列表中包含新命令词,则根据新命令词生成对应的新发音词典并训练得到新语目模型; 将新语言模型合并到与命令词库对应的语言模型库中; 接收语音,根据与命令词库对应的声学模型、发声词典和语言模型库进行语音识别。
2.根据权利要求1所述方法,其特征在于,所述获取用户指定的文本文件包括:从用户输入的指定地址获取文本文件,或者,获取用户输入的文本文件。
3.根据权利要求1所述方法,其特征在于,所述按照预定规则从文本文件中提取命令词得到命令词列表包括: 读取文本文件的内容,并对其进行分词;然后按照预定规则从分词结果中选择命令词得到命令词列表。
4.根据权利要求1至3任意一项所述方法,其特征在于,所述方法还包括: 通过所述语音识别获得语音识别的结果,确定所述语音识别的结果是否为预设标志命令词; 若所述语音识别的结果为预设标志命令词,则获取所述预设标志命令词对应的文本文件;否则执行语音识别的结果对应的操作。
5.根据权利要求1至3任意一项所述方法,其特征在于,在语音识别完成后,所述方法还包括: 确定所述用户指定的文本文件是否发生变化;若所述用户指定的文本文件发生变化,则获取发生变化后的文本文件;否则执行语音识别的结果对应的操作。
6.一种语音识别方法,其特征在于,包括: 接收语音,并依据与命令词库对应的声学模型、发声词典和语言模型库进行语音识别得到语音识别的结果; 若语音识别的结果为预设标志命令词,则获取所述预设标志命令词对应的文本文件;若语音识别的结果不是预设标志命令词,则执行语音识别的结果对应的操作; 按照预定规则从所述预设标志命令词对应的文本文件中提取命令词得到命令词列表; 将命令词列表与命令词库相比较,确认命令词列表中是否包含新命令词,所述新命令词为命令词列表中包含而命令词库中不包含的命令词; 如果命令词列表中包含新的命令词,则根据新命令词生成对应的新发音词典并训练得到新语言模型;将新语言模型合并到与命令词库对应的语言模型库中。
7.根据权利要求6所述方法,其特征在于,所述获取所述预设标志命令词对应的文本文件包括:从所述预设标志命令词对应的地址获取文本文件,或者,获取所述预设标志命令词对应的用户输入的文本文件。
8.一种语音识别设备,其特征在于,包括:文本获取单元,用于获取用户指定的文本文件; 列表生成单元,用于按照预定规则从文本获取单元获取的文本文件中提取命令词得到命令词列表; 确定单元,用于将列表生成单元得到的命令词列表与命令词库相比较,确认命令词列表中是否包含新命令词,所述新命令词为命令词列表中包含而命令词库中不包含的命令词; 训练生成单元,用于如果确定单元确定结果为:命令词列表中包含新命令词,则根据新命令词生成对应的新发音词典并训练得到新语言模型;将新语言模型合并到与命令词库对应的语言模型库中; 语音接收单元,用于接收语音; 识别单元,用于根据与命令词库对应的声学模型、发声词典和语言模型库对语音接收单元接收的语音进行语音识别。
9.根据权利要求8所述设备,其特征在于, 所述文本获取单元,具体用于获取用户指定的文本文件包括:从用户输入的指定地址获取文本文件,或者,获取用户输入的文本文件。
10.根据权利要求8所述设备,其特征在于, 所述列表生成单元,具体用于读取文本文件的内容,并对其进行分词;然后按照预定规则从分词结果中选择命令词得到命令词列表。
11.根据权利要求8至10任意一项所述设备,其特征在于,` 所述确定单元,还用于在识别单元进行语音识别完成后,确定语音识别的结果是否为预设标志命令词; 所述文本获取单元,还用于若确定单元确定结果为预设标志命令词,则获取所述预设标志命令词对应的文本文件; 执行单元,用于若确定单元确定结果为不是预设标志命令词,则执行语音识别的结果对应的操作。
12.根据权利要求8至10任意一项所述设备,其特征在于, 所述确定单元,还用于在语音识别完成后,确定所述用户指定的文本文件是否发生变化; 所述文本获取单元,还用于若确定单元确定所述用户指定的文本文件发生变化,则获取发生变化后的文本文件; 执行单元,用于若确定单元确定所述用户指定的文本文件未发生变化,则执行语音识别的结果对应的操作。
13.一种语音识别设备,其特征在于,包括: 语音接收单元,用于接收语音; 识别单元,用于依据与命令词库对应的声学模型、发声词典和语言模型库对语音接收单元接收的语音进行语音识别得到语音识别的结果; 确定单元,用于确定识别单元得到的语音识别的结果是否为预设标志命令词; 文本获取单元,用于若确定单元确定语音识别的结果为预设标志命令词,则获取所述预设标志命令词对应的文本文件;执行单元,用于若确定单元确定语音识别的结果不是预设标志命令词,则执行语音识别的结果对应的操作; 列表生成单元,用于按照预定规则从所述预设标识命令词对应的文本文件中提取命令词得到命令词列表; 所述确定单元,还用于将将列表生成单元得到的命令词列表与命令词库相比较,确认命令词列表中是否包含新命令词,所述新命令词为命令词列表中包含而命令词库中不包含的命令词; 训练生成单元,用于如果确定单元确定命令词列表中包含新命令词,则根据新命令词生成对应的新发音词典并训练得到新语言模型;将新语言模型合并到与命令词库对应的语言模型库中。
14.根据权利要求13所述设备,其特征在于, 所述文本获取单元,具体用于若确定单元确定语音识别的结果为预设标志命令词,则从所述预设标志命令词对应的地址获取文本文件,或者,获取所述预设标志命令词对应的用户输入的文本文件。
【文档编号】G10L15/08GK103680498SQ201210363804
【公开日】2014年3月26日 申请日期:2012年9月26日 优先权日:2012年9月26日
【发明者】刘长娥, 张德明 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1