一种基于HTK的连续语音识别系统的制作方法

文档序号:12128353阅读:502来源:国知局

本发明属于语音识别技术领域,特别是涉及一种基于HTK的连续语音识别系统。



背景技术:

根据识别任务的不同,语音识别具体可分为孤立词的语音识别和连续语音识别。它们的区别是:前者中待识别的语句中每个词之间都有明显的间隔,而后者中待识别语句中词与词之间已没有明显的间隔,每个词的发音都会受相邻词发音的影响而产生一些变化。因此,人们也尝试了各种方法来克服连续语音识别带来的挑战。HTK工具已成为在语音识别领域进行研究和实验的好助手。



技术实现要素:

本发明的目的在于提供一种基于HTK的连续语音识别系统,通过该系统的应用,解决了现有的问题。

为解决上述技术问题,本发明是通过以下技术方案实现的:

本发明为一种基于HTK的连续语音识别系统,包括依次连接的测试数据输入模块、特征提取模块、搜索与解码模块、识别结果输出模块,所述搜索与解码模块的输入端连接有声学模型和识别网络模块;所述声学模型的输入端连接有训练数据输入模块;所述识别网络模块的输入端连接有词典、任务语法和语言模型。

进一步地,所述测试数据输入模块用于获取语音信号并将其传至特征提取模块;所述特征提取模块用于对语音信号进行预处理并从中提取出语音特征,其中语音特征包括LPCC、MFCC;所述声学模型就是用来描述发音过程的一个数学模型,该数学模型为隐马尔可夫模型,通过事先准备好的一些训练数据,对建立的声学模型进行训练,从而得到这些模型的所有参数;所述识别网络模块就是在识别的过程中用来搜索最佳词序列的一个搜索空间;所述搜索与解码模块是语音识别系统中的核心部分,它用于在识别网络中搜索一条最优路径并使得该路径上的模型产生未知声音序列的概率为最大,继而把该路径上的模型对应的单词作为识别的结果输出。

本发明具有以下有益效果:

本发明通过测试数据输入模块接收语音信号,继而通过特征提取模块对语音信号进行预处理及语音特征的提取,便于后续模块对语音信号进一步分析处理;通过声学模型对训练数据进行训练,从而获得相应的模型参数,再通过识别网络模块提供最佳词序列的路径,然后通过搜索与解码模块根据最佳词序列途径进行搜索,并根据搜索结果与声学模型输出的模型参数进行匹配,继而输出识别结果,从而有利于提高语音识别的效率和准确度。

当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的一种基于HTK的连续语音识别系统的组成框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

请参阅图1所示,本发明为一种基于HTK的连续语音识别系统,包括依次连接的测试数据输入模块、特征提取模块、搜索与解码模块、识别结果输出模块,搜索与解码模块的输入端连接有声学模型和识别网络模块,声学模型的输入端连接有训练数据输入模块,识别网络模块的输入端连接有词典、任务语法和语言模型。

其中,测试数据输入模块用于获取语音信号并将其传至特征提取模块;特征提取模块用于对语音信号进行预处理并从中提取出语音特征,其中语音特征包括LPCC、MFCC;声学模型就是用来描述发音过程的一个数学模型,该数学模型为隐马尔可夫模型,通过事先准备好的一些训练数据,对建立的声学模型进行训练,从而得到这些模型的所有参数,以便在后面识别的时候使用;识别网络就是在识别的过程中用来搜索最佳词序列的一个搜索空间;搜索解码是语音识别系统中的核心部分,它用于在识别网络中搜索一条最优路径并使得该路径上的模型产生未知声音序列的概率为最大,继而把该路径上的模型对应的单词作为识别的结果输出。

在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

最后需要说明的是,以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1