1.一种改进语音识别系统的神经网络语言模型的装置,包括:
词分类单元,其对上述语音识别系统的词典中的词进行分类;
语言模型训练单元,其基于分类的结果训练基于类的语言模型;和
向量拼接单元,其将上述基于类的语言模型的输出向量与上述神经网络语言模型的位置指示向量拼接,作为上述神经网络语言模型的输入向量。
2.根据权利要求1所述的改进神经网络语言模型的方法,其中,
上述词分类单元,基于预定的标准对上述词典中的词进行分类。
3.根据权利要求2所述的改进神经网络语言模型的方法,其中,
上述预定的标准包括词性、语义和语用信息。
4.根据权利要求3所述的改进神经网络语言模型的方法,其中,
上述词分类单元,基于词性以预定的分类方式对上述词典中的词进行分类。
5.根据权利要求1-4的任一项所述的改进神经网络语言模型的方法,其中,
上述语言模型训练单元,以预定的阶数训练基于类的语言模型。
6.根据权利要求1-4的任一项所述的改进神经网络语言模型的方法,其中,
上述基于类的语言模型包括APRA语言模型、NN语言模型和RF语言模型。
7.根据权利要求6所述的改进神经网络语言模型的方法,其中,
上述NN语言模型包括DNN语言模型和RNN语言模型。
8.一种语音识别装置,具备:
语音输入单元,其用于输入待识别的语音;
文本句识别单元,其利用声学模型将上述语音识别为文本句;和
得分计算单元,其利用语言模型计算上述文本句的得分;
所述语言模型包括由权利要求1-7中任一项的装置改进后的语言模型。
9.一种改进语音识别系统的神经网络语言模型的方法,包括:
对上述语音识别系统的词典中的词进行分类;
基于分类的结果训练基于类的语言模型;和
将上述基于类的语言模型的输出向量与上述神经网络语言模型的位置指示向量拼接,作为上述神经网络语言模型的输入向量。
10.一种语音识别方法,包括:
输入待识别的语音;
利用声学模型将上述语音识别为文本句;和
利用语言模型计算上述文本句的得分;
所述语言模型包括由权利要求9所述的方法改进后的语言模型。