基于垃圾模型的语音识别处理方法及装置的制造方法_2

文档序号：8944171阅读：来源：国知局

信号之间的关系。多个状态的数量根据实际应用需要进行设定，例如:语音信号的速度较快，则设置的状态数量较少，语音信号的速度较慢，则设置的状态数量较多。以状态数量为3举例说明如下:
[0031]假设三音子模型a-b+C，对应到语音数据中的I秒到2秒之间的时间段，那么与该三音子模型对应的三个状态信息的sl，s2, s3,其中，si对应的是Is到1.3s的状态，s2对应的是1.3s到1.7s的状态，s3对应的是1.7s到2.0s的状态。
[0032]针对每个音节而言，每个音节对应两个三音子模型，通过预先训练的隐马尔可夫模型，能够获取每个三音子模型对应的多个状态信息，从而能够获取与每个音节对应的三音子状态序列，三音子状态序列包括:与该音节对应的两个三音子模型对应的多个状态信息。举例说明，若与每个三音子模型对应的状态信息数量为3，则与每个音节对应的三音子状态序列包括:6个状态信息。
[0033]步骤103，根据与每个音节对应的三音子状态序列，从所述音节列表中筛选出多个建模音节，其中，所述多个建模音节的数量与预先设置的垃圾模型数目相同。
[0034]根据与每个音节对应的三音子状态序列从音节列表中筛选出多个建模音节。其中，根据三音子状态序列筛选出多个建模音节的方式很多，可以根据具体应用需要进行选择，例如:根据各个三音子状态序列之间的距离进行筛选，或者，根据预设的数学模型对各个三音子状态序列进行处理，获取各个音节之间的相似度，根据各个音节之间的相似度进行筛选。
[0035]需要强调的是，对音节列表中的音节进行筛选的原则是尽量删除相近的音节，保留差异较大的音节，以建立更加完备全面的垃圾模型，从而可以更好的模拟集外词情况。对音节列表中的音节进行筛选的数量是使得筛选出来的多个建模音节的数量与预先设置的垃圾模型数目相同。
[0036]步骤104，应用所述多个建模音节生成对应数量的多个垃圾模型，以采用所述多个垃圾模型进行语音识别处理。
[0037]应用从音节列表中筛选出的多个建模音节生成对应数量的多个垃圾模型，从而采用多个垃圾模型生成拒识网络，并应用拒识网络和预先建立的识别网络建立语音识别网络，对待处理的语音指令进行语音识别。
[0038]相比于现有技术中的一个通用垃圾模型或者以元音和辅音分别建立的两个垃圾模型，本实施例可以根据实际应用需要，建立基于音节聚类的合适数量的垃圾模型，例如根据应用需要建立50个垃圾模型，从而可以更加精准全面的模拟集外词，提高识别效果。
[0039]本申请实施例的基于垃圾模型的语音识别处理方法，首先获取待处理的音节列表中与每个音节对应的三音子模型；然后采用预先训练的隐马尔可夫模型，根据所述三音子模型获取与每个音节对应的三音子状态序列；进而根据与每个音节对应的三音子状态序列，从所述音节列表中筛选出多个建模音节，其中，所述多个建模音节的数量与预先设置的垃圾模型数目相同；最后应用所述多个建模音节生成对应数量的多个垃圾模型，以采用所述多个垃圾模型进行语音识别处理。由此，实现了建立与应用需要匹配数量的、基于音节聚类的垃圾模型，从而提高了建模组网的效率和灵活性，以及提高了语音识别处理的准确性。
[0040]针对图1所示实施例，根据三音子状态序列筛选出多个建模音节的方式很多，例如根据各个三音子状态序列之间的距离进行筛选，或者，根据各个三音子状态序列的相似度进行筛选，可以根据实际应用需要进行选择，为了更加清楚的描述如何根据三音子状态序列筛选出多个建模音节，通过图2所示实施例进行说明，具体如下:
[0041]图2是本申请另一个实施例的基于垃圾模型的语音识别处理方法的流程图。
[0042]如图2所示，本实施例是根据各个三音子状态序列之间的距离从音节列表中筛选多个建模音节，针对步骤103的实施过程，具体可以包括以下步骤:
[0043]步骤201，计算每两个三音子状态序列之间的距离。
[0044]具体地，根据与每个音节对应的三音子状态序列，计算每两个三音子状态序列之间的距离。需要注意的是，为了进一步地提高后续处理效率，可以直接对所获得的距离按照大小进彳丁排序。
[0045]步骤202，将所述距离低于预设的门限值的音节从所述音节列表中删除。
[0046]将获取的每两个三音子状态序列之间的距离与预设的门限值进行比较，将低于预设的门限值的距离对应的音节从音节列表中删除，举例说明如下:
[0047]假设音节A对应的三音子状态序列与音节B对应的三音子状态序列之间的距离20，音节A对应的三音子状态序列与音节C对应的三音子状态序列之间的距离30，门限25，则删除音节B ;假设音节A对应的三音子状态序列与音节B对应的三音子状态序列之间的距离20，音节B对应的三音子状态序列与音节C对应的三音子状态序列之间的距离10，门限15，则删除音节C。
[0048]步骤203，若判断获知剩余的音节数量与预先设置的垃圾模型数目相同，则停止删除，若判断获知剩余的音节数量大于预先设置的垃圾模型数目相同，则调整所述门限值，继续删除。
[0049]将距离低于门限值的音节从音节列表中删除后，判断音节列表中剩余的音节数量与预先设置的垃圾模型数目是否相同，根据判断结果采用不同的处理，具体如下:
[0050]若判断获知剩余的音节数量与预先设置的垃圾模型数目相同，则停止删除；若判断获知剩余的音节数量大于预先设置的垃圾模型数目，则调整预设的门限值，继续删除，直到剩余的音节数量与预先设置的垃圾模型数目是否相同。
[0051]需要注意的是，本实施例设置的门限值用于将小于该门限值的距离多对应的音节从音节列表中删除，直到剩余音节数量与预设的垃圾模型数量相同，因此，预设的门限值与上述过程匹配。
[0052]在另一个实施例中，也可以设置其他的门限值，根据该门限值用于将大于该门限值的距离多对应的音节在音节列表中保留，直到保留的音节数量与预设的垃圾模型数量相同，其实施过程类似，此处不再赘述。
[0053]本申请实施例的基于垃圾模型的语音识别处理方法，首先计算每两个三音子状态序列之间的距离，然后将所述距离低于预设的门限值的音节从所述音节列表中删除，最后若判断获知剩余的音节数量与预先设置的垃圾模型数目相同，则停止删除，否则，调整所述门限值，继续删除。由此，实现了建立与应用需要匹配数量的、基于音节聚类的垃圾模型，大大提高了建模组网的效率和灵活性。
[0054]图3是本申请另一个实施例的基于垃圾模型的语音识别处理方法的流程图。
[0055]如图3所示，基于上述实施，在步骤104之后，还可以包括以下步骤:
[0056]步骤301，采用所述多个垃圾模型生成拒识网络。
[0057]步骤302，应用所述拒识网络和预先建立的识别网络建立语音识别网络。
[0058]具体地，采用上述实施例生成的多个垃圾模型生成拒识网络，并应用拒识网络和预先建立的识别网络建立语音识别网络。其中，拒识网络用于更加精准全面的模拟集外词，识别网络用于识别待处理的语音指令是否属于集内词表中的指令，其中，识别网络也预先通过隐马尔科夫模型或者其他模型生成，该过程不是本实施例的发明点，因此不再赘述，
[0059]步骤303，采用所述语音识别网络对输入的语音指令进行识别。
[0060]步骤304，若判断获知所述拒识网络的识别权重大于所述识别网络，则确定所述语音指令属于集外词，输出拒识响应；若判断获知所述拒识网络的识别权重小于所述识别网

完整全部详细技术资料下载

当前第2页1 2 3 4