异构解码网络的构建方法及系统、语音识别方法及系统的制作方法

文档序号：2827587阅读：236来源：国知局

异构解码网络的构建方法及系统、语音识别方法及系统的制作方法
【专利摘要】本发明公开了一种异构解码网络的构建方法及系统、语音识别方法及系统，构建方法包括：获取业务所需的命令词解码网络和听写解码网络；构建命令词训练数据集和听写训练数据集；利用命令词训练数据集和听写训练数据集，确定命令词解码网络的补偿得分；优化命令词解码网络，并使优化后的命令词解码网络的每个弧上保存有命令词条、补偿得分、以及对应命令词条的声学模型得分；将优化后的命令词解码网络和听写解码网络并联组成异构解码网络。应用本发明实施例异构解码网络的构建方法及系统，通过配置一套识别引擎完成多种不同业务的并联识别、节省系统资源；应用本发明实施例语音识别方法及系统，可以提高识别效果及识别效率，降低系统的复杂度。
【专利说明】异构解码网络的构建方法及系统、语音识别方法及系统

【技术领域】
[0001] 本发明涉及语音信号处理【技术领域】，尤其涉及一种异构解码网络的构建方法及系统、语音识别方法及系统。

【背景技术】
[0002] 语音识别技术就是让机器通过识别和理解过程将语音信号转变为相应的文本或命令的技术。现有的语音识别系统，通常只能单独支持命令词识别（基于规则的语音识别系统）或听写识别（基于统计的语音识识别系统）。因此，在一些多业务的场景（比如在车载设备上的应用，既需要命令词识别，如"打电话给 XXX"、"发短信给XXX"，还需要听写识别，如短信的内容，导航的目的地等；再比如手机语音助手上的使用，对于大部分的功能，比如聊天、查天气、查股票等都是听写识别，但是打电话和发短信功能都是使用的命令词识另IJ)下，需要同时配置这两种系统，实现多种不同语音业务的并联识别。
[0003] 基于规则的语音识别系统利用命令词解码网络实现解码，而基于统计的语音识别系统利用听写解码网络实现解码。由于这两种类型的解码网络的结构不同，所以针对这两种类型的解码网络需要分别配置不同的识别引擎才能完成识别工作。这种方式不仅会占用大量系统资源，影响系统性能，而且，由于听写解码网络和命令词解码网络的结构不一致，需要进行置信度判决来选择最终的识别结果，可靠性差，效率低，而且增加了整个语音识别系统的复杂度。

【发明内容】

[0004] 本发明实施例一方面提供了一种异构解码网络的构建方法及系统，可以在多业务的场景下，通过配置一套识别引擎完成多种不同业务的并联识别、节省系统资源。
[0005] 本发明实施例另一方面提供了一种基于该异构解码网络的语音识别方法及系统，以提高识别效果及识别效率，降低系统的复杂度。
[0006] 本发明实施例提供一种异构解码网络的构建方法，包括：
[0007] 获取业务所需的命令词解码网络和听写解码网络，所述命令词解码网络的每个弧上保存有一个命令词条以及对应所述命令词条的声学模型得分，所述听写解码网络的每个弧上保存有一个听写词条以及均对应所述听写词条的声学模型得分和语言模型得分；
[0008] 构建命令词训练数据集和听写训练数据集，所述命令词训练数据集内的命令词训练数据由所述命令词条构成，所述听写训练数据集内的听写训练数据由所述听写词条构成；
[0009] 利用所述命令词训练数据集和所述听写训练数据集，确定命令词解码网络的补偿得分；
[0010] 优化所述命令词解码网络，并使优化后的命令词解码网络的每个弧上保存有所述命令词条、所述补偿得分、以及对应所述命令词条的声学模型得分；
[0011] 将优化后的命令词解码网络和所述听写解码网络并联组成异构解码网络。
[0012] 优选地，所述利用所述命令词训练数据集和所述听写训练数据集，确定命令词解码网络的补偿得分包括：
[0013] 依次将所述命令词训练数据集内的每一个命令词训练数据输入至所述命令词解码网络和所述听写解码网络，分别得到对应所述命令词训练数据的第一命令词网络得分和第一听写网络得分；所述第一命令词网络得分为与所述命令词训练数据相匹配的命令词条对应的声学模型得分，所述第一听写网络得分为与所述命令词训练数据相匹配的听写词条对应的声学模型得分和语言模型得分之和；
[0014] 依次将所述听写训练数据集内的每一个听写训练数据分别输入至所述命令词解码网络和所述听写解码网络，分别得到对应所述听写训练数据的第二命令词网络得分和第二听写网络得分，所述第二命令词网络得分为与所述听写训练数据相匹配的命令词条对应的声学模型得分，所述第二听写网络得分为与所述听写训练数据相匹配的听写词条对应的声学模型得分和语言模型得分之和；
[0015] 确定所述命令词解码网络的补偿得分，并使所述补偿得分满足预设条件：对于命令词训练数据集内的设定比例的命令词训练数据，所述第一命令词网络得分与所述补偿得分之和大于所述第一听写网络得分；对于听写训练数据集内的设定比例的听写训练数据，所述第二命令词网络得分与所述补偿得分之和小于所述第二听写网络得分。
[0016] 优选地，所述确定所述命令词解码网络的补偿得分，并使所述补偿得分满足预设条件包括：
[0017] 获取满足第一取值范围且能够整除第一步进量的第一参数，以及满足第二取值范围且能够整除第二步进量的第二参数的所有参数组合；
[0018] 依次对每一组参数组合，获取所述命令词训练数据集内满足第一预设条件的命令词训练数据个数，所述第一预设条件为：所述第一参数和所述命令词训练数据对应的第一命令词网络得分的乘积与所述第二参数的和，大于所述命令词训练数据对应的第一听写网络得分；
[0019] 依次对每一组参数组合，获取所述听写训练数据集内满足第二预设条件的听写训练数据个数，所述第二预设条件为：所述第一参数和所述听写训练数据对应的第二命令词网络得分的乘积与所述第二参数的和，小于所述听写训练数据对应的第二听写网络得分；
[0020] 确定优选参数组合，所述优选参数组合对应的命令词训练数据个数和听写训练数据个数之和，大于其它参数组合对应的命令词训练数据个数和听写训练数据个数之和；
[0021] 将所述优选参数组合中第一参数和任意第一命令词网络得分的乘积与所述优选参数组合中第二参数的和，再减去所述第一命令词网络得分所得的结果，作为所述命令词解码网络的补偿得分。
[0022] 优选地，所述确定所述命令词解码网络的补偿得分，并使所述补偿得分满足预设条件包括：
[0023] 获取满足设定的取值范围且能够整除设定的步进量的参数集合；
[0024] 依次对所述参数集合中的每一个参数，获取所述命令词训练数据集内满足第三预设条件的命令词训练数据个数，所述第三预设条件为：所述命令词训练数据对应的第一命令词网络得分与所述参数的和，大于所述命令词训练数据对应的第一听写网络得分；
[0025] 依次对所述参数集合中的每一个参数，获取所述听写训练数据集内满足第四预设条件的听写训练数据个数，所述第四预设条件为：所述听写训练数据对应的第二命令词网络得分与所述参数的和，小于所述听写训练数据对应的第二听写网络得分；
[0026] 确定优选参数，所述优选参数对应的命令词训练数据个数和听写训练数据个数之和，大于其它参数对应的命令词训练数据个数和听写训练数据个数之和；
[0027] 将所述优选参数作为所述命令词解码网络补偿得分。
[0028] 本发明实施例还提供一种异构解码网络的构建系统，包括：
[0029] 解码网络获取单元，用于获取业务所需的命令词解码网络和听写解码网络，所述命令词解码网络的每个弧上保存有一个命令词条以及对应所述命令词条的声学模型得分，所述听写解码网络的每个弧上保存有一个听写词条以及均对应所述听写词条的声学模型得分和语言模型得分；
[0030] 训练数据集构建单元，用于构建命令词训练数据集和听写训练数据集，所述命令词训练数据集内的命令词训练数据由所述命令词条构成，所述听写训练数据集内的听写训练数据由所述听写词条构成；
[0031] 补偿得分确定单元，用于利用所述命令词训练数据集和所述听写训练数据集，确定命令词解码网络的补偿得分；
[0032] 优化单元，用于优化所述命令词解码网络，并使优化后的命令词解码网络的每个弧上保存有所述命令词条、所述补偿得分、以及对应所述命令词条的声学模型得分；
[0033] 并联单元，用于将优化后的命令词解码网络和所述听写解码网络并联组成异构解码网络。
[0034] 优选地，所述补偿得分确定单元包括：
[0035] 第一网络得分获取单元，用于依次将所述命令词训练数据集内的每一个命令词训练数据输入至所述命令词解码网络和所述听写解码网络，分别得到对应所述命令词训练数据的第一命令词网络得分和第一听写网络得分；所述第一命令词网络得分为与所述命令词训练数据相匹配的命令词条对应的声学模型得分，所述第一听写网络得分为与所述命令词训练数据相匹配的听写词条对应的声学模型得分和语言模型得分之和；
[0036] 第二网络得分获取单元，用于依次将所述听写训练数据集内的每一个听写训练数据分别输入至所述命令词解码网络和所述听写解码网络，分别得到对应所述听写训练数据的第二命令词网络得分和第二听写网络得分，所述第二命令词网络得分为与所述听写训练数据相匹配的命令词条对应的声学模型得分，所述第二听写网络得分为与所述听写训练数据相匹配的听写词条对应的声学模型得分和语言模型得分之和；
[0037] 第一补偿得分确定单元，用于确定所述命令词解码网络的补偿得分，并使所述补偿得分满足预设条件：对于命令词训练数据集内的设定比例的命令词训练数据，所述第一命令词网络得分与所述补偿得分之和大于所述第一听写网络得分；对于听写训练数据集内的设定比例的听写训练数据，所述第二命令词网络得分与所述补偿得分之和小于所述第二听写网络得分。
[0038] 优选地，所述第一补偿得分确定单元包括：
[0039] 参数组合获取单元，用于获取满足第一取值范围且能够整除第一步进量的第一参数，以及满足第二取值范围且能够整除第二步进量的第二参数的所有参数组合；
[0040] 第一命令词训练数据个数获取单元，用于依次对每一组参数组合，获取所述命令词训练数据集内满足第一预设条件的命令词训练数据个数，所述第一预设条件为：所述第一参数和所述命令词训练数据对应的第一命令词网络得分的乘积与所述第二参数的和，大于所述命令词训练数据对应的第一听写网络得分；
[0041] 第一听写训练数据个数获取单元，用于依次对每一组参数组合，获取所述听写训练数据集内满足第二预设条件的听写训练数据个数，所述第二预设条件为：所述第一参数和所述听写训练数据对应的第二命令词网络得分的乘积与所述第二参数的和，小于所述听写训练数据对应的第二听写网络得分；
[0042] 优选参数组合确定单元，用于确定优选参数组合，所述优选参数组合对应的命令词训练数据个数和听写训练数据个数之和，大于其它参数组合对应的命令词训练数据个数和听写训练数据个数之和；
[0043] 第二补偿得分确定单元，用于将所述优选参数组合中第一参数和任意第一命令词网络得分的乘积与所述优选参数组合中第二参数的和，再减去所述第一命令词网络得分所得的结果，作为所述命令词解码网络的补偿得分。
[0044] 优选地，所述第一补偿得分确定单元包括：
[0045] 参数集合获取单元，用于获取满足设定的取值范围且能够整除设定的步进量的参数集合；
[0046] 第二命令词训练数据个数获取单元，用于依次对所述参数集合中的每一个参数，获取所述命令词训练数据集内满足第三预设条件的命令词训练数据个数，所述第三预设条件为：所述命令词训练数据对应的第一命令词网络得分与所述参数的和，大于所述命令词训练数据对应的第一听写网络得分；
[0047] 第二听写训练数据个数获取单元，用于依次对所述参数集合中的每一个参数，获取所述听写训练数据集内满足第四预设条件的听写训练数据个数，所述第四预设条件为：所述听写训练数据对应的第二命令词网络得分与所述参数的和，小于所述听写训练数据对应的第二听写网络得分；
[0048] 优选参数确定单元，用于确定优选参数，所述优选参数对应的命令词训练数据个数和听写训练数据个数之和，大于其它参数对应的命令词训练数据个数和听写训练数据个数之和；
[0049] 第三补偿得分确定单元，用于将所述优选参数作为所述命令词解码网络补偿得分。
[0050] 本发明实施例还提供一种基于所述的异构解码网络的语音识别方法，包括：
[0051] 获取语音数据；
[0052] 将所述语音数据分别输入至所述优化后的命令词解码网络以及所述听写解码网络中，分别得到命令词网络得分和听写网络得分；所述命令词网络得分为与所述语音数据相匹配的命令词条对应的声学模型得分与所述补偿得分之和，所述听写网络得分为与所述语音数据相匹配的听写词条对应的声学模型得分和语言模型得分之和；
[0053] 判断所述命令词网络得分是否大于所述听写网络得分；
[0054] 如果是，则确定所述与语音数据相匹配的命令词条为语音识别结果；
[0055] 否则，确定所述与语音数据相匹配的听写词条为语音识别结果。
[0056] 本发明实施例还提供一种基于所述的异构解码网络的语音识别系统，包括：
[0057] 语音数据获取单元，用于获取语音数据；
[0058] 网络得分获取单元，用于将所述语音数据分别输入至所述优化后的命令词解码网络以及所述听写解码网络中，分别得到命令词网络得分和听写网络得分；所述命令词网络得分为与所述语音数据相匹配的命令词条对应的声学模型得分与所述补偿得分之和，所述听写网络得分为与所述语音数据相匹配的听写词条对应的声学模型得分和语言模型得分之和；
[0059] 判断单元，用于判断所述命令词网络得分是否大于所述听写网络得分；
[0060] 确定单元，用于在所述命令词网络得分大于所述听写网络得分的情况下，确定所述与语音数据相匹配的命令词条为语音识别结果；在所述命令词网络得分小于或等于所述听写网络得分的情况下，确定所述与语音数据相匹配的听写词条为语音识别结果。
[0061] 本发明实施例异构解码网络的构建方法及系统，通过将命令词解码网络构建成与听写解码网络一样的网络结构，可以实现命令词解码网络和听写解码网络的并联，从而在多业务的场景下，通过配置一套识别引擎完成多种不同业务的并联识别，大大节省了系统资源，增强系统性能。另外，应用本发明实施例基于异构解码网络的语音识别方法及系统，由于命令词解码网络与听写解码网络的结构相同，所以可以通过简单地比较两个解码网络输出的网络得分来选择最终的识别结果，提高了对语音数据的识别效果及识别效率，降低了系统的复杂度。

【专利附图】

【附图说明】
[0062] 图1示出了本发明实施例异构解码网络的构建方法的流程图；
[0063] 图2示出了本发明实施例中利用命令词训练数据集和听写训练数据集，确定命令词解码网络的补偿得分的流程图；
[0064] 图3示出了本发明实施例中确定所述命令词解码网络的补偿得分，并使补偿得分满足预设条件的一种流程图；
[0065] 图4示出了本发明实施例中确定所述命令词解码网络的补偿得分，并使补偿得分满足预设条件的另一种流程图；
[0066] 图5示出了本发明实施例异构解码网络的构建系统的结构示意图；
[0067] 图6示出了本发明实施例中补偿得分确定单元的结构示意图；
[0068] 图7示出了本发明实施例中第一补偿得分确定单元的一种结构示意图；
[0069] 图8示出了本发明实施例中第一补偿得分确定单元的另一种结构示意图；
[0070] 图9示出了本发明实施例基于异构解码网络的语音识别方法的流程图；
[0071] 图10示出了本发明实施例基于异构解码网络的语音识别系统的结构示意图。

【具体实施方式】
[0072] 下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能解释为对本发明的限制。
[0073] 为了解决现有技术中命令词解码网络和听写解码网络的结构不同导致的：需要分别配置不同的识别引擎才能完成识别工作，会占用大量系统资源，影响系统性能；需要进行置信度判决来选择最终的识别结果，可靠性差，效率低，而且增加了整个语音识别系统的复杂度，本发明实施例一方面提供了一种异构解码网络的构建方法及系统，可以在多业务的场景下，通过配置一套识别引擎完成多种不同业务的并联识别、节省系统资源。
[0074] 如图1所示，是本发明实施例异构解码网络的构建方法的流程图，所述异构解码网络的构建方法包括以下步骤：
[0075] 步骤101 :获取业务所需的命令词解码网络和听写解码网络，所述命令词解码网络的每个弧上保存有一个命令词条以及对应所述命令词条的声学模型得分，所述听写解码网络的每个弧上保存有一个听写词条以及均对应所述听写词条的声学模型得分和语言模型得分。
[0076] 具体地，根据业务需求构建解码网络是语音识别的前提，解码网络的基本结构是一个有向图，由结点和弧组成，弧上保存了一个词条以及这个词条的声学模型信息和/或语言模型信息，声学模型信息一般表现为声学模型得分，语言模型信息一般表现为语言模型得分，语音识别就是根据输入的语音数据在这个有向图上寻找一条最优路径的过程。 [0077] 本发明实施例涉及到两种解码网络，分别为命令词解码网络与听写解码网络，其中命令词解码网络是针对特定业务构建的网络，通常只支持特定的命令词，即：命令词解码网络的每个弧上保存有一个命令词条以及对应所述命令词条的声学模型得分。例如可以针对导航业务构建一个命令词解码网络"导航到{地名}"，该命令词解码网络的每个弧上保存有一个地名（例如"北京路"、"南京路"、"上海路"等）以及对应该地名的声学模型得分，可以看出命令词解码网络的结构简单，仅支持特点说法，是针对命令词条的识别，并且该解码网络的弧上仅保存有命令词条和声学模型得分，未保存语言模型得分，这是由命令词解码网络的特点决定的。听写解码网络比命令词解码网络更为复杂，听写解码网络的每个弧上保存有一个听写词条以及均对应所述听写词条的声学模型得分和语言模型得分，可以看出听写解码网络能够支持通用识别。
[0078] 基于以上两种类型的解码网络的特点，在某些情况下，需要能够对某个特定的业务有较好的支持，同时又能支持通用转写，就需要同时使用命令词解码网络和听写解码网络，也就是解码网络并联的技术，同时使用两种解码网络进行语音识别，根据得分选取最优结果，具体的网络并联方法将结合以下步骤102至步骤105进行详细地阐述。
[0079] 步骤102 :构建命令词训练数据集和听写训练数据集，所述命令词训练数据集内的命令词训练数据由所述命令词条构成，所述听写训练数据集内的听写训练数据由所述听写词条构成。
[0080] 比如，所述命令词训练数据集包括5000句命令词录音，每一条命令词录音为一个命令词训练数据；所述听写训练数据集包括5000句听写录音，每一条听写录音为一个听写训练数据。
[0081] 步骤103 :利用所述命令词训练数据集和所述听写训练数据集，确定命令词解码网络的补偿得分。
[0082] 具体地，在构建完成命令词训练数据集和听写训练数据集训练集之后，就可以开始进行参数的训练了。在本发明的一优选实施例中，采用一阶线性分类的方法对参数进行训练，最终得到最优的补偿得分。所述利用命令词训练数据集和听写训练数据集，确定命令词解码网络的补偿得分的方法将在下文中结合图2至图4进行详细地阐述。
[0083] 通过上述训练方法得到的最优的补偿得分可以看作是命令词解码网络的通用的语言模型得分（即补偿得分）。
[0084] 步骤104 :优化所述命令词解码网络，并使优化后的命令词解码网络的每个弧上保存有所述命令词条、所述补偿得分、以及对应所述命令词条的声学模型得分。
[0085] 具体地，经过优化处理后，所述优化后的命令词解码网络的每个弧上保存有一个命令词条、补偿得分以及与所述命令词条相对应的声学模型得分，由于补偿得分可以看成是命令词解码网络的语言模型得分，所以，优化后的命令词解码网络的网络结构与听写解码网络的网络结构是一致的。
[0086] 步骤105 :将优化后的命令词解码网络和所述听写解码网络并联组成异构解码网络。
[0087] 具体地，将网络结构一致的优化后的命令词解码网络和听写解码网络并联组成异构解码网络。
[0088] 如图2所示，是本发明实施例中利用命令词训练数据集和听写训练数据集，确定命令词解码网络的补偿得分的流程图，所述确定命令词解码网络的补偿得分包括以下步骤：
[0089] 步骤201 :依次将所述命令词训练数据集内的每一个命令词训练数据输入至所述命令词解码网络和所述听写解码网络，分别得到对应所述命令词训练数据的第一命令词网络得分和第一听写网络得分；所述第一命令词网络得分为与所述命令词训练数据相匹配的命令词条对应的声学模型得分，所述第一听写网络得分为与所述命令词训练数据相匹配的听写词条对应的声学模型得分和语言模型得分之和。
[0090] 具体地，所述命令词解码网络的每个弧上不仅包括命令词条和与该命令词条相对应的声学模型得分，还包括与该命令词条相对应的声学特征，同样地，所述听写解码网络的每个弧上不仅包括听写词条以及均与该听写词条相对应的声学模型得分和语言模型得分，还包括该听写词条的声学特征。
[0091] 第一命令词网络得分的获取过程为：将一个命令词训练数据输入至命令词解码网络后，命令词解码网络比较该命令词训练数据的声学特征与该命令词解码网络具有的各个弧上的命令词条的声学特征，通过比较，确定一个与该命令词训练数据的声学特征最匹配的命令词条，并将该命令词条对应的声学模型得分作为针对该命令词训练数据的第一命令词网络得分。
[0092] 第一听写网络得分的获取过程为：将一个命令词训练数据输入至听写解码网络后，听写解码网络比较该命令词训练数据的声学特征与该听写解码网络具有的各个弧上的听写词条的声学特征，通过比较，确定一个与该命令词训练数据的声学特征最匹配的听写词条，并将该听写词条对应的声学模型得分与语言模型得分之和作为针对该命令词训练数据的第一听写网络得分。
[0093] 从而，对应命令词训练数据集内所有命令词训练数据的第一命令词网络得分和第一听写网络得分如下表所示，其中依次对应各个命令词训练数据的第一命令词网络得分分别为：Χ1，Χ2，χ3···，χη，依次对应各个命令词训练数据的第一听写网络得分分别为： yl，y2, y3…，yn。
[0094]

【权利要求】
1. 一种异构解码网络的构建方法，其特征在于，包括：获取业务所需的命令词解码网络和听写解码网络，所述命令词解码网络的每个弧上保存有一个命令词条以及对应所述命令词条的声学模型得分，所述听写解码网络的每个弧上保存有一个听写词条以及均对应所述听写词条的声学模型得分和语言模型得分；构建命令词训练数据集和听写训练数据集，所述命令词训练数据集内的命令词训练数据由所述命令词条构成，所述听写训练数据集内的听写训练数据由所述听写词条构成；利用所述命令词训练数据集和所述听写训练数据集，确定命令词解码网络的补偿得分；优化所述命令词解码网络，并使优化后的命令词解码网络的每个弧上保存有所述命令词条、所述补偿得分、以及对应所述命令词条的声学模型得分；将优化后的命令词解码网络和所述听写解码网络并联组成异构解码网络。
2. 根据权利要求1所述的方法，其特征在于，所述利用所述命令词训练数据集和所述听写训练数据集，确定命令词解码网络的补偿得分包括：依次将所述命令词训练数据集内的每一个命令词训练数据输入至所述命令词解码网络和所述听写解码网络，分别得到对应所述命令词训练数据的第一命令词网络得分和第一听写网络得分；所述第一命令词网络得分为与所述命令词训练数据相匹配的命令词条对应的声学模型得分，所述第一听写网络得分为与所述命令词训练数据相匹配的听写词条对应的声学模型得分和语言模型得分之和；依次将所述听写训练数据集内的每一个听写训练数据分别输入至所述命令词解码网络和所述听写解码网络，分别得到对应所述听写训练数据的第二命令词网络得分和第二听写网络得分，所述第二命令词网络得分为与所述听写训练数据相匹配的命令词条对应的声学模型得分，所述第二听写网络得分为与所述听写训练数据相匹配的听写词条对应的声学模型得分和语言模型得分之和；确定所述命令词解码网络的补偿得分，并使所述补偿得分满足预设条件：对于命令词训练数据集内的设定比例的命令词训练数据，所述第一命令词网络得分与所述补偿得分之和大于所述第一听写网络得分；对于听写训练数据集内的设定比例的听写训练数据，所述第二命令词网络得分与所述补偿得分之和小于所述第二听写网络得分。
3. 根据权利要求2所述的方法，其特征在于，所述确定所述命令词解码网络的补偿得分，并使所述补偿得分满足预设条件包括：获取满足第一取值范围且能够整除第一步进量的第一参数，以及满足第二取值范围且能够整除第二步进量的第二参数的所有参数组合；依次对每一组参数组合，获取所述命令词训练数据集内满足第一预设条件的命令词训练数据个数，所述第一预设条件为：所述第一参数和所述命令词训练数据对应的第一命令词网络得分的乘积与所述第二参数的和，大于所述命令词训练数据对应的第一听写网络得分；依次对每一组参数组合，获取所述听写训练数据集内满足第二预设条件的听写训练数据个数，所述第二预设条件为：所述第一参数和所述听写训练数据对应的第二命令词网络得分的乘积与所述第二参数的和，小于所述听写训练数据对应的第二听写网络得分；确定优选参数组合，所述优选参数组合对应的命令词训练数据个数和听写训练数据个数之和，大于其它参数组合对应的命令词训练数据个数和听写训练数据个数之和；将所述优选参数组合中第一参数和任意第一命令词网络得分的乘积与所述优选参数组合中第二参数的和，再减去所述第一命令词网络得分所得的结果，作为所述命令词解码网络的补偿得分。
4. 根据权利要求2所述的方法，其特征在于，所述确定所述命令词解码网络的补偿得分，并使所述补偿得分满足预设条件包括：获取满足设定的取值范围且能够整除设定的步进量的参数集合；依次对所述参数集合中的每一个参数，获取所述命令词训练数据集内满足第三预设条件的命令词训练数据个数，所述第三预设条件为：所述命令词训练数据对应的第一命令词网络得分与所述参数的和，大于所述命令词训练数据对应的第一听写网络得分；依次对所述参数集合中的每一个参数，获取所述听写训练数据集内满足第四预设条件的听写训练数据个数，所述第四预设条件为：所述听写训练数据对应的第二命令词网络得分与所述参数的和，小于所述听写训练数据对应的第二听写网络得分；确定优选参数，所述优选参数对应的命令词训练数据个数和听写训练数据个数之和，大于其它参数对应的命令词训练数据个数和听写训练数据个数之和；将所述优选参数作为所述命令词解码网络补偿得分。
5. -种异构解码网络的构建系统，其特征在于，包括：解码网络获取单元，用于获取业务所需的命令词解码网络和听写解码网络，所述命令词解码网络的每个弧上保存有一个命令词条以及对应所述命令词条的声学模型得分，所述听写解码网络的每个弧上保存有一个听写词条以及均对应所述听写词条的声学模型得分和语言模型得分；训练数据集构建单元，用于构建命令词训练数据集和听写训练数据集，所述命令词训练数据集内的命令词训练数据由所述命令词条构成，所述听写训练数据集内的听写训练数据由所述听写词条构成；补偿得分确定单元，用于利用所述命令词训练数据集和所述听写训练数据集，确定命令词解码网络的补偿得分；优化单元，用于优化所述命令词解码网络，并使优化后的命令词解码网络的每个弧上保存有所述命令词条、所述补偿得分、以及对应所述命令词条的声学模型得分；并联单元，用于将优化后的命令词解码网络和所述听写解码网络并联组成异构解码网络。
6. 根据权利要求5所述的系统，其特征在于，所述补偿得分确定单元包括：第一网络得分获取单元，用于依次将所述命令词训练数据集内的每一个命令词训练数据输入至所述命令词解码网络和所述听写解码网络，分别得到对应所述命令词训练数据的第一命令词网络得分和第一听写网络得分；所述第一命令词网络得分为与所述命令词训练数据相匹配的命令词条对应的声学模型得分，所述第一听写网络得分为与所述命令词训练数据相匹配的听写词条对应的声学模型得分和语言模型得分之和；第二网络得分获取单元，用于依次将所述听写训练数据集内的每一个听写训练数据分别输入至所述命令词解码网络和所述听写解码网络，分别得到对应所述听写训练数据的第二命令词网络得分和第二听写网络得分，所述第二命令词网络得分为与所述听写训练数据相匹配的命令词条对应的声学模型得分，所述第二听写网络得分为与所述听写训练数据相匹配的听写词条对应的声学模型得分和语言模型得分之和；第一补偿得分确定单元，用于确定所述命令词解码网络的补偿得分，并使所述补偿得分满足预设条件：对于命令词训练数据集内的设定比例的命令词训练数据，所述第一命令词网络得分与所述补偿得分之和大于所述第一听写网络得分；对于听写训练数据集内的设定比例的听写训练数据，所述第二命令词网络得分与所述补偿得分之和小于所述第二听写网络得分。
7. 根据权利要求6所述的系统，其特征在于，所述第一补偿得分确定单元包括：参数组合获取单元，用于获取满足第一取值范围且能够整除第一步进量的第一参数，以及满足第二取值范围且能够整除第二步进量的第二参数的所有参数组合；第一命令词训练数据个数获取单元，用于依次对每一组参数组合，获取所述命令词训练数据集内满足第一预设条件的命令词训练数据个数，所述第一预设条件为：所述第一参数和所述命令词训练数据对应的第一命令词网络得分的乘积与所述第二参数的和，大于所述命令词训练数据对应的第一听写网络得分；第一听写训练数据个数获取单元，用于依次对每一组参数组合，获取所述听写训练数据集内满足第二预设条件的听写训练数据个数，所述第二预设条件为：所述第一参数和所述听写训练数据对应的第二命令词网络得分的乘积与所述第二参数的和，小于所述听写训练数据对应的第二听写网络得分；优选参数组合确定单元，用于确定优选参数组合，所述优选参数组合对应的命令词训练数据个数和听写训练数据个数之和，大于其它参数组合对应的命令词训练数据个数和听写训练数据个数之和；第二补偿得分确定单元，用于将所述优选参数组合中第一参数和任意第一命令词网络得分的乘积与所述优选参数组合中第二参数的和，再减去所述第一命令词网络得分所得的结果，作为所述命令词解码网络的补偿得分。
8. 根据权利要求6所述的系统，其特征在于，所述第一补偿得分确定单元包括：参数集合获取单元，用于获取满足设定的取值范围且能够整除设定的步进量的参数集合；第二命令词训练数据个数获取单元，用于依次对所述参数集合中的每一个参数，获取所述命令词训练数据集内满足第三预设条件的命令词训练数据个数，所述第三预设条件为：所述命令词训练数据对应的第一命令词网络得分与所述参数的和，大于所述命令词训练数据对应的第一听写网络得分；第二听写训练数据个数获取单元，用于依次对所述参数集合中的每一个参数，获取所述听写训练数据集内满足第四预设条件的听写训练数据个数，所述第四预设条件为：所述听写训练数据对应的第二命令词网络得分与所述参数的和，小于所述听写训练数据对应的第二听写网络得分；优选参数确定单元，用于确定优选参数，所述优选参数对应的命令词训练数据个数和听写训练数据个数之和，大于其它参数对应的命令词训练数据个数和听写训练数据个数之和；第三补偿得分确定单元，用于将所述优选参数作为所述命令词解码网络补偿得分。
9. 一种基于权利要求1至4任一项所述的异构解码网络的语音识别方法，其特征在于，包括：获取语音数据；将所述语音数据分别输入至所述优化后的命令词解码网络以及所述听写解码网络中，分别得到命令词网络得分和听写网络得分；所述命令词网络得分为与所述语音数据相匹配的命令词条对应的声学模型得分与所述补偿得分之和，所述听写网络得分为与所述语音数据相匹配的听写词条对应的声学模型得分和语言模型得分之和；判断所述命令词网络得分是否大于所述听写网络得分；如果是，则确定所述与语音数据相匹配的命令词条为语音识别结果；否则，确定所述与语音数据相匹配的听写词条为语音识别结果。
10. -种基于权利要求1至4任一项所述的异构解码网络的语音识别系统，其特征在于，包括：语音数据获取单元，用于获取语音数据；网络得分获取单元，用于将所述语音数据分别输入至所述优化后的命令词解码网络以及所述听写解码网络中，分别得到命令词网络得分和听写网络得分；所述命令词网络得分为与所述语音数据相匹配的命令词条对应的声学模型得分与所述补偿得分之和，所述听写网络得分为与所述语音数据相匹配的听写词条对应的声学模型得分和语言模型得分之和；判断单元，用于判断所述命令词网络得分是否大于所述听写网络得分；确定单元，用于在所述命令词网络得分大于所述听写网络得分的情况下，确定所述与语音数据相匹配的命令词条为语音识别结果；在所述命令词网络得分小于或等于所述听写网络得分的情况下，确定所述与语音数据相匹配的听写词条为语音识别结果。
【文档编号】G10L15/06GK104064184SQ201410290869
【公开日】2014年9月24日申请日期:2014年6月24日优先权日:2014年6月24日
【发明者】鹿晓亮, 单言丰, 刘强申请人:科大讯飞股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：鹿晓亮;单言丰;刘强
技术所有人：科大讯飞股份有限公司
我是此专利的发明人

上一篇：一种利用短时时频值的自适应端点检测方法
上一篇：钢琴击弦的制造方法