本发明涉及一种航路点识别方法,特别是一种基于空间位置信息的空管语音中航路点识别方法。
背景技术:
1、在当前的空管管制语音识别领域中,航路点的识别是其中的主要难点。如今模拟飞行系统、空管自动化系统中对于语音识别的要求不断提高,对飞行意图自动化识别的需求不断增加,航路点的准确识别已成为该领域中亟需解决的难题。
2、目前有一些研究人员提出了通过文本纠错的方式实现语音识别结果中的航路点纠错,然而语音识别结果中航路点的识别结果可能在文本上与正确结果差别较大,因而该方法往往难以奏效。
3、因此急需一种相对精确的端到端的航路点识别方法。
技术实现思路
1、发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种基于空间位置信息的空管语音中航路点识别方法。
2、为了解决上述技术问题,本发明公开了一种基于空间位置信息的空管语音中航路点识别方法,包括以下步骤:
3、步骤1,构建内容库,将航路点信息和扇区数据进行关联,存入内容库中;
4、所述的内容库中,关联的数据至少包括:扇区id、相邻扇区列表、扇区内航路点列表以及航路点语音数据。
5、步骤2,根据空管语音数据的来源确定所在位置,并利用内容库得到目标航路点集合,具体包括:
6、步骤2-1,确定空管语音数据对应的扇区id,具体方法包括:
7、步骤2-1-1,对于采用模拟信号传播的空管语音数据,直接采用信号频率确定其对应扇区id;
8、步骤2-1-2,对于采用数据链的方式传递信号的空管语音数据,使用ip地址获取信号所对应的扇区id。
9、步骤2-2,构建目标航路点集合:根据扇区id在内容库中搜索获得扇区内的航路点,将搜索获得的航路点作为目标航路点集合。
10、所述的构建目标航路点集合,即根据任务需求,将目标航路点集合的范围扩展到当前扇区的相邻扇区,即根据扇区id在内容库中搜索出相邻扇区列表,再根据相邻扇区列表中的信息搜索出相邻扇区内的航路点,将相邻扇区内的航路点也加入至目标航路点集合中。
11、步骤3,构建航路点语音抽取模型,对空管语音数据中航路点部分进行切片,得到切片后的航路点语音;
12、所述的对空管语音数据中航路点部分进行切片,具体包括:
13、步骤3-1,构建航路点语音抽取模型,所述航路点语音抽取模型包括:航路点语音编码器、空管语音识别编码器以及定位模块;
14、其中,航路点语音编码器用于获取内容库中航路点语音数据的编码;
15、空管语音识别编码器用于获取内容库中航路点语音数据的音素后验矩阵;
16、定位模块采用注意力机制对整段空管语音进行切片,即根据航路点语音数据的编码在航路点语音数据的音素后验矩阵中获取航路点语音在整段空管语音中的位置和时长,即得到切片后的航路点语音;
17、所述航路点语音编码器,为经过预训练的编码器。
18、所述预训练的数据源,包括航路点及其对应的音频。
19、步骤3-2,构建构航路点语音抽取模型的训练数据集,所述数据集包括:语音数据、语音数据对应的文本数据以及文本数据中包括的航路点部分的标注;并使用训练数据集对航路点语音抽取模型进行训练;
20、步骤3-3,利用训练好的航路点语音抽取模型,对空管语音数据中航路点部分进行切片,得到切片后的航路点语音;
21、步骤3-4,从整段空管语音数据的音素后验矩阵中按照切片时获得的位置和时长信息将航路点部分的音素后验矩阵抽取出来。
22、步骤4,将切片后的航路点语音与目标航路点集合中的航路点进行匹配,得到匹配结果,具体包括:
23、步骤4-1,构建分类器,将抽取出来的音素后验矩阵匹配到内容库中的所有航路点中,获取每一个航路点的匹配概率;
24、步骤4-2,挑选目标航路点集合中匹配概率最高的航路点作为匹配结果,并设置一个阈值δ,当所有目标航路点的分类概率均小于δ时,则认为步骤3中的切片结果有误,当前空管语音数据中不存在航路点语音,即无匹配结果。
25、步骤5,匹配结果拼接:将匹配结果拼接到现有语音识别模型所给出的空管语音识别结果中,实现包含航路点在内的空管语音的识别信息。
26、所述的匹配结果拼接,具体包括:
27、步骤5-1,采用现有技术的语音识别模型对空管语音数据进行语音识别,得到初步识别文本;
28、步骤5-2,当步骤4-3中有匹配结果时,根据步骤3中切片时获得的位置和时长,在初步识别文本中,将对应位置和长度的文本信息替换为步骤4-3中的匹配结果,获得最终的的空管语音识别文本,完成基于空间位置信息的空管语音中航路点识别。
29、有益效果:
30、本发明从“语音-文本-纠错”的线性模式变为了从语音直接匹配航路点的模式,减少了一个中间步骤,从而降低了错误传递的可能,能够大幅提升航路点识别的准确率。
1.一种基于空间位置信息的空管语音中航路点识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于空间位置信息的空管语音中航路点识别方法,其特征在于,步骤1中所述的内容库中,关联的数据至少包括:扇区id、相邻扇区列表、扇区内航路点列表以及航路点语音数据。
3.根据权利要求2所述的一种基于空间位置信息的空管语音中航路点识别方法,其特征在于,步骤2具体包括:
4.根据权利要求3所述的一种基于空间位置信息的空管语音中航路点识别方法,其特征在于,步骤2-1中所述的确定空管语音数据对应的扇区id,具体方法包括:
5.根据权利要求4所述的一种基于空间位置信息的空管语音中航路点识别方法,其特征在于,步骤2-2中所述的构建目标航路点集合,即根据任务需求,将目标航路点集合的范围扩展到当前扇区的相邻扇区,即根据扇区id在内容库中搜索出相邻扇区列表,再根据相邻扇区列表中的信息搜索出相邻扇区内的航路点,将相邻扇区内的航路点也加入至目标航路点集合中。
6.根据权利要求5所述的一种基于空间位置信息的空管语音中航路点识别方法,其特征在于,步骤3所述的对空管语音数据中航路点部分进行切片,具体包括:
7.根据权利要求6所述的一种基于空间位置信息的空管语音中航路点识别方法,其特征在于,步骤4所述的将切片后的航路点语音与目标航路点集合中的航路点进行匹配,具体包括:
8.根据权利要求7所述的一种基于空间位置信息的空管语音中航路点识别方法,其特征在于,步骤5中所述的匹配结果拼接,具体包括:
9.根据权利要求8所述的一种基于空间位置信息的空管语音中航路点识别方法,其特征在于,步骤3-1中所述航路点语音编码器,为经过预训练的编码器。
10.根据权利要求9所述的一种基于空间位置信息的空管语音中航路点识别方法,其特征在于,步骤3-1中所述预训练的数据源,包括航路点及其对应的音频。