一种基于音频分析的乘务员呼唤应答检测方法与流程

文档序号：13706178阅读：212来源：国知局

技术领域本发明属于语音处理技术领域，具体涉及一种针对机车乘务员一次乘务作业全过程中是否进行呼唤应答的自动化检测方法。

背景技术：
根据《铁路机车操作规则》中附件7《机车乘务员确认呼唤(应答)标准》规定一次乘务作业全过程必须认真执行确认(呼唤)应答制度，在关键项点发生时，需要对关键项点进行相应的呼唤应答。为了检查乘务员是否作业规范，需判断乘务员在关键项点是否进行了相应的呼唤。目前这些工作都是由地面分析人员进行抽查的，费时费力。

技术实现要素：
本发明提供了一种基于音频分析的乘务员呼唤应答检测方法，旨在解决在进行乘务员呼唤应答检测时需要地面分析人员进行抽查，费时费力，且不能够全面检测的问题。为解决上述技术问题，本发明的基于音频分析的乘务员呼唤应答检测方法包括：1)根据LKJ运行记录文件，获取需要乘务员进行呼唤应答的时间点；2)根据步骤1)中的时间点，对乘务员行车录音文件中各时间点对应的设定时长的音频信号流进行语音信号处理，判断各时间点对应的音频信号流中是否包含语音信号；3)若某时间点对应的音频信号流不包含语音信号，则表明乘务员该时间点进行呼唤应答，给出报警提示。步骤2)中检测各时间点对应的设定时长的音频信号流中是否包含语音信号的具体过程是：从乘务员行车录音文件中截取各时间点对应的设定时长的音频信号流，对各音频信号流进行预处理、特征提取和模型训练，识别出各音频信号流是否包含语音信号。步骤3)中若音频信号流包含语音信号，检测语音信号持续时间的长度；将语音信号持续时间长度与乘务员关键项呼唤应答标准时间长度进行比较，如果时间长度差超出预设范围，判断乘务员在规定的时间点进行了错误呼唤应答，进行报警。所述乘务员关键项呼唤应答标准时间长度是根据不同关键项点处呼唤应答的内容不同，结合实际情况，事先制定好的。对各音频信号流进行预处理包括：采用小波包法对音频信号流进行去噪处理。对各音频信号流进行特征提取时采用Mel频率倒谱系数法。语音信号持续时间的长度的检测方法为端点检测。所述端点检测包括短时能量检测和过零率检测。所述步骤2)中所述设定时长为20s。本发明的技术效果：该方法根据LKJ运行记录文件获取关键项时间点，对乘务员行车录音文件中关键项时间点对应的音频信号流进行一系列语音处理后识别出是否是语音信号，对于不是语音信号的音频信号流进行报警提示。该方法为自动检测乘务员呼唤应答的方法，只需要通过软件自动实现乘务员呼唤应答的检测，大大降低了乘务员呼唤应答的检测难度，提高了检测效率，减轻了检查人员的工作量，并且可以对LKJ运行记录文件中的所有关键项时间点进行乘务员呼唤应答检测，检测较为全面。附图说明图1为本实施例基于音频分析的乘务员呼唤应答检测方法流程图。具体实施方式下面结合附图，对本发明的技术方案作进一步详细说明。本实施例的基于音频分析的乘务员呼唤应答检测方法包括如下步骤：1)根据LKJ运行记录文件，获取需要乘务员进行呼唤应答的时间点；2)根据步骤1)中的时间点，对乘务员行车录音文件中各时间点对应的设定时长的音频信号流进行语音信号处理，判断各时间点对应的音频信号流中是否包含语音信号；3)若某时间点对应的音频信号流不包含语音信号，则表明乘务员该时间点进行呼唤应答，给出报警提示下面对上述步骤进行具体阐述：对于步骤1)，结合LKJ运行记录文件，根据机务管理文件的要求，自动分析判断需要进行呼唤应答的时间点。步骤2)中检测各时间点对应的音频信号流中是否包含语音信号时可采用两种方式：方式一，根据步骤1)中的时间点，在乘务员行车录音文件中，向后截取设定时长的各时间点对应的音频信号流，然后对截取的各音频信号流进行语音信号处理，识别出各时间点对应的音频信号流中是否包含语音信号。方式二，根据步骤1)中的时间点，在乘务员行车录音文件中，找到时间点对应的设定时长的音频信号，然后对该音频信号流进行语音信号处理及识别。本实施例中的LKJ运行记录文件和录音文件是相匹配的，是同一车次、同一机班、同一时间段的记录数据，并且LKJ运行记录文件和录音文件的时间是同步的，因此LKJ运行记录文件和录音文件关键项点的时间是相同的。定位到录音文件中的所有关键项点后，向后截取音频信号流的时长可自行设定，本实施例中结合实际情况每个关键项点向后截取20秒的音频信号流。本实施例对音频信号包括预处理、特征提取和模式识别。其中预处理包括去噪处理，而去除噪声的方法很多，本实施例中采用小波包法对语音信号进行去噪，小波包法对语音去噪是比较成熟的技术，这里不再详细说明。对去噪处理过的语音信号提取相关特征，主要是根据音频信号的时域特征中的平均能量、短时平均过零率、共振峰、基音周期等参数以及频域特征中有线性预测系数(LPC)、LPC倒谱系数(LPCC)、线谱对数(LSP)、短时频谱、Mel频率倒谱系数(MFCC)等，本实施例中使用了MFCC来提取语音信号的特征。利用提取的特征训练特征模型，检测判断音频信号流中的语音信号和非语音信号。模型训练的方法在现有技术中也有很多，如DTW，HMM、人工神经网络等，这里不再详细介绍其原理。对于步骤3)，如果音频信号流中未检测到语音信号，则说明乘务员在此关键项点处未进行呼唤应答，给出相应的报警提示。进一步，当音频信号流中检测到语音信号后，检测语音信号的开始和结束点(即乘务员呼唤应答说话时间的开始点和结束点)，根据语音信号的开始点和结束点计算乘务员说话时间的长度。开始点和结束点的检测即语音信号的端点检测，本实施例中采用短时能量检测和过零率检测相结合的方法进行语音的端点检测。根据乘务员关键项点呼唤应答标准，将检测计算到的乘务员说话时间长度和在此关键项点呼唤应答标准时间长度进行比较判断，如果时间长度差在预定的范围内，则判断乘务员在此处进行了呼唤应答；否则，给出提示，指明乘务员在此处未进行相应的呼唤应答。结合乘务员呼唤应答实际情况，在不同项点处呼唤应答的内容不同。关键项点呼唤应答的标准时长，是结合实际情况，事先已经制定好的。相较于现有的人工对乘务员的呼唤应答情况进行检查的方法，利用本发明的乘务员呼唤应答自动化检测方法，只需要通过软件自动实现乘务员呼唤应答的检测，大大降低了乘务员呼唤应答的检测难度，提高了检测效率，减轻了检查人员的工作量。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张宪锋;艾彬;李火星;陈召阳;王满苹;
技术所有人：郑州畅想高科股份有限公司;
我是此专利的发明人

上一篇：一种基于深度学习的口语评测方法和系统与流程
上一篇：一种音调序列的鲁棒阶跃规整方法与流程