基于小样本数特征融合的托辊异音识别方法与流程

文档序号：44893741发布日期：2026-03-13 22:48阅读：4来源：国知局

技术简介：
本发明针对托辊异音识别中因小样本数据导致的传统深度学习模型过拟合、特征区分度不足的问题，提出多域特征融合与聚类优化方案。通过增强预处理、提取时域/频域/梅尔倒谱系数多域特征，对梅尔倒谱系数进行聚类优化并融合其他特征，构建适配小样本场景的优化特征向量，结合预训练RBF-SVM分类模型提升识别准确率，同时引入滑动窗口与报警冷却机制降低误报。
关键词：托辊异音识别,小样本特征融合

本发明涉及信号处理，尤其涉及一种基于小样本数特征融合的托辊异音识别方法。

背景技术：

1、托辊作为带式输送机的关键承载部件，其运行状态直接影响整个输送系统的安全与效率。托辊轴承磨损、卡涩等故障在初期会表现出特定的“异音”特征。因此，通过音频分析技术对托辊运行声音进行在线监测与智能诊断，是实现预测性维护、避免非计划停机的重要手段。

2、目前，基于机器学习的音频识别方法已被广泛应用于工业设备故障诊断领域。现有技术方案通常遵循如下流程：采集设备运行音频，提取梅尔倒谱系数、频谱质心等声学特征，构建高维特征集，并利用深度学习模型（如卷积神经网络）进行模式分类。

3、由于托辊设备数量庞大、安装环境复杂，难以获取足量且标注准确的故障音频样本，导致可供模型训练的“异音”数据极其稀缺，即面临“小样本”问题。现有主流方法在此约束下暴露出显著缺陷：一方面，深度学习模型严重依赖大数据，在小样本上极易过拟合，泛化能力差；另一方面，直接使用传统的特征提取与融合方法，未针对小样本数据分布稀疏、噪声干扰强的特点进行优化，所构建的特征表示区分度不足、鲁棒性低，导致模型识别准确率与可靠性急剧下降。

技术实现思路

1、本发明提供了一种基于小样本数特征融合的托辊异音识别方法，以解决现有技术中由于故障音频样本稀缺导致传统深度学习模型易过拟合、特征区分度不足，进而造成故障识别准确率与可靠性低的问题。

2、本发明第一方面提供了一种基于小样本数特征融合的托辊异音识别方法，包括：获取托辊运行时的原始音频信号，对所述原始音频信号进行增强预处理，得到增强后的音频信号；对所述增强后的音频信号进行分帧处理，并从每一帧中提取时域特征、频域特征和梅尔倒谱系数特征，形成多域特征向量；对所述多域特征向量中的梅尔倒谱系数特征进行聚类优化，并将优化结果与所述时域特征和所述频域特征融合，得到适配于小样本场景的优化特征向量；将所述优化特征向量输入至预训练的rbf核支持向量机分类模型，得到托辊状态的分类结果；根据所述分类结果，结合滑动窗口计数机制和报警冷却机制，判断是否触发报警，并在满足报警条件时输出报警信息。

3、在一种可行的实施方式中，在将所述优化特征向量输入至预训练的rbf核支持向量机分类模型之前，还包括：采集并构建小样本训练集，所述小样本训练集包括正常、异音和停机三类托辊运行音频样本；对所述小样本训练集中的音频样本执行增强处理、分帧处理、多特征提取以及梅尔倒谱系数特征分析，得到训练特征向量集；利用所述训练特征向量集对rbf核支持向量机分类模型进行训练，并通过交叉验证优化超参数，得到rbf核支持向量机分类模型。

4、在一种可行的实施方式中，所述对所述增强后的音频信号进行分帧处理，并从每一帧中提取时域特征、频域特征和梅尔倒谱系数特征，形成多域特征向量，包括：对所述增强后的音频信号进行分帧处理，得到若干音频帧；对各音频帧分别提取时域特征、频域特征和梅尔倒谱系数特征；将每个音频帧的时域特征、频域特征和梅尔倒谱系数特征进行拼接，形成多域特征向量。在一种可行的实施方式中，所述对所述多域特征向量中的梅尔倒谱系数特征进行聚类优化，并将优化结果与所述时域特征和所述频域特征融合，得到适配于小样本场景的优化特征向量，包括：对所述多域特征向量中的梅尔倒谱系数特征进行聚类运算，形成至少两个特征簇；从所述至少两个特征簇中确定样本量最大的主簇，并提取该主簇的代表性特征值，以优化小样本数据下的特征表示，得到优化后的梅尔倒谱系数特征；将所述优化后的梅尔倒谱系数特征与所述多域特征向量中的时域特征和频域特征进行拼接，形成所述适配于小样本场景的优化特征向量。

5、在一种可行的实施方式中，所述对所述多域特征向量中的梅尔倒谱系数特征进行聚类运算，形成至少两个特征簇，包括：采用k-means聚类算法对所述梅尔倒谱系数特征进行聚类分析；根据轮廓系数或交叉验证结果，确定最优的聚类数量k；基于所述聚类数量k执行聚类，将梅尔倒谱系数特征划分至k个特征簇中，其中，k为大于或等于2的整数。

6、在一种可行的实施方式中，所述提取该主簇的代表性特征值，以优化小样本数据下的特征表示，得到优化后的梅尔倒谱系数特征，包括：计算所述主簇中所有样本在各梅尔倒谱系数维度上的中位数；将计算得到的中位数序列作为该主簇在对应维度上的代表性特征值；各维度的代表性特征值组合，形成所述优化后的梅尔倒谱系数特征。

7、在一种可行的实施方式中，所述根据所述分类结果，结合滑动窗口计数机制和报警冷却机制，判断是否触发报警，并在满足报警条件时输出报警信息，包括：基于预设的包含连续多次分类结果的滑动窗口，并统计所述滑动窗口内分类结果为“异音”的帧数占比；若所述占比超过预设的报警阈值，则触发报警并启动冷却计时器，在冷却期内屏蔽新的报警触发；在报警触发时，同步执行本地声光报警、异常音频数据存储以及报警信息远程推送中的至少一项操作。

8、本发明第二方面提供了一种基于小样本数特征融合的托辊异音识别装置，包括：获取模块，用于获取托辊运行时的原始音频信号，对所述原始音频信号进行增强预处理，得到增强后的音频信号；提取模块，用于对所述增强后的音频信号进行分帧处理，并从每一帧中提取时域特征、频域特征和梅尔倒谱系数特征，形成多域特征向量；优化模块，用于对所述多域特征向量中的梅尔倒谱系数特征进行聚类优化，并将优化结果与所述时域特征和所述频域特征融合，得到适配于小样本场景的优化特征向量；分类模块，用于将所述优特征向量输入至预训练的rbf核支持向量机分类模型，得到托辊状态的分类结果；警报模块，用于根据所述分类结果，结合滑动窗口计数机制和报警冷却机制，判断是否触发报警，并在满足报警条件时输出报警信息。

9、在一种可行的实施方式中，所述基于小样本数特征融合的托辊异音识别装置还包括：训练模块，用于采集并构建小样本训练集，所述小样本训练集包括正常、异音和停机三类托辊运行音频样本；对所述小样本训练集中的音频样本执行增强处理、分帧处理、多特征提取以及梅尔倒谱系数特征分析，得到训练特征向量集；利用所述训练特征向量集对rbf核支持向量机分类模型进行训练，并通过交叉验证优化超参数，得到rbf核支持向量机分类模型。

10、在一种可行的实施方式中，所述处理模块具体用于：对所述增强后的音频信号进行分帧处理，得到若干音频帧；对各音频帧分别提取时域特征、频域特征和梅尔倒谱系数特征；将每个音频帧的时域特征、频域特征和梅尔倒谱系数特征进行拼接，形成多域特征向量。

11、在一种可行的实施方式中，所述优化模块包括：聚类单元，用于对所述多域特征向量中的梅尔倒谱系数特征进行聚类运算，形成至少两个特征簇；优化单元，用于从所述至少两个特征簇中确定样本量最大的主簇，并提取该主簇的代表性特征值，以优化小样本数据下的特征表示，得到优化后的梅尔倒谱系数特征；拼接单元，用于将所述优化后的梅尔倒谱系数特征与所述多域特征向量中的时域特征和频域特征进行拼接，形成所述适配于小样本场景的优化特征向量。

12、在一种可行的实施方式中，所述聚类单元具体用于：采用k-means聚类算法对所述梅尔倒谱系数特征进行聚类分析；根据轮廓系数或交叉验证结果，确定最优的聚类数量k；基于所述聚类数量k执行聚类，将梅尔倒谱系数特征划分至k个特征簇中，其中，k为大于或等于2的整数。

13、在一种可行的实施方式中，所述优化单元具体用于：计算所述主簇中所有样本在各梅尔倒谱系数维度上的中位数；将计算得到的中位数序列作为该主簇在对应维度上的代表性特征值；各维度的代表性特征值组合，形成所述优化后的梅尔倒谱系数特征。

14、在一种可行的实施方式中，所述警报模块具体用于：基于预设的包含连续多次分类结果的滑动窗口，并统计所述滑动窗口内分类结果为“异音”的帧数占比；若所述占比超过预设的报警阈值，则触发报警并启动冷却计时器，在冷却期内屏蔽新的报警触发；在报警触发时，同步执行本地声光报警、异常音频数据存储以及报警信息远程推送中的至少一项操作。

15、本发明第三方面提供了一种电子设备，包括：存储器和至少一个处理器，所述存储器中存储有指令；所述至少一个处理器调用所述存储器中的所述指令，以使得所述电子设备执行上述的基于小样本数特征融合的托辊异音识别方法。

16、本发明的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述的基于小样本数特征融合的托辊异音识别方法。

17、本发明提供的技术方案中，获取托辊运行时的原始音频信号，对所述原始音频信号进行增强预处理，得到增强后的音频信号；对所述增强后的音频信号进行分帧处理，并从每一帧中提取时域特征、频域特征和梅尔倒谱系数特征，形成多域特征向量；对所述多域特征向量中的梅尔倒谱系数特征进行聚类优化，并将优化结果与所述时域特征和所述频域特征融合，得到适配于小样本场景的优化特征向量；将所述优化特征向量输入至预训练的rbf核支持向量机分类模型，得到托辊状态的分类结果；根据所述分类结果，结合滑动窗口计数机制和报警冷却机制，判断是否触发报警，并在满足报警条件时输出报警信息。本发明实施例中，通过预处理增强原始音频信噪比，采用时域、频域及mfcc多域特征提取并针对小样本数据稀疏性对mfcc特征进行聚类优化，有效融合出区分度更高、抗噪性更强的特征表示，结合预训练的rbf核支持向量机模型，能够在托辊故障音频数据稀缺的小样本场景下显著提升故障识别准确率与泛化能力，同时利用滑动窗口计数与报警冷却机制有效降低误报，实现对托辊运行状态的可靠在线监测与智能预警。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：曾建勇,凌寿晓,王志鸿,曾发喜,张云帆,李国富
技术所有人：广州国巡机器人科技有限公司
我是此专利的发明人

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！