一种基于Mel声谱图与改进SEResNet的鱼类行为识别方法

文档序号:35967430发布日期:2023-11-09 07:45阅读:来源:国知局

技术特征:

1.一种基于mel声谱图与改进seresnet的鱼类行为识别方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于mel声谱图与改进seresnet的鱼类行为识别方法,其特征在于,所述步骤s1中,通过水听器采集养殖水域中的所述鱼类音频信号,鱼类每个行为采集时长为120s,将采集到的鱼类音频信号按照每段2s进行人工切分并编号,另设一组空白噪声对照组同步采集环境噪声,所述空白噪声对照组用于区分鱼类音频信号和噪声音频信号,将编号后的鱼类音频信号中的噪声音频信号去除,得到预处理后的鱼类音频信号。

3.根据权利要求2所述的一种基于mel声谱图与改进seresnet的鱼类行为识别方法,其特征在于,所述步骤s2中,所述mel声谱图特征提取方法包括通过mel滤波器对鱼类音频信号进行傅里叶变换,将能量非线性映射到频域梅尔刻度上,提取出傅里叶变换后的鱼类音频信号中的重要频率特征,在频率轴上对鱼类音频信号进行压缩,提取出鱼类细粒度声音信息,得到鱼类音频的mel声谱图特征信息。

4.根据权利要求3所述的一种基于mel声谱图与改进seresnet的鱼类行为识别方法,其特征在于,所述步骤s3中,

5.根据权利要求4所述的一种基于mel声谱图与改进seresnet的鱼类行为识别方法,其特征在于,所述步骤s4中,所述se注意力机制模块通过所述池化层模块进行全局平均池化获取mel声谱图特征信息的全局信息,通过第一全连接层模块顺着空间维度对mel声谱图特征信息进行特征压缩,使特征维度降低,通过relu层模块进行非线性操作,经过全连接层将特征维度还原并拟合通道间复杂的相关性卷积特征,最后使用sigmoid函数激活,与所述卷积特征进行逐空间位置相乘,得到所述鱼类声音关键信息。

6.根据权利要求5所述的一种基于mel声谱图与改进seresnet的鱼类行为识别方法,其特征在于,所述步骤s5中,设所述鱼类声音信息特征经过卷积处理后的特征向量为ht,如公式(1)所示:

7.根据权利要求6所述的一种基于mel声谱图与改进seresnet的鱼类行为识别方法,其特征在于,所述步骤s7中,输出的鱼类行为识别结果包括摄食行为、游泳行为和跳跃行为。


技术总结
本发明提出一种基于Mel声谱图与改进SEResNet的鱼类行为识别方法,包括采集养殖水域中的鱼类音频信号,对鱼类音频信号进行预处理;通过Mel声谱图特征提取方法对预处理后的鱼类音频信号进行声音特征提取,得到鱼类音频的Mel声谱图特征信息;构建TAP‑SEResNet模型,包括SEResNet模块、SE注意力机制模块、TAP模块、全连接层模块和Softmax分类器模块;将Mel声谱图特征信息输入TAP‑SEResNet模型中,得到鱼类声音信息特征;将鱼类声音信息特征输入TAP模块,得到深层声音特征向量;将深层声音特征向量输入全连接层模块得到声音特征整合信息;将声音特征整合信息输入Softmax分类器模块进行分类,输出鱼类行为识别结果。本发明能够能够减少关键信息丢失,且能够处理声音细节特征,使鱼类行为识别精度提高。

技术研发人员:于红,杨雨欣,杨宗轶,涂万,张鑫,林远山
受保护的技术使用者:大连海洋大学
技术研发日:
技术公布日:2024/1/16
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1