一种基于音频自学习的产床仔猪栏位定位方法及系统与流程

文档序号：45328746发布日期：2026-04-24 20:43阅读：6来源：国知局

本发明涉及智能养殖，尤其涉及一种基于音频自学习的产床仔猪栏位定位方法及系统。

背景技术：

1、近年来，基于音频分析的声源定位技术在安防监控、智能家居及工业检测等领域得到了广泛应用。在畜牧养殖业，特别是产床仔猪防压监护场景中，利用麦克风阵列捕捉仔猪尖叫声并进行定位，成为一种非侵入式、可实时监测的技术方向。现有技术方案多直接沿用传统的声源定位方法，例如，通过计算麦克风对间的到达时间差（tdoa）结合几何原理进行空间定位，或提取信号的频域特征（如mfcc）后采用通用分类模型进行模式识别。

2、然而，将这些现有技术直接应用于结构复杂、声学环境特殊的产床时，仍存在以下问题：

3、首先，在复杂产床环境下的定位精度与鲁棒性不足。产床通常由金属围栏构成，内部空间封闭且存在食槽、加热灯等多种物体，导致声音传播伴随强烈的多径反射和混响。现有技术主要依赖时延估计和基础的频域特征。但单纯依靠tdoa方法在混响环境中时延估计容易模糊，且无法区分声学结构相似的相邻栏位，导致在相似空间布局下定位混淆，难以满足栏位级精度的要求。

4、其次，系统扩展性与实际部署维护成本高。多数现有方案采用监督分类模型（如支持向量机、神经网络），其训练依赖于大量已标注的、覆盖所有栏位正负样本的数据集。在实际养猪场中，为每个栏位采集均衡且足量的样本，尤其是难以预见的“负样本”（其他栏位或干扰声音），操作难度大、成本高昂。此外，一旦产床布局调整或栏位数量增减，此类模型往往需要重新收集数据并整体进行再训练，流程繁琐，难以适应规模化养殖场动态变化的需求。

5、最后，误报率高，影响系统可信度与可用性。产床环境充满各种非目标声源干扰，如母猪哼叫、设备运行、金属碰撞等。现有技术通常在检测到声音事件并完成定位后即触发报警，缺乏对定位结果可靠性的定量评估机制。这导致大量由干扰声音或定位不确定事件引发的无效报警，不仅增加了保育员的工作负担，也易使其对系统产生警觉疲劳，从而降低了对真实险情的响应效率。

6、如何解决上述技术问题为本发明面临的课题。

技术实现思路

1、为了解决现有技术的不足，本发明提供了一种通过提取多维特征向量结合自学习度量模型，实现了对仔猪声源的精准定位，提高防压报警的准确性与实用性的基于音频自学习的产床仔猪栏位定位方法及系统。

2、本发明解决其技术问题所采用的技术方案是：

3、本发明提供一种基于音频自学习的产床仔猪栏位定位方法，包括以下步骤

4、采集若干组包含仔猪叫声的音频信号并进行预处理，得到若干组训练音频信号；

5、对若干组训练音频信号进行特征提取，得到若干组第一多维特征向量；所述第一多维特征向量包括时延特征、频域特征、能量特征与环境反射特征；

6、构建栏位定位模型并基于若干组第一多维特征向量训练栏位定位模型，得到训练后的栏位定位模型；

7、采集包含仔猪叫声的实时音频信号并依次进行预处理与特征提取，得到第二多维特征向量；基于第二多维特征向量，采用训练后的栏位定位模型进行定位，得到栏位定位结果并根据栏位定位结果触发报警。

8、优选地，所述采集包含仔猪叫声的音频信号包括

9、在每个栏位内安装音频采集装置，通过音频采集装置对每个栏位采集若干组包含仔猪叫声的音频信号。

10、优选地，所述预处理包括降噪处理、端点检测及分帧加窗。

11、优选地，所述时延特征基于广义互相关函数计算时延估计得到；

12、所述频域特征通过基于mel频率倒谱系数提取mfcc特征并计算频谱质心，对mfcc特征与频谱质心采用特征拼接或加权融合得到；

13、所述能量特征通过基于距离的声强衰减模型计算得到；

14、所述环境反射特征通过倒谱分析提取得到。

15、优选地，所述构建栏位定位模型包括

16、采用可学习的相似度度量函数构建栏位定位模型；所述栏位定位模型公式表示如下：

17、

18、其中，为可学习的特征变换矩阵，为多维特征向量，为栏位参考特征向量；

19、所述栏位参考特征向量通过对每个栏位的若干组第一多维特征向量，采用均值向量法或聚类中心法计算得到。

20、优选地，所述构建栏位定位模型还包括定义栏位定位损失函数，所述栏位定位损失函数采用多任务对比损失函数，包括对比损失与角度损失，公式表示如下：

21、

22、其中，为对比损失，为角度损失，为权重系数；

23、对比损失公式表示如下：

24、

25、其中，为特征距离，为边界参数；

26、角度损失公式表示如下：

27、

28、其中，为投影后的特征向量与其正样本之间的夹角优选地，所述训练栏位定位模型包括

29、定义目标函数，基于第一多维特征向量，采用反向传播算法与随机梯度下降法对栏位定位模型进行参数更新，得到更新后的栏位定位模型；

30、所述目标函数公式表示如下：

31、

32、其中，为正则化系数，表示frobenius范数正则项。

33、优选地，所述采用训练后的栏位定位模型进行定位包括

34、采用训练后的栏位定位模型计算第二特征向量与每个栏位的栏位参考特征向量的相似度；

35、基于相似度采用softmax函数计算栏位概率，选择概率最大的栏位作为声源位置，将声源位置作为栏位定位结果。

36、优选地，所述根据栏位定位结果触发报警包括

37、设置置信度阈值，当栏位定位结果对应的栏位概率大于置信度阈值时，触发报警；当栏位定位结果对应的栏位概率小于或等于置信度阈值时，不触发报警。

38、本发明还提供一种基于音频自学习的产床仔猪栏位定位系统，包括

39、信号采集与预处理模块，用于采集包含仔猪叫声的音频信号并进行预处理，得到预处理后的包含仔猪叫声的音频信号；

40、特征提取模块，用于对预处理后的包含仔猪叫声的音频信号进行特征提取，得到多维特征向量；

41、模型构建与训练模块，用于构建并训练栏位定位模型，得到训练后的栏位定位模型；

42、定位报警模块，用于采用训练后的栏位定位模型对包含仔猪叫声的实时音频信号进行定位，得到栏位定位结果并根据栏位定位结果触发报警。

43、本发明的有益效果为：通过提取多维特征向量结合自学习度量模型，实现了对仔猪声源的精准定位，提高防压报警的准确性与实用性。引入环境反射特征，同时，结合gcc-phat时延估计、mfcc声源特征及能量衰减模型，构建的多维特征向量从空间几何、声源属性、距离约束及环境指纹多个维度综合描述声源，为后续定位分析提供有效支撑。通过可学习的特征变换矩阵与多任务损失函数，将各栏位样本在投影空间内聚合成单一“原型”向量，使系统仅需存储各栏位的原型向量进行相似度匹配，新增栏位时仅需采集该栏位少量样本更新原型库，而无需改动或重训练核心模型，极大简化了系统在养猪场规模化部署与后期维护的难度与成本。设置置信度阈值，仅当最高栏位概率超过阈值时才触发报警，从而过滤掉因非目标声音（如金属撞击、远场干扰）或定位模糊事件产生的低质量匹配结果。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨雨婷,牛安然,经璐,王凯,马康,张丽萍,杨昌雨,刘阳,岳雷,梁志刚
技术所有人：新希望六和股份有限公司
我是此专利的发明人

上一篇：一种煤粉炉炉墙结构的制作方法
下一篇：负载调整补偿电路及充电器的制作方法

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！