一种基于被动声学信息的淡水鱼品种识别装置和方法与流程

文档序号:12199778阅读:308来源:国知局
一种基于被动声学信息的淡水鱼品种识别装置和方法与流程

本发明属于农产品品质分析技术领域,具体涉及一种基于被动声学信息的淡水鱼品种识别的装置和方法。



背景技术:

我国是传统的渔业大国,水产品总产量和出口量均居世界首位,其中淡水鱼的养殖产量占内陆水产品总养殖产量的较大比重,是我国主要的水产养殖种类。根据中国渔业统计年鉴公布的数据可知,2009~2013年之间,我国的淡水鱼年产量平均增长率为5.5%,到2013年,我国淡水鱼年产量就已达到2635.08万吨,且会持续增长(梁焕秋等,2014;刘佳,2014)。鱼类肉味鲜美,营养丰富,含有人体所必需的动物蛋白、钙、多种维生素等营养物质,是日常生活中不可或缺的食材。而冷冻鱼和鲜活鱼无论是在营养价值还是在销售价格上都有较大的差别,普通消费者更多的倾向于购买鲜活鱼类。目前,国内和国际的淡水鱼市场需求一直在持续增长,其中90%以上淡水鱼以鲜活形式在市面上销售。

相关研究表明,鱼类在水下有着各种各样的发声方式,如骨骼发出的声音、鳃盖的闭合声、游动时激起的水花和旋窝、鱼在沉浮时鱼鳔受到撞击震动以及鱼鳔换气时发出的声音、鱼体与鱼体之间发生碰撞所发出的声音等,声音信号丰富。而之所以我们听不到鱼所发出的任何声音,是因为水的密度是相当于空气密度的7500倍,鱼在水里面发出的声音几乎都在水的介质中逐渐消失。相关研究表明,鱼类的声音是用来实现种间或者种内的信息传递,包括生殖时的集群声、躲避敌害发生的声音、寻找食物的试探声以及识别同类的呼叫声等,其特征与鱼的种类、生理状态等生命活动紧密关联,有着特定的生物学意义。国内外对声学信息在渔业中的应用研究主要集中在鱼类发声特性及发声机理、鱼群发声信号处理、鱼类个体的水声目标特性和基于水声信号的鱼类资源评估方法等方面。在针对鱼类声音信号的研究中,大都围绕在通过分析水下的鱼声信号判断鱼群的地理分布等;个别针对鱼声信号本身的研究也以海鱼和船舶辐射噪声为主,提取信号的频域特征,目的是进行海鱼种类识别以及对鱼声信号与船舶声音信号进行识别;近年来,鱼探仪已成为渔业资源调查与评估的一个重要工具,广泛地应用于监测鱼群行为、鉴别鱼类性别、评估其它水生生物量、探测水体底部类型、监测水质和水生生态系统。

鱼声检测方式主要包括主动声呐检测和被动声呐检测,现有研究中采用主动声呐方式较多,但将被动水声信息检测技术应用于淡水鱼种类识别的应用目前尚未发现。被动声学探测具有成本适中、灵敏度高、发展较成熟的优点,因此,基于被动声学信息的淡水鱼状态检测,进而实现对淡水鱼进行品种识别更具有应用潜力,也是该领域的发展趋势。



技术实现要素:

本发明的目的为采用语音分析技术提取鱼声信号特征值,采用概率神经网络构建淡水鱼品种识别模型,实现淡水鱼品种的快速检测。

本发明技术方案:

一种基于被动声学信息的淡水鱼品种识别装置,提取原始鱼声信号的装置包括第一鱼箱,第二鱼箱,所述第一鱼箱内设有第一水听器,所述第二鱼箱内设有第二水听器,所述第一水听器、第二水听器分别与声学记录仪连接,所述第一鱼箱、第二鱼箱外设有隔音棉。

一种基于被动声学信息的淡水鱼品种识别方法,所述方法具体包括以下步骤:

1)消噪处理:提取原始鱼声信号,并对所得的鱼声信号进行消噪处理;

2)提取特征参数:根据所述步骤1)消噪处理后的鱼声信号,提取鱼声短时平均能量、鱼声短时平均过零率,再对消噪处理后的鱼声信号进行小波包分解,采用四层、五层、六层和七层小波包分解方法对鱼声信号进行了频段划分,提取各频段能量;

3)构建特征向量:根据所述步骤2)提取的短时平均能量、短时平均过零率和各频段能量构建特征向量;

4)样本集划分:采集不同品种不同时间的鱼声信号,构成一个鱼声样本集,将样本集划分为训练集和验证集;

5)特征频段挑选、特征向量降维:对经过步骤4)划分样本集的鱼声音信号进行Z-score标准化预处理,并采用竞争自适应重加权采样法、多元线性回归对特征频段再次进行优选,剔除不显著的特征频段,得到鱼声信号特征频段能量,对步骤3)特征向量降维,得到降维后的鱼声信号特征向量;

6)建立分类器模型:对所述步骤5)降维后的鱼声信号特征向量,采用概率神经网络建立淡水鱼品种分类器;

7)品种识别:对未知淡水鱼样本鱼声信号进行检测,并将鱼声样本的特征向量带入步骤6)建立的分类器中,划分出不同品种的鱼类;

完成淡水鱼品种的识别。

优选地,所述步骤5)鱼声信号特征频段挑选中,当采用四层小波包分解方法对鱼声信号进行了频段划分时筛选得到的特征频段为0-32Hz、64~96Hz、96~128Hz、128~160Hz、160~192Hz、192~224Hz、224~256Hz、256~288Hz、288~320Hz、320~352Hz、352~384Hz、416~448Hz、448~480Hz。

优选地,所述步骤5)鱼声信号特征频段挑选中,当采用五层小波包分解方法对鱼声信号进行了频段划分时筛选得到的特征频段为0-16Hz、80~96Hz、112~128Hz、144~160Hz、160~178Hz、178~192Hz、192~208Hz、208~224Hz、240~256Hz、272~288Hz、304~320Hz、320~336Hz、336~352Hz、368~384Hz、400~416Hz、432~448Hz、448~464Hz、464~480Hz。

优选地,所述步骤5)鱼声信号特征频段挑选中,当采用六层小波包分解方法对鱼声信号进行了频段划分时筛选得到的特征频段为0-8Hz、8~16Hz、24~32Hz、64~72Hz、80~88Hz、88~96Hz、112~120Hz、120~128Hz、144~152Hz、176~184Hz、192~200Hz、200~208Hz、208~216Hz、216~224Hz、224~232Hz、240~248Hz、248~256Hz、272~280Hz、304~312Hz、320~328Hz、328~336Hz、336~344Hz、344~352Hz、368~376Hz、376~384Hz、400~408Hz、432~440Hz、448~456Hz、456~464Hz、464~472Hz、472~480Hz。

优选地,所述步骤4)采用Rank-SPXY法进行样本集的划分,该方法由两部分组成,首先是Rank部分,即将样本按因变量活鱼条数的升序排序,然后将样本等分为m份;其次是SPXY法部分,即在等分m份的每个区间内采用SPXY法选取出训练集,其余的样本自动归为验证集,m分别取值为5和10。

优选地,所述步骤6)中对淡水鱼的品种识别采用的数据方法为概率神经网络分类器。

进一步优选地,所述分类器由四层组成:输入层、模式层、累加层和输出层,

输入层神经元节点对应特征向量中的每个分量,对输入层神经元节点进行归一化处理;

模式层的神经元个数取决于训练集样本特征向量维度数和待匹配的类别数的乘积,在模式层中,将经过输入层归一化处理后的特征向量进行加权处理,即Z=X·W,其中W为权值矩阵,对应于各类模式中的训练集样本,然后Z经过激活函数处理后,传给累加层;

在累加层中,把来自模式层的输出进行累加,累加层各神经元只与目标类别的神经元相连,并依据Parzen方法求和来估计样本类别的概率,输出为每一模式类别的概率估计,传递给输出层;

输出层的神经元个数与待分类目标的类别数相同,根据累加层对每一模式类别概率的估计,采用Bayes分类决策,选择出具有最小“风险”的类别,即具有最大后验概率的类别;

进一步优选地,所述概率神经网络分类器的平滑因子取值为9.0或10.0。

所述的装置或所述方法在淡水鱼养殖与渔业资源调查过程中的应用。

本发明提供的一种基于被动声学信息的淡水鱼品种识别装置及方法,有益效果如下:

1、本发明建立的淡水鱼品种识别方法,对鱼类的品种做到自动无损检测,并可提高检测效率,降低劳动成本;

2、应用本发明建立的淡水鱼品种识别方法,可以实现淡水鱼养殖和渔业资源调查过程中鱼类品种的在线检测,准确率最高为94.3%,因此,本发明可以帮助养殖户提高水产养殖设施的信息化水平,也可帮助渔业资源调查工作人员提高工作效率。

附图说明

图1本发明鱼声信号采集系统结构图;

图2概率神经网络结构图;

图3本发明的六层小波包分解结构方法;

图4 PNN网络训练后的效果图;

图5 PNN网络训练后的误差图;

图6 PNN神经网络预测效果图;

其中1为第一鱼箱,2为第二鱼箱,3声学记录仪,4为第一水听器,5为第二水听器,6为隔音棉。

具体实施方式

分类器模型的建立

分类器模型的建立采用概率神经网络分类器算法,概率神经网络(PNN)分类器结构如图2所示,由四层组成:输入层、模式层(又称为样本层)、累加层和输出层(又称为竞争层)。

在PNN的网络模型中,输入层用来接收来自训练集样本的鱼声特征向量,因此,神经元个数与鱼声特征向量维度相同。本发明提取鱼声信号的短时平均能量、短时平均过零率、四层小波包分解的各频段(只采用0-500Hz内的频段,共15个频段)能量,去除品种间差异不显著的32~64Hz频段能量x4和384~416Hz频段能量x15,构成特征向量,共15维,因此,本发明的PNN神经网络输入层采用15个神经元节点,即X1、X2、…、X15。在输入层对特征向量每个分量进行归一化处理,具体公式为:

模式层的神经元个数取决于训练集样本特征向量维度数和待匹配的类别数的乘机,本发明将鱼声信号分为4类,因此,其神经元个数为4×15=60个。在模式层中,将经过输入层归一化处理后的特征向量进行加权处理,即Z=X·W,其中W为权值矩阵,对应于各类模式中的训练集样本。然后Z经过一个激活函数处理后,传给累加层。本发明采用的激活函数为:

式中,δ2为样本方差。则该层每个神经元节点的输出为:

式中,σ是对分类有着重要作用的平滑因子,决定了模式样本点之间的影响程度,其通过影响PNN中的概率密度分布函数变化,直接决定着最终的分类效果,所以合适的平滑因子取值在设计分类器时显得尤其重要。当取值过大时,虽然概率密度估计比较平滑但细节丢失严重;而当取值过小时,密度估计又会呈现较多的尖峰突起。平滑因子的取值大小需要在反复试验对比中来确定,本发明的平滑因子取值分别为6.0、7.0、8.0、9.0、10.0、20.0、30.0。

在累加层中,累加神经元的作用是把来自模式层的输出进行累加,累加层各神经元只与目标类别的神经元相连,依据Parzen窗口方法求和来估计样本类别的概率,即其条件概率为:

该层的输出为每一模式类别的概率估计,使概率神经网络配置按后验概率自动激活。

输出层的神经元个数与待分类目标的类别数相同,本发明将鱼声信号分为4类:无鱼C1、草鱼C2、鳊鱼C3、鲫鱼C4,其输出层的对应描述如表1所示:

表1鱼声类别对应描述

根据累加层对每一模式类别的概率估计,采用Bayes分类决策,选择出具有最小“风险”的类别,即具有最大后验概率的类别,其决策方法如下:

P(X|Ci)P(Ci)>P(X/Cj)P(Cj),i≠j (5)

则输出y(X)=Ci

基于小波包分解的频段能量提取

用小波包对淡水鱼声音信号进行分解时要选择适合的分解尺度和小波包基函数,分解尺度的确定与鱼声信号的主要频段以及采样频率有关。用不同的小波包基函数对同一个鱼声信号进行分解将会得到不同的结果,所以在选用小波包对信号进行分解时,要根据不同信号的特征以及反复对比分析来选择一个最好的小波包基函数,选择的小波包基函数需要满足以下几点要求:在时域和频域都具有一定的局部化分析能力;在时域具有紧支撑性,在频域具有快速衰减性;至少具有一阶消失矩;具有良好的分解与重构性。满足上述要求的常用小波有SymletsA(symN)小波、Coiflet(coifN)小波、Daubechies(dbN)小波等。鱼声信号分析处理实际应用中一般选择dbN小波,它是Daubechies从双尺度方程系数{hk}中定义出来的离散正交小波,是离散小波变换的良好工具。N指小波的阶数。

本申请采集鱼声信号时的采样频率是4000Hz,而常见淡水鱼声音信号的主要频率成分是500Hz以下的低频部分,因此,本申请只针对0-500Hz以内的鱼声信号进行分析研究。采用小波包分解对鱼声信号进行特征参数提取,提取信号各频段内能量作为分类识别的特征参数。其步骤如下:

第一步:选取合适的分解尺度和小波基函数,对鱼声信号S进行分解。在对海洋鱼类声音信号进行小波包分解时,分解尺度一般选取为三层或四层,而由于常见淡水鱼声音信号比较微弱,且频率较低,因此,本发明分别选取四层、五层、六层作为分解尺度,选取db1小波作为小波包基函数,以六层小波包分解为例,其分解结构如图3所示。

图3中,每个节点都代表了一定的特征,比如,节点(0,0)代表原始鱼声信号S;节点(1,0)代表第一层小波包分解第0个节点的系数;节点(1,1)代表第一层小波包分解第1个节点的系数;依次类推。

第二步:利用分解的节点系数对分解尺度上的信号进行单尺度重构,得到各频段内的小波包重构信号。以Sij表示节点(i,j)的小波包重构信号,则原始鱼声信号S可以表示为:

S=S60+S61+S62+S63+…+S662+S663

四层、五层、和七层小波包分解方法与此方法相同。

实施例1

如图1所示,一种基于被动声学信息的淡水鱼存活率预测装置,提取原始鱼声信号的装置包括第一鱼箱1,第二鱼箱2,所述第一鱼箱1内设有第一水听器4,所述第二鱼箱2内设有第二水听器5,所述第一水听器4、第二水听器5分别与声学记录仪3连接,所述第一鱼箱1,第二鱼箱2外设有隔音棉6。

实施例2

1)鱼声信号采集及消噪处理:分别在图1中第一鱼箱和第二鱼箱中注入500L的水,水温度为10~15℃,溶氧量为7-8mg/L,pH为7.2-7.5,将第一水听器和第二水听器布置在水面以下20cm处,静置5min,待鱼在水中比较稳定时,设置声学记录仪进行鱼声信号采集。

设置参数如下:采集时长:1min;采样频率:4000Hz;采集通道:双通道;采集次数:3次。将草鱼、鳊鱼、鲫鱼放入1号鱼箱中,采集次数为1次,共采集草鱼声音信号样本44个,鳊鱼声音信号样本44个,鲫鱼声音信号样本44个,并采集无鱼声音信号样本44个。

2)提取特征参数:根据所述步骤1)消噪处理后的鱼声信号,提取鱼声短时平均能量、鱼声短时平均过零率,再对消噪处理后的鱼声信号进行小波包分解,采用四层小波包分解方法对鱼声信号进行了频段划分,提取各频段能量;

3)构建特征向量:根据所述步骤2)提取的短时平均能量、短时平均过零率和各频段能量构建特征向量;

4)样本集划分:采集不同品种不同时间的鱼声信号,构成一个鱼声样本集,将样本集划分为训练集和验证集;本实施例运用鱼声信号采集系统分别采集了无鱼、草鱼、鳊鱼和鲫鱼的声音信号各44组作为概率神经网络分类器的数据样本,训练集和验证集的划分结果如表2所示:

表2样本集划分结果

5)特征频段挑选、特征向量降维:对经过步骤4)划分样本集的鱼声音信号进行Z-score标准化预处理,并采用竞争自适应重加权采样法、多元线性回归对特征频段再次进行优选,剔除不显著的特征频段,得到鱼声信号特征频段能量,对步骤3)特征向量降维,得到降维后的鱼声信号特征向量;

鱼声信号频段能量显著性分析结果如表所示,由表3可知:当采用四层小波包分解方法对鱼声信号进行了频段划分时不同品种淡水鱼声音信号除32~64Hz和384~416Hz频段能量之外,其它13个频段能量均具有显著差异,

即筛选得到的特征频段为0-32Hz、64~96Hz、96~128Hz、128~160Hz、160~192Hz、192~224Hz、224~256Hz、256~288Hz、288~320Hz、320~352Hz、352~384Hz、416~448Hz、448~480Hz;

表3鱼声信号四层分解频段能量显著性分析

注:xi为鲫鱼声音信号经Z-score标准化预处理后特征值,x1是指鱼声短时平均能量、x2是指鱼声短时平均过零率,xi中i≥3时为基于四层小波包分解的频段能量。

6)建立分类器模型:对所述步骤5)降维后的鱼声信号特征向量,采用概率神经网络建立淡水鱼品种分类器;

将特征向量代入到分类器中进行品种识别。平滑因子不同取值的分类结果如表4所示:

表4平滑因子不同取值的分类结果比较

准确率计算公式如下:

其中,T为样本分类正确数,N为样本数,无鱼、草鱼、鳊鱼、鲫鱼的样本数为22,总样本数为88。

由表4可知,当平滑因子取值为9.0或10.0时,分类准确率最高,为94.3%,其训练效果图如图4、5所示,预测效果图如图6所示。

通过观察训练效果图可知,PNN神经网络对训练样本集的模拟分类的准确率为100%,说明本实施例所构建的PNN神经网络是可信的,且训练效果良好。在对88组验证集样本进行预测的分类结果中可以发现预测分类结果跟鱼声样本真实类别基本一致,其中,3个无鱼声音信号样本被判定为鳊鱼,2个无鱼声音信号样本被判定为鲫鱼,总准确率达到94.3%,说明所构建的PNN神经网络具有较好的预测能力。根据分类结果可知,采用四层小波包分解提取频段能量构建特征向量,分类准确率已经达到94.3%,且数据量少,计算量小,模型运行速度快,故本实施例采用四层小波包分解对鱼声信号进行频段划分,提取频段能量特征。

本实施例构建了概率神经网络分类器实现了淡水鱼的品种识别,并探讨了平滑因子的取值对分类器分类准确率的影响。当平滑因子取值为9.0时,分类器的分类效果达到最佳,总分类准确率为94.3%,其中无鱼的分类准确率为77.3%,草鱼、鳊鱼、鲫鱼的分类准确率均为100%,识别效果较好。

实施例3鲫鱼存活率预测模型

1)鱼声信号采集及消噪处理:分别在图1中第一鱼箱和第二鱼箱中注入500L的水,水温度为10~15℃,溶氧量为7-8mg/L,pH为7.2-7.5,将第一水听器和第二水听器布置在水面以下20cm处。将鲫鱼放入1号鱼箱中,鲫鱼的活鱼条数范围为1-50条,最小鱼水比为1:999,最大鱼水比为1:19,静置5min,待鱼在水中比较稳定时,设置声学记录仪进行鱼声信号采集。

设置参数如下:采集时长:1min;采样频率:4000Hz;采集通道:双通道;采集次数:3次。共采集鲫鱼声音信号样本1363个。

2)提取特征参数:根据所述步骤1)消噪处理后的鱼声信号,提取鱼声短时平均能量、鱼声短时平均过零率,再对消噪处理后的鱼声信号进行分解,采用四层、五层、六层和七层小波包分解方法对鱼声信号进行了频段划分,提取各频段能量;

3)构建特征向量:根据所述步骤2)提取的短时平均能量、短时平均过零率和各频段能量构建特征向量;特征向量维数如表5所示。

表5不同分解尺度的特征向量维数

4)样本集划分:对步骤1)采集的鲫鱼声音信号样本划分为训练集和验证集,样本数为1363个。

分别采用了SPXY法和Rank-SPXY法将鲫鱼声音信号样本集按照4:1的比例划分为训练集和验证集,并进行了分析比较,其中Rank-SPXY法的m分别取值为5和10。样本集划分结果如表6所示。Rank-SPXY法,该方法由两部分组成,首先是“Rank”部分,即将样本按因变量(活鱼条数)的升序排序,然后将样本等分为m份;其次是“SPXY法”部分,即在等分的每个区间内采用SPXY法选取出训练集,其余的样本自动归为验证集。其中m也是重要参数,当m=1时,即为SPXY法;当m较大时,得到的训练集活鱼条数更加均匀,但特征值的代表性有所下降。

表6不同样本集划分方法划分结果

由表6可知,采用SPXY法划分的样本集中,29-50条的鲫鱼声音样本全部划分为了训练集,这造成了样本集划分不均匀,而Rank-SPXY法所划分的验证集的数据范围包含在训练集的数据范围内,并且验证集平均值小于训练集平均值,因此选择Rank-SPXY法划分样本集更加合理。在采用Rank-SPXY法对样本集进行划分时,通过比较m=5和m=10时验证集的标准差可知,采用m=10对鲫鱼声音信号样本集的划分更加均匀,但m值较大也会影响特征值的代表性。因此,本实施例同时采用m两种不同取值对鲫鱼声音信号样本集进行划分,并建立预测模型,比较哪种取值更佳。

5)特征值挑选、特征向量降维:对经过步骤4)划分样本集的鲫鱼声音信号进行Z-score(标准分数)标准化预处理,并采用运用竞争自适应重加权采样(CARS)法对鲫鱼声音信号样本集进行特征值优选,并采用10折交叉验证选择模型交叉验证均方差(RMSECV)值最小的特征值变量子集;

运用多元线性回归(MLR)对特征频率再次进行优选,MLR建模后,剔除不显著的特征频率段,得到鱼声信号特征频段能量,对步骤3)特征向量降维,得到降维后的鱼声信号特征向量,优选结果如表7所示。

表7鲫鱼声音信号特征值优选结果

6)模型建立:对所述步骤5)降维后的鱼声信号特征向量,采用多元线性回归(MLR)法和偏最小二乘(PLSR)法分别建立鲫鱼存活率预测模型。预测模型的相关系数如表8所示。

表8预测模型相关系数

综合上述的采用不同特征提取、不同样本集划分方法以及不同建模方法得到的建模结果可知,“7层+Rank-SPXY(m=10)”得到的样本集建立的MLR预测模型的相关系数最高,但计算量是“6层+Rank-SPXY(m=10)”时的二倍,因此选取短时平均能量和短时平均过零率以及基于6层小波包分解的频段能量为鲫鱼声音信号样本的最优特征提取方法;Rank-SPXY(m=10)法为鲫鱼声音信号样本的最优样本集划分方法。对鲫鱼声音信号进行特征提取后,采用Rank-SPXY(m=10)法划分样本集,然后进行Z-score(标准分数)标准化预处理,并采用CARS法对样本集进行特征值优选,最后建立鲫鱼存活率MLR预测模型,回归方程如下:

y=40.471-3.095x2+1.710x4-1.981x5-1.768x6+2.349x7-10.883x11+7.301x12-1.306x16-2.187x18+19.417x25+9.734x28+70.133x35-25.264x43-79.860x47-40.098x50+26.155x55-24.005x61+31.320x62

方程的参数及其显著性见表9,其中,回归常数项b=40.071,xi为鲫鱼声音信号经Z-score标准化预处理后特征值,x1是指鱼声短时平均能量、x2是指鱼声短时平均过零率,xi中i≥3时为基于6层小波包分解的频段能量,具体含义见表10,ai为各特征值的回归系数。

表9回归方程的参数及其显著性

表10鱼声信号短时平均能量、短时平均过零率及鱼六层分解频段能量特征值

鲫鱼存活率预测模型的相关系数R值为0.835,定标标准差RMSECV值为10.096,说明模型具有较好的稳定性和预测性。由表5可知,在x35、x47、x50处,回归系数绝对值最大,其t值相对较大,P值均为0.000,说明这些特征值对预测模型的影响比较显著,其分别代表了鲫鱼声音信号的特征频段为256~264Hz、352~360Hz、376~384Hz。

7)预测存活率:对未知淡水鱼样本鱼声信号进行检测,并将鱼声样本的特征向量经Z-score标准化预处理后带入到回归方程中,计算出活鱼条数;

运用所述步骤6)建立的回归方程,对验证集中的274个鲫鱼声音样本进行预测。将274个鲫鱼声音样本的18个特征值经Z-score标准化预处理后带入到回归方程中,计算出活鱼条数。部分鲫鱼验证集的实际条数以及预测条数见表10。鲫鱼存活率预测模型验证的相关系数R为0.816,校验标准差RMSEP值为8.015,相对分析误差RPD值为1.79,说明该预测模型较可靠。

表11鲫鱼存活率预测结果

由表11可知,靠近两端(1条和50条)的样本预测条数误差较大,在12条左右;而中间的样本预测条数误差较小,在3条左右,模型精度有待进一步提高。

实施例4鳊鱼存活率预测模型

1)鱼声信号采集及消噪处理:分别在图1中第一鱼箱和第二鱼箱中注入500L的水,水温度为10~15℃,溶氧量为7-8mg/L,pH为7.2-7.5,将第一水听器和第二水听器布置在水面以下20cm处。将鲫鱼放入1号鱼箱中,鳊鱼的活鱼条数范围为1-30条,最小鱼水比为1:666,最大鱼水比为1:21,静置5min,待鱼在水中比较稳定时,设置声学记录仪进行鱼声信号采集。

设置参数如下:采集时长:1min;采样频率:4000Hz;采集通道:双通道;采集次数:3次。鳊鱼声音信号样本294个。

2)提取特征参数:同实施例3;

3)构建特征向量:同实施例3;

4)样本集划分:对步骤1)采集的鲫鱼声音信号样本划分为训练集和验证集,样本数为294个。

采用了SPXY法和Rank-SPXY法将鳊鱼声音信号样本集按照4:1的比例划分为训练集和验证集,并进行了分析比较,其中Rank-SPXY法的m分别取值为5和10。样本集划分结果如表12所示。

表12不同样本集划分方法划分结果

由表12可知,采用SPXY法划分的样本集中,训练集和验证集的平均值和标准差均相差较大,而采用Rank-SPXY法划分样本集的平均值和标准差均相差不大,说明采用SPXY法划分样本集造成了划分不均匀,而采用Rank-SPXY法对样本集进行划分更加均匀。因此选择Rank-SPXY法划分鳊鱼声音信号样本集更加合理。在采用Rank-SPXY法对样本集进行划分时,通过比较m=5和m=10时验证集的标准差可知,采用m=10对样本集的划分更加均匀,但m值较大也会影响特征值的代表性。因此本实施例同时采用m两种不同取值对鳊鱼声音信号样本集进行划分。

5)特征值挑选、特征向量降维:对经过步骤4)划分样本集的鲫鱼声音信号进行Z-score(标准分数)标准化预处理,并采用运用竞争自适应重加权采样(CARS)法对对鳊鱼声音信号样本集进行特征值优选,并采用10折交叉验证选择模型交叉验证均方差(RMSECV)值最小的特征值变量子集。

运用MLR对特征频率再次进行优选,MLR建模后,剔除不显著的特征频率段,得到鱼声信号特征频段能量,对步骤3)特征向量降维,得到降维后的鱼声信号特征向量,优选结果如表13所示。

表13鳊鱼声音信号特征值优选结果

6)模型建立:对所述步骤5)降维后的鱼声信号特征向量,采用多元线性回归(MLR)法和偏最小二乘(PLSR)法分别建立鳊鱼存活率预测模型。预测模型的相关系数如表14所示。

表14预测模型相关系数

综合上述的采用不同特征提取、不同样本集划分方法以及不同建模方法得到的建模结果可知,“7层+Rank-SPXY(m=5)”得到的样本集建立MLR预测模型的相关系数最高,但计算量是“6层+Rank-SPXY(m=5)”时的二倍,因此本实施例选取短时平均能量和短时平均过零率以及基于6层小波包分解的频段能量为鳊鱼声音信号样本的最优特征提取方法;Rank-SPXY(m=5)法为鳊鱼声音信号样本的最优样本集划分方法。对鳊鱼声音信号进行特征提取后,采用Rank-SPXY(m=5)法划分样本集,然后进行Z-score标准化预处理,并采用CARS法对样本集进行特征值优选,最后建立鳊鱼存活率MLR预测模型,回归方程如下:

y=4.384+1.415x5+2.681x9+8.356x14+2.694x18-3.290x24

方程的参数及其显著性见表15,其中,回归常数项b=4.384,xi为鳊鱼声音信号经预处理后的特征值,ai为各特征值的回归系数。

表15鳊鱼存活率预测模型的参数及其显著性

鳊鱼存活率模型的相关系数R值为0.894,定标标准差RMSECV值为3.83,说明模型具有较好的稳定性和预测性。由表4-10可知,在x9、x14、x18、x24处,回归系数绝对值最大,其t值相对较大,P值最大为0.034,小于0.05,说明这些特征值对预测模型的影响比较显著,其分别代表了鳊鱼声音信号的特征频段为48~56Hz、88~96Hz、120~128Hz、168~178Hz。

7)预测存活率:对未知淡水鱼样本鱼声信号进行检测,并将鱼声样本的特征向量经Z-score标准化预处理后带入到回归方程中,计算出活鱼条数;

运用步骤6)所建立的回归方程,对验证集中60个鳊鱼声音样本进行预测。将60个鳊鱼声音样本的5个特征值经Z-score标准化预处理后带入到回归方程中,计算出活鱼条数。部分鳊鱼验证集的实际条数以及预测条数见表15。鳊鱼存活率预测模型验证的相关系数R为0.865,校验标准差RMSEP值为4.54,相对分析误差RPD值为2.01,说明该预测模型非常可靠。

表15鳊鱼存活率预测结果

由表15可知,偏差最小为0条,最大为7条,这种误差是由于噪音干扰造成,有待进一步提高信号的信噪比,进而提高模型的预测精度。

本实施例建立了淡水鱼鳊鱼存活率预测模型,运用模型对验证集样本进行了预测,并研究了不同分解尺度的频段分解以及不同样本集划分方法对存活率预测模型性能的影响,结果表明:采用“短时平均能量+短时平均过零率+6层小波包分解各频段能量”提取特征结合Rank-SPXY(m=5)样本划分方法建立的鳊鱼存活率预测模型预测性能最优(R=0.894,RPD=2.01)。

上述的实施例仅为本发明的优选技术方案,而不应视为对于本发明的限制,本申请中的实施例及实施例中的特征在不冲突的情况下,可以相互任意组合。本发明的保护范围应以权利要求记载的技术方案,包括权利要求记载的技术方案中技术特征的等同替换方案为保护范围。即在此范围内的等同替换改进,也在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1