一种基于动态时间规整的海洋生物识别方法与流程

文档序号:13619668阅读:340来源:国知局
本发明涉及一种海洋生物识别方法,特别涉及一种基于动态时间规整的海洋生物识别方法。
背景技术
:利用声学方法识别海洋生物,具有快速、准确、可持续观察等优点。海洋生物的声学信号分为主动和被动两种形式,识别步骤包括数据预处理、特征提取、训练识别模型、模式匹配。目前的海洋生物声学方法识别研究通常使用需要提前训练的识别模型在同类物种内进行识别。例如,首先利用训练数据训练鲸类、鱼类的识别模型,识别时将鲸类信号特征输入至鲸类识别模型,将鱼类信号特征输入至鱼类识别模型,进而得出具体是何种鲸类或鱼类,例如蓝鲸或大黄鱼。在实际应用中,此种方式存在两点不足。一是必须预先确定待识别的信号所属的物种,无法做到多物种混合识别。二是采集海洋生物的声学信号较困难,物种的样本数据一般较少,很难通过少量的训练数据获得较好的识别模型参数。当特征库更新或物种类别增加时,需重新训练或新建识别模型。技术实现要素:为解决上述技术问题,本发明提供了一种基于动态时间规整的海洋生物识别方法,以达到无需预先训练,只需少量数据即可进行特征匹配,无需预知信号所属的物种即可进行混合识别,数据量和物种种类增加时无需调整算法的目的。为达到上述目的,本发明的技术方案如下:一种基于动态时间规整的海洋生物识别方法,包括提取已知海洋生物物种的信号特征作为该物种的特征模板,每个物种的特征模板可包含多个特征;提取待识别生物的信号特征,使用动态时间规整算法将待识别生物的信号特征与特征模板的信号特征进行模式匹配,在设定的阈值范围内匹配成功则为该特征模板的生物,否则为未知生物。上述方案中,所述信号特征包括作为主动信号特征的包络和作为被动信号特征的梅尔频率倒谱系数。进一步的技术方案中,所述包络的模式匹配步骤如下:(1)待识别信号的特征量记作f,特征模板的某一特征记作m,f和m分别是维数为m和n的向量,计算f和m每维之间的距离,并填充距离矩阵dist,dist是m×n的矩阵,计算公式如下:dist(i,j)=[f(i)-m(j)]2(1);(2)由dist计算累积距离矩阵d,d是m×n的矩阵;令d(1,1)=dist(1,1),d的第一行和第一列分别由dist的第一行和第一列累加得到:d(i,1)=dist(i,1)+d(i-1,1),2≤i≤m(2);d(1,j)=dist(1,j)+d(1,j-1),2≤j≤n(3);从第2行第2列开始,d(i,j)只能由3个点中的一个值累加得到,分别是d(i-1,j)、d(i,j-1)、d(i-1,j-1),取其最小值与d(i,j)相加作为位置(i,j)的累积距离,计算公式如下:d(i,j)=dist(i,j)+min[d(i,j-1),d(i-1,j),d(i-1,j-1)](4);(3)填充累积距离矩阵d之后,从位置(m,n)倒序寻找一条最小累积距离的路径,将路径点的位置作为最优路径记录至r中,r是r×2的矩阵,r为最优路径点的个数;(4)f和m的最小累计距离是d(m,n),r中记录的是最优路径点,d(m,n)除以r就可以得到f和m的距离,记为dfm;(5)依次计算f与各物种特征模板中特征的距离dfm,当特征模板中某一物种的特征数量多于一个时,对同物种内的dfm取平均值;如果dfm的最小值小于设定的阈值,则m所属的物种即为识别结果;如果dfm的最小值大于设定的阈值,则判定为未知物种。进一步的技术方案中,所述梅尔频率倒谱系数的模式匹配步骤如下:(1)提取待识别信号的梅尔频率倒谱系数记作f,特征模板的某个梅尔频率倒谱系数记作m,f和m分别是m×d和n×d的矩阵,m和n是帧数,d是每一帧的维数;由于梅尔频率倒谱系数特征是矩阵的形式,距离矩阵dist由f和m每帧之间的距离进行填充,每帧之间的距离计算公式如下:(2)由dist计算累积距离矩阵d,d是m×n的矩阵;令d(1,1)=dist(1,1),d的第一行和第一列分别由dist的第一行和第一列累加得到:d(i,1)=dist(i,1)+d(i-1,1),2≤i≤m(2);d(1,j)=dist(1,j)+d(1,j-1),2≤j≤n(3);从第2行第2列开始,d(i,j)只能由3个点中的一个值累加得到,分别是d(i-1,j)、d(i,j-1)、d(i-1,j-1),取其最小值与d(i,j)相加作为位置(i,j)的累积距离,计算公式如下:d(i,j)=dist(i,j)+min[d(i,j-1),d(i-1,j),d(i-1,j-1)](4);(3)填充累积距离矩阵d之后,从位置(m,n)倒序寻找一条最小累积距离的路径,将路径点的位置作为最优路径记录至r中,r是r×2的矩阵,r为最优路径点的个数;(4)f和m的最小累计距离是d(m,n),r中记录的是最优路径点,d(m,n)除以r就可以得到f和m的距离,记为dfm;(5)依次计算f与各物种特征模板中特征的距离dfm,当特征模板中某一物种的特征数量多于一个时,对同物种内的dfm取平均值;如果dfm的最小值小于设定的阈值,则m所属的物种即为识别结果;如果dfm的最小值大于设定的阈值,则判定为未知物种。通过上述技术方案,本发明提供的基于动态时间规整的海洋生物识别方法针对多种类的海洋生物和小数据量的应用场景,根据海洋生物主被动声学信号的特点,提取时域信号的包络作为主动信号的特征,提取mel频率倒谱系数(melfrequencycepstrumcoefficient,mfcc)作为被动信号的特征,使用动态时间规整(dynamictimewarping,dtw)算法进行自动识别。该算法无需预先训练,只需少量数据即可进行特征匹配,无需预知信号所属的物种即可进行混合识别,数据量和物种种类增加时无需调整算法,具有很好的应用前景。具体实施方式下面将对本发明实施例中的技术方案进行清楚、完整地描述。本发明提供了一种基于动态时间规整的海洋生物识别方法,具体实施例如下:实施例一:分别提取黄鱼、鲈鱼、黑头主动信号的包络特征,选择每种鱼类的10个特征作为该种类的特征模板,按照以下步骤将待识别生物的包络特征与特征模板的信号特征进行模式匹配:(1)待识别信号的特征量记作f,特征模板的某一特征记作m,f和m分别是维数为m和n的向量,计算f和m每维之间的距离,并填充距离矩阵dist,dist是m×n的矩阵,计算公式如下:dist(i,j)=[f(i)-m(j)]2(1);(2)由dist计算累积距离矩阵d,d是m×n的矩阵;令d(1,1)=dist(1,1),d的第一行和第一列分别由dist的第一行和第一列累加得到:d(i,1)=dist(i,1)+d(i-1,1),2≤i≤m(2);d(1,j)=dist(1,j)+d(1,j-1),2≤j≤n(3);从第2行第2列开始,d(i,j)只能由3个点中的一个值累加得到,分别是d(i-1,j)、d(i,j-1)、d(i-1,j-1),取其最小值与d(i,j)相加作为位置(i,j)的累积距离,计算公式如下:d(i,j)=dist(i,j)+min[d(i,j-1),d(i-1,j),d(i-1,j-1)](4);(3)填充累积距离矩阵d之后,从位置(m,n)倒序寻找一条最小累积距离的路径,将路径点的位置作为最优路径记录至r中,r是r×2的矩阵,r为最优路径点的个数;(4)f和m的最小累计距离是d(m,n),r中记录的是最优路径点,d(m,n)除以r就可以得到f和m的距离,记为dfm;(5)依次计算f与各物种特征模板中特征的距离dfm,当特征模板中某一物种的特征数量多于一个时,对同物种内的dfm取平均值;如果dfm的最小值小于设定的阈值,则m所属的物种即为识别结果;如果dfm的最小值大于设定的阈值,则判定为未知物种。识别结果见表1所示:表1鱼类主动信号识别结果黄鱼鲈鱼黑头特征模板数量101010识别样本数量98264194正确识别样本数量98262193识别率100%99.24%99.48%实施例二:提取6种鱼类被动信号的梅尔频率倒谱系数特征(mfcc),选择每种鱼类的5个特征作为该种类的特征模板,分别对3种、5种、6种鱼类使用dtw算法进行分类识别,具体步骤如下:(1)提取待识别信号的梅尔频率倒谱系数记作f,特征模板的某个梅尔频率倒谱系数记作m,f和m分别是m×d和n×d的矩阵,m和n是帧数,d是每一帧的维数;由于梅尔频率倒谱系数特征是矩阵的形式,距离矩阵dist由f和m每帧之间的距离进行填充,每帧之间的距离计算公式如下:(2)由dist计算累积距离矩阵d,d是m×n的矩阵;令d(1,1)=dist(1,1),d的第一行和第一列分别由dist的第一行和第一列累加得到:d(i,1)=dist(i,1)+d(i-1,1),2≤i≤m(2);d(1,j)=dist(1,j)+d(1,j-1),2≤j≤n(3);从第2行第2列开始,d(i,j)只能由3个点中的一个值累加得到,分别是d(i-1,j)、d(i,j-1)、d(i-1,j-1),取其最小值与d(i,j)相加作为位置(i,j)的累积距离,计算公式如下:d(i,j)=dist(i,j)+min[d(i,j-1),d(i-1,j),d(i-1,j-1)](4);(3)填充累积距离矩阵d之后,从位置(m,n)倒序寻找一条最小累积距离的路径,将路径点的位置作为最优路径记录至r中,r是r×2的矩阵,r为最优路径点的个数;(4)f和m的最小累计距离是d(m,n),r中记录的是最优路径点,d(m,n)除以r就可以得到f和m的距离,记为dfm;(5)依次计算f与各物种特征模板中特征的距离dfm,当特征模板中某一物种的特征数量多于一个时,对同物种内的dfm取平均值;如果dfm的最小值小于设定的阈值,则m所属的物种即为识别结果;如果dfm的最小值大于设定的阈值,则判定为未知物种。识别结果显示在表2。表2鱼类被动信号识别结果鱼类物种数量3种鱼类5种鱼类6种鱼类特征模板数量152530识别样本数量588094正确识别样本数量587789识别率100%96.25%94.68%实施例三:提取了3种虾类和12种鲸类被动信号的梅尔频率倒谱系数特征(mfcc),与实施例二的6中鱼类共同(总共21个物种)进行混合识别,具体步骤与实施例二相同。识别结果显示在表3。表3被动信号混合识别结果混合物种组成6种鱼类3种虾类12种鲸类所有物种(21种)特征模板数量301560105识别样本数量943885217混合识别正确样本数量813277190混合识别率86.17%84.21%90.59%87.56%识别结果表明,dtw算法对主被动信号均具有较高的识别率。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1