本发明涉及海底生物识别技术领域,具体涉及一种冷泉区海底生物识别方法及处理终端。
背景技术:
冷泉区域海底水合物的形成有密切关系,冷泉区提供的甲烷等烃类气体不仅可作为合成海底水合物的材料,同时还为冷泉区的海底生物提供能量。依赖于海底冷泉区渗漏的气体为生的生物,通常被叫作冷泉生物,冷泉生物主要包括白瓜贝,贻贝,细菌席等生物。而这些冷泉生物的出现、分布与密度能够表征所在地冷泉的活跃程度,进而还可以根据冷泉的活跃程度判断海底是否存在水合物。因此,对冷泉区海底生物识别具有重要的现实意义。
目前,深度学习在视频图像、语音识别、自然语言处理等相关领域得到了广泛应用。卷积神经网络(cnn)作为深度学习的一个重要分支,由于其超强的拟合能力以及端到端的全局优化能力,使得视频图像分类任务在应用卷积神经网络之后,预测精度大幅提升。因此,可以通过卷积神经网络对冷泉去海底生物照片进行标记并输出标签,每一个标签对应一个生物,从而识别出冷泉生物。但目前卷积神经网络仅能对一个输入的数据给出一个标签,而无法给出多标签。然而在真实的应用场景中,一般对冷泉去海底生物的图片通常包括多个物体,相应的,期望能够对输入数据给出多个分类结果。而且,对于冷泉去海底生物识别的场景中,很多冷泉生物之间存在伴生依赖关系,也即,很多冷泉生物可能会同时出现或者同时不出现,单纯的多标签分类方法很难捕捉到标签之间的相关性。因此,需要一种能够对冷泉区海底生物进行多标签标记以达到识别冷泉生物的目的。
技术实现要素:
针对现有技术的不足,本发明的目的之一提供一种冷泉区海底生物识别方法,其能够解决冷泉区海底生物识别的问题;
本发明的目的之二提供一种处理终端,其能够解决冷泉区海底生物识别的问题。
实现本发明的目的之一的技术方案为:一种冷泉区海底生物识别方法,包括如下步骤:
步骤1:获得冷泉区海底生物图片,并接收对冷泉区海底生物照片上的冷泉生物进行标记,所述标记至少包括表征开始标记的开始标记<start>和表征结束标记的结束标记<end>,标记后的冷泉区海底生物图片为包括图像数据和标签数据的样本数据;
步骤2:将所述图像数据输入卷积神经网络,卷积神经网络输出结果为图像数据的视觉特征,视觉特征记为featureimage,
将标签数据输入嵌入神经网络,嵌入神经网络输出结果为标签数据的文本特征,其中,第i个标签对应的文本特征记为
步骤3:将视觉特征和文本特征输入循环神经网络进行特征融合,对于循环神经网络的第i次循环,对应的输入特征为
其中,输出特征
步骤4:将每一次的输出特征
进一步地,所述卷积神经网络为采用任意的网络结构。
进一步地,所述步骤4中,深度神经网络进行标签预测,采用softmax交叉熵作为损失函数。
实现本发明的目的之二的技术方案为:一种处理终端,其包括,存储器,用于存储程序指令;
处理器,用于运行所述程序指令,以执行所述的冷泉区海底生物识别方法的步骤。
本发明的有益效果为:本发明能够冷泉区的冷泉生物进行多标签标记,并识别出冷泉生物,识别结果准确性高。
附图说明
图1为本发明的流程示意图;
图2为本发明一种处理终端的结构示意图。
具体实施方式
下面,结合附图以及具体实施方案,对本发明做进一步描述。
如图1所示,一种冷泉区海底生物识别方法,包括如下步骤:
步骤1:获得冷泉区海底生物的拍摄照片,该拍摄照片也即是冷泉区海底生物图片,并对冷泉区海底生物照片上的冷泉生物进行标记。例如对冷泉区海底生物图片中的白瓜贝进行标记,例如标记为“白瓜贝”,标记除了对冷泉区海底生物图片中的生物进行标记之外,还至少包括表征开始标记的开始标记,以及表征结束标记的结束标记,可以分别用<start>、<end>两个标签来表示。标记后的冷泉区海底生物图片为样本数据,也即样本数据包括图像数据和标签数据,图像数据即是冷泉区海底生物图片本身,而标签数据即是标记。
本步骤中,可以采用照相设备在冷泉去进行拍摄,从而可以得到冷泉区海底生物图片。冷泉区海底生物图片中通常包括冷泉生物。通过人工对冷泉区海底生物照片上的冷泉生物进行人工标记,不同冷泉生物用不同标记,人工进行标记可以有效得到较为真实、准确的冷泉区海底生物图片中的各个冷泉生物。
步骤2:将所述图像数据输入卷积神经网络,卷积神经网络输出结果为图像数据的视觉特征,视觉特征记为featureimage,卷积神经网络可以采用任意的网络结构,包括开源(例如inception、vgg、resnet)或专有的网络,不作具体限定。其中,每一个图像数据输入卷积神经网络均对应一个视觉特征,也即每一张冷泉区海底生物图片经卷积神经网络处理后,输出一个视觉特征。
将标签数据输入嵌入神经网络,嵌入神经网络输出结果为标签数据的文本特征,其中,第i个标签对应的文本特征记为
步骤3:将视觉特征和文本特征输入循环神经网络(recurrentneuralnetwork,rnn)进行特征融合,对于循环神经网络的第i次循环,对应的输入特征为
公式①也即是表示视觉特征和文本特征融合特征后的结果与上一次循环神经网络的输出特征相乘,相乘结果作为当前循环神经网络的输入特征,从而对循环神经网络输出的特征结果添加注意力机制,以预测不定长的多标签感知结果。其中,⊕表示拼接运算,也即是将两个特征数据拼接在一起,例如,假设featureimage=[1,2,3],
本步骤中,每一次循环都有一个输出特征,对第i次循环,输出特征为
步骤4:将步骤3中经过循环神经网络处理的输出结果,也即是将每一次的输出特征为
本步骤中,每一个标签有一个输出特征,对应有一个预测结果,从而实现多标签的感知结果,也即能够识别出一个样本数据中的各个冷泉生物。
本发明还涉及冷泉区海底生物识别方法的实体实现处理终端100,其包括,
存储器101,用于存储程序指令;
处理器102,用于运行所述程序指令,以执行所述冷泉区海底生物识别方法的步骤。
本说明书所公开的实施例只是对本发明单方面特征的一个例证,本发明的保护范围不限于此实施例,其他任何功能等效的实施例均落入本发明的保护范围内。对于本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及变形,而所有的这些改变以及变形都应该属于本发明权利要求的保护范围之内。