一种基于多粒度图像特征的矿物识别方法与系统

文档序号:36782919发布日期:2024-01-23 11:56阅读:23来源:国知局
一种基于多粒度图像特征的矿物识别方法与系统

本发明涉及矿物识别领域,特别是指一种基于多粒度图像特征的具有较高识别率的矿物识别方法与系统。


背景技术:

1、矿物识别是地质研究的重要内容,传统上根据矿物的物理化学性质进行识别,但存在对识别人员的专业知识依赖性高等问题,而目前使用人工智能对矿物的识别方法采用的是针对大类分类的粗粒度图像识别方法,无法对矿物非常相似的细粒度特征进行识别,因此识别准确率不高,亟需一种能结合细粒度特征对矿物进行识别的方法,以进一步提高矿物识别准确率。


技术实现思路

1、为此,本发明提供一种基于多粒度图像特征的矿物识别方法与系统,以解决现有识别方法无法对矿物非常相似的细粒度特征进行识别、进而矿物识别准确率低的问题。

2、为实现上述目的,本发明实施例提供如下技术方案:

3、本发明提供一种基于多粒度图像特征的矿物识别方法与系统,其特征在于,所述基于多粒度图像特征的矿物识别方法与系统使用渐进多粒度的方式对采用的先进骨干网络进行训练,所述方法包括:

4、将矿物图像裁剪为边长为原长1/8、1/4、1/2的多个小图块并分别采用随机拼图的方式将裁剪出的小图块拼接为3个新图,使用3个新图及原图共4个图像以交叉熵为损失函数对骨干网络进行4次训练,第1次训练时骨干网络参数初始化为在imagenet数据集上预训练得到的值,后面3次训练使用前一次训练结束时的参数为初始值,前3次训练按从细到粗的粒度分别输入3个新图,经骨干网络的3个不同层提取特征后分别使用卷积层conv得到相同维度的特征图,将这3个特征图分别使用包含2个全连接层的分类器得到前3个输出,第4次训练时将未拆分的原矿物图像输入骨干网络,并拼接之前3个conv输出的特征图输入到包含2个全连接层的第4个分类器,得到第4个输出,将4个输出相加得到结果向量,向量中最大的值即为预测的矿物类别。

5、本发明实施例具有如下优点:

6、本发明实施例公开了一种基于多粒度图像特征的矿物识别方法与系统,将矿物图像裁剪为不同粒度的小图块并采用随机拼图的方式拼接为新图对骨干网络进行多次训练,随机拼图解决了多粒度信息容易集中在相似区域的问题,使网络的每次训练专注于矿物的局部特征而不全是整体图像,每次训练专注于提取矿物的特定粒度图像特征并对提取到的多粒度矿物图像特征进行拼接融合,除第一次训练外的其他训练将上一次训练结束时获得的细粒度信息作为训练初始值进一步融合了多粒度图像特征。该方法与系统能对矿物非常相似的细粒度特征进行识别,使用矿物多粒度图像特征进一步提高了矿物的识别准确率。



技术特征:

1.一种基于多粒度图像特征的矿物识别方法与系统,其特征在于,所述基于多粒度图像特征的矿物识别方法与系统采用渐进多粒度的方式对使用的先进骨干网络进行训练,具体将矿物图像裁剪为边长为原长1/8、1/4、1/2的多个小图块并分别采用随机拼图的方式将裁剪出的小图块拼接为3个新图,使用3个新图及原图共4个图像以交叉熵为损失函数对骨干网络进行4次训练,第1次训练时骨干网络参数初始化为在imagenet数据集上预训练得到的值,后面3次训练使用前一次训练结束时的参数为初始值,前3次训练按从细到粗的粒度分别输入3个新图,经骨干网络的3个不同层提取特征后分别使用卷积层conv得到相同维度的特征图,将这3个特征图分别使用包含2个全连接层的分类器得到前3个输出,第4次训练时将未拆分的原矿物图像输入骨干网络,并拼接之前3个conv输出的特征图输入到包含2个全连接层的第4个分类器,得到第4个输出,将4个输出相加得到结果向量,向量中最大的值即为预测的矿物类别。


技术总结
本发明实施例公开了一种基于多粒度图像特征的矿物识别方法与系统,所述方法与系统将同一矿物图像根据粒度不同裁剪出多个小块并分别采用随机拼图的方式拼接出3个新图,使用3个新图及原图共4个图像对骨干网络进行粒度由细到粗的4次训练,前3次经骨干网络的不同层提取相应粒度的矿物图像特征后分类,第4次融合所有粒度特征后分类,并且将不同粒度的4次分类结果加和后作为最终识别结果,训练时除第1次训练外的后3次训练均使用前一次粒度训练结束时的参数为初始值以进一步融合矿物多粒度图像特征。本发明解决了现有矿物识别方法与系统无法对矿物非常相似的细粒度特征进行识别而带来的识别准确率不高的问题,进一步提高了矿物识别准确率。

技术研发人员:季晓慧,万成舟,杨眉,何明跃,张招崇,王玉柱,曾姗
受保护的技术使用者:中国地质大学(北京)
技术研发日:
技术公布日:2024/1/22
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1