基于图像数据的陶片分类方法、系统和介质

文档序号:36896814发布日期:2024-02-02 21:28阅读:19来源:国知局
基于图像数据的陶片分类方法、系统和介质

本发明涉及图像处理,尤其是涉及基于图像数据的陶片分类方法、系统和介质。


背景技术:

1、河姆渡文化是中国南方最重要的新石器文化,通过考古发掘,无数的村庄和成千上万的文物向我们讲述了河姆渡人2000年的历史。河姆渡遗址是中国最有代表性的新石器时代考古遗址之一,河姆渡文化以陶器出土数量多、修复率高为特点。在多次考古考察的过程中,出土了惊人的40万件陶器碎片,其中大约六分之一是完整的、可修复的器皿。

2、从河姆渡遗址出土的陶器大致可分为两种:夹砂陶和夹炭陶。夹砂陶的特点是在烧制过程中夹杂了大量的砂砾,这赋予了陶器坚固而致密的质地,以及优异的硬度和导热性。它可以承受高温烧制而不翘曲,即使随后暴露在高温下也能保持抗破损。另一方面,夹炭陶需要在烧制过程中加入大量的有机材料,如碾碎的植物茎、叶和外壳。这导致形成多孔结构或类似于骨灰的木炭残留物,使陶器表面光滑,密度较低陶器数据所包含的信息大致可以分为两类:纹理信息和形状信息。

3、但是靠形状信息进行分类十分不易,主要还是通过纹理进行分类。对这些陶器碎片的分类和分析,是了解那个时代的社会习俗、经济文化和生活方式的重要手段,传统的分类方法严重依赖人工,耗时久,为劳动密集型工作,且容易受到相关个人的主观解释、专业知识、技能和经验的影响。


技术实现思路

1、本发明的目的在于克服上述技术不足,提出基于图像数据的陶片分类方法、系统和介质,解决现有技术中传统的分类方法严重依赖人工、耗时久,容易受到个人的主观影响的技术问题。

2、为达到上述技术目的,第一方面,本发明的技术方案提供一种基于图像数据的陶片分类方法,包括以下步骤:

3、获取陶片的图像数据并标注陶片的类型,所述图像数据包括多张夹砂陶图像和多张夹炭陶图像;

4、对所述图像数据进行数据裁剪和数据增强处理;

5、将数据增强前后的两组所述图像数据输入到同一个编码器中,得到n维的特征向量;

6、将n维的所述特征向量投影到m维,n大于m,且n为m的整数倍;

7、计算所述特征向量的监督对比损失函数和中心损失函数,相加得到训练损失函数;

8、基于flooding方法(泛洪策略)控制训练损失函数在预设区间内重复波动,以使线性分类器保持训练能力,所述线性分类器包括训练损失函数和评分函数;

9、使用训练完成的所述线性分类器对图像数据进行分类。

10、与现有技术相比,本发明提供的基于图像数据的陶片分类方法的有益效果包括:

11、本技术的基于图像数据的陶片分类方法,首先采集陶片的图像数据并标注陶片的类型,再对所述图像数据进行数据裁剪和数据增强处理,然后进行特征提取和降维投影得到预设维度的特征向量,基于特征向量计算得到训练损失函数,基于flooding方法控制训练损失函数在预设区间内重复波动得到训练好的线性分类器,通过训练好的线性分类器对图像数据进行分类。本技术能够实现高准确率地陶片分类,基于算法对陶片分类能够有效提升分类的效率和可靠性,减少了个人的主观解释、专业知识、技能和经验对分类过程的影响。

12、根据本发明的一些实施例,对所述图像数据进行数据裁剪,包括步骤:

13、将所述图像数据中的背景部分替换为白色;

14、根据所述图像数据中陶片的大小对所述图像数据进行数据裁剪,使裁剪后的图像中所述陶片占比尽可能大。

15、根据本发明的一些实施例,对所述图像数据进行数据增强处理,包括步骤:

16、对所述图像数据进行随机裁剪、随机翻转操作。

17、根据本发明的一些实施例,n=2048,m=512,计算所述特征向量的监督对比损失函数和中心损失函数,包括步骤:

18、计算所述特征向量的监督对比损失函数

19、

20、i是指输入模型中的样本,p(i)是指与当前i具有相同标签的样本。a(i)是指除i之外其余样本组成的集合,zi是指经过投影得到的512位的向量,τ是温度系数用来平衡困难样本的惩罚程度

21、所述中心损失函数:

22、

23、xi与上面的zi相同,ci表示与第i个样本类别相同的数据的特征分布中心,cj(i)表示与第i个样本不同类别的特征分布中心,margin是一个大于0的常数,用来保证损失的效果。

24、根据本发明的一些实施例,相加得到训练损失函数,计算式:

25、

26、λ用来控制所述中心损失函数的权重。

27、根据本发明的一些实施例,基于flooding方法控制训练损失函数在预设区间内重复波动,表达式如下:

28、

29、j(θ)是待优化目标,即训练损失函数,为改进后的训练损失函数,b为floodinglevel,用来控制flooding方法的区间。

30、第二方面,本发明的技术方案提供一种基于图像数据的陶片分类系统,包括:

31、图像获取模块,用于获取陶片的图像数据并标注陶片的类型,所述图像数据包括多张夹砂陶图像和多张夹炭陶图像;

32、数据预处理模块,与所述图像获取模块通信连接,用于对所述图像数据进行数据裁剪和数据增强处理;

33、特征提取模块,与所述数据预处理模块通信连接,用于将数据增强前后的两组所述图像数据输入到同一个编码器中,得到n维的特征向量;

34、投影模块,与所述特征提取模块通信连接,用于将n维的所述特征向量投影到m维,n大于m,且n为m的整数倍;

35、损失函数计算模块,与所述投影模块通信连接,用于计算所述特征向量的监督对比损失函数和中心损失函数,相加得到训练损失函数;

36、分类器控制模块,与所述损失函数计算模块通信连接,基于flooding方法控制训练损失函数在预设区间内重复波动,以使线性分类器保持训练能力,所述线性分类器包括训练损失函数和评分函数;

37、分类模块,与所述分类器控制模块通信连接,使用训练完成的所述线性分类器对图像数据进行分类。

38、根据本发明的一些实施例,所述数据预处理模块包括:

39、背景替换单元,用于将所述图像数据中的背景部分替换为白色;

40、数据裁剪单元,与所述背景替换单元通信连接,根据所述图像数据中陶片的大小对所述图像数据进行数据裁剪,使裁剪后的图像中所述陶片占比尽可能大。

41、根据本发明的一些实施例,所述数据预处理模块还包括:

42、数据增强单元,与所述数据裁剪单元通信连接,用于对所述图像数据进行随机裁剪、随机翻转操作。

43、第三方面,本发明的技术方案提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如第一方面中任意一项所述的基于图像数据的陶片分类方法。

44、本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1