地震专业标签数据生成方法、电子设备、存储介质及系统与流程

文档序号:29957619发布日期:2022-05-11 08:21阅读:81来源:国知局
地震专业标签数据生成方法、电子设备、存储介质及系统与流程

1.本发明涉及人工智能应用领域,更具体地,涉及一种地震专业标签数据生成方法、设备、存储介质及系统。


背景技术:

2.人工智能是机器产生的智能,在计算机领域是指根据对环境的感知,做出合理的行动并获得最大收益的计算机程序。也就是说,要想实现人工智能,需要把人类理解和判断事物的能力教给计算机,让计算机拥有类似人类的识别能力。数据标注可视为模仿人类学习过程中的经验学习,相当于人类从书本中获取已有知识的认知行为。具体操作时,数据标注把需要计算机识别和分辨的图片事先打上标签,让计算机不断地识别这些图片的特征,最终实现计算机能够自主识别。
3.地震专业标签数据是地震资料处理解释利用人工智能的数据基础和根本,地震专业标签数据生成是地震资料处理解释技术智能化应用的关键所在。为了足够数量的地震专业标签数据,很多专家学者将深度学习方法引入地震标签数据的标注中,发展了采用人工智能技术的自动标注方法,但这种方法由于标注的准确度达不到实际应用的需求。利用人工智能进程地震资料处理解释的重要内容就是把数据标签输入神经网络模型进行训练,不断提高网络模型对标签的识别能力,最终得到一个精度较高的地震处理解释网络模型。数据标注得越准确,模型效果越好,这就需要精准的地震标签数据。


技术实现要素:

4.本发明的目的是提出一种地震专业标签数据生成方法、设备、存储介质及系统,实现提高地震专业数据标签的准确度,进而提高地震处理解释神经网络模型的识别率。
5.第一方面,本发明提出了一种地震专业标签数据生成方法,用于生成地震处理解释神经网络模型的训练数据,包括:
6.接收地震数据的基本标签数据集,所述基本标签数据集通过人机交互可视化的方式在地震数据处理解释的成果数据中手动对需要的地震数据进行标注形成;
7.采用数据增强方法对所述基本标签数据集中的每个标签数据进行增强扩展处理,以扩大所述基本标签数据集中标签数据的数量规模,形成增强标签数据集;
8.将所述增强标签数据集中的所有标签数据转换成原始时间域的标签数据,形成用于输入所述地震处理解释神经网络模型的训练标签数据集。
9.可选地,所述基本标签数据集的形成方法包括:
10.基于人际交互终端,通过鼠标交互操作以可视化的方式在所述地震数据处理解释的成果数据中对需要的数据进行标注,形成标签数据。
11.可选地,所述鼠标交互操作包括:对所述地震数据处理解释的成果数据中的点、线、面拾取进行操作,形成规则的或不规则的多边形,以框选出需要的数据并进行标注。
12.可选地,所述地震数据处理解释的成果数据为二维图像数据。
13.可选地,所述采用数据增强方法对所述基本标签数据集中的每个标签数据进行增强扩展处理包括:
14.将所述基本标签数据集中的标签数据作为初始标签数据,将所述初始标签数据至少进行平移处理、旋转处理、缩放处理、镜像处理中的其中之一,以形成多个新的标签数据。
15.可选地,所述平移处理包括:将所述初始标签数据沿x方向平移和/或沿y方向平移,每平移一次形成一个新的标签数据;
16.所述旋转处理包括:将所述初始标签数据按顺时针至少旋转一次,每次旋转90度,每次旋转形成一个新的标签数据;
17.所述缩放处理包括:将所述初始标签数据按照预设的比例进行缩放,形成新的标签数据;
18.所述镜像处理包括:将所述初始标签数据进行水平镜像和/或垂直镜像,每次镜像形成一个新的标签数据。
19.可选地,所述将所述增强标签数据集中的所有标签数据转换成原始时间域数据包括:
20.采用时深转换方法将所述增强标签数据集中的所有标签数据转换成原始时间域数据。
21.第二方面,本发明提出一种电子设备,所述电子设备包括:
22.至少一个处理器;以及,
23.与所述至少一个处理器通信连接的存储器;其中,
24.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的地震专业标签数据生成方法。
25.第三方面,本发明提出一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行第一方面所述的地震专业标签数据生成方法。
26.第四方面,本发明提出一种地震专业标签数据生成系统,包括:
27.标注模块,用于通过人机交互可视化的方式在地震数据处理解释的成果数据中手动对需要的地震数据进行标注,形成地震数据的基本标签数据集;
28.标签数据集接收模块,用于接收所述基本标签数据集;
29.数据增强模块,用于:采用数据增强方法对所述基本标签数据集中的每个标签数据进行增强扩展处理,以扩大所述基本标签数据集中标签数据的数量规模,形成增强标签数据集;
30.时深转换模块,用于:将所述增强标签数据集中的所有标签数据转换成原始时间域数据,形成用于训练所述地震处理解释神经网络模型的最终标签数据集。
31.本发明的有益效果在于:
32.通过人机交互可视化的标签数据标注方法,提高了数据标注的准确性,通过数据增强技术可以扩大标签数据集的数量规模,为神经网络模型提供大量带标签的数据,供机器训练和学习,保证了人工智能算法模型的有效性,提高模型运算效果。
33.本发明的装置具有其它的特性和优点,这些特性和优点从并入本文中的附图和随
后的具体实施方式中将是显而易见的,或者将在并入本文中的附图和随后的具体实施方式中进行详细陈述,这些附图和具体实施方式共同用于解释本发明的特定原理。
附图说明
34.通过结合附图对本发明示例性实施例进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显,在本发明示例性实施例中,相同的参考标号通常代表相同部件。
35.图1示出了根据本发明的一种地震专业标签数据生成方法的步骤图。
36.图2示出了根据本发明的一个实施例的一种地震专业标签数据生成系统的功能模块示意图。
37.附图标记说明:
38.1-标注模块,2-标签数据集接收模块,3-数据增强模块,4-时深转换模块。
具体实施方式
39.下面将参照附图更详细地描述本发明。虽然附图中显示了本发明的优选实施例,然而应该理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
40.实施例1
41.图1示出了根据本发明的一种地震专业标签数据生成方法的步骤图。
42.如图1所示,一种地震专业标签数据生成方法,用于生成地震处理解释神经网络模型的训练数据,包括:
43.s101:接收地震数据的基本标签数据集,基本标签数据集通过人机交互可视化的方式在地震数据处理解释的成果数据中手动对需要的地震数据进行标注形成;
44.在一个具体应用场景中,基于人际交互终端(如pc机等),通过鼠标交互操作以可视化的方式在地震数据处理解释的成果数据中对需要的数据进行标注,形成标签数据,本实施例中,地震数据处理解释的成果数据为二维图像数据,标注的是二维图像中的特征区域。鼠标交互操作包括:对地震数据处理解释的成果数据中的点、线、面拾取进行操作,形成规则的或不规则的多边形,以框选出需要的数据特征区域并进行标注。采用手动可视化的方式标注形成的标签数据的准确度和质量都比较高,相较于现有的机器自动标注方法能够有效保证标签数据的准确性和质量。
45.s102:采用数据增强方法对基本标签数据集中的每个标签数据进行增强扩展处理,以扩大基本标签数据集中标签数据的数量规模,形成增强标签数据集;
46.在上述具体应用场景中,采用数据增强方法对基本标签数据集中的每个标签数据进行增强扩展处理的方法为:
47.将基本标签数据集中的标签数据作为初始标签数据,将初始标签数据至少进行平移处理、旋转处理、缩放处理、镜像处理中的其中之一,以形成多个新的标签数据。
48.其中,平移处理包括:将初始标签数据沿x方向平移和/或沿y方向平移,每平移一次形成一个新的标签数据;例如将初始标签数据中标注的特征区域在整个图像中沿x+方向
和y+方向分别平移一次,则形成两个新的标签数据。
49.旋转处理包括:将初始标签数据按顺时针至少旋转一次,每次旋转90度,每次旋转形成一个新的标签数据;例如将初始标签数据的整个图像按照顺时针分别旋转90度3次,即形成的三个新的标签数据。
50.缩放处理包括:将初始标签数据按照预设的比例进行缩放,形成新的标签数据;例如将初始标签数据的图像向外缩放10%,然后再剪裁成与原始图片尺寸相同的图片,形成一个新的标签数据。
51.镜像处理包括:将初始标签数据进行水平镜像和/或垂直镜像,每次镜像形成一个新的标签数据。例如将初始标签数据的图像分别水平镜像、垂直镜像,则增加两个新的标签数据。
52.具体地,手动标注地震数据质量比较高,但是效率较低,形成标签数据集的规模有限。而数据集的规模较小容易使神经网络模型产生过拟合的问题,导致模型识别效果下降。因此本发明通过对收到标注的数据集进行平移、旋转、缩放、镜像等一系列数据增强技术,可以使数据集的规模几倍甚至十几倍的增加。把规模增大后的标签数据集作为神经网络模型的输入进行训练,训练出来的神经网络模型也会有更强的数据适应能力,模型预测精度随之提高。需要说明的是,本领域技术人员可以根据实际情况选择不同的数据增强方法,尽量避免加入不相关的标签数据。
53.s103:将增强标签数据集中的所有标签数据转换成原始时间域的标签数据,形成用于输入地震处理解释神经网络模型的训练标签数据集。
54.在上述具体应用场景中,采用时深转换方法将增强标签数据集中的所有标签数据转换成原始时间域数据。
55.具体地,地震专业的标签数据通常针对的是地震成果数据,也就是对地震采集到的原始数据经过一系列处理解释形成的成果数据。地震成果数据通常是深度域的数据,而作为神经网络模型输入的通常是地震采集到的原始时间域数据。所以需要采用地震中常用的时深转换方法转换成原始时间域数据。这样的最后形成的训练标签数据集输入神经网络训练出的模型,才能替代传统的地震处理解释方法。
56.实施例2
57.本发明实施例还提出一种电子设备,电子设备包括:
58.至少一个处理器;以及,
59.与至少一个处理器通信连接的存储器;其中,
60.存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行实施例1的地震专业标签数据生成方法。
61.实施例3
62.本发明实施例还提出一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行实施例1的地震专业标签数据生成方法。
63.实施例4
64.图2示出了根据本发明的一个实施例的一种地震专业标签数据生成系统的功能模块示意图。
65.如图2所示,一种地震专业标签数据生成系统,包括:
66.标注模块1,用于通过人机交互可视化的方式在地震数据处理解释的成果数据中手动对需要的地震数据进行标注,形成地震数据的基本标签数据集;
67.标签数据集接收模块2,用于接收基本标签数据集;
68.数据增强模块3,用于:采用数据增强方法对基本标签数据集中的每个标签数据进行增强扩展处理,以扩大基本标签数据集中标签数据的数量规模,形成增强标签数据集;
69.时深转换模块4,用于:将增强标签数据集中的所有标签数据转换成原始时间域数据,形成用于训练地震处理解释神经网络模型的最终标签数据集。
70.综上,本发明通过可视化的标签数据标注方法,提高了数据标注的准确性,通过数据增强技术可以扩大标签数据集的数量规模,为神经网络模型提供大量带标签的数据,供机器训练和学习,保证了人工智能算法模型的有效性,提高模型运算效果。并大大提高了地震专业数据标签的准确度,进而提供人工智能网络模型的识别率,为以岩性圈闭为主的常规油气的勘探开发和非常规(煤层气和页岩气)油气的勘探开发服务。
71.以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1