一种基于机器学习的森林生长建模与预测的方法及装置与流程

文档序号：18269016发布日期：2019-07-27 09:28阅读：519来源：国知局

本发明涉及森林工业、森林测量领域，具体涉及一种基于机器学习的森林生长建模与预测的方法及装置。

背景技术：

在森林工业领域，对木材的生物质量(biomass)的测量、估计和预测是一个重要的工作。这是由于森林的价值直接取决于森林的储量，而生物质量是其储量的重要指标。例如，森林的固碳总量、经济林的商业价值总量均可以从森林的生物质量计算得来。

在现有技术中，已经存在有多种生物质量的测量、估计和预测方法，这些方法总结起来均是使用测量固定的参数，例如胸径，并根据数学模型估计单棵树木或区域森林的生物质量。例如，基于异速生长学(allometry)的生物质量估计(biomassestimation)方法是广泛应用的方法。例如，通过简单的异速生长学公式：w＝ah^bd^c就可以计算出树木的生物质量；其中w为生物质量，h为树木高度，d为树木胸径，a，b，c为估计参数。然而，这种方法的准确度较低，模型精度随不同的材种而变化，但是好处在于无需破坏树木。近年来，基于遥测遥感的森林生物质量测量、估计与预测得到了很快的发展，例如基于无人机或微星为载体、基于激光雷达或多光谱传感器为测量手段的方法得到了发展。然而，遥测遥感的方法精度受到地形等因素的影响，精度不可靠。

技术实现要素：

为了解决现有技术中存在的问题，本申请实施例提供了一种基于机器学习的森林生长建模与预测的方法及装置。

本申请实施例的第一方面提供了一种基于机器学习的森林生长建模与预测的方法，包括：

通过至少一个图像传感装置采集树木的破坏性取样图像数据；

对图像数据中的年轮进行标注，获取标注数据；

获取图像数据对应树木的基本参数，其中基本参数至少包括树木生物质量数据；

将图像数据、标注数据、基本参数作为训练数据输入至机器学习模型并进行训练，生成生物质量模型；

生物质量模型用于对后续采集到的破坏性取样图像数据进行自动识别并输出当前及预测的树木生物质量数据。

在一些实施例中，对图像数据中的年轮进行标注，具体包括：对图像数据中每一圈年轮的边缘进行标注；根据已标注的每一圈年轮的边缘标注每一圈年轮的尺寸信息。

在一些实施例中，生物质量模型用于对后续采集到的破坏性取样图像数据进行自动识别并输出当前及预测的树木生物质量数据具体包括：生物质量模型根据图像数据自动识别出各圈年轮的边缘，并根据各圈年轮的图像数据输出当前及预测的树木生物质量数据。

在一些实施例中，图像传感装置包括：可见光图像传感器、主动式太赫兹探测传感器和多光谱图像传感器中的至少一种。

在一些实施例中，破坏性取样图像数据包括：树木砍伐横截面的图像数据、横截面的太赫兹传感图像数据和钻取的树木生长样本图像数据中的至少一种。

本申请实施例的第二方面提供了一种基于机器学习的森林生长建模与预测的装置，包括：

图像采集模块，用于通过至少一个图像传感装置采集树木的破坏性取样图像数据；

训练数据获取模块，用于对图像数据中的年轮进行标注，获取标注数据；获取图像数据对应树木的基本参数，其中基本参数至少包括树木生物质量数据；并将图像数据、标注数据、基本参数作为训练数据；

模型生成模块，用于将训练数据获取模块获取到的训练数据输入至机器学习模型并进行训练，生成生物质量模型；

生物质量模型用于对后续采集到的破坏性取样图像数据进行自动识别并输出当前及预测的树木生物质量数据。

在一些实施例中，训练数据获取模块包括数据标注子模块；

标注子模块，用于对图像数据中每一圈年轮的边缘进行标注；根据已标注的每一圈年轮的边缘标注每一圈年轮的尺寸信息。

在一些实施例中，模型生成模块生成的生物质量模型，具体用于根据图像数据自动识别出各圈年轮的边缘，并根据各圈年轮的图像数据输出当前及预测的树木生物质量数据。

在一些实施例中，图像采集模块中的图像传感装置包括：可见光图像传感器、主动式太赫兹探测传感器和多光谱图像传感器中的至少一种。

在一些实施例中，图像采集模块采集的破坏性取样图像数据包括：树木砍伐横截面的图像数据、横截面的太赫兹传感图像数据和钻取的树木生长样本图像数据中的至少一种。

本申请实施例的第三方面还提供了一种电子设备，包括：存储器以及一个或多个处理器；

其中，所述存储器与所述一个或多个处理器通信连接，所述存储器中存储有可被所述一个或多个处理器执行的指令，所述指令被所述一个或多个处理器执行时，所述电子设备用于实现如前述各实施例所述的方法。

本申请实施例的第四方面提供了一种计算机可读存储介质，其上存储有计算机可执行指令，当所述计算机可执行指令被计算装置执行时，可用来实现如前述各实施例所述的方法。

本申请实施例的第五方面提供了一种计算机程序产品，所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，可用来实现如前述各实施例所述的方法。

本发明的有益效果为：本发明提出了一种基于机器学习的森林生长建模与预测的方法及装置，能够将多维度的训练数据输入至机器学习模型生成生物质量模型，使得生物质量模型的自适应性更强、预测准确度更高。

附图说明

为了更清楚的说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是现有技术中根据破坏性取样得到的生物质回归曲线；

图2是本申请一个实施例中公开的一种基于机器学习的森林生长建模与预测的方法流程图；

图3是本申请一个实施例中公开了按照年轮标注信息的示意图；

图4是本申请一个实施例中公开的生物质量随着时间变化的增长曲线示意图；

图5是本申请一个实施例中公开的基于年轮图像的生物质量预测示意图；

图6是本申请一个实施例中公开的一种基于机器学习的森林生长建模与预测的装置框图；

图7是本申请一个实施例中公开的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请实施例一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

在现有技术中，破坏性的取样相比其他的方法拥有较好的精度。这种方法需要将森林区域中的一定数量树木砍倒，然后带入实验室进行各种测量，最后能得到精度较高的模型。如图1所示，x轴表示树木胸径，y轴表示总生物量，图中离散点表示不同的样本情况，根据样本情况拟合出生物质回归曲线，其中，所述生物质回归曲线用来描述树木胸径与总生物量的关系。然而，破坏性取样的缺点在于需要对树木进行破坏，并且只适用于学术研究。一旦研究结束，数据和模型则不再发生变化，固定的模型被应用到不同的区域、材种，因此可能带来预测的偏差，例如在全球森林碳储量的预测上，不同结果带来较大的出入。而在真实的林业工业中，模型受到各种其他因素的影响、例如树种、降雨、地形等因素的影响，因此这种小型的用于研究的模型不能适用于真实的林业生产和经营中，预测偏差可能带来直接的经济损失或估值偏差。除此之外，由于获得大量的破坏性样本的成本过于高昂，现有的模型只能拟合少量的重要的参数。

然而，随着近几年来人工智能、尤其是机器学习方法的进步与发展，在模型拟合方面利用大数据的方法逐渐显示出超越传统方法的优势。一方面，机器学习的方法可以随着数据量的累计不断提升性能，这在生物质量测量方面是极大的好处，因为过往的研究中积累的数据并不能整合起来并加以利用。此外，机器学习能够自动拟合多种参数，尤其是机器学习能够将多种模型在神经网络的隐层内部进行拟合，这意味着构建高精度、区域性的模型将变为可行。

在本申请实施例中，所提出的方法是基于这样一种前提，传统的建模方法受限于成本，因此只能处理较少的参数。这个成本一方面体现在获得数据的成本，例如砍伐树木，取样，实验室内部的数据处理等；成本另外一方面体现在建模所付出的人力，调节各种参数之间的关系、进行函数拟合、测试精度等。

在本申请实施例中，所述生物质量模型包括生物质量估计、生物质量生长、生物质量产出等模型。

如图2所示，本申请实施例的一个实施例公开了一种基于机器学习的森林生长建模与预测的方法，所述方法包括：通过至少一个图像传感装置采集树木的破坏性取样图像数据；

s201、通过至少一个图像传感装置采集树木的破坏性取样图像数据；

s202、对图像数据中的年轮进行标注，获取标注数据；

s203、获取图像数据对应树木的基本参数，其中基本参数至少包括树木生物质量数据；

s204、将图像数据、标注数据、基本参数作为训练数据输入至机器学习模型并进行训练，生成生物质量模型；

其中，生物质量模型用于对后续采集到的破坏性取样图像数据进行自动识别并输出当前及预测的树木生物质量数据。

所述方法还包括：对所述训练数据按照材种进行分类；将分类后的训练数据输入至所述机器学习模型并进行训练，生成所述材种对应的生物质量模型。

在本实施例中，本申请实施例至少包含一个图像传感装置，用于获取一个树木的破坏性取样图像。例如，图像传感装置可以是可见光图像传感器。由于含水量对于树木生物质量计算至关重要，因此图像传感装置也可以是主动式太赫兹探测传感器(“reviewofmoistureandliquiddetectionandmappingusingterahertzimaging”，johnf.federici，《journalofinfrared,millimeterandterahertzwaves》volume33,issue2,pp97–126，february2012)；图像传感装置还可以是多光谱图像传感器。其中，破坏性取样图像数据可以是树木砍伐横截面的图像数据，或者横截面的太赫兹传感图像数据；还可以是钻取的树木生长样本(incrementcore)图像数据。

进一步的，对图像传感装置获得的图像进行标注，由于破坏性取样提供了更为精细的数据，而在传统建模中这些数据往往由于建模过于复杂而被忽略了。此处，一种高精度标注方法为基于生长年轮的标注法，由于生长年轮反映了历史多年的生长情况，这相比仅仅测量胸径的方法提供了更高纬度的数据信息。图3给出了一个按照年轮标注信息的示意图，首先如图3左图所示，对图像中的年轮边缘进行标注，获取一圈圈的年轮(图中示例5圈)，进一步按照年轮边缘标注每一圈年轮的尺寸信息,例如d1、d2、d3、d4、…可以为自里向外第一圈年轮以及后续几圈年轮的直径，并且d为树木切面直径；进一步地，可以对木材的体积、密度、生物质量等信息进行标注；如图3右侧自上至下依次为第五圈年轮、第四圈年轮、第三圈年轮，并对第五圈年轮、第四圈年轮、第三圈年轮进行标注，包括但不限于体积(v)、密度(ρ)及生物质量(b)；需要说明的是，由于太赫兹电磁波对水分的敏感度较高，因此如若标注含水量的数据较优的选用太赫兹图像。其中，含水量和木材的密度可以通过实验得到，例如将木材切面样本按年轮切割，并分别测量含水量、体积和生物质密度，得到每层年轮的含水量、体积和生物质密度。

在获得标注图像所需的数据之后，还需要得到包括木材生物质量数据在内的基本参数；所述基本参数，除包括木材生物质量数据外，还包括树木的比重(specificgravity，sg)、干燥后的质量、木材体积以及树木材种、地域、地形、降雨量等数据，这些数据反映了木材的整体生物质量以及生长环境。

综上，以上步骤描述所获得的破坏性样本的数据可以分为三大类：1)通过破坏性取样的木材图像数据；2)树木图像的标注数据；3)树木的生物质量数据及基本参数；将上述数据输入至机器学习模型，例如基于深度卷积神经网络(deepconvolutionalneuralnetwork)的机器学习模型，得到一个基于图像数据的生物质量预测模型。该模型基于图像输入，模型将自动识别出年轮的边界，并根据年轮间的图像数据得到树木生物质量数据。由于标注的数据按照年轮的方式进行了标注，这意味着模型是可以通过一个时序的信息对当前以及未来的生物质量进行预测。每一年的年轮反应了对应年的木材生长情况，因此模型将木材生长的历史反映在图像中的特征提取出来，并预测了木材的生物质量。当然，这些过程并不是显性存在的，而是通过标注的训练数据得到的。

由于机器学习模型可以根据输入图像数据和生物质量之间自动建立模型，因此本方法可以通过改变训练方式快速得到不同的模型关系。例如，当将训练数据限制于同一种木材和同一个小型区域时，机器学习生成的模型将在区域级别内具有更高的准确度。如果数据中包含了当地的降雨量信息，则模型可以自动拟合降雨量信息对当地生物质量的影响，此时该模型必须将图像和历年对应的降雨量同时作为输入至模型。进一步，当训练数据按照某一材种标注时，则可以得到该材种的生长模型。

当机器学习模型训练结束后，就可以部署该机器学习模型。在实际运行中，设备通过图像传感器获得一棵树木的破坏性采样图像。例如，当在一片人工林中进行日常砍伐时，即可获得切面的图像数据或太赫兹成像数据。将图像数据输入至上述机器学习模型之中，即可得到该棵树木的生物质量预测；将一定数量的数据输入至上述方法生成的另外一个模型，则可以得到该区域的森林的生物质量预测。通过本方法，只要训练数据的样本分布能够覆盖树木的全部生长周期，则模型就可以精确的推测树木在不同的阶段的质量。图3给出了树木生长过程模型示意图；根据图4可知，生物质量(b)会随着时间(t)的推移不断增长，并且该增长曲线与年轮图像呈现对应关系；其中y轴代表生物质量(b)，x轴代表时间(t)，x轴下方的图像是年轮图像。由于机器学习模型的训练过程中已经将每年的年轮与当前的生物质量之间建立了预测模型，这也使得无需人工再去建立一个基于异速生长学的预测模型。可以理解的是，基于异速生长学的模型仅使用了当前的胸径和树高作为生物质的估算的输入，而基于机器学习的方法则可以将更多维度的参数输入至模型，从而使得模型的自适应性更强、预测精度更准。例如，由于标注图像包含了不同树龄的图像输入，如图3所示。因此，机器学习模型还可以用于生物质量的预测。例如，获得一片林区的一定数量的采样数据，则可以得到整片森林三年后的生物质量预测；也就是说，机器学习模型被不同样本空间的训练数据训练，因此也可以得到木材的生长模型。此时，机器模型的训练过程需要对标注数据按照材种进行分类，输出则为不同的时间点的生物质量。图5中给出了这种基于年轮图像的生物质量预测示意图，当设备通过图像传感器得到图像数据后，模型能够给出当前的生物质量的预测以及未来两年的生物质量预测；其中，根据图像p1可获得当前生物质量b1，图中b2和b3均表示预测生物质量；当设备通过图像传感器得到另外一颗树木时，则模型给出另外一条曲线，并给出当前以及未来两年的生物质量预测。

如图6所示，本发明的一个实施例还公开了一种基于机器学习的森林生长建模与预测的装置600，包括：

图像采集模块601，用于通过至少一个图像传感装置采集树木的破坏性取样图像数据；

训练数据获取模块602，用于对图像数据中的年轮进行标注，获取标注数据；获取图像数据对应树木的基本参数，其中基本参数至少包括树木生物质量数据；并将图像数据、标注数据、基本参数作为训练数据；

模型生成模块603，用于将训练数据获取模块602获取到的训练数据输入至机器学习模型并进行训练，生成生物质量模型；

生物质量模型用于对后续采集到的破坏性取样图像数据进行自动识别并输出当前及预测的树木生物质量数据。

在一些实施例中，训练数据获取模块602包括数据标注子模块；

标注子模块，用于对图像数据中每一圈年轮的边缘进行标注；根据已标注的每一圈年轮的边缘标注每一圈年轮的尺寸信息。

在一些实施例中，模型生成模块603生成的生物质量模型，具体用于根据图像数据自动识别出各圈年轮的边缘，并根据各圈年轮的图像数据输出当前及预测的树木生物质量数据。

在一些实施例中，图像采集模块601中的图像传感装置包括：可见光图像传感器、主动式太赫兹探测传感器和多光谱图像传感器中的至少一种。

在一些实施例中，图像采集模块601采集的破坏性取样图像数据包括：树木砍伐横截面的图像数据、横截面的太赫兹传感图像数据和钻取的树木生长样本图像数据中的至少一种。

本发明的一个实施例还提供了一种电子设备，如图7所示，所述电子设备700包括：存储器730以及一个或多个处理器710；

其中，所述存储器730与所述一个或多个处理器710通信连接，所述存储器730中存储有可被所述一个或多个处理器710执行的指令，所述指令被所述一个或多个处理器710执行时，所述电子设备700用于实现如前述各实施例所述的方法。

其中，所述存储器730与所述一个或多个处理器710通信连接，所述存储器730中存储有可被所述一个或多个处理器执行的程序指令732，所述程序指令732被所述一个或多个处理器710执行，以使所述一个或多个处理器710执行本申请前述实施例中的方法。

具体地，处理器710和存储器730可以通过总线或者其他方式连接，图7中以通过总线740连接为例。处理器710可以为中央处理器(centralprocessingunit，cpu)。处理器710还可以为其他通用处理器、数字信号处理器(digitalsignalprocessor，dsp)、专用集成电路(applicationspecificintegratedcircuit，asic)、现场可编程门阵列(field-programmablegatearray，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片，或者上述各类芯片的组合。

存储器730作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块，如本申请实施例中的第一神经网络和/或第二神经网络等。处理器710通过运行存储在存储器730中的非暂态软件程序、指令以及模块732，从而执行处理器的各种功能应用以及数据处理，即实现上述方法实施例中的基于机器学习的森林生长建模与预测的方法。

存储器730可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储处理器710所创建的数据等。此外，存储器730可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中，存储器730可选包括相对于处理器710远程设置的存储器，这些远程存储器可以通过网络(比如通过通信接口720)连接至处理器710。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

本发明的一个实施例还提供了一种计算机可读存储介质，其上存储有计算机可执行指令，当所述计算机可执行指令被计算装置执行时，可用来实现如前述各实施例所述的方法。

前述的计算机可读取存储介质包括以存储如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方式或技术来实现的物理易失性和非易失性、可移动和不可移动介质。计算机可读取存储介质具体包括，但不限于，u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、可擦除可编程只读存储器(eprom)、电可擦可编程只读存储器(eeprom)、闪存或其他固态存储器技术、cd-rom、数字多功能盘(dvd)、hd-dvd、蓝光(blue-ray)或其他光存储设备、磁带、磁盘存储或其他磁性存储设备、或能用于存储所需信息且可以由计算机访问的任何其他介质。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的设备和模块的具体工作过程，可以参考前述装置实施例中的对应描述，在此不再赘述。

本发明的一个实施例还提供了一种计算机程序产品，所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，可用来实现如前述各实施例所述的方法。

尽管此处所述的主题是在结合操作系统和应用程序在计算机系统上的执行而执行的一般上下文中提供的，但本领域技术人员可以认识到，还可结合其他类型的程序模块来执行其他实现。一般而言，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其他类型的结构。本领域技术人员可以理解，此处所述的本主题可以使用其他计算机系统配置来实践，包括手持式设备、多处理器系统、基于微处理器或可编程消费电子产品、小型计算机、大型计算机等，也可使用在其中任务由通过通信网络连接的远程处理设备执行的分布式计算环境中。在分布式计算环境中，程序模块可位于本地和远程存储器存储设备的两者中。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及方法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对原有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

综上所述，由于本申请实施例使用了基于机器学习的生物质量预测方法，因此可以利用机器学习的多个好处，进而使得该方法及装置在多个方面远超出现有技术，具体的可以总结为以下几点：1)正常林业作业中需要的砍伐任务使得大量数据的获得变为可能，而传统方法无法持续的通过数据的积累得到性能的提升，因此本发明的方法可以通过不断获取的数据逐步提升预测性能；2)传统的模型涉及过程被机器学习的自动建模能力取代，因此只需要低成本积累数据即可快速实现大量不同功能的模型，例如适用于特定区域的模型、针对单独材种的模型、将降雨量纳入考虑的预测模型、具有未来预测能力的模型等；3)新方法获得的数据远远多于传统方法，使得出了胸径和树高这些传统参数以外，其他的更高时间精度的年轮图像、含水量数据等均被用于建立模型的过程，这使得模型的精度和潜力远大于传统的方法。

以上，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：丁磊
技术所有人：北京木业邦科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。