一种基于大数据的模型匹配方法与流程

文档序号:12825641阅读:348来源:国知局
一种基于大数据的模型匹配方法与流程

本发明涉及模型匹配技术,尤其涉及一种基于大数据挖掘技术的模型匹配方法。



背景技术:

技术词解释:

近红外光:近红外光(nir)是介于紫外-可见光(uv-vis)和中红外(mir)之间的电磁波,其波长范围为700~2500nm;近红外光谱能反映含氢基团x—h(如c—h、n—h、o—h等)振动的倍频和合频吸收,不同基团(如甲基、亚甲基、苯环等)或同一基团在不同化学环境中的近红外吸收波长与强度都有明显差别,因此,近红外光谱非常适用于含氢有机物质的物化参数测量。

台间差问题:由于制造工艺(同一批仪器,或不同批的仪器,由于制造工艺的细微差别而导致的台间差)、环境(仪器受当前环境影响,如温度、湿度等,导致对同一样本获得不同的结果)、仪器损耗(由于使用年限及仪器本身的使用损耗,导致不同仪器之间存在台间差)等问题,使得同一批次的产品,对同个样本所测量的数据存在差异,从而导致一台仪器建立的分析模型无法直接在其他仪器上使用。

模型传递方:将建立了分析模型的仪器做为主机,将需要使用这个分析模型的仪器做为从机,分别使用主从机扫描同种样品或标准品并建立校正模型,从机可通过校正模型校正检测光谱后使用主机的分析模型或直接使用主机的分析模型后对预测结果进行校正。

基于现代化学计量学方法,近红外光谱既可以用于定量分析,也可以用于定性分析。而对于定量分析与定性分析中的化学计量学方法,其主要包括以下几个方面:1、光谱预处理和变量选择;2、建立用于预测未知样品性质或组成的分析模型;3、模式识别方法和模型界外点检测方法;4、模型传递方法。目前,由于使用该技术的组织或个人大多仅使用单台或少量近红外光谱仪进行分析模型的建立,因此台间差问题通常会采用现代化学计量学中的模型传递方法来解决。

目前用于解决台间差问题的模型传递方法,其主要包括有两种,一是提高校正模型的稳健性,二则是增强校正模型的适应性。前一种方法主要通过变量的筛选、微分、正交信号校正等预处理方法,和在不同环境测量条件下扩充校正模型以及采用稳健回归等方式过滤光谱中的噪声信息,融合多个局部模型,提高模型抗噪声的能力,以达到校正模型较高的可靠性,鲁棒性的目的。后一种方法则是通过数学方法建立从机和主机所测光谱、模型参数、或预测结果之间的函数关系,由此实现模型传递。由于前一种方式只是一些常见的数据与处理的方式,不能达到较高的准确性,因此通常主要是采用后一种方法,如经典的shenk’s算法,来解决台间差问题的。但是,对于目前常用的模型传递方法,其仍存在不少的缺点,例如:1、校正计算量过多,无法实现大量模型的转移;2、需要大量的校正样品来支撑模型传递;3、缺乏动态变化,一旦仪器校正后,模型已经固定了,而仪器则会随着时间的消耗使得模型不再准确,需动态更新;4、用户参与度低,用户与商家的关系仅限于买卖关系。因此由此可见,当仪器量剧增时,模型传递的方法很难实现,容易产生计算量过多而无法负荷、所需的校正样品的数量过多、对每台待建模的仪器都需要采集大量的光谱数据从而导致工作人员工作量大、动态性差等问题,其基本无法解决大量仪器之间的台间差问题,这样则导致近红外光谱技术无法大批量推广使用。



技术实现要素:

为了解决上述技术问题,本发明的目的是提供一种基于大数据的模型匹配方法,可打破近红外光谱仪器数量的限制,适用于红外光谱仪器的大量生产模式,从而有助于近红外光谱技术的推广使用。

本发明所采用的第一技术方案是:一种基于大数据的模型匹配方法,该方法包括:

获取新设备的仪器参数;

将获取的仪器参数与每个仪器类别所对应的第一类别特征进行比较,从而找出与该新设备最接近的仪器类别;

该新设备从基础模型库中获得与该找出的仪器类别相对应的基础模型后,利用该获得的基础模型进行物质信息的结果预测处理;

其中,所述的基础模型库是基于仪器种群聚类方式而建成的基础模型库。

作为第一技术方案的优选实施方式,所述基础模型库的建立步骤包括:

对所有出厂的同一仪器类型设备进行随机抽样,并对抽出的设备进行仪器参数的采集;

对采集得到的仪器参数进行聚类分析,从而得到多个数据簇,其中,一个数据簇表示为一个仪器类别,所述数据簇的聚类中心表示为仪器类别所对应的第一类别特征;

为每个仪器类别建立相对应的基础模型,所有建立得到的基础模型构成基础模型库。

作为第一技术方案的优选实施方式,所述为仪器类别建立相对应的基础模型,其具体步骤包括:

选取属于同一仪器类别下的设备进行已知物质信息样品的光谱采集,然后通过化学计量学中的建模算法,从而根据采集得到的光谱数据来创建与该仪器类别相对应的分析模型。

本发明所采用的第二技术方案是:一种基于大数据的模型匹配方法,该方法包括:

获取新设备的仪器参数;

将获取的仪器参数与每个仪器类别所对应的第一类别特征进行比较,从而找出与该新设备最接近的仪器类别;

根据找出的仪器类别,判断个性化模型库中是否存有与该仪器类别相对应的个性化模型,若有,则从个性化模型库中找出与该仪器类别相对应的个性化模型,然后,将获得的仪器参数与找出的个性化模型中所存储的仪器特征进行匹配比较,从而找出与该新设备最匹配的个性化模型,然后,利用找出的个性化模型进行物质信息的结果预测处理;反之,则从基础模型库中获得与该找出的仪器类别相对应的基础模型后,利用该获得的基础模型进行物质信息的结果预测处理;

其中,所述的基础模型库是基于仪器种群聚类方式而建成的基础模型库。

作为第二技术方案的优选实施方式,所述个性化模型中存储有模型规则和仪器特征。

本发明所采用的第三技术方案是:一种基于大数据的模型匹配方法,该方法包括:

获取新设备的仪器参数以及待测光谱;

将获取的仪器参数与每个仪器类别所对应的第一类别特征进行比较,从而找出与该新设备最接近的仪器类别;

根据找出的仪器类别,从基础模型库和个性化模型中找出与该仪器类别相对应的分析模型,然后将待测光谱与找出的分析模型所对应的光谱特征进行匹配比较,找出与待测光谱最相似的光谱特征,从而获得最匹配的分析模型;

利用最匹配的分析模型进行物质信息的结果预测处理;

其中,所述的基础模型库是基于仪器种群聚类方式而建成的基础模型库。

作为第三技术方案的优选实施方式,所述根据找出的仪器类别,从基础模型库和个性化模型中找出与该仪器类别相对应的分析模型,然后将待测光谱与找出的分析模型所对应的光谱特征进行匹配比较,找出与待测光谱最相似的光谱特征,从而获得最匹配的分析模型这一步骤,其具体为:

根据找出的仪器类别,从基础模型库和个性化模型中找出与该仪器类别相对应的分析模型,然后将待测光谱与找出的分析模型所对应的光谱特征进行匹配比较,找出与待测光谱最相似的光谱特征,从而得到与找出的最相似的光谱特征相对应的分析模型,然后,将获得的仪器参数与得到的分析模型所对应的仪器特征进行匹配比较,从而找出与该仪器参数最匹配的仪器特征,从而获得最匹配的分析模型。

作为第三技术方案的优选实施方式,所述分析模型所对应的光谱特征,其提取步骤包括:

对建模集中的光谱数据进行分析,从而提取光谱特征,其中,所述建模集为用于建立分析模型的建模数据集。

本发明所采用的第四技术方案是:一种基于大数据的模型匹配方法,该方法包括:

获取新设备的仪器参数、待测光谱以及对标准品的平均光谱;

将获取的仪器参数与每个仪器类别所对应的第一类别特征进行比较,从而找出与该新设备最接近的仪器类别;

对获得的对标准品的平均光谱和该仪器类别所对应的第二类别特征进行分析,从而求出校正系数;

利用求出的校正系数对待测光谱进行校正,从而得到校正后的待测光谱;

根据找出的仪器类别,从基础模型库和个性化模型中找出与该仪器类别相对应的分析模型,然后将校正后的待测光谱与找出的分析模型所对应的光谱特征进行匹配比较,找出与校正后的待测光谱最相似的光谱特征,从而获得最匹配的分析模型;

利用最匹配的分析模型进行物质信息的结果预测处理;

其中,所述的基础模型库是基于仪器种群聚类方式而建成的基础模型库。

作为第四技术方案的优选实施方式,所述仪器类别所对应的第二类别特征,其提取步骤包括:

将属于同一仪器类别下的设备进行标准品的光谱采集;

对采集到的对标准品的光谱数据进行平均光谱的计算,计算得出的平均光谱作为该仪器类别所对应的第二类别特征。

本发明的有益效果是:通过使用本发明的模型匹配方法,能为新设备匹配出最优的分析模型,而且还无需大量的样品、无需进行大量光谱数据的采集及计算量,因此,本发明的方法可解决大量仪器之间的台间差问题,模型可在大批量的设备之间传递,从而可打破近红外光谱仪器数量的限制,适用于红外光谱仪器的大量生产模式,从而有助于近红外光谱技术的推广使用,而且还具有准确性高、灵活性高、操作便利性高等优点。

附图说明

图1是基础模型库的建立流程示意图;

图2是一种基于基础模型库的模型匹配流程示意图;

图3是个性化模型的建立流程示意图;

图4是一种基于基础模型库和个性化模型库的模型匹配流程示意图;

图5是一种基于基础模型库、个性化模型库及光谱特征的模型匹配流程示意图;

图6是一种基于基础模型库、个性化模型库、光谱特征及仪器特征的模型匹配流程示意图;

图7是对仪器类别所对应的第二类别特征的提取步骤流程示意图;

图8是一种基于基础模型库、个性化模型库、光谱特征及平均光谱的模型匹配流程示意图。

具体实施方式

本实施例中的设备指的是近红外光谱仪。在基础模型库中的分析模型称为基础模型,在个性化模型库中的分析模型称为个性化模型。

实施例1、基础模型库的建立

对于所述的基础模型库,其建立步骤包括:

s101、对所有出厂的同一仪器类型设备进行随机抽样,并对抽出的设备进行仪器参数的采集,其中,所需采集的仪器参数包括有光源波长、光源发光功率、光源驱动电流、白板反射率、检测暗电流等;

s102、采用kmeans算法对采集得到的仪器参数进行聚类分析,从而得到多个数据簇,其中,一个数据簇表示为一个仪器类别,所述数据簇的聚类中心表示为仪器类别所对应的第一类别特征;

对于所述步骤s102,其具体包括:

s1021、初始化,设定k个初始聚类中心的坐标;

s1022、计算各个数据点(一个数据点对应代表一仪器对象,一仪器对象包括该设备的仪器参数)与各个聚类中心之间的距离,根据计算得出的距离,将各个数据点相对应地划分至与其自身距离最近的聚类中心所属的数据簇中,从而得到多个数据簇,即k个数据簇;

s1023、判断当前计算得出的数据簇是否符合聚类结束要求,如判断当前计算得出的数据簇的聚类中心是否与前一次计算得出的数据簇的聚类中心相等或相差小于一定阈值,若是,则结束,当前得到的多个数据簇为所需计算得到的多个数据簇;反之,则重新计算每个数据簇的聚类中心的坐标,然后返回执行上一步骤s1022;

其中,步骤s1023中所述的聚类中心的坐标,其计算公式如下所示:

上述cij表示为第i个聚类中心第j维的坐标,表示为属于第i个数据簇的第k个数据点在第j维的坐标;

s103、通过上述步骤s101和s102所实现的仪器种群聚类技术,便能计算得出各个数据簇的聚类中心,即各个仪器类别的特征,此时,对于每个仪器类别而言,其又分别对应包含一系列与仪器类别的第一特征相近似的设备,即这一系列的设备均属于该仪器类别,此时,则可为每个仪器类别建立相对应的基础模型,而所有建立得到的基础模型构成基础模型库;

其中,所述为仪器类别建立相对应的基础模型,其具体步骤包括:

选取属于同一仪器类别下的全部设备,或部分设备进行已知物质信息样品的光谱采集,然后通过化学计量学中的建模算法,从而根据采集得到的光谱数据来创建与该仪器类别相对应的分析模型,所述创建的分析模型即为所需建立的基础模型。然后,则将仪器类别所对应的第一类别特征、分析模型、分析模型所对应的仪器特征、建模集等信息均在云端进行存储。

在本实施例中,对于上述基础模型库的建立,其具体流程如图1所示(样品以豆粕、玉米为例,指标以水分含量、蛋白含量为例):

首先,对设备1、设备2、设备3、……、设备n进行仪器参数的采集;然后采用kmeans算法对采集得到的仪器参数进行聚类分析,从而得到多个不同的仪器类别,以及仪器类别所对应的第一类别特征,如类别a的特征a、类别b的特征b、……、类别k的特征k;接着,选取属于同一仪器类别下的设备进行已知物质信息样品的光谱采集;跟着,通过化学计量学中的建模算法,从而根据采集得到的光谱数据来创建与该仪器类别相对应的分析模型,如类别a的特征a,其所对应的分析模型包括有针对玉米水分的分析模型、针对玉米蛋白的分析模型以及针对豆粕蛋白的分析模型。

对于上述基础模型库的建立步骤,其适用于以下所有实施例中。

实施例2、一种基于基础模型库的模型匹配方法

在检测阶段,针对实施例1建立好的基础模型库,在新设备进行模型匹配时,其方法步骤包括有:

s201、获取新设备的仪器参数;

s202、将获取的仪器参数与每个仪器类别所对应的第一类别特征进行比较,从而找出与该新设备最接近的仪器类别,如类别b;

s203、该新设备从基础模型库中获得与该找出的仪器类别b相对应的基础模型后,利用该获得的基础模型进行物质信息的结果预测处理;

其中,所述的基础模型库是基于仪器种群聚类方式而建成的基础模型库。

对于上述的模型匹配方法,其具体流程如图2所示(样品以豆粕、玉米为例,指标以水分含量、蛋白含量为例):

首先,获取新设备的仪器参数,然后,将获取的仪器参数与每个仪器类别所对应的第一类别特征进行比较,从而找出与该新设备最接近的仪器类别b;接着,该新设备对玉米和豆粕进行检测时,分别对玉米和豆粕进行光谱采集,跟着,从基础模型库中获得与该仪器类别b所对应的分析模型后,利用该获得的分析模型,对采集到的光谱信息进行物质信息的结果预测处理。

实施例3、一种基于基础模型库和个性化模型库的模型匹配方法

在用户使用设备的过程中,将会不断进行分析模型的创建与维护,而目前对于这些新建的分析模型,其无法实现共享,因此,为了实现这些新建的分析模型的共享,打破资源孤岛的情况,令其它新设备能获取到更精准的分析模型,本发明结合互联网的概念,将这些新建的分析模型及相关数据上传至云端,例如,每有用户创建或更新分析模型后,系统会自动将用户愿意共享的新的分析模型及相关数据上传至云端,并将它们存储在该用户所使用设备的对应仪器类别中,如,该用户所使用的设备属于仪器类别a,那么则将该设备所创建的或更新的分析模型及相关数据上传至云端,并将它们存储在仪器类别a中。此时,对于这些在用户使用设备的过程而创建或更新的分析模型,其作为个性化模型存储在云端,并且将所有个性化模型构建成个性化模型库。另外,在个性化模型中,其不仅存储有模型规则,还存储有一系列的仪器特征,以及相对应地存储有光谱信息、算法信息等。

在本实施例中,对于上述个性化模型库的建立,其具体流程如图3所示(样品以豆粕、玉米为例,指标以水分含量、蛋白含量、纤维含量为例):

设备1和设备2将新建的分析模型、仪器特征以及样品光谱信息一并上传至云端,并将它们存储至相对应的仪器类别中,作为个性化模型存在,设备1针对玉米蛋白所新建的分析模型分别为002和004,设备2针对豆粕纤维所新建的分析模型为003,而在存储每一个个性化模型时,所相对应存储的信息包括有模型规则(其中,所述模型规则包括有初始化系数、常数项、乘积系数、平均光谱、预处理算法、回归算法),以及仪器特征(其中,所述仪器特征包括有波长、驱动电流、光源温度、环境温度、环境湿度、检测器温度、反射率)以及样品的光谱信息等。

在检测阶段,针对上述建立好的个性化模型以及实施例1建立好的基础模型库,在新设备进行模型匹配时,其方法步骤包括有:

s301、获取新设备的仪器参数;

s302、将获取的仪器参数与每个仪器类别所对应的第一类别特征进行比较,从而找出与该新设备最接近的仪器类别,如类别b;

s303、根据找出的仪器类别b,判断个性化模型库中是否存有与仪器类别b相对应的个性化模型,若有,则从个性化模型库中找出与该仪器类别b相对应的个性化模型,然后,将新设备的仪器参数与找出的个性化模型中所存储的仪器特征进行匹配比较,从而找出与该新设备最匹配的个性化模型,然后,利用找出的个性化模型,调用该个性化模型的模型规则,从而进行物质信息的结果预测处理;反之,则从基础模型库中获得与该找出的仪器类别b相对应的基础模型后,利用该获得的基础模型进行物质信息的结果预测处理;

其中,所述的基础模型库是基于仪器种群聚类方式而建成的基础模型库。

对于上述的模型匹配方法,其具体流程如图4所示(样品以玉米为例,指标以蛋白含量为例):

首先,获取新设备的仪器参数,然后,将获取的仪器参数与每个仪器类别所对应的第一类别特征进行比较,从而找出与该新设备最接近的仪器类别b;接着,根据找出的仪器类别b,判断个性化模型库中是否存有与仪器类别b相对应的个性化模型,若有,则从个性化模型库中找出与该仪器类别b相对应的个性化模型,然后,新设备的仪器参数与找出的个性化模型中所存储的仪器特征进行匹配比较,从而找出与该新设备最匹配的个性化模型,在本实施例中,找出的个性化模型为针对玉米蛋白的个性化模型003,接着,利用找出的个性化模型,调用该个性化模型的模型规则所对应的预测函数,从而对采集到的样品的光谱信息,如玉米的光谱信息,进行物质信息的结果预测处理。

实施例4、一种基于基础模型库、个性化模型库及光谱特征的模型匹配方法

增设光谱特征来实现模型匹配,这可在基础模型库与个性化模型库中的分析模型数量增多时,能更好地匹配寻找到最优分析模型。

由于需要利用光谱特征来进行模型匹配,因此,对于基础模型库和个性化模型库中的分析模型,在其建立过程中,增设有光谱特征提取步骤,具体地,所述分析模型所对应的光谱特征,其提取步骤包括:对建模集中的光谱数据进行分析,从而提取出相应的光谱特征,而提取出来的光谱特征,其与建立好的分析模型一一对应地存储在云端。例如,使用设备1时,建立分析模型o,而此时用于建立这一分析模型o所用到的数据构成一建模数据集,称为建模集,然后,对这一建模集中的光谱数据进行分析,从而提取出相应的光谱特征o,接着,则将这一分析模型o及其对应的光谱特征o上传至云端存储,并存储至与设备1所对应的仪器类别中。

在检测阶段,针对分析模型所对应的光谱特征、实施例3建立好的个性化模型以及实施例1建立好的基础模型库,在新设备进行模型匹配时,其方法步骤包括有:

s401、获取新设备的仪器参数以及待测光谱;

s402、将获取的仪器参数与每个仪器类别所对应的第一类别特征进行比较,从而找出与该新设备最接近的仪器类别,如类别b;

s403、根据找出的仪器类别b,从基础模型库和个性化模型中找出与该仪器类别b相对应的分析模型,然后将待测光谱与找出的分析模型所对应的光谱特征进行匹配比较,找出与待测光谱最相似的光谱特征,从而获得最匹配的分析模型,此时,与找出的最相似的光谱特征相对应的分析模型为最匹配的分析模型;

s404、利用最匹配的分析模型进行物质信息的结果预测处理;

其中,所述的基础模型库是基于仪器种群聚类方式而建成的基础模型库。

另外,对于找出与待测光谱最相似的光谱特征这一步骤,其所采用的修正余弦相似度算法的公式如下所示:

上述u表示为特征集,u表示为u内单个特征维度所代表的信息,i表示新设备检测时的待测样品光谱特征集合,即待测光谱,j表示为每个待对比的分析模型所对应的光谱特征,即分析模型中的建模光谱集的特征集合,sim(i,j)表示为待测光谱与每个待对比的分析模型所对应的光谱特征之间的比对结果。

对于上述的模型匹配方法,其具体流程如图5所示(样品以玉米为例,指标以蛋白含量为例):

首先,获取新设备的仪器参数以及待测光谱;然后,将获取的仪器参数与每个仪器类别所对应的第一类别特征进行比较,从而找出与该新设备最接近的仪器类别b;接着,根据找出的仪器类别b,从基础模型库和个性化模型中找出与该仪器类别b相对应的分析模型,然后将待测光谱与找出的分析模型所对应的光谱特征进行匹配比较,找出与待测光谱最相似的光谱特征,从而获得最匹配的分析模型;此时,与找出的最相似的光谱特征相对应的分析模型为最匹配的分析模型,在本实施例中,找出的最匹配的分析模型为仪器类别b所对应的个性化模型007;最后,利用最匹配的分析模型,即个性化模型007,调用该个性化模型007的模型规则所对应的预测函数,从而对未知光谱x进行物质信息的结果。

实施例5、一种基于基础模型库、个性化模型库、光谱特征及仪器特征的模型匹配方法

本实施例的模型匹配方法综合运用了上述的仪器种群聚类技术、个性化模型技术以及光谱特征匹配技术,并且还进一步地结合仪器特征从而实现对未知样品进行多指标预测。

在检测阶段,针对分析模型所对应的光谱特征、仪器特征、实施例3建立好的个性化模型以及实施例1建立好的基础模型库,在新设备进行模型匹配时,其方法步骤包括有:

s501、获取新设备的仪器参数以及待测光谱;

s502、将获取的仪器参数与每个仪器类别所对应的第一类别特征进行比较,从而找出与该新设备最接近的仪器类别,如类别b;

s503、根据找出的仪器类别b,从基础模型库和个性化模型中找出与该仪器类别b相对应的分析模型,然后将待测光谱与找出的分析模型所对应的光谱特征进行匹配比较,找出与待测光谱最相似的光谱特征,从而得到与找出的最相似的光谱特征相对应的分析模型,然后,将新设备的仪器参数与得到的分析模型(即与找出的最相似的光谱特征相对应的分析模型)所对应的仪器特征进行匹配比较,从而找出与新设备的仪器参数最匹配的仪器特征,从而获得最匹配的分析模型,此时,与找出的最匹配的仪器特征相对应的分析模型为最匹配的分析模型;

s504、利用最匹配的分析模型进行物质信息的结果预测处理;

其中,所述的基础模型库是基于仪器种群聚类方式而建成的基础模型库。

对于上述的模型匹配方法,其具体流程如图6所示(样品以玉米为例,指标以水分含量、蛋白含量为例):

首先,获取新设备(未知设备)的仪器参数以及待测光谱(未知光谱);然后,将获取的仪器参数与每个仪器类别所对应的第一类别特征进行比较,从而找出与该新设备最接近的仪器类别b;接着,根据找出的仪器类别b,从基础模型库和个性化模型中找出与该仪器类别b相对应的分析模型,然后将待测光谱与找出的分析模型所对应的光谱特征进行匹配比较,找出与待测光谱最相似的光谱特征,从而得到与找出的最相似的光谱特征相对应的分析模型,此时这些找出的分析模型为可用模型匹配的分析模型,在本实施例中,找出的可用模型匹配的分析模型为针对玉米蛋白的分析模型005和009、针对玉米水分的分析模型001、005和010;跟着,将新设备的仪器参数与这些得到的分析模型所对应的仪器特征进行匹配比较,从而找出与新设备的仪器参数最匹配的仪器特征,从而获得最匹配的分析模型,在本实施例中,所找出的最匹配的分析模型分别为针对玉米蛋白的分析模型009和针对玉米水分的分析模型005;最后,利用这两个分析模型,分别调用这两个分析模型的模型规则所对应的预测函数,从而对未知光谱x进行物质信息的结果。

由上述可见,通过使用本实施例的模型匹配方法,其通过多方面的特征匹配,可进一步地找出待测样品最为适用的模型,从而大大提高预测值的准确度。通过该发明技术,供应商仅需要对出厂的部分仪器建立基础模型,供应商与用户都可在仪器的使用过程中不断向云端填充个性化模型,随着个性化模型的逐渐增多,预测精度及模型的匹配效果都会被不断完善,从而实现买卖双方良性的合作循环。

实施例6、一种基于基础模型库、个性化模型库、光谱特征及平均光谱的模型匹配方法

在本实施例中,还有机结合了现代化学计量学中模型传递技术,从而更进一步地提升预测结果的准确度。利用平均光谱来进行模型匹配,因此,在仪器类别划分结束后,即步骤s102之后,增设有标准品(仪器附件之一)光谱采集这一步骤,从而得出每个仪器类别所对应的对标准品的平均光谱,在本实施例中,仪器类别所对应的对标准品的平均光谱作为仪器类别所对应的第二类别特征。

对于所述仪器类别所对应的第二类别特征,其提取步骤s104包括:在步骤s102后,已划分出了不同的仪器类别,然后将属于同一仪器类别下的全部设备,或部分有代表性的设备进行标准品的光谱采集,接着,对采集到的对标准品的光谱数据进行平均光谱的计算,计算得出的平均光谱作为该仪器类别所对应的第二类别特征,最后将该仪器类别所对应的平均光谱上传至云端进行相应的存储;例如,在仪器类别划分结束后,一共划分出10种仪器类别,而第一仪器类别(即类别1)中包括有30台设备,此时则对这30台设备或部分有代表性的设备,如15台近红外光谱仪,进行标准品的光谱采集,即令这30台或15台近红外光谱仪对标准品进行光谱采集,然后,根据这些采集到的对标准品的光谱数据进行平均光谱计算,此时计算得出的平均光谱则作为第一仪器类别(即类别1)所对应的第二类别特征。由此可见,上述步骤s104设置在步骤s102之后。

对于上述的步骤s104,其具体流程如图7所示:

首先,当根据步骤s101和s102进行聚类分析后,划分出类别1、类别2……类别n这n个仪器类别,然后将属于同一仪器类别下的设备对标准品进行光谱采集,然后对采集到的对标准品的光谱数据进行平均光谱的计算,从而得到类别1所对应的平均光谱为平均光谱1,而平均光谱1则作为类别1所对应的第二类别特征。

在检测阶段,针对仪器类别所对应的平均光谱、分析模型所对应的光谱特征、实施例3建立好的个性化模型以及实施例1建立好的基础模型库,在新设备进行模型匹配时,其方法步骤包括有:

s601、令新设备对标准品进行多次扫描(至少3次),从而获得新设备的对标准品的平均光谱,即将新设备对标准品进行多次扫描所得到的多个光谱数据进行平均值计算,得到的平均值则为新设备的对标准品的平均光谱;

s602、获取新设备的仪器参数及待测光谱;

s603、将获取的仪器参数与每个仪器类别所对应的第一类别特征进行比较,从而找出与该新设备最接近的仪器类别,如类别b;

s604、对新设备的对标准品的平均光谱以及该仪器类别b所对应的第二特征,即该仪器类别b所对应的对标准品的平均光谱,进行分析,从而使用现代化学计量学中的方法(如shenk’s算法、直接校正算法ds、分段直接校正算法pds)求出校正系数;

s605、利用求出的校正系数对待测光谱进行校正,从而得到校正后的待测光谱;

s606、根据找出的类别b,从基础模型库和个性化模型中找出与该仪器类别b相对应的分析模型,然后,将校正后的待测光谱与找出的分析模型所对应的光谱特征进行匹配比较,找出与校正后的待测光谱最相似的光谱特征,从而获得最匹配的分析模型,此时,所述找出的最相似的光谱特征所对应的分析模型为最匹配的分析模型;

s607、利用最匹配的分析模型进行物质信息的结果预测处理;

其中,所述的基础模型库是基于仪器种群聚类方式而建成的基础模型库。

对于上述的模型匹配方法,其具体流程如图8所示:

首先,获取新设备的对标准品的平均光谱、仪器参数及待测光谱;然后,将获取的仪器参数与每个仪器类别所对应的第一类别特征进行比较,从而找出与该新设备最接近的仪器类别2;接着,将新设备的对标准品的平均光谱以及仪器类别2所对应的平均光谱2进行分析,从而求出校正系数;跟着,利用求出的校正系数对待测光谱,分别包括对新样本a所采集的未知光谱a、对新样本b所采集的未知光谱b以及对新样本c所采集的未知光谱c,进行校正,从而得到校正后的待测光谱,分别为校正光谱a、校正光谱b、校正光谱c;随后,根据找出的类别2,从基础模型库和个性化模型中找出与该仪器类别2相对应的分析模型,然后,将校正光谱与找出的分析模型所对应的光谱特征进行匹配比较,找出与校正光谱最相似的光谱特征,从而获得最匹配的分析模型,分别为分析模型2a、分析模型2b及分析模型2c;最后,利用最匹配的分析模型,调用其模型规则所对应的预测函数对应地对校正光谱进行物质信息的结果预测处理。

由上述可得,本发明的模型匹配方法所具有的优点包括:

1、本发明可满足模型转移过程中较大强度的自动化,实现模型快速,准确转移

在本发明的匹配方法中,可根据仪器本身特点及环境建立个性化转移模型,满足模型转移过程中灵活性,突破有限设备、有限模型的转移,实现大量模型快速、准确地迁移;

2、模型的动态更新

在本发明的匹配方法中,可根据仪器自身情况,以及结合用户反馈信息,建立仪器在其整个生命周期上的动态模型,使其成为一个不断改善的生态模型系统,灵活性高,而且还能提高模型匹配的准确性以及适用性;

3、满足用户参与,定制个性化模型的需求

打破企业与用户传统的短暂买卖关系,以仪器为渠道,整合线上线下平台,建立起与用户的长期关联,以此为桥梁满足用户参与的需求,并通过用户与仪器交互的数据为模型更新,以及定制个性化模型提供依据。

以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1