实施对光谱数据的红外和荧光多路处理来进行光谱分析的方法和设备与流程

文档序号:16814575发布日期:2019-02-10 14:11阅读:214来源:国知局
实施对光谱数据的红外和荧光多路处理来进行光谱分析的方法和设备与流程

本发明基于一种用于光谱分析的方法和设备。更具体地,本发明涉及一种用于通过将多路统计处理应用于来自不同光谱分析技术的一组光谱数据来分析至少一个样品的方法。

本发明尤其可以但不仅仅应用于农业综合经营业、制药工业或环境工业。在农业综合经营业中,本发明使得能够例如研究食品在其制备过程中的技术特性、营养特性和/或毒理学特性,或者研究该产品所经受的耕作方法、生物方法或技术方法。更一般地,本发明可以应用于确定样品的任何质量指示符,和/或确定表征所述样品所经受的方法的任何参数。



背景技术:

为了确定指示食品的质量的参数(称为质量参数),已知的是采用化学计量方法的光谱分析。在这种情况下,包括透射光谱法和/或反射光谱法的吸收光谱法基于装备农业综合经营厂和用于接收农业原材料的场所的各种设备。红外(ir)和/或近红外(nir)场中的吸收光谱尤其能够评估食品中浓度增加的组分(例如蛋白质、脂肪、水含量或总糖)的含量的测量。

通常,已知的并用于吸收光谱的方法基于对光谱数据进行统计多变量分析的方法。当数据是多维数据时,如荧光(激发和发射矩阵)的情况时,多路分析是多变量分析的自然延伸,并且因此多路分析基于使用多路统计模型,例如,“parafac”(“平行因子”)和“npls”(“n向偏最小二乘回归”)。

然而,当今许多工业过程需要构成这些样品的原材料的特定知识,对给定产品的技术特性、营养特性和/或毒理学特性进行的详细分析尤其如此。例如,可能需要知道各种参数,例如有害化学分子(丙烯酰胺,真菌毒素等)对这些样品的污染程度、调节蛋白质功能的蛋白质结构(变形率、聚集体大小等),或谷物的发芽状态(小麦的hagberg下降数量、麦芽中大麦的潜在发芽等)。为了被精确测量,这些参数需要在尽可能宽的电磁光谱场上处理光谱数据,包括红外光、可见光和紫外光。然而,通常在红外光场中应用的仅使用吸收光谱法确定的质量参数无法提供关于所分析样品的非常精确的信息。例如,这种类型的光谱不能量化痕量状态(l'étatdetraces)(<0.5%)下存在的分子,如真菌毒素或丙烯酰胺。

根据现有技术,已知一种具体对所分析的产品的质量进行量化并采用荧光技术的方案。经受具有确定波长的光束的样品,例如在可见光(vis)场和/或紫外光(uv)场,根据该样品中包含的组分发射发射光束作为响应。基于对这些发射光束的测量,可以根据波长获得相应的荧光光谱。因此,荧光光谱能够表征趋势,例如ph的变化、食用基质(如植物油的情况)的加热,或分析污染物或表征植物生长和谷物发芽。获得的信息还能评估所分析样品的不同的技术质量标记。

尽管该标记具有一定的灵敏度,已知的是荧光光谱不能精确地确定吸收光谱能够使用的相同质量参数。特别地,吸收光谱提供关于原子间的键,而荧光对分子组成感兴趣。例如,糖可以通过羰基分子间键来表征,可以在红外光场中进行量化,但是糖不是荧光的,因此不能通过荧光来量化。两种技术都可以看见蛋白质,但是通过不同的结构:红外区的酰胺基团和氨基酸的芳香环,例如,具体是荧光色氨酸。因此,在给定样品的表面上发射的荧光信号和吸收信号逻辑上应该是一起使用的,以通过使用具有根据电磁波谱中确定的波长的光束照射样品来确定与样品的物理化学状态有关的更多信息。

然而,对由这两种技术所提供的数据(例如,ir场和nir中的吸收以及vis场和uv场中的荧光)的结合处理,现在仍然存在问题,因为该结合处理受到当前分析方法的有效性的限制。通常,对由两种不同的技术所提供的数据的处理是分开进行的。因此,从两种类型的光谱获得的结果不会受益于这两种类型光谱结合使用所产生的协同作用和互补性。此外,通过两种不同光谱技术获得的数据的处理和组合受到许多技术限制,这限制了相关分析方法的性能。经由对每种技术应用多变量分解工具所获得的减少的变量解决了这种互补性的一部分,但是不能精确并可靠地提取所有原始和非减少的光谱信息。此外,该信息是不相关的,因为考虑到两种技术引起的重叠,该信息不会给所应用的处理带来强大的优势。该信息也不互补,因为该信息不会丰富所提取的信息。最后,这些方法最多只能对样品进行分类或比较,而专业人员更感兴趣和认为更有用的是指示符的量化。为了从这两种类型的测量中受益,生产商、制造商和合作社通常装配有两种不同类型的分析仪,这代表了潜在的高的人员成本、投资成本和物流成本。



技术实现要素:

为了克服这些困难或限制使用不同的技术,本发明旨在提出一种用于分析至少一个样品的方法,该方法实现了对基于多路统计模型的光谱数据进行分析的方法,其特征在于,该方法包括:

a)由第一光源和第二光源照射待分析的所述样品或每个样品,所述至少一个第二光源与所述第一光源分开;

b)获取所述样品或每个样品的荧光光谱,所述荧光光谱是由所述第一光源发射的一个或多个光束照射所述样品或每个样品产生的;

c)获取所述样品或每个样品的透射光谱和/或反射光谱,所述透射光谱和/或所述反射光谱是由所述第二光源发射的一个或多个光束照射所述样品或每个样品产生的;

d)将获取的所述荧光光谱组织为第一获取数据立方体;

e)将获取的所述透射光谱和/或所述反射光谱组织为第二获取数据立方体;

f)将所述第一立方体的获取数据与所述第二立方体的获取数据合并为第三合并数据立方体;

g)应用所述多路统计模型来分解所述第三立方体的所述合并数据;

h)根据将所述多路统计模型应用于所述合并数据所产生的数据,确定表征所述样品或每个样品的至少一个指示符。

根据可以一起或单独使用的不同的附加特征:

-所述第一光源是具有相应的照射波长的光束源。

-所述第二光源是连续源。

-所述荧光光谱是在250nm至800nm的光谱范围内获取的光谱。

-所述透射光谱和/或所述反射光谱是在400nm至2500nm的光谱范围内获取的光谱,优选地是在400nm至1100nm的光谱范围内。

-由第一光源发射的光束的数量介于一到八之间,并且优选地介于二到五之间。

-荧光光谱是在正面模式下获取的荧光光谱。

-所述步骤d)还包括对所述荧光光谱和/或所述透射光谱和/或所述反射光谱进行标准化的在先步骤。

-实施的所述多路统计模型是tucker型模型。

-所述确定表征所述样品或每个样品的指示符是通过应用校准模型来完成的,该校准模型将分解数据关联到所述指示符。

发明进一步旨在提出一种用于实现根据本发明的方法来分析至少一个样品的设备,其特征在于,所述设备包括:

-用于照射待分析的所述样品或每个样品的装置,所述照射装置包括第一光源和至少一个第二光源,所述至少一个第二光源与所述第一光源分开;

-用于获取所述样品或每个样品的荧光光谱的第一装置,所述荧光光谱是由所述第一光源发射的一个或多个光束照射所述样品或每个样品产生的;

-用于获取所述样品或每个样品的透射光谱和/或反射光谱的第二装置,所述透射光谱和/或所述反射光谱是由所述第二光源发射的一个或多个光束照射所述样品或每个样品产生的;以及

-被配置成至少实施步骤d)至步骤h)的一个或多个处理器。

附图说明

本发明的其他特征、细节和优点将通过阅读参考作为示例给出的附图所进行的说明来呈现,并且这些附图分别表示为:

-图1为根据本发明的实施例的分析设备的原理图;

-图2为限定获取数据立方体中光谱数据的组织形式的图;

-图3、图4和图5为根据不同实施例的限定组织形式并且将获取数据合

并到至少一个合并数据立方体中的图。

具体实施方式

根据本发明的方法的第一步骤a)包括通过多个光源照射一个样品或多个样品。图1示出了用于实施根据本发明的方法的设备a的简化图。如图所示,样品e被布置在支撑件h上。所述样品可以是固体、粉末、包含在透明容器中的液体等。该支撑件h能够对光辐射透明或部分透明。

设备a包括第一光源s1,该第一光源s1被布置在所述支撑件h的一侧并且被配置成照亮e。有利地,所述第一光源s1是具有相应照射波长的激发光辐射源。优选地,所述光源中的每个光源发射具有不同波长的单色辐射光束。根据本发明,通过第一光源照射e能够产生荧光光谱。荧光光谱法包括在样品的方向上发送具有确定波长的光束。该光束通常具有可见光(vis)场和/或紫外光(uv)场中的至少一个波长,以导致该样品中包含的组分的激发。表征所述光束的波长在通常介于250nm至800nm之间的光谱范围内延伸。对于对应于波长λ激发的每个激发光束,所考虑的样品发射全光谱(称为荧光光谱),该全光谱包括对应于多个波长λ发射的多个发射光束。这些光束通常包括两个贡献:一个是由于弹性扩散而具有与照射光束相同的波长;另一个是多色性,由于荧光,相应的发射光束的特征在于波长λ发射大于λ激发。荧光光谱还可以包括自体荧光光谱,或者在某些情况下,由添加到样品中的标记物诱导的荧光光谱。

以非限制性方式,所述第一光源可以包括:一个单色辐射源、两个以上的单色辐射源、或者产生所述第一光源的照射光束的一个或多个多色光源。有利地,第一光源包括一个或多个发光二极管。因此,如果需要更高的强度,s1还可以包括一个或多个激光源。如图1所示,s1可以包括另一光源s12,甚至更一般地包括与s1分开的多个其他光源。优选地但非限制性地,所述光束的波长介于250nm至800nm之间。通常,激发光束可以具有选择的波长,以尽可能的覆盖最宽的uv-可见光谱。根据辐射源的数量,这些激发光束可以在覆盖红外光场、可见光场和紫外光场的光谱范围内进行粗略地采样(几十个波长)和/或精细地采样(几百个波长)。有利地,由第一光源发射的光束的数量介于一到八之间,优选地介于二到五之间。

优选地,荧光光谱是在正面模式(modefrontal)下获取的荧光光谱。在正面模式下荧光的具体使用具有能够实时应用该方法的优点。此外,对所述样品或每个样品发射的正面荧光光谱的获取不会产生与所述样品的制备相关的任何分析误差。因此,通过根据本发明的方法获得的结果更精确并且更快地被确定。

设备a还包括第二光源s2,该第二光源s2被配置成照射样品e。可以在由如上所述的源s1照射e之前或之后提供由源s2对e的照射。有利地,s2是连续光源,例如,多色光源,比如钨灯、卤素灯或卤钨灯。源s2被配置成发射连续光束,该连续光束的波长可以在电磁光谱的宽光谱范围内进行分布。有利地,s1被配置成在介于400nm至2500nm之间并且优选地介于400nm至1100nm之间的光谱范围内照射样品。该光谱范围可以包括可见光场、红外光场和/或近红外光场。照射模块mi也可以被添加到源s2,以将s2发射的光束引导至样品e。如下所述,这些光束在被获取装置ma检测之前被样品吸收。

根据本发明,通过源s2照射e能够产生吸收光谱。这些吸收信号具体可以包括透射信号和/或反射信号。吸收光谱是基于这样的原理,根据该原理,经受入射光束(例如,红外光束)的任何材料可以反射这些光束的一部分,或者吸收这些光束的一部分,或者透射这些光束的一部分。更具体地,吸收光谱基于原子键的特性以吸收具有感兴趣的波长的光能。

应当注意的是,第二光源可以相对于样品被布置在与第一光源相同的一侧,或者沿着任何其他方向进行布置。有利地,第一光源和第二光源沿着样品e和/或支撑件h的两个不同侧进行布置。最后,使用单个设备(例如包括同一测量室和单个光谱仪,该光谱仪被配置成分析在紫外光场、可见光场、红外光场和/或近红外光场中获取的一组光谱)使得能够有利于在同一样品上获得的数据的一致性。

根据本发明的方法的第二步骤b)和第三步骤c)包括获取所述样品或每个样品的荧光光谱和吸收光谱。

根据本发明,由样品产生的一组荧光光谱和吸收光谱被获取装置ma捕获。所述装置ma检测和测量由对样品进行照射所产生的并且由所述样品发射、反射或透射的任何光束。装置ma例如包括一个或多个测量站,该一个或多个测量站物理上分开或不分开并且使得能够获取由样品产生的荧光光谱和吸收光谱。有利地,装置ma共同位于单个测量站中,并且被适当地布置成以最佳的方式接收由样品e产生的任何类型的辐射。这有利于根据材料分析样品,使该方法更有效,减少分析所需的时间,并且使得与材料有关的光谱数据能够更好地相关。

然后,e发射的荧光信号和吸收信号通过中间的通信装置mc被传送至一个或多个处理器p。所述通信装置mc可以包括有线连接(例如,光纤类型、以太网、cpl),甚至是无线连接(例如,wi-fi或蓝牙类型),或者是根据用于实现本发明的优选材料而变化的任何其他类型的连接。处理器p自身可以包括:用于处理信号的设备、被配置成分解光谱中发射的光束的光谱仪或适于该方法的任何其他处理装备。更一般地,p包括用于处理数据的装置(例如,适当编程的计算机),该装置能够从由设备a获取的光谱中提取化学计量信息。通常通过化学计量方法来分析信号,所述化学计量方法使得能够提取与待测量的质量参数相关的信息。这些相关性存在于许多食品中,并且由于食物中含量的发展而出现。例如,食物的天然成分(维生素、蛋白质和其他天然成分,或有意或无意添加的成分)的固有荧光(fluorescenceintrinsèque)及该固有荧光的反射可以随时间发展,而同时由于新分子的形成可以产生新信号。因此,所述相关性通过光谱分析作为相关性表征的一部分起着重要作用。

根据本发明的方法的第四步骤d)和第五步骤e)包括:对分别在获取数据的第一立方体和第二立方体中获取的荧光光谱和吸收光谱进行组织。

一旦获取到所分析样品的荧光光谱、透射光谱和/或反射光谱,则将收集到的数据组织为数据立方体。从定义上看,所述数据立方体包括被称为“激发-发射矩阵”(matricesexcitation-émission,mee)的多个矩阵,所述矩阵被构建成包括在一个样品上获取的所有光谱。具体地,mee可以是双向表,所述表可以表示为“激发×发射×强度”形式的三维光谱。对于获取一个或多个荧光光谱的特定情况,获取数据立方体通常包括三个维度“激发×发射×样品”。

根据本发明将光谱数据组织为数据立方体的模式在图2中示出。将获取的数据组织为数据立方体使得在该方法的以下步骤中能够应用比多变量分解工具更强大的多路分析方法。

在获取荧光数据期间,荧光测量被组织在三维数据立方体“i×j×k”中,称为第一获取数据立方体c1或“荧光立方体”。所述三个维度中的每个维度对应于给定模。包括“i”个条目的c1的模i与在获取所述样品或每个样品的荧光光谱的步骤期间由第二光源照射的样品的数量相关联。包括“j”个条目的c1的模j与发射波长的数量“j”相关联,这些波长中的每个波长对应于通过第一光源照射所述一个样品或所述多个样品之后由所述一个样品或所述多个样品发射的光束的分量中的一个分量。包括“k”个条目的c1的模k与激发波长的数量“k”相关联,这些波长中的每个波长对应于用于照射一个样品或多个样品的光束。因此,获得的荧光数据被组织为三维立方体,对应于三个模“激发×发射×样品”。

在获取吸收数据期间,吸收测量被组织为二维数据立方体(uncubededonnéesàdeuxdimensions)“i×l”,称为第二获取数据立方体c2或“吸收立方体”。所述两个维度中的每个维度对应于给定模。包括“i”个条目的c2的模i与在获取所述样品或每个样品的透射光谱和/或反射光谱的步骤期间被第一光源照射的样品的数量相关联。包括“l”个条目的c2的模l与吸收波长的数量“l”相关联,这些波长中的每个波长对应于通过第二光源照射所述一个样品或所述多个样品之后由所述一个样品或所述多个样品发射的光束的分量中的一个分量。因此,获得的荧光数据被组织为二维立方体“i×l”,对应于模“发射×样品”。

根据本发明的方法的第六步骤f)包括将来自第一立方体的数据与来自第二立方体的数据合并到第三立方体中,称为合并数据。

因此,提出了组织以及合并数据的三种模。如限定的那样,用于组织数据的第一模具有遵循所获取数据的物理特性的优点。用于组织下面限定的数据的第一模和第三模的显著技术效果是保留了由两种光谱技术中的每一种技术单独获取的光谱数据的线性。这些实施例还使得能够在第一数据立方体和第二数据立方体的合并期间保留吸收数据和荧光数据之间的相关性。这些相关性是重要的,因为其可以包括将给定样品的紫外-可见中的荧光光谱和可见-近红外中的透射光谱相关联的信息。该信息例如是:分析物浓度、物理化学结构或产品的功能性和灵敏度。该信息对于限定特定于所分析样品的质量标准尤其有用,并且难以经由仅使用吸收光谱或荧光光谱来获得。

如图3所示,根据本发明的实施例包括将第一获取数据立方体和第二获取数据立方体结合为一个相同的第三数据立方体c31,称为合并数据。

在步骤3.1期间,立方体c2被转换为三维立方体i×l×l,以使得立方体i×l根据模l×l构成立方体i×l×l的对角面,该对角面中的对角线的尺寸等于由荧光立方体的第k个源的弹性扩散形成的对角线。在步骤3.2期间,该立方体i×l×l与尺寸为i×j×k的立方体c1连接以形成立方体c31。立方体c31中的其他条目填充有等于零的值。完成该连接(concaténation)使模l与模j和k对齐以构成所述合并数据的立方体c3。因此,立方体c31是尺寸为i×(k+l)×(k+l)的立方体,该立方体的左上部分包括三维子立方体形式的荧光数据,并且根据模式(k+l)×(k+l),该立方体中的对角面的一部分包括对角子平面形式的吸收数据。

这种数据组织具有遵循立方体c1和c2的初始共模(lesmodescommunsinitiaux)的优点,因为c2的模l与c1的模j和k对齐。由于这些模分别对应于发射波长和激发波长,因此保留了由荧光光谱获取的数据与由吸收光谱获取的数据之间的相关性。

根据图4和图5,根据本发明的两个其他实施例包括替换立方体c2。根据步骤4.1或步骤5.1,立方体c2被复制“k”次以形成中间的三维立方体i×l×k。因此,所述中间立方体i×l×k包括与尺寸为i×j×k的立方体c1共有的两个类型的条目。这两个三维立方体具有两个共模,可以以多个方式组合这两个共模以保留模i,该模i对应于在合并数据的单个且相同的三维立方体中分析的样品的数量“i”。

如图4所示,第一可能性包括根据步骤4.2和4.3进行,以将中间立方体i×l×k与立方体c1并置。通过将这两个三维立方体的模j和l对齐,获得三维立方体c32,i×k×(j+l),该立方体包括所有的荧光数据和吸收数据。

如图5所示,另一可能性包括根据步骤5.2和5.3进行,以将中间立方体i×l×k与立方体c1并置。通过根据共模k将这两个立方体对齐,来获得三维立方体c3,i×l×j,该立方体包括所有的荧光数据和吸收数据。这可以通过例如形成“k”个矩阵乘积来完成。

应当理解的是,其他合并模式也可以用于形成三维合并数据立方体并且具有类似的技术优点。

应当注意的是,根据本发明,组织获取的光谱数据之前可以有不同的预处理子步骤。有利地,荧光光谱可以例如被预处理以考虑由于弹性扩散(也称为瑞利扩散(diffusionrayleigh))引起的贡献。这些贡献可以通过广义线性模型进行计算,然后从获取的光谱中减去。在大多数分析方法中通常需要减去瑞利扩散,并且减去瑞利扩散可以被应用作为本发明方法的一部分。然而,在本发明中不一定需要减去扩散。此外,可以通过数学处理去除弹性扩散的贡献,以利用“纯”荧光光谱。可选地,可以添加弹性扩散强度以供以后使用,例如,在计算表征样品的指示符期间。与由该方法的以下步骤所提供的信息相结合,对应于不同激发波长的初始弹性扩散强度实际上可以被重复使用。

有利地,可以通过msc(multiplicativescattercorrection,多元散射校正)或snv(standardnormalvariate,标准正态变量)来预处理获取的光谱。有利地,限定的预处理也可以应用于根据本发明的数据立方体。

根据本发明的方法的第七步骤g)包括通过应用多路统计模型来分解来自第三立方体的合并数据。数据分解可以根据不同类型的化学计量处理进行。根据待分解的数据立方体的大小和尺寸,多变量方法将因此与多路方法区分开。例如pls或pca的多变量方法通常是用于减少数据的方法,适用于根据二维立方体所组织的数据。该方法通常涉及:根据尺寸中的一个尺寸对初始立方体进行预先折叠,对获得的数据进行连接,并且对连接的数据进行分析。例如tucker、npls或mpca的多路方法是用于减少数据的方法,适用于组织到具有两个以上维度的立方体中的数据。因此,该方法本质上是多维的,并且可以直接用于根据上面限定的步骤的分析方法产生的数据立方体。

除了将多路统计模型应用于合并数据的单个立方体而不是两个数据立方体所允许的分析方法的更高软件效率之外,分解所述数据同时保留内在相关性的可能性也使得能够从分解的数据和该数据的内在相关性中推断出关于所分析样品的更精确的信息。

因此,本发明还提出了一种更快速和更高效的分析方法。同样地,实现这种方法的分析设备需要更简单、更便宜的装备,并且因此比现有技术更适合工业需求。本发明还能够有利于在食品生产过程中所作决策的速度和决策的合理性。

以创新的方式,本发明将新的多路分解技术应用于所有合并的原始数据。有利地,所应用的用以实现对合并数据的三维立方体进行分解的多路处理是tucker3型模型。tucker3模型使得能够将张量x“i×j×k”分解为三个二维立方体和分解为两个数据立方体。具体的,每个元素xi,j,k被分解如下:

其中:

-ai,p、bj,q、ck,r是相应矩阵a“i×p”、b“j×q”和c“k×r”的元素;

-ei,j,k是残余矩阵e“i×j×k”的元素;

-gp,q,r是交互立方体g“p×q×r”(也称为“核心数组”)的元素。

在任何情况下,矩阵a、b或c中的一个矩阵是称为“得分(scores)”矩阵或简化数据的矩阵,而其他矩阵被称为“载荷(loadings)”矩阵。例如,如果模i是样品的模,则矩阵a“i×p”是“得分”矩阵,所述“得分”矩阵能够通过代表性“得分”的数量“p”限定每个样品“i”。所述“得分”随后用于本发明。载荷矩阵b和c自身分别表示模j和k的贡献,而立方体g表示3个模之间的相互作用。

优选地但以非限制的方式,本发明还可以应用tucker2或parafac类型的多路分解,这两个模型构成了tucker3的特定情况。

根据本发明的方法的第八步骤h)包括:根据将所述多路统计模型应用于所述合并数据所提供的数据,确定表征所述样品或每个样品的至少一个指示符。根据本发明的步骤g)所提供的“得分”矩阵实际上能够通过一组变量表征所分析的一个样品或多个样品。所述变量本身可以经由回归模型被关联至所述至少一个指示符。因此,将所述回归模型应用于在一个或多个新样品上获得的“得分”使得能够获得这些样品上的所述指示符的值。

下面使用两个应用示例来限定本发明的一些技术结果。这两个示例示出了使用根据本发明的方法来预测样品的特征的性能的改进,该性能是在不实施所述方法的情况下获得的性能。

第一示例涉及通过荧光光谱和荧光光谱的组合分析所获得的得分的多元线性组合来获得结果,以获得小麦样品(例如,谷蛋白)中的蛋白质比率的预测。

对于该第一示例,考虑分析20个小麦样品。每个样品被4个发光二极管或led照射,该发光二极管或led在280nm、340nm、385nm和450nm处发射相应的光束。这些光束的照射使得能够在250nm至800nm的电磁光谱范围内获取完整的发射光谱,并且包括与20个小麦样品相关联的荧光光谱。然后用卤素灯/钨丝等照射每个样品,以在800nm至2500nm的光谱范围内发射连续光束。这些光束的照射使得能够在250nm至800nm的同一电磁光谱范围内获取完整的发射光谱,并且包括20个小麦样品的透射光谱和/或反射光谱。对通过信号分析仪获取并完成的光谱进行处理具体是经由一个或多个处理器执行的。具体地,可以清除荧光光谱中的弹性扩散,然后经由标准化进行预处理。该标准化例如是snv类型。应当理解的是,根据实现本方法的最佳方式,可以在将荧光光谱和吸收光谱组织为数据立方体之前的任何时间执行光谱的预处理。在该预处理之后,荧光光谱被组织为一个三维立方体cf1,称为第一获取数据立方体,与所述维度相关联的条目的数量分别对应于样品的数量、激发光束的数量以及获取的发射光束的数量,即模为“样品×激发×发射”的立方体。对于所考虑的示例,立方体cf1包括20×4×550个条目,即44,000个条目。可能使用snv(标准正态变量)标准化进行预处理的吸收光谱被组织为一个二维立方体ca0,称为第二获取数据立方体,与所述维度相关联的条目的数量分别对应于样品的数量和发射光束的数量,即模为“样品×发射”的立方体。对于所考虑的示例,所述立方体ca0包括20×1700个条目,即34000个条目。然后将立方体ca0复制4次以形成大小为20×4×1700的立方体ca1,换言之,该立方体ca1由136,000个条目构成。

对于本申请,所述立方体cf1和ca1然后根据发射模进行配对,以获得模为样品×激发×发射、大小为20×4×2250的立方体cfa1。然后通过应用算法(例如,tucker2类型)来分解立方体cfa1,以获得大小为20×15的得分矩阵,换言之,结果是针对20个样品中的每个样品获得15个得分因子。然后得分矩阵与大小为20×1的矢量相关,所述矢量包括:经由多元线性回归获得的在样品中的每个样品中测量的谷蛋白比率(作为百分比)的分析结果。

应用这些特定组织模式使得能够从这些模式中提取更多信息。该信息不仅包括仅通过红外光的小麦质量参数的校准质量和仅通过荧光获得的校准质量,还包括通过将分别由两个技术获得的得分进行结合获得的校准,以及通过使用上述三维结构获得的校准。该回归的统计性能在下表中提供。

下面的表1示出了通过r2值和校准误差(校正标准差(rmsec)和校正均方根差(rmsecv))表征根据现有技术的典型方法所提供的性能的表格。

表1

为了标准该方法带来的技术改进,通过文献中常用的方法获得了类似的回归。具体为:通过acp使用吸收数据预处理的双向表的分解,提供20×5的得分矩阵ma1,然后进行多元线性回归。另外:通过parafac使用荧光数据预处理的立方体cf1的分解,提供20×6的得分矩阵mf1,然后进行多元线性回归。因此,两个矩阵ma1和mf1连接形成大小为20×11的矩阵mfa1,然后进行多元线性回归。将如此获得的回归的性能与形成本发明主题的方法进行比较,以获得小麦样品中的每个小麦样品的蛋白质比率的预测。这些性能的比较呈现在下面的表2中,证明了预测性能的明显改善。通过应用根据本发明的方法对由获取的所考虑的20个样品的荧光光谱和透射光谱所提供的光谱数据进行分析所获得的r2、rmsec、r2cv和rmsecb的相应值均大于通过应用传统方法对由仅获取的荧光光谱或仅获取的透射光谱所提供的数据进行分析所获得的r2、rmsec、r2cv和rmsecb的相应值。

表2

应用的与上面限定的第一示例接近但是独立的第二示例涉及通过对荧光光谱和荧光光谱的组合分析所获得的得分进行多元线性组合所获得的结果,以获得小麦样品中的蛋白质比率的预测。

每个样品被4个led连续照射,该led在280nm、340nm、385nm和450nm处发射相应的光束。对于所述光束的每个光束,已经在250nm至800nm的范围内获取到了完整的发射光谱。然后通过卤素灯/钨丝灯在800nm至2500nm的光谱范围内照射每个样品,并在同一光谱范围内获取相应的吸收光谱。清除荧光光谱的弹性扩散,然后经由snv(标准正态变量)标准化进行预处理,并且被组织为模为“样品×激发×发射”、大小为20×4×550的一个第一数据立方体cf2。吸收光谱自身经由snv(标准正态变量)标准化进行预处理,并且被组织成模为“样品×发射”、大小为20×1700的第二数据立方体。所述吸收数据表被复制4次,并且将由此获得的4个表进行配对以形成大小为20×4×1700的新的立方体ca2。然后在立方体cf2和ca2之间形成根据激发模的矩阵乘积,以获得模为“样品×发射×发射”、大小为20×550×1700的立方体cfa2。然后,通过应用parafac算法来分解该立方体,使得能够获得大小为20×15的得分矩阵“样品×因子”。然后得分矩阵与大小为20×1的矢量相关,所述矢量包括:经由多元线性回归获得对样品中的每个样品测量的蛋白质比率(%)进行分析的结果。该回归的统计性能在下面的表3中提供。下面的表示出了通过r2值和校准误差(rmsec和rmsecv)表征根据现有技术的典型方法所提供的性能的表格。

表3

为了表征通过该方法带来的技术进步,通过现有技术的文献中常用的方法获得了类似的回归:通过acp使用吸收数据预处理的双向表的分解,提供20×5的得分矩阵ma1,然后进行多元线性回归。另外:通过parafac使用荧光数据预处理的立方体cf1的分解,提供20×6的得分矩阵mf1。然后进行多元线性回归。最后:两个矩阵ma1和mf1简单连接形成大小为20×11的矩阵mfa1,然后进行多元线性回归。将如此获得的回归的性能与形成本发明主题的方法进行比较,因而证明预测性能的改进,如下表4所示。

表4

简而言之,本发明涉及一种分析方法,该分析方法能够优化由两个不同的光谱技术所提供的光谱数据的结合处理,以分析一个或多个给定样品。具体地,限定的分析方法和该分析方法的不同的实施例旨在协调由同时使用这两个技术产生的约束,具体为吸收光谱和荧光光谱。因此,本发明提出一种创新的分析方法,用于获得表征一个或多个样品的质量的更精确的指示符。本发明还提出一种用于实现这种分析方法的分析设备。

当然,为了满足特定需求,本发明领域的技术人员可以对前面的描述进行修改。

尽管本发明通过参照以上特定实施例来进行限定,但是本发明不限于特定实施例,并且对于本领域技术人员而言,本发明的应用领域中的修改将是清楚的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1