一种单粒水稻直链淀粉定量分析模型构建及其检测方法与流程

文档序号:15703454发布日期:2018-10-19 20:18阅读:338来源:国知局
本发明涉及一种单籽粒作物成分含量的检测方法,具体涉及一种单粒水稻直链淀粉定量分析模型构建及其检测方法。
背景技术
:为了缩短育种周期、加快育种进程,水稻育种要求能够在种子培育的早代检测出甚至分选出符合育种家需要的特定性状的种子。在水稻品质育种中,直链淀粉是水稻最重要的品质指标之一,直链淀粉的含量决定水稻的食用品质和营养品质,因此备受育种家与消费者关注。传统的直链淀粉的检测方法如碘显色光度法和碘亲和力测定法(包括安倍滴定法和电位滴定法)等等,不同程度存在破坏种子、消耗试剂、操作繁琐、费时费力的缺陷,无法满足对早代种子的快速无损检测和分选需要。近红外光谱分析技术是一种快速、无损、简便、环保的分析技术,已广泛应用于农业、生物、医药、食品、化工等各个领域。单粒近红外检测技术(singlekernelnear-infraredspectroscopy,sk-nirs)指单粒作物水平上的近红外光谱分析技术,有望实现单粒水稻直链淀粉含量的快速无损检测,并可结合一定自动化装置,实现分选,以满足育种家早代选育合适的符合品质要求的水稻品种的需求。然而,近红外是一种二级分析技术,分析时是需要化学法作为参比的,而参比方法的精度大大影响到近红外的分析结果。现有文献报道中,化学参比值主要是由多籽粒混合样的平均化学值得到。但这种方法存在较大的局限性:由于即使为同一品种,不同大小、生长条件的种子其化学值成分也不尽相同。所以由这种方法得到的化学值只能用于检测品种成分的含量,不能够获得单籽粒准确的参比值,更难以构建准确的单籽粒近红外分析模型。l.e.agelet等指出,籽粒性状与大小、近红外光谱仪的种类与光谱的采集方式及建模方法,以及参比值的测定对于建立一个准确的近红外模型是至关重要的。而单籽粒化学参比值的测定是影响模型建立成功与否的一个重要因素:若单籽粒化学参比值的误差较大,那么模型预测的误差也会变大。针对这种单粒检测参比方法精度不够的问题,国内外一些专家采取了不同的优化方法。如j.g.wu等改进直链淀粉参比技术,使用半粒法作为参比方法,实现了单粒水稻直链淀粉含量的检测;又如armstrong,p.r等对多条单籽粒光谱进行平均,分析这些籽粒混合后的参比值,根据平均光谱和参比值构建近红外单粒作物的成分分析模型。然而,对于前一种方法,半粒法检测的是不含胚的那半粒水稻,这与所采集的完整的单粒水稻光谱是不完全对应的,因而影响到分析结果;而对于后一种方法,由于最终用于建模的光谱是每个籽粒光谱算术平均后的光谱,然而每个的籽粒质量、大小不同,导致每个籽粒对最终计算出的混合样的化学值的贡献不一,这和平均光谱也不是完全对应的,因而也会一定程度影响到预测结果。因此,只有改进直链淀粉参比方法,使之能够检测单粒水稻,才可以采用近红外方法准确地实现单粒水稻直链淀粉含量的快速无损检测。本发明在近红外建模时,采集样品的漫透射光谱,并对农业部标准碘比色法(ny/t2639)进行改进,将样品量由50mg降低至10mg,同时用离心管代替容量瓶,以实现单粒水稻直链淀粉的化学检测,之后再在此方法基础上,将光谱与化学值相关联,构建单粒直链淀粉近红外直链淀粉含量检测模型,旨在为水稻品质育种提供一种快速、无损、简便、准确的检测手段,以加快育种进程,促进育种技术发展。技术实现要素:本发明所要解决的技术问题在于提供了一种单粒水稻直链淀粉含量的近红外定量分析模型的构建方法和直链淀粉微量检测方法。本发明是通过以下技术方案解决上述技术问题的:一种单粒水稻直链淀粉定量分析模型构建方法,包括以下步骤:s1、收集直链淀粉含量有差异的单粒水稻样品若干份,干燥处理,平衡水分后作为校正集;s2、采集校正集中各所述单粒水稻样品的近红外光谱;s3、分别将校正集的各所述单粒水稻样品处理成米粉,获得各所述单粒水稻样品的直链淀粉含量参比值,构建校正集参比值矩阵;s4、近红外单粒直链淀粉模型的构建:将s2获得的近红外光谱筛选光谱区间,获得校正集光谱矩阵,将所述光谱矩阵与s3所述参比值矩阵进行回归关联分析,获得单粒水稻直链淀粉含量的近红外定量分析模型。进一步地,所述步骤s1中各单粒水稻样品为外观饱满完整、无病斑、无霉变、无虫蚀的单粒水稻。进一步地,所述步骤s2中各单粒水稻样品的近红外光谱为各所述单粒水稻样品分别在正反两面采集的至少一组近红外光谱的平均值。进一步地,所述的近红外光谱为近红外漫透射光谱。进一步地,所述步骤s3中,所述米粉为糙米粉或精米粉。进一步地,所述步骤s3中校正集米粉直链淀粉含量参比值的测定采用改良后的碘比色法,所述改良后的碘比色法的具体步骤为:(1)标准曲线的制作:选取直链淀粉标准样品若干份,进行如下步骤操作,获得标准曲线:a)糊化:每份样品各称取适量的样品粉末,将样品置于容量不小于2ml的容器中,加入无水乙醇将将样品分散,轻轻拍打容器,确保样品粉末充分分散,然后加入1mol/lnaoh,之后放入95-100℃的水浴中加热,期间取出摇晃数次,加热15-20分钟后,将样品取出冷却,之后加入水摇匀,其中,样品粉末与无水乙醇、1mol/lnaoh溶液、水的重量体积比10mg:100μl:900μl:1ml;b)显色:糊化后的液体取放入容量不小于5ml的容器中,依次加入水、1mol/lhac、0.2%i2-ki染色液,摇匀后再次加入水,继续摇匀,显色5-20分钟后测量620nm下的吸光度,每份样品至少重复上述显色过程两次,以重复测定的吸光度的平均值作为该样品的吸光度,其中,所述糊化后的液体、第一次加入的水、hac、i2-ki染色液以及第二次加入的水的体积比为40μl:860μl:40μl:60:μl:3000μl;c)计算标准曲线:根据标准样品的直链淀粉含量以及标准样品的吸光度与质量的比值拟合标准曲线;(2)校正集直链淀粉含量的检测,包含如下步骤:d)糊化:每份校正集单粒水稻样品经过脱壳、磨粉处理后过100目筛,于75-85℃烘箱中烘干至恒重,得到所需米粉。之后的步骤同步骤a);e)显色:过程同步骤b);f)计算校正集直链淀粉含量:根据步骤c)中所获的标准曲线,根据校正集样品的吸光度与其质量的比值计算校正集样品的直链淀粉含量。进一步地,所述容器为离心管。进一步地,所述步骤s4中还包括对s2获得的光谱进行预处理步骤,所述预处理步骤为:对s2获得的光谱进行一阶导数处理,平滑点数17点,然后截取光谱范围11146.8cm-1-9812.3cm-1、9133.5cm-1-8470.1cm-1和7791.3cm-1-7127.9cm-1的光谱,获得预处理后的校正集光谱矩阵。进一步地,所述步骤s4中采用偏最小二乘法构建单粒水稻直链淀粉含量近红外定量分析模型,所采用的偏最小二乘法中主成分数设置为14。本发明还保护一种单粒水稻直链淀粉检测方法,包括以下步骤:1)选择若干外观饱满完整、无病斑、无霉变、无虫蚀的单粒水稻作为待测集,并分别采集的各所述单粒水稻正反两面至少一组近红外光谱数据的平均值;2)对步骤1)获得的近红外光谱数据平均值进行预处理与光谱范围截取,利用权利要求1至9任一所述的一种单粒水稻直链淀粉定量分析模型构建方法构建的模型计算待测集各样品的直链淀粉含量。进一步地,所述步骤2)中近红外光谱数据平均值进行预处理和光谱范围截取的步骤为:对获得的光谱进行一阶导数处理,平滑点数17点,然后截取光谱范围11146.8cm-1-9812.3cm-1、9133.5cm-1-8470.1cm-1和7791.3cm-1-7127.9cm-1的光谱。本发明还保护一种单籽粒水稻自动分选装置,所述分选装置采用如权利要求1至10任一所述的方法对单籽粒水稻进行自动分选。在建模时,对所建定量模型的评价指标主要有如下几种:决定系数(coefficientofdetermination,r2),交叉验证均方根误差(rootmeanstandarderrorofcrossvalidation,rmsecv);在外部验证时,对预测结果的评价指标有如下几种:预测相关系数(coefficientofcorrelation,r),预测均方根误差(rootmeanstandarderrorofprediction,rmsep)。详细算法如下面公式所示:(1)决定系数(r2)式中,yi,actual为第i个校正集样品的参比值;yi,predicted为第i个校正集样品的近红外模型预测值;yi,actual为所有校正集样品参比值的平均值;n为校正集样品数。r2被用来评价由校正建立的模型拟合效果。在浓度范围相同的前提下,r2越接近1,表示预测值越接近参比值,即准确性越高;若r2等于1,则表示完全拟合;若r2为负值,则表示模型拟合效果极差。另外,r2的大小与待测量的分布范围关系极大,对于分布范围很广的待测量,有可能出现r2接近1,但其准确性较差的情况。(2)交叉验证均方根误差(rmsecv)式中,yi,actual为校正集中第i个样品的参比值;yi,predicted为校正集交叉验证过程中第i个样品的模型预测值;n为校正集的样品数;rmsecv越小,表明模型对校正集的样本预测效果越好。(3)预测相关系数(r)式中,yi,actual为第i个验证集样品的参比值;yi,predicted为第i个验证集样品的近红外模型预测值;yi,actual为所有验证集样品参比值的平均值;m验证集为样品数。预测相关系数r越接近1,表示预测值越接近参比值,即准确性越高。(4)预测均方根误差(rmsecp)式中,yi,actual为验证集中第i个样品的参比值;yi,predicted为验证集中第i个样品的模型预测值;m为验证集的样品数;rmsep值越小,表明所建模型的预测能力越强、预测结果越准确。根据本发明方法,可以设计、建立一套近红外无损检测自动分选装置,根据所检测组分的差异分选待测单籽粒作物。本发明相比现有技术的优点在于:采用近红外技术实现了单粒水稻直链淀粉含量的快速无损检测;在此基础上,在近红外分析时,通过改良碘比色法,获取了准确的直链淀粉参比值,因而所构建的近红外模型相比过去报道更为准确。因此,采用本发明方法,可实现对单粒水稻直链淀粉含量的快速、无损、准确检测。附图说明图1为实施例1中采集的原始光谱;图2为实施例1中根据ny/t2639方法绘制的标准曲线;图3为实施例1中根据改良的碘比色法绘制的标准曲线;图4为实施例1中近红外单粒水稻直链淀粉模型对验证集样品的预测值与参比值的散点图。具体实施方式下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。实施例一种单粒水稻直链淀粉定量分析模型构建方法本实施例的具体检测步骤如下:s1、样品收集本实施例收集不同种质来源的水稻品种,包括水稻籼稻品种“9311”、粳稻“武运粳7号”受重离子辐照后的突变体、以及其他粳稻品种上百份,从中筛选表面无病斑、霉变、虫蚀等现象的饱满、完整、成熟的单粒水稻种子共160粒,随机选择其中120粒,作为校正集,用于建模。s2、采集校正集样品的近红外漫透射光谱;光谱采集使用仪器为德国bruker公司mpa型傅立叶变换近红外光谱仪,配有积分球、pbs检测器和opus7.0数据处理与分析软件。检测窗口固定一直径30mm中间有直径2mm小孔的铝片,使用样品杯漫透射扫描参数,光谱扫描范围为5793cm-1-12489cm-1,分辨率16cm-1,对该检测窗口进行扫描,扫描次数64次,作为背景光谱。背景扫描后,将水稻样品平放在铝片上,水稻正面、背面各采集1条光谱后计算平均光谱,作为该样品光谱。采集得到的原始光谱见图1所示。s3、对所收集对单粒水稻手工去壳,使用研钵和杵磨成粉,之后过100目筛,制备成米粉。采用改良后的碘比色法测定校正集样品的直链淀粉含量参比值,并根据校正集样品的直链淀粉含量参比值构建校正集样品参比值矩阵,所述校正集样品参比值矩阵中每行代表一个样品的直链淀粉含量参比值,不同的行代表不同样品的直链淀粉含量参比值。改良后的碘比色法的具体步骤为:(1)标准曲线的制作:选取合适的直链淀粉标准样品4份,其直链淀粉含量分别为1.5%、10.4%、16.2%和26.5%,每份重复2次,进行如下步骤操作,获得标准曲线:a)糊化:每份样品称取10mg左右的粉末,记录下其质量后,置于离心管中(离心管容量不小于2ml),加100μl无水乙醇将样品分散,轻轻拍打离心管,确保粉末充分分散后,加900μl的1mol/lnaoh,之后放入95-100℃的水浴中加热,期间取出摇晃数次,加热时间15-20分钟后,将样品取出冷却,之后加1ml水摇匀。b)显色:糊化后的液体取40μl放入新的离心管中(离心管容量不小于5ml),依次加水860μl,加40μl的1mol/lhac,再加60μl的0.2%i2-ki染色液,摇晃后加水3ml,摇匀,显色10分钟后,用分光光度计测定620nm下的吸光度。每份样品在显色步骤设置2次以上重复,以2次重复的吸光度的平均值作为该样品的吸光度。c)计算标准曲线:根据标准样品的直链淀粉含量以及标准样品的吸光度与质量的比值拟合标准曲线。(2)校正集样品直链淀粉含量的检测,包含如下步骤:d)糊化:每份校正集单粒水稻样品经过脱壳、磨粉、过筛处理成米粉,之后的步骤同步骤a);e)显色:过程同步骤b);f)计算校正集直链淀粉含量:根据步骤c)中所获的标准曲线,根据校正集样品的吸光度与其质量的比值计算校正集样品的直链淀粉含量。本碘比色方法和其不同之处主要在于使用了水浴替换金属浴,以满足大部分实验室的需要,同时在显色步骤增加了待显色样品溶液及对应试剂的剂量,并设2次重复,以保证显色步骤的精度。为验证本碘比色法对直链淀粉具有和传统的碘比色法(ny/t2639)相当的检测精度,对上述4份直链淀粉标准样品,分别使用该方法称取10mg米粉、使用ny/t2639中所述方法称取50mg米粉,进行直链淀粉含量检测(重复1次),两种方法所建立的标准曲线分别如图2和图3所示,其吸光度/质量和直链淀粉真值的决定系数r2分别为0.9987和0.9972。两种方法所测4份标样的吸光度/重量值之间的相关系数r为0.9950(图中未显示),由此可见,改良的碘比色法同样对于直链淀粉检测可行。其中,r2指的是两种方法(传统方法与改良碘比色法)建立标准曲线的决定系数,r指的是两种方法所测的两个结果间的相关系数(correlationcoefficient)。由图可知,改良方法所构建的标准曲线和ny/t2639中所述方法精度接近,说明所采用的改良的碘比色方法可以准确地检测10mg样品的直链淀粉化学值。使用改良的碘比色法测定后的校正集和验证集的直链淀粉参比值统计如表1。由表可知,两者具有较接近的平均值,较低的标准误和标准差。校正集的直链淀粉含量范围(1.35%-26.74%)大于验证集的直链淀粉范围(1.63%-24.45%),说明校正集可以较好地代表验证集以及大部分水稻品种。表1改良的碘比色法检测单粒水稻直链淀粉含量的统计结果种类校正集样品验证集样品样本数量12040直链淀粉含量范围1.35-26.741.63-24.45直链淀粉含量平均值13.5413.46标准误差0.611.09标准差6.716.91s4、近红外单粒直链淀粉模型的构建:使用合适的预处理方法处理校正集的原始光谱,并筛选光谱区间,获得预处理后的光谱矩阵;并根据上述获取的光谱矩阵,以及校正集样品参比值矩阵,采用偏最小二乘法构建回归模型。模型构建在matlab2015b软件(themathworks,natick,ma,usa)上实现。不同的预处理方法、不同的光谱范围,以及偏最小二乘回归时选择的主成分数不同,最终所建模型的表现不同。通过比较不同的预处理方法以及不同的光谱范围的组合,筛选最优的校正模型。预处理方法从无预处理、一阶导数(默认17点平滑)、标准正态变量变换(snv)、一阶导数+snv变换共4种方法中筛选;光谱范围的筛选方法为对全光谱范围的数据点均等截取10段(例如该一条全光谱范围的光谱有870个光谱点,对应870个数据,则10段中的每段包含87个光谱点的数据),其光谱范围截取情况如表2。穷举其中任意1段、2段、3段、4段的组合,共计210种光谱范围的组合,从中筛选最优光谱范围。预处理方法与光谱范围合计840种组合,对这840种组合建立偏最小二乘模型,选择其中主成分数20以内的,r2最高、rmsecv最低的模型作为最佳模型,其对应的预处理方法、光谱范围以及主成分数,为最优的偏最小二乘建模参数。模型的部分比较结果如表3所示。表2光谱编号与对应的光谱范围表3不同预处理方法及不同光谱范围下的建模表现由表3可知,在预处理方法一阶导数,光谱范围11146.8cm-1-9812.3cm-1、9133.5cm-1-8470.1cm-1和7791.3cm-1-7127.9cm-1(对应表3中的第3,4,6,8段)、主成分数为14时,所建模型的交叉验证结果最好,其r2为0.8563,rmsecv为2.55。因此选择该模型用于后续的验证、预测。为了验证模型的预测性能,从步骤s1中所述的突变体库中,再次挑选表面无病斑、霉变、虫蚀等现象的饱满、完整、成熟的单粒水稻种子40粒,作为验证集样品。对这些样品采用同步骤s2相同的方法采集光谱,同步骤s3相同的方法采集参比值,同步骤s4中相同的光谱预处理(即一阶导数,光谱范围11146.8cm-1-9812.3cm-1、9133.5cm-1-8470.1cm-1和7791.3cm-1-7127.9cm-1)处理验证集原始光谱,之后使用步骤s4中构建的模型对预处理后的光谱进行预测,主成分数设为14。模型预测在matlab2015b软件(themathworks,natick,ma,usa)上实现。其预测值与参比值的散点图如图4所示。由图4可见,模型具有较高的的外部验证相关系数r2(0.9511),以及较低的rmsep(2.1135),验证集预测值与参比值的配对t检验的p值为0.926>0.05,该结果优于j.g.wu等(fieldcropsresearch,2004)所报道的单粒水稻(r2=0.66,rmsep=4.69)的直链淀粉近红外检测结果,说明模型可以有效预测验证集的样品,因而也可以推广于其他类似种质的单粒水稻上。当对未知的水稻种子样品进行预测时,采用同步骤s2相同的方法采集待测的单粒水稻光谱,同步骤s4中相同的光谱预处理(即一阶导数,光谱范围11146.8cm-1-9812.3cm-1、9133.5cm-1-8470.1cm-1和7791.3cm-1-7127.9cm-1)处理这些单粒水稻的原始光谱,并使用步骤s4中构建的模型对预处理后的光谱进行预测,所得结果即为待测单粒水稻的直链淀粉含量。需要特别指出的是,本发明的检测方法不限于上述实施例所述的应用场景,进一步地,还可以设计、建立一套不同成分的单籽粒水稻的近红外直链淀粉含量自动分选装置,装置中的软件可整合该方法设计近红外模型、并对待测单籽粒水稻光谱采集和预测,以满足育种和粮食行业中对不同直链淀粉含量的单籽粒水稻的快速无损检测和分选需要。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1