利用形态标构建狗牙根核心种质的方法和装置与流程

文档序号:13446642阅读:308来源:国知局
利用形态标构建狗牙根核心种质的方法和装置与流程

本发明涉及计算机技术领域,尤其涉及一种利用形态标构建狗牙根核心种质的方法和装置。



背景技术:

狗牙根(cynodonrichard)属于禾本科画眉草亚科虎尾草族的c4型多年生草本植物,是世界三大暖季型草坪草之一,也是一种优良牧草(harlan,1969)。狗牙根属植物分为9种10变种(taliaferro,1995)。大部分狗牙根起源于非洲地区,主要分布在温暖湿润的热带或亚热带地区,也有部分狗牙根分布在温带地区(rochecouste,1962;woffordandbaltensperger,1985;harlan,1970)。其中普通狗牙根(c.var.dactylon)属于世界广布种,水平分布范围为53°n~45°s;垂直分布上,既能生长在海平面以下也能生长在海拔4000m的喜马拉雅山上。中国有2种1变种,分别是普通狗牙根(c.dactylon)和弯穗狗牙根(c.radiatus)2个种,以及双花狗牙根(c.dactylonvar.biflorus)1个变种(floraof(chinaeditorialcommittee,2006)。国内外学者在狗牙根种质资源的收集、遗传多样性评价等方面已取得一定的进展(wangetal.,2009;wuetal.,2004;wuetal.,2006;tiwarietal.,2016;zhengetal.,2017),这些研究为狗牙根种源的核心种质的构建奠定了良好的基础。

目前核心种质的构建研究主要集中在农作物或园艺作物(lietal.,2002;martínez,etal.,2017;ortizetal.,1998),草类植物方面研究比较少。近20年里已构建核心种质的牧草主要包括多年生黑麦草(loliumperenne)、多年生苜蓿(medicagosativa)、一年生苜蓿(annualmedicago)、卵叶山蚂蝗(desmodiumovalifolium)和木豆(cajanuscajan)等(charmetandbalfourier,1995;basigalupetal.,1995;diwanetal.,1995;reddyetal.,2005;bhattacharjeeetal.,2007)。在狗牙根核心种质构建方面的研究较少,anderson(2005)利用598份狗牙根的表型数据构建了包含169份材料的狗牙根核心种质。jewell等(2011)对690份澳大利亚狗牙根种质的dna进行了est-ssr扩增,将得到的ssr数据结合狗牙根的地理来源信息、染色体倍数和形态数据用分层聚类取样的方法从原始种质中抽取了13%的核心材料构建了澳大利亚的狗牙根核心种质。郑轶琦利用表型数据为831份狗牙根构建了包含208份材料的初级核心种质(zhengetal.,2014)。

中国热带农业科学院热带作物品种资源研究所近年来收集了大量的狗牙根种源,目前已从形态、分子、抗逆性、坪用价值、饲用价值等方面对所收集的代表性资源进行了研究(huangetal.,2013;huangetal.,2014),丰富的种质资源为狗牙根的系统研究和遗传育种工作提供了大量的材料,然而,如此众多的资源给保存、评价、鉴定及利用带来了困难,如何更快、更有效地研究、利用现有的种质资源,对于加快发掘优异的资源为育种服务显得尤为重要。因此,进行狗牙根核心种质构建研究,对于种质资源创新和有效保护利用以及品种改良、新品种选育等具有十分重要的意义和应用前景。



技术实现要素:

本发明实施例提出的一种利用形态标构建狗牙根核心种质的方法和装置,所构建成的狗牙根核心种质能够有效地保留原始种质的表型遗传多样性、表型性状相关性和群体表型遗传结构,可以作为整体资源的代表性样本。

第一方面,本发明实施例提供一种利用形态标记构建狗牙根核心种质的方法,包括:

根据形态标记,测定狗牙根试验材料中狗牙根的性状,获得狗牙根原始种质的表型数据;

将取样方法、总体取样比例、聚类方法和遗传距离中包含的子策略进行两两组合,组合成的策略对所述原始种质进行种质的选取,获得狗牙根核心种质子集;

根据评价参数将每一个核心种质子集包含的种质的表型数据与原始种质的表型数据进行对比分析,从所述取样方法、所述总体取样比例、所述聚类方法和所述遗传距离中选取出相应的最优子策略;

将组内取样比例包含的子策略与所述选取出的四种类型最优的子策略进行组合,组合成的策略对分组后的原始种质的每一个小组进行种质的选取,并根据所述评价参数将所选取到的种质的表型数据与原始种质的表型数据进行对比分析,筛选出组内取样比例的最优子策略;

根据选取出的五种类型的最优子策略,从所述原始种质进行种质的选取,构建成狗牙根核心种质。

优选地,所述取样方法的子策略包括多次聚类优先取样法、多次聚类变异度取样法和不聚类完全随机法;

所述总体取样比例的子策略包括5%、10%、15%、20%、25%、30%和35%;

所述聚类方法的子策略包括最短距离法、最长距离法、中间距离法、不加权类平均法和离差平方和法;

所述遗传距离的子策略包括欧氏距离、马氏距离和主成分距离。

优选地,所述组内取样比例的子策略包括简单比例、平方根比例和对数比例。

优选地,所述选取出的五种类型的最优子策略为:所述取样方法为多次聚类优先取样法,所述总体取样比例为20%,所述聚类方法为不加权类平均法,所述遗传距离为马氏距离,以及所述组内取样比例为平方根据比例。

优选地,所述评价参数包括均值差异百分率、方差差异百分率、极差符合率和变异系数变化率。

进一步地,对所述原始种质进行分组的方法为:

根据植物学分类将所述原始种质分成相应的组类;

根据地理来源将每一组类内的原始种质进行划分,完成对所述原始种质的分组。

第二方面,本发明实施例还提供一种利用形态标记构建狗牙根核心种质的装置,包括:

表型数据测定模块,用于根据形态标记,测定狗牙根试验材料中狗牙根的性状,获得狗牙根原始种质的表型数据;

核心种质子集模块,用于将取样方法、总体取样比例、聚类方法和遗传距离中包含的子策略进行两两组合,组合成的策略对所述原始种质进行种质的选取,获得狗牙根核心种质子集;

第一策略选取模块,用于根据评价参数将每一个核心种质子集包含的种质的表型数据与原始种质的表型数据进行对比分析,从所述取样方法、所述总体取样比例、所述聚类方法和所述遗传距离中选取出相应的最优子策略;

第二略选取模块,用于将组内取样比例包含的子策略与所述选取出的四种类型最优的子策略进行组合,组合成的策略对分组后的原始种质的每一个小组进行种质的选取,并根据所述评价参数将所选取到的种质的表型数据与原始种质的表型数据进行对比分析,筛选出组内取样比例的最优子策略;

核心种质构建模块,用于根据选取出的五种类型的最优子策略,从所述原始种质进行种质的选取,构建成狗牙根核心种质。

优选地所述取样方法的子策略包括多次聚类优先取样法、多次聚类变异度取样法和不聚类完全随机法;

所述总体取样比例的子策略包括5%、10%、15%、20%、25%、30%和35%;

所述聚类方法的子策略包括最短距离法、最长距离法、中间距离法、不加权类平均法和离差平方和法;

所述遗传距离的子策略包括欧氏距离、马氏距离和主成分距离。

所述组内取样比例的子策略包括简单比例、平方根比例和对数比例。

所述评价参数包括均值差异百分率、方差差异百分率、极差符合率和变异系数变化率。

优选地,所述选取出的五种类型的最优子策略为:所述取样方法为多次聚类优先取样法,所述总体取样比例为20%,所述聚类方法为不加权类平均法,所述遗传距离为马氏距离,以及所述组内取样比例为平方根据比例。

进一步地,所述利用形态标记构建狗牙根核心种质的装置还包括用于对所述原始种质进行分组的种质分组模块,所述种质分组模块包括:

植特学分组单元,用于根据植物学分类将所述原始种质分成相应的组类;

地理来源分组单元,用于根据地理来源将每一组类内的原始种质进行划分,完成对所述原始种质的分组。

实施本发明实施例,具有如下有益效果:

本发明实施例提供的利用形态标构建狗牙根核心种质的方法和装置,根据形态标记,测定狗牙根试验材料中狗牙根的性状,获得狗牙根原始种质的表型数据;将取样方法、总体取样比例、聚类方法和遗传距离中包含的子策略进行两两组合,组合成的策略对所述原始种质进行种质的选取,获得狗牙根核心种质子集;进而根据评价参对狗牙根核心种质子集进行对比分析,从所述取样方法、所述总体取样比例、所述聚类方法和所述遗传距离中选取出相应的最优子策略;并与组内取样比例包含的子策略进行组合,组合成的策略对分组后的原始种质的每一个小组进行种质的选取,并根据所述评价参数筛选出组内取样比例的最优子策略;这样选取出来的取样方法、总体取样比例、聚类方法、遗传距离和组内取样比例为最佳策略,由该最佳策略所构建成的狗牙根核心种质能够有效地保留原始种质的表型遗传多样性、表型性状相关性和群体表型遗传结构,可以作为整体资源的代表性样本。

附图说明

图1,是本发明提供的利用形态标记构建狗牙根核心种质的方法的一个实施例的流程示意图;

图2是本发明实施例提供的依据步骤s3构建的核心子集中的种质与原始种质的遗传差异比较的评价分析表图;

图3是本发明提供不同组内取样比例在各原始种质的小组中抽取到核心种质的数量表格图;

图4是本发明提供的10%和20%总体取样比例组合构建的核心子集的评价参数对比表格图;

图5是由本发明提供的构建核心种质的方法构建成的核心种质与原始种质性状质之间的相关分析表格图;

图6是由本发明提供的构建核心种质的方法构建成的核心种质与原始种质之间的主成分析的特征值与累积贡献率表格图;

图7a是由本发明提供的构建核心种质的方法构建成的核心种质的第一主成分和第二主成分的二维散点图;

图7b是本发明提供的原始种质的第一主成分和第二主成分的二维散点图;

图8是本发明提供的利用形态标记构建狗牙根核心种质的装置的一个实施例的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参见图1,是本发明提供的利用形态标记构建狗牙根核心种质的方法的一个实施例的流程示意图;本发明实施例提供一种利用形态标记构建狗牙根核心种质的方法,包括步骤s1至步骤s5:

s1,根据形态标记,测定狗牙根试验材料中狗牙根的性状,获得狗牙根原始种质的表型数据。

本发明实施例所用的狗牙根试验材料是中国热带农业科学院热带作物品种资源研究所草业研究室于2006~2014年从国内外22个不同国家和地区采集的537份野生狗牙根,包括476份普通狗牙根、59份弯穗狗牙根、1份双花狗牙根,1份非洲狗牙根。利用形态标记对上述试验材料进行性状测定,共测定11个性状,其中数量性状7个,质量性状4个。数量性状有直立枝叶长、直立枝叶宽、匍匐枝叶长、匍匐枝叶宽、匍匐枝茎粗、匍匐枝节间长、草层高度,重复测定15次,求平均值。质量性状的测定项目包括:叶毛、叶姿、叶色和茎色。

需要说明的是,基于形态标记构建核心种质是核心种质构建的一种传统而重要的方法,但由于形态标记易受外界环境的影响,所以基于形态标记得到的核心种质难以代表原有种质资源的遗传多样性,使用分子标记的方法,能够在较短时间内获得大量的遗传信息,并且能很好的反映种质资源群体中个体间的亲缘关系,但由于分子标记实验的费用较高,而种质资源的原始群体一般规模庞大,因而很难对每个样品逐一进行分子标记检测。因此,只有将表型标记与分子标记等充分整合起来构建核心种质,才能最大限度地代表遗传多样性,提高核心种质的代表性、有效性。

s2,将取样方法、总体取样比例、聚类方法和遗传距离中包含的子策略进行两两组合,组合成的策略对所述原始种质进行种质的选取,获得狗牙根核心种质子集。

优选地,所述取样方法的子策略包括多次聚类优先取样法、多次聚类变异度取样法和不聚类完全随机法;所述总体取样比例的子策略包括5%、10%、15%、20%、25%、30%和35%;所述聚类方法的子策略包括最短距离法、最长距离法、中间距离法、不加权类平均法和离差平方和法;所述遗传距离的子策略包括欧氏距离、马氏距离和主成分距离。将取样方法、总体取样比例、聚类方法和遗传距离这4个策略的各个子策略进行两两完全组合,组合成的策略对所述原始种质的种群中进行种质的选取,共构建出315份狗牙根核心子集,并在后续步骤s3中对核心子集进行评价,从中筛选出最优的取样方法、总体取样比例、聚类方法和遗传距离的子策略。

s3,根据评价参数将每一个核心种质子集包含的种质的表型数据与原始种质的表型数据进行对比分析,从所述取样方法、所述总体取样比例、所述聚类方法和所述遗传距离中选取出相应的最优子策略。

需要说明的是,基于原始种质的表型数据构建的上述315份核心子集,为了评价核心子集中的核心种质是否保存了原始种质的表型遗传多样性,本发明实施例选择了均值差异百分率、方差差异百分率、极差符合率和变异系数变化率4个评价参数对其进行评价,核心种质只有足均值差异百分率小于20%且极差符合率至少大于80%才是有效的,且均值差异百分率越小,方差差异百分率、极差符合率以及变异系数变化率越大就越能代表原始种质的遗传多样性,进而可以从中筛选出最优的取样方法、总体取样比例、聚类方法和遗传距离的子策略。

对于一个核心子集,利用上述评价参数进行评价具体的计算过程为:

均值差异百分率md的计算公式为md=(st/n)×100%;

方差差异百分率vd的计算公式为vd=(sf/n)×100%;

极差符合率cr的计算公式为

变异系数变化率vr计算公式为

其中,i表示第i个性状;n是性状总数;st是该核心子集的核心种质与原始种质进行t检验时均值差异显著的性状数目;sf是该核心子集的核心种质与原始种质进行f检验时方差差异显著的性状数目;rc(i)是该核心子集的群体第i个性状的极差;ri(i)表示原始种质的种群内第i个性状的极差;cvc(i)表示该核心子集的核心种质的第i个性状的变异系数;cvi(i)表示原始种质的种群第i个性状的变异系数。

如图2所示,图2是本发明实施例提供的依据步骤s3构建的核心子集中的种质与原始种质的遗传差异比较的评价分析表图。

对于取样方法的筛选,具体为:利用均值差异百分率、方差差异百分率、极差符合率和变异系数变化率4个参数分别对3种取样方法构建的核心子集进行评价,通过计算,可以得出如图2所示的结果,结果表示多次聚类优先取样法构建的核心子集除平均极差符合率和多次聚类变异度取样法都为100%外,其它3个各参数明显优于多次聚类变异度取样法和不聚类完全随机法,因此最佳取样方法为多次聚类优先取样法。

对于遗传距离的筛选,具体为:利用均值差异百分率、方差差异百分率、极差符合率和变异系数变化率4个参数分别对3种遗传距离构建的核心子集进行评价,通过将核心子集中的种质与原始种质中的种质进行比较计算,可以得出如图2所示的结果,结果表示三者在4个评价参数上差异均不显著,平均均值差异百分率范围是2.86~4.16%;平均方差差异百分率范围是65.32~65.58%;平均极差符合率值都是100%;平均变异系数变化率取值范围是136.35~157.76%,因此,可认为选择三种遗传距离中的任意一种均可,本发明实施例优选马氏遗传距离为最佳的遗传距离的子策略。

对于聚类方法筛选,具体为:利用均值差异百分率、方差差异百分率、极差符合率和变异系数变化率4个参数分别对5种聚类方法构建的核心子集的进行评价,通过将核心子集中的种质与原始种质中的种质进行比较计算,可以得出如图2所述的结果,结果表示,在上述核心子集中,平均均值差异百分率的最小值为0.87%,最大值为4.33%;平均方差差异百分率的取值范围为62.34~68.83%;平均极差符合率都是100%;平均变异系数变化率的范围为135.21%~160.08%。5种聚类方法在4个评价参数上差异均不显著。所以选择任意一种聚类方法构建核心种质都可以,本发明实施例通过加权计算评价每个聚类方法的4个评价参数,优选的不加权类平均法为最佳聚类方法。

对于总体取样比例初步筛选,用5%、10%、15%、20%、25%、30%和35%等7种不同的总体取样比例构建狗牙根的核心子集,各核心子集的评价参数存在很大的差异。对4个评价参数进行综合分析,发现5%、10%在4个评价参数中都是最优的,且差异不显著;10%、15%和20%在除平均变异系数变化率外的3个评价参数上差异均不显著,总体参数值略差于5%;25%总体参数值较前4者差,但比30%和35%好;30%和35%总体参数值最差,且差异不显著。综上可知,总体取样比例最优的是5%和10%,其次是15%和20%,最差的是30%和35%。理论上,应选取5%或10%作为总体取样比例,然而这两个总体取样比例在同类研究中运用得较少,而且15%和20%和它们差异不大,因此,本发明实施例优选10%和20%留做备用总体取样比例,在接下来的组内取比例的选取计算中进一步筛选。

s4,将组内取样比例包含的子策略与所述选取出的四种类型最优的子策略进行组合,组合成的策略对分组后的原始种质的每一个小组进行种质的选取,并根据所述评价参数将所选取到的种质的表型数据与原始种质的表型数据进行对比分析,筛选出组内取样比例的最优子策略。

组内取样比例设定为简单比例、平方根比例和对数比例3种,总体取样比例设定为10%和20%等2种,将总体取样比例和组内取样比例组合成6种方式进行筛选,计算用这6种方式从各组中抽取的核心材料数量(如图3所示,图3是本发明提供不同组内取样比例在各原始种质的小组中抽取到核心种质的数量表格图)。由图3可知,第9、10和11组内包含的狗牙根材料分别只有4、1和1份。为了保证核心种质能保留原始种质中的特殊材料,3种组内取样比例中只有平方根比例能从这3个组中都抽取核心材料,因此选择平方根比例。

其中,如图3所示,本发明实施例提供的对步骤s1提供的原始种质的整个种群进行分组的方法为:首先,根据植物学分类将所述原始种质分成相应的组类。例如:本发明实施例提供的试验材料为537份野生狗牙根,按植特学分类将537份野生狗牙根材料分为普通狗牙根(c.dactylon)、弯穗狗牙根(c.radiatus)、双花狗牙根(c.dactylonvar.biflorus)和非洲狗牙根(c.transuaalensis)4大组。接着,根据地理来源将每一组类内的原始种质进行划分,完成对所述原始种质的分组,可将上述举例提供的4大组划分成11小组,因而将原始种质划分成了11小组。

在选择平方根比例作为组内取样比例的基础上,比较总体取10%和20%构建和核心子集的评价参数。图4是本发明提供的10%和20%总体取样比例组合构建的核心子集的评价参数对比表格图,由图4可知,两者在均值差异百分率上相等;在方差差异百分率和极差符合率上,20%都大于10%;而在变异系数变化率上,10%较大。由此可知,20%略微优于10%,因此选择20%作为最佳取样比例。

综上可知,筛选出了基于原始种质的表型数据构建狗牙根核心种质的策略,即取样方法选择多次聚类优先取样法,总体取样比例选择20%,组内取样比例选择平方根比例,遗传距离选择马氏距离,聚类方法选择不加权类平均法。

s5,根据选取出的五种类型的最优子策略,从所述原始种质进行种质的选取,构建成狗牙根核心种质。

利用上述筛选出的“取样方法选择多次聚类优先取样法,总体取样比例选择20%,组内取样比例选择平方根比例,遗传距离选择马氏距离,聚类方法选择不加权类平均法”的最佳核心种质构建策略(即上述五种类型的最优子策略)对原始种质的表型数据(537份狗牙根种质的表型数据)进行分析,从中选取种质,构建成由108份狗牙根种质组成的核心种质。

需要说明的是,步骤s5构建核心种质的具体过程,实际上是基于原始种质的种群的基础上以上述选取出来的最佳核心种质构建策略为取样策略不断抽取样本的过和,可以最大程度地剔除原始种质群体的遗传冗余,而且能使核心种质的变异和原群体遗传多样性的保有量达到最大化。首先,构建核心种质的过程,先在未分组的原始种质的种群内以20%的总体取样比例完全随机取样出相应的种质,然后分组,以平方根比例的组内取样比例完全随机取样选取出相应的种质。接着,由于资源的遗传多样性分布是不均匀的,在执行随机取样之后再进行聚类取样将会获得多样性结构不同的核心种质,聚类取样法可以从遗传距离较近的材料中剔除一定比例的样本,从而降低了原种质的遗传冗余并保持原种质的遗传结构,本发明实施例的聚类方法选择不加权类平均法。进而,在聚类抽样之后再按遗传距离(马氏距离)进行抽样,最终完成核心种质的构建。

本发明实施例提供的利用形态标构建狗牙根核心种质的方法和装置,根据形态标记,测定狗牙根试验材料中狗牙根的性状,获得狗牙根原始种质的表型数据;将取样方法、总体取样比例、聚类方法和遗传距离中包含的子策略进行两两组合,组合成的策略对所述原始种质进行种质的选取,获得狗牙根核心种质子集;进而根据评价参对狗牙根核心种质子集进行对比分析,从所述取样方法、所述总体取样比例、所述聚类方法和所述遗传距离中选取出相应的最优子策略;并与组内取样比例包含的子策略进行组合,组合成的策略对分组后的原始种质的每一个小组进行种质的选取,并根据所述评价参数筛选出组内取样比例的最优子策略;这样选取出来的取样方法、总体取样比例、聚类方法、遗传距离和组内取样比例为最佳策略,由该最佳策略所构建成的狗牙根核心种质能够有效地保留原始种质的表型遗传多样性、表型性状相关性和群体表型遗传结构,可以作为整体资源的代表性样本。

种质的性状间的相关性是一个物种的内在特性,是物种内在遗传物质存在关联的外在表现。抽样不应该改变这种物种固有的性状间的相关,因此一个优良的核心种质应该保持原始种质的性状相关性。由于表型核心种质比原始种群的种质材料数量少,两者自由度不一样,所以比较相关系数的大小没有意义,

只需要比较在原始群体中呈显著相关的性状是否在表型核心种质中也呈显著相关即可。本发明实施例分别对根据上述实施例提供的构建核心种质的方法所构建成的核心种质和原始种质之间进行了基于11个表型性状的相关分析,发现本发明实施例提供的构建核心种质的方法所能构建的核心种质能保持原始种质85%以上的性状相关。

以下将以本发明实施例提供的试验材料(537份野生狗牙根的表型数据)进行举例证明描述:

对本发明实施例构建成的核心种质与原始种质性状质之间的相关分析,具体参见图5,图5是由本发明提供的构建核心种质的方法构建成的核心种质与原始种质性状质之间的相关分析表格图,原始种质和核心种质均有11个表型,在原始种质的表型数据中,28对表型性状呈极显著相关,4对表型性状呈显著相关;而在核心种质的表型数据中有24对性状呈极显著相关,4对性状呈显著相关。原始种质中85%左右的性状相关性在表型核心种质中得到了保持。从而证明了由本发明实施例提供的构建方法而构建成的核心种质能保持原始种质中85%左右的性状相关性。

一个合格的核心种质不但要尽量多地保存原始种质的遗传多样性,还要尽量保持原始种质的群体遗传结构。主成分分析是一种将多变量、多指标转化为较少变量、较少指标的数据分析技术,已被广泛应用于生物多样性研究,包括核心种质构建。根据种质材料在第1、第2主成分上的得分绘制的2维散点图可以近似地反映种质材料在群体中的分布情况,可以直观地反映群体的遗传结构。散点图中种质材料间的距离即反映了它们的遗传相似度,距离越近,相似度越高,距离越远,相异度越大;而且第1、2主成分的贡献率越大,反映得越精确。将原始种质与核心种质的主成分2维分布图进行对比,可以直观地反映核心种质对原始种质的代表性。本发明实施例对原始种质和核心种质进行了主成分分析,并绘制了它们基于第1、第2主成分的2维分布图。发现核心种质的2维分布图都有与原始种质相近的几何外形和分布特点,能大部分保持原始种质的群体遗传结构。

为了进一步检验由本发明实施例提供的构建方法而构建成的核心种质对原始种质的代表性,本发明实施例分别对两个群体的表型数据进行了主成分分析,如图6所示,图6是由本发明提供的构建核心种质的方法构建成的核心种质与原始种质之间的主成分析的特征值与累积贡献率表格图;由图6可知,以特征值大于1为标准,选取了4个主成分。核心种质与原始种质在各个主成分的特征值、比例和累积贡献率上都比较接近,且前三个主成分的特征值比原始种质的略高。根据种质材料在第一和第二主成分上的得分绘制二维散点图(图7a和图7b,其中,两图中的横轴为种质的第一主成分,纵轴为第二主成分)。从图7a和图7b可以看出核心种质主成分二维分布图的几何形状、特征与原始种质非常相似,两者的种质材料都主要集中分布在散点图的左方,而图中下方有零星分布,说明核心种质良好地保持了原始种群的遗传结构。

参见图8,图8是本发明提供的利用形态标记构建狗牙根核心种质的装置的一个实施例的结构示意图。

第二方面,本发明实施例还提供一种利用形态标记构建狗牙根核心种质的装置,包括:

表型数据测定模块10,用于根据形态标记,测定狗牙根试验材料中狗牙根的性状,获得狗牙根原始种质的表型数据;

核心种质子集模块20,用于将取样方法、总体取样比例、聚类方法和遗传距离中包含的子策略进行两两组合,组合成的策略对所述原始种质进行种质的选取,获得狗牙根核心种质子集;

第一策略选取模块30,用于根据评价参数将每一个核心种质子集包含的种质的表型数据与原始种质的表型数据进行对比分析,从所述取样方法、所述总体取样比例、所述聚类方法和所述遗传距离中选取出相应的最优子策略;

第二略选取模块40,用于将组内取样比例包含的子策略与所述选取出的四种类型最优的子策略进行组合,组合成的策略对分组后的原始种质的每一个小组进行种质的选取,并根据所述评价参数将所选取到的种质的表型数据与原始种质的表型数据进行对比分析,筛选出组内取样比例的最优子策略;

核心种质构建模块50,用于根据选取出的五种类型的最优子策略,从所述原始种质进行种质的选取,构建成狗牙根核心种质。

优选地所述取样方法的子策略包括多次聚类优先取样法、多次聚类变异度取样法和不聚类完全随机法;

所述总体取样比例的子策略包括5%、10%、15%、20%、25%、30%和35%;

所述聚类方法的子策略包括最短距离法、最长距离法、中间距离法、不加权类平均法和离差平方和法;

所述遗传距离的子策略包括欧氏距离、马氏距离和主成分距离。

所述组内取样比例的子策略包括简单比例、平方根比例和对数比例。

所述评价参数包括均值差异百分率、方差差异百分率、极差符合率和变异系数变化率。

优选地,所述选取出的五种类型的最优子策略为:所述取样方法为多次聚类优先取样法,所述总体取样比例为20%,所述聚类方法为不加权类平均法,所述遗传距离为马氏距离,以及所述组内取样比例为平方根据比例。

进一步地,所述利用形态标记构建狗牙根核心种质的装置还包括用于对所述原始种质进行分组的种质分组模块,所述种质分组模块60包括:

植特学分组单元,用于根据植物学分类将所述原始种质分成相应的组类;

地理来源分组单元,用于根据地理来源将每一组类内的原始种质进行划分,完成对所述原始种质的分组。

进一步地,本发明实施例还提供一种计算机可读存储介质,其中存储有多条指令,所述指令被处理器执行时实现第一方面的任一种实施方式提供的利用形态标记构建狗牙根核心种质的方法。

更进一步地,本发明实施例还提供一种终端设备,包括存储设备、处理器及存储在所述存储设备上并可在所述处理器上运行的多条指令,其中,所述处理器执行所述指令时实现第一方面的任一种实施方式提供的利用形态标记构建狗牙根核心种质的方法。

实施本发明实施例,具有如下有益效果:

本发明实施例提供的利用形态标构建狗牙根核心种质的装置、计算机可读存储介质和终端设备,根据形态标记,测定狗牙根试验材料中狗牙根的性状,获得狗牙根原始种质的表型数据;将取样方法、总体取样比例、聚类方法和遗传距离中包含的子策略进行两两组合,组合成的策略对所述原始种质进行种质的选取,获得狗牙根核心种质子集;进而根据评价参对狗牙根核心种质子集进行对比分析,从所述取样方法、所述总体取样比例、所述聚类方法和所述遗传距离中选取出相应的最优子策略;并与组内取样比例包含的子策略进行组合,组合成的策略对分组后的原始种质的每一个小组进行种质的选取,并根据所述评价参数筛选出组内取样比例的最优子策略;这样选取出来的取样方法、总体取样比例、聚类方法、遗传距离和组内取样比例为最佳策略,由该最佳策略所构建成的狗牙根核心种质能够有效地保留原始种质的表型遗传多样性、表型性状相关性和群体表型遗传结构,可以作为整体资源的代表性样本。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1