1.一种玉米杂种优势类群分析方法,其特征在于,包括如下步骤:对玉米材料进行基因分型分析,筛选出最小等位基因频率0.2以上,位点没有缺失的snp分子标记;将上述玉米材料snp分子标记的plink格式作为输入文件输入lea程序包,采用基于r语言的群体结构分析lea程序包进行玉米材料的群体结构分析,将玉米材料分成不同的类群;采用线性判别分析方法获得线性判别函数,依据待测样本与线性判别函数之间的相似程度获得待测样本的归属分类;所述相似程度包括概率、距离和离差中的至少一种。
2.根据权利要求1所述的分析方法,其特征在于,所述群体结构分析包括如下步骤:采用lea程序包的ped2geno函数将plink格式文件转换成.geno格式文件,再用snmf()函数,运行.geno格式文件,运行结果采用plot()函数绘制群体结构折线图,将玉米材料分成不同的类群。
3.根据权利要求1所述的分析方法,其特征在于,所述线性判别分析方法包括如下步骤:利用所述玉米材料snp分子标记数据进行主成分的计算,获得所述玉米材料的主成分和类群,采用基于r语言的mass包和分类结果可视化klar程序包构建线性判别函数。
4.根据权利要求3所述的分析方法,其特征在于,所述主成分的计算包括如下步骤:利用所述玉米材料snp分子标记数据,读入到软件tassel中,依次点击tassel软件的analysis-relatedness-pca三个命令,直接计算所述玉米材料的主成分。
5.根据权利要求3所述的分析方法,其特征在于,构建线性判别函数时的取样策略包括方式1或方式2;所述方式1为:将所述玉米材料的主成分和类群数据按照特定的目的,分类进行选择,每个类群选择一部分共同组成训练集,剩余样本组成验证集;所述方式2为随机的选取所述玉米材料的主成分和类群数据中一定数量的样本作为训练集,剩余部分作为验证集。
6.根据权利要求3所述的分析方法,其特征在于,构建线性判别函数的方法为:采用a<-read.csv()函数将所述玉米材料的主成分和类群数据读入r程序,数据集命名为a,通过index <- 1:30和train <- a[index,]两个命令选择一部分样本作为训练集train,通过命令test <- a[48:60,]指定测试集为test,其中中括号中输入不同的行号来选择用来测试的样本;使用mass包中的线性判别函数lda()建立分类器,表达式为lda <- lda(type~不同主成分相加,data = train),运行该命令会得到线性判别函数。
7.根据权利要求3所述的分析方法,其特征在于,依据待测样本与线性判别函数之间的相似程度获得待测样本的归属分类包括如下步骤:分类效果采用partimat()函数进行可视化,把训练集的不同类群圈定到不同的区域中,采用predict <- predict(lda, test)函数,利用分类器的方程和测试集的主成分进行测试集样本的分类进行预测,采用table(test$gen,predict$class)函数线束预测结果。
8.根据权利要求1-7任意一项所述分析方法所得的snp分子标记,其特征在于,所述snp分子标记如下表所示:
9.权利要求8所述分子标记在糯玉米杂种优势类群分析中的应用,其特征在于,包括如下步骤:将所述糯玉米材料snp分子标记的plink格式作为输入文件输入lea程序包,采用基于r语言的群体结构分析lea程序包进行玉米材料的群体结构分析,将玉米材料分成不同的类群;采用线性判别分析方法获得线性判别函数,依据待测样本与线性判别函数之间的相似程度获得待测样本的归属分类;所述相似程度包括概率、距离和离差中的至少一种。
10.根据权利要求9所述的应用,其特征在于,所述线性判别函数为y1和y2:y1=-3.22*pc1+0.60*pc2-0.09*pc3+0.79*pc4-2.06*pc5+2.88*pc6-0.41*pc7+2.31*pc8-0.64*pc9+0.26*pc10;