1.一种基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,包括以下步骤:
s1.数据的获取和数据集的建立
获取钩藤属植物的its区序列,并进行比对,切除引物端后,去除中间存在高变的插入或缺失的序列,得到用于机器学习的数据集;
s2.利用机器学习提取鉴定钩藤属物种的核苷酸特征
将s1得到的数据集以barcodingwithlogic作为机器学习进行100次-1000次迭代计算,得到鉴定钩藤属植物的核苷酸特征;
s3.11个钩藤属植物的鉴定
鉴定11个钩藤属植物的特异核苷酸位点,具体标准是:
若第486位碱基为g,则鉴定为平滑钩藤uncaria.laevigata;
若第497位碱基为t,则鉴定为华钩藤u.sinensis;
若第631为碱基为a,则鉴定为云南钩藤u.yunnanensis;
若第589位碱基为t,则鉴定为侯钩藤u.rhynchophylloides;
若第118位碱基为t,则鉴定为一般钩藤u.rhynchophylla;
若第608位碱基为t,则鉴定为北越钩藤u.homomllla;
若第468位碱基为c,则鉴定为毛钩藤u.hirsuta;
若第651位碱基为a,则鉴定为白钩藤u.sessilifructus;
若第574位碱基为c,则鉴定为大叶钩藤u.macrophylla;
若第485位碱基为c且第589位碱基为c,则鉴定为倒挂钩藤u.lancifolia;
若第482位碱基为t,则鉴定为攀茎钩藤u.scandens。
2.根据权利要求1所述的基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,在步骤s1中,its区序列一部分来自于实验获取,物种是一般钩藤、华钩藤、毛钩藤、白钩藤、大叶钩藤、侯钩藤、北越钩藤,通过分子生物学实验及测序获得该7个钩藤属物种的its区序列,具体包括如下步骤:
s11.以改良的ctab法,提取7个待测物种样品的总dna;
s12.以7个待测物种样品的总dna为模板,利用引物its5和its4进行pcr扩增;
s13.扩增产物纯化后连接到载体pmd18-t,连接产物转化到e.colijm109感受态细胞,进行氨苄青霉素选择,对阳性菌落进行测序,测序引物与pcr扩增引物一致,得到its区序列。
3.根据权利要求1所述的基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,在步骤s1中,its区序列一部分来自于genbank,物种是一般钩藤、华钩藤、毛钩藤、白钩藤、大叶钩藤、北越钩藤、平滑钩藤、倒挂钩藤、攀茎钩藤、云南钩藤。
4.根据权利要求3所述的基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,在步骤s1中,将实验获得的its区序列与从genbank下载的its区序列合为一个文件,采用mega7.0作为比对软件。
5.根据权利要求2所述的基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,在步骤s11中,待测样品为新鲜采集的茜草科钩藤属植物的叶片,待测叶片先经过预处理后才进行dna的提取,所述预处理是将叶片浸泡于75%乙醇溶液中,5min后取出放置于无菌环境中风干,然后再液氮冷却的条件下研磨至粉末,该粉末即为待测样品。
6.根据权利要求5所述的基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,在步骤s12中,所述引物its4的核苷酸序列如seqidno:1所示,its5的核苷酸序列如seqidno:2所示,
seqno.1:tcctccgcttattgatatgc20
seqno.2:ggaagtaaaagtcgtaacaagg22。
7.根据权利要求6所述的基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,在步骤s12中,pcr扩增反应体系总体积为20μl,该反应体系包含2.5mmol/l10×pcrbuffer(含mgcl2)2μl,2.5mmol/ldntp1.6μl,10μmol/l引物its40.8μl,10μmol/l引物its50.8μl,5u/μlhifidna聚合酶0.1μl,加入dna模板50ng,其余体积用无菌水补足。
8.根据权利要求7所述的基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,在步骤s12中,pcr扩增反应过程为:95℃预变性3min,94℃变性1min,56℃退火1min,72℃延伸1min,30个循环,72℃延伸10min。
9.根据权利要求1所述的基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,在步骤s2中,以barcodingwithlogic作为机器学习方法,将s1得到的数据集随机分成训练集和测试集,其中训练集占总集合的90%,测试集占总集合的10%,进行1000次迭代计算。
10.根据权利要求1所述的基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,在步骤s3中,鉴别钩藤属物种的核苷酸特征为鉴别钩藤属植物的物种特异位点(species-specificpositions),各钩藤属植物在其特异位点未发生变异。