一种基于ITS序列和机器学习的钩藤属植物鉴定方法与流程

文档序号:19419320发布日期:2019-12-14 01:15阅读:来源:国知局

技术特征:

1.一种基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,包括以下步骤:

s1.数据的获取和数据集的建立

获取钩藤属植物的its区序列,并进行比对,切除引物端后,去除中间存在高变的插入或缺失的序列,得到用于机器学习的数据集;

s2.利用机器学习提取鉴定钩藤属物种的核苷酸特征

将s1得到的数据集以barcodingwithlogic作为机器学习进行100次-1000次迭代计算,得到鉴定钩藤属植物的核苷酸特征;

s3.11个钩藤属植物的鉴定

鉴定11个钩藤属植物的特异核苷酸位点,具体标准是:

若第486位碱基为g,则鉴定为平滑钩藤uncaria.laevigata;

若第497位碱基为t,则鉴定为华钩藤u.sinensis;

若第631为碱基为a,则鉴定为云南钩藤u.yunnanensis;

若第589位碱基为t,则鉴定为侯钩藤u.rhynchophylloides;

若第118位碱基为t,则鉴定为一般钩藤u.rhynchophylla;

若第608位碱基为t,则鉴定为北越钩藤u.homomllla;

若第468位碱基为c,则鉴定为毛钩藤u.hirsuta;

若第651位碱基为a,则鉴定为白钩藤u.sessilifructus;

若第574位碱基为c,则鉴定为大叶钩藤u.macrophylla;

若第485位碱基为c且第589位碱基为c,则鉴定为倒挂钩藤u.lancifolia;

若第482位碱基为t,则鉴定为攀茎钩藤u.scandens。

2.根据权利要求1所述的基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,在步骤s1中,its区序列一部分来自于实验获取,物种是一般钩藤、华钩藤、毛钩藤、白钩藤、大叶钩藤、侯钩藤、北越钩藤,通过分子生物学实验及测序获得该7个钩藤属物种的its区序列,具体包括如下步骤:

s11.以改良的ctab法,提取7个待测物种样品的总dna;

s12.以7个待测物种样品的总dna为模板,利用引物its5和its4进行pcr扩增;

s13.扩增产物纯化后连接到载体pmd18-t,连接产物转化到e.colijm109感受态细胞,进行氨苄青霉素选择,对阳性菌落进行测序,测序引物与pcr扩增引物一致,得到its区序列。

3.根据权利要求1所述的基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,在步骤s1中,its区序列一部分来自于genbank,物种是一般钩藤、华钩藤、毛钩藤、白钩藤、大叶钩藤、北越钩藤、平滑钩藤、倒挂钩藤、攀茎钩藤、云南钩藤。

4.根据权利要求3所述的基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,在步骤s1中,将实验获得的its区序列与从genbank下载的its区序列合为一个文件,采用mega7.0作为比对软件。

5.根据权利要求2所述的基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,在步骤s11中,待测样品为新鲜采集的茜草科钩藤属植物的叶片,待测叶片先经过预处理后才进行dna的提取,所述预处理是将叶片浸泡于75%乙醇溶液中,5min后取出放置于无菌环境中风干,然后再液氮冷却的条件下研磨至粉末,该粉末即为待测样品。

6.根据权利要求5所述的基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,在步骤s12中,所述引物its4的核苷酸序列如seqidno:1所示,its5的核苷酸序列如seqidno:2所示,

seqno.1:tcctccgcttattgatatgc20

seqno.2:ggaagtaaaagtcgtaacaagg22。

7.根据权利要求6所述的基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,在步骤s12中,pcr扩增反应体系总体积为20μl,该反应体系包含2.5mmol/l10×pcrbuffer(含mgcl2)2μl,2.5mmol/ldntp1.6μl,10μmol/l引物its40.8μl,10μmol/l引物its50.8μl,5u/μlhifidna聚合酶0.1μl,加入dna模板50ng,其余体积用无菌水补足。

8.根据权利要求7所述的基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,在步骤s12中,pcr扩增反应过程为:95℃预变性3min,94℃变性1min,56℃退火1min,72℃延伸1min,30个循环,72℃延伸10min。

9.根据权利要求1所述的基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,在步骤s2中,以barcodingwithlogic作为机器学习方法,将s1得到的数据集随机分成训练集和测试集,其中训练集占总集合的90%,测试集占总集合的10%,进行1000次迭代计算。

10.根据权利要求1所述的基于its序列和机器学习的钩藤属植物鉴定方法,其特征在于,在步骤s3中,鉴别钩藤属物种的核苷酸特征为鉴别钩藤属植物的物种特异位点(species-specificpositions),各钩藤属植物在其特异位点未发生变异。


技术总结
本发明公开了一种基于ITS序列和机器学习鉴定钩藤属植物的方法,包括以下步骤:(1)收集钩藤属植物的ITS序列;(2)利用机器学习提取鉴别钩藤属植物的特异核苷酸位点;(3)对钩藤属植物进行鉴别。将ITS序列和机器学习结合用于钩藤属植物鉴定的方法,能够实现快速、高准确性、高特异性地鉴定11个钩藤属物种。该方法减少了从众多变异位点中手动筛选核苷酸位点来鉴定物种的时间,提高了鉴定效率;同时,该方法提取的核苷酸位点是物种的特异核苷酸位点,避免了将非特异位点作为鉴定钩藤属物种的依据而造成鉴定失败的情况,保证了鉴定钩藤属物种的特异性,并提高了钩藤属物种的鉴定成功率。

技术研发人员:朱爽;冯婷婷;邓锦思;丘思敏;林月霞
受保护的技术使用者:广东药科大学
技术研发日:2019.08.06
技术公布日:2019.12.13
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1