本发明属于生物,具体的涉及一种基于贝叶斯模型的编辑基因载体残留检测方法和系统。
背景技术:
1、高通量测序由于其短周期和低成本的优势,目前在肿瘤诊断,遗传病检测,新生儿筛查等方向上广泛应用,但是基因编辑方向上使用高通量测序数据进行检测的方法和算法并不多见。尤其是在植物方向,由于植物进行基因编辑时候会通过载体(如农杆菌转染)将外源序列导入到植物本体基因组中,表达相关基因编辑的蛋白质和靶点,对目标区域的dna进行改变。在后期的多代回交中纯化过滤载体序列。基因组中存在大量重复序列,同源序列,载体中会使用植物同源的启动子,实验中会有气溶胶污染,测序中会有测序标签交叉污染等情况。所以如何利用高通量测序技术评价编辑植物的基因组中是否有载体相关序列残留需要系统的方法和算法。
2、目前对于载体残留情况评价采用,传统的pcr方式进行,利用随机在载体骨架序列上进行引物设计,然后在编辑植物中进行pcr实验,观察是否能够获得pcr产物序列,从而确认载体是否残留。
3、1、传统使用具有局限性,无法对载体序列进行全面检查,随机抽查,会导致最终判定结果不准确。
4、2.传统方法,需要繁琐的引物设计与分子实验,无法进行大规模高通量筛查。
5、3.传统方法,并没有综合考虑试验操作系统及环境污染,取样污染等情况。
6、4.早期高通量测序方法,无系统的分析方法和算法,只是简单统计载体残留的测序片段 数目,不符合统计学意义的显著性。
技术实现思路
1、针对上述缺点,首先利用高通量测序手段,通过一次全基因组测序,获得该个体的全部基因组序列信息,可以在短时间内对大量植物进行同时检测,大大提高了检测通量;通过多种筛选手段后的数据,尽可能排除实验操作、实验环境及系统引入的误差,借助贝叶斯概率模型,结合统计学的显著性值,科学有效地推断编辑材料是否安全,大大加快编辑材料的安全评价进程。
2、根据本发明第一方面,本发明请求保护一种基于贝叶斯模型的编辑基因载体残留检测方法,包括:
3、获取编辑材料基因组序列和野生材料基因组序列,构建样本数据库,将所述编辑材料基因组序列和野生材料基因组序列存入所述样本数据库中;
4、提取所述编辑材料基因组序列和野生材料基因组序列,进行高通量测序,得到测序编辑材料基因组序列和测序野生材料基因组序列;
5、将所述测序编辑材料基因组序列和测序野生材料基因组序列依次分别与植物基因组与载体序列进行比对,得到候选编辑材料基因组序列和候选野生材料基因组序列;
6、依据所述候选野生材料基因组序列对所述候选编辑材料基因组序列进行筛选,得到编辑材料基因组序列中载体序列残留的数据条数;
7、将所述载体序列残留的数据条数输入载体残留贝叶斯概率模型,得到编辑材料存在载体序列残留的概率。
8、根据本发明第二方面,本发明请求保护一种基于贝叶斯模型的编辑基因载体残留检测系统,包括:
9、样本数据库,存储编辑材料基因组序列和野生材料基因组序列;
10、高通量测序模块,提取所述编辑材料基因组序列和野生材料基因组序列,进行高通量测序,得到测序编辑材料基因组序列和测序野生材料基因组序列;
11、比对模块,将所述测序编辑材料基因组序列和测序野生材料基因组序列依次分别与植物基因组与载体序列进行比对,得到候选编辑材料基因组序列和候选野生材料基因组序列;
12、筛选模块,依据所述候选野生材料基因组序列对所述候选编辑材料基因组序列进行筛选,得到编辑材料基因组序列中载体序列残留的数据条数;
13、概率输出模块,将所述载体序列残留的数据条数输入载体残留贝叶斯概率模型,得到编辑材料存在载体序列残留的概率。
14、本发明请求保护一种基于贝叶斯模型的编辑基因载体残留检测方法和系统,通过全基因组测序数据,依靠数据比对,结合比对质量、同源区域、野生材料基因组序列降低背景噪音等多种筛选方式,并将最后试验材料剩余的载体测序片段数目与贝叶斯概率模型进行科学融合,推断编辑材料的载体残留情况更为科学有效,充分考虑了重复序列,同源序列,载体中会使用植物同源的启动子。由于实验中会有气溶胶污染,测序中会有测序标签交叉污染等情况,本发明进一步推动基因编辑材料的安全性评价。本发明的技术效果包括实现了大规模高通量的检测,综合考虑各种污染情况,更有效地推断编辑材料的载体残留情况,更科学地评价基因编辑材料的安全性。
1.一种基于贝叶斯模型的编辑基因载体残留检测方法,其特征在于,包括:
2.如权利要求1所述的一种基于贝叶斯模型的编辑基因载体残留检测方法,其特征在于,
3.如权利要求1所述的一种基于贝叶斯模型的编辑基因载体残留检测方法,其特征在于,
4.如权利要求1所述的一种基于贝叶斯模型的编辑基因载体残留检测方法,其特征在于,
5.如权利要求1所述的一种基于贝叶斯模型的编辑基因载体残留检测方法,其特征在于,
6.一种基于贝叶斯模型的编辑基因载体残留检测系统,其特征在于,包括:
7.如权利要求6所述的一种基于贝叶斯模型的编辑基因载体残留检测系统,其特征在于,
8.如权利要求7所述的一种基于贝叶斯模型的编辑基因载体残留检测系统,其特征在于,
9.如权利要求8所述的一种基于贝叶斯模型的编辑基因载体残留检测系统,其特征在于,
10.如权利要求9所述的一种基于贝叶斯模型的编辑基因载体残留检测系统,其特征在于,