一种寻找基因组中锌指蛋白靶标位点的方法与流程

文档序号:15118048发布日期:2018-08-07 22:00阅读:来源:国知局

技术特征:

1.一种寻找基因组中锌指蛋白靶标位点的方法,其特征在于,包括如下步骤:

S1.将能与锌指蛋白结合且结合率大于2的所有9个核苷酸序列建成一个库;

S2.设计软件程序,利用该程序在目标基因组的双链中寻找每隔一段距离存在的与步骤S1所述库中对应的9个核苷酸序列匹配的位点,即得到相应的锌指蛋白靶标位点;所述软件程序包括用户输入模块、序列载入和转换模块、数据处理模块、靶标搜索模块、搜索时间进度模块、结果输出模块;

具体步骤如下:

1)编写步骤S2所述的软件程序,提示用户输入相关数据;

2)收集能与9个核苷酸序列结合且结合率大于2的所有锌指蛋白基因信息,建成由相应的9个核苷酸序列所组成的库;

3)将步骤2)所述的库分别命名为正向和反向motif并储存;

4)储存待寻找锌指蛋白靶标位点的带有fasta格式的基因组或部分序列的文件;

5)规定锌指蛋白靶标位点的正向和反向motif之间的碱基距离数;

6)从motif文件中提取正向和反向motif,并将反向motif做反向互补处理;

7)分别从正向和反向motif中剔除重复的motif,生成正向和反向motif的所有组合,并确保两个motif之间的碱基数目与用户设定的间距一致;

8)运行perl子程序Motif_finder,它会调用bioperl模块,从用户输入的fasta序列中搜索以上生成的所有motif组合;

9)根据motif组合数目,调用Tk模块生成搜索进度条;

10)输出motif搜索结果到文件。

2.根据权利要求1所述的方法,其特征在于,步骤S1所述的所有9个核苷酸序列共有103个,其序列具体如下:GCAGCAGGA、GCTGCTGCT、GAAGAAGCT、GGGGAAGAA、GAAGTTGAG、GGTGCTGTG、GGTGCTGCC、GGAGGAGGT、GCGGCTGGG、GCCGCTGGG、GCAGCGGCA、GCAGATCTA、GCAGATCGC、GCAGCAGAG、GCGGCTGGG、GAAGCAGCA、GGGGTAGCG、GAAGGTGTG、TTGGTGGGA、GGGGGAGGG、GGGGCGGGC、GGGGAAGAG、GGGGAAGAA、GTCGGGGTA、GGGGACGTC、GGAGGGGCT、GGGGTGGCT、GGGGCTGCC、GGAGGAGGT、GCAGGAGGT、GGCGGAGAT、GATGGAGTT、GGGGAGGAG、GGAGGTGGT、GGAGGCGCG、GGAGCGGGT、GGAGCGGTG、GGTGAAGCT、GGTGCTGCC、GGCGGAGAT、GGCGTGGGA、GGCGCCGTG、GAGGAGGAG、GAGGACGGC、GAGGACGTG、GAGGTGGGC、GCTGTTGAG、GAGGCTGAT、GAGGCTGTG、GAGTGAGGA、GAGTTTGCC、GAAGATGGT、GAAGACGCT、GAAGTGGTC、GATGGAGTT、GATGGTGGG、GATGAAGCT、GATGATGGG、GATGCTGCA、GACGACGGC、GACGTGGTA、GACGCTGCT、GTGGGCGCC、GTGGATGAG、GTGGACGCG、GTGGTGGTG、GTGGCGGAT、GTGGCTGGT、GTGTAGGGG、GTAGAGGAT、GTAGATGGA、GTAGTAGCT、GTAGTTGGC、GTTGAGGGT、GTTGCGGCC、GTCGATGCC、GTCGCAGCC、GCGGTGGGA、GCGGTGGGT、GCGGTAGGC、GCGGCGGAC、GCGTGGGCG、GCAGAAGCC、GCAGTGGCG、GCAGTCGGC、GCAGTCGAC、GCAGTCGCT、GCAGCGGGC、GCAGCCGGA、GCTGACGTG、GCTGCTGCT、GCTGCTGCC、GCCGGTGGC、GCCGGCGGA、GCCGGCGGC、GCCGAGGTG、GCCGTCGCC、GCCGCAGTG、GCCGCCGGC、TAGGGAGCG、TCTGGCGCT、TGGGAGTCT、TTATGGGAG。

3.根据权利要求1所述的方法,其特征在于,步骤S2是同时分别在目标基因组的双链中寻找每隔一段距离存在的与步骤S1所述库中对应的9个核苷酸序列匹配的位点。

4.根据权利要求1所述的方法,其特征在于,步骤S2中所述的一段距离是指5~7个核苷酸的距离。

5.根据权利要求1所述的方法,其特征在于,所述用户输入模块是提示用户输入相关数据,所述相关数据是指:所有能与锌指蛋白结合且结合率大于2的9个核苷酸所组成的文件名,和所要寻找靶标序列的目标基因组文件名。

6.根据权利要求1所述的方法,其特征在于,所述序列载入和转换模块是根据输入的文件名,将能与锌指蛋白结合且结合率大于2的所有9个核苷酸序列载入,并转换得到所有反向互补的相应序列。

7.根据权利要求1所述的方法,其特征在于,所述数据处理模块是生成正向和反向motif的所有组合,并确保两个motif之间的碱基数目与用户设定的间距一致,为下一步的靶标搜索做好准备。

8.权利要求1~7任一所述方法在构建锌指蛋白中的应用。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1