填补昆虫基因组物理图谱中裂缝的方法

文档序号:563520阅读:414来源:国知局
专利名称:填补昆虫基因组物理图谱中裂缝的方法
技术领域
本发明涉及一种昆虫的基因组DNA,特别涉及一种用电子克隆技术填补 昆虫基因组物理图谱中未知序列的方法。
背景技术
2006年10月26日,来自13个国家数十个科研机构的将近200名科学家 组成的蜜蜂基因组测序联盟,在《自然》上公布了他们对西方蜜蜂的全基因组 的测序和分析结果。该研究团组用4年的时间,测定了这个拥有约2. 36亿个 碱基对的蜜蜂基因组,鉴定了 IOOOO多个基因。在蜜蜂基因组测序的基础上, 研究人员对蜜蜂所拥有的基因进行了注释,开展重要功能基因的基础和应用研 究。他们认为,蜜蜂的全基因组密码的破译,不仅揭示了蜜蜂进化的奥秘,也 带来与农业生产、人类健康有关的重要信息。这一成果虽然令人振奋,但蜜蜂 全基因组图谱中还存在大量的裂缝(Gap),裂缝中的碱基序列至今不明,短 的裂缝有数IO bp,长的达IOOO bp以上,这些未知序列的存在无疑是基因组 计划中的缺憾, 一些正值外显子区域的裂缝对解读蜜蜂基因密码带来很大障 碍。本发明作出之前,在"扩增未知序列DNA片段的PCR技术研究进展"[生 物工程进展2001. Vol21. N0 1 51-57一文中,介绍了多种扩增未知序列的 方法,如同端化PCR (UT-PCR)、反转录PCR(RT-PCR)等,但这些方法耗时 长、费用髙、操作复杂。然而,随着蜜蜂等昆虫EST数据库的日臻完善,电子克隆技术为扩增未 知序列、填补基因组图谱裂缝及寻找昆虫新基因提供了技术支撑。为进一步完 善昆虫基因组数据库、有效解读其基因密码、描绘昆虫基因组精细图谱提供科 学依据。发明内容本发明的目的在于克服现有技术存在的不足,提供一种准确有效地填补昆虫基因组物理图谱中裂缝的方法。实现本发明目的的技术方案是 一种填补昆虫基因组物理图谱中裂缝的方 法,包括(1) 将昆虫基因组中未知序列的上游或下游200 500 bp的碱基序列作为信 息探针,到NCBI网站的昆虫EST数据库中进行相似性检索;(2) 检索得到的相似性髙于95%的EST序列回到该昆虫EST数据库中进行 再检索,将检索得到的片段用DNASTAR软件进行拼接,形成的片段回到EST 数据库中继续检索,(3) 重复步骤(2),直至检出所有的重叠EST或重叠群不能继续延续为止;(4) 用DNASTAR软件将检索得到的所有EST序列拼接成一条完整的重叠群 片段;。)将上述拼接得到的完整的重叠群片段与裂缝中未知序列进行相似性比 对,检验所获片段序列的填补效果;(6) 根据所获重叠群片段的序列,设计特异引物;(7) 提取该昆虫的基因组DNA,以此为模板进行PCR扩增,通过PCR产物 的测序分析,进一步验证裂缝中碱基序列的准确性,完成裂缝未知序列的填补。所述的昆虫为蜜蜂或家蚕。本发明以昆虫基因组序列中未知序列(裂缝)侧翼的一段已知序列为信息 探针,以EST数据库为介质,釆用电子克隆技术对裂缝中的未知序列进行搜索 和拼接,并用PCR方法对裂缝序列进行测序和验证,与现有技术相比,具有简 便、快捷和准确的优点,它有效地填补了昆虫基因组物理图谱中残存的裂缝, 为进一步完善昆虫基因组数据库、描绘基因组精细图谱、有效解读基因密码提 供科学依据。


附图1为本发明技术方案的流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步描述实施例l:本实施例技术方案用以填补蜜蜂基因组物理图谱中裂缝,具体步骤如下 参见附图1,先搜索并下载蜜蜂基因组序列,裂缝位于蜜蜂16号染色体的 NW—001253149片段中,其特征是由151个N代替染色体碱基序列上的A、 T、 C、 G四种碱基,从60560位至60710位定名为1号裂缝,长度为151 bp。在网站(http:〃www. ncbi.nlm.nih.gov)下载蜜蜂16号染色体序列(序列 编号NW—001253149),找到1号裂缝位置,以裂缝右侧480bp碱基为信息探针。用信息探针在蜜蜂EST数据库中检索,获得3条与信息探针相似性较髙(959d 以上)的EST,用DNASTAR中配备的SeqMan软件将3条EST组装为1条重叠群;因该拼接片段的长度已覆盖1号裂缝,所以这重叠群即为最终的cDNA序列, 定名为重叠群"将重叠群1与裂缝所在的蜜蜂基因组序列进行相似性比对,获得裂缝序列。 其中151个碱基代替了裂缝中的全部N。实施例2:本实施例提供蜜蜂16号染色体中2号裂缝,参见附图l,具体填补方法如下 裂缝位于蜜蜂16号染色体的NW—001253149片段中,其特征是以50个N 代替染色体碱基序列上的A、 T、 C、 G四种碱基,从49808位至49857位定名为 2号裂缝,长度为50 bp。在网站(http://www. ncbi. nlm. nih. gov)下载蜜蜂16号染色体序列(序列 编号NWJJ01253149),找到2号裂缝位置,以裂缝右侧480bp碱基为信息探针。 用信息探针在蜜蜂EST数据库中检索,获得8条与信息探针相似性较髙(95% 以上)或有部分重叠的EST,用DNASTAR中配备的SeqMan软件将8条EST拼接 组装为重叠群l;再以重叠群1检索蜜蜂EST数据库,得到相似性较髙(95%以 上)的13条EST序列,拼接组装为重叠群2;重复上述过程,得到相似性较髙 (95%以上)的20条EST序列,组装得到重叠群3;反复进行EST重叠群序列的 拼接和比对,直至检出所有的重叠EST或重叠群不能继续延续,最终获得20条 EST序列,记作候选EST序列。将获得所有参与拼接组装的候选EST序列输入SeqMan软件中,拼接组装为重叠群4,即为最终的cDNA序列。将重叠群4与裂缝所在的蜜蜂基因组序列进行相似性比对,检验所获重叠群 4覆盖裂缝的效果。在重叠群4的3'和5'端设计2条特异性引物弓l物1: ATCGGATCCGCCATGGGTCGTAAATT;弓l物2: AGTCTCGAGTCACTGCTTAGCGTTAAC。提取蜜蜂DNA,以此为模板进行PCR。将PCR产物回收、纯化、重组、筛选和鉴定,对含有目的片段的质粒进行测序。将测序结果与拼接片段及含有未知序列的DNA片段进行相似性比对,将未 知序列补充完整。
权利要求
1、一种填补昆虫基因组物理图谱中裂缝的方法,其特征是(1)将昆虫基因组中未知序列的上游或下游200~500bp的碱基序列作为信息探针,到NCBI网站的昆虫EST数据库中进行相似性检索;(2)检索得到的相似性高于95%的EST序列,回到该昆虫EST数据库中进行再检索,将检索得到的片段用DNASTAR软件进行拼接,形成的片段回到EST数据库中继续检索;(3)重复步骤(2),直至检出所有的重叠EST或重叠群不能继续延续为止;(4)用DNASTAR软件将检索得到的所有EST序列拼接成一条完整的重叠群片段;(5)将上述拼接得到的完整的重叠群片段与裂缝中未知序列进行相似性比对,检验所获序列片段的填补效果;(6)根据所获重叠群片段的序列,设计特异引物;(7)提取该昆虫的基因组DNA,以此为模板进行PCR扩增,通过PCR产物的测序分析,进一步验证裂缝中碱基序列的准确性,完成裂缝未知序列的填补。
2、 根据权利要求l所述的一种填补昆虫基因组物理图谱中裂缝的方法,其 特征在于所述的昆虫为蜜蜂或家蚕。
全文摘要
本发明涉及一种昆虫的基因组DNA,特别涉及一种用电子克隆技术填补昆虫基因组物理图谱中未知序列的方法。它以昆虫(如蜜蜂、家蚕)基因组序列中裂缝(Gap)侧翼的一段已知序列为信息探针,昆虫EST数据库中的资源为介质,用电子克隆技术对裂缝中的未知序列进行搜索和拼接,并用PCR方法对裂缝中的未知序列进行验证,达到填补昆虫基因组DNA裂缝的目的,为进一步完善昆虫基因组数据库、有效解读基因密码提供科学依据。
文档编号C12N15/10GK101255414SQ20081002352
公开日2008年9月3日 申请日期2008年4月2日 优先权日2008年4月2日
发明者储荣华, 刘嘉琦, 君 周, 剑 徐, 楼程富, 袁红艳, 陆小平 申请人:苏州大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1