测定dna序列的方法

文档序号:547499阅读:9359来源:国知局
专利名称:测定dna序列的方法
技术领域
本发明涉及的是一种测定DNA序列的方法,属于生物信息测试技术领域。
DNA序列测定及分析是人类基因组工程的重要一环。目前使用的DNA序列分析法是双脱氧法,基本原理是将特异的引物与待测DNA配对,在含有双脱氧核苷酸的脱氧核苷酸混合物存在下,DNA聚合酶对待测DNA复制并在特异的位点终止,然后用变性聚丙烯酰胺凝胶电泳方法分离。实验中用放射性同位素或荧光染料示踪,这种方法较为繁琐。申请号95197574.9“用于DNA测序和DNA鉴定的方法和装置”,该专利基于尼龙膜上的DNA样品矩阵,而探针储存于多孔板,根据其权利要求1中所描述的方法,需重复从给定长度的一套不完全探针中选择探针,而且必须重复进行杂交,以获得数据拟合所需信息,每一循环都要进行探针筛选,这给实际使用者带来难度,实施过程中的步骤较复杂。
本发明的目的在于克服现有技术中的不足,提供一种测定DNA序列的方法。
本发明的技术方案及其实施情况如下将A、C、G、T构成的长度为L的所有组合的寡核苷酸片段固定于DNA芯片上,序列待测的DNA片段是荧光标记的一组长度为L,连接位点处的nz个核苷酸是已知的随机片段,同时与DNA芯片一起保温,进行DNA配对,与待测DNA序列配对的寡核苷酸片段被连接起来,反应后清洗DNA芯片,然后用扫描仪检测,可以获得待测DNA片段中各种序列出现的频率,可以反推出待测DNA片段的核苷酸序列。
DNA芯片的结构芯片的总寡核苷酸探针点数n=4Lxy,在一个二维构成的芯片平面,可以在X、Y轴上各选择4nx,4ny个点,并满足下列条件4nx×4ny=4Lxy,DNA芯片就可实现序列展开和反演。
寡核苷酸探针被连接已知核苷酸片段序列长度为L,但只有连接点的nz个核苷酸是已知的荧光标记的寡核苷酸片段。其已知的种类由连接位点已知核苷酸的数目决定。连接位点已知核苷酸是1个时,就只有4种。连接位点已知核苷酸是2个时,就有16种,连接位点已知核苷酸是nz个时,就有4nz种。待测DNA段与DNA芯片发生各种配对连接反应,信息总量是一种X、Y、Z轴构建的立体结构,其中可包含的序列总量是N=4nx×4ny×4nz种,而每种寡核苷酸片段序列(此时的长度为L=Lxy+nz)在这种三维结构中有一个特定的位置。
DNA序列是由ATCG四个编码构成的生命信息序列,对于长度为L的序列,其ATCG全组合的总数是n=4L。这样任何一个DNA序列,其长度为L的片段,必定是n=4L全排列中的一个。这样,任何一DNA序列都可用长度为L的ATCG全组合片段来描述,称之为序列展开。当长度为L的序列的ATCG全组合集合作为探针固定于DNA芯片,就可用DNA芯片实现序列展开。通过逆向过程,可推算出待测样品的序列,称之为序列反演。
把一长度为L的ATCG全组合集合作为探针固定在DNA芯片上,通过DNA配对原则(A-T,C-G),待测DNA样品序列的片段与芯片上的DNA探针匹配,并携带荧光标记。然后,用扫描器对与样品作用过的DNA芯片进行扫描检测。就可获得DNA芯片上的荧光点的分布模式,这一分布模式,按四进制方式在芯片上进行位置编码。但由于DNA芯片的信息是平行处理,从DNA芯片上测得的荧光分布模式不能确定与探针匹配的片段在整个样品序列中的位置,这样就必须用递推的方法。从已知的核苷酸片段开始,逐个片段递推。由于每个片段的下一个递推片段存在四个可能性,所以,递推的结果不是唯一的。递推结果的个数取决于探针的长度和样品序列的长度,及样品序列内在的简并性。但递推结果必有一个是实际待测样品序列。仿真实现如下根据上述序列展开及反演技术,采用长度为11的寡核苷酸序列的ATCG全组合作为DNA芯片的DNA探针。根据n=4L,则共有4194304个DNA探针,采用三维立体阵列排列方法,把DNA探针排列如下256(X方向)×256(Y方向)×64(Z方向)制成64块256×256点阵的DNA探针阵列芯片。用计算机仿真了长度为2~5Kb待测样品序列结果。验证了本发明的技术方案。本发明比现有方法具有实质性特点和显著进步,本发明具有明显的优点。如1.操作简单。该方法只需简单的分子杂交、DNA片段连接操作,其余的工作都是用扫描仪和计算机完成。
2.节省时间。分子杂交和DNA片段连接所需的条件很变通,一个人可以同时操作很多样品。而扫描所需的时间只需几分钟完成。样品序列的逆推反演完全由计算机完成。在133MHz个人计算机上应用本发明方案所给出的逆推反演技术,可以在1~2小时内给出结果。
3.信息量大。长度为Lxy+nz的寡核苷酸种类是4Lxy+nz种。当Lxy+nz=11时,可较快地测定出5Kb左右的序列。而常规的DNA分析方法一次只能确定1Kb左右DNA序列。
4.节省费用。大量芯片的使用将使芯片的价格大幅度降低。由于芯片一次性可以确定较长片段的核苷酸序列,因此平均单个核苷酸所需的费用就会大大降低。
权利要求
1.一种测定DNA序列的方法,其特征在于将A、C、G、T构成的长度为L的全组合寡核苷酸片段固定于DNA芯片上,序列待测的DNA片段是荧光标记的一组长度为L,待连接点处的nz个核苷酸是已知的随机片段,同时与DNA芯片一起保温,进行DNA配对,与待测DNA序列配对的寡核苷酸片段被连接起来,反应后清洗DNA芯片,然后用扫描仪检测,可以获得待测DNA片段的各种匹配片段序列出现的频率,根据这种频率可以反推出待测DNA片段的核苷酸序列。
2.根据权利要求1所述的测定DNA序列方法,其特征还在于芯片的总寡核苷酸探针点数n=4Lxy,在一个二维构成的芯片平面,可以在X、Y轴上各选择4nx,4ny个点,并满足下列条件4nx×4ny=4Lxy,DNA芯片就可实现序列展开和反演。
全文摘要
本发明将A、C、G、T构成的长度为L的全组合寡核苷酸片段固定于DNA芯片上,序列待测的DNA片段是荧光标记的一组长度为L,待连接点处的nz个核苷酸是己知的随机片段,同时与DNA芯片一起保温,进行DNA配对,与待测DNA序列配对的寡核苷酸片段被连接起来,反应后清洗DNA芯片,然后用扫描仪检测,可以获得待测DNA片段的各种匹配片段序列出现的频率,根据这种频率可以反推出待测DNA片段的核苷酸序列。
文档编号C12Q1/68GK1272551SQ0011538
公开日2000年11月8日 申请日期2000年4月13日 优先权日2000年4月13日
发明者王庆康, 刘建华, 林志新, 刘燕刚 申请人:上海交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1