一种构建测序用dna文库的方法

文档序号:9642691阅读:825来源:国知局
一种构建测序用dna文库的方法
【技术领域】
[0001] 本发明属于分子生物学领域,具体涉及构建测序用DNA文库的方法、以及该构建 测序用DNA文库的方法在二代测序中的应用。
【背景技术】
[0002] 目前二代测序已经能够根据研究需求,应用于多个研究领域,比如基因组测序、外 显子测序、转录组测序、表观基因组测序、染色体三维结构测序等。二代测序的主流平台一 般均采用边合成边测序(Sequencing By Synthesis, SBS)技术进行核酸测序。测序前,需 要对核酸(DNA或RNA)样本进行测序文库的构建,基本流程如下:首先将片段化后的DNA进 行片段的末端修复,之后在修复后的片段3'端加"A"碱基,然后将上述DNA片段与含有测 序引物结合位点的DNA接头(Adapter)连接,最后通过PCR进行扩增,完成测序文库构建。
[0003] 在传统的建库及测序方法中,是每个样本进行一个PCR反应,然后再将这些PCR 扩增产物混合进行测序。例如,基于上述的建库及测序方法,Illumina公司推出了 DNA标 签(或称为Index、Barcode)建库方法和相应的文库构建试剂盒,例如TruSeqA DNA Kit、 TruSeq:k. DNA PCR-Free Kit、Tm每eq? Stranded RNA LT 等。在基于这些试剂盒的建库 及测序方法中,在测序前将不同标签标记的样本文库进行混合然后测序,测序完成后将测 序数据按照标签序列将样本数据进行区分。这样的建库及测序方法无疑会增加 PCR反应试 剂成本和人工成本。

【发明内容】

[0004] 鉴于上述现有技术中存在的不足,本发明的目的在于提供一种能够减少文库构建 试剂用量、降低测序人工成本的测序用文库构建方法,及该测序用文库构建方法在二代测 序中的应用。
[0005] 本发明的发明人为解决上述技术问题进行了深入研究,结果发现:通过使用本发 明人设计的标签接头,能够实现由每个样本进行一个PCR扩增反应变成多个样本共用一个 PCR扩增反应,从而减少文库构建试剂用量、降低测序人工成本。
[0006] 即,本发明包括:
[0007] 1. -种构建测序用DNA文库的方法,其包括:
[0008] 步骤A :分别将希望进行测序的多个样本中的DNA片段进行末端修复,得到多组平 末端DNA片段;
[0009] 步骤B :分别将所述多组平末端DNA片段进行3'端加 A,得到多组3'端加 A的DNA 片段;
[0010] 步骤C :分别将所述多组3'端加 A的DNA片段进行加接头,得到多组加接头DNA片 段;
[0011] 步骤D :将所述多组加接头DNA片段混合,得到混合物;以及
[0012] 步骤E :将所述混合物进行PCR扩增,得到扩增产物;
[0013] 其中,所述步骤C中,对于每一组3'端加 A的DNA片段,使用一个标签接头组进行 加接头,所述标签接头组由一个i5标签接头和一个i7标签接头组成,所述i5标签接头含 有选自SEQ ID NO: 1~380中的标签,所述i7标签接头含有选自SEQ ID NO: 1~380中的 标签;且对于每一组3'端加 A的DNA片段,使用不同的标签接头组。
[0014] 2.根据项1所述的方法,其中,所述多组加接头DNA片段为97组以上。
[0015] 3. -种测序用DNA文库,其是采用项1或2所述的构建测序用DNA文库的方法构 建的。
[0016] 4. -种测序方法,其中,以项3所述的测序用DNA文库作为对象进行测序。
[0017] 5.根据项4所述的测序方法,其中,所述测序利用Illumina平台进行。发明效果
[0018] 根据本发明,通过使用本发明人设计的标签接头,能够实现由每个样本进行一个 PCR扩增反应变成多个样本共用一个PCR扩增反应,从而减少文库构建试剂用量、降低测序 人工成本。
[0019] 发明的【具体实施方式】
[0020] 本说明书中提及的科技术语具有与本领域技术人员通常理解的含义相同的含义, 如有冲突以本说明书中的定义为准。
[0021] 首先,在一个方面中,本发明提供一种构建测序用DNA文库的方法,其包括:
[0022] 步骤A :分别将希望进行测序的多个样本中的DNA片段进行末端修复,得到多组平 末端DNA片段;
[0023] 步骤B :分别将所述多组平末端DNA片段进行3'端加 A,得到多组3'端加 A的DNA 片段;
[0024] 步骤C :分别将所述多组3'端加 A的DNA片段进行加接头,得到多组加接头DNA片 段;
[0025] 步骤D :将所述多组加接头DNA片段混合,得到混合物;以及
[0026] 步骤E :将所述混合物进行PCR扩增,得到扩增产物;
[0027] 其中,所述步骤C中,对于每一组3'端加 A的DNA片段,使用一个标签接头组进行 加接头,所述标签接头组由一个i5标签接头和一个i7标签接头组成,所述i5标签接头含 有选自SEQ ID NO: 1~380中的标签,所述i7标签接头含有选自SEQ ID NO: 1~380中的 标签;且对于每一组3'端加 A的DNA片段,使用不同的标签接头组。
[0028]






















[0052] 在本说明书中,为了记述方便,将SEQ ID NO: 1~380中的标签依次称作标签1~ 380,相应的i5标签接头称作i5标签接头1~380,相应的i7标签接头称作i7标签接头 1 ~380〇
[0053] 所述i5标签接头是在所述标签1~380的5'端加上用于与测序芯片上的序列匹 配的DNA序列、且在3'端加上用于与测序引物及标签测序引物匹配的DNA序列而构成的。 所述i7标签接头是在所述标签1~380的5'端加上用于与测序芯片上的序列匹配的DNA 序列、且在3'端加上用于与测序引物及标签引物匹配的DNA序列而构成的。
[0054] -个标签接头组由一个i5标签接头和一个i7标签接头组成。本发明中,对于每 一组3'端加 A的DNA片段,使用不同的标签接头组。所述"不同的标签接头组"是指两组 或多组标签接头组中的i5标签接头和i7标签接头至少之一各不相同,优选i5标签接头和 i7标签接头这两者均各不相同。在本说明书中,i5标签接头或i7标签接头各不相同是指 i5标签接头或i7标签接头的标签各不相同。
[0055] 通常,在各个标签接头组的所有i5标签接头之间,除了标签不同之外,其他部分 均是相同的;在各个标签接头组的所有i7标签接头之间,除了标签不同之外,其他部分也 均是相同的。
[0056] 在本发明的一个实施方式中,可使用的i5标签接头是分别在各个所述标签的5' 端加 AATGATACGGCGACCACCGAGATCTACAC、在 3' 端加 ACACTCTTTCCC TACACGACGCTCTTCCGATCT 而得到的;可使用的i7标签接头是分别在各个所述标签的5'端加 PhosGATCGGAAGAGCACA CGTC TGAACTC CAG TCAC、在 3' 端加 ATCTCGTATGC CGTC TTCT GC TTG 而得的。
[0057] 上述标签1~380是本发明人设计的全新标签,其设计主要考虑以下原则:
[0058] 1.考虑到标签序列之间的可识别性和识别率的问题,在设计标签时,保证了 Sbp 标签中,碱基差异须大于或等于3个碱基;
[0059] 2.考虑到序列合成或者测序中出现的错误率,因此在设计标签时避免标签8个碱 基中出现3个或3个以上的连续相同碱基;
[0060] 3.考虑到测序中,相同位置的ATGC 4个碱基的含量会影响到测序质量,在设计标 签时,保证标签混合后每个位点的GT与AC碱基的平衡。
[0061] 正如前述,在二代测序方法中,在测序前将不同标签标记的样本文库进行混合然 后测序,测序完成后将测序数据按照标签序列将样本数据进行区分。但是,现有的标签序列 十分有限。例如,TruSec]? HT Sample pr印Kits采用6bp标签序列,只有24种标签;而 TruSeqk HT Sample Pr印Kits采用双标签设计,i5标签有8个,i7标签只有12个,总共 也只有96种组合。也就是说,对于超过96种的样本,由于标签数量的限制,现有技术不可 能将其混合测序,然后按照标签序列将样本数据加以区分。与此相对,采用本发明人全新设 计的380种i5标签与380种i7标签,可以提供高达144400种组合,完全可以满足对大数 目量样本进行混合测序的需要。因此,在本发明的构建测序用DNA文库的方法中,所述多组 加接头DNA片段可以为97组以上,例如为100组以上,再例如为200组以上,再例如为300 组以上,再例如为400组以上,再例如为500组以上,最多可达144400组;此外,从便于实际 操作的角度考虑,可以为2000组以下,例如为1000组以下,再例如为500组以下,再例如为 400组以下。
[0062] 优选地,在本发明的构建测序用DNA文库的方法的各个步骤之间例如步骤A与步 骤B之间、步骤B与步骤C之间、步骤C与步骤D之间、步骤D与步骤E之间,和/或在步骤 E之后可
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1