鉴定宿主基因组中hbv基因整合位点和重复靶基因的制作方法

文档序号:518744阅读:501来源:国知局
鉴定宿主基因组中hbv基因整合位点和重复靶基因的制作方法
【专利摘要】本发明公开了一种新颖的大规模锚定并行测序技术,其可用于分离和测序整合序列、从而鉴定宿主基因组中HBV基因整合的重复靶基因;本发明还公开了用于实施该技术的试剂盒;本发明还公开了6个新的被HBV重复整合的基因、以及相关的试剂盒。
【专利说明】鉴定宿主基因组中HBV基因整合位点和重复靶基因
【技术领域】
[0001]本发明涉及一种新颖的大规模锚定并行测序技术(massive anchored parallelsequencing,MAPS),其可用于分离和测定HBV基因整合序列(即,整合子,integrant)、从而鉴定宿主基因组中HBV的基因整合位点和整合靶基因(targeted genes);本发明还涉及用于实施该技术的试剂盒;本发明还涉及利用该技术确定的被HBV重复整合的(recurrentlyintegrated)基因、以及这些基因的用途。
【背景技术】
[0002]乙肝病毒(hepatitis B virus, HBV)的长期感染可以引起一系列肝脏疾病,包括慢性肝炎、肝硬化以及肝细胞癌(hepatocellular carcinoma, HCC)。全世界大约有20亿人受到HBV感染,其中3.5亿为慢性感染。HBV感染每年造成50万-120万人死亡,其中32万由HCC引起(Parkin2006)。很多流行病学研究发现,HBV慢性感染与HCC的发生发展存在因果关系(Szmunessl978)。由HBV引起的HCC中,约85-90%发现了 HBV整合片段和游离的 HBV 基因组(Murakami, Saigo et al.2005)。
[0003]大部分HBV相关的HCC中都发现了乙肝病毒DNA整合到宿主细胞的染色体上。在HCC的发生发展中,HBV基因整合的 作用复杂,机理尚未完全明晰。HBV整合发现于宿主基因组的各个染色体上(Tokino and Matsubaral991)。这些整合可能导致染色体的改变、基因组的不稳定,或者改变人类基因的表达水平。HBV整合被认为与染色体脆弱位点或者重复序列相关,并在整合后导致局部的重组,因而使基因组变得更加不稳定(Feitelson andLee2007)。
[0004]病毒基因整合入宿主细胞基因组中引起整合靶基因形成诱发癌化的功能,是病毒感染引发癌症的经典机制。HBV插入的目标基因包括RARB (Garcia,de The et al.1993)和CCNA2 (Wang,Zindy et al.1992),整合后产生融合的原癌蛋白引起癌发生。类似的HBV整合激活祀基因癌化功能形成的报道还包括甲轻戍酸激酶(MK) (Graef,Caselmann etal.1994 ;Graef, Caselmann et al.1995),羧妝酶N(CPN2) (Pineau,Marchio et al.1996),肌质网/内质网钙蛋白(SERCA) (Chami,Gozuacik et al.2000)和端粒酶逆转录酶(TERT)(Horikawa and Barrett2001)。然而,上述基因中除了 TERT外,其余靶基因整合还没有被发现在其它HCC患者中重现。
[0005]随着新一代测序技术的发展,全基因组测序已被用来研究全基因组范围内的HBV整合事件。Sung等人利用Illumina PE测序对81个HBV阳性的HCC样本进行超过30倍覆盖率的全基因组测序,根据2对测序结果同时比对上hgl9和HBV的临近序列为整合位点认定标准,他们发现了 399个HBV整合事件,平均每个病人4.9个整合,其中重复整合的靶基因有TERT (整合次数η = 18,即发现该基因在所有样本中被HBV整合18例)、MLL4 (η = 9)、FNl(η = 5)、CCNEl(η = 4)、SENP5(n = 3)和 ROCKl(η = 2)(Sung,Zheng et al.2012)。在另一篇最近的报道中,Jiang等人利用Complete Genomics测序技术以超过80倍的测序覆盖分析了 3位HBV-HCC病人的基因组,鉴定到255个HBV整合位点,平均每个病人为64个整合事件,但没有发现重复整合IE基因(Jiang, Jhunjhunwala et al.2012)。Fujimoto等利用IlluminaPE测序在11例HBV相关的HCC样本中进行40倍覆盖率的全基因组测序,发现23个整合位点,其中一个重复整合靶基因TERT (n = 4) (Fujimoto, Totoki et al.2012)。
[0006]但是,全基因组测序耗费较为高昂,多样本测序则更甚。大部分整合位点的分析工作主要通过特异地富集整合序列后再测序,即先使用PCR扩增整合相关序列。许多PCR方法包括 Alu-PCR(Minami,Poussin et al.1995)、LM-PCR(Tamori,Yamanishi et al.2005)和RS-PCR(Ferber,Montoya et al.2003)都曾用于HBV整合子的分离,分离后再用Sanger法测序。但是,这些方法都有技术性缺陷(即,只能分离局限于基因组某些部位的整合位点),并受限于有限的测序通量无法识别更多的整合位点。因此HBV病毒的整合分析需要一种全新设计的扩增、测序方案,要求其不仅可快速地、全面(在全基因组水平)和特异性地鉴定HBV病毒的整合,同时更具经济性,以便用于常规的肝癌临床检测。
[0007]耶¥中包含多种蛋白,比如耶1、耶8、耶6、耶(3等。其中,HBx是HBV中的X蛋白,由HBV ORF中最小的X基因(即HBX基因)编码,包含154个氨基酸,分子量为16.5kDa,是个多功能调控蛋白,具有细胞和病毒调控作用,在HBV的复制和转录中发挥重要作用。HBx是整合并保留在宿主基因组中最常见的病毒基因(Unsal H,Yakicier C,Marcais C,KewM, Volkmann M, Zentgraf H et al.(1994).Genetic heterogeneity of hepatocellularcarcinoma.Proc Natl Acad Sci USA 91:822-826.)。因此 HBx 蛋白及其编码基因一HBX基因的检测对于肝癌的预测、诊断、治疗而言意义重大。

【发明内容】

[0008]为了进一步改进新一代测序技术,提高测序通量,并提高HBV基因整合分析的全面性、准确性和分析效率,本发明人将连接介导的PCR技术(ligation-mediated PCR,LM-PCR)中使用的接头(adapter)和Illumina的双末端(paired-end,简称PE)测序中使用的接头进行组合,结合基因组步移(genome walking)技术,并结合DNA条形码(DNAbarcode)的应用,开发出一 种大规模锚定并行测序技术(massive anchored parallelsequencing, MAPS)来分离和测序整合序列,并针对HBV与人类基因组的整合特点来设计MAPS所需的特定巢式引物,实现HBV整合序列扩增和高通量测序。与之相适应地,开发出一套数据分析流程,借此从测序数据中发现可信的、确定的HBV整合位点。通过该技术,本发明人还开发了用于分离和鉴定肝脏组织(癌,癌旁或正常组织)或血液(游离细胞或DNA)中HBV整合位点的试剂盒。通过MAPS,本发明人发现了 286个HBV整合位点,8个HBV重复整合靶基因。其中,6个基因为新的重复靶基因。毫无疑问,这些新发现的重复靶整合基因或基因位点可用于开发肝癌病人的分子分型试剂盒和肝癌治疗药物的开发。
[0009]因此,本发明的第一个目的在于提供一种用于分离和鉴定宿主基因组中HBV基因整合位点的大规模锚定并行测序技术(MAPS),其包含如下步骤:
[0010]I)从样品中提取基因组DNA ;
[0011]2)将步骤I)所得基因组DNA随机片段化;
[0012]3)使步骤2)所得DNA片段两端与步移接头相连接,构建基因组步移文库;
[0013]4)以步骤3)制备的基因组步移文库为模板,利用步移接头特异引物和HBV特异引物进行PCR扩增,得到整合子序列;[0014]5)以步骤4)所得整合子序列为模板,通过PCR反应引入与高通量测序平台兼容的接头序列,制备高通量测序文库;
[0015]6)对步骤5)所得测序文库进行高通量多元测序分析;
[0016]7)进行生物信息学分析,发现HBV整合位点。
[0017]为实施这些步骤,本发明的第二个目的在于提供一种用于MAPS的引物一PE2步移接头(PE2Walking Adapter),其包含:
[0018]序列为
[0019]5,-CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTNNNNNN*T**-3,(SEQ ID N0.1)的 PE2 接头(PE2Adapter),和
[0020]序列为5,-#P04-NNNNNNAGATCGGAAGAGCGAGCACATCCCTTTCTCACA-3,(SEQ ID N0.2)的步移接头2,
[0021 ] 其中,SEQ IDN0.1中的NNNNNN和SEQ IDN0.2中的NNNNNN都是6个核苷酸碱基(6nt)的、并且相互互补的DNA条形码;
[0022]*是指3’端最末两个喊基之间用硫代憐酸酷键修饰;
[0023]**此处T是外伸或称悬垂(overhang),与基因组DNA片段修复后的A外伸互补;
[0024]#P04-是指5’端磷酸化修饰;
[0025]SEQ ID N0.1 中包含序列为 5’_CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCT-3’ (SEQ ID N0.3)的双末端引物之一 PE2,而该PE2中包含前后相邻的序列为 5’ -CAAGCAGAAGAC-3’ (SEQ ID N0.4)的 PE2.1 和序列为 5’ -GGCATACGAGATCGGTCTCGGCATTCCTGCTGAACC-3’ (SEQ ID N0.5)的 PE2.2 ;
[0026]由于SEQ ID N0.1 中在靠近 3’端的部分序列 5’-GCTCTTCCGATCTNNNNNN-3’与 SEQID N0.2中在靠近5’端的部分序列5’ -NNNNNNAGATCGGAAGAGCG-3’互补配对,使得由长链SEQ ID N0.1与短链SEQ ID N0.2组成的PE2步移接头呈“Y”形。
[0027]优选地,SEQID N0.1 中的 DNA 条形码 5’ -NNNNNN-3’ 选自下组:ACATCG、GCCTAA、TGGTCA、CACTGT、ATTGGC、GATCTG、TCAAGT、CTGATC、AAGCTA、GTAGCC、TACAAG、CGTGAT、AGAAGC、GTTCCG ;与上述条形码标签——对应地,SEQ ID N0.2中的DNA条形码5,-NNNNNN-3,分别选自下组:CGATGT、TAGGC、TGACCA、ACAGTG、GCCAAT、CAGATC、ACTTGA、GATCAG、TAGCTT、GGCI AC、CTTGIA、ATCACG,GCTTCT,CGGAACo
[0028]另一种用于大规模锚定并行测序技术的引物一PE1,其序列为:5’ -AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’ (SEQ ID N0.6)。
[0029]另一种用于大规模锚定并行测序技术的引物一PEl-Barcode-HBX2,其序列为:5’ -CACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNACTTCGCTTCACCTCTGCACGT-3’ (SEQ IDN0.7)。
[0030]该序列SEQ ID N0.7中包含具有5个核苷酸碱基(5nt)的DNA条形码NNNNN、和序列为 5’ -ACTTCGCTTCACCTCTGCACGT-3’ (SEQ ID N0.8)的 HBX 二次 PCR 引物 IIBX2。
[0031]优选地,SEQID N0.7 中的 DNA 条形码 5’ -NNNNN-3’ 选自下组:AACCG、AACGA,AACTC、AAGCT、CCAAT、CTCTG、CTGGA、CTTCG、GCGTA、GGACT、GGTAA、TCGTC、TCTGC、TGAGC。
[0032]另一种用于大规模锚定并行测序技术的引物一HBX1,其序列为:5’ -TCTCATCTGCCGGACCGTGT-3’ (SEQ ID N0.9)。[0033]当上述这些引物用于本发明的大规模锚定并行测序技术时,上述步骤2)至7)具体包括:
[0034]2)将DNA片段化,比如进行超声片段化,优选经超声破碎而得到大致在IOObp到1000bp之间的DNA片段;
[0035]3)构建基因组步移文库,包括修复DNA片段末端、DNA平末端加单核苷A外伸或称悬垂(overhang)、与PE2步移接头相连接、纯化DNA ;
[0036]4)扩增整合子序列,包括:以步骤3)制备的基因组步移文库为模板,以PE2.1为一端引物、HBXl为另一端引物,进行第一轮HBX基因侧翼扩增;以第一轮HBX基因侧翼扩增得到的文库为模板,以PE2.2为一端引物、以PEl-Barcode-HBX2为另一端引物,进行第二轮HBX基因侧翼扩增,得到整合子序列;
[0037]5)制备双端测序文库,包括:以第二轮巢式PCR扩增得到的整合子序列为模板,以PE2为一端引物、以PEI为另一端引物,通过PCR进行富增,借此导入11 lumina PE测序的全长接头序列,得到双端测序文库;
[0038]6)制备阴性对照的文库,以便更好地评估MAPS方法,包括制备如下两种阴性对照:一个是来自于HBV阴性个体的基因组DNA (即没有HBV的DNA);另一个是纯化的HBV基因组DNA与人类基因组DNA的简单混合物(没有与之整合),优选该混合物中HBV DNA和人类DNA可通过现有技术的常 规的DNA检测手段进行定性和/或定量;
[0039]7) Illumina双端多元测序分析;
[0040]8)生物信息学分析,包括:序列去多元化;通过两个方向的读序Readl (读序I)和Read2 (读序2)进行序列比对,识别整合位点;筛选鉴定出包含由2对以上双端序列支持的HBV基因整合位点,作为可信的(即确定的)HBV基因整合位点;
[0041]9) PCR验证和Sanger测序验证,包括:通过巢式PCR、电泳鉴定和Sanger法测序,确定宿主基因组DNA与HBV基因的整合。
[0042]优选地,所述宿主是人。
[0043]优选地,分离HBV整合序列的引物位于HBX基因上。
[0044]为了实施本发明的大规模锚定并行测序技术,本发明的第三个目的在于提供一种用于检测HBV DNA整合入宿主基因组DNA、尤其是包含HBV中HBX基因的整合位点的试剂盒,其包括选自下组的PCR引物:PE2步移接头、PE2(SEQ ID N0.3)、PE2.1 (SEQ ID N0.4),PE2.2(SEQ ID N0.5),PEI (SEQ ID N0.6)、PEl-Barcode_HBX2(SEQ ID N0.7)、HBX2(SEQ IDN0.8)、HBXl (SEQ ID N0.9)。
[0045]HBV整合于人类基因组的位置是随机的。大部分整合事件与肝癌的发生、发展并无联系;但是有一部分整合事件在不同的肝癌患者中具有重现性(重复靶基因)。因此,检测这些重复靶基因可以用于肝癌的诊断和分子分型,或开发靶向疗法。Sung等发现肝癌组织中HBV整合位点的数量与肝癌患者的生存期有关,整合位点数量多的病人生存期较短(Sung, Zheng et al.2012)。因此,HBV整合位点的检测可以用于评估肝癌的预后。
[0046]换句话说,除了用于科学研究比如整合位点、(重复)靶基因筛查之外,本发明的MAPS还具有用于肝癌诊断和预后的潜在用途。
[0047]因此,本发明的第四个目的在于提供用于肝癌检测和评估的试剂盒,其包括选自下组的 PCR 引物:PE2 步移接头、PE2 (SEQ ID N0.3)、PE2.1 (SEQ ID N0.4), PE2.2 (SEQID N0.5)、PEl (SEQ ID N0.6)、PEl-Barcode-HBX2 (SEQ ID N0.7)、HBX2 (SEQ ID N0.8)、HBXl (SEQ IDN0.9)。
[0048]优选地,所述宿主基因选自下组:TERT、FN1、ARHGEF12、CYP2C8、PHACTR4、PLXNA4、RBFOXl、SMAD5、MLL4、CCNEl、SENP5 和 ROCKl。
[0049]类似地,本发明的还提供了另一种试剂盒,其可以用于肝癌治疗药物的开发和制备、肝癌检测试剂的开发和制备、肝癌检测试剂盒的开发和制备。其包括至少一种选自下组的 DNA 片段:SEQ ID N0.10、SEQ ID N0.11、SEQ ID N0.12、SEQ ID N0.13、SEQ ID N0.14、SEQ ID N0.15,SEQ ID N0.16,SEQ ID N0.17,SEQ ID N0.18,SEQ ID N0.19,SEQ ID N0.20、和 SEQ ID N0.21 ;以及选自下组的 PCR 引物:PE2 步移接头、PE2 (SEQ ID N0.3)、PE2.1 (SEQID N0.4)、PE2.2 (SEQ ID N0.5)、PEl (SEQ ID N0.6)、PEl-Barcode-HBX2 (SEQ ID N0.7)、HBX2(SEQ ID N0.8)、HBXl (SEQ ID N0.9)。 [0050]本发明的大规模锚定并行测序法是对新一代高通量测序技术的进一步改进,可以高效地、经济地筛选人类基因组中乙肝病毒的基因整合位点。比如,通过对40对乙肝病毒相关的肝癌组织(癌组织和癌旁组织)进行MAPS分析,发现了 286个确定的HBV和人类DNA整合序列信息的整合位点。本发明人还发现了 6个新的乙肝病毒重复整合靶基因,极大地拓展了目前已知重复靶基因的列表,大大增加了已知HBV重复靶基因的数量。
[0051]本发明的MAPS对于HBV病毒整合分析的特异性高,并可抑制不含整合位点的基因组片段的扩增,规避了一些其他方法包括限制性内切酶方法对整合位点序列扩增的偏好性,减少了假阳性,从而提高了 HBV病毒整合检测的准确性。相对通过全基因组测序来分析HBV整合位点,同样的测序通量MAPS可以分析更多的样本(200-300倍),因而更快速、更经济,可用于常规的临床检测。
【专利附图】

【附图说明】
[0052]图1是大规模锚定并行测序技术的流程示意图。图1A是两个带有DNA条形码标签的引物一PE2步移接头和PEl-Barcode (条形码)-HBX2的结构图,PE2步移接头中由于长链的PE2接头在6nt的条形码一端与短链的步移接头2靠近6nt的条形码一端存在部分序列互补配对而呈“Y”形。图1B是利用MAPS对HBV的基因整合位点进行分离和鉴定的流程图,其中扩增的序列(文库)中浅色部分代表DNA条形码标签(barcode)。图1B的右下侧代表引物之间相互配对导致不含整合位点的基因组片段受到抑制而不被扩增。
[0053]图2是通过MAPS得到的整合结果。图2A是在整合位点处来自MAPS的成对读序的基因比对图(mapping),第I端序列即读序I (Readl)被锚定,因为它们是从固定的HBX巢式引物延伸的;第2端序列即读序2 (Read2)的位置由于随机的DNA片段化而有所不同。图2B是在UCSC基因组浏览器中显示的插入位点,其中chr是染色体(chromosome)的缩写,(i)插入ERBB4,(ii)插入GRMB。图2C是ERBB4和GRMB的整合子序列,断裂点(breakpoint)用箭头显示,数字是基于GQ205441参照的HBV基因组坐标,人类基因组序列用下划线表示,浅色的碱基“GC”表示在连接处HBV基因组和人类基因组之间的共有碱基。图2D是ERBB4和GRMB整合的文库序列中的整合长度分布图。
【具体实施方式】[0054]以下结合实施例,对本发明的技术方案做详细描述。
[0055]定义
[0056]术语“整合”、“插入”,或称“基因整合”(integration,或insertion)是指外来的DNA分子插入到宿主基因组DNA (genomic DNA)中的过程,主要包括转座子(transposon)、逆转录病毒(retrovirus)、逆转录基因治疗载体(retrovirus therapeutic vector)等在自然或人工过程中的整合行为。HBV在感染过程中能够自发的整合到人类肝细胞的基因组中。
[0057]术语“整合位点”,或称“插入位点”是指乙肝病毒HBV的DNA与人类基因组DNA序列的整合之处,数字化地表示为基因组对应染色体上的坐标值。
[0058]术语“巢式(nest) ”,或称“巢式PCR”是指一种变异的聚合酶链反应(PCR),使用两对(而非一对)PCR引物扩增完整的片段。第一对PCR引物扩增片段和普通PCR相似。第二对引物称为巢式引物(因为它们在第一次PCR扩增片段的内部)结合在第一次PCR产物内部,使得第二次PCR扩增片段短于第一次扩增。巢式PCR的好处在于,如果第一次扩增产生了错误片断,则第二次能在错误片段上进行引物配对并扩增的概率极低。因此,巢式PCR的扩增非常特异。
[0059]在Illumina公司平台的第二代高通量测序中,也应用类似巢式PCR的原理,进行目的片段的扩增。首先在目的片段通过TA末端连接,引入一个片段,然后在特定的一个FlowCell固定大量的特异 探针,通过PCR反应的特异性,扩增目的片段,然后继续应用于下一步测序。巢式PCR可以在10的六次方基因组背景下检测到一个拷贝的病毒基因。
[0060]术语“连接介导的PCR 技术(ligation-mediated PCR, LM-PCR) ” 是指 DNA 连接酶的接头(adapter)序列和目的基因内部的已知序列介导的PCR,可以扩增已知序列上游的未知序列。其方法就是先用DNA内切酶消化基因组DNA,但目的基因内部不含有所用内切酶的酶切位点,然后通过DNA连接酶将DNA接头与切割过的DNA5’磷酸化末端非特异性连接,以目的基因的特异序列为引物1,以接头序列为引物2进行PCR扩增。该方法可用于基因组足迹分析和测序。
[0061]术语“双末端(paired-end,简称PE) ”是指Illumina测序中使用的技术,双末端(PE)测序就是大片段末端测序,将基因组随机打断成固定范围大小(如5kb、10kb)的片段建成文库,对文库片段的两端进行测序。PE测序有利于拼接,大基因组、转录组的de novo和re-sequencing都要用到。
[0062]术语“基因组步移(genome walking) ”是一种重要的分子生物学研究技术,使用这种技术可以有效获取与已知序列相邻的未知序列。其原理是:从第一个重组克隆插入片段的一端分离出一个片段作为探针从文库中筛选第二个重组克隆,该克隆插入片段含有与探针重叠顺序和染色体的其他顺序。从第二个重组克隆的插入片段再分离出末端小片段筛选第三个重组克隆,如此重复,得到一个相邻的片段,等于在染色体上移了一步,故称之为基因组步移。
[0063]术语“接头(adapter)”是指一段已知序列的短DNA链,其连接于待扩增序列的两端,用于对特异性片段进行预扩增和选择性扩增。由于PCR对引物的5’端(在一定长度的完全配对的引物顺序后)的顺序有很大的容忍性,因此可以在PCR引物的5’端引入“接头”序列,以便对生成的PCR产物进行特定的修饰。比如,进行PCR时,引物设计5’端引入酶切位点“接头”序列,这样PCR扩增出来的产物就在两端含有酶切位点,可以进行酶切,以方便后续处理如克隆等。在某些PCR比如反向PCR、RT-PCR、连接接头法、LM-PCR、巢式PCR等对于接头序列有特定的设计。好的“接头”序列的设计是一些特定PCR方法和DNA样品处理试剂盒(如二代测序样品制备试剂盒)的关键。Illumina和Life Technologies公司都有有专利保护的“接头”序列设计。有时,为简要目的,本申请中“接头”、“引物”、“接头引物”可以彼此混用。
[0064]为直观和简要起见,本申请中,将Illumina测序中使用的一对双末端接头引物之一称为PE1,另一个称为PE2。
[0065]其中,PE2可被分解为前后相邻的PE2.1和PE2.2,它们先后在不同的PCR中作为引物。
[0066]类似地,在扩增含有、或怀疑含有HBV基因的序列时,使用的一端引物中用于第一轮的引物被称为HBXI,用于第二轮的引物被称为HBX2。
[0067]术语“DNA条形码标签”、“DNA条形码”、“条形码”、“条形码标签”、“barcode ”、“Barcode”的意义相同,比如是指PE2接头(SEQ ID N0.1)中的6nt条形码、步移接头2 (SEQID N0.2)中的6nt 条形码、或者PEl-Barcode-HBX2(SEQ ID N0.7)中的 5nt 条形码Barcode。在本发明的MAPS中,条形码被整合在扩增的序列文库中作为可被识别的标签或标记(标志)。
[0068]术语“第二代测序技术”又称为“下一代测序技术”(Next-generationsequencing, NGS),是一种高通量测序技术(High-throughput sequencing),能一次并行对几十万到几百万条DNA分子进行序列测定,一般读长较短。根据发展历史、影响力、测序原理和技术不同等,主要有以下几种:大规模平行签名测序(MassivelyParallel Signature Sequencing, MPSS)、聚合酶克隆(Polony Sequencing)、4δ4 焦憐酸测序(454pyrosequencing)、Illumina (Solexa) sequencing、离子半导体测序(1nsemiconductor sequencing)、DNA 纳米球测序(DNA nanoball sequencing)、CompleteGenomics的DNA纳米阵列与组合探针锚定连接测序法等。该测序技术使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(de印sequencing)。
[0069]术语“去多元化”是指利用测序结果中的Barcode (条形码)来区别物理上混合在一起的不同组织的DNA读序,最终区分HBV整合位点所属的组织。
[0070]术语“靶基因”是指在HBV整合位点固定范围内(如上下游IOkb)存在注释(annotation)的人类基因。
[0071]术语“重复整合靶基因”或“重复靶基因”是指在一次或多次的分析研究中,在样本群的不同病人中发现的相同的靶基因。换言之,是具有重现性的靶基因。不同病人中出现相同的靶基因被HBV整合,其对应的整合位点可以是不同的,即整合发生在相同靶基因的不同位置。
[0072]本发明的组成 成分
[0073]本发明将连接介导的PCR技术和Illumina的双末端测序的接头进行整合,汲取成熟的基因组步移研究中关于接头序列设计的精华(Jeung,Cho et al.2005),引入了引物条形码设计,以Illumina PE接头为蓝本设计了符合大规模、高效率的测序要求的接头序列。新设计的Y形PE2步移接头两个单链SEQ ID N0.1和SEQ ID N0.2部分互补,并在平末端具有一个T外伸(overhang,或称悬垂)(图1A)。
[0074]其中,在引物设计中引入DNA条形码是为了使MAPS分析效率更高,用于多样本分析。具体来说,长为6个核苷酸的条形码(附带有T外伸)通过PE2步移接头被导入。双端测序第I端序列(Readl)上的长为5个核苷酸的条形码经第二轮PCR由携带此条形码的引物而被引入受测序列。
[0075]本发明中所用的引物见表1。
[0076]表1.HBV整合位点MAPS实验引物
[0077]
【权利要求】
1.一种用于分析HBV整合位点的大规模锚定并行测序技术,其包含如下步骤: 1)从样品中提取基因组DNA; 2)将步骤I)所得基因组DNA随机片段化; 3)使步骤2)所得DNA片段两端与步移接头相连接,构建基因组步移文库; 4)以步骤3)制备的基因组步移文库为模板,利用步移接头特异引物和HBV特异引物进行PCR扩增,得到整合子序列; 5)以步骤4)所得整合子序列为模板,通过PCR反应引入与高通量测序平台兼容的接头序列,制备高通量测序文库; 6)对步骤5)所得测序文库进行高通量多元测序分析; 7)进行生物信息学分析,发现HBV整合位点。
2.如权利要求1所述的大规模锚定并行测序技术,其特征在于,所述基因组是人的基因组。
3.如权利要求1所述的大规模锚定并行测序技术,其特征在于,所述基因组DNA选自下组:TERT、FN1、ARHGEF12、CYP2C8、PHACTR4、PLXNA4、RBFOXl、SMAD5,所述基因与 HBV 发生整合的区域选自:外显子、内含子、或启动子中IOkb以内的序列,和基因3’端IOkb以内的序列,并且这些基因编号是GenBank中的Refseq编号。
4.如权利要求1所述的大规模锚定并行测序技术,其特征在于,所述样品选自下组:肝脏组织、肝脏周围组织、全血、血浆、血清、尿液、精液、脑脊液、唾液、或眼泪。
5.一种用于实施如权利要求1至4中任一项所述的大规模锚定并行测序技术的试剂盒,其包括选自下组的PCR引物:PE2步移接头(SEQ ID N0.1和SEQ ID N0.2)、PE2 (SEQ ID N0.3)、PE2.1 (SEQ ID N0.4)、PE2.2 (SEQ ID N0.5), PEl (SEQ ID N0.6)、PEl-Barcode-HBX2(SEQ ID N0.7)、HBX2 (SEQ IDN0.8)、HBXl(SEQ ID N0.9)。
6.如权利要求5所述的试剂盒,其特征在于,进一步包含选自下组的阴性对照:来自于HBV阴性个体的基因组DNA,其不含HBV DNA ;纯化的HBV DNA与人类基因组DNA的简单混合物,其中HBV DNA没有与人类基因组DNA整合。
7.如权利要求5所述的试剂盒,其特征在于,进一步包含选自下组的PCR引物:来自HBV 基因组的引物一;来自 TERT、FN1、ARHGEF12、CYP2C8、PHACTR4、PLXNA4、RBFOXU SMAD5基因序列的引物二,该引物二包括选自所述基因序列中的下述区域:外显子、内含子或启动子中IOkb以内的序列,和基因3’端IOkb以内的序列。
8.如权利要求5至7中任一项所述的试剂盒,其特征在于,用于肝癌的诊断、预后、分子分型、治疗方案遴选。
9.如权利要求5至7中任一项所述的试剂盒用于开发肝癌治疗药物的用途,用于检测宿主基因组与HBV基因的整合,所述宿主基因包括TERT、FN1、ARHGEF12、CYP2C8、PHACTR4、PLXNA4、RBFOXl、SMAD5 基因。
10.一种试剂盒,其包括至少一种选自下组的DNA片段:SEQ ID N0.10,SEQ ID N0.11、SEQ ID N0.12,SEQ ID N0.13,SEQ ID N0.14,SEQ ID N0.15,SEQ ID N0.16,SEQ ID N0.17、SEQ ID N0.18,SEQ ID N0.19,SEQ ID N0.20、和 SEQ ID N0.21 ;以及选自下组的 PCR 引物:PE 2 步移接头、PE 2 (SEQ ID N0.3) ,PE 2.1 (SEQ ID N0.4) ,PE 2.2 (SEQ ID N0.5) ,PEl (SEQID N0.6)、PEl-Barcode-HBX2(SEQ ID N0.7)、HBX2(SEO ID N0.8)、HBXl(SEO ID N0.9)。
【文档编号】C12Q1/68GK103725773SQ201310430532
【公开日】2014年4月16日 申请日期:2013年9月18日 优先权日:2012年10月10日
【发明者】林标扬, 丁东 申请人:杭州普望生物技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1