基于IlluminaGA测序技术的HLA基因高分辨率分型方法

文档序号:584420阅读:1053来源:国知局

专利名称::基于IlluminaGA测序技术的HLA基因高分辨率分型方法
技术领域
:本发明涉及核酸测序
技术领域
,特别是PCR测序
技术领域
。另外,本发明还涉及DNA分子标签技术和DNA不完全打断策略。本发明的方法特别适用于第二代测序技术。本发明的方法涉及DNA序列的分型方法,特别是HLA基因高分辨率分型方法。
背景技术
:人类白细胞抗原,S卩HLA(humanleukocyteantigen,HLA),是迄今为止发现的多态性最高的基因系统之一,它是调控人体特异性免疫应答和决定疾病易感性个体差异的主要基因系统,与同种异体器官移植的排斥反应密切相关。研究发现,移植时,供受双方的HLA相关基因匹配程度越高,分辨率越高,移植物的存活时间越长。HLA-SBT(SequenceBasedTyping,基于DNA序列的分型方法)是当前HLA高分辨率分型的主要方法。该方法通过PCR扩增相应HLA的基因区域,对扩增产物测序,测序结果经过专业的分型软件分型,最终得到样本的HLA基因型别信息。其具有直观、高分辨且能检测新的等位基因的特点。当前的HLA-SBT方法主要是基于Sanger测序法,该测序方法不能直接得到样本中单体型(父本或者母本单独的序列信息)的序列信息,而只能得到二倍体型序列信息,这给HLA分型结果带来了不确定性(Ambiguity),为了得到确定的分型结果,需要加测GSSP(组特异性测序引物,(iroupSepecificSequencingPrimer)或者通过克隆测序来解决上述问题基于Sanger测序法的测序通量小,以ABI公司的3730测序仪一天4000个测序反应的饱和通量为例,单份样本的HLA-A/B/DRB1三个位点的SBT分型大概需要17个测序反应,一台3730测序仪整天不停运转也只能产出约240份样本的数据量。目前!M-SBT主要通过专业分型软件来分型,导入测序峰图质量的好坏对分型软件的峰图识别能力影响很大,当软件识别错误时,需要分型人员能及时发现错误,改正错误。同时,为了避免人为错误,同一批次样本的分型工作往往要由两人以上独立完成,核对无误后,才能确认结果。如果能够实现软件分型的自动化那将大大减少错误的发生率,并且降低人力成本。基于Sanger测序法的fflJV_SBT实验步骤包括:PCR扩增、PCR产物电泳、PCR产物纯化、测序反应、测序反应产物纯化、测序仪测序、测序结果分型以及后继的加测GSSP等,整个实验流程复杂,且实验过程中,不同PCR产物不能混合在一起操作,大大地加大了实验工作量。HLA-SBT整个实验流程复杂、通量低和成本高等缺点使其很难应用于大规模HLA高分辨分型项目。
发明内容IlluminaGA测序(Illumina公司的GenomeAnalyzer测序仪,简称IlluminaGA)是利用边合成边测序的原理进行DNA序列分析,可以检测单体型,其最终产出的数据是一系列的碱基序列,可直接用于与HLA数据库中的参考序列直接比对,不存在传统分型软件峰图误判的问题,有利于软件分型的自动化。IlluminaGA的测序通量大,目前一个实验流程下来可以产生50G(500亿)碱基的数据,平均每天产生50亿碱基的数据。高的数据通量可以在测序序列数确定的情况下,使得每条序列获得高的测序深度,确保测序结果的可靠性。目前还未有将IlluminaGA应用于HLA分型领域的研究,本发明首次将IlluminaGA测序应用于HLA分型领域,结合DNA分子标签技术、DNA不完全打断及PCR-FREE建库的PCR测序技术,实现HLA的低成本,高通量、高准确率、高分辨率的分型。基于DNA分子标签技术,实现了对多样本PCR产物的分别标记,使Illumina测序文库构建实验环节可把多个样本混合(pooling)成一个文库同时处理,大大简化了实验操作,最终,每个样本的检测结果可以通过其独特的标签(index)序列找回。DNA不完全打断技术使IlluminaGA实际可测通的PCR产物长度超过测序仪的测序最大长度,在当前IlluminaGA测序最大长度200bp的情况下,实际可测通的PCR产物长度达到200bp以上。“接头(adapter)”或“文库接头(libraryadapter)”标签技术是指通过对多个测序文库添加不同文库接头(不同文库接头的组成序列不同,序列不同的部分称为接头标签(adapterindex),构建标签测序文库,从而可实现多个不同标签测序文库混合测序,且最终各个标签测序文库的测序结果可相互区分的一种文库标签技术。基于DNA分子标签技术和DNA不完全打断策略的PCR测序方法的使用可在减少引物标签数目的情况下,大大提高可唯一标记的样本数目(图1)。结合文库接头标签技术的PCR-FREE的文库构建方法,是指将文库接头直接连接至测序文库中的DNA片段两端,文库接头的导入过程因为没有PCR的参与,因此称作PCR-Free文库构建。其中接入方法可以采用DNA连接酶进行连接。其整个文库构建过程中无PCR的参与,避免了在高序列相似度的PCR产物混合(pooling)文库的构建过程中,由PCR引入错误而导致最后结果的不准确性。本发明,采用基于DNA分子标签技术、DNA不完全打断及PCR-FREE建库的PCR测序技术,通过对待分析样本分组,再对每组样本通过双向引物标签标记的引物,对HLA基因目的片段扩增(PCR产物的最大长度取决于测序仪可结合的最大DNA长度,当前IlluminaGA适用的最大DNA长度为700bp,此长度为原始DNA长度,没有包括文库接头序列长度),所得PCR产物等量混合,经DNA不完全打断处理,构建PCR-Free标签测序文库。把各样本组得到的不同标签测序文库等摩尔混合,选择性回收片段长度大于测序仪最大测序长度以上的所有DNA片段,随后用IlluminaGA测序仪测序。通过对测序结果中接头标签(adapterindex)、弓I物标签以及PCR弓I物的序列信息筛选,可获得每个样本的DNA序列信息,所得DNA序列经过组装与頂GT!M专业数据库中对应数据库的比对,最终可得到样本的!M基因型别。在本发明的一个方面中,提供了一组引物标签(primerindex),其包括表1所示95对引物标签中的至少10对,或至少20对,或至少30对,或至少40对,或至少50对,至少60对,或至少70对,或至少80对,或至少90对,或95对(或者所述一组引物标签由表1所示95对引物标签中的10-95对(例如10-95对,20-95对,30-95对,40-95对,50-95对,60-95对,70-95对,80-95对,90-95对,或95对)组成),并且所述一组引物标签优选地至少包括表1所示95对引物标签中的PI-I至PI-10,或PI-Il至PI-20,或PI-21至PI-30,或PI-31至PI-40,或PI-41至PI-50,或PI-51至PI-60,或PI-61至PI-70,或PI—71至PI—80,或PI—81至PI—90,或PI—91至PI-95,或者它们任何两个或者多个的组合。根据本发明另一方面,还提供了所述的引物标签用于PCR测序方法的用途,其中特别是,每一对引物标签与用于扩增待测目的序列的PCR引物对组合成一对标签引物,正反PCR引物的5’端分别具有(或者任选通过连接序列连接)正向引物标签和反向引物标签。在本发明的一个具体实施方式中,所述PCR引物是用于扩增HLA的特定基因的PCR引物,优选是用于扩增HLA-A/B2,3,4号外显子和HLA-DRB12号外显子的PCR引物,优选的所述PCR引物如表2所示。本发明另一方面中,提供了上文所述一组引物标签与用于扩增待测目的序列的PCR引物对组合成的一组标签引物,其中每一对引物标签与PCR引物对组合成一对标签引物,正反PCR引物的5’端分别具有(或者任选通过连接序列连接)正向引物标签和反向引物标签。在本发明的一个具体实施方式中,上文所述标签引物中的PCR引物是用于扩增HLA的特定基因的PCR引物,优选是用于扩增HLA-A/B2,3,4号外显子和HLA-DRB12号外显子的PCR引物,优选的所述PCR引物如表2所示。在本发明的另一个具体实施方式中,所述的标签引物用于PCR测序方法。本发明另一方面中,提供了一种HLA分型的方法,其包括1)提供η个样品,η为大于等于1的整数,所述样品优选地来自哺乳动物,更优选是人,特别是人的血样;2)将待分析的η个样品分成m个小组,m为整数且η彡m彡1;3)扩增对于每一个样品,使用一对标签引物,在存在来自该样品的模板时,在适于扩增目的核酸的条件下进行PCR扩增,其中,每一对标签引物由包含引物标签的正向标签引物和反向标签引物(均可以是简并引物)构成,其中正向标签引物和反向标签引物所包含的引物标签可以相同或者不同;不同样品所用标签引物对中的引物标签彼此不同;4)混合将各样品的PCR扩增产物混合在一起,获得PCR产物文库;5)打断将所得的PCR产物文库进行不完全打断;6)建库结合文库接头标签技术,将打断后的PCR产物文库构建PCR-Free测序文库,回收位于所用测序仪最大读长长度到所用测序仪适用的最长DNA长度范围之间的所有DNA条带,可以对文库添加不同的文库接头(adapter)以区分不同的PCR-Free测序文库;7)测序将回收的DNA混合物利用二代测序技术,优选的是Pair-End技术(例如IlluminaGA,IlluminaHiseq2000)进行测序,获得打断后的DNA的序列;8)拼接基于各个文库不同的文库接头序列和每个样品独特的引物标签将获得的测序结果与样品一一对应,利用比对程序(例如Blast,BWA程序)把各个测序序列定位到PCR产物的相应DNA参考序列上,通过序列重叠和连锁关系,从打断后的DNA的序列拼接出完整的目的核酸。在本发明的一个具体实施方式中,在上文所述的方法中,所述结合文库接头标签技术,将打断后的PCR产物文库构建PCR-Free测序文库是指使用m种文库接头给4)中得到的m个PCR产物文库加上接头,其中每一个PCR产物文库使用一种不同的文库接头,从而构建m个接头标签测序文库;将m个接头标签测序文库等摩尔混合在一起构建混合接头标签测序文库。其中连接文库接头的方法是指不通过PCR程序直接采用DNA连接酶进行连接。在本发明的一个具体实施方式中,在上文所述的方法中,每一对引物标签与PCR引物对组合成一对标签引物,正反PCR引物的5’端分别具有(或者任选通过连接序列连接)正向引物标签和反向引物标签。在本发明的一个具体实施方式中,在上文所述的方法中,所述PCR引物是用于扩增HLA的特定基因的PCR引物,优选是用于扩增HLA-A/B2,3,4号外显子和HLA-DRB12号外显子的PCR引物,优选的所述PCR引物如表2所示。在本发明的一个具体实施方式中,在上文所述的方法中,所述引物标签针对PCR引物进行设计,优选针对用于扩增IM的特定基因的PCR引物进行设计,更优选针对用于扩增fflJV-A\B2,3,4号外显子和!M-DRB12号外显子的PCR引物,特别是如表2所示的PCR引物进行设计,所述引物标签特别是包括表1所示95对引物标签中的至少10对,或至少20对,或至少30对,或至少40对,或至少50对,至少60对,或至少70对,或至少80对,或至少90对,或95对(或者所述一组引物标签由表1所示95对引物标签中的10-95对(例如10-95对,20-95对,30-95对,40-95对,50-95对,60-95对,70-95对,80-95对,90-95对,或95对)组成),并且所述一组引物标签优选地至少包括表1所示95对引物标签中的PI-I至PI-10,或PI-Il至PI-20,或PI-21至PI-30,或PI-31至PI-40,或PI-41至PI-50,或PI-51至PI-60,或PI-61至PI-70,或PI-71至PI-80,或PI-81至PI-90,或PI-91至PI-95,或者它们任何两个或者多个的组合。在本发明的一个具体实施方式中,在上文所述的方法中,所述DNA打断包括化学打断方法和物理打断方法,其中所述化学方法包括酶切方法,所述物理打断方法包括超声波打断方法或机械打断方法。所述DNA打断后,纯化回收450-750bp长度的片段。所述纯化回收纯化回收方法包括但不限于电泳割胶回收,也可以是磁珠回收。在本发明的一个具体实施方式中,在上文所述的方法中,所述DNA打断后,在构建PCR-Free标签文库的过程中,对不同组样品的DNA用不同的文库接头连接,从而在其后的分型步骤中,基于每个样品所用的引物标签和接头标签,将获得的测序结果与样本一一对应。利用比对程序把各个样本测序序列定位到其PCR产物已知相应的DNA参考序列(ReferenceSequence)上,通过序列重叠和连锁关系,从打断后的DNA的序列拼接出完整的PCR产物序列。本发明另一方面中,提供了一种HLA分型方法,包括使用上文所述的测序方法对来自患者的样品(特别是血样)进行测序和拼接,以及将拼接好的序列与HLA数据库(如IMGTHLA专业数据库)中HLA相关序列数据比对,序列比对结果100%匹配的即为对应样本的HLA-DRBl基因型别。发明的有益效果本发明提供了基于illuminaGA测序技术的HLA基因高分辨率分型方法,从而实现单体型测序、软件分型自动化,提高HLA基因分型的通量,降低成本。图1为引物标签和接头标签(adaptorindex)标记后的PCR产物示意图。实验时,通过PCR在每个样本的PCR产物两端同时引入引物标签;把多个带有不同引物标签的PCR产物混合在一起,用于构建测序文库。测序文库构建过程中,当需要构建多个测序文库时,可通过添加带有不同接头标签的文库接头,来标记各个测序文库。文库构建完毕后,带有不同接头标签标记的多个测序文库可以混合在一起同时用IlluminaGA测序(不同接头标签标记的测序文库之间的引物标签可以相同)。测序结果出来后,通过对测序结果中接头标签和引物标签序列信息的筛选,可获得每个样本的DNA序列信息。图2为1号样本HLA-A/B/DRB1相应外显子PCR产物电泳结果,从电泳图上看,PCR产物为一系列片段大小300bp-500bp的单一条带,其中泳道M是分子量标记物(DL2000,Takara公司),泳道1-7为1号样本的HLA-A/B/DRB1各外显子(A2、A3、A4、B2、B3、B4、DRB1-2)PCR扩增产物,阴性对照(N)无扩增条带。其它样品的结果与此类似。图3为HLA-Mix打断后DNA电泳情况(割胶前后),割胶区域为450_750bp区域。其中泳道M是分子量标记物(NEB-50bpDNALadder),泳道1是割胶前HLA-Mix的电泳情况,泳道2是割胶后HLA-Mix的胶图。图4:1号样本一致性(consensus)序列构建程序截图,示例说明了根据引物标签和DNA片段之间的重叠关系拼接出PCR产物的完整序列。具体实施例方式下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。在本发明的实施例中,采用基于引物标签、DNA不完全打断、文库标签及PCR-FREE建库的PCR测序方法,对950个样本的HLA-A/B2,3,4号外显子以及HLA-DRB12号外显子(PCR产物长度大小处于290bp-500bp之间)的基因分型,证明该发明能够实现低成本、高通量、高准确率和高分辨率的HLA基因分型。原理将待分析的样本均分成10组,对每组样本通过PCR反应在HLA-A/B2,3,4号外显子以及HLA-DRB12号外显子的PCR产物两端引入引物标签,使其特异的标记PCR产物的样本信息。将各组内样品的HLA-A/B/DRB1三个位点的PCR扩增产物等体积混合在一起,获得PCR产物文库;所得PCR产物文库经过超声不完全打断后,构建不同的PCR-Free标签测序文库(其中每一个PCR产物文库使用一种不同的接头,从而构建10个标签测序文库);将10个标签测序文库等摩尔混合在一起构建混合标签测序文库,混合标签测序文库经2%低熔点琼脂糖电泳,割胶纯化回收位于450-750p长度范围之间的所有DNA条带。回收的DNA经IlluminaGAPE-100测序。通过文库标签和引物标签序列可以找到所有所测样本的序列信息,再通过已知DNA片段的参考序列信息和DNA片段序列之间的重叠和连锁关系组装出整个PCR产物的序列,再通过与HLA-A/B/DRB1相应外显子的标准数据库的比对结果可组装出原PCR产物的全序列,实现HLA-A/B/DRB1的基因分型。实施例1样本提取使用KingFisher自动提取仪(请提供供货商信息)(美国Thermo公司)从950份已知HLA-SBT分型结果的血样(中国造血干细胞捐献者资料库(以下称“中华骨髓库”))中提取DNA。主要步骤如下取出6个Kingfisher自动提取仪配套的深孔板及1个浅孔板,根据说明书分别加入一定量配套的试剂并作好标记,将所有已加好试剂的孔板按要求置于相应的位置,选定程序“BioeaSy_200ulBloodDNA_KF.msz”程序,按下“star”执行该程序进行核酸提取。程序结束后收集plateElution中的IOOul左右的洗脱产物即为提取的DNA,准备做下一步PCR中的模板用。实施例2PCR扩增把样本提取步骤中所得的950份DNA依次编号1_950,均分成10组,每组95份DNA,分别标记为HLA-1、HLA-2、HLA-3、HLA-4、HLA-5、HLA-6、HLA-7、HLA-8、HLA-9、HLA-10。对每组样本分别以95套带有双向引物标签(表1)用于扩增HLA-A/B2,3,4号外显子和HLA-DRB12号外显子的PCR引物(表2)来分别扩增95份DNA样本。PCR反应在96孔板中进行,共7板,编号分别为HLA-X-P-A2、HLA-X-P-A3、HLA-X-P-A4、HLA-X-P-B2、HLA-X-P-B3、HLA-X-P-B4以及HLA-X-P-DRB1-2(“X”表示样本组号信息1/2/3/4/5/6/7/8/9/10,“A2/3/4,B2/3/4,DRBl-2”表示扩增的位点),每板内设置一个不添加模板的阴性对照,阴性对照所用引物为PI-I(表1)标记的引物。实验的同时,记录下每个样本对应的样本组号信息和引物标签信息。表1,引物标签的相关信息表2,未添加引物标签前用于扩增HLA-A/B/DRB1相应外显子的PCR引物D2-F1,D2-F2,D2-F3,D2-F4,D2-F5,D2-F6,D2-F7为扩增HLA-DRB12号外显子的正向引物,D2-R为扩增HLA-DRB12号外显子的反向引物。HLA-A/B/DRB1的PCR程序如下96"C2min95°C30s—60°C30s—72°C20s(32cycles)15°C⑴HLA-A/B的PCR反应体系如下HLA-DRBl的PCR反应体系如下其中PInf-A/B/D2-F1/2/3/4/5/6/7表示引物5’末端带有第η号正向引物标签序列(表1)的HLA-A/B/DRB1的F引物,PInf-A/B/D2-R2/3/4表示引物5’末端带有第η号反向引物标签序列的HLA-A/B/DRB1的R引物(此处η<95),其它依次类推。且每个样本对应特定的一套PCR引物(PInf-A/B/D2-F1/2/3/4/5/6/7,PInf_A/B/D2_R2鋪)。PCR反应在Bio-Rad公司的PTC-200PCR仪上运行。PCR完成后,取2ulPCR产物经的琼脂糖凝胶电泳检测。图2显示了1号样本HLA-A/B/DRB1相应外显子PCR产物电泳结果,DNA分子标记为DL2000(Takara公司),胶图上有一系列片段大小为300bp_500bp单一条带,表明1号样本的HLA-A/B/DRB1各外显子(A2、A3、A4、B2、B3、B4、DRB1-2)PCR扩增成功,阴性对照(N)无扩增条带。其它样品的结果与此类似实施例3PCR产物混合和纯化对第“X“组(“X”为1/2/3/4/5/6/7/8/9/10)样本,从96孔板HLA-X-P-A2剩余的PCR产物中(阴性对照除外)各取20ul混合在一个3ml的EP管中,标记为HLA-X-A2_Mix,对第“X”组样本的其它6个96孔板进行同样的操作,分别标记为HLA-X-A3-MiX、HLA-X-A4-MiX、HLA-X-B2-Mix、HLA_X-B3_Mix、HLA_X-B4_Mix和HLA_X-D2_Mix,震荡混勻,从HLA_X-A2_Mix、HLA-X-A3-Mix、HLA-X-A4_Mix、HLA-X-B2_Mix、HLA-X-B3_Mix、HLA-X-B4_Mix和HLA-X-D2_Mix中各取200ul混合在一个3ml的EP管中,标记为HLA_X_Mix。从中各取500ulDNA混合物经QiagenDNAPurificationkit过柱纯化(具体纯化步骤详见说明书),纯化所得的200ulDNA,经Nanodrop8000(ThermoFisherScientific公司)测定的DNA浓度分别为实施例4IlluminaGA测序文库构建1.DNA打断从纯化后的HLA-X-Mix中各取总量5ug的DNA用带AFA纤维扣盖的Covaris微管在CovarisS2(Covaris公司)上打断。打断条件如下频率扫描(frequencysweeping)2.打断后纯化将HLA-X-Mix的所有打断产物用QIAquickPCRPurificationKit(QIAGEN公司)回收纯化,分别溶于37.5ul的EB(QIAGENElutionBuffer)中;3.末端修复反应对打断后纯化的HLA-X-Mix进行DNA末端修复反应,体系如下(试剂均购自Enzymatics公司)反应条件为恒温混勻器(Thermomixer,Eppendorf公司)20°C温浴30min。反应产物经QIAquickPCRPurificationKit回收纯化,溶于34μ1的冊(QIAGENElutionBuffer)中。4.3’末端加A反应上一步回收DNA的3’末端加A反应,体系如下(试剂均购自Enzymatics公司)反应条件为恒温混勻器(Thermomixer,Eppendorf公司)37°C温浴30min。反应产物经MiniElutePCRPurificationKit(QIAGEN公司)回收纯化,溶于13μ1的EB溶液(QIAGENElutionBuffer)中。5.连接IlluminaGAPCR-Free文库接头(adapter)术语“PCR-Free文库接头(adapter)”是指经设计的一段碱基,其主要作用是辅助固定DNA分子在测序芯片上以及提供通用测序引物的结合位点,PCR-Free文库接头可以通过DNA连接酶将其直接连接至测序文库中的DNA片段两端,接头的导入过程因为没有PCR的参与,因此称作PCR-Free文库接头。加A后的产物分别连接不同的IlluminaGAPCR-Freeindex文库接头,体系如下(试剂均购自Illumina公司)反应条件为恒温混勻器(Thermomixer,Eppendorf公司)20°C温浴15min。样本组与文库接头的对应关系如下反应产物经AmpureBeads(BeckmanCoulterGenomics)纯化后溶于50ul去离子水,经荧光定量PCR(QPCR)检测到DNA摩尔浓度结果如下6.割胶回收HLA-I-Mix,HLA-2-Mix,HLA-3-Mix,HLA-4-Mix,HLA-5-Mix,HLA-6-Mix,HLA-7-Mix、HLA-8-Mix、HLA-9-Mix和HLA-10-Mix等摩尔混合(终浓度72.13nM/ul),标记为HLA-Mix-IO,取30μLHLA-Mix-IO用2%低熔点琼脂糖胶进行回收。电泳条件为100V,lOOmin。DNAmarker为NEB公司的50bpDNAmarker。割胶回收450_750bp长度范围的DNA片段(附图3)。胶回收产物经QIAquickPCRPurificationKit(QIAGEN公司)回收纯化,纯化后体积为32ul,经荧光定量PCR(QPCR)检测到DNA浓度结果为9.96nM。实施例5IlluminaGA测序根据QPCR检测结果,取IOpmolDNA用IlluminaGAPE-100程序测序,具体操作流程详见IlluminaGA操作说明书(IlluminaGAIIχ)。实施例6结果分析IlluminaGA产出的测序结果是一系列DNA序列,通过查找测序结果中的接头标签序列、正反弓丨物标签序列和引物序列,建立各个引物标签对应样本IM-A/B/DRB1各外显子PCR产物测序结果的数据库。通过BWA(Burrows-WheelerAligner)把各外显子的测序结果定位在相应外显子的参考序列上(参考序列来源:http://www.ebi.ac.uk/imgt/hla/)同时,构建各个数据库的一致性(consensus)序列,再对数据库中DNA序列进行筛选和测序错误校正。校正后的DNA序列通过序列重叠(overlap)和连锁(Pair-End连锁)关系可组装成fflJV-A/B/DRBl各外显子相应的序列。所得DNA序列利用与IMGTKA专业数据库中fflJV-A/B/DRBl相应各外显子的序列数据库比对,序列比对结果100%匹配的即为对应样本的fflJV-A/B/DRBl基因型别。可参考图4示例说明的1号样品的IM-A位点的2号外显子一致性序列构建程序的截图。所有950个样本,得到的分型结果与原已知分型结果完全相符,其中1-32号样本的具体结果如下样本编号原HLA-A/B/DRB1型别0117]1A-k0203Ak1101B-k3802B-k4801DRBl-k1454DRBl-k15010118]2A-k0101A-k3001B-k0801B-k1302DRBl-k0301DRBl-k07010119]3A-k0101A-k0201B-k1511B-k4701DRBl-k1302DRBl-k15010120]4A-k2408A-k2601B-k4001B-k5101DRBl-k0404DRBl-k09010121]5A-k0101A-k2402B-k5401B-k5502DRBl-k0405DRBl-k09010122]6A-k0101A-k0302B-k1511B-k3701DRBl-k1001DRBl-k14540123]7A-k1101A-k3001B-k1302B-k1518DRBl-k0404DRBl-k07010124]8A-k0101A-k0201B-k3503B-k8101DRBl-k1101DRBl-k15010125]9A-k0206A-k3101B-k2707B-k4002DRBl-k0301DRBl-k13020126]10A-k0101A-k6601B-k3701B-k4901DRBl-k1001DRBl-k13020127]11A-k0101A-k0301B-k3501B-k5201DRBl-k0101DRBl-k15020128]12A-k1101A-k1101B-k1501B-k1505DRBl-k0406DRBl-k15010129]13A-k0101A-k1102B-k0702B-k1502DRBl-k0901DRBl-k15010130]14A-k0101A-k0201B-k5201B-k6701DRBl-k1502DRBl-k16020131]15A-k0101A-k0205B-k1517B-k5001DRBl-k0701DRBl-k15010132]16A-k0101A-k1101B-k3701B-k4002DRBl-k1001DRBl-k12020133]17A-k2407A-k3201B-k3505B-k4001DRBl-k0301DRBl-k04050134]18A-k1101A-k2402B-k1301B-k3501DRBl-k1602DRBl-k16020135]19A-k1101A-k1101B-k4002B-k5512DRBl-k0405DRBl-k15010136]20A-k0211A-k2402B-k4001B-k4006DRBl-k1101DRBl-k15010137]21A-k0101A-k0206B-k5101B-k5701DRBl-k0701DRBl-k12010138]22A-k0101A-k2901B-k0705B-k1501DRBl-k0405DRBl-k07010139]23A-k0101A-k0207B-k3701B-k4601DRBl-k0403DRBl-k10010140]24A-k2485A-k3001B-k1302B-k5502DRBl-k0701DRBl-k150125A1101Ak3101Bk0706Bk5101DRBlk1202DRBlk140526Ak0101Ak1101Bk4601Bk5701DRBlk0701DRBlk080327Ak0101Ak0201Bk1518Bk3701DRBlk0401DRBlk150128Ak0101Ak2402Bk3701Bk4601DRBlk0901DRBlk100129Ak2601Ak6601Bk4040Bk4102DRBlk1201DRBlk150130Ak0201Ak2902Bk1302Bk4501DRBlk0301DRBlk120231Ak0101Ak1103Bk1501Bk5701DRBlk0701DRBlk150132Ak1101Ak2601Bk3503Bk3801DRBlk1103DRBlk1404样本编号测得的HLA-A/B/DRB1型别1Ak0203Ak1101Bk3802Bk4801DRBlk1454DRBlk15012Ak0101Ak3001Bk0801Bk1302DRBlk0301DRBlk07013Ak0101Ak0201Bk1511Bk4701DRBlk1302DRBlk15014Ak2408Ak2601Bk4001Bk5101DRBlk0404DRBlk09015Ak0101Ak2402Bk5401Bk5502DRBlk0405DRBlk09016Ak0101Ak0302Bk1511Bk3701DRBlk1001DRBlk14547Ak1101Ak3001Bk1302Bk1518DRBlk0404DRBlk07018Ak0101Ak0201Bk3503Bk8101DRBlk1101DRBlk15019Ak0206Ak3101Bk2707Bk4002DRBlk0301DRBlk130210Ak0101Ak6601Bk3701Bk4901DRBlk1001DRBlk130211Ak0101Ak0301Bk3501Bk5201DRBlk0101DRBlk150212Ak1101Ak1101Bk1501Bk1505DRBlk0406DRBlk150113Ak0101Ak1102Bk0702Bk1502DRBlk0901DRBlk150114Ak0101Ak0201Bk5201Bk6701DRBlk1502DRBlk160215Ak0101Ak0205Bk1517Bk5001DRBlk0701DRBlk150116Ak0101Ak1101Bk3701Bk4002DRBlk1001DRBlk120217Ak2407Ak3201Bk3505Bk4001DRBlk0301DRBlk040518Ak1101Ak2402Bk1301Bk3501DRBlk1602DRBlk160219Ak1101Ak1101Bk4002Bk5512DRBlk0405DRBlk150120Ak0211Ak2402Bk4001Bk4006DRBlk1101DRBlk150121Ak0101Ak0206Bk5101Bk5701DRBlk0701DRBlk120122Ak0101Ak2901Bk0705Bk1501DRBlk0405DRBlk070123Ak0101Ak0207Bk3701Bk4601DRBlk0403DRBlk100124Ak2485Ak3001Bk1302Bk5502DRBlk0701DRBlk150125Ak1101Ak3101Bk0706Bk5101DRBlk1202DRBlk140526Ak0101Ak1101Bk4601Bk5701DRBlk0701DRBlk080327Ak0101Ak0201Bk1518Bk3701DRBlk0401DRBlk150128Ak0101Ak2402Bk3701Bk4601DRBlk0901DRBlk100129Ak2601Ak6601Bk4040Bk4102DRBlk1201DRBlk150130Ak0201Ak2902Bk1302Bk4501DRBlk0301DRBlk120231A女01:01A女11:03B女15:01B女57:01DRBl女07:01DRBl女15:0132A女11:01A女26:01B女35:03B女38:01DRBl女11:03DRBl女14:04注HLA-DRBl型别中的DRBl*1201不排除DRBl*1206/1210/1217的可能性,DRBl女1454不排除DRBl女1401的可能性,因为上述等位基因在2号外显子的序列完全相同。同理对于HLA-A/B位点中2、3、4号外显子序列完全相同的结果取常见型。采用本发明的技术路线,对950份已知HLA-SBT分型结果的样本进行HLA-A/B/DRBl位点的基因分型,结果发现采用本发明的技术路线所得的分型结果与原结果完全一致。尽管本发明的具体实施方式已经得到详细的描述,本领域技术人员将会理解。根据已经公开的所有教导,可以对那些细节进行各种修改和替换,这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。参考文献[1].http//www.ebi.ac.uk/imgt/hla/stats,html[2].TiercyJΜ.MolecularbasisofHLApolymorphismamplicationsinclinicaltransplantation.[J].TransplImmunol,2002,9:173-180.[3].C.Antoine,S.Miiller,A.Cant,etal.Long-termsurvivalandtransplantationofhaemopoieticstemcellsforimmunodeficiencies:reportoftheEuropeanexperience.1968-99.[J].TheLancet,2003,9357:553_560.[4].H.A.Erlich,G.Opelz,J.Hansen,etal.HLADNATypingandTransplantation.[J].Immunity,2001,14:347-356.[5],LilloR,BalasA,VicarioJL,etal.TwonewHLAclassallele,DPBl^02014,bysequence-basedtyping.[J].TissueAntigens,2002,59:47_48.[6].A.Dormoy,N.Froelich.Leisenbach,etal.Mono-allelicamplificationofexons2~4usingallelegroup-specificprimersforsequence-basedtyping(SBT)oftheHLA-A,-Band-CgenesPreparationandvalidationofready-to-usepre-SBTmini-kits.[J],TissueAntigens,2003,62:201_216.[7].ElaineR.Mardis.Theimpactofnext-generationsequencingtechnologyongenetics.[J].TrendsinGenetics.2008,24:133_141.[8].ChristianHoffmannl,NanaMinkah1,JeremyLeipzig.DNAbarcodingandpyrosequencingtoidentifyrareHIVdrugresistancemutations.[J].NucleicAcidsResearch,2007,1-8.[9].ShannonJ.Odelberg,RobertB.Weiss,AkiraHata.Template-switchingduringDNAsynthesisbyThermusaquaticusDNApolymeraseI.[J].NucleicAcidsResearch.1995,23:2049_2057.[10].SayerD,WhidborneR,BrestovacB.HLA-DRBlDNAsequencingbasedtyping:anapproachsuitableforhighthroughputtypingincludingunrelatedbonemarrowregistrydonors.[J].TissueAntigens.2001,57(1):46_54。权利要求一种HLA分型方法,其包括1)提供n个样品,n为大于等于1的整数,所述样品优选地来自哺乳动物,更优选是人,特别是人的血样;2)将待分析的n个样品分成m个小组,m为整数且n≥m≥1;3)扩增对于每一个样品,使用一对标签引物,在存在来自该样品的模板时,在适于扩增目的核酸的条件下进行PCR扩增,其中,每一对标签引物由包含引物标签的正向标签引物和反向标签引物(均可以是简并引物)构成,其中正向标签引物和反向标签引物所包含的引物标签可以相同或者不同;不同样品所用标签引物对中的引物标签彼此不同;4)混合将各样品的PCR扩增产物混合在一起,获得PCR产物文库;5)打断将所得的PCR产物文库进行不完全打断;6)建库结合文库接头标签技术,将打断后的PCR产物文库构建PCRFree测序文库,可以对文库添加不同的文库接头(adapter)以区分不同的PCRFree测序文库,回收位于所用测序仪最大读长长度到所用测序仪适用的最长DNA长度范围之间的所有DNA条带,具体而言是450750bp长度范围的DNA片段;7)测序将回收的DNA混合物利用二代测序技术,优选的是PairEnd技术(例如IlluminaGA、IlluminaHiseq2000)进行测序,获得打断后的DNA的序列;8)拼接基于各个文库不同的文库接头序列和每个样品独特的引物标签将获得的测序结果与样品一一对应,利用比对程序(例如Blast,BWA程序)把各个测序序列定位到PCR产物的相应DNA参考序列上,通过序列重叠和连锁关系,从打断后的DNA的序列拼接出完整的目的核酸;和9)分型将测序结果与HLA数据库(如IMGTHLA专业数据库)中HLADRB12号外显子的序列数据比对,序列比对结果100%匹配的即为对应样本的HLADRB1基因型别。2.权利要求1所述的方法,其中每一对引物标签与PCR引物对组合成一对标签引物,正反PCR引物的5’端分别具有(或者任选通过连接序列连接)正向引物标签和反向引物标签。3.权利要求1所述的方法,其中所述PCR引物是用于扩增HLA的特定基因的PCR引物,优选是用于扩增HLA-A/B的2,3,4号外显子以及HLA-DRB12号外显子的PCR引物,更优选的所述PCR引物如表2所示。4.权利要求1所述的方法,其中所述引物标签针对用于扩增HLA的特定基因的PCR引物进行设计,优选针对用于扩增HLA-A/B的2,3,4号外显子以及HLA-DRB12号外显子的PCR引物,特别是如表2所示的PCR引物进行设计,特别是所述引物标签特别是包括表1所示95对引物标签中的至少10对,或至少20对,或至少30对,或至少40对,或至少50对,至少60对,或至少70对,或至少80对,或至少90对,或95对(或者所述一组引物标签由表1所示95对引物标签中的10-95对(例如10-95对,20-95对,30-95对,40-95对,50-95对,60-95对,70-95对,80-95对,90-95对,或95对)组成),并且所述一组引物标签优选地至少包括表1所示95对引物标签中的PI-I至PI-10,或PI-Il至PI-20,或PI-21至PI-30,或PI-31至PI-40,或PI-41至PI-50,或PI-51至PI-60,或PI-61至PI-70,或PI-71至PI-80,或PI-81至PI-90,或PI-91至PI-95,或者它们任何两个或者多个的组合。5.权利要求1所述的测序方法,其中所述DNA打断包括化学打断方法和物理打断方法,其中所述化学方法包括酶切方法,所述物理打断方法包括超声波打断方法或机械打断方法。6.权利要求1所述的测序方法,其中所述纯化回收方法包括但不限于电泳割胶回收,也可以是磁珠回收。7.权利要求1所述的测序方法,所述结合文库接头标签技术,将打断后的PCR产物文库构建PCR-Free测序文库是指使用m种文库接头给2)中得到的m个PCR产物文库加上接头,其中每一个PCR产物文库使用一种不同的文库接头,从而构建m个接头标签测序文库;将m个接头标签测序文库等摩尔混合在一起构建混合接头标签测序文库。其中连接文库接头的方法是指不通过PCR程序直接采用DNA连接酶进行连接。8.一组引物标签,其包括表1所示95对引物标签中的至少10对,或至少20对,或至少30对,或至少40对,或至少50对,至少60对,或至少70对,或至少80对,或至少90对,或95对(或者所述一组引物标签由表1所示95对引物标签中的10-95对(例如10-95对,20-95对,30-95对,40-95对,50-95对,60-95对,70-95对,80-95对,90-95对,或95对)组成),并且所述一组引物标签优选地至少包括表1所示95对引物标签中的PI-I至PI-10,或PI-Il至PI-20,或PI-21至PI-30,或PI-31至PI-40,或PI-41至PI-50,或PI-51至PI-60,或PI-61至PI-70,或PI-71至PI-80,或PI-81至PI-90,或PI-91至PI-95,或者它们任何两个或者多个的组合。9.权利要求8所述的一组引物标签用于PCR测序方法的用途,其中特别是,每一对引物标签与用于扩增待测目的序列的PCR引物对组合成一对标签引物,正反PCR引物的5’端分别具有(或者任选通过连接序列连接)正向引物标签和反向引物标签。10.权利要求9所述的用途,其中PCR引物是用于扩增HLA的特定基因的PCR引物,优选是用于扩增HLA-A/B的2,3,4号外显子以及HLA-DRB12号外显子的PCR引物,优选的所述PCR引物如表2所示。11.权利要求8的一组引物标签与用于扩增待测目的序列的PCR引物对组合成的一组标签引物,其中每一对引物标签与PCR引物对组合成一对标签引物,正反PCR引物的5’端各具有(或者任选通过连接序列连接)一个引物标签。12.权利要求11所述的标签引物,其中所述PCR引物是用于扩增HLA的特定基因的PCR引物,优选是用于扩增HLA-A/B的2,3,4号外显子以及HLA-DRB12号外显子的PCR引物,优选的所述PCR引物如表2所示。13.权利要求11所述的标签引物用于PCR测序方法的用途。全文摘要本发明提供了提供了基于illuminaGA测序技术的HLA基因高分辨率分型方法,还提供了用于上述方法的引物标签。文档编号C12Q1/68GK101921841SQ201010213719公开日2010年12月22日申请日期2010年6月30日优先权日2010年6月30日发明者李剑,田埂,章文尉,蒋慧申请人:深圳华大基因科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1