用于高通量检测人类乳头瘤病毒的dna分子标签的制作方法

文档序号:584424阅读:236来源:国知局
专利名称:用于高通量检测人类乳头瘤病毒的dna分子标签的制作方法
技术领域
本发明涉及人类乳头瘤病毒(Human Papilloma Virus, HPV)的检测方法,特别是 基于Solexa测序法的HPV检测方法。
背景技术
宫颈癌是世界上女性癌症的第二号杀手,仅次于乳腺癌。每年全世界约有50万新 发病例,25万死亡病例,其中发展中国家占2/3。我国是宫颈癌的高发区,占全球宫颈癌总 数的10%。研究表明,人乳头瘤病毒(HPV)与宫颈癌有着密切关系,是重要的致癌因子,同 时也是引发宫颈癌的必要条件之一。已经表明,超过100种的HPV能够感染皮肤(皮肤类 型)或呼吸道和肛门生殖道的粘膜(粘膜类型),超过40种的HPV能够感染子宫颈。基于 诱导的良性的,恶化前的或恶性的病变,将HPV分别分为低危型(例如HPV6,11,42,43和 44)和高危型(例如昍乂16,18,31,33和45)。因此,对HPV感染的及早发现和正确分型对 宫颈癌防治显得至关重要。目前HPV的检测方法主要有以下几种①细胞学检查,其利用宫颈刮片细胞学检 查或液基薄层细胞学检查,藉由细胞外观形态的转变来加以诊断。对于HPV感染,镜下可见 挖空细胞、角化不良以及湿疣外底层细胞。其局限性在于,HPV感染的诊断的灵敏性和特异 性较低。②免疫组化方法,其通过检测HPV的衣壳抗原来进一步明确HPV感染,其所得的阳 性反应定位明确,判断可靠。但是,衣壳抗原仅在HPV-DNA复制成熟后才产生,因此,诊断为 阴性的受试者并不能被确定为不被HPV感染,该方法灵敏性较低。③实时荧光定量PCR法 (FQ-PCR),其主要是应用荧光检测PCR仪,在PCR反应体系中加入荧光基团,利用荧光信号 积累对PCR过程中每一个循环产生的扩增产物进行实时监测,从而对模板的初始浓度进行 定量。此方法通量较低。④杂交捕获法(主要为HC-II系统),其是目前唯一获得美国FDA 认证的可用于临床的HPV DNA检测方法,并且其已获得欧洲CE及中国SDA认证。该方法使 用专用的标本采集保存器;已获得专利保护的全长SOOObp的RNA探针以及已获得专利保护 的特异性第一抗体。其原理是将核酸探针杂交到受测检体的HPVDNA上,再通过化学荧光或 酶反应借助增幅的信号进行检测。该方法所使用的核酸探针主要分为两种针对低危险型 HPV的核酸探针和针对高危险型HPV的核酸探针。该方法可用于HPV的初步筛检,但是不能 确定HPV的特定类型,也不能确定多重感染的情况。将上述检测方法联合使用,可以提高HPV检测的灵敏性并降低检测的假阴性率。 然而,这些方法的组合成本相对较高,一般只适用于经济发达地区的HPV检测和宫颈癌筛 查。对于经济较不发达地区,特别是在山区和广大农村地区,上述检测方法的联合使用存在 着较大的局限性。因此,开发适合的、低成本的HPV检测方法,是亟待解决的问题。另一方面,目前已知的HPV检测方法,例如上文描述的那些检测方法,通量都较 低。当对大规模的样品进行HPV检测时,应用上述方法是耗时耗力的,并且成本高昂。因此, 本领域迫切需要新的高通量的、低成本的HPV检测方法。

发明内容
本发明基于Solexa测序法以及PCR标签(PCR index),开发了新型的HPV检测方 法以及用于此的试剂盒。根据本发明的方法和试剂盒不仅可以实现HPV的高通量、低成本 检测,而且可以实现HPV的精确分型。定义为了更好地理解本发明,下面提供相关术语的定义和解释。如本文中所使用的,术语“PCR”是指聚合酶链式反应。如本文中所使用的,术语“Solexa测序法”是指近几年开发的新一代DNA测序法, 也称为第二代测序法。Solexa测序法与传统测序法(例如,Sanger测序法)的不同之处在 于,其采用边合成边测序的原理进行DNA序列分析。Solexa测序法具有下述优点1)成本 低,仅为传统测序成本的;2)通量高,可以同时对多个样品进行测序,并且进行一次的 Solexa测序法可以产生大约500亿(50G)个碱基的数据;3)精确性高(高于98.4% ),有 效的解决了多聚重复序列的读取问题。另一方面,高测序通量在进行测序的序列的数目确 定的情况下,又反过来提高了序列的测序深度(例如,针对每个序列,可以进行多次测序), 从而确保了测序结果的可靠性。如本文所使用的,术语“测序深度”是指一段DNA序列在测 序数据中集中出现的次数。测序深度可以通过将测序量除以基因组长度来计算,例如测序 深度为10,表示测了 10次的整个基因组。Solexa测序法的应用十分广泛。其可以用于基因组测序,基因分型,基因多态性研 究等等。本发明的方法将Solexa测序法用于检测HPV 通过对待分析的样品进行针对HPV 的测序,然后使用本领域已知的比对程序,例如BLAST和S0AP,将所得的测序结果与HPV数 据库中的参考序列进行比对,从而实现对样品所感染的HPV的精确分型。本文中使用的HPV 数据库包含本领域已知的HPV类型的序列,所述序列可见于例如公共数据库,例如NCBI数 据库(http://www. ncbi. nlm. nih. gov/)。如本文中可互换使用的,术语“PCR标签(PCR index)”、“标签(index)”或“引物 标签(primer index) ”是指添加在PCR引物5 ‘末端的一小段碱基序列,其通过PCR扩增 可以用于标记PCR产物,从而辨别不同模板来源的PCR产物的混合物中各个PCR产物的模 板来源。通过在引物的5'末端添加标签,可以对PCR产物进行标记,从而可以将多个不同 的PCR产物混合成一个文库,用于进一步的分析和处理。文库中各个不同的PCR产物各自 具有独特的标签,从而根据各个PCR产物中独特的标签,可以将各个不同的PCR产物互相区 分开来,并将其与PCR模板一一对应。例如,当需要对多个样品进行测序时,可以在用于各个样品的引物的5'末端添 加不同的标签,然后用添加了标签的引物分别对各个样品进行PCR反应,从而对各个样品 (即,PCR产物)进行标记。PCR反应后,可以将来自各个样品的带有不同标签的PCR产物 混合在一起组成一个文库,然后应用高通量的Solexa测序法同时对文库中的各个PCR产物 进行测序。最终,在所得的测序数据中,通过独特的标签,可以将测序结果与各个PCR产物 (从而样品模板)一一对应。可以仅在用于PCR扩增的引物对的一条引物中引入标签,也可以在引物对的两条 引物中都引入标签。当在引物对的两条引物中都引入标签时,每个PCR引物对与一对标签 组合成一对标签引物,其中正向和反向PCR引物的5'端分别具有正向标签和反向标签,并
4且正反标签和正反引物序列是对应的,且正向标签和反向标签可以是相同的,或不同的。设计标签时需要考虑多种因素,包括1)标签序列中应当避免3个或3个以上的 单碱基重复序列;2)所有标签的同一位点中碱基A和碱基C的总含量应在所有碱基含量 的30% -70%之间,例如,当设计100条不同的标签序列时,每一条标签序列的第二个碱基 (艮P,所谓的同一位点)中A和C占该100条序列第二个碱基总量的30% -70% ;3)标签 序列本身的GC含量应在40-60%之间;4)标签之间的序列差异应大于4个碱基;5)标签序 列中应避免出现与用于测序的引物相似度高的序列;6)当标签序列添加到PCR扩增引物上 后,应避免PCR扩增引物形成发卡结构和二聚体等二级结构。如本文中所使用的,术语“标签引物(index primer) ”是指带有标签的引物,其包 含2个部分,标签部分和引物部分,其中标签部分用于在PCR扩增反应中标记PCR产物,而 引物部分与模板碱基互补配对,用于扩增模板,并且其中标签部分,任选地通过连接序列, 连接至引物部分的5'端。如本文中所使用的,术语“接头(adapter) ”或“文库接头(libraryadapter) ”是指 经设计的一段碱基序列,其可以连接至文库中的扩增后的PCR产物上,从而文库中的所有 扩增后的PCR产物都可以借助该接头进行测序,例如,使用针对该接头设计的测序引物(而 无需使用针对各PCR产物设计的特异性测序引物)进行测序。优选地,本发明的接头可以 通过“PCR-FREE ”方法连接至PCR产物上。如本文中所使用的,术语“PCR-FREE”是指不进行PCR反应而直接将接头连接至 PCR产物上,例如通过使用DNA连接酶将接头连接至PCR产物上。利用PCR-Free方法来 构建测序文库是本领域技术人员已知的,参见例如,Nature Methods 6,291-295 (2009)。 “PCR-FREE”方法由于整个过程无需进行PCR而具有以下有利方面1)减少了纯化步骤,降 低了花费的时间和成本;2)减少了非特异性扩增;3)在含有许多序列高度相似的PCR产物 的文库的构建过程中,避免由PCR引入错误,从而提高最后的测序结果的准确性。如本文中所使用的,本发明的方法和试剂盒可以使用至少1种接头。不同的接头 可以共有相同的一段序列(在本文中称为“测序序列”),并且可进一步包含不同的特征序 列,从而,不同的接头可以共用相同的引物(其针对相同的测序序列进行设计)进行测序, 并且利用独特的特征序列可以辨别多个文库的混合物中各个PCR产物的文库来源,S卩,对 不同文库来源的PCR产物进行进一步的标记。将标签与具有不同特征序列的接头组合,可以大大提高标记的效率(参见图1)。 例如,使用100种标签可以标记100个样品,而使用100种标签和200种具有不同特征序列 的接头,可以标记100*200 = 20000个样品。因此,本发明的一个方面提供了一组标签,其包含至少10种,优选至少20种、至少 30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种或95种标签,并 且所述标签具有选自SEQ ID NO :1-95的序列。在一个优选实施方案中,该组标签至少包括 SEQ ID NO: 1-10,或 SEQ ID NO 11-20,或 SEQ ID NO :21_20,或 SEQ ID NO :31_40,或 SEQ ID NO :41-50,或 SEQ ID NO :51_60,或 SEQ ID NO :61_70,或 SEQ ID NO :71_80,或 SEQ ID N0:81-90,或SEQ ID NO :91_95所示的标签,或者其任何两个或者多个的组合,例如SEQ ID NO 1-95所示的标签。在本发明的一个优选实施方案中,本发明的标签用于标记SEQ IDNO :96_106所示的PCR引物,从而用于进行高通量HPV测序、检测或分型。本发明的一个方面提供了一种标签引物组,其包含11种标签引物,所述标签引物 的序列包含标签序列和PCR弓I物序列,并且所述标签序列,任选地通过连接序列,连接至所 述PCR引物序列的5'端,其中1)所述标签序列选自SEQ ID NO 1_95,且标签引物组中的11种标签引物的每一 种的标签序列都相同,和2)所述11种标签引物的PCR引物序列分别如SEQ ID NO :96_106所示。本发明的标签引物组可扩增出至少16种大约170bp的产物,其对应于HPV基因组 中最为保守的基因区(Li区)中的一段高度保守的DNA序列。因此,本发明的标签引物组 可用于HPV的精确分型。在一个优选实施方案中,本发明的标签引物组可用于HPV测序、检测或分型,从而 其可用于医疗用途,例如诊断HPV的存在和确定HPV的类型等,以及非医疗用途,例如构建 HPV数据库,鉴定HPV的新的类型和亚型,研究HPV类型分布的地域性特点,流行病学研究和 疫苗研制等。在另一个优选实施方案中,本发明的标签引物组可用于制备试剂盒,所述试剂 盒可用于HPV测序、检测或分型。本发明的另一个方面提供了一种标签引物套组,其包含至少10个,优选至少20 个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个或95 个上文描述的标签引物组。优选地,标签引物套组中,各个标签引物组所使用的标签序列 互不相同。更优选,标签引物套组中所使用的标签序列至少包括SEQ IDNO 1-10,或SEQ ID NO :11-20,或 SEQ ID NO :21_20,或 SEQ ID NO :31_40,或 SEQ ID NO :41_50,或 SEQ ID NO :51-60,或SEQ ID NO :61_70,或SEQ ID NO :71_80,或SEQ ID NO :81_90,或SEQ ID NO: 91-95所示的标签序列,或者它们任何两个或者多个的组合,例如SEQID NO :1_95所示的标 签序列。在一个优选实施方案中,本发明的标签引物套组可用于高通量HPV测序、检测或 分型,从而其可用于医疗用途,例如大规模的HPV相关疾病的诊断和HPV的精确分型(为临 床诊断和治疗方案选择提供依据)等,以及非医疗用途,例如构建HPV数据库,鉴定HPV的 新的类型和亚型,研究HPV类型分布的地域性特点,流行病学研究和疫苗研制等。在另一个 优选实施方案中,本发明的标签弓I物套组可用于制备试剂盒,所述试剂盒可用于高通量HPV 测序、检测或分型。本发明的另一个方面提供了一种试剂盒,其包含上文描述的标签引物组或标签引 物套组。优选,本发明的试剂盒还包含至少1种,优选至少2种、至少10种、至少20种、至 少30种、至少40种、至少50种、至少100种或至少200种接头。在一个优选实施方案中,所 述接头适用于Solexa测序法,例如其可用于构建测序文库,例如所述接头可具有选自SEQ ID N0:121-132的序列。在一个优选实施方案中,通过PCR-FREE方法,例如DNA连接酶法, 使用接头来构建测序文库。在一个优选实施方案中,本发明的试剂盒可用于高通量HPV测序、检测或分型,并 且如上所述,其可用于医疗用途和非医疗用途。本发明的另一个方面提供了用于对一个或多个样品进行HPV测序、检测或分型的 方法。所述方法包括使用上文描述的标签引物组或标签引物套组或试剂盒对各个样品的DNA进行扩增,然后进行测序以获得样品的序列的步骤。本发明的另一个方面提供了用于对一个或多个样品进行HPV测序、检测或分型的 方法,其包括下列步骤提供η个样品,η为大于等于1的整数,所述样品优选地来自哺乳动物,更优选是 人,且优选是脱落细胞;可选地,将待分析的η个样品分成m个小组,m为整数且η > m > 1 ;1)对于每一个样品,使用一个标签弓I物组对样品的DNA进行扩增,其中所述标签引物组包含11种标签引物,所述标签引物的序列包含标签序列和PCR引 物序列,并且所述标签序列,任选地通过连接序列,连接至所述PCR引物序列的5'端,其中i)所述标签序列选自SEQ ID NO :1_95,并且所述11种标签引物的每一种的标签 序列都相同,和ii)所述11种标签引物的PCR引物序列分别如SEQ ID NO :96_106所示,其中,不同的样品使用的标签引物组可以相同或者不同,并且不同的标签引物组 使用不同的标签序列;2)将步骤1)中的使用不同标签引物组进行扩增所获得的扩增产物混合在一起, 得到一个或多个PCR产物文库; 3)通过PCR-FREE方法,例如DNA连接酶法给步骤2)中获得的一个或多个PCR产 物文库分别添加接头,从而构建一个或多个测序文库,其中不同的测序文库所使用的接头 可以相同或者不同,且不同的接头共有相同的测序序列,但具有不同的特征序列;4)任选地,将步骤3)中获得的使用不同接头的测序文库混合在一起,得到一个或 多个文库混合物;5)对步骤3)中获得的一个或多个测序文库或步骤4)中获得的一个或多个文库混 合物分别进行测序,其中利用二代测序技术,优选Pair-End技术(例如Solexa、Illumina Hiseq 2000)进行测序;6)根据标签引物组的标签引物序列,或者根据标签引物组的标签引物序列以及接 头的特征序列,将测序结果与样品一一对应;其中所述样品优选是脱落细胞,且优选来源于动物,例如人。在优选的实施方案中,本发明的方法使用至少10个,优选至少20个、至少30个、 至少40个、至少50个、至少60个、至少70个、至少80个、至少90个或95个上文描述的标签 引物组。进一步优选地,所使用的标签序列至少包括SEQ ID N0:l-10,或SEQ ID NO 11-20, 或 SEQ ID NO :21-20,或 SEQ ID NO :31_40,或 SEQ ID NO :41_50,或 SEQ ID N0:51_60,或 SEQ ID NO :61-70,或 SEQ ID NO :71_80,或 SEQ ID NO :81_90,或 SEQ ID N0:91_95 所示的 标签序列,或者它们任何两个或者多个的组合,例如SEQ ID NO: 1-95所示的标签序列。在本发明的方法的一个优选实施方案中,本发明的方法使用至少1种,优选至少2 种、至少10种、至少20种、至少30种、至少40种、至少50种、至少100种或至少200种接 头,例如所述接头可具有选自SEQ ID NO 121-132的序列。在本发明的方法的一个优选实施方案中,在测序后,将获得的样品序列与上文描 述的HPV数据库中的序列进行对比,从而对样品进行HPV精确分型。在本发明的另一个方面,本发明基于Solexa测序法提供了用于对多个样品进行 高通量HPV测序、检测或分型的方法,所述样品优选是脱落细胞,且优选来源于动物,例如人,所述方法包括下列步骤1)将待分析的样品分成m个小组,m为彡1的整数;2)对每个样品小组进行如下步骤2a)从待分析的样品中提取DNA ;2b)根据用于扩增HPV DNA的引物组中的所有引物的序列,设计一套标签,标签的 个数η等于该样品小组的样品数目;2c)将2b)中设计的每一个标签分别添加至引物组的所有正向引物或所有反向引 物或所有引物的序列的5'末端,从而提供η个标签引物组;2d)使用2c)中提供的标签引物组对2a)中获得的样品DNA进行PCR扩增,从而提 供PCR产物,其中针对每个样品DNA,使用不同的标签引物组;和2e)将2d)中的所有PCR产物混合在一起,获得PCR产物文库;3)给2)中得到的PCR产物文库加上接头,其中各个PCR产物文库使用不同的接 头,从而构建m个测序文库,其中各个接头共有相同的测序序列,而具有互不相同的特征序 列;4)将m个测序文库混合在一起,利用二代测序技术,优选Pair-End技术(例如 Solexa, Illumina Hiseq 2000)进行测序;得到所有样品的测序结果;5)根据测序结果中的接头的特征序列、标签的序列以及引物的序列,将获得的测 序结果与样品一一对应;和任选地,将每个样品的测序结果与HPV数据库进行比对,从而实 现HPV测序、检测或分型。在一个优选实施方案中,使用本领域技术人员熟知的方法进行DNA提取。例 如,可以使用自动化的DNA提取仪和DNA提取试剂盒进行DNA提取,例如可商购获得的 KingFisher自动提取仪,例如美国Thermo Scientific Kingfisher Flex全自动磁珠提取 纯化系统。在一个优选的实施方案中,2b)中的引物组包含11条引物,其序列分别如SEQ ID NO 96-106所示。这11条引物组成的引物组可扩增出至少16种大约170bp的产物,其对 应于HPV基因组中最为保守的基因区(Li区)中的一段高度保守的DNA序列。因此,通过 对该扩增产物进行精确测序,可以实现HPV的精确分型。在又一个优选的实施方案中,2b)中设计的标签的个数为至少10个,优选至少20 个,至少30个,至少40个,至少50个,至少60个,至少70个,至少80个,至少90个,或至少 100个。优选,标签可具有选自SEQ ID NO :1_95的序列。在优选的实施方案中,不同样品小 组之间的所使用的标签可以相同或者不同。在优选的实施方案中,引入正向引物的标签与 引入反向引物的标签可以相同或者不同。在特别优选的实施方案中,2b)中设计的标签至少 包括 SEQ ID N0:l-10,或 SEQ ID NO 11-20,或 SEQ ID NO :21_20,或 SEQ ID N0:31_40,或 SEQ ID NO :41-50,或 SEQ ID NO :51_60,或 SEQ ID NO :61_70,或 SEQ ID NO :71_80,或 SEQ ID N0:81-90,或SEQ ID NO :91_95所示的标签,或者它们任何两个或者多个的组合。在特 别优选的实施方案中,2b)中设计的标签如SEQ ID N0:l-95所示。在一个优选的实施方案中,使用PCR-FREE方法,给PCR产物文库加上接头,例如使 用DNA连接酶。特别地,在本发明的方法中,由于不同HPV类型之间的DNA序列高度相似, 因此,本发明的测序文库的构建必须通过PCR-FREE方法来完成。相反,如果通过采用常规的pooling PCR将接头连接至PCR产物上来构建测序文库,那么所得到的文库中将含有大 量的与原模板不一致的产物,导致不能对原模板进行准确测序。在一个优选的实施方案中, 使用的接头的数目为至少1种,优选至少2种、至少10种、至少20种、至少30种、至少40 种、至少50种、至少100种或至少200种,例如所述接头可具有选自SEQID NO :121_132的 序列。在本发明的方法的优选实施方案中,接头是可商购获得的接头,例如可购自 IIlumina公司的PCR-free Index Adapter Oligo Mix。在另外的实施方案中,本发明也可 使用下列PCR-free接头(下划线部分为接头的特征序列)。PCR-free 接头 1 (SEQ ID NO: 121) =ATCACG5-Phos/GATCGGMGAGCACACGTCTGMCTCCAGTCACATCACGATCTCGTATGCCGTCTTCTGCTTGPCR-free 接头 2 (SEQ ID NO 122) =CGATGT5-Phos/GATCGGMGAGCACACGTCTGMCTCCAGTCACCGATGTATCTCGTATGCCGTCTTCTGCTTGPCR-free 接头 3 (SEQ ID NO 123) =TTAGGC5-Phos/GATCGGMGAGCACACGTCTGMCTCCAGTCACTTAGGCATCTCGTATGCCGTCTTCTGCTTGPCR-free 接头 4 (SEQ ID NO: 124) =TGACCA5-Phos/GATCGGMGAGCACACGTCTGMCTCCAGTCACTGACCMTCTCGTATGCCGTCTTCTGCTTGPCR-free 接头 5 (SEQ ID NO 125) =ACAGTG5-Phos/GATCGGMGAGCACACGTCTGMCTCCAGTCACACAGTGATCTCGTATGCCGTCTTCTGCTTGPCR-free 接头 6 (SEQ ID NO: 126) =GCCAAT5-Phos/GATCGGMGAGCACACGTCTGMCTCCAGTCACGCCMTATCTCGTATGCCGTCTTCTGCTTGPCR-free 接头 7 (SEQ ID NO 127) =CAGATC5-Phos/GATCGGMGAGCACACGTCTGMCTCCAGTCACCAGATCATCTCGTATGCCGTCTTCTGCTTGPCR-free 接头 8 (SEQ ID NO: 128) =ACTTGA5-Phos/GATCGGMGAGCACACGTCTGMCTCCAGTCACACTTGMTCTCGTATGCCGTCTTCTGCTTGPCR-free 接头 9 (SEQ ID NO: 129) =GATCAG5-Phos/GATCGGMGAGCACACGTCTGMCTCCAGTCACGATCAGATCTCGTATGCCGTCTTCTGCTTGPCR-free 接头 10 (SEQ ID NO: 130) =TAGCTT5-Phos/GATCGGMGAGCACACGTCTGMCTCCAGTCACTAGCTTATCTCGTATGCCGTCTTCTGCTTGPCR-free 接头 11 (SEQ ID NO 131) =GGCTAC5-Phos/GATCGGMGAGCACACGTCTGMCTCCAGTCACGGCTACATCTCGTATGCCGTCTTCTGCTTGPCR-free 接头 12 (SEQ ID NO: 132) =CTTGTA5-Phos/GATCGGMGAGCACACGTCTGMCTCCAGTCACCTTGTMTCTCGTATGCCGTCTTCTGCTTG在一个优选的实施方案中,本发明的方法使用Solexa测序仪(例如,Illumina Genome Analyzer IIx测序仪)进行Solexa测序法。在另外的优选的实施方案中,HPV数 据库包含本领域已知的HPV类型的序列,所述序列例如可见于例如公共数据库,例如NCBI 数据库(http://www. ncbi. nlm. nih. gov/)。在本发明的方法的一个优选实施方案中,样品可以是脱落细胞。在另一个优选实 施方案中,样品可以来源于动物,优选哺乳动物,更优选人。发明的有益效果
本发明的新型的HPV检测方法和用于此的试剂盒相对于现有技术具有以下有利方面。1)高通量。通过使用标签与具有不同特征序列的接头,进行一次本发明的方法,可 检测甚至10000份样品,从而本发明的方法可以广泛用于疾病普查工作,成为早期诊断疾 病的有效手段。2)低成本。本发明采用Solexa测序法进行测序,测序成本大大降低(仅为常规测 序法的),从而HPV检测成本大大降低。3)可对HPV进行精确分型。通过使用多条引物(例如本发明的6条正向引物和5 条反向引物)进行扩增,并将扩增产物的序列信息与HPV数据库进行比对,可以精确地确定 HPV的类型,从而为临床诊断和治疗方案选择提供依据。另外,使用本发明的方法还有利于发现新的HPV类型,包括已有的类型中的新的 亚型和变异体,为科学研究提供更有效和方便的工具。下面将结合附图和实施例对本发明的实施方案进行详细描述,但是本领域技术人 员将理解,下列附图和实施例仅用于说明本发明,而不是对本发明的范围的限定。根据附图 和优选实施方案的下列详细描述,本发明的各种目的和有利方面对于本领域技术人员来说 将变得显然。


图1为经标签和具有独特的特征序列的接头标记后的PCR产物的示意图。在本 发明的示例性方法中,通过PCR在每个样品的PCR产物两端同时引入标签;把多个带有不 同标签的PCR产物混合在一起,用于构建测序文库。在测序文库的构建过程中,当需要时, 可以构建多个测序文库时,其中通过使用具有不同特征序列的接头,来标记各个测序文库。 文库构建完毕后,经具有不同特征序列的接头标记的多个测序文库可以混合在一起,并用 Solexa测序法进行同时测序(不同的测序文库之间所使用的标签可以相同或不同)。最 后,根据测序结果中的接头的特征序列和标签的序列信息,可将测序结果与每个样品一一 对应。图2为部分PCR产物的琼脂糖凝胶电泳图。从电泳图上可观察到,PCR产物条带 的大小为约170bp。其中,泳道M是50bp DNA分子梯,泳道1_14为随机挑选的HPV阳性样 本的PCR产物。
具体实施例方式采用本发明的方法,对190份已知HC-II结果的样品进行HPV基因分型,结果发 现采用本发明的方法所得的结果不仅与已知的HC-II结果一致,而且实现了对HPV的精确 分型。实施例1 样品提取根据厂商的说明书,使用KingFisher自动提取仪(美国ThermoSc ientific Kingfisher Flex全自动磁珠提取纯化系统)从190份已知HC-II结果的脱落细胞中提取 DNA。使用程序“BioeaSy-200l·! 1 BloodDNA-KF. msz”,进行核酸提取。程序结束后,获得 100 μ 1左右的洗脱产物(提取的DNA),用作下一步PCR扩增中的模板。
实施例2 =PCR扩增把实施例1中获得的190份DNA依次编号为1_190,并平均分为2组(HPV-1组编 号1-95 ;HPV-2组编号96-190)。根据用于扩增HPV DNA的引物组(包括6条正向引物和 5条反向引物)的各条引物的序列(表2,SEQ ID N0:96-107),设计一套标签,共95个(表 1, SEQ ID N0:l-95)。将设计的每一个标签分别添加至引物组的各条引物的序列的5'末 端,从而获得95个标签引物组,其中每个标签引物组包括相应的6条正向标签引物和5条 反向标签引物,并且不同的标签引物组使用不同的标签(即,95个标签引物组与95个标签 --对应)。在96孔板中对所有样品进行PCR反应,共使用2块板(HPV-1组和HPV-2组各1块 板)。使用实施例1中获得的DNA作为模板,并且在HPV-I组和HPV-2组(各95个样品) 中,针对每个样品,使用不同的标签引物组进行PCR扩增(S卩,95个样品与95个标签引物组 一一对应)。记录下每一个标签引物组(每一个标签)对应的样品的编号信息。每块板中 还设置一个不添加模板的阴性对照。2块板中的阴性对照所用的引物分别与样品1和样品 96所用的引物相同。表1 标签与样品的相关信息。
表2 未添加标签的用于扩增HPV DNA的引物组的各条引物的序列信息。
引物。使用下列PCR参数进行扩增95 "C 30 秒一48 "C 30 秒一72 °C 30 秒(40 个循环)72°C 10 分钟一12°C⑴PCR反应体系为25 μ 1,其组成是(所有试剂均购自Enzymatics公司) PCR反应在Bio-Rad公司的PTC-200PCR仪上运行。PCR完成后,取3 μ 1 PCR产物 在2. 5%的琼脂糖凝胶上进行电泳检测(图2)。实施例3 =PCR产物的混合和纯化把HPV-I组与HPV-2组中剩余的PCR产物各混合在一个3ml的EP管中(同样标 记为HPV-I组和HPV-2组),并震荡混勻。从2管混合物中各取出500 μ 1 DNA,并根据厂 商的说明书,使用Qiagen DNAPurification试剂盒进行过柱纯化,得到200 μ 1 DNA。使用 Nanodrop8000 (Thermo Fisher Scientific公司),测定纯化后的混合物的DNA浓度分别为 98ng/ μ 1 (HPV-1 组)和 102ng/ μ 1 (HPV-2 组)。实施例4 =Solexa测序文库的构建4. 1 末端修复反应使用Thermomixer (Eppendorf公司),对实施例3中获得的经纯化的两管DNA混合 物分别进行DNA末端修复反应。修复反应的反应体系为ΙΟΟμ 1,其组成是(所有试剂均购 自 Enzymatics 公司)
16 反应条件为20°C,30分钟。根据厂商的说明书,使用QIAquick PCR Purification试剂盒纯化并回收DNA末 端修复反应的产物。回收的产物溶于34μ1 EB(QIAGENElution Buffer)中。4.2:3'末端加A反应使用Thermomixer (Eppendorf公司),对回收的DNA进行3'末端加A反应。反应 体系为50ul,其组成是(所有试剂均购自Enzymatics公司): 反应条件为37°C,30分钟。根据厂商的说明书,使用MiniElute PCR Purification Kit (QIAGEN公司)纯化 并回收3'末端加A反应的产物。回收的产物溶于20μ 1的EB中。4. 3 添力口 Solexa 接头使用Thermomixer (Eppendorf公司),对上一步获得的2种产物分别添加不同的接 头以构建2个测序文库。记录下接头和文库的对应关系。添加Solexa接头的反应体系为50ul,其组成是(所有试剂均购自Illumina公 司)
反应条件为20°C,15分钟。根据厂商的说明书,使用Ampure Beads (Beckman CoulterGenomics)纯化反应产 物并将产物溶于17 μ 1去离子水。使用AgilentBioanalyzer 2100 (Agilent公司)和荧光 定量PCR(QPCR)测定产物的DNA浓度,结果如下 实施例5 So Iexa测序以Agilent Bioanalyzer 2100所测浓度为准,将上一步所得的2种产物等摩尔混 合在一起(各取IOpmol DNA)。根据厂商的说明书,使用Solexa测序仪(Illumina Genome Analyzer IIx测序仪),用Solexa PE-75程序进行测序。实施例6 结果分析根据测序结果中的接头的特征序列以及标签引物(标签部分和引物部分)的序列 的信息,将测序结果与每个样品一一对应。然后,使用本领域已知的比对程序,例如BLAST 和S0AP,将每个样品的测序结果与HPV数据库进行比对,从而实现HPV检测,并对HPV进行 精确分型。所得到的检测结果与已知的结果完全一致(参见表3),表明本发明方法可以用于 精确检测样品中的HPV。表3 :190个样品的检测结果。
18 此外,本发明的方法还可以对样品中的HPV进行精确分型。表4中提供了图2所 示的泳道1-14所对应的样品的测序序列和分型结果。
参考文献本文中用于举例说明本发明或提供关于本发明的实施的另外的详细内容的专利、
出版物和其他材料通过引用合并入本文,并且为方便起见按下列文献目录提供。[1]. Pectasides D,Kanposioras K,Papaxoinis G et al. Chemotherapy for recurrent cervical cancer. Cancer TreatmentReviews,2008,34(7) :603_613.[2]. Brink, A. A.,P. J. Sni jders, and C. J. Mei jer. HPVdetection methods. Dis. Markers 2007,23 :273_281·[3]. IARC. Handbooks of cancer prevention. Cervix cancer screening [R]. Lyon :IARC Press,2005.[4].Doorbar, J. Molecular biology of human papillomavirusinfection and cervical cancer. Clin. Sci. 2006,110 :525_54L[5].Cox T,Cuzick J. HPV DNA testing in cervical cancerscreening :From evidence to policies.Gyneeol Oncol,2006,103 :8_1L[6]. Kulmala S,syljhen. Human papillomavirus testing withthe hybrid capture assay and PCR as screening tools. ClinMicrobiol,2004,42(6) :2470_2475.[7]. Quai1,M. et al. ,A large genome center's improvementsto the Illumina sequencing system. Nat. Methods,2008,5,1005-1010.[8]. Brown, C. G. et al.,Solexa/Illumina GAPipeline productand product documentation, Illumina Inc,2006.[9].Lozano,R. Successfully integrating humanpapi1lomavirus testing into your practice. Arch. Pathol. LabMed, 2003,127 :991_994.
权利要求
一组标签,其包含至少10种,优选至少20种、至少30种、至少40种、至少50种、至少60种、至少70种、至少80种、至少90种或95种标签,所述标签具有选自SEQ ID NO1 95的序列,并且优选所述标签用于标记SEQ ID NO96 106所示的PCR引物;优选该组标签至少包括SEQ ID NO1 10,或SEQ ID NO11 20,或SEQ ID NO21 20,或SEQ ID NO31 40,或SEQ ID NO41 50,或SEQ ID NO51 60,或SEQ ID NO61 70,或SEQ ID NO71 80,或SEQ ID NO81 90,或SEQ ID NO91 95所示的标签,或者其任何两个或者多个的组合。
2.权利要求1的一组标签用于进行高通量HPV测序、检测或分型的用途,优选其用于标 记SEQ ID NO 96-106所示的PCR引物。
3.一种标签引物组,其包含11种标签引物,所述标签引物的序列包含标签序列和PCR 引物序列,并且所述标签序列,任选地通过连接序列,连接至所述PCR引物序列的5'端,其 中1)所述标签序列选自SEQID NO :1-95,并且所述11种标签引物的每一种的标签序列 都相同,和2)所述11种标签引物的PCR引物序列分别如SEQID NO :96_106所示。
4.权利要求3的标签引物组的用途,其用于HPV测序、检测或分型,或用于制备试剂盒, 所述试剂盒用于HPV测序、检测或分型。
5.一种标签引物套组,其包含至少10个,优选至少20个、至少30个、至少40个、至少 50个、至少60个、至少70个、至少80个、至少90个或95个权利要求3的标签引物组,其中, 每个标签引物组所使用的标签序列互不相同,优选所使用的标签序列至少包括SEQ ID NO 1-10,或 SEQ ID NO :11-20,或SEQ ID NO :21_20,或 SEQ ID NO :31_40,或 SEQ ID NO :41_50, 或 SEQ ID NO :51-60,或 SEQ ID NO :61_70,或 SEQ ID NO :71_80,或 SEQ ID N0:81_90,或 SEQ ID NO :91-95所示的标签序列,或者它们任何两个或者多个的组合。
6.权利要求5的标签引物套组的用途,其用于高通量HPV测序、检测或分型,或用于制 备诊断试剂盒,所述试剂盒用于高通量HPV测序、检测或分型。
7.一种试剂盒,其包含权利要求3的标签引物组或权利要求5的标签引物套组,并且 优选还包含至少1种,优选至少2种、至少10种、至少20种、至少30种、至少40种、至少50 种、至少100种或至少200种接头,优选所述接头适用于Solexa测序法,例如适用于构建测 序文库,例如所述接头可具有选自SEQ ID NO 121-132的序列。
8.权利要求7的试剂盒用于高通量HPV测序、检测或分型的用途。
全文摘要
本发明涉及人类乳头瘤病毒(Human Papilloma Virus,HPV)的检测方法,特别是基于Solexa测序法的HPV检测方法。
文档编号C12Q1/70GK101921748SQ20101021373
公开日2010年12月22日 申请日期2010年6月30日 优先权日2010年6月30日
发明者刘涛, 徐佳佳, 易鑫 申请人:深圳华大基因科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1