本发明涉及一种egfr基因突变的检测试剂盒及检测方法,特别是涉及到检测egfr基因的18、19、20、21外显子上的热点突变检测,属于分子生物学技术领域。
背景技术:
人类表皮生长因子受体(epidermalgrowthfactorreceptor,egfr)基因位于人类7号染色体短臂7p12~14区,由28个外显子组成,该蛋白属于受体酪氨酸激酶(tki)家族,存在于所有正常上皮和部分间叶来源的细胞。egfr可以激活酪氨酸激酶,从而打开下游信号通路最终介导细胞分化、生存、迁移、侵袭、黏附和细胞损伤修复等一系列过程,在肿瘤恶性生长中发挥重要作用。因此,egfr成为肿瘤靶向治疗研究的一个重要靶点。
目前,临床上egfr的靶向治疗主要基于小分子酪氨酸激酶抑制剂(egfr-tki)和单克隆抗体两种机制。其中,基于egfr-tki机制的吉非替尼(gefitinib,商品名易瑞沙)和厄洛替尼(erlotinib,商品名特罗凯),是目前肿瘤患者最有效的靶向药物。但这些靶向药物并非对所有患者有效,egfr敏感突变是药物有效的前提。临床研究结果表明,吉非替尼对egfr外显子18、19或21发生突变的患者,有效率可达80%,而对野生型患者基本无效。此外,研究表明部分egfr-tki类药物初始治疗有效的患者在后期会发生耐药反应,这与egfr20号外显子的突变密切相关,其中50%的egfr-tki耐药由外显子20的t790m点突变所致。
文献报道(chansk,etal,eurjcancer,2006,42(1):17-23),egfr基因的酪氨酸激酶区存在多种突变,其中29种为常见突变(见表1),主要集中在外显子18-21上,其中约90%存在于外显子19和21上,包括外显子19上747-750位氨基酸之间的19种常见缺失突变约占突变的45%;外显子21上的l858点突变约占突变的40-45%,这些位点也是中国人egfr基因的热点突变(韩宇等,中华肿瘤学杂志,2007,29(4):278-282;郭健等,中国肺癌杂志,2007,10(6):504-507)。由于egfr-tki类的靶向药物的价格昂贵,如果病人不携带egfr突变而服用此类药物,不仅耽误病情还造成巨额药费的浪费。因此,在用药前筛查肿瘤患者是否携带egfr突变显得尤为重要,也是未来肿瘤个体化治疗的发展方向。目前,检测肿瘤组织中的egfr突变的方法很多,其中,国内外主要采用的是基因测序技术。该法费用较低,但操作耗时长,并且它有两个明显的缺点:一是灵敏度低,一般需要突变基因丰度达到10%以上才能准确检测,对于低于10%的样品出现假阴性的结果。二是由于后续需要对pcr产物进行处理,容易出现污染,导致假阳性结果的出现。
taqman探针技术是一种通过检测pcr过程中和pcr之后产生的荧光信号来区分等位基因类型的snp检测技术。为特异地识别待检snp位点,需要一对taqman探针及其对应上下引物。这对探针分别检测snp位点的两种等位基因,其3’端连有荧光淬灭剂,5’端分别连有两种不同的荧光染料。在pcr扩增过程中,利用taq酶5’核酸酶活性降解与目标序列完全互补的探针,并使荧光剂与淬灭剂分离而发出荧光。如果探针与目标序列间存在错配,就会大大减少荧光的释放量。taqman探针技术最突出的优点是不需要分离或洗脱等pcr后处理过程,从而提高了检测速度。
技术实现要素:
本发明的目的是:提供一种检测egfr基因上热点突变的试剂盒,该试剂盒主要是利用了taqman探针对热点突变进行多重pcr反应并检测。
技术方案是:
一种egfr基因突变的荧光定量检测试剂盒,包括有用于检测egfr上18、19、20、21外显子上突变的引物和探针。
在一个实施例中,所述的突变如下表所示:
表1
在一个实施例中,以上的各个突变是按每两个为一组进行荧光定量多重pcr反应检测。
在一个实施例中,g719a和e746_t751del为一组、g719s和l747_t751del为一组、t790m和l858r为一组、s768i和l861q为一组。
在一个实施例中,每一个突变上包括有一条上游引物和下游引物,还包括一条针对野生型的探针和一条针对变异型的探针。
在一个实施例中,引物和探针序列以及在pcr反应体系中的浓度如下表所示:
表2
表格中,f是指正向引物、r是指反向引物、w是提检测野生型的探针、m是指检测突变型的探针。
在一个实施例中,反应体系的组成是:reactionmix5μl,引物和探针的混合液6μl,c-taq酶0.7μl,dna提取液1ng-4ng,补水至25μl;所述的reactionmix组成(终浓度为1×):tris-hcl浓度为50mm,kcl50mm,bsa1.2mg/ml,mgcl2为2.4mm,dntp为0.2mm,甜菜碱0.6m,tween-20体积占2%,剩余成分为水。
本发明的另一个方面,还提供了了一种检测方法,包括如下步骤:
提取dna样本,采用上述的试剂盒对样本分成4管进行pcr扩增,收集荧光信号;
将待测样本的信号值与标准品信号值进行对比,判定待测样本的突变类型。
在一个实施例中,所述的pcr扩增过程中扩增程序:25℃1min收集荧光;95℃2min热变性;95℃15s,60℃50s,共进行40个循环;25℃1min收集荧光。
在一个实施例中,所述的检测方法是用于非治疗与诊断目的。
有益效果
本发明提供的egfr突变的检测试剂盒,可以应用于18、19、20、21号外显子上的热点突变的检测,同时采用了四色荧光多重pcr反应体系,具有检测效率高、敏感性好、特异性好的优点。
附图说明
图1是实施例1中g719a杂合子突变样本的pcr荧光曲线图;
图2是实施例1中g719s杂合子突变样本的pcr荧光曲线图;
图3是实施例1中e746_t751del杂合子突变样本的pcr荧光曲线图;
图4是实施例1中l747_t751del杂合子突变样本的pcr荧光曲线图;
图5是实施例1中t790m杂合子突变样本的pcr荧光曲线图;
图6是实施例1中s768i杂合子突变样本的pcr荧光曲线图;
图7是实施例1中l858r杂合子突变样本的pcr荧光曲线图;
图8是实施例1中l861q杂合子突变样本的pcr荧光曲线图;
图9是实施例2中l861q杂合子突变样本的pcr荧光曲线图;
图10是实施例2中l861q杂合子突变样本的pcr荧光曲线图;
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。但本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件(例如参考j.萨姆布鲁克等著,黄培堂等译的《分子克隆实验指南》,第三版,科学出版社)或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。
本发明中的术语:
如本文所用的,术语“参考基因组”或“参考序列”是指任何生物体或病毒的任何具体的已知基因组序列(无论是部分的或完整的),它可以用于对来自受试者的识别的序列进行参比。例如,用于人类受试者以及许多其他生物体的参考基因组可见于美国国家生物技术信息中心(thenationalcenterforbiotechnologyinformation),在ncbi.nlm.nih.gov。“基因组”是指生物体或病毒的完整遗传学信息,其在核酸序列中被表达。
“等位基因”一般是指dna区段,同源染色体上的相同物理位置上,控制相对性状的一对基因。在一些情况下,等位基因可以对应于特定物理基因座上的单核苷酸的替换。在其它情况中,等位基因可以对应于核苷酸(单个或多个)插入或缺失。
“引物”意指在与多核苷酸模板形成双链体时,能够充当核酸合成的起始点,并自其3’末端沿模板延伸,从而形成延伸的双链体的天然或合成的寡聚核苷酸。延伸过程中添加的核苷酸序列是由模板多核苷酸的序列决定的。引物通常由dna聚合酶延伸。
“探针”通常指在研究中与寡聚核苷酸或靶核酸互补的寡聚核苷酸。以允许检测的方式,例如用荧光或其他任选地可辨别的标签标记要求保护的本发明的某些方面中所用的探针。例如,sybrgreen和其它dna结合染料都是检测探针。一些检测探针可以是序列特异性的,例如taqman探针。
本发明中,探针、引物与dna模板之间为互补,具体是指:寡核苷酸具有在延伸反应的条件下能够与包括特定序列的目标核酸形成双键状态的碱基序列,但并不要求完全互补,也可以含有几个不匹配碱基对。本发明所述的匹配是指:双链状态的核酸序列碱基对形成为沃森-克里克(watson-crick)碱基对的状态,不匹配是指:没有形成沃森-克里克碱基对的状态。沃森-克里克碱基对是指:脱氧核糖核酸的两个多核苷酸分子组成腺嘌呤(a)和胸腺嘧啶(t)、鸟嘌呤(g)和胞核嘧啶(c)组,并通过氢键连接的碱基对。那么,探针、引物与dna模板序列可以完全匹配,也可以有几个碱基的不匹配,只要能与相同的目标碱基序列位置互补即可实现本发明的技术方案。
“热稳定性的聚合酶”是指对热稳定性的或热抗性的酶,主要指dna聚合酶,该酶在pcr扩增时,在升高的温度条件下不会发生失活。
寡核苷酸的“tm”或“熔解温度”是指一段dna中50%的分子与互补序列杂交时的温度。tm值可以使用熟知的公式来计算(见,maniatis,t.等人:molecularcloning,coldspringharbor,n.y.:1982)。
“灵敏性”是指能够被检出模板的最小量(拷贝数)。
“特异性”是指区分匹配模板和错配模板的能力。
引物及探针的设计直接关系到snp位点的准确分型。其遵守设计原则:1、探针5’端尽可能靠近上游引物;2、因g碱基的荧光淬灭作用,5’端避免用g碱基;3、整条探针的c碱基高于g碱基;4、因使用探针检测突变位点的特异性,探针中包含有突变位点,一般将突变位点放于探针3’端2个碱基的前方;5、探针需要绝对的保守。检测同一突变位点的两条探针除待检测的碱基的区分外,其长度及组成碱基稍有区别,以提高探针的单一性及特异性;6、探针的退火温度高于上下游引物的退火温度,一般为10度;为保证单管内每个反应的同步性,引物的退火温度尽量保持一致(一般60℃左右,oligo6.0计算)。
为保证检测的准确性,单个位点的两条探针的扩增效率尽量保持一致。探针与模板的结合能力及探针的特异性是保证检测准确的重要的因素,但结合能力强的探针特异性偏弱,可能引发非特异扩增,影响到最终的分型结果。当待检模板为杂合子时,两条探针为竞争关系;而在检测纯合子模板时,探针的特异性尤为重要,否则会引发纯合子误判为杂合子的错误分型。探针的退火温度,定量体系中探针的浓度选择,以及snp位点在探针碱基组成的位置均与探针模板间结合速率,探针特异识别模板的能力有直接的相关性。探针中snp位点与5’端的距离关系到探针特异识别能力,一般将snp位点放置于距3’端1/3处;探针的退火温度影响到探针与对应模板的结合速率,退火温度的增加有益于探针与模板的结合速率。故两条探针的位置错开,以使退火温度尽量保持一致;探针的浓度则体现为最终收集的荧光rfu值。探针浓度升高,最终收集荧光值亦会增加。
综合考虑以上三个关键因素,对引物探针的设计及浓度进行优化,以杂合子检测的均衡性(两种探针的荧光rfu值的差异不低于70%),纯合子的检测特异性(另一等位基因所对应的扩增曲线的rfu值低于50)为基本评判标准,最终探针引物的设计、以及引物和探针浓度如表2。8个位点对应的引物和探针分为4组,每组2个位点,在同一个体系中进行多重扩增。其中,g719a和e746_t751del为一组、g719s和l747_t751del为一组、t790m和l858r为一组、s768i和l861q为一组。根据oligo6.0对各引物探针的性能的评价,将8个snp位点进行上述分组时,可保证基因座间的引物二聚体,发夹结构等参数在一定范围内,以减少引物非特异结合或扩增的消耗。
本发明提供的试剂盒中,还包括标准品,包括两种纯合子标准品及一种杂合子标准品,均由已知分型结果的质粒以一定的浓度构成。纯合子标准品用于识别纯合子型,杂合子标准品则可用于鉴定杂合子基因型。对标准品进行检测,杂合子标准品的扩增曲线的均衡型较好,而纯合子标准品的扩增特异性良好,无非特异扩增曲线。
上述的标准品质粒的构建可以采用常规方法,例如:在待检测的位点的上下游设计一对pcr引物,其扩增片段的长度可在500bp的范围内,用gdna为模板,采用常规pcr方法,扩增出这一片段,通过at克隆的方式,将该片段克隆至测序的质粒中,通常用invitrogen的pcr2.1topot载体试剂盒,操作按说明书进行,也可用其他厂家的t载体试剂盒,甚至可用自己制备的t载体质粒。得到的阳性克隆,经测序验证,证明序列的正确性,然后采用stratagene公司的quickchange试剂盒,设计对应位点的另一个基因型引物,通过quickchange的方法,得到该突变型别的阳性克隆,操作按说明书进行,所得到的阳性质粒都必须经测序验证为正确方可进入下一步的使用。质粒的提取采用tiangen(highpureplasmidkit,dp116)的质粒提取试剂盒进行,具体操作步骤详见产品说明书。所提dna溶解于tris-hcl中(10mmol/l,ph8.0),紫外分光光度计检测样本质量并测定浓度。然后,将样本稀释至的进行pcr反应。
反应体系的组成是:reactionmix5μl,引物和探针的混合液6μl,c-taq酶0.7μl,dna提取液1ng-4ng,补水至25μl;所述的reactionmix组成(终浓度为1×):tris-hcl浓度为50mm,kcl50mm,bsa1.2mg/ml,mgcl2为2.4mm,dntp为0.2mm,甜菜碱0.6m,tween-20体积占2%,剩余成分为水。
pcr扩增程序:25℃1min收集荧光;95℃2min热变性;95℃15s,60℃50s,共进行40个循环;25℃1min收集荧光。
实施例1质粒标准品的检测
按上述方法构建了8个敏感突变位点的杂合子标准质粒,采用如表1所示的引物、探针进行荧光定量检测,反应体系如下:
表3
其中,reactionmix组成是:
表4
探针和引物分成4管进行多重pcr扩增,g719a和e746_t751del的探针和引物在一管、g719s和l747_t751del的探针和引物在一管、t790m和l858r的探针和引物在一管、s768i和l861q的探针和引物在一管。同时记录荧光数值。
经过检测,8个位点的扩增荧光曲线分别如图1~8所示,从图中可以看出,采用上述探针和引物可以较好地分辨出杂合突变标准品中的等位基因类型。
对照例质粒标准品的检测
按上述方法构建了8个敏感突变位点的杂合子标准质粒,采用的引物、探针与实施例1的区别是:t790m检测t型等位基因的探针为3’-catgttgcatctcttaattccttga-5’(seqidno.33),向3’端移动2个碱基,同时探针碱基数为18,反应体系如下:
表5
其中,reactionmix组成是:
表6
探针和引物分成4管进行多重pcr扩增,g719a和e746_t751del的探针和引物在一管、g719s和l747_t751del的探针和引物在一管、t790m和l858r的探针和引物在一管、s768i和l861q的探针和引物在一管。同时记录荧光数值。
其中,t790m位点检测结果如图9,显示为c型。说明该条件下探针序列并不能较好地分辨出c/t杂合突变。
实施例2质粒标准品的检测
构建了8个敏感突变位点的纯合子标准质粒,采用如表1所示的引物、探针进行荧光定量检测,反应体系如下:
表7
其中,reactionmix组成是:
表8
由于在反应体系分组时,不同的位点在同时扩增时,会相互受到影响,存在着二聚体结构、引物二聚体,发夹结构、非特异性扩增等情况。本对照例中,采用的分组是:g719a和e746_t751del为一组、g719s和l747_t751del为一组、t790m和s768i为一组、l858r和l861q为一组。
其中,l858r和l861q所在的反应体系中,l861q的扩增曲线图如图9所示,显示为a/t杂合突变,说明出现了非特异性扩增,导致误判,修改扩增体系中s768i和l861q互换之后,扩增曲线如图10所示,显示为a纯合突变。
实施例3试剂盒检测灵敏性验证
将纯合突变质粒模板从10000个拷贝开始稀释,直至稀释至5拷贝,然后分别采用上述的试剂盒和检测方法对其进行检测,并记录荧光pcr的ct值。结果如表9所示:
表9
结果表明本发明的荧光pcr方法灵敏度高,引物检测对应质粒样本,5拷贝的样本也可以成功进行判定。
实施例4病人样本的检测
获取8份来源自医院病理科的经过石蜡包埋的非小细胞肺癌病理切片,将组织切片放到染片缸中,加入二甲苯充分浸泡2个小时,用75%酒精漂洗2次,加入100%乙醇浸泡10分钟,晾干。将晾干的组织切片平放实验台上固定,用平板刮刀小心的将组织片从玻片上剥离,迅速将组织样品放入1.5mlep管中盖好盖。加入180μlatl缓冲液和20μl蛋白酶k,用震荡器充分混匀,将混合物放入水浴锅中56℃消化60分钟。将消化后的混合物放入水浴锅中90℃消化60分钟。加入200μlal缓冲液充分混匀,再加入200μl100%乙醇混匀,将混合样品放入qiaampminelutecolumn中,8000rpm离心2min,然后分别用500µlbufferaw1和500µlbufferaw2分别6000×g(8000rpm)离心1min洗脱,最后20000×g;14000rpm离心3min甩干,加入100μlate20000×g;14000rpm离心1min洗脱后收集洗脱液体进行dna质量鉴定。
采用本发明的荧光pcr方法、高通量测序法(ngs)进行对比,结果如下:
表10
从表中可以看出,本发明的荧光pcr方法检测方法与高通量测序法结果一致。
序列表
<110>邓定平
<120>一种egfr基因突变的检测试剂盒及检测方法
<130>无
<160>33
<170>siposequencelisting1.0
<210>1
<211>22
<212>dna
<213>人工序列(artificialsequence)
<400>1
caagaggagggcccccaccatc22
<210>2
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>2
ccagtggagaagctcccaacc21
<210>3
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>3
agcgtgcgcttccgaacgatgtggc25
<210>4
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>4
cggagcgtgcgcttccgaaggatgt25
<210>5
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>5
cgtgcgcttccgaacgatgtg21
<210>6
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>6
gcagcgtgcgcttctgaacgatg23
<210>7
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>7
gccagaggagggcccccaccatccc25
<210>8
<211>22
<212>dna
<213>人工序列(artificialsequence)
<400>8
gcttgtggagcctcttacaccc22
<210>9
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>9
ctccgcagcgtgcgcttccgaac23
<210>10
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>10
aaattcccgtcgctatcaaggaa23
<210>11
<211>24
<212>dna
<213>人工序列(artificialsequence)
<400>11
tcaagagagcttggttgggagctt24
<210>12
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>12
cagcactttgatctttttgaattca25
<210>13
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>13
cgcttccgaacgatgtggcgccttc25
<210>14
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>14
gtggaggtgaggcagatgcccag23
<210>15
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>15
agatcctcaagagagcttggttggg25
<210>16
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>16
cagcactttgatctttttgaa21
<210>17
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>17
ttctgggatccagagtcccttat23
<210>18
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>18
gctcatcacgcagctcatgcccttc25
<210>19
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>19
ctgctcttaattccttgatagcg23
<210>20
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>20
tgttgcatctcttaattccttgata25
<210>21
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>21
ttccttcaagatcctcaagagagct25
<210>22
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>22
tttcggagatgttgcttctctta23
<210>23
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>23
catacaccgtgccgaacgcaccg23
<210>24
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>24
ccttatacaccgtgccgaacgcacc25
<210>25
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>25
gctggccatcacgtaggcttcatcg25
<210>26
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>26
gcgacggtcctccaagtagttcatg25
<210>27
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>27
acagttgagcaggtactgggagc23
<210>28
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>28
gcacacaccagttgagcaggtac23
<210>29
<211>24
<212>dna
<213>人工序列(artificialsequence)
<400>29
tgcacggtggaggtgaggcagatg24
<210>30
<211>22
<212>dna
<213>人工序列(artificialsequence)
<400>30
caccagtacgttcctggctgcc22
<210>31
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>31
tatgcacacaccagttgagcagg23
<210>32
<211>22
<212>dna
<213>人工序列(artificialsequence)
<400>32
atttgcacacaccagttgagca22
<210>33
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>33
catgttgcatctcttaattccttga25