一种与乳腺癌相关的SNP标记的制作方法

文档序号:11126035阅读:557来源:国知局
本发明涉及生物医学
技术领域
,具体涉及一种与乳腺癌相关的SNP标记。
背景技术
:乳腺癌是一种全身性疾病、其发生和发展是一个涉及多因素、多环节的复杂过程,包括癌基因的激活以及抑癌基因的失活等。因此,基因突变在乳腺癌的发生、发展过程中起着非常重要的作用。乳腺癌是一个多因素遗传变异性疾病,只有不足10%是由于单基因缺陷引起的。随着高通量基因技术的发展,越来越多与乳腺癌相关基因被发现,这些基因上潜在的遗传变异(单核苷酸多态和拷贝数变异)可能引起乳腺癌药物治疗效果的差异。由于遗传变异的存在使抗肿瘤药物的代谢途径以及药物作用的目标基因可能受到影响,进而影响疗效以及预后。SNP(singlenucleotidepolymorphism,SNP,即单核苷酸多态性)是1996年由美国麻省理工学院的人类基因组研究中心学者Lander提出的一类分子遗传标记,主要是指基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。SNP表现出的多态性仅涉及到单个碱基的变异,表现是有转换、颠换、插入和缺失等。单核苷酸多态性为第三代遗传标志,人体许多表型差异、对药物或疾病的易感性等等都可能与SNP有关。目前对于不同分型乳腺癌预后、疗效的预测性研究主要集中在SNP水平。SNP赋予个体对环境暴露、药物治疗等的不同反应,从而产生不同的表型,因此SNP可能是导致个体疾病发生发展差异的重要遗传基础。利用疾病易感的SNP谱诊断疾病,具有快速、灵敏、准确等特点,因而应用前景广阔。近年来,利用SNP诊断疾病的发生发展已成为临床和科研工作者的研究热点。然而,目前还没有将SNP应用于乳腺癌诊断的报道,若能筛选出乳腺癌易感的SNP作为生物标志物,并研制相应的诊断试剂盒,必将有力地推动我国乳腺癌早期诊断的现状,并为其药物筛选、药效评价及靶向治疗开辟新的途径。技术实现要素:本发明的目的是针对上述技术问题,提出一种与乳腺癌辅助诊断相关的生物标志物。本发明的第二个目的是提供所述生物标记物在预测乳腺癌诊断试剂中的应用。本发明的第三个目的是提供乳腺癌辅助诊断试剂盒。发明人通过分离和研究乳腺癌患者及与其年龄匹配的健康女性对照外周血DNA中的单核苷酸多态性,寻找一组与乳腺癌高度相关的高特异性和敏感性的SNP,并研制出可便于临床应用的乳腺癌辅助诊断试剂盒,为乳腺癌的筛查和诊断提供数据支持。本发明的目的是通过下列技术方案实现的:一种与乳腺癌相关的SNP标记,所述生物标记物包括位于基因C12orf45核苷酸序列自5’端起第8187位碱基发生了由C到G的SNP位点突变,所述SNP位点突变为C12orf45:NM_152318:exon4:c.C368G:p.S123W。其中,基因C12orf45(chromosome12openreadingframe45),是位于人类第12号染色体上的一个开放阅读框,其基因组序列为NC_000012.12,共8408bp;NM_152318是C12orf45的一个转录本,所述SNP位点突变发生在该转录本的第4个外显子上,并且第368位发生了由C到G的错义突变,该突变导致了编码蛋白由丝氨酸S到色氨酸W的转变。进一步地,本发明提供了所述生物标记物在预测乳腺癌诊断试剂中的应用。优选的,所述的试剂包括用于扩增所述SNP位点的引物对,或是包括用于扩增所述SNP位点的引物对和限制性内切酶。优选的,扩增所述SNP位点的引物对具有SEQIDNO:3-4所示的核苷酸序列。优选的,所述引物对扩增的核苷酸序列SEQIDNO:1所示。更近一步地,本发明提供了一种乳腺癌辅助诊断的试剂盒,其包括检测位于基因C12orf45核苷酸序列自5’端起第8187位SNP位点基因型的试剂。优选的,所述的试剂包括用于扩增所述SNP位点的引物对,或是包括用于扩增所述SNP位点的引物对和限制性内切酶。优选的,扩增所述SNP位点的引物对具有SEQIDNO:3-4所示的核苷酸序列。优选的,所述试剂盒还包括PCR反应常用的酶和试剂,如dNTPs、Taq酶、Mg2+、PCR反应缓冲液等;还可以含有标准品和/或对照品。本发明有益效果:本发明研究SNP在乳腺癌辅助诊断的应用前景,阐述SNP对于乳腺癌进展的影响,揭示其诊断价值。因此,本发明通过SNP生物标志物和诊断试剂盒的研制和应用,可使得乳腺癌的诊断更加方便易行,为临床医生快速准确掌握患者病情,为临床治疗效果评价奠定基础,并为发现具有潜在治疗价值的新型小分子药物靶标提供帮助。具体实施方式以下实施例用于说明本发明,但不用来限制本发明的范围。若未特别指明,实施例中所用的技术手段为本领域技术人员所熟知的常规手段。本发明的技术方案具体包括:采集符合标准的血液样本,系统收集完整的人口学资料和临床资料;基因型检测:选择乳腺癌病例、与乳腺癌病例年龄匹配的健康女性对照,利用外显子测序,找出与乳腺癌相关的SNP;对筛选出的阳性关联SNP,进一步采用基因分型进行检测,验证其应用于临床诊断的可重复性;乳腺癌辅助诊断试剂盒的研制:根据乳腺癌病例和健康女性对照中基因型分布频率有显著差异的SNP开发SNP辅助诊断试剂盒。数据分析中各数值表示如下:1、ljb23_sift:SIFT分值(version2.3),表示该变异对蛋白序列的影响,包含三个值,一是SIFT初始分值,二是转换后的值(1-SIFT),三是T或者D。当该变异同时影响多个蛋白序列时,对每条蛋白序列有一个SIFT值,取最小值。SIFT分值越小越“有害”,表明该SNP导致蛋白结构或功能改变的可能性大;D:Deleterious(sift<=0.05);T:tolerated(sift>0.05));2、ljb23_pp2hvar:利用PolyPhen2基于HumanVar数据库预测该变异对蛋白序列的影响,用于单基因遗传病。该列包含两个值,第一个是PolyPhen2分值,数值越大越“有害”,表明该SNP导致蛋白结构或功能改变的可能性大;第二个是D或P或B(D:Probablydamaging(>=0.909),P:possiblydamaging(0.447<=pp2_hvar<=0.909);B:benign(pp2_hvar<=0.446));3、ljb23_pp2hdiv:利用PolyPhen2基于HumanDiv数据库预测该变异对蛋白序列的影响,用于复杂疾病。该列包含两个值,第一个是PolyPhen2分值,数值越大越“有害”,表明该SNP导致蛋白结构或功能改变的可能性大;第二个是D或P或B(D:Probablydamaging(>=0.957),P:possiblydamaging(0.453<=pp2_hdiv<=0.956);B:benign(pp2_hdiv<=0.452));4、ljb23_mt:tionTaster分值(version2.3),表示该变异对蛋白序列的影响,包含三个值,一是MutationTaster初始分值,二是转换后的值,三是A、D、N或者P。第二个值越大越“有害”,表明该SNP导致蛋白结构或功能改变的可能性大,其中"A"("disease_causing_automatic");"D"("disease_causing");"N"("polymorphism");"P"("polymorphism_automatic")。具体来说研究的实验方法主要包括以下几个部分:1.研究样本的选择(1)经病理学明确诊断的乳腺癌病例25例和与乳腺癌病例年龄匹配的健康女性10例作为对照,其中乳腺癌病例中有3例病人具有癌症家族史;(2)采血前未接受过放疗或化疗、无既往肿瘤病史;(3)与病例年龄匹配的健康女性对照2.酚-氯仿法提取外周血基因组DNA,按常规方法操作。通常能得到20-50ng/μLDNA,纯度(紫外2600D:2800D)在1.6-2.0。3.全外显子芯片检测(1)取受试者全基因组DNA样本;(2)在全外显子芯片(北京诺禾致源科技股份有限公司,下同)上进行扫描;(3)检测并比较各基因型在乳腺癌病例与健康女性对照中的分别差异。4.单个SNP的基因分型(1)取受试者DNA样本;(2)设计单个SNP的特异性扩增引物;(3)进行PCR反应,回收产物进行测序;(4)比较乳腺癌病例与健康女性对照中不同基因型的分布差异。5.诊断试剂盒制备方法全外显子芯片进行扫描和单个SNP检测后确定乳腺癌病例与健康女性对照中基因型分布频率有显著差异的SNP,作为乳腺癌诊断的指标。筛选出的与乳腺癌发病有关的SNP辅助诊断试剂盒,其包括检测位于基因C12orf45核苷酸序列自5’端起第8187位SNP位点基因型的试剂,诊断试剂盒还可以包括这些SNP的特异性扩增引物,以及Taq酶、dNTPs等试剂。6.临床应用例利用本发明人制备的乳腺癌辅助诊断试剂盒检测待筛查的乳腺癌患者并与实际临床检测相比较以确定了乳腺癌辅助诊断试剂盒的有效性。具体包括测定受试者血标本cDNA中上述SNP的特异性扩增引物和其他检测试剂,为临床医生快速准确掌握患者的疾病状态和病情严重程度,及时采取更具个性化的防治方案提供支持。实施例1样品的收集和样品资料的整理发明人于2010年1月至2015年12月在深圳市第二人民医院收集了大量的新发乳腺癌患者血标本,通过对样品资料的整理,发明人从中选择了25例符合下列标准的样本,同时选择10例年龄在25-55岁健康女性作对照进行全外显子芯片检测,样本选择标准如下:1、经病理学明确诊断的乳腺癌病例,其中有3例病人具有癌症家族史并分别标记为X1、X2、X3;2、采血前未接受过放疗或化疗、无既往肿瘤病史;3、与病例年龄匹配的健康女性对照并系统采集了这些样本的人口学资料和临床资料等情况。实施例2外周血DNA的提取和纯化在上述符合条件的25例乳腺癌患者和10例健康女性对照中,两组年龄均衡可比。具体步骤为:1、向储存于2mL冻存管中的外周血加入溶血试剂(即裂解液,40份量配置方法如下:蔗糖219.72g、氯化镁2.02g和曲拉通X-100(amresco0694)20mL混合后,用TrisHcl溶液定容至2000mL,下同),颠倒混匀后完全转入。2、去除红细胞:用溶血试剂将5mL离心管补至4mL,颠倒混匀,4000rpm离心10分钟,弃上清。向沉淀中加入4mL溶血试剂,再次颠倒混匀清洗一次,4000rpm离心10分钟,弃上清。3、抽提DNA:向沉淀中加1mL抽提液(每300mL中含有122.5mL0.2M氯化钠,14.4mL0.5M乙二胺四乙酸,15mL10%十二烷基硫酸钠,148.1mL双蒸水,下同)和8μL蛋白酶K,振荡器上充分振荡混匀,37℃水浴过夜。4、去除蛋白质:加1mL饱和酚充分混匀(手轻摇15分钟),4000rpm离心10分钟,取上清转入新的5mL离心管中。在上清液中加入等体积氯仿与异戊醇混合液(氯仿:异戊醇=24:1,v/v,下同),充分混匀后(手摇15分钟),4000rpm离心10分钟,取上清(分入两个1.5mL的离心管)。5、DNA沉淀:在上清液中加入3M的醋酸钠60μL,再加入与上清液等体积的冰无水乙醇,上下轻摇,可见白色絮状沉淀物,再以12000rpm离心10min。6、DNA洗涤:在沉淀中加入冰无水乙醇1mL,12000rpm离心10min,弃上清后真空抽干或置于清洁干燥环境中蒸干。7、测量浓度:通常能得到20-50ng/μLDNA,纯度(紫外2600D:2800D)在1.8-2.0。实施例3SNP的全外显子组检测将实施例2中两组人群经全外显子芯片检测获得相关结果。1、文库构建北京诺禾致源科技股份有限公司采用Agilent的液相芯片捕获系统,对人的全外显子区域DNA进行高效富集,然后在IlluminaHiseq平台上进行高通量、高深度测序。建库和捕获实验采用AgilentSureSelectHumanAllExonV5试剂盒,严格使用说明书推荐的试剂和耗材,并参照最新的经过优化的实验流程进行操作。实验基本流程:将基因组DNA经Covaris破碎仪随机打断成长度为180-280bp的片段,经末端修复和加A尾后在片段两端分别连接上接头制备DNA文库。带有特异index的文库pooling后与多达543,872个生物素标记的探针进行液相杂交,再使用带链霉素的磁珠将20,965个基因的334,378个外显子捕获下来,经PCR线性扩增后进行文库质检,合格即可进行上机测序。2、库检文库构建完成后,先使用Qubit2.0进行初步定量,稀释文库至1ng/μL,随后使用Agilent2100对文库的insertsize进行检测,insertsize符合预期后,使用Q-PCR方法对文库的有效浓度进行准确定量(文库有效浓度>2nM),以保证文库质量。3、上机测序库检合格,根据文库的有效浓度及数据产出需求进行IlluminaHiseq平台测序。4、数据分析与处理经过数据筛选、深度加工和生物信息学序列比对,最终确定“乳腺癌病例”组和“健康女性对照”组中发现的基因型分布频率有显著差异的53个SNP位点为优选敏感级位点。其中,位于基因C12orf45核苷酸序列自5’端起第8187位碱基为G的SNP位点,所述位点为C12orf45:NM_152318:exon4:c.C368G,该位点变异对蛋白影响值如下:ljb23_sift:0,1.00,Dljb23_pp2hvar:0.951,Dljb23_pp2hdiv:0.999,Dljb23_mt:0.996,0.004,N。该位点经过生物信息学分析,可以确认为乳腺癌候选标志物。实施例4利用危险度评分方法进一步分析SNP与乳腺癌的发病风险本发明人通过对2组样品(“乳腺癌病例组”和“健康女性对照组”)基因型分布频率的比较,选择阳性关联的SNP,以全外显子扫描样本中单个SNP回归系数为权重,进一步求得危险分值,绘制ROC来评价诊断的灵敏性和特异性,进而诊断这些SNP对乳腺癌发病的判断能力。对所有SNP标志物的联合分析发现,位于基因C12orf45:NM_152318:exon4第368位碱基为G/C的突变,其灵敏度和特异度都达到60%以上。因此,本发明人证明了该位点标志物能够很好地将健康女性对照和乳腺癌患者区分。实施例5单个SNP的基因分型1、取5例乳腺癌患者和5例健康女性对照DNA样本同实施例2;2、PCR扩增利用PrimerPremier5软件对C12orf45:NM_152318:exon4:c.C368G设计单个SNP的特异性扩增引物如表1所示。表1引物序列PCR反应体系如表2所示。PCR扩增程序为:95℃预变性10min,94℃变性15s,61℃退火15s,72℃延伸30s,进行30个循环,最后72℃延伸30min,于4℃保存,过夜需放置-20℃冷冻。表2反应体系组分加入量2×mix25μL上游引物(10uM)3.0μL下游引物(10uM)3.0μL模板5μL加入灭菌蒸馏水至50μL3、测序PCR扩增结束后,取5μL扩增产物,1%琼脂糖凝胶电泳,电泳30min,染色20min,然后将凝胶块置于凝胶成像仪中观察,根据比对Marker的片段大小情况,初步判断扩增片段是否正确。进而对符合要求的扩增产物进行纯化:采用Mag-BindOligonucleotidePurificationKit试剂盒,并按试剂盒要求进行操作。上样测序:采用ABI公司BigDye3.1SequencingKit试剂盒,并按试剂盒要求进行操作;用ABI公司3730型测序仪进行测序。4、结果分析通过Chromas序列分析软件,将测序结果与标准序列进行比对,寻找SNP位点,通过分析SNP位点处碱基的类型,就可以得到SNP位点的基因型。结果显示:5例乳腺癌患者测序得到392bp的片段的核苷酸序列如SEQIDNO.1所示,其在第239位碱基为CG、GG;而5例健康女性对照测序得到392bp的片段的核苷酸序列如SEQIDNO.2所示,其在第239位碱基为CC;证实了该位点为CG、GG基因型时判断为乳腺癌的易感基因型,该位点为CC基因型时判断为乳腺癌的非易感基因型,从而进一步确认所述C12orf45:NM_152318:exon4:c.C368G的SNP位点可用于乳腺癌的检测、治疗、诊断、预后评估等辅助诊断。实施例6用于乳腺癌辅助诊断SNP试剂盒的制作基于实施例5得到的引物组,组装本发明所述的用于乳腺癌的试剂盒,所述试剂盒包括特异扩增如SEQIDNO.1所示的核苷酸序列的引物对如SEQIDNO:3和SEQIDNO:4所示。所述试剂盒还可以有相应PCR技术所需的常用试剂,如:dNTPs,MgCl2,双蒸水,Taq酶等,这些常用试剂都是本领域技术人员熟知的,另外还可以有标准品和对照(如确定基因型的标准品和空白对照等)。此试剂盒的价值在于只需要外周血而不需要其他组织样品,通过最精简和特异的引物对检测SNP,再通过SNP谱辅助判断乳腺癌,不仅稳定,检测方便,且精确,大大提高疾病诊断的敏感性和特异性,因此将此试剂盒投入实践,可以帮助指导诊断和更有效的个体化治疗。虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。序列表<110>深圳市第二人民医院<120>一种与乳腺癌相关的SNP标记<130>P1690<160>4<170>PatentInversion3.5<210>1<211>392<212>DNA<213>人工序列<400>1ttgctcatcaactcccaacctaagtccagaaagacctccactcttcaaacagttcggata60gagaggagtcccttattggaccaggtacagacatttctcccacagatggcacgggcaaat120gaaaagctaagaaaagaaatggcagctgcaccacctggtcgtttcaatattgaaaacatt180gatgggcctcatagtaaagttatacaaatggatgtggctttgtttgagatgaatcagtcg240gattcaaaagaagtggacagttcagaagagagttcacaagacagttcagagaacagttca300gaatcagaagacgaagatgacagcatcccatctgaagtcaccatagataacattaagctt360cccaattctgaaggtggaaaaggcaagattga392<210>2<211>392<212>DNA<213>人工序列<400>2ttgctcatcaactcccaacctaagtccagaaagacctccactcttcaaacagttcggata60gagaggagtcccttattggaccaggtacagacatttctcccacagatggcacgggcaaat120gaaaagctaagaaaagaaatggcagctgcaccacctggtcgtttcaatattgaaaacatt180gatgggcctcatagtaaagttatacaaatggatgtggctttgtttgagatgaatcagtcg240gattcaaaagaagtggacagttcagaagagagttcacaagacagttcagagaacagttca300gaatcagaagacgaagatgacagcatcccatctgaagtcaccatagataacattaagctt360cccaattctgaaggtggaaaaggcaagattga392<210>3<211>23<212>DNA<213>人工序列<400>3ttgctcatcaactcccaacctaa23<210>4<211>23<212>DNA<213>人工序列<400>4cttccaccttttccgttctaact23当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1