一种用于乳腺癌发病风险预测的多因素模型及其建立方法与流程

文档序号:11272088阅读:1056来源:国知局
一种用于乳腺癌发病风险预测的多因素模型及其建立方法与流程

本发明涉及乳腺癌的发病风险评估领域,具体涉及一种采用多种高危因素结合胚系基因突变构建的用于乳腺癌发病风险预测的多因素模型及其建立方法,特别适用于家族性乳腺癌高危人群预测。



背景技术:

乳腺癌是女性最常见恶性肿瘤之一。2014年中国肿瘤登记年报数据显示,2012年中国乳腺癌发病率达42.55/10万,并以每年2-3%的速度增加,城市地区尤为明显。月经初潮年龄早、绝经年龄晚、不孕、营养过剩、肥胖、饮食、乳腺癌家族史等危险因素与乳腺癌发病有关。而家族史是最确定的乳腺癌高危因素之一,家族性乳腺癌在整个乳腺癌人群中占相当大的比例。如果能对这部分人群进行早期筛查、早期诊断,采取积极的干预措施,对降低我国乳腺癌发病率和提高这部分人群术后生存率,具有重要意义。

国外在10年前就开始研究评估家族性乳腺癌发病风险的模型,并且先后开发出了以gail、claus、cuzick-tyrer、brcappo和myriad等模型。gail及claus模型是在西方应用较为广泛的风险评估模型。缺点是该模型在亚洲女性人群中的应用效果仍缺乏相关证据。cuzick-tyrer、brcappo和myriad模型尽管结合了相关高危因素及brca基因突变检测,但这些模型建立的数据是主要来源于北美和欧洲人群。因此这些模型对中国人群的基因风险评估意义值得探讨。



技术实现要素:

本发明为解决现有技术中的上述问题,提出一种采用多种高危因素结合胚系基因突变构建的用于乳腺癌发病风险预测的多因素模型及其建立方法。

为实现上述目的,本发明采用以下技术方案:

本发明的第一个方面是提供一种用于乳腺癌发病风险预测的多因素模型的建立方法,包括对基因检测的筛查,所述筛查具体包括如下步骤:

(1)外周血样本的收集及处理;

(2)构建样本的文库dna,并采用hiseq测序平台进行上机测序,保证每个文库的原始的数据量达到0.6gb以上,目标区域的平均测序深度为200x,目标区域覆盖度达99%以上;

(3)对下机数据进行生物信息分析找到样本中的点突变和插入/缺失突变,并对目标区域的乳腺癌易感基因突变进行解读,找出致病突变;

(4)采用金标准sanger测序技术对突变位点进行测序,根据测序峰图分析目标位点的突变情况,验证高通量测序所获突变位点的准确性,获得准确基因突变信息。

进一步地,所述步骤(1)中外周血样本的收集及处理的具体方法为:每个受试者使用edta抗凝管收集约5ml静脉血,上下混匀,经dna提取试剂盒dnabloodminikit提取样本中基因组dna200ul,使用2.0检测dna浓度,每份样本的dna获得量≥2μg。

进一步地,所述步骤(2)中构建样本文库dna的具体方法为:基因组dna经随机打断、纯化、末端修复加a后,与hiseq测序所需特殊接头连接,然后经pcr预扩增,乳腺癌易感基因芯片目标区域靶向杂交捕获和pcr再扩增后,得到目标区域dna的hiseq上机文库。

进一步地,所述步骤(3)中对下机数据进行生物信息分析的具体方法为:对原始测序数据进行初步处理和质量控制,将所得序列用bwa软件比对到人的参考基因组hg19上,经picard和gatk软件去重,校正和突变检测后,找到样本中的点突变和插入/缺失突变。

进一步地,所述步骤(4)中采用金标准sanger测序技术对突变位点进行测序的具体方法为:首先,对该突变位点所在的区域设计引物进行pcr扩增,然后以提取的基因组dna为模板,使用设计的引物进行pcr扩增,扩增的条件为:95℃预变性3min;94℃变性25sec,57℃退火30sec,72℃延伸40sec,30个循环;最后72℃充分延伸8min;40ul扩增的体系为:2xkapa2grobusthotstartreadymix20ul,引物f和r各2ul(10um),dna模板1ul(50ng/ul)后,最后加双蒸水补至40ul;pcr产物经琼脂糖凝胶电泳验证后,进行pcr产物纯化及测序。

进一步地,还包括对常规高危因素的筛选:以乳腺癌家族史的发病人群及未患病人群为受试人群,确定受试者的肿瘤家族史、乳腺良性疾病史、月经史、初潮史、是否绝经、流产史、母乳喂养史、钼靶照射史、是否服用雌激素类药物。

进一步优选地,还包括对上述基因检测的筛查和常规高危因素的筛选两部分进行数据统计分析,建立用于乳腺癌发病风险预测的多因素模型,包括:先单因素分析筛选到有统计学意义的乳腺癌危险因素:分别为家族史,乳腺良性疾病史,怀孕史,乳腺钼靶照射史,及atm、brca2、brip1基因突变;再根据logistic回归分析,最终得到预测乳腺癌发病风险模型:

y=1.614+0.764x1+0.324x2-1.699x3-1.970x4+1.619x5

其中,x1=家族史,x2=乳腺良性疾病史,x3=怀孕史,x4=乳腺钼靶照射史,x5=brca基因突变y=乳腺癌发病风险。

本发明的第二个方面是提供一采用上述方法建立的种用于乳腺癌发病风险预测的多因素模型,所述多因素模型为:

y=1.614+0.764x1+0.324x2-1.699x3-1.970x4+1.619x5

其中,x1=家族史,x2=乳腺良性疾病史,x3=怀孕史,x4=乳腺钼靶照射史,x5=brca基因突变y=乳腺癌发病风险。

本发明的第三个方面是提供一种用于样本收集的抗凝管,其包括管体,管体包括粗管和细管两部分,粗管与细管之间平滑过渡连接,粗管的管口处设置有密封盖,密封盖的中央设置有一个可直接在采血点采血的取血管,该取血管穿过密封盖伸入细管的内腔中。

进一步地,在用于样本收集的抗凝管中,所述细管的内腔为横截面呈三星形或椭圆形的腔体。

本发明采用上述技术方案,与现有技术相比,具有如下技术效果:

本发明用于乳腺癌发病风险预测的多因素模型,采用多种高危因素结合胚系基因突变构建,其主要由常规高危因素和基因突变因素两大部分构成,通过对单因素分析筛选到有统计学意义的乳腺癌危险因素进行数据统计,再根据logistic回归分析;该用于乳腺癌发病风险预测的多因素模型,能对这部分人群进行早期筛查、早期诊断,采取积极的干预措施,特别适用于家族性乳腺癌高危人群预测,对降低我国乳腺癌发病率和提高这部分人群术后生存率,具有重要意义。

附图说明

图1为本发明一种用于乳腺癌发病风险预测的多因素模型的logistic回归线性关系图;

图2为本发明一种用于乳腺癌发病风险预测的多因素模型的建立流程图。

具体实施方式

下面通过具体实施例对本发明进行详细和具体的介绍,以使更好的理解本发明,但是下述实施例并不限制本发明范围。

一种评估家族性乳腺癌发病风险的多因素预测模型主要有常规高危因素和基因突变因素两大部分构成。

如图2所示,本发明实施例的评估家族性乳腺癌发病风险的多因素预测模型的建立方法包括以下步骤:

(1)高危因素的筛选:

选择乳腺癌家族史的发病人群及未患病人群进行随访调查研究。调查内容包括:肿瘤家族史,乳腺良性疾病史,月经史,初潮史,是否绝经,流产史,母乳喂养史,钼靶照射史,是否服用雌激素类药物等;受试人群获得知情同意之后,填写调查问卷,后期统计分析。

(2)基因检测的筛查:

(a)人全血dna的提取

每个受试者使用edta抗凝管收集约5ml静脉血,上下混匀,经dna提取试剂盒dnabloodminikit提取样本中基因组dna200ul,使用2.0检测dna浓度,每份样本的dna获得量≥2μg。

(b)样本的文库构建与上机测序

基因组dna经随机打断、纯化、末端修复加a后,与hiseq测序所需特殊接头连接,然后经pcr预扩增,乳腺癌易感基因芯片目标区域靶向杂交捕获和pcr再扩增后,得到目标区域dna的hiseq上机文库。经质控合格后的文库dna,按照hiseq测序平台的操作说明进行上机测序,保证每个文库的原始的数据量达到0.6gb以上,目标区域的平均测序深度为200x,目标区域覆盖度达99%以上。

(c)生物信息分析与突变解读

下机数据由专业人士进行解读,首先对原始测序数据进行初步处理和质量控制,然后将所得序列用bwa软件比对到人的参考基因组hg19上,经picard和gatk软件去重,校正和突变检测后,找到样本中的点突变和插入/缺失突变;最后,对目标区域的乳腺癌易感基因突变进行解读,找出致病突变。

(d)sanger验证

为了验证高通量测序所获突变位点的准确性,采用金标准sanger测序技术对突变位点进行测序验证。首先对该突变位点所在的区域设计引物进行pcr扩增,然后以提取的基因组dna为模板,使用设计的引物进行pcr扩增,扩增的条件为:95℃预变性3min;94℃变性25sec,57℃退火30sec,72℃延伸40sec,30个循环;最后72℃充分延伸8min。40ul扩增的体系为:2xkapa2grobusthotstartreadymix20ul,引物f和r各2ul(10um),dna模板1ul(50ng/ul)后,最后加双蒸水补至40ul。pcr产物经琼脂糖凝胶电泳验证后,进行pcr产物纯化及测序。最后根据测序峰图分析目标位点的突变情况。

(3)数据统计分析,建立多因素预测模型:先单因素分析筛选到有统计学意义的乳腺癌危险因素:分别为家族史,乳腺良性疾病史,怀孕史,乳腺钼靶照射史,及atm、brca2、brip1基因突变;再根据logistic回归分析,最终得到预测乳腺癌发病风险模型:

y=1.614+0.764x1+0.324x2-1.699x3-1.970x4+1.619x5

其中,x1=家族史,x2=乳腺良性疾病史,x3=怀孕史,x4=乳腺钼靶照射史,x5=brca基因突变y=乳腺癌发病风险,如图1所示为用于乳腺癌发病风险预测的多因素模型的logistic回归线性关系图。

本发明实施例还提供了提供一种用于样本收集的抗凝管,其包括管体,管体包括粗管和细管两部分,粗管与细管之间平滑过渡连接,粗管的管口处设置有密封盖,密封盖的中央设置有一个可直接在采血点采血的取血管,该取血管穿过密封盖伸入细管的内腔中。优选地,细管的内腔为横截面呈三星形或椭圆形的腔体。

以上对本发明的具体实施例进行了详细描述,但其只是作为范例,本发明并不限制于以上描述的具体实施例。对于本领域技术人员而言,任何对本发明进行的等同修改和替代也都在本发明的范畴之中。因此,在不脱离本发明的精神和范围下所作的均等变换和修改,都应涵盖在本发明的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1