作为标记物用在乳腺癌风险评估、诊断、预后和治疗中的在CHR5p12和10q26上的遗传变异体的制作方法

文档序号:570575阅读:1261来源:国知局

专利名称::作为标记物用在乳腺癌风险评估、诊断、预后和治疗中的在CHR5p12和10q26上的遗传变异体的制作方法
技术领域
:本发明涉及评估对乳腺癌的易感性的方法。本发明包括通过评价已经发现与乳腺癌的增加或降低的易感性相关的一些标记物或单体型(h即lotypes)来诊断对乳腺癌的增加的易感性的方法,以及诊断对乳腺癌的降低的易感性或诊断针对癌症的保护的方法。本发明还涉及评估诊断患有乳腺癌的个体的预后的方法,评估对乳腺癌治疗剂或乳腺癌治疗的反应的可能性的方法,以及监控诊断患有乳腺癌的个体的治疗进展的方法。在一个方面,本发明涉及一种诊断对人类个体中乳腺癌的易感性的方法,所述方法包括确定从所述个体获得的核酸样品中染色体5pl2或染色体10q26上至少一个多态标记物(polymorphicmarker)的至少一个等位基因的存在或缺乏,其中所述至少一个等位基因的存在指示对乳腺癌的易感性。本发明还涉及一种通过确定来自所述个体的核酸样品中染色体5pl2上或染色体10q26上至少一个多态标记物的至少一个等位基因的存在或缺乏来确定对乳腺癌的易感性的方法,其中至少一个等位基因的存在的确定指示对乳腺癌的易感性。在另一个方面,本发明涉及一种确定人类个体中对乳腺癌的易感性的方法,包括确定在至少一个多态标记物中至少一个风险中的等位基因是否存在于来自所述个体的基因型数据组(genotypedataset)中,其中所述至少一个多态标记物选自染色体5pl2内的标记物,并且其中所述至少一个风险中的等位基因的存在的确定指示个体中对乳腺癌的增加的易感性。本发明进一步涉及一种用于确定人类个体中对乳腺癌的易感性的方法,包括确定至少一个多态标记物的至少一个等位基因是否存在于由所述个体获得的核酸样品中或者存在于来自所述个体的基因型数据组中,其中至少一个多态标记物选自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237)、以及在与其连锁不平衡中的标记物,并且其中至少一个等位基因的存在指示对于个体的乳腺癌的易感性。在一个实施方式中,所述基因型数据组包括关于标记物同一性(身份,identity)的信息,以及所述个体的等位基因状态,即,对于所述标记物由所述个体携带的关于两个等位基因同一性的信息。所述基因型数据组可以包括关于一个或多个标记物的等位基因信息,包括两个以上标记物、三个以上标记物、五个以上标记物、一百个以上标记物等。在一些实施方式中,所述基因型数据组包括来自所述个体的整个_基因组评估的基因型信息,其可以包括几十万个标记物,或者甚至一百万或更多标记物。在一些实施方式中,至少一个多态标记物与FGF10基因、HCN1基因、MRPS30基因、和/或FGFR2基因相关。在一些这样的实施方式中,所述至少一个多态标记物与FGF10基因、HCN1基因、MRPS30基因、和/或FGFR2基因在连锁不平衡中。在一些其他实施方式中,所述至少一个多态标记物选自NCBIBuild34中,位于跨越位置44,666,047和44,976,797的染色体区段内的标记物的组以及其在连锁不平衡中的标记物。在另一实施方式中,所述至少一个多态标记物选自由在表1和表3中列出的多态标记物组成的组,以及其在连锁不平衡中的标记物。在一些实施方式中,所述至少一个多态标记物选自表12、表13和表14中列出的标记物。在一个实施方式中,所述至少一个多态标记物选自如在SEQIDNO:1-237中列出的标记物。在一个实施方式中,在与标记物rs4415084连锁不平衡中的标记物选自表12中列出的标记物。在另一实施方式中,在与标记物rsl0941679连锁不平衡中的标记物选自表13中列出的标记物。在另一实施方式中,在与标记物rsl219648连锁不平衡中的标记物选自表14中列出的标记物。在一些实施方式中,进行评估个体中至少一个单体型的频率的进一步的步骤。在这样的实施方式中,两个或更多个标记物,包括三个、四个、五个、六个、七个、八个、九个或十个或更多个标记物可以被包括在所述单体型中。在一个实施方式中,所述单体型包括在染色体5pl2区中的标记物。在另一实施方式中,所述单体型包括染色体10q26区中的标记物。在一些实施方式中,所述单体型包括在与rs4415084连锁不平衡中的标记物。在一些其他实施方式中,所述单体型包括在与rsl0941679连锁不平衡中的标记物。在一些其他实施方式中,所述单体型包括在与rsl219648连锁不平衡中的标记物。在赋予乳腺癌的风险的标记物中,如此处描述的,可以与对于乳腺癌的其他遗传标记物组合。因此,在一些实施方式中,包括另外的步骤,包括确定不与表12、表13和表14中列出的标记物中的任何一个连锁不平衡的对于乳腺癌的至少一个风险中的变异体的至少一个风险中的等位基因是否存在于包含来自人类个体的基因组DNA的样品中或来自人类个体的基因型数据组中。换言之,在基因组中的其它位置中的遗传标记物可以与本发明的标记物组合使用,以便基于多遗传因子来确定乳腺癌的总风险。不在连锁不平衡中(不在LD中)的标记物的选择可以基于对于连锁不平衡的合适的测量,如这里进一步描述的。在一些实施方式中,不在连锁不平衡中的标记物对于LD测量r2具有在小于0.2的标记物之间的值。在一些其他实施方式中,不在LD中的标记物对于r2具有在小于0.15的标记物之间的值,包括小于0.10、小于0.05、小于0.02和小于0.01。用于确立标记物不在LD中的其他合适的分界值(cutoffvalue)(包括桥接任何这些值的值)被预期。10在一些实施方式中,确定如这里描述的多重标记物(多个标记物,multiplemarkers)以确定乳腺癌的总风险。因此,在一些实施方式中,包括另外的步骤,所述步骤包括确定至少两个多态标记物中的每一个中的至少一个等位基因是否存在于包括来自人类个体的基因组DNA的样品中或来自人类个体的基因型数据组中,其中所述至少两个多态标记物中的至少一个等位基因的存在指示对于乳腺癌的增加的易感性。在一个实施方式中,所述标记物选自rs4415084(SEQIDNO:235)、rsl0941679(SEQIDNO:236)和rsl219648(SEQIDNO:237),及其连锁不平衡中的标记物。基于本发明的标记物的风险评估也可以与用于从个体中获得的核酸样品中或来自所述个体的基因型数据组中对于乳腺癌的至少一个高外显遗传因子(遗传因素)的存在或缺乏的评估结合。所述对于乳腺癌的高外显遗传因子可以例如为BRCA1突变、BRCA2突变、TP53突变或PTEN突变。总之,BRCA1和BRCA2中的突变可以解释家族乳腺癌的15-20%的风险,并且这些可以解释2-3%之间的偶发的乳腺癌患者[Gorski,etal.,(2005),BreastCancerResTreat,92,19-24;(2000),BrJCancer,83,1301-8]。TP53和PTEN基因中的已知突变解释约5%的乳腺癌的总遗传风险[Easton,(1999),BreastCancerRes,1,14-7]。在一个实施方式中,高外显遗传因子是BRCA2999de15。本发明的遗传标记物也可以与非遗传信息结合以确立个体的总风险。因此,在一些实施方式中,包括进一步的步骤,包括分析非遗传信息以进行个体的风险评估、诊断、或预后。所述非遗传信息可以为关于个体的疾病状态的任何信息或可以影响个体的乳腺癌的总风险的估计的其他信息。在一个实施方式中,所述非遗传信息选自年龄、性别、种族划分、社会经济情况、先前的疾病诊断、受治疗者(受试者)的医疗史、乳腺癌的家族史、生物化学测量、以及临床测量。在另一个方面,本发明涉及一种在先前诊断有乳腺癌的个体中评估至少发展第二原发肿瘤(第二原发性肿瘤,primarytumor)的风险的方法,所述方法包括确定在由所述个体获得的核酸样品中至少一个多态标记物的至少一个等位基因的存在或缺乏,其中所述至少一个多态标记物选自由表12、表13和表14中列出的多态标记物组成的组,以及在与其连锁不平衡中的标记物,其中所述至少一个等位基因的存在指示至少发展第二原发肿瘤的风险。可替换地,本发明涉及一种确定在先前诊断有乳腺癌的个体中至少发展第二原发肿瘤的风险的方法,所述方法包括确定至少一个多态标记物的至少一个等位基因是否存在于由所述个体获得的核酸样品中,或者存在于来自所述个体的基因型数据组中,其中至少一个多态标记物选自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237),以及在与其连锁不平衡中的标记物,并且其中至少一个等位基因的存在指示至少发展第二原发肿瘤的风险。在一个这样的实施方式中,所述至少一个多态标记物选自表12、表13和表14中列出的标记物。本发明还涉及一种用于确定人类个体中乳腺癌的遗传指征(geneticindicator)的装置,包括计算机可读存储器;以及存储在计算机可读存储器上的程序;其中所述程序适于在处理器上执行以对于至少一个人类个体分析关于至少一个选自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237)的多态标记物,以及在与其连锁不平衡中的标记物的标记物和/或单体型信息,并基于所述标记物或单体型信息产生输出,其中所述输出包括作为人类个体的乳腺癌的遗传指征的至少一个标记物或单11体型的个体风险测量。在一个实施方式中,所述至少一个多态标记物选自在表12、表13和表14中列出的标记物。在一个实施方式中,所述程序进一步包括与至少一个标记物等位基因和/或单体型相关的乳腺癌的风险测量,其中所述风险测量基于诊断有乳腺癌的多个个体中至少一个多态标记物和/或单体型的至少一个等位基因的频率与多个参考个体中至少一个多态标记物和/或单体型的至少一个等位基因的频率的指征(指示符,indicator)的比较,并且其中人类个体的所述个体风险是基于个体对于至少一个标记物等位基因和/或单体型的携带者状态与对于至少一个标记物等位基因和/或单体型的风险测量的比较。例如,与对照相比,所述风险测量在一些实施方式中可以是在患有乳腺癌的个体群中,对于乳腺癌由风险中的变异体的每个拷贝提供的风险的测量。基于这样的参考数据,通过确定在特定标记物处他的/她的基因型状态并基于其计算个体的风险可以估计对于特定个体的风险。如果所述个体在他的/她的基因组中携带所述遗传风险变异体的一个拷贝,则计算的风险可以基于由所述风险变异体的单一拷贝提供的风险。如果所述个体携带所述遗传风险变异体的两个拷贝,即,所述个体对于风险中的变异体是纯合的,则与对照相比,对于所述个体的风险评估可以基于基于个体群的风险。通常,对于纯合子携带者的风险将是平方的变异体的单一拷贝的风险。用于基于在特定标记物处基因型状态来报告或估计个体的风险的其他方法也是可能的,并且在本发明的范围内。在另一个方面,本发明涉及一种鉴定用于评估对乳腺癌的易感性的标记物的方法,所述方法包括鉴定在与rsl0941679(SEQIDN0:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDN0:237)中的至少一个连锁不平衡中的至少一个多态标记物;确定诊断有乳腺癌或具有对乳腺癌的易感性的个体的样品的基因型状态;以及确定对照个体的样品的基因型状态;其中与对照样品中至少一个等位基因的频率相比,诊断有乳腺癌或具有对乳腺癌的易感性的个体中至少一个多态性中的至少一个等位基因的频率中的显著性差异指示用于评估对乳腺癌的易感性的至少一个多态性。显著性差异可以在乳腺癌患者和对照中的一些多态标记物处等位基因计数的统计分析上被评估。在一个实施方式中,显著性差异是基于乳腺癌患者与对照之间小于0.05的计算的P-值。在一个实施方式中,与对照样品中至少一个等位基因的频率相比,诊断有乳腺癌或具有对乳腺癌的易感性的个体中的至少一个多态性中至少一个等位基因的频率的增加是用于评估对乳腺癌的增加的易感性的至少一个多态性的指征。在另一个实施方式中,与对照样品中至少一个等位基因的频率相比,诊断有乳腺癌或具有对乳腺癌的易感性的个体中的至少一个多态性中至少一个等位基因的频率的减少是用于评估对乳腺癌的减少的易感性或针对乳腺癌的保护的至少一个多态性的指征。本发明还涉及一种对由人类个体获得的核酸样品进行基因型测定(基因型鉴定,genotyping)的方法,包括确定至少一个多态标记物的至少一个等位基因是否存在于来自个体样品的核酸样品中,其中所述至少一个标记物选自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)和rsl219648(SEQIDNO:237),以及在与其连锁不平衡中的标记物,并且其中所述样品中至少一个等位基因的存在的确定指示个体中对乳腺癌的易感性。在一个实施方式中,rs4415084(SEQIDNO:235)中的等位基因T、rsl0941679(SEQIDNO:236)中的等位基因G和/或rsl219648(SEQIDNO:237)中的等位基因G的存在的确定指示个体中乳腺癌的增加的易感性。在一个实施方式中,基因型测定包括通过聚合酶链反应(PCR),利用在至少一个多态标记物侧翼的核苷酸引物对来扩增包括至少一个多态标记物的核酸的区段。在另一个实施方式中,基因型测定利用选自等位基因-特异性探针杂交、等位基因_特异性引物延伸、等位基因_特异性扩增、核酸测序、5'_外切核酸酶消化、分子标志分析(molecularbeaconassay)、寡核苷酸连接分析法(oligo皿cleotideligationassay)、粒度分析(sizeanalysis)、单链构象分析和微阵列技术的方法来进行。在一个实施方式中,所述微阵列技术是分子倒位探针阵列技术(MolecularInversionProbearraytechnology)或珠阵列(BeadArray)技术。在一个实施方式中,所述方法包括等位基因_特异性探针杂交。在另一个实施方式中,所述方法包括微阵列技术。一个优选的实施方式包括以下步骤(l)在用于寡核苷酸探针与核酸特异性杂交的条件下,使所述核酸的拷贝与检测寡核苷酸探针和增强子寡核苷酸探针接触;其中(a)所述检测寡核苷酸探针的长度为5-100个核苷酸,并特异性杂交于其核苷酸序列由SEQIDNO:1-237中的任何一个给出的核酸的第一区段;(b)所述检测寡核苷酸探针包括在其3'末端处的可检测标记(detectablelabel)和在其5'末端处的猝灭部分;(c)所述增强子寡核苷酸的长度为5-100个核苷酸,并互补于相对于所述寡核苷酸探针位于5'的核苷酸序列的第二区段,使得当两个寡核苷酸杂交至所述核酸时,所述增强子寡核苷酸相对于所述检测寡核苷酸探针被定位于3';以及(d)单一碱基间隙存在于所述第一区段与所述第二区段之间,使得当所述寡核苷酸探针和所述增强子寡核苷酸探针均杂交至所述核酸时,单一碱基间隙存在于所述寡核苷酸之间;(2)用核酸内切酶处理所述核酸,所述核酸内切酶当所述检测探针被杂交至所述核酸时将从所述检测探针的3'末端剪切所述可检测标记以释放游离的(自由的)可检测标记;以及(3)测量游离的可检测标记,其中所述游离的可检测标记的存在指示所述检测探针特异性杂交至所述核酸的第一区段,并且指示作为所述检测探针的互补物的多态位点的序列。本发明的进一步的方面涉及一种评估个体对于乳腺癌治疗剂的反应的可能性的方法,包括确定至少一个多态标记物的至少一个等位基因是否存在于由所述个体获得的核酸样品中,或存在于来自所述个体的基因型数据组中,其中所述至少一个多态标记物选自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237)、以及在与其连锁不平衡中的标记物,其中所述至少一个标记物的至少一个等位基因的存在指示对所述治疗剂的阳性反应可能性。本发明在另一方面涉及一种预测诊断有乳腺癌的个体的预后的方法,所述方法包括确定至少一个多态标记物的至少一个等位基因是否存在于由所述个体获得的核酸样品中,或存在于来自所述个体的基因型数据组中,其中所述至少一个多态标记物选自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237)、以及在与其连锁不平衡中的标记物,其中所述至少一个等位基因的存在指示所述个体中乳腺癌的较坏预后。本发明的又一方面涉及一种监测经历乳腺癌治疗(处理)的个体的治疗进展(处理进展)的方法,所述方法包括确定至少一个多态标记物的至少一个等位基因是否存在于由所述个体获得的核酸样品中,或存在于来自所述个体的基因型数据组中,其中所述至少一个多态标记物选自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDN0:235)、和rsl219648(SEQIDNO:237),以及在与其连锁不平衡中的标记物,其中所述至少一个等位基因的存在指示所述个体的治疗结果。在一个实施方式中,所述治疗是通过手术进行的治疗、通过放射疗法进行的治疗、或通过药物给予进行的治疗。本发明还涉及寡核苷酸探针在制备用于诊断和/或评估人类个体中对乳腺癌的易感性的试剂中的应用,其中所述探针杂交于具有如在SEQIDNO:1-237中的任何一个中列出的核苷酸序列的核酸的区段,其中所述探针的长度是15-500个核苷酸。在一些实施方式中,所述探针的长度是约16至约IOO个核苷酸。在一些其他实施方式中,所述探针的长度是约20至约50个核苷酸。在一些其他实施方式中,所述探针的长度是约20至约30个核苷酸。本发明还涉及计算机可读介质。在一个方面,本发明涉及一种其上存储了以下的介质用于至少一个多态标记物的标识符(identifier);在多个诊断有乳腺癌的个体中所述至少一个多态标记物的至少一个等位基因的频率的指征(指示符,indictor);以及在多个参考个体中所述至少一个多态标记物的至少一个等位基因的频率的指征;其中所述至少一个多态标记物选自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDN0:235)、和rsl219648(SEQIDNO:237),以及在与其连锁不平衡中的多态标记物。在一个实施方式中,所述多态标记物选自在表12、表13和表14中列出的标记物。在另一个实施方式中,所述介质进一步包括关于多个个体的家系的信息。乳腺癌的表型的各种诊断和类别在本发明的范围内。在其最广泛的意义上,本发明涉及任何乳腺癌表型。在一些实施方式中,乳腺癌包括乳腺癌的任何临床诊断,包括但不限于侵袭性导管(invasiveductal),侵袭性小叶(invasivelobular),管状、或作为其他方式侵袭的或混合侵袭的,髓,DCIS(原位导管癌),LCIS(原位小叶癌),或另外的非侵袭的,侵袭性乳腺癌,包括阶段0、阶段1、阶段2(包括阶段2a和阶段2b)、阶段3(包括阶段3a、阶段3b和阶段3c)和阶段4乳腺癌。在一些实施方式中,所述乳腺癌表型选自全乳腺癌、多原发乳腺癌、和早期发作乳腺癌。在一些实施方式中,本发明的标记物与具有乳腺癌的家族史的个体中乳腺癌的风险相关。在一个这样的实施方式中,总计的家族史(summedfamilyhistory)(FHS)是与乳腺癌相关的表型。在另一个实施方式中,与本发明的变异体相关的乳腺癌是雌激素受体(ER)阳性和/或孕酮受体(PR)阳性乳腺癌。在一个实施方式中,所述与本发明的变异体相关的乳腺癌是雌激素受体(ER)阳性的。在另一个实施方式中,与本发明的变异体相关的乳腺癌是孕酮受体(ER)阳性的。在一个这样的实施方式中,这里描述的与对乳腺癌的增加的风险或易感性相关的标记物提供ER-阳性的和/或PR-阳性的乳腺癌的增加的风险或易感性。因此,在一些实施方式中,本发明的风险中的变异体的至少一个的存在是个体中ER阳性或PR阳性乳腺癌的预兆。在本发明的方法的一些实施方式中,在所述方法中确定的易感性是增加的易感性。在一个这样的实施方式中,增加的易感性的特征在于至少1.10的相对风险(RR)。在另一个实施方式中,增加的易感性的特征在于至少1.20的相对风险。在另一个实施方式中,增加的易感性的特征在于至少1.30的相对风险。在另一个实施方式中,增加的易感性的特征在于至少1.40的相对风险。在又一个实施方式中,增加的易感性的特征在于至少1.50的相对风险。在另外的实施方式中,增加的易感性的特征在于至少1.70的相对风险。在又一个实施方式中,增加的易感性的特征在于至少2.0的相对风险。其他实施方式的特征在于至少1.10、1.11、1.12、1.13、1.14、1.15、1.16、1.17、1.18、1.19、1.20、1.21、1.22、1.23、1.24、1.25、1.26、1.27、1.28、1.29、1.30、1.31、1.32、1.33、1.34、1.35的相对风险。桥接任14何这些上述值的风险的其他数值也是可能的,并且这些也在本发明的范围内。在本发明的方法的一些实施方式中,在所述方法中确定的易感性是减少的易感性。在一个这样的实施方式中,减少的易感性的特征在于小于0.9的相对风险(RR)。在另一个实施方式中,减少的易感性的特征在于小于0.8的相对风险(RR)。在另一个实施方式中,减少的易感性的特征在于小于O.7的相对风险(RR)。在又一个实施方式中,减少的易感性的特征在于小于0.5的相对风险(RR)。其他分界(截止,cutoffs),如小于0.89、0.88、0.87、0.86、0.85、0.84、0.83、0.82、0.81、0.80、0.79、0.78、0.77、0.76、0.75、0.74、0.73、0.72、0.71、0.70等的相对风险在本发明的范围内。本发明还涉及试剂盒。在一个这样的方面中,本发明涉及一种用于评估人类个体中对乳腺癌的易感性的试剂盒,所述试剂盒包括选择性检测所述个体的基因组中染色体5p12或10q26上至少一个多态标记物的至少一个等位基因所必需的试剂,其中所述至少一个等位基因的存在指示对乳腺癌增加的易感性。在另一个方面,本发明涉及一种用于评估人类个体中对乳腺癌的易感性的试剂盒,所述试剂盒包括用于选择性检测所述个体的基因组中至少一个多态标记物的至少一个等位基因的试剂,其中所述多态标记物选自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237),以及在与其连锁不平衡中的多态标记物,并且其中所述至少一个等位基因的存在指示对乳腺癌的易感性。在一个实施方式中,所述至少一个多态标记物选自表12、表13和表14中列出的标记物。试剂盒试剂在一个实施方式中可以包括至少一种连续寡核苷酸(contiguousoligonucleotide),所述寡核苷酸杂交于包括所述至少一个多态标记物的个体的基因组的片段。在另一个实施方式中,所述试剂盒包括至少一对寡核苷酸,所述寡核苷酸杂交于从所述受治疗者获得的基因组区段的相反链,其中每个寡核苷酸引物对被设计成选择性扩增包括一个多态性的个体的基因组的片段,其中所述多态性选自由如表12、表13和表14中限定的多态性组成的组,并且其中所述片段的大小为至少20个碱基对。在一个实施方式中,所述寡核苷酸与所述个体的基因组完全互补。在另一个实施方式中,所述试剂盒进一步包含缓冲剂和用于扩增所述区段的酶。在另一个实施方式中,所述试剂进一步包括用于检测所述片段的标签。在一个优选的实施方式中,所述试剂盒包括长度为5-100个核苷酸的检测寡核苷酸探针;长度为5-100个核苷酸的增强子寡核苷酸探针;以及核酸内切酶;其中所述检测寡核苷酸探针特异性地杂交于其核苷酸序列在SEQIDN0:l-237的任何一个中列出的核酸的第一区段,并且其中所述检测寡核苷酸探针包括在其3'末端的可检测标记和在其5'末端的猝灭部分(quenchingmoiety);其中所述增强子寡核苷酸的长度是5_100个核苷酸并与相对于所述寡核苷酸探针在5'的核苷酸序列的第二区段互补,使得当两个寡核苷酸均杂交至所述核酸时,所述增强子寡核苷酸相对于检测寡核苷酸探针位于3';其中单一碱基间隙存在于所述第一区段与第二区段之间,使得当所述寡核苷酸探针和增强子寡核苷酸探针均杂交至所述核酸时,单一碱基间隙存在于所述寡核苷酸之间;并且其中当所述检测探针杂交至所述核酸时,用核酸内切酶处理所述核酸将从所述检测探针的3'末端剪切所述可检测标记以释放自由的可检测标记。根据本发明的试剂盒还可以用在本发明的其他方法中,包括评估先前诊断有乳腺15癌的个体中至少发展第二原发肿瘤的风险的方法,评估个体对于乳腺癌治疗剂的反应的可能性的方法,以及监测诊断有乳腺癌并被提供对于所述疾病的治疗的个体的治疗进展的方法。这里描述的与乳腺癌相关的标记物均可以用在本发明的各个方面中,包括这里描述的方法、试剂盒、应用、装置、程序(procedures)。在一些实施方式中,本发明涉及染色体5pl2内的标记物的应用。在一些其他实施方式中,本发明涉及染色体10q26内的标记物。在一些实施方式中,本发明涉及表1或表3中列出的标记物,以及在与其连锁不平衡中的标记物。在一些其他实施方式中,本发明涉及在表3中列出的标记物。在一些其他实施方式中,本发明涉及标记物rsl0941679、rs7703618、rs4415084、rs2067980、rsl0035564、rsl1743392、rs7716600和rsl219648,以及在与其连锁不平衡中的标记物。在一些优选的实施方式中,本发明涉及标记物rs4415084、rsl0941679和rsl219648,以及在与其连锁不平衡中的标记物。在一些其他优选的实施方式中,本发明涉及如这里在表12、表13和表14中列出的标记物。在其他优选的实施方式中,本发明涉及rs4415084及在与其连锁不平衡中的标记物(例如,如在表12中列出的标记物)。在其他优选的实施方式中,本发明涉及rsl0941679及在与其连锁不平衡中的标记物(例如,如在表13中列出的标记物)。在其他优选的实施方式中,本发明涉及rsl219648及在与其连锁不平衡中的标记物(例如,如在表14中列出的标记物)。在一个实施方式中,本发明涉及标记物rs4415084。在另一个实施方式中,本发明涉及rs10941679。在另一个实施方式中,本发明涉及rsl219648。在一些实施方式中,提供乳腺癌的增加的风险的至少一个标记物等位基因选自rsl0941679等位基因G、rs7703618等位基因T、rs4415084等位基因G、rs2067980等位基因G、rsl0035564等位基因G、rsl1743392等位基因T、rs7716600等位基因A、和rsl219648等位基因G。在这些实施方式中,所述等位基因(风险中的等位基因)的存在指示乳腺癌的增加的风险。在本发明的一些实施方式中,连锁不平衡是利用连锁不平衡测量r2和|D'|确定的,其给出了两个遗传元件(例如,多态标记物)之间的连锁不平衡(LD)的程度的定量测量。对于特定标记物的这些测量的一些数值指示处于连锁不平衡中的标记物,如这里进一步描述的。在本发明的一个实施方式中,标记物之间的连锁不平衡(即,指示处于连锁不平衡中的标记物的LD值)被限定为r2>0.1。在另一个实施方式中,连锁不平衡被限定为r2>0.2。其他实施方式可以包括连锁不平衡的其他限定,如r2>0.25、r2>0.3、r2>0.35、r2>0.4、r2>0.45、r2>0.5、r2>0.55、r2>0.6、r2>0.65、r2>0.7、r2>0.75、r2>0.8、r2>0.85、r2>0.9、r2>0.95、r2>0.96、r2>0.97、r2>0.98、或r2>0.99。在一些实施方式中,连锁不平衡也可以被限定为|D'I>0.2,或限定为|D'|>0.3、|D'>0.4、|D'|>0.5、|D'|>0.6、|D'|>0.7、|D'|>0.8、|D'|>0.9、|D'|>0.95、|D'IX).98或lD'|>0.99。在一些实施方式中,连锁不平衡被限定为满足r2和D'I的两个标准,如r2〉0.2和|D'|>0.8。1~2和|0'|的值的其他组合也是可能的并且在本发明的范围内,包括但不限于上面列出的这些参数的值。根据下面的本发明的优选实施方式的更特别的描述,本发明的前述和其他目的、16特征以及优点将显而易见。图1示出了来自冰岛1组(同龄组,Cohort)的5pl2上关联数据的图。上图示出了来自1660个乳腺癌患者和11,563个对照的冰岛1组的源自IlluminaH即300数据的关联信号的P值,其根据它们的物理位置(NCBIBuild34)绘出。来自限定区域中6个同等类的关键SNP的信号被标记A-F。在下图中示出了重组热点(recombinationhotspots)的位置、染色体带、已知基因的外显子和重组率。在底部绘制了来自H即M即PhaseII数据(释放19)的成对一值。点的强度与成对一值的大小成比例。重组热点和重组率利用McVeanetal.2004(参见文本)描述的方法获得。具体实施例方式本发明披露了被发现与乳腺癌相关的多态变异体和单体型。染色体5pl2上多态标记物处特定的等位基因已经被发现与乳腺癌相关。这样的标记物和单体型用于诊断目的,用于预测药物反应的方法,以及用于预测治疗进展(treatmentprogress)的方法,如这里进一步详细描述的。本发明的另外的应用包括利用本发明的多态标记物来评估通过手术或放射进行的乳腺癌治疗的反应的方法,以及用在本发明的方法中的试剂盒。定义除非另有指明,否则核酸序列在5'到3'方向从左到右书写。说明书内陈述的数字范围包括限定所述范围的数字并包括限定范围内的每个整数或任何非整数部分。除非另外定义,否则这里使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。下面的术语,在本发明的上下文中,将具有如指出的含义如这里描述的,"多态标记物",有时称为"标记物"指的是基因组多态位点。每个多态标记物具有至少两个在多态位点处的特定等位基因的序列变异特征。因此,与多态标记物的遗传关联(geneticassociation)指的是存在与那个特定多态标记物的至少一个特定等位基因的关联。所述标记物可以包括在基因组中发现的任何变异体类型的任何等位基因,包括单核苷酸多态性(SNP)、小或微随体、易位和拷贝数量变异(插入、缺失、重复)。多态标记物可以为群体中任何可测量的频率。对于疾病基因的绘图(作图),具有大于5_10%的群体频率的多态标记物通常最有用。然而,多态标记物也可以具有较低的群体频率,如1-5%频率,或甚至更低的频率,尤其是拷贝数量变异(CNV)。所述术语在本发明的上下文中将包括具有任何群体频率的多态标记物。"等位基因"指的是染色体上给定基因座(位置)的核苷酸序列。多态标记物等位基因由此指的是染色体上所述标记物的组成(即,序列)。来自个体的基因组DNA对于任何给定的多态标记物包含两个等位基因,代表每个染色体上标记物的一个拷贝。这里所用的核苷酸的序列编码为A=1、C=2、G=3、T=4。对于微随体等位基因,CEra样品(Centred'EtudesduPolymorphismeHumain,genomicsrepository,CEPH样品1347-02)被用作参考,这个样品中每个微随体的较短等位基因被设定为O,而其他样品中的所有其他等位基因相对于这个参考被计数。因此,例如,等位基因i比CEra样品中的较短等位基因长ibp,等位基因2比CEra样品中的较短等位基因长2bp,等位基因3比CEra样品中的较低等位基因长3bp,等等,并且等位基因-1比CEra样品中的较短等位基因短lbp,等位基因-2比CEra样品中的较短等位基因短2bp,等等。"单核苷酸多态性"或"SNP"是当在基因组中特定位置处的单核苷酸在物种(species)的数量之间或在个体中成对的染色体之间不同时所存在的DNA序列变异。大多数SNP多态性具有两个等位基因。在这个情况下,每个个体对于多态性的一个等位基因是纯合的(即,个体的两个染色体拷贝在SNP位置处具有相同的核苷酸),或者所述个体是杂合的(即,个体的两个姐妹染色体包含不同的核苷酸)。如这里报道的SNP命名是指由NationalCenterforBiotechnologicalInformation(NCBI)为每个独特的SNP分配的正式参考SNP(rs)ID识别标签。如这里描述的序列核苷酸多义性是如由IUPAC-IUB提议的。这些编码与由EMBL、GenBank、和PIR数据库所用的编码一致。<table>tableseeoriginaldocumentpage18</column></row><table>其中多于一个序列在群体(自然群体或合成群体,例如,合成分子的库)中是可能的核苷酸位置在这里被称为"多态位点"。如这里所描述的,"变异体"指的是不同于参考DNA的DNA的区段。如这里所定义的,"标记物"或"多态标记物"是变异体。不同于参考物的等位基因被称为"变异体"等位基因。"微随体"是在特定位点具有长度是2-8个核苷酸的碱基的多个小重复的多态标记物(如CA重复),其中重复长度的数目在一般群体中变化。"indel"是包括典型地仅几个核苷酸长的小的插入或缺失的多态性的常见形式。如这里所描述的,"单体型"指的是一条DNA内基因组DNA的区段,其特征在于沿着所述区段排列的等位基因的特定组合。对于二倍体有机体如人类,单体型包括对于每个多态标记物或基因座的等位基因对的一个数量。在一些实施方式中,单体型可以包括两个或更多个等位基因,三个或更多个等位基因,四个或更多个等位基因,或五个或更多个等位基因。如这里所描述的,术语"易感性"包括增加的易感性和降低的易感性。因此,本发明的特定多态标记物和/或单体型的特征可以为乳腺癌的增加的易感性(即,增加的风险),如由大于1的相对风险(RR)所表征的,或如由大于1的优势比(让步比,oddsratio)(OR)所表征的。可替换地,本发明的标记物和/或单体型的特征为乳腺癌的降低的易感性(即,降低的风险),如由小于1的相对风险所表征的,或由小于1的优势比所表征的。单体型此处在标记物名称的上下文中描述,并且所述单体型中的标记物的等位基因,如,"Trs4415084"指的是所述单体型中标记物rs4415084的T等位基因,并且这个命名相当于"rs4415084等位基因T"和"T-rs4415084"。此外,单体型中的等位基因编码是关于个体标记物的,BP,1=A、2=C、3=G和4=T。如这里所描述的,术语"易感性"指的是个体朝向某一状态(如,某一特性、表型或疾病,如乳腺癌)的发展或朝向比平均个体较不能够抵抗特定状态的倾向。所述术语包括增加的易感性和降低的易感性。因此,如这里描述的本发明的多态标记物和/或单体型处的特定等位基因的特征可以为乳腺癌的增加的易感性(即,增加的风险),如通过对于特定等位基因或单体型的大于1的相对风险(RR)或优势比(OR)所表征的。可替换地,本发明的标记物和/或单体型的特征是乳腺癌的降低的易感性(即,降低的风险),如通过小于1的相对风险所表征的。术语"和/或"在本发明的上下文中将被理解为表示通过它连接的术语的一个或两个被涉及。换言之,所述术语这里将意味着"一个或另一个或两个"。如这里所描述的,术语"查询表(查找表)"是一种这样的表,其使一种形式的数据与另一形式相关,或使一种或多种形式的数据与所述数据相关的预测的结果相关,诸如表型或特性。例如,查询表可以包括对于至少一个多态标记物的等位基因数据与特定特性或表型之间的关联,诸如特定疾病的诊断,包含特定等位基因数据的个体可能显示所述特性或表型,或比不包含特定等位基因数据的个体更可能显示所述特性或表型。查询表可以为多维的,即,它们可以同时包含关于单一标记物的多个等位基因的信息,或它们可以包含关于多标记物的信息,并且它们还可以包含其他因素,如关于疾病诊断、种族信息、生物标记物、生物化学测量、治疗方法或药物等的细节。"计算机可读介质"是可以利用商业上可获得的或定制的界面通过计算机访问的信息存储介质。示例性的计算机可读介质包括存储器(如,RAM、ROM、闪存等)、光存储介质19(如,CD-ROM)、磁存储介质(如,计算机硬驱动器、软盘等)、穿孔卡、或其他商业上可获得的介质。信息可以在感兴趣的系统与介质之间、在计算机之间、或在计算机与用于存储或存储的信息的获取的计算机可读介质之间传输。这样的传输可以是电的,或通过其他可利用的方法,如IR链接、无线连接等。"核酸样品"是一种从包含核酸(DNA或RNA)的个体获得的样品。在一些实施方式中,即,在特定多态标记物和/或单体型的检测中,核酸样品包含基因组DNA。这样的核酸样品可以从包含基因组DNA的任何来源获得,包括如血液样品、羊水样品、脑脊液样品、或来自皮肤、肌肉、口腔或芥末粘膜、胎盘、胃肠道或其他器官的组织样品。术语"乳腺癌治疗剂"指的是可以用于改善或防止与乳腺癌相关的症状的药剂。如这里所描述的,术语"乳腺癌-相关的核酸"指的是已经被发现与乳腺癌相关的核酸。这包括但不限于,这里描述的标记物和单体型以及在与此强连锁不平衡(LD)中的标记物和单体型。如这里所描述的,术语"乳腺癌"指的是乳腺癌的任何临床诊断,包括乳腺癌的任何和全部特定亚表型。例如,乳腺癌有时被分类为雌激素受体(ER)阳性乳腺癌或雌激素受体阴性乳腺癌;乳腺癌有时也被分类为孕酮受体(PR)阳性或阴性的。此外乳腺癌有时被诊断为侵袭性导管、侵袭性小叶、管状、或其他侵袭性的或混合侵袭性的。乳腺癌还可以被分类为髓DCIS(原位导管癌)或LCIS(原位小叶癌),或另外的非侵袭性的。侵袭性乳腺癌还可以被定义为阶段0、阶段1、阶段2(包括阶段2a和阶段2b)、阶段3(包括阶段3a、阶段3b和阶段3c)或阶段4乳腺癌。在本发明的上下文中,"乳腺癌"可以包括乳腺癌的这些亚表型中的任何一个,并且还包括乳腺癌的任何其他临床可应用的亚表型。术语"所有的乳腺癌"或"所有的BC"指的是诊断有乳腺癌的所有个体。术语"介质诱因"乳腺癌或"MedPre"乳腺癌指的是乳腺癌的亚表型。这个表型的定义要求先证者(proband)满足以下标准中的至少一个该先证者是在3个减数分裂事件(3M)的遗传距离内包含3个或更多个受影响的亲属的乳腺癌病例群的成员。该先证者是在3M内相关的受影响的对的成员,其中一个在50岁或更年轻时被诊断。该先证者是在3M内相关的受影响的对的成员,其中一个被诊断患有任何类型的第二原发肿瘤。该先证者已经被诊断有任何类型的第二原发肿瘤。如这里所描述的,术语"多原发乳腺肿瘤"或"MPBC"指的是其中除了第一乳腺癌诊断之外,至少一个原发肿瘤也被诊断的病例,并且两个肿瘤均临床确认或通过组织学确认,独立于原发肿瘤,同时发生或在第一乳腺癌后发生,并且存在于对侧或同侧乳房中。如这里所描述的,术语"家族史得分"或"FHS"基于对于具有疾病的先证者受乳腺癌影响的亲属的数量来定义。对于每个先证者,对于每个受影响的一级亲属(first-degreerelative)给予1的得分,对于每个受影响的二级亲属,给予0.5的得分,并且对于每个三级亲属给予O.25的得分。由此在所有受影响的亲属上获得的总数代表总合的家族史(summedfamilyhistory)得分或FHS。如这里所描述的,术语"雌激素受体阳性乳腺癌"或"ER-阳性乳腺癌"指的是被确定对于雌激素受体阳性的肿瘤。在本发明的上下文中,大于或等于10fmol/mg的ER水平和/或大于或等于10X阳性细胞核的免疫组织化学观测结果被认为是ER阳性的。不满足ER阳性的标准的乳腺癌这里被定义为"ER-阴性"或"雌激素受体阴性"。如这里所描述的,术语"孕酮受体阳性乳腺癌"或"PR-阳性乳腺癌"指的是被确定对于孕酮受体阳性的肿瘤。在本发明的上下文中,大于或等于10fmol/mg的PR水平和/或大于或等于10X阳性细胞核的免疫组织化学观测结果被认为是PR阳性的。不满足PR阳性的标准的乳腺癌这里被定义为"PR-阴性"或"孕酮受体阴性"。如这里所描述的,术语"染色体5pl2"指的是染色体5上NCBI(NationalCenterforBiotechnologyInformation)Build34的位置44,094,392与46,393,984之间的区域。如这里所描述的,术语"FGF10"或"FGF10基因"指的是人类染色体5p上的成纤维细胞生长因子10基因。如这里所描述的,术语"MRPS30"或"MRPS30基因"指的是人类染色体5p上的线粒体核糖体蛋白S30基因。该基因还被称为程序化细胞死亡蛋白9(PDCD9),并编码线粒体S28亚单位。如这里所描述的,术语"FGFR2"或"FGFR2基因"指的是人类染色体10q26上的成纤维细胞生长因子受体2基因。该基因还被称为蛋白酪氨酸激酶受体类似物(like)14(TK14)、角质形成细胞生长因子受体(KGFR)、和成纤维细胞生长因子受体BEK。通过根据本发明诊断有乳腺癌的个体群的关联分析,已经发现染色体5pl2上的一些多态标记物处的一些等位基因与乳腺癌相关。对于与癌症相关的变异体的基因组_广泛的分析显示乳腺癌与染色体5的区域的关联,所述区域在位置44,094,392与46,393,984(NCBIBuild34坐标)之间,在这里称为染色体5pl2区。在该区域中特定标记物被发现与乳腺癌的增加的风险相关。通过利用Ill咖inaH咖anHap300微阵列技术对大约1,600个冰岛乳腺癌患者和11,563个对照者进行基因型测定,发现染色体5p上的大量标记物显示与乳腺癌相关(表1)。尤其是,标记物rs4415084的T等位基因和标记物rs7703618的G等位基因被发现与乳腺癌增加的风险相关。标记物rs7703618的关联在第二冰岛同龄组中被重复,表明关联信号确实是重要的。冰岛发现同龄组与公众CGEMS数据组的比较显示与rs4415084的关联也在该同龄组中重复。实际上,与该标记物的关联信号(在冰岛发现同龄组中p值9.02E-06)在基因组_广泛水平上是重要的(在Bonferroni校正后),其中当两个数据组合并时名义p值为1.38E-07。该SNP在单独CGEMS数据组中具有2.21E-03的不显著的P值,但是在冰岛群中重复所述初始发现。标记物rsl0941679,其与标记物rs4415084(D'=0.99,r2=0.51)相关,具有甚至更强的与乳腺癌的相关性(0R=1.19,p值为2.2E-06)。后续分析已经表明在来自瑞典、荷兰、西班牙和美国的同龄组中,所述信号归因于rs4415084和rsl0941679(参见表6)。本发明还示出在Chr5p12区中等位基因异质性的证据,并且六个同等类别(由关键标记物rs7703618、rs4415084、rs2067980、rsl0035564、rsl1743392和rs7716600表示)已经被鉴定。进一步的分析已经确定观察到的关联信号主要由标记物rs4415084和rsl0941679说明。在通过本发明鉴定的区中存在三个著名的已知基因,其具有与乳腺癌相关的标记物和单体型。这些基因是FGFIO、MRPS30、和HCN1,连同不良表征的基因L0C441070。这些基因中的两个,FGF10和MRPS30,是涉及乳腺癌诱因的强迫候选者。因此,FGFIO是乳房的正常胚胎发育所必需的[HowardandAshworth,(2006),PLoSGenet,2,e112],并且FGF10已经作为癌基因在通过匪TV插入性诱变的小鼠乳腺癌模型中被涉及,并且FGF10在约10%的人类乳腺癌中被过度表达[Theodorou,etal.,(2004),Oncogene,23,6047-55]。FGF10基因通过重组热点从关联信号的主要集簇(mainclusters)被分离。然而,控制FGF10的调节的关键元件可以存在于其中强关联信号发生的区中。可替换地,该关联信号可以在FGF10基因本身内伴随致病突变的连锁不平衡中。MRPS30基因,还称为程序化细胞死亡蛋白9(PDCD9),编码线粒体28S核糖体亚单位。该基因是Gallusgallus前凋亡蛋白p52的哺乳动物对应部分(配对物)。还显示它在哺乳动物细胞中诱导凋亡并活化应激反应的JNKl途径。该蛋白似乎通过Bcl-2途径至少部分地在凋亡中起作用[Sun,etal.,(1998),Gene,208,157-66;Carim,etal.,(1999),CytogenetCellGenet,87,85_8;CavdarKoc,etal.,(2001),FEBSLett,492,166-70]。虽然它还没有在乳腺癌中预先被涉及,但是其在上面的途径中的涉及提示MRPS30中的所述遗传变异体可以在改变乳腺癌风险中被涉及。还发现染色体10上的FGFR2基因座处的标记物rsl219648提供乳腺癌的风险(表6),其特别与ER阳性肿瘤相关(表10)。还发现与rsl219648的关联在结节阳性肿瘤中比在结节阴性肿瘤中更重要,并且所述关联对于具有乳腺癌家族史的个体更强大。用于标记物和单体型的评估当比较个体时群体内的基因组序列是不同的。相反,在基因组中的许多位置,基因组表现出个体之间的序列变异性。序列的这样的变异通常被称为多态性,并且在每个基因组内存在许多这样的位点。例如,人类基因组表现出平均每500个碱基对发生的序列变异。最常见的序列变异体由在基因组内单一碱基位置处的碱基变异组成,并且这样的序列变异体或多态性通常被称为单一核苷酸多态性("SNP")。这些SNP被认为通过单一突变事件产生,因此通常可能在每个SNP位点存在两个可能的等位基因;最初的等位基因和突变的(替换的)等位基因。由于自然遗传漂变和可能的还有选择压力,最初的突变导致以任何给定群体中其等位基因的特定频率为特征的多态性。许多其他类型的序列变异体在人类基因组中被发现,包括小随体和微随体,以及插入、缺失、倒位(也称为拷贝数量变异(CNV))。多态微随体在特定位点具有多个小的碱基重复(如CA重复,在互补链(complimentarystrand)上的TG),其中重复长度的数量在总群体中变化。大体上,序列的每个版本在多态位点方面代表多态位点的特定等位基因。所有的序列变异体可以被称为多态性,存在于以所讨论的序列变异体为特征的特定多态位点处。大体上,多态性可以包括任何数量的特定等位基因。因此在本发明的一个实施方式中,多态性的特征在于在任何给定群体中两个或多个等位基因的存在。在另一个实施方式中,多态性的特征在于三个或更多个等位基因的存在。在另一个实施方式中,多态性的特征在于四个或更多个等位基因、五个或更多个等位基因、六个或更多个等位基因、七个或更多个等位基因、九个或更多个等位基因。或十个或更多个等位基因。所有这样的多态性可以被用在本发明的方法和试剂盒中,因此在本发明的范围内。由于它们的丰度,SNP说明人类基因组中大多数序列变异。迄今,超过6百万SNP已经被石角认(http://www.ncbi.nlm.nih.gov/projects/SNP/snp_summary.cgi)。然而,CNV正在受到增加的关注。这些大规模的多态性(典型地lkb或更大)说明影响装配的人类基因组的实质比例的多态变异;已知的CNV覆盖超过15X的人类基因组序列(Estivill,XArmengol;L.,PIoSGenetics3:1787-99(2007).Ahttp://projects.tcag.ca/variation/)。然而大多数这些多态性是非常稀少的,并且平均仅影响每个个体的基因组序列的一部分。CNV已知通过破坏基因剂量来影响基因表达、表型变异和适应,还已知造成疾病(微缺失和微重复紊乱)并提供常见复合体疾病的风险,包括HIV-1感染和肾小球性肾炎(Redon,R.,etal.Nature23:444-454(2006))。因此可能的是,先前描述的或未知的CNV代表与乳腺癌相关的这里描述的标记物在连锁不平衡中的造成原因的变异体。用于检测CNV的方法包括比较基因组杂交(CGH)和基因型测定(基因型鉴定,genotyping),包括使用基因型测定阵列(genotypingarrays),如由Carter描述的(NatureGenetics39:S16-S21(2007))。基因组变异体的数据库(httD:〃oroiects.tcag.ca/variation/)包含最新的关于所述的DNV的位置、类型和大小的信息。所述数据库目前包含超过15,000个CNV的数据。在一些情况中,参考被制备成在多态位点处的不同等位基而无需选择参考等位基因。可替换地,参考序列可以被称为用于特定的多态位点。参考等位基因有时被称为"野生型"等位基因并且它通常被选择为第一测序的等位基因或来自"未影响的"个体的等位基因(例如,没有表现出性状或疾病表型的个体)。如这里提及的用于SNP标记物的等位基因涉及碱基A、C、G、或T,此时它们存在于所采用的SNP测定(分析)中的多态位点处。这里使用的SNP的等位基因编码如下1=A、2=C、3=G、4=T。然而本领域技术人员将认识到通过分析或阅读相对的DNA链,互补等位基因在每一种情况中可以被测量。因此,对于特征为A/G多态性的多态位点(多态标记物),采用的测定可以被设计成特异性地检测可能的两个碱基,即,A和G中的一个或两个的存在。可替换地,通过设计被设计成检测DNA模板上相反链的测定,可以测量互补碱基T和C的存在。定量地(例如,关于相对风险),相同的结果将从任何一个DNA链(+链或-链)的测量获得。典型地,参考序列涉及用于特定的序列。与参考不同的等位基因有时被称为"变异体"等位基因。如这里所用的,变异体序列是指与参考序列不同但是以其他方式基本上类似的序列。这里描述的在多态遗传标记物处的等位基因是变异体。变异体可以包括影响多肽的改变。当与参考核苷酸序列比较时,序列差异可以包括单一核苷酸或多于一个核苷酸的插入或缺失,导致移码;至少一个核苷酸的改变,导致编码的氨基酸的改变;至少一个核苷酸的改变,导致未成熟的终止密码子的产生;几个核苷酸的缺失,导致由所述核苷酸编码的一个或多个氨基酸的缺失;一个或几个核苷酸的插入,如通过不相等的重组或基因转换,导致阅读框的编码序列的中断;序列的所有或部分的重复;转座;或核苷酸序列的重排。这样的序列改变可以改变由核酸编码的多肽。例如,如果核酸序列中的改变造成移码,则该移码可以导致编码的氨基酸的改变,和/或可以导致未成熟的终止密码子的产生,造成截短的多肽的产生。可替换地,与疾病或性状相关的多态性可以为一个或多个核苷酸中的同义改变(即,不导致氨基酸序列改变的改变)。例如,这样的多态性可以改变剪接位点(splicesites),影响mRNA的稳定性或转运,或以其他方式影响编码的多肽的转录或翻译。它还可以改变DNA以增加结构改变,如扩增或缺失,在躯体水平发生的可能性。由参考核苷酸序列编码的多肽是具有特定参考氨基酸序列的"参考"多肽,并且由变异体等位基因编码的多肽被称为具有变异体氨基酸序列的"变异体"多肽。单体型指的是DNA的区段,其特征在于沿着所述区段排列的等位基因的特定组合。对于二倍体有机体,如人类,所述单体型可以包括对于每个多态标记物或基因座的等位基因对中的一种成员。在一些实施方式中,单体型可以包括两个或多个等位基因、三个或多个等位基因、四个或多个等位基因、或者五个或多个等位基因,每个等位基因对应于沿着所述区段的特定多态标记物。单体型可以包括在多态位点具有特定等位基因的不同多态标记物的组合,例如SNP和微随体。因此单体型包括在不同遗传标记物处的等位基因的组合。检测特异性多态标记物和/或单体型可以通过本领域中已知的用于检测多态位点处的序列的方法来实现。例如,可以使用用于SNP和/或微随体标记物的存在的基因型测定(genotyping)的标准技术,如基于荧光的技术(Chen,X.etal.,GenomeRes.9(5):492-98(1999)),利用PCR、LCR、巢式(nested)PCR和其他用于核酸扩增的技术。用于SNP基因型测定的可获得的特定商业方法包括,但不限于,T叫Man基因型测定分析和SNPIex平台(AppliedBiosystems)、凝胶电泳(AppliedBiosystems)、质谱分析(例如,来自Sequenom的MassARRAY系统)、微测序方法、实时PCR、Bio-Plex系统(BioRad)、CEQ和SNPstream系统(Beckman)、阵列杂交技术(例如,AffymetrixGeneChip;Perlegen)、BeadArray技术(例如,IlluminaGoldenGate和Infinium分析)、阵列标签技术(例如,Parallele)、以及基于核酸内切酶的荧光杂交技术(Invader;ThirdWave)。一些可获得的阵列平台(包括AffymetrixSNP阵列6.0和IlluminaCNV370-Duo和1MBeadChips)包括标记一些CNV的SNP。这允许经由包括在这些平台中的代理SNP检测CNV。因此,通过利用本领域技术人员可获得的这些或其他方法,多态标记物处(包括微随体、SNP或其它类型的多态标记物)的一个或多个等位基因可以被鉴定。在这里描述的一些方法中,处于对乳腺癌的增加的易感性(即,增加的风险)的个体是这样的个体,其中在一个或多个多态标记物或单体型处的提供对乳腺癌增加的易感性的至少一个特定等位基因被鉴定(即,风险中的标记物等位基因或单体型)。在一个方面,风险中的标记物或等位基因是提供乳腺癌的显著增加的风险(或易感性)的标记物或单体型。在一个实施方式中,与标记物或单体型相关的显著性通过相对风险(RR)来测量。在另一个实施方式中,与标记物或单体型相关的显著性通过优势比(0R)来测量。在进一步的实施方式中,显著性通过百分比来测量。在一个实施方式中,显著增加的风险作为至少1.10,包括但不限于至少1.11、至少1.12、至少1.13、至少1.14、至少1.15、至少1.16、至少1.17、至少1.18、至少1.19、至少1.20、至少1.21、至少1.22、至少1.23、至少1.24、至少1.25、至少1.30、至少1.35、至少1.40、至少1.50、至少1.60、至少1.70、1.80、至少1.90、至少2.0、至少2.5、至少3.0、至少4.0、和至少5.0的风险(相对风险和/或优势比)被测量。在一个特别的实施方式中,至少l.15的风险(相对风险和/或优势比)是显著的。在另一个特别的实施方式中,至少l.17的风险是显著的。在又一个实施方式中,至少1.20的风险是显著的。在另外的实施方式中,至少约1.25的相对风险是显著的。在另一进一步的实施方式中,风险的显著增加是至少约1.30是显著的。然而,其他分界也是预期的,例如,至少1.16、1.18、1.19、1.21、1.22等,并且这样的分界也在本发明的范围内。在另一个实施方式中,风险的显著增加是至少约10%,包括但不限于约15%、约20%、约25%、约30%、约35%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%、和约100%。在一个特别的实施方式中,风险的显著增加是至少15%。在其他实施方式中,风险的显著增加是至少17%、至少20%、至少22%、至少24%、至少25%、至少30%、至少32%和至少35%。然而,被本领域技术人员认为适于表征本发明的其他分界或范围也是预期的,并且这些也在本发明的范围内。在一些实施方式中,风险的显著增加通过P-值来表征,如小于0.05、小于0.01、小于1X10—3(0.001)、小于1X10—4(0.0001)、小于1X10—4(0.00001)、小于1X10—5(0.000001)、小于1X10—6(0.0000001)、小于1X10—7(0.00000001)、或小于1X10—8(0.000000001)的p-值。本发明的风险中的多态标记物或单体型是这样的标记物或单体型,其中与其在比较组(对照)中的存在频率相比,至少一个标记物或单体型的至少一个等位基因更经常地存在于处于疾病或性状(受影响的)的风险中或诊断有所述疾病或性状的个体中,使得所述标记物或单体型的存在指示对疾病或性状(如,乳腺癌)易感性。对照组在一个实施方式中可以为群体样品,即,来自一般群体的随机样品。在另一个实施方式中,对照组由无疾病的个体(即,没有诊断有乳腺癌的个体)的组来表示。这样的无疾病的对照在一个实施方式中可以通过一个或多个特定疾病相关症状的缺乏来表征。在另一个实施方式中,无疾病的对照组的特征在于一个或多个疾病-特异性风险因素的缺乏。在一个实施方式中,这样的风险因素为至少一个环境风险因素。代表性的环境因素是天然产物、矿物或其他化学制品,其已知影响、或预期影响发展特异性疾病或性状的风险。其他环境风险因素是与生活方式相关的风险因素,包括但不限于食物和饮酒习惯、主要居住地的地理位置以及职业风险因素。在另一个实施方式中,所述风险因素是至少一个遗传风险因素。用于关联的简单检验的实例是二乘二表(twobytwotable)上的Fisher-精确检验。考虑到染色体的同龄组,二乘二表用染色体的数量构建,其包括标记物或单体型的两个、标记物或单体型的一个但不包括标记物或单体型的另一个和标记物或单体型中没有一个。本领域技术人员已知的关联的其他统计检验也被预期并且也在本发明的范围内。在本发明的其他实施方式中,对于疾病或性状具有降低的易感性(S卩,降低的风险)的个体是这样的个体,其中提供对于所述疾病或性状的降低的易感性的一个或多个多态标记物或单体型处的至少一个特定等位基因被鉴定。提供降低的风险的所述标记物等位基因和/或单体型也被称为保护性的。在一个方面,所述保护性标记物或单体型是提供疾病或性状的显著降低的风险(或易感性)的标记物或单体型。在一个实施方式中,显著降低的风险作为小于0.90,包括但不限于小于0.85、小于0.80、小于0.75、小于0.7、小于0.6、小于0.5、小于0.4、小于0.3、小于0.2和小于0.1的相对风险被测量。在一个特别的实施方式中,显著降低的风险小于0.90。在另一个实施方式中,显著降低的风险小于0.85。在又一个实施方式中,显著降低的风险小于0.80。在另一个实施方式中,风险(或易感性)的降低为至少10%,包括但不限于至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少80%、至少85%、至少90%、至少95%和至少98%。在一个特别的实施方式中,风险的显著降低为至少约15%。在另一个实施方式中,风险的显著降低为至少约20%。在另一个实施方式中,风险的显著降低为至少约25%。然而,本领域技术人员认为适合表征本发明的其他分界或范围也被预期,并且那些也在本发明的范围内。本领域技术人员将认识到对于具有被研究的群体中存在的两个等位基因的多态标记物(如SNP),并且,其中一个等位基因被发现与对照相比在群体中在具有性状或疾病的个体的组中频率增加,标记物的另一等位基因将被发现与对照相比,在具有性状或疾病的个体的组中频率降低。在这样的情况中,标记物的一个等位基因(被发现在具有性状或疾病的个体中频率增加的等位基因)将为风险中的等位基因,而另一等位基因将为保护性等位基因。与疾病或性状(例如,乳腺癌)相关的遗传变异体可以单独使用以预测对于给定基因型的疾病的风险。对于双等位基因标记物,如SNP,存在3个可能的基因型对于风险中的变异体的纯合子、杂合子、以及风险中的变异体的非携带者。与多个基因座处的变异体相关的风险可以用于评估综合风险(overallrisk)。对于多个SNP变异体,存在k个可能的基因型k二3nX2P;其中n为常染色体基因座的数量,而p为生殖染色体(gonosomal)(性染色体)基因座的数量。综合风险评估计算通常假定不同遗传变异体的相对风险相乘,即,与特定基因型组合相关的综合风险(例如,RR或0R)是对于每个基因座处基因型的风险值的乘积。如果与具有匹配的性别和种族的参考群体相比,表达的风险是对于每个个人,或对于每个个人的特定基因型的相对风险,则组合的风险是基因座特定风险值的乘积_并且其也对应于与所述群体相比的综合风险评估。如果个人的风险是基于与风险中的等位基因的非携带者的比较,则组合的风险对应于这样的评估,其比较在所有基因座处具有给定基因型的组合的个人和在这些基因座的任何一个处没有携带风险变异体的个体的组。任何风险中的变异体的非携带者的组具有最低的评估的风险并具有与其自身相比(即,非携带者)l.O的组合风险,但是与所述群体相比具有小于1.0的综合风险。应当注意到,非携带者的组可以潜在地非常小,尤其对于大量的基因座,并且在该情况下,其关联性相应地小。乘法模型是节俭的模型,其通常相当好地适合复合性状的数据。与相乘的偏差很少描述在对于常见疾病的常见变异体的上下文中,并且如果报道,通常仅是建议性的,因为通常需要非常大的样品大小以能够展示基因座之间的统计相互作用。通过实例的方式,让我们考虑已经描述与前列腺癌相关的八个变异体的总禾口(Gudmundsson,J.,etal.,NatGenet39:631-7(2007),Gudmundsson,J.,etal.,NatGenet39:977-83(2007);Yeager,M.,etal,NatGenet39:645-49(2007),Am皿dadottir,L,elal.,NatGenet38:652-8(2006);Haiman,CA.,etal.,NatGenet39:638-44(2007))。这些基因座中的七个是常染色体,并且剩余的基因座在染色体X上。于是理论上基因型组合的总数是3TX21=4374。这些基因型类别中的一些是非常少的,但仍是可能的,并应当被考虑用于综合风险评估。可能的是在多个遗传变异体的情况中应用的乘法模型在结合非遗传风险变异体时也将有效,假定所述遗传变异体不明确地与"环境"因素相关。换言之,遗传和非遗传风险中的变异体可以在乘法模型下被评估以估计组合的风险,假定所述非遗传和遗传风险因素并不相互作用。利用相同的定量方法,与乳腺癌相关的多个变异体相关的组合的或综合风险可以被评估。连锁不平衡重组的自然现象,其在每个减数分裂事件期间对于每个染色体对平均发生一次,代表一种这样的方式,其中自然提供序列中的变异(和因此的生物学功能)。已经发现重组在基因组中不随机发生;相反,在重组率的频率中存在大的变异,导致高重组频率的小区(也称为重组热点)和低重组频率的较大区,其通常称为连锁不平衡(LD)块(Myers,S.etal.,BiochemSocTrans34:526-530(2006)Jeffreys,AJ.,etal.,NatureGenet29:217-222(2001);May,C.A.,etal.,NatureGenet31:272—275(2002))。连锁不平衡(LD)指的是两个遗传元件的非随机分配。例如,如果特定遗传元件(例如,多态标记物的等位基因,或单体型)以O.50(50%)的频率在群体中发生,并且另一元件以O.50(50%)的频率发生,则具有两个元件的个人的预测的发生率是O.25(25%),假定所述元件随机分布。然而,如果发现两个元件以大于O.125的频率一起发生,则所述元件被称为处于连锁不平衡中,因为它们倾向于以比它们独立的发生频率(例如,等位基因或单体型频率)将预测的比率高的比率一起遗传。粗略地说,LD通常与两个元件之间的重组事件的频率相关。在群体中等位基因或单体型频率可以通过基因型测定群体中的个体和确定群体中每个等位基因或单体型的发生频率来确定。对于二倍体的群体,例如,人类群体,对于每个遗传元件(例如,标记物,单体型或基因),个体将通常具有两个等位基因。许多不同的测量已经被提出用于评估连锁不平衡的强度(LD;在Devlin,B.&Risch,N.,Genomics29:311-22(1995)中综述)。大多数捕获双等位基因位点的对之间的关联的强度。LD的两个重要的成对测量值是一(有时表示为口A2)和|D'I(Lewontin,R.,Genetics49:49-67(1964);Hill,W.G.&Robertson,A.Theor.Appl.Genet.22:226-231(1968))。两个测量值的范围从0(没有不平衡)到l("完全"不平衡),但是它们的解释稍微不同。|D'I以这样的方式定义,S卩,如果可能的单体型中的仅两个或三个出现,则它等于1,并且如果全部四个可能的单体型出现,则它<i。因此,<i的Id'I值表示历史重组可能已经发生在两个位点之间(再发生突变也可以造成Id'I<i,但是对于单一核苷酸多态性(SNP),这通常被认为可能性比重组小)。测量值一代表两个位点之间的统计相关性,并且如果仅两个单体型出现,则采取1的值。r2测量值可论证地是用于关联绘制的最相关的测量值,因为r2与检测易感性基因座和特定SNP之间的关系所必需的样品大小之间存在简单的相反关系。这些测量值针对成对的位点被定义,但是对于一些应用,确定多强的LD穿过包含许多多态位点的整个区可能是期望的(例如,测试是否LD的强度在基因座中或群体中显著不同,或者在特定模式下在区域中是否存在比预测的更多或更少的LD)。测量跨越区域的LD不是直接的,但是一种途径是使用测量值r,其在群体遗传学中被开发。粗略地说,r测量在特定群体模型中多少重组对产生在数据中可见到的LD将是必需的。这种类型的方法也可以对确定LD数据是否提供重组热点的存在的证据的问题潜在地提供统计上严格的途径。对于这里描述的方法,基因区段(如SNP标记物)之间的显著的一值可以为至少0.l,如至少O.1、0.15、0.2、0.25、0.3、0.35、0.4、0.45、0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.91、0.92、0.93、0.94、0.95、0.96、0.97、0.98、0.99或1.0。在一个优选的实施方式中,显著的r2值可以为至少0.2。可替换地,如这里描述的连锁不平衡指的是特征为至少0.2,如0.3、0.4、0.5、0.6、0.7、0.8、0.85、0.9、0.95、0.96、0.97、0.98、0.99的|D'|值的连锁不平衡。因此,连锁不平衡代表不同标记物的等位基因之间的相关性。其通过相关系数或ID'|(一直到1.O,并且|D'I直到1.0)来测量。连锁不平衡可以在单一人类群体中被确定,如这里限定的,或者它可以在包括来自多于一个人类群体的个体的样品的采集中被确定。在本发明的一个实施方式中,LD在来自一个或多个HapMap群体的样品中被确定(Caucasian,african,Japanese,Chinese),如限定的(http:〃www.h即map.org)。在一个这样的实施方式中,LD在H即M即样品的CEU群体中被确定。在另一个实施方式中,LD在YRI群体中被确定。在另一个实施方式中,LD在欧洲群体中被确定。在又一个实施方式中,LD在冰岛群体中被确定。如果基因组中所有的多态性在群体水平是相同的,则它们中每一个将需要在关联研究中被调查。然而,由于多态性之间的连锁不平衡,紧密连接的多态性是强相关的,其减少在观察显著的关联的关联研究中需要被研究的多态性的数量。LD的另一结果是许多多态性由于这些多态性是强相关的事实可以产生关联信号。基因组LD图已经跨越所述基因组被产生,并且这样的LD图已经被提出用作用于绘制疾病-基因的框架(Risch,N.&Merkiangas,K,Science273:1516-1517(1996);Maniatis,N.,etal.,ProcNatlAcadSciUSA99:2228-2233(2002);Reich,DEetal,Nature411:199-204(2001))。现在已经确定人类基因组的许多部分可以被分成系列的包含几个常见单体型的离散的单体型块;对于这些块,连锁不平衡数据几乎没有提供表明重组的证据(参见,例如,Wall.,J.D.andPritchard,J.K.,NatureReviewsGenetics4:587-597(2003);Daly,M.etal.,NatureGenet.29:229-232(2001);Gabriel,S.B.etal.,Science296:2225-2229(2002);Patil,N.etal.,Science294:1719-1723(2001);Dawson,E.etal.,Nature418:544-548(2002);Phillips,M.S.etal.,NatureGenet.33:382-387(2003))。存在两个用于定义这些单体型块的主要方法块可以被定义为具有有限的单体型多样性的DNA的区(参见,例如,Daly,M.etal.,NatureGenet.29:229-232(2001);Patil,N.etal.,Science294:1719-1723(2001);Dawson,E.etal.,Nature418:544-548(2002);Zhang,K.etal.,Proc.Natl.Acad.Sci.USA99:7335-7339(2002)),或者定义为具有广泛的历史重组的过渡带之间的区,利用连锁不平衡鉴定(参见,例如,Gabriel,S.B.etal.,Science296:2225-2229(2002);Phillips,M.S.etal.,NatureGenet.33:382-387(2003);Wang,N.etal.,Am.J.Hum.Genet.71:1227-1234(2002);Stumpf,M.P.,andGoldstein,D.B.,Curr.Biol.13:1-8(2003))。近来,跨过人类基因组的重组率和相应的热点的精密-标度图已经被产生(Myers,S.,etal.,Science310:321-32324(2005);Myers,S.etal.,BiochemSocTrans34:526530(2006))。所述图显示跨过基因组的重组中的巨大变异,其中在热点区中重组率高达10-60cM/Mb,而在间隔区重组率接近O,其由此代表有限的单体型多样性和高LD的区。该图因此可以用于将单体型块/LD块限定为被重组热点侧翼包围的区。如这里所用的,术语"单体型块"或"LD块"包括通过上面描述的特征种的任何一个或本领域技术人员所用的限定这样的区的其他可替换的方法所限定的块。因此已经变的显然是,对于任何给定的观察到的与基因组中多态标记物的关联,可能基因组中的另外的标记物也表现出关联。这是跨越基因组的LD的不平均分布的自然结果,如通过重组率的较大的变异所观察到的。用于检测关联的标记物因此在某种意义上28代表用于与给定疾病或性状相关的基因组区(即,单体型块或LD块)的"标签"。一个或多个引起结果的(功能性)变异体或突变可以存在于发现与疾病或性状相关的区内。所述功能性变异体可以为另一SNP,串联(衔接)重复多态性(如小随体或微随体),转座因子(转座元件)、或拷贝数量的变异,如倒位、缺失或插入。与这里描述的变异体在LD中这样的变异体可以提供比用于检测关联的标签标记物观察到的更高的相对风险(RR)或优势比(OR)。本发明由此涉及用于检测与疾病的关联的标记物,如这里描述的,以及与所述标记物连锁不平衡中的标记物。因此,在本发明的一些实施方式中,与本发明的标记物和/或单体型在LD中的标记物,如这里描述的,可以用作代理标记物(surrogatemarkers)。该代理标记物在一个实施方式中具有比最初发现与疾病相关的标记物或单体型更小的相对风险(RR)和/或优势比(OR)值,如这里所描述的。在其他实施方式中,该代理标记物具有比针对最初发现与疾病相关的标记物初始确定的那些具有更大的RR或OR值,如这里所描述的。这样的实施方式的一个实例将是与最初发现与疾病相关的更常见的变异体(>10%群体频率)在LD中稀少的、或相对稀少(<10%等位基因群体频率)的变异体,如这里描述的变异体。鉴定和使用如这里描述的用于检测由本发明的发明人发现的关联的这样的标记物可以通过本领域技术人员熟知的常规方法来进行,并且因此在本发明的范围内。单体型频率的确定患者和对照组中单体型的频率可以利用预期-最大化算法来估计(DempsterA.etal.,J.R.Stat.Soc.B,39:1-38(1977))。可以处理错失的基因型和与相位(phase)的不确定性的该算法的实施可以被使用。在零假设下,患者和对照被认为具有相同的频率。利用可能性方法,可替换的假设被测试,其中可以包括这里描述的标记物的候选风险中的单体型)被允许在患者中具有比对照更高的频率,而其他单体型的频率的比被假定在两个组中相同。在两个假设下可能性被分别最大化,并且相应的1-df可能性比统计量被用于评估统计显著性。为了寻找易感性区中,例如LD块区中,风险中的和保护性的标记物和单体型,研究了所述区中基因型化(genotyped)的标记物的所有可能的组合的关联。组合的患者和对照组可以被随机分成两个组,大小上等于患者和对照的原始组。随后重复标记物和单体型分析并且确定记录的最显著的P值。可以重复该随机化方案,例如,超过100次以构建p值的经验分布。在优选的实施方式中,<0.05的p值是显著的标记物和/或单体型关联的指征。单体型分析单体型分析的一个一般方法涉及利用应用于NEstedM0dels(GretarsdottirS.,etal.,Nat.Genet.35:131-38(2003))的基于似然的推论。所述方法在程序NEMO中实施,其考虑许多多态标记物、SNP和微随体。该方法和软件被特别设计用于病例_对照研究,其中目的是鉴定提供不同的风险的单体型基团。它还是用于研究LD结构的工具。在NEM0中,最大似然估计、似然比率和P-值借助于EM算法来直接计算,用于观测数据,作为错失(漏失)-数据问题处理它。即使基于对于观测的数据直接计算的似然的似然比率检验,其已经捕获由于相(phase)中的不确定性的信息损失和错失的基因型,可以被依赖以产生有效的p值,但是仍然感兴趣的是知道多少信息由于信息不完全已经丢失。用于单体型分析的信息测量描述29在Nicolae禾口Kong(TechnicalReport537,DepartmentofStatistics,UniversityofStatistics,UniversityofChicago;Biometrics,60(2):368-75(2004))中,作为限定用于连锁分析的信息测量的自然延伸,并且在NEMO中实施。对于单一标记物与疾病的关联,Fisher精确检验可以用于计算每个个体等位基因的两侧P值。通常,除非特别指出,否则所有的P值未调整的呈现用于多重比较。呈现的频率(对于微随体、SNP和单体型)是与携带者频率相反的等位基因频率。为了最小化由于作为家族招募的患者的相关性的任何偏倚(bias),一级和二级亲属可以从患者列表中删除。此外,通过延伸先前描述的方差调整程序用于同胞群(Risch,N.&Teng,J.(GenomeRes.,8:1273-1288(1998))以便它可以用于一般家族关系,并代表用于比较的调整的和未调整的P值,可以重复所述检验用于关联校正患者中任何残余的关联性。基因组对照的方法(Devlin,B.&Roeder,K.Biometrics55:997(1999))也可以用于调整个体的相关性和可能的分层。差异通常如预期的非常小。为了评估对于多个检验校正的单一标记物关联的显著性,我们可以利用相同的基因型数据进行随机检验。患者和对照的同龄组可以被随机化并且重做关联分析多次(例如,直到500,000次),并且p值是复制的部分,其产生对于一些标记物等位基因的P值,其低于或等于我们利用最初的患者和对照同龄组观察到的P值。对于单一标记物和单体型分析,相对风险(RR)和群体特异风险(PAR)可以被计算(假定乘法模式(模型))(单体型相对风险模型)(Terwilliger,J.D.&0tt,J.,H亂Hered.42:337-46(1992)andFalk,CT.&Rubinstein,P,Arm.Hum.Genet.51(Pt3):227-33(1987)),即,个人携带的两个等位基因/单体型的风险相乘。例如,如果RR是A相对于a的风险,则个人纯合子AA的风险将是杂合子Aa的风险的RR倍,并且将是纯合子aa的风险的RR2倍。乘法模式具有简化分析和计算的优点_在受影响的群体内以及对照群体内,单体型是独立的,即,在Hardy-Weinberg平衡中。因而,受影响的和对照的单体型计数均具有多项分布,但是在可替换的假设下具有不同的单体型频率。特别地,对于两个单体型,hi和hj,风险GO/风险(hj)=(fi/Pi)/(fj/Pj),其中f和p分别指受影响的群体中和对照群体中的频率。虽然如果真实模式不是相乘的,存在一些力量损失,但是损失倾向于轻微,除了极端情况外。最重要地,P值总是有效的,因为它们相对于零假设计算。在一个关联研究中检测的关联信号可以在第二个组(同龄组)(理想地来自相同或不同种族的不同群体(例如,相同或不同国家的不同区))中被复制。复制研究的优点是在复制研究中进行的测试的数量,并由此被应用的统计测量严格性较低。例如,对于利用300,000个SNP的用于特定疾病或性状的易感性变异体的基因组_范围的研究,进行的300,000个测试(对于每个SNP—个)的校正可以被进行。由于在典型使用的阵列上许多SNP相关联(即,在LD中),因此它们不是独立的。由此,所述校正是保守的。然而,应用该校正因素需要小于0.05/300,000=1.7X10—7的观察到的P值,因为应用该保守检验的要考虑的显著性的信号产生自单一的研究组。明显地,在P值小于该保守阈值的情况下,在基因组-范围的关联研究中发现的信号是真正的基因作用的测量值,并且在另外的组(同龄组)中的复制从统计角度来看不是必需的。然而,由于校正因素取决于进行的统计检验的数量,因此如果来自初始研究的一个信号(一个SNP)在第二个病例-对照组中被复制,则对于显著性的合适的统计检验是对于单一统计检验的那个,即,P值小于O.05。在一个或甚至几个另外的病例-对照组中的复制研究具有的增加的优点是提供增加的群体中关联信号的评估,由此同时确认初始发现并提供大体上在人类群体中被测试的遗传变异体的综合显著性的评估。来自几个病例-对照组的结果也可以被结合以提供潜在作用的综合评估。通常用于结合来自多个基因关联研究的结果的方法是Mantel-Haenszel模式(MantelandHaenszel,JNatlCancerInst22:719-48(1959))。所述模式被设计成处理其中关联产生自不同的群体的情况,可能具有不同的遗传变异体的群体频率的每个,被结合。所述模式结合这样的结果,其假定变异体对疾病的风险的影响,通过OR或RR测量,在所有的群体中是相同的,而变异体的频率在群体之间可能不同。结合来自几个群体的结果具有增加的优势,即,检测实际的潜在关联信号的综合能力被增加,原因是由结合的组(同龄组)提供的增加的统计能力。此外,个体研究中的任何缺陷,例如由于病例和对照的不相等匹配或群体分层,在来自多个组(同龄组)的结果被结合时将倾向于平衡,再次提供真实的潜在遗传作用的更好估计。风险评估和诊断在任何给定的群体内,存在发展疾病或性状的绝对风险,定义为个人在指定时期发展特定疾病或性状的机会。例如,妇女的乳腺癌的终生绝对风险为九分之一。也就是说,每九个中的一个妇女在她们生命的某个点将发展乳腺癌。风险通常通过考察非常大量的人而不是在特定个体处测量。风险通常根据绝对风险(AR)和相对风险(RR)表示。相对风险用来比较与两个变异体相关的风险或两个不同的人群的风险。例如,它可以用来比较具有某个基因型的人群与具有不同的基因型的另一人群。对于疾病,2的相对风险意味着一个群具有的发展疾病的机会是另一群的两倍。表达的风险对于个人,或个人的特定基因型通常是与具有匹配的性别或种族的群体相比较的相对风险。同样性别和种族的两个个体的风险可以以简单的方式比较。例如,如果,与所述群体相比,第一个个体具有相对风险1.5,而第二个具有相对风险O.5,则与第二个个体相比,第一个个体的风险是1.5/0.5=3。如这里描述的,一些多态标记物和包含这样的标记物的单体型被发现用于乳腺癌的风险评估。风险评估可以涉及用于诊断对乳腺癌的易感性的标记物的应用。多态标记物的特定等位基因被发现在患有乳腺癌的个体中比在没有诊断有乳腺癌的个体中更常见。因此,这些标记物等位基因具有用于检测个体中乳腺癌或对乳腺癌的易感性的预测价值。包含风险中的标记物,如本发明的标记物的单体型块或LD块内的标签标记物可以用作单体型块或LD块内其他标记物和/或单体型的代理。具有等于1的r2值的标记物是风险中的变异体的完美的代理,即,对于一个标记物的基因型完全预测另一个的基因型。具有小于1的较小一值的标记物也可以为用于风险中的变异体的代理,或者可替换地代表具有与风险中的变异体一样高的相对风险值的变异体或者具有可能甚至比风险中的变异体更高的相对风险的变异体。鉴定的风险中的变异体本身可以不是功能性变异体,但是在该情况下与真正的功能性变异体在连锁不平衡中。所述功能性变异体可以例如为串联重复(衔接重复,tandemr印eat),如小随体或微随体、转座元件(如,Alu元件)、或结构改变、如缺失、插入或倒位(有时还称为拷贝数量变异,或CNV)。本发明包括评估用于如这里披露的标记物的这样的代理标记物。这样的标记物被注解、绘图和列在公共数据库中,如本领域技术人员熟知的,或者可以可替换地被容易地鉴定,所述鉴定是通过对个体的组中本发明的标记物鉴定的区或区的一部分进行测序,并鉴定序列的所得到的组中的多态性。因此,本领域技术人员可以容易地且无需过度实验基因型代理在与如这里描述的标记物和/或单体型连锁不平衡中的标记物。在与检测的风险中的变异体LD中的标签或代理标记物,对于检测个体中与乳腺癌或对乳腺癌的易感性的关联也具有预测价值。这些在与本发明的标记物LD中的标签或代理标记物也可以包括在单体型中区别的其他标记物,因为这些类似地具有用于检测对乳腺癌的易感性的预测价值。在一些实施方式中,本发明可以通过评估包含来自个体的基因组DNA的样品的与乳腺癌相关的这里描述的变异体的存在来实施。这样的评估包括以下步骤利用技术人员熟知的和这里进一步描述的方法来检测至少一个多态标记物的至少一个等位基因的存在或缺乏,以及基于这样的评估的结果,确定样品来源的个体是否处于乳腺癌的增加或降低的风险中(增加或降低的易感性)。可替换地,本发明可以利用包括关于这里描述的与乳腺癌相关的至少一个多态标记物(或者在与这里所示的与乳腺癌相关的至少一个标记物连锁不平衡中的标记物)的基因型状况的信息的数据组(dataset)来实施。换言之,包含关于这样的基因状况的信息的数据组,例如形式为在某一多态标记物或多个标记物(例如,一些风险中的等位基因的存在或缺乏的指征)处的基因型计数,或对于一个或多个标记物的实际基因型,可以被查询与乳腺癌相关的由本发明的发明人所示的一些多态标记物处一些风险中的等位基因的存在或缺乏。如这里所示的,对于与乳腺癌的增加的风险相关的变异体(例如,标记物等位基因)的阳性结果指示数据组来源的个体处于乳腺癌的增加的易感性(增加的风险)。在本发明的一些实施方式中,多态标记物通过参考对于多态标记物的基因型数据与包括多态性的至少一个等位基因与乳腺癌之间的关联的查询表而与乳腺癌关联。在一些实施方式中,所述表包括对于一个多态性的关联。在其他实施方式中,所述表包括对于多个多态性的关联。在两种情况中,通过参考给出标记物与乳腺癌之间的关联的指征的查询表,对于乳腺癌的风险,或对于乳腺癌的易感性,可以在样品来源的个体中被鉴定。在一些实施方式中,所述关联作为统计测量值被报道。所述统计测量值可以作为风险测量值被报道,如相对风险(RR)、绝对风险(AR)或优势比(0R)。本发明的标记物,如,染色体5pl2和染色体10q26上的多态标记物,例如,表12、表13和表14中示出的标记物,例如,标记物rs7703618、rs4415084、rs2067980、rs10035564、rsl1743392、rs7716600、rsl0941679、rsl219648,可以用于单独或组合用于风险评估和诊断目的。因此,甚至在其中通过个体的标记物的风险增加相对中等的情况下,即,大约10-30%,所述关联也可以具有显著的含义。因此,相对常见的变异体可以对于综合风险具有显著的贡献(群体特异风险高),或标记物的组合可以用于限定个体的组,其基于标记物的组合的风险,处于发展所述疾病的显著组合的风险中。例如,组合的风险可以基于来自染色体5pl2和染色体10q26上的标记物的基因型结果来评估,如标记物rsl0941679和标记物rsl219648。可替换地,与这些标记物中的任何一个在LD中的标记物可以被评估。已知提供乳腺癌的风险的其他标记物也可以与这里描述的标记物一起被评估,如染色体2ql4上的标记物(例如,标记物rs4848543或在与其连锁不平衡中的标记物),染色体2q35上的标记物(例如,标记物rsl3387042,或在与其连锁不平衡中的标记物),以及染色体16上的标记物(例如,标记物rs3803662,或在与其连锁不平衡中的标记物)。32因此,在本发明的一个实施方式中,多个变异体(标记物和/或单体型)用于综合风险评估。这些变异体在一个实施方式中选自如这里披露的变异体。其他实施方式包括本发明的变异体结合已知用于诊断对乳腺癌的易感性的其他变异体的应用。对于任何两个或多个标记物的结果可以在这样的分析中被组合,如对于三个标记物、四个标记物、五个标记物、六个标记物、七个标记物、八个标记物、九个标记物、或十个或更多个标记物的结果。在这样的实施方式中,多个标记物和/或单体型的基因型状况在个体中被确定,并且所述个体的状况与相关变异体的群体频率,或者临床健康受治疗者,如年龄_匹配的和性别_匹配的受治疗者中的变异体的频率相比较。本领域已知的方法,如多变量分析或联合风险分析,可以随后用来确定基于多基因座处基因型状况提供的综合风险。基于这样的分析的风险的评估可以随后用在本发明的方法和试剂盒中,如这里描述的。如上面描述的,人类基因组的单体型块结构具有这样的影响,即在与疾病或性状原始相关的变异体连锁不平衡中的大量的变异体(标记物和/或单体型)可以用作用于评估与疾病或性状的关联的代理标记物。这样的代理标记物的数量将依赖于诸如所述区中的历史重组率、所述区中的突变频率(即,所述区中多态位点或标记物的数量)、以及所述区中LD的程度(LD块的大小)的因素。这些标记物通常位于所讨论的LD块或单体型块的物理界限内,如利用这里描述的方法,或通过本领域技术人员已知的其他方法限定的。然而,有时标记物和单体型关联被发现延伸到如所限定的单体型块的物理界限之外。在那些情况中,这样的标记物和/或单体型也可以用作用于物理上位于如所限定的单体型块内的标记物和/或单体型的代理标记物和/或单体型。因此,与本发明的标记物和单体型在LD中的标记物和单体型(典型地特征为r2大于0.1,如r2大于0.2,包括r2大于0.3,还包括r2大于O.4)也在本发明的范围内,即使它们物理上位于如所限定的单体型块的界限之外。这包括这里描述的标记物(例如,表1和表3,例如,rs4415084、rsl0941679、rsl219648),但是还包括与表1和表3中列出的标记物的一个或多个在强LD中(特征为r2大于0.1或0.2和/或ID'I>0.8)的其他标记物。对于这里描述的SNP标记物,在患者中发现与过量的等位基因(风险中的等位基因)相对的等位基因被发现在乳腺癌中频率降低。LD中和/或包含这样的标记物的这些标记物和单体型由此对于乳腺癌是保护性的,B卩,它们为携带这些标记物和/或单体型的个体提供发展乳腺癌的降低的风险或易感性。本发明的一些变异体,包括一些单体型,在一些情况下包括不同遗传标记物的组合,如SNP和微随体。检测单体型可以通过用于检测多态位点处的序列的本领域已知的方法和/或这里描述的方法来实现。此外,一些单体型或标记物的组与疾病表型之间的关联可以利用标准技术来校验。用于关联的简单测试的代表性实例为在二乘二表上的Fisher精确检验。在特定实施方式中,发现与乳腺癌相关的标记物等位基因或单体型(例如,如在表1和表3中列出的标记物等位基因,如在表12、表13和表14中列出的标记物,SEQIDNO:1-237)是这样的标记物等位基因或单体型,其中所述标记物等位基因或单体型与其在健康个体(对照)中存在的频率相比,在处于乳腺癌风险(受影响的)个体中以更大的频率存在,其中,所述标记物等位基因或单体型的存在指示乳腺癌或对乳腺癌的易感性。在其他实施方式中,在与发现与乳腺癌相关的一个或多个标记物连锁不平衡中的风险中的标记物是标签标记物,其与它们在健康个体(对照)中存在的频率相比,以更大的频率存在于处于乳腺癌风险中的个体(受影响的)中,其中所述标签标记物的存在指示对乳腺癌的增加的易感性。在另外的实施方式中,在与发现与乳腺癌相关的一个或多个标记物连锁不平衡中的风险中的标记物等位基因(即,提供增加的易感性)是包含一个或多个等位基因的标记物,所述等位基因与其在健康个体(对照)中存在的频率相比,在处于乳腺癌风险的个体中以更大频率存在,其中,所述标记物的存在指示对乳腺癌的增加的易感性。研究群体在通常意义上,本发明的方法和试剂盒可以用于包含来自任何来源,即,任何个体的基因组DNA的样品。在优选的实施方式中,所述个体为人类个体。所述个体可以为成年人、儿童、或胎儿。本发明还用于评估作为目标群体的成员的个体中的标记物和/或单体型。这样的目标群体在一个实施方式中为处于发展疾病的风险中的群体或个体群,这是基于其他遗传因素、生物标记物、生物物理参数(例如,体重、BMD、血压)、或一般健康和/或生活方式参数(例如,癌症史、乳腺癌史、先前的疾病诊断、癌症的家族史、乳腺癌的家族史)。本发明提供了包括来自特定年龄亚群的个体的实施方式,如那些超过40岁的年龄,超过45岁的年龄,或超过50、55、60、65、70、75、80、或85岁的年龄的亚群。本发明的其他实施方式涉及其他年龄组,如年龄小于85,如小于80岁,小于75岁,或小于70、65、60、55、50、45、40、35、或30岁的个体。其他实施方式涉及具有在上面描述的年龄范围的任何一个中疾病的发作时的年龄的个体。还预期年龄的范围在一些实施方式中可以是相关的,如在超过45岁但小于60岁时发作的年龄。然而其他年龄范围也是预期的,包括由上面列出的年龄值包括的所有年龄范围。本发明进一步涉及任何一个性别的个体,雄性或雌性。在一些实施方式中,它涉及雄性受治疗者的评估。在优选的实施方式中,它涉及雌性受治疗者的评估。冰岛人群是北欧世系的高加索人群。在最近几年内已经公布了大量报道冰岛人群中遗传连锁和关联的结果的研究。这些研究中的许多表明在其他人群中变异体的复制,其最初在冰岛人群中因为与特定疾病相关而被鉴定(Styrkarsdottir.,U.,etal.NEnglJMedApr292008(Epubaheadofprint);Thorgeirsson,T.,etal.Nature452:638-42(2008);Gudmundsson,J.,etal.NatGenet.40:281-3(2008);Stacey,S.N.,etal.,NatGenet.39:865-69(2007);Helgadottir,A.,etal.,Science316:1491-93(2007);Steinthorsdottir,V.,etal.,NatGenet.39:770-75(2007);Gudmundsson,J.,etal.,NatGenet.39:631-37(2007);Frayling,TM,NatureReviewsGenet8:657-662(2007);Amundadottir,LT.,etal.,NatGenet.38:652-58(2006);Grant,S.F.,etal.,NatGenet.38:320-23(2006))。因此,冰岛人群中的遗传发现通常在其他人群中被复制,包括来自非洲和亚洲的人群。被发现与乳腺癌相关的本发明的标记物被认为在其他人类群体中表现出类似的关联。包括个体的人类群体的特定实施方式由此也是预期的并在本发明的范围内。这样的实施方式涉及来自一个或多个人类群体的人类受治疗者,所述群体包括但不限于,高加索人群、欧洲人群、美洲人群、欧亚人群、亚洲人群、中亚/南亚人群、东亚人群、中东人群、非洲人群、西班牙人群、和大洋州人群。欧洲人群包括但不限于,瑞典人、挪威人、芬兰人、俄国人、丹麦人、冰岛人、爱尔兰人、凯尔特人、英国人、苏格兰人、荷兰人、比利时人、法国人、德国人、西班牙人、葡萄牙人、意大利人、波兰人、保加利亚人、斯拉夫人、塞尔维亚人、波斯尼亚人、捷克人、希腊人和土耳其人群体。此外在其他实施方式中,本发明可以在特定人类群体中被实施,所述群体包括班图人、曼丁哥人、约鲁巴人、桑人、姆布蒂俾格米人、奥克尼群岛、Adygel、俄国人、撒丁尼亚人、托斯卡纳人、莫扎比特(Mozabite)、贝多因人、德鲁兹人(Druze)、巴勒斯坦人、俾路支人(Balochi)、布拉灰人(Brahui)、莫克兰人(Makrani)、信德人(Sindhi)、帕坦人、布魯肖人(Burusho)、哈扎拉人(Hazara)、维吾尔人(Uygur)、卡拉什人(Kalash)、汉族人、傣族人、达斡尔人(Daur)、赫哲人(Hezhen)、拉祜族人、苗族人(Miao)、鄂伦春人(Oroqen)、禽族人、土家族人(Tujia)、土族人(Tu)、锡伯族人(Xibo)、彝族人、蒙古人、纳西族人(Naxi)、柬埔寨人、日本人、雅库特人、美拉尼西亚人、巴布亚人、卡日天安人(Karitianan)、苏瑞人(Surui)、哥伦比亚人(Colmbian)、玛雅人和比马人。在一些实施方式中,本发明涉及包括黑种非洲人世系的群体,如包括非洲人谱系或血统的个人的群体。黑种非洲人世系可以通过作为非洲人_美洲人、非洲_美洲人、黑种美洲人自我报道来确定,其是黑色人种的成员或黑人人种的成员。例如,非洲人美洲人或黑种美洲人是那些生活在北美并在非洲的黑人人种群体的任何一个中具有起源的个人。在另一个实例中,黑种非洲人世系的自我报道的个人可以具有至少一个黑种非洲人世系的双亲或至少一个黑种非洲人世系的祖父母。个体受治疗者中的人种分布也可以通过遗传分析来确定。世系的遗传分析可以利用非连锁的微随体标记物进行,如在Smithetal.(AmJHumGenet74,1001-13(2004))中阐述的那些。在一些实施方式中,本发明涉及在特定群体中的标记物和/或单体型,如上所述。本领域技术人员将认识到连锁不平衡(LD)的测量当被应用于不同的群体时将产生不同的结果。这是由于不同的人类群体的不同的群体历史以及可以导致在特定基因组区中LD中的差异的不同的选择压力。本领域技术人员还熟知一些标记物,如,SNP标记物,在一个群体中是多态的,但是在另一群体中不是多态的。然而本领域技术人员将可利用地应用所述方法并如这里教导的在任何给定的人类群体中实施本发明。这可以包括本发明的LD区中多态标记物的评估,以便鉴定那些在特定群体内产生最强的关联的标记物。因此,本发明的风险中的变异体可以位于不同的单体型背景上并以不同的频率在各种人类群体中。然而,利用本领域已知的方法和本发明的标记物,本发明可以在任何给定的人类群体中实施。预测乳腺癌的遗传风险的模型乳腺癌风险评估的目标是提供一种用于所有妇女的个人化的医疗管理策略的发展的合理的框架,目标是提高高风险妇女中的存活率和生命质量,同时最小化成本、不必要的介入和较低风险的妇女中的焦虑。风险预测模型试图估计在具有给定的先天风险特征(例如,家族史、在前的良性乳腺损伤、先前乳腺肿瘤)的组的个体中对于乳腺癌的风险。在临床实践中最常采用的乳腺癌风险评估模型通过考虑家族史来估计遗传风险因素。该风险评估是基于具有一个或多个先前诊断有乳腺癌的近亲属的个体的增加的风险的观察。他们并不考虑复杂系谱结构。这些模型具有的另外的不利之处在于不能够区别具有乳腺癌易于突变的基因的携带者和非携带者。更复杂的风险模型具有处理特定家族史的更好机制并具有考虑对于BRCA1和BRCA2突变的携带者状况的能力。例如,疾病发生率和携带者评估算法的乳腺和卵巢分析(BreastandOvarianAnalysisofDiseaseIncidenceandCarrierEstimationAlgorithm)(BOADICEA)(Antoniouetal.,2004)基于个体系谱结构通过系谱分析程序MENDEL考虑家族史。关于已知BRCAl和BRCA2状况的信息也被考虑。BOADICEA和所有其他目前使用的乳腺癌风险模型的主要限制在于它们并不结合来自其他诱因基因的基因型信息。目前的模型强烈依赖于家族史以用作补偿缺乏风险的非-BRCA遗传定子的知识的代理。因此,可利用的模型限于其中存在已知的疾病家族史的情况。较低外显率的乳腺癌诱因基因可能在群体中相对常见,并且可能没有显示如BRCAl和BRCA2基因那样强的驱动家族簇集的倾向。具有相对高的诱因等位基因的遗传负荷的患者可能显示很少或没有显示疾病的家族史。因此存在构建模型的需要,其并入通过基于基因的测试直接获得的遗传易感性数据。除了更精确地形成模型外,这将减少对家族史参数的依赖性并辅助风险识别(风险预测,风险分布,riskprofiling)延伸入其中家族史不是这样的关键因素的更广泛的风险中的群体中。将改善的遗传风险模型整合入乳腺癌原发预防的临床管理中临床原发预防选择目前可以被分类为化学预防(或激素)治疗和预防性手术。鉴定为高风险的患者可以被指定长期过程的化学预防治疗。该概念在心血管药物领域中被充分接受,但是现在仅开始影响临床肿瘤学。最广泛使用的肿瘤学化学预防法是他莫昔芬(Tamoxifen),一种选择性雌激素受体调节剂(SERM)。最初用作针对乳腺癌复发的辅助疗法,现在他莫昔芬已经证明作为乳腺癌预防药剂的功效[Cuzick,etal.,(2003),Lancet,361,296-300][Martino,etal.,(2004),Oncologist,9,116-25]。FDA已经批准在一些高风险妇女中使用他莫昔芬作为化学预防药剂。不幸的是,长期使用他莫西芬增加子宫内膜癌的风险约2.5倍,静脉血栓形成的风险约2.0倍。肺栓塞、中风、和白内障的风险也被增加[Cuzick,etal.,(2003),Lancet,361,296-300]。因此,他莫昔芬用于减少乳腺癌发生率的优点不可能被容易地转化为总的死亡率的相应降低。称为雷洛昔芬(Raloxifene)的另一SERM在预防性模式中可能更有效,并且不带来对于子宫内膜癌的相同风险。然而,在长期用雷洛昔芬治疗的患者中血栓形成的风险仍被提高[Cuzick,etal.,(2003),Lancet,361,296-300;Martino,etal.,(2004),Oncologist,9,116-25]。此外,他莫昔芬和雷洛昔芬均具有与它们相关的生命质量问题。为了在化学预防性模式中进行SERM治疗的合理的风险益处分析,存在的临床需要是鉴定处于乳腺癌的最大风险中的个体。假定乳腺癌的风险的实质部分是遗传的,则在这点上存在对于量化个体的风险的遗传测试的清楚的临床需要。可以预期起源于可能变得可利用的任何未来的癌症化学-预防性治疗的类似问题,如芳香酶抑制剂。此外,随着化学预防治疗变得更安全,存在对鉴定遗传易患病的,但是没有与BRCAI&2突变携带者相关的大量提高的风险的患者的增加的需要。鉴定为处于乳腺癌的高风险的患者被考虑预防性手术;双侧乳房切除术或卵巢切除术或两者。清楚地,这样的激烈处理仅被推荐用于被感知处于极高风险的患者。实践中,这样的风险目前仅在携带BRCA1、BRCA2或已知涉及稀有的乳腺癌诱因综合症的基因中的突变的个体中鉴定,如Li-Fra咖eni综合症中的p53,Cowden's综合症中的PTEN。BRCA1和BRCA2突变的外显率的估计倾向于当它们来自多病例家族时比当它们来自基于群体的估计时高。这是因为不同的突变-携带家族表现出对乳腺癌的不同外显率(参见例如[Thorlacius,etal.,(1997),AmJHumGenet,60,1079-84])。有助于该变异的主要因素之一是至今未知的诱因基因的作用,其影响修饰BRCAl和BRCA2突变的外显率。因此,携带BRCAl或BRCA2基因中的突变的个体的绝对风险在修饰基因的存在和作用的知识缺乏的情况下不能被精确地量化。由于对于BRCAl和BRCA2携带者的治疗选择可能是严格的,因此在这点上重要的是用最大可能的精确度来量化个体BRCA携带者的风险。因此,存在的需要是鉴定影响修饰BRCAl和BRCA2携带者中乳腺癌的外显率的诱因基因并基于这些基因发展改善的风险评估模型。此外,存在这样的个体,其被察觉到处于非常高的乳腺癌风险中,可能是因为乳腺癌的强家族史,但是其中已知诱因基因中没有突变可以被鉴定。在这样的情况下考虑预防性手术是困难的,因为人们不能够测试所述个体以发现是否她已经遗传了高外显率诱因基因。因此,个体的风险不能被精确地评估。因此,存在的清楚的临床需求是鉴定仍然未发现的任何高外显率诱因基因并发展在最初预防策略中使用的相关遗传测试。这样的基因可以例如为这里披露的与乳腺癌的风险相关的基因(例如,FGF10、MRPS30和/或FGFR2基因)。虽然这里所示的与乳腺癌的风险相关的变异体是相当常见的,并且提供乳腺癌的相对低的风险,但是非常可能的是较高风险的变异体存在于这些基因中的一个或多个内。因此,预期FGF10、MRPS30和/或FGFR2基因中的一个或多个内或与FGF10、MRPS30和/或FGFR2基因中的一个或多个相关的高风险遗传变异体可以用于确定个体是否是乳腺癌的高风险(和高外显率)遗传因子的携带者。早期诊断临床筛查乳腺癌在大多数西方国家中由定期临床乳房检查(CBE)和X-射线乳房X线照相术组成。存在良好的证据表明当在良好的乳房X线照相筛查程序的环境中使用时CBE几乎没有增加的益处。在英国,年龄在50岁与70岁之间的妇女被邀请每三年进行筛查乳房X线照相术。美国的情况依赖卫生保健提供者变化,然而,美国癌症协会建议从40岁起每年进行乳房X线照相筛查(mammographicscreening)。乳房X线照相筛查已经证明在减少超过50岁的被筛查的妇女中的死亡率中的有效性。未必遗传测试将永远用作减少获取现有的乳房X线照相筛查程序的方式。然而,乳房X线照相筛查不是没有缺点,但是可以设想遗传测试应当用于选择用于增加的筛查程序的人。乳房X线照相筛查的缺点之一是它至今对于50岁年龄以下的筛查的妇女不可能展示对提高的生存的显著影响。乳房X线照相术在50岁以下的妇女中有效性较低的一个原因是在较年轻的妇女中乳腺组织的密度更高,使得肿瘤的乳房X线照相检测更困难。然而,易患病的个体中的乳腺癌倾向于在早期年龄组中发生,并且在高乳腺密度与乳腺癌风险之间存在清楚的关联。因此,在用于具有高诱因的个体的乳房X线照相筛查中存在伴随简单的增加的问题,因为他们将通过在最高风险的组中不是最理想地进行的技术来管理。最近的研究已经表明对比-增强的磁共振成像(CE-MRI)更敏感,并在该高风险组中比乳房X线照相筛查更早期地检测肿瘤[Warner,etal.,(2004),Jama,292,1317-25;Leach,etal.,(2005),Lancet,365,1769-78]。CE-MRI策略在结合常规X-射线乳房X线照相术使用时运行特别良好[Leach,etal.,(2005),Lancet,365,1769-78]。因为CE-MRI需要导致高成本的专家中心,5Q岁以下的筛查必须限于最高风险的那些个体。目前的CE-MRI检查限定那些具有37BRCA1、BRCA2或p53突变或非常强的疾病家族史的个体进入。该筛查形式到较广范围的高风险患者的延伸将由基于基因的风险预测工具的提供极大地辅助。存在良好的支持该观念的证据,S卩,早期发作的乳腺癌和在遗传易患病的妇女中发生的癌症比年老者中的癌症生长更快,易患病的强度较小的妇女中的癌症生长更快。这来自较年轻的妇女中较高间隔率癌症的观察,即,在充分筛查的群体中筛查访问之间的间隔中发生的癌症在较年轻的妇女中更高。因此,存在这样的建议,即,筛查间隔,通过任何方法,对于较年轻的女性应当减少。这里存在的矛盾是利用更昂贵的方法的更频繁的筛查似乎对于其中乳腺癌的总率比较低的年龄组是必需的。这里存在清楚的临床需要来鉴定那些年轻个体,其是最强地容易早期发展疾病,并把他们引入更昂贵和广泛的筛查方案。这里披露的提供乳腺癌风险的变异体可以用于处于特别高的发展乳腺癌风险的个体的鉴定。这样的个体可能从早期和侵入性筛查程序中更受益,以便最大化癌症的早期鉴定的可能性。治疗目前,原发乳腺癌通过手术、佐剂化学疗法、放射疗法、随后通过长期激素疗法来治疗。通常使用三种或四种疗法的组合。伴随疾病的相同阶段的乳腺癌患者对佐剂化学疗法可以具有非常不同的反应,导致总的治疗结果的广泛的变化。意见一致的指导方针(Consensusguidelines)(theStGalen和NIH标准)已经被开发用于确定乳腺癌患者对佐剂化学疗法治疗的适当性。然而,甚至转移(新陈代谢)的最强的临床和组织预测者也不能精确地预测乳腺肿瘤的临床反应[Goldhirsch,etal.,(1998),JNatlCancerInst,90,1601—8;Eifel,etal.,(2001),JNatlCancerInst,93,979-89]。化学疗法或激素疗法仅减少转移的风险大约1/3,然而,接受该治疗的70-80%的患者在没有它的情况下也将存活。因此,大多数的乳腺癌患者目前被提供无效或非必需的治疗。对于预后测量的开发中的改进存在清楚的临床需要,所述预后测量将允许临床医师制定更适当地将最佳受益的那些患者的治疗。合理的是预期识别(预测)个体的遗传诱因将揭示与它们的治疗结果相关的信息并由此辅助合理的治疗计划。本发明的标记物,提供乳腺癌的风险,被预期用在该背景中。几个先前的结果例证了该概念作为BRCA突变携带者的乳腺癌患者当用佐剂化学疗法治疗时似乎显示出更好的临床反应率和存活[Ch即puis,etal.,(2002),JMedGenet,39,608-10;Goffin,etal.,(2003),Cancer,97,527-36]。BRCA突变携带者对用于卵巢癌的铂化学疗法比非携带者表现出提高的反应[Cass,etal.,(2003),Cancer,97,2187-95]。类似的考虑可以应用于其中涉及的基因未知的易患病的患者。例如,渗入小叶乳腺癌(infiltratinglobularbreastcarcinoma)(ILBC)已知具有强家族成分,但是涉及的遗传变异体还没有被鉴定。具有ILBC的患者对常见的化学疗法方案表现出较弱的反应[Mathieu,etal.,(2004),EurJCancer,40,342-51]。遗传诱因模型不仅可以辅助治疗策略的个性化,而且可以在这些策略的设计中起整体的作用。例如,BRCA1和BRCA2突变体肿瘤细胞已经被发现由于它们缺陷的DNA修复途径而对聚(ADP-核糖)聚合酶(PARP)抑制剂非常敏感[Farmer,etal.,(2005),Nature,434,917-21]。这已经剌激了着眼于它们在BRCA携带者患者中特异性的应用的靶向PARP的小分子药物的发展。从该实例可以清楚的是,遗传诱因的知识可以鉴定药物靶标(drugtargets),这导致与遗传风险识别(预测)结合使用的个人化的化学治疗方案的发展。类似地,本发明的标记物可以辅助耙向,例如,FGF10、MRPS30和/或FGFR2基因中的一个或多个的新型药物的鉴定。癌症化学疗法众所周知对正常组织尤其是高度增殖造血和肠上皮细胞区室具有剂量限制性副作用。可以预期基于遗传的个体差异存在于正常组织对细胞毒性药物的敏感性中。这些因素的理解可以辅助合理的治疗计划和被设计成保护正常组织免于化学疗法的不利作用的药物的开发。遗传识别(geneticprofiling)也可以有助于改善的放射治疗方法在经历标准的放射治疗方案的乳腺癌患者的组中,部分患者将经历与正常可以忍受的辐射剂量的不利反应。急性反应包括红斑、湿性脱屑(moistdesquamation)、水肿和放射性肺炎(radiationpne咖atitis)。包括毛细管扩张、水肿、肺纤维化和乳房纤维化的长期反应可以在放射治疗后许多年发生。急性和长期反应均是发病率的重要来源并可能是致命的。在一个研究中,87%的患者被发现对放射治疗具有一些不利的副作用,而11%具有严重的不利反应(LENT/S0MAGrade3-4);[Hoeller,etal.,(2003),IntJRadiatOncolBiolPhys,55,1013-8]。经历对放射治疗的不利反应的可能性主要是由于正常组织反应中的构成性个体差异,并且存在这些具有强遗传成分的怀疑。几个已知的乳腺癌诱因基因(例如,BRCA1、BRCA2、ATM)影响DNA双链断裂修复的途径。DNA双链断裂是放射治疗诱导的主要细胞毒性损害。这已经导致涉及通过携带属于这些途径的基因中的变异体对乳腺癌遗传易患病的个体也可能处于遭受来自放射治疗的过度的正常组织损害的较高风险。可以预期这里描述的提供乳腺癌的风险的遗传变异体,例如通过FGF10、MRPS30和/或FGFR2基因中的一个或多个,可能用于鉴定处于对放射治疗的不利反应的特定风险处的个体。群体中构成性放射敏感个体的存在意味着对于大多数患者群体的放射治疗剂量率必须被限制,以便将不利反应的频率保持在可接受的水平。因此,存在对可靠试验的临床需要,该可靠试验可以鉴定处于提高的对于放射治疗的不利反应风险中的个体。这样的试验将指出用于放射敏感的个体的保守或可替换的治疗,而允许增加的放射治疗剂量用于相对放射抵抗的大多数患者。已经估计通过试验将乳腺癌患者简单地分成放射敏感的、中间的和放射抵抗的类别而成为可能的剂量增加将导致局部肿瘤控制中大约35%的增加以及随之的存活率的改进[Burnet,etal.,(1996),ClinOncol(RCollRadiol),8,25-34]。暴露于电离辐射是证明的有助于乳腺癌中肿瘤发生的因素[DumitrescuandCotarla,(2005),JCellMolMed,9,208-21]。已知的乳腺癌诱因基因编码细胞对辐射诱导的DNA损伤的应答的途径成分(pathwaycomponents)[NarodandFoulkes,(2004),NatRevCancer,4,665-76]。因此,存在这样的担忧,即,在放射治疗领域内通过正常组织的辐射,第二原发乳腺肿瘤的风险可能被增加。对于BRCA携带者似乎没有来自放射治疗的任何可测量的增加的风险,然而它们对于第二原发肿瘤的风险已经特别高。存在证据表明第二原发肿瘤的风险在用放射治疗处理的ATM和CHEK2基因的乳腺癌诱导等位基因的携带者中增力口[Bernstein,etal.,(2004),BreastCancerRes,6,R199—214;Broeks,etal.,(2004),BreastCancerResTreat,83,91-3]。预期来自放射治疗(以及可能地,来自密集的乳房X线照相筛查)的第二原发肿瘤的风险将通过处理计划阶段期间从患者获得精确的遗传风险特征(geneticriskprofiles)而更好地限定。39第二预防大约30%诊断有1期或2期乳腺癌的患者将经历它们的原始肿瘤的原位_局部(loco-regional)或远缘转移复发(distantmetastaticrecurrence)。当已经实施乳房_保存手术时,已经具有原发乳腺癌的患者也处于诊断有第二原发肿瘤的极大增加的风险中,在对侧乳房或在同侧乳房中。第二预防指的是用于预防复发或第二原发肿瘤发展的方法。目前使用的方法包括长期用他莫昔芬或另一SERM治疗,单独或可替换地使用芳香酶抑制剂,风险_减少的对侧乳房的乳房切除术,以及风险_减少的卵巢切除术(在处于家族乳腺-卵巢癌风险中的患者中)。关于使用他莫昔芬的考虑已经在上面讨论。利用风险-减少的手术选择,清楚的是风险需要尽可能被量化,以便进行有见识的(informed)成本受益分析。存在一些指征,S卩,具有已知的对乳腺癌的遗传诱因的患者比大多数患者进展更差。与非携带者相比,携带CHEK2基因1100delC变异体的患者具有估计的2.8-倍增加的远缘转移的风险和3.9-倍增加的疾病复发的风险[deBock,etal.,(2004),JMedGenet,41,731-5]。患有BRCA1结-阴性肿瘤的患者具有比不携带BRCA1突变的类似患者更大的转移风险[Goffin,etal.,(2003),Cancer,97,527-36;Moller,etal.,(2002),IntJCancer,101,555-9;Eerola,etal.,(2001),IntJCancer,93,368-72]。遗传识别可以因此用于帮助评估局部复发和转移的风险,从而指导第二预防性治疗的选择。基于这里描述的变异体的遗传识别可以在这点上使用。在一些实施方式中,这样的识别(profiling)可以基于这里描述的一个或多个变异体。在其他实施方式中,这样的识别可以包括一个或几个其他已知的乳腺癌的遗传风险因素。这样的风险因素可以是充分确认的高外显率风险因素,或者它们可以为一个或多个常见的先前已经描述的较低外显率的风险因素(风险因子)(例如,染色体2ql4上的标记物(例如,标记物rs4848543或在与其连锁不平衡中的标记物),染色体2q35上的标记物(例如,标记物rs13387042,或在与其连锁不平衡中的标记物),以及染色体16上的标记物(例如,标记物rs3803662,或在与其连锁不平衡中的标记物)。通常,具有原发肿瘤诊断的患者以0.7%的恒定年度发生率处于第二原发肿瘤的风险中[PetoandMack,(2000),NatGenet,26,411-4]。具有BRCA突变的患者对于第二原发肿瘤的风险显著大于多数乳腺癌患者,其中绝对风险在40-60%的范围内[Eastern,(1999),BreastCancerRes,1,14-7]。BRCA突变的携带者具有对于第二原发肿瘤的极大增加的风险[Stacey,etal.,(2006),PLoSMed,3,e217;Metcalfe,etal.,(2004),JClinOncol,22,2328-35]。在CHEK2基因中具有突变的患者具有估计的对侧乳腺癌的5.7倍增加的风险[deBock,etal.,(2004),JMedGenet,41,731-5]。BARD1Cys557Ser变异体的携带者是2.7倍更可能诊断有第二原发肿瘤[Stacey,etal.,(2006),PLoSMed,3,e217]。遗传风险识别可以用于评估患者中第二原发肿瘤的风险并将告知预防性测量应当是怎样的侵入性的决定。本发明的方法诊断和筛查方法在一些实施方式中,本发明涉及通过检测更频繁地出现在乳腺癌受治疗者或对于乳腺癌易感的受治疗者中的遗传标记物处的特定等位基因,来诊断或辅助诊断乳腺癌或对乳腺癌的易感性的方法。在特定的实施方式中,本发明是一种通过检测至少一个多态标记物(例如,这里描述的标记物)的至少一个等位基因来确定对乳腺癌的易感性的方法。在其他实施方式中,本发明涉及一种通过检测至少一个多态标记物的至少一个等位基因来诊断对乳腺癌的易感性的方法。本发明描述了这样的方法,其中特定标记物的特定等位基因或单体型的检测指示对乳腺癌的易感性。这样的预测或预言分析也可以用来确定在与乳腺癌相关的症状发作前患者的预防性治疗。在一些实施方式中,本发明涉及诊断的临床应用方法,例如,通过医学专业人员进行的诊断。在其他实施方式中,本发明涉及通过外行进行的易感性的诊断或确定方法。所述外行可以为基因型测定服务(genotypingservice)的顾客。所述外行也可以为基因型服务提供者,其在来自个体的DNA样品上进行基因型分析,以便基于所述个体(即,所述顾客)的基因型状态,提供与特定性状或疾病的遗传风险因素相关的服务。基因型测定技术(genotypingtechnologies)中的最近的技术进展,包括SNP标记物的高通量基因型测定,如分子倒位探针阵列技术(例如,AffymetrixGeneChip)和BeadArray技术(例如,IlluminaGoldenGate和Infinium测定),使得个体以相对低成本具有他们的直到一百万SNP同时被评估的自己的基因组成为可能。所得到的基因型信息(其可以由个体获得)可以与关于与多种SNP相关的疾病或性状风险的信息相比较,包括来自公共文献和科技出版物的信息。如这里描述的疾病_相关的等位基因的诊断应用可以由此例如由个体进行,这是通过健康专业人员基于临床测试结果进行他的/她的基因型数据分析,或者由第三方进行,包括基因型服务提供者。所述第三方还可以为解释来自顾客的基因型信息以提供与特定遗传风险因素(包括这里描述的遗传标记物)相关的服务的服务提供者。换句话说,遗传风险的易感性的诊断或确定可以基于关于个体的基因型状况的信息和关于由特定遗传风险因素(如,特定SNP)提供的风险的知识,由健康专业人员、遗传顾问、提供基因型测定服务的第三方、提供风险评估服务的第三方或由外行(例如,所述个体)来进行。在本发明的上下文中,术语"诊断"、"诊断易感性"和"确定易感性"意味着涉及任何可利用的诊断方法,包括上述那些。在一些实施方式中,包含来自个体的基因组DNA的样品被收集。这样的样品可以例如为口腔拭样(buccalswab)、唾液样品、血液样品、或包含基因组DNA的其他合适的样品,如这里进一步描述的。随后利用技术人员可利用的任何常见技术,如高通量阵列技术来分析基因组DNA。来自这样的基因型测定的结果被存储在便利的数据存储单元中,如数据载体,包括计算机数据库、数据存储盘,或通过其他便利的数据存储装置被存储。在一些实施方式中,所述计算机数据库是对象数据库、关系数据库或关系后数据库(post-relationaldatabase)。所述基因型数据随后被分析一些变异体的存在,所述变异体已知为特定人类状况的易感变异体,如这里描述的遗传变异体。基因型数据可以利用任何便利的数据查询方法从所述数据存储单元检索。计算个体的由特定基因型提供的风险可以基于比较所述个体的基因型与对于所述基因型的先前确定的风险(例如,表达为相对风险(RR)或优势比(OR)),例如对于特定疾病或性状(如乳腺癌)的风险中的变异体的杂和携带者。对于所述个体计算的风险可以为与具有匹配的性别和种族的平均群体相比,个人或个人的特定基因型的相对风险。平均群体风险可以利用来自参考群体的结果被表达为不同基因型的风险的加权平均值,并且然后可以进行计算相对于所述群体的基因型组的风险的合适计算。可替换地,对于个体的风险是基于特定基因型的比较,如标记物的风险中的等位基因的杂合携带者与风险中的等位基因的非携带者的比较。在一些实施方式中,利用群体平均值可能是更方便的,因为它提供了对于使用者容易解释的测量值,即,基于他的/她的基因型,给出与群体的平均值相比个体的风险的测量值。对于消费者,估计的计算的风险可以经由网站,优选安全的网站获得。在一些实施方式中,服务提供者将在提供的服务中包括以下所有的步骤从消费者提供的样品分离基因组DNA、进行分离的DNA的基因型测定、基于所述基因型数据计算遗传风险、以及向消费者报告风险。在一些其他实施方式中,所述服务提供者将在服务中包括个体的基因型数据的解释,即,基于个体的基因型数据对于特定遗传变异体的风险评估。在一些其他实施方式中,所述服务提供者可以包括这样的服务,其包括基因型测定服务和基因型数据的解释,起始于来自所述个体(消费者)的分离的DNA的样品。对于多风险变异体的综合风险可以利用标准方法来进行。例如,假定乘法模型,即,假定个体风险变异体的风险相乘以建立综合效果,允许用于多个标记物的综合风险的直接计算。此外,在一些其他实施方式中,本发明涉及诊断或辅助诊断对乳腺癌的降低的易感性的方法,所述方法是通过检测看起来在乳腺癌患者中比在没有诊断有乳腺癌的个体中或一般群体中频率较少的特定遗传标记物等位基因或单体型。如这里描述和例证的,特定标记物等位基因或单体型(例如,染色体5pl2和10q26上的标记物,例如如表12、表13和表14中列出的标记物和单体型,例如标记物rs4415084、rsl0941679和rs1219648,以及在与其连锁不平衡中的标记物)与乳腺癌相关。在一个实施方式中,所述标记物等位基因或单体型是提供对乳腺癌的显著风险或易感性的标记物等位基因或单体型。在另一个实施方式中,本发明涉及一种诊断人类个体中对乳腺癌的易感性的方法,所述方法包括确定从所述个体获得的核酸样品中至少一个多态标记物的至少一个等位基因的存在或缺乏,其中所述至少一个多态标记物选自由表12、表13和表14中列出的多态标记物,以及在与其连锁不平衡中的标记物组成的组。在另一个实施方式中,本发明涉及诊断人类个体中对乳腺癌的易感性的方法,所述方法是通过筛查如在表12、表13或表14中列出的至少一个标记物等位基因或单体型,或在与其连锁不平衡中的标记物。在另一个实施方式中,所述标记物等位基因或单体型与其在健康受治疗者(对照,如群体对照)中其存在的频率相比,在具有或对乳腺癌易感的(受影响的)受治疗者中以更高频率存在。在一些实施方式中,所述至少一个标记物等位基因或单体型的关联的显著性的特征在于P值<0.05。在其他实施方式中,关联的显著性的特征在于较小的p值,如〈0.01、<0.001、<0.0001、<0.00001、<0.000001、<0.0000001、<0.00000001或<0.000000001。在这些实施方式中,至少一个标记物等位基因或单体型的存在指示对乳腺癌的易感性。这些诊断方法涉及检测与乳腺癌相关的至少一个标记物等位基因或单体型的存在或缺乏。这里描述的单体型包括在各种遗传标记物(如,SNP,微随体,或其他遗传变异体)处等位基因的组合。构成特定单体型的特定遗传标记物等位基因的检测可以通过多种这里描述的和/或本领域已知的方法进行。例如,遗传标记物可以在核酸水平上(例如,通过直接核苷酸测序或通过本领域技术人员已知的其他方式)被检测,或者如果遗传标记物影响由乳腺癌-相关的核酸编码的蛋白质的编码序列(例如,通过蛋白质测序或通过利用识别这样的蛋白质的抗体的免疫测定),可以在氨基酸水平上被检测。本发明的标记物等位基因或单体型对应于与乳腺癌相关的基因组DNA序列的片段。这样的片段包括所讨论的多肽标记物或单体型的DNA序列,但是也可以包括在与所述标记物或单体型强LD(连锁不平衡)中的DNA区段。在一个实施方式中,这样的区段包括在与所述标记物或单体型LD中的区段(如通过大于0.1的r2值和/或ID'I>0.8确定的)。在一个实施方式中,对乳腺癌易感性的诊断可以利用杂交方法实现(参见CurrentProtocolsinMolecularBiology,Ausubel,F.etal.,eds.,JohnWiley&Sons,包括所有的补充物)。基因组DNA、RNA或cDNA的来自测试受治疗者或个体的的生物样品("测试样品")从怀疑患有乳腺癌、具有对乳腺癌的易感性、或易患乳腺癌的受治疗者("测试受治疗者")获得。所述受治疗者可以为成年人、儿童或胎儿。所述测试样品可以来自包含基因组DNA的任何来源,如血液样品、羊水样品、脑脊液样品、或来自皮肤、肌肉、口腔或结膜粘膜、胎盘、胃肠道或其他器官的组织样品。来自胎儿细胞或组织的DNA的测试样品可以通过合适的方法获得,如通过羊膜穿剌或绒毛膜绒毛取样。DNA、RNA、或cDNA样品随后被检查。特定标记物等位基因的存在可以通过对特定等位基因特异性的核酸探针的序列-特异性杂交来显示。更多特定标记物等位基因或特定单体型的存在可以通过利用几个序列-特异性核酸探针来显示,每个对于特定等位基因是特异性的。在一个实施方式中,单体型可以通过对于所述特定单体型特异性的单一核酸探针来显示(即,特异性杂交到包含以所述单体型为特征的特定标记物等位基因的DNA链)。序列-特异性探针可以直接杂交到基因组DNA、RNA、或cDNA。如这里所用的,"核酸探针"可以为杂交到互补序列的DNA探针或RNA探针。本领域技术人员将知道如何设计这样的探针以便序列特异性杂交仅在如果特定等位基因存在于来自测试样品的基因组序列中时将发生。本发明也可以被简化为利用任何便利的基因型测定方法实施,包括用于测定特定多态标记物的基因型的商业上可获得的技术和方法。为了诊断对乳腺癌的易感性,杂交样品可以通过使包含乳腺癌-相关的核酸的测试样品如基因组DNA样品与至少一个核酸探针接触来形成。用于检测mRNA或基因组DNA的探针的非限制性实例是能够杂交到这里描述的mRNA或基因组DNA序列的标记的核酸探针。所述核酸探针可以为,例如,全长核酸分子,或其一部分,如长度为至少15、30、50、100、250或500个核苷酸的寡核苷酸,其足以在严格的条件下特异性地杂交于合适的mRNA或基因组DNA。例如,所述核酸探针可以包括包含表12、表13和表14中列出的标记物(SEQIDNO:1-237)的核苷酸序列的全部或部分,或包含FGF10、MRPS30、HCN1或FGFR2基因的核苷酸序列或其片段,如这里描述的,可选地包含这里描述的标记物的至少一个等位基因,或者这里描述的至少一个单体型,或者所述探针可以为这样的序列的互补序列。在特定的实施方式中,所述核酸探针为这样的核苷酸序列的一部分,其为包含表12、表13和表14中的任何一个中列出的标记物(SEQIDNO:1-237)的核苷酸序列,或者包含FGF10、MRPS30、HCN1和FGFR2基因的核苷酸序列或其片段,如这里描述的,可选地包含这里描述的标记物的至少一个等位基因,或者一个多态标记物的至少一个等位基因或包含这里描述的至少一个多态标记物的单体型,或者所述探针可以为这样的序列的互补序列。用在本发明的诊断分析(diagnosticassays)中的其他合适的探针在这里描述。杂交可以通过本领域技术人员熟知的方法进行(参见,例如,CurrentProtocolsinMolecularBiology,Ausubel,F.etal.,eds.,JohnWiley&Sons,包括所有的补充物)。在一个实施方式中,杂交指的是特异性杂交,即,没有错配的杂交(精确的杂交)。在一个实施方式中,用于特异性杂交的杂交条件是高度严格的。特异性杂交,如果存在,利用标准方法来检测。如果特异性杂交存在于核酸探针与测试样品中的核酸之间,则所述样品包含互补于存在于所述核酸探针中的核苷酸的等位基因。所述方法(过程)可以重复用于本发明的任何标记物,或者构成本发明的单体型的标记物,或者多重探针可以同时用于每次检测多于一个的标记物等位基因。还可以设计包含特定单体型的多于一个标记物等位基因的单一探针(例如,包含互补于构成特定单体型的标记物的2、3、4、5或全部的等位基因的探针)。样品中单体型的特定标记物的检测表明所述样品的来源具有特定单体型(如,单体型)并因此对于乳腺癌是易感的。在一个优选的实施方式中,利用包含在其3'末端的荧光部分或基团和在其5'末端的猝灭剂(quencher)的检测寡核苷酸探针和增强子寡核苷酸的方法被采用,如Kutyavinetal.(NucleicAcidRes.34:el28(2006))描述的。所述荧光部分可以为GigHarborGreen或YakimaYellow,或者其他合适的荧光部分。所述检测探针被设计成杂交到包含要被检测的SNP多态性的短核苷酸序列。优选地,所述SNP在从末端残基到距离所述检测探针的3'端-6个残基的任何地方。所述增强子为杂交到3'相对于检测探针的DNA模板的短寡核苷酸探针。所述探针被设计成使得单一核苷酸间隙存在于检测探针与增强子核苷酸探针之间(在两者均连接到模板时)。所述间隙形成被核酸内切酶,如核酸内切酶IV识别的合成无碱基(abasic)位点。所述酶从完全互补的检测探针剪切下染料,但是不剪切包含错配的检测探针。因此,通过测量释放的荧光部分的荧光,可以进行由检测探针的核苷酸序列限定的特定等位基因的存在的评估。所述检测探针可以为任何合适的大小,虽然优选所述探针较短。在一个实施方式中,所述探针的长度为5-100个核苷酸。在另一个实施方式中,所述探针的长度为10-50个核苷酸,并且在另一个实施方式中,所述探针的长度为12-30个核苷酸。所述探针的其他长度是可能的并在本领域普通技术人员的范围内。在一个优选的实施方式中,包含SNP多态性的DNA模板在检测前通过聚合酶链反应(PCR)来扩增。在这样的实施方式中,扩增的DNA用作用于检测探针和增强子探针的模板。检测探针、增强子探针、和/或用于通过PCR扩增模板的引物的一些实施方式包括修饰的碱基的应用,包括修饰的A和修饰的G。修饰的碱基的应用可以用于调节核苷酸分子(探针和/或引物)与模板DNA的解链温度,例如用于提高包含低百分比的G或C碱基的区域中的解链温度,其中可以使用能够与其互补的T形成三个氢键的修饰的A,或者用于降低包含高百分比的G或C碱基的区中的解链温度,例如通过利用在双链DNA分子中与其互补的C碱基形成两个氢键的修饰的G碱基。在优选的实施方式中,修饰的碱基用在检测核苷酸探针的设计中。本领域技术人员已知的任何修饰的碱基可以在这些方法中被选择,并且基于这里的教导和如技术人员已知的从商业来源可获得的已知碱基,合适的碱基的选择完全在技术人员的范围内。此外,或可替换地,除了这里描述的杂交方法中的核酸探针之外或代替所述核酸探针,还可以使用肽核酸(PNA)探针。PNA是具有肽样的无机骨架,如N-(2-氨基乙基)甘氨酸单位的DNA模拟物,具有经由亚甲基羰基链接附着于所述甘氨酸氮的有机碱基(A、G、C、T或U)(参见,例如,Nielsen,P.,etal.,Bioconjug.Chem.5:3-7(1994))。PNA探针可以被设计成特异性杂交于怀疑包含与乳腺癌相关的一个或多个标记物等位基因或单体型的样品的分子。PNA探针的杂交由此可以诊断乳腺癌或对乳腺癌的易感性。在本发明的一个实施方式中,包含从所述受治疗者获得的基因组DNA的测试样品被收集,并且聚合酶链反应(PCR)被用于扩增包含本发明的一个或多个标记物或单体型的片段。如这里描述的,与乳腺癌相关的特定标记物等位基因或单体型的鉴定可以利用各种方法(例如,序列分析,通过限制性消化进行的分析,特异性杂交,单链构象多态性分析(测定)(SSCP)、电泳分析等)来实现。在另一个实施方式中,诊断通过表达分析来实现,例如通过利用定量PCR(动力热循环)。该技术可以,例如,利用商业上可获得的技术,如TaqMan(A卯liedBiosystems,FosterCity,CA)。所述技术可以评估由与乳腺癌相关的核酸编码的多肽或剪接变异体的表达或组成的改变的存在。此外,所述变异体的表达可以被量化为物理上或功能上的差异。在本发明的另一方法中,如果等位基因导致限制性位点相对于参考序列的形成或消除,则通过限制性消化进行的分析可以用来检测特定等位基因。限制性片段长度多态性(RFLP)分析可以例如如在CurrentProtocolsinMolecularBiology上文中描述的来进行。相关DNA片段的消化模式表明样品中特定等位基因的存在或缺乏。序列分析还可以用于检测与乳腺癌相关的特异性等位基因或单体型(例如,表12、表13和表14中的多态标记物(SEQIDNO:1-237)和在与其连锁不平衡中的标记物)。因此,在一个实施方式中,特定标记物等位基因或单体型的存在或缺乏的确定包括从受治疗者或个体获得的DNA或RNA的测试样品的序列分析。PCR或其他合适的方法可以用于扩增与乳腺癌相关的核酸的一部分,并且特异性等位基因的存在随后可以通过对样品中基因组DNA的多态位点(或者单体型中的多个多态位点)进行测序而直接加以检测。等位基因-特异性寡核苷酸也可以用于检测与乳腺癌相关的核酸中特定等位基因的存在(例如,表12、表13和表14中的多态标记物,和在与其连锁不平衡中的标记物),这是通过使用具有等位基因-特异性寡核苷酸(AS0)探针的扩增的寡核苷酸的斑点印迹杂交(斑点杂交)(参见,例如,Saiki,R.etal.,Nature,324:163-166(1986))。"等位基因_特异性寡核苷酸"(这里也称为"等位基因_特异性寡核苷酸探针")是大约1050个碱基对或大约1530碱基对的寡核苷酸,其特异性杂交于与乳腺癌相关的核酸,并且其包含在多态位点处(例如,这里描述的标记物或单体型)的特异性等位基因。对于与乳腺癌相关的一个或多个特定核酸特异性的等位基因-特异性寡核苷酸探针可以利用标准方法来制备(参见,例如,CurrentProtocolsinMolecularBiology,上文)。PCR可以用来扩增期望的区。包含扩增的区的DNA可以利用标准方法进行斑点印迹(参见,例如,CurrentProtocolsinMolecularBiology,上文),并且所述印迹可以与寡核苷酸探针接触。所述探针与所述扩增的区的特异性杂交的存在可以随后被检测。等位基因-特异性寡核苷酸探针与来自受治疗者的DNA的特异性杂交是与癌症,包括乳腺癌相关的多态位点处的特异性等位基因的指征(参见,例如,Gibbs,R.etal.,NucleicAcidsRes.,17:2437-2448(1989)和W093/22456)。在加入这样的类似物如闭锁的核酸(LNA)的情况下,引物和探针的大小可以被减小到8个碱基。LNA是新类别的双环DNA类似物,其中呋喃糖环中的2'和4'位置经由0-亚甲基(氧-LNA)、S-亚乙基(硫代-LNA)、或氨基亚甲基(氨基-LNA)部分被连接。对于这些LNA变异体的全部共同的是朝向互补的核酸的亲和力,其迄今为止对于DNA类似物是最高报道的。例如,特定的全部氧-LNA九聚物已经显示当在与互补的DNA或RNA的复合体中时分别具有64t:和74°C的解链温度(Tm),与对于相应的DNA九聚物的DNA和RNA的28°C相对。Tm的显著增加也当LNA单体与标准DNA或RNA单体组合使用时获得。对于引物和探针,依赖于LNA单体被包括的地方(例如,3'端,5'端,或中间),Tm可以被显著地提高。在另一个实施方式中,互补于来自受治疗者的靶核酸序列区段的寡核苷酸探针的阵列可以用于鉴定与乳腺癌相关的核酸(例如,表12、表13和表14中的多态标记物(SEQIDNO:1-237),以及在与其连锁不平衡中的标记物)中的多态性。例如,可以使用寡核苷酸阵列。寡核苷酸阵列典型地包括多个不同的寡核苷酸探针,其在不同的已知位置偶联至底物的表面。这些寡核苷酸阵列,还描述为"GenechipsTM"在本领域中通常已经被描述(参见,例如,美国专利第5,143,854号、PT专利公开第WO90/15070和92/10092号)。这些阵列通常可以利用机械合成方法或光直接合成方法,其并入光刻方法和固相寡核苷酸合成方法的组合,或者通过本领域技术人员已知的其他方法来生产(参见,例如,Bier,F.F.,etal.AdvBiochemEngBiotechnol109:433-53(2008);Hoheisel,J.D.,NatRevGenet7:200-10(2006);Fan,J.B.,etal.MethodsEnzymol410:57-73(2006);Raqoussis,J.&Elvidge,G.,ExpertRevMolDiagn6:145-52(2006);Mockler,T.C.,etalGenomics85:1_15(2005),以及其中列举的参考文献,其每个的全部教导以引用方式并入本文中)。用于多态性检测的寡核苷酸阵列的制备和应用的许多另外的描述可以例如在US6,858,394、US6,429,027、US5,445,934、US5,700,637、US5,744,305、US5,945,334、US6,054,270、US6,300,063、US6,733,977、US7,364,858、EP619321、和EP373203中找到,其全部教导以引用方式并入本文中。本领域技术人员可获得的核酸分析的其他方法可以被用来检测与乳腺癌相关的多态位点处的特定等位基因。代表性的方法包括,例如,直接手工测序(ChurchandGilbert,Proc.Natl.Acad.Sci.USA,81:1991-1995(1988);Sanger,F.,etal.,Proc.Natl.Acad.Sci.USA,74:5463-5467(1977);Beavis,etal.,U.S.PatentNo.5,288,644);自动化的荧光测序;单链构象多态性分析(SSCP);钳制变性凝胶电泳(clampeddenaturinggelelectrophoresis)(CDGE);变性梯度凝胶电泳(DGGE)(Sheffield,V.,etal.,Proc.Natl.Acad.Sci.USA,86:232-236(1989)),迁移率变动分析(Orita,M.,etal.,Proc.Natl.Acad.Sci.USA,86:2766-2770(1989)),限制性内切酶分析(Flavell,R.,etal.,Cell,15:25-41(1978);Geever,R.,etal.,Proc.Natl.Acad.Sci.USA,78:5081—5085(1981));异源双链体分析;化学错配剪切(CMC)(Cotton,R.,etal.,Proc.Natl.Acad.Sci.USA,85:4397-4401(1985));核糖核酸酶保护分析(Myers,R.,etal.,Science,230:1242-1246(1985);识别核苷酸错配的多肽如E.colimutS蛋白的应用;以及等位基因特异性PCR。在本发明的另一个实施方式中,在其中本发明的遗传标记物或单体型导致多肽的组成或表达改变的那些情况中,乳腺癌或对乳腺癌的易感性的诊断可以通过检验由与乳腺癌相关的核酸编码的多肽的表达和/或组成来进行。因此,在其中本发明的遗传标记物或单体型导致多肽的组成或表达改变的那些情况中(例如FGF10、MRPS30、HCN1和FGFR2基因中的一个或多个),对乳腺癌的易感性的诊断可以通过检验这些多肽之一或由与乳腺癌相关的核酸编码的另一多肽的表达和/或组成来进行。显示与乳腺癌的关联的本发明的单体型和标记物可以通过它们对这些附近的基因中的一个或多个的影响起作用。影响这些基因的可能的机制包括,例如,对转录的影响、对RNA剪接的影响、改变mRNA的可替换的剪接形式的相对量、对RNA稳定性的影响、对从细胞核到细胞质的转运的影响、以及对翻译的效率和准确度的影响。因此,在另一个实施方式中,显示与乳腺癌的关联的本发明的变异体(标记物或单体型)影响附近基因的表达。熟知的是影响基因表达的调节元件可以位于距离基因的启动子区的第十或甚至成百的kb(千对碱基)的位置。通过分析本发明的至少一个多态标记物的至少一个等位基因的存在或缺乏,由此可以评估这样的附近基因的表达水平。由此预期本发明的标记物或单体型的检测可以用于评估FGF10、MRPS30、HCN1和FGFR2基因中的一个或多个的表达。各种方法可以用于检测蛋白表达水平,包括酶联免疫吸附分析(ELISA)、蛋白质印迹、免疫沉淀反应和免疫荧光法。来自受治疗者的测试样品被评估由与乳腺癌相关的核酸编码的多肽的表达改变和/或组成改变的存在。由与乳腺癌相关的核酸编码的多肽的表达改变可以为,例如,定量的多肽表达(即,产生的多肽的量)中的改变。由与乳腺癌相关的核酸编码的多肽的组成改变是定性的多肽表达(例如,突变体多肽的表达或不同剪接变异体的表达)中的改变。在一个实施方式中,对乳腺癌的易感性的诊断通过检测由与乳腺癌相关的核酸编码的特定剪接变异体或剪接变异体的特定模式(例如,编码FGFIO、MRPS30、和HCN1基因的核酸)来进行。两种这样的改变(定量和定性)也均可以存在。如这里所使用的,多肽表达或组成中的"改变"指的是与对照样品中多肽的表达或组成相比,测试样品中表达或组成的改变。对照样品是对应于测试样品(即,来自相同类型的细胞)的样品,并且来自不受乳腺癌影响和/或没有对乳腺癌的易感性的受治疗者。在一个实施方式中,对照样品来自不具有如这里描述的标记物等位基因或单体型的受治疗者。类似地,与对照样品相比,测试样品中一个或多个不同的剪接变异体的存在,或测试样品中显著不同量的不同剪接变异体的存在可以指示对乳腺癌的易感性。在其中等位基因相对于对照样品中的参考改变剪接位点的情况下,与对照样品相比,测试样品中多肽表达或组成的改变可以是特异性等位基因的指征。检验由核酸编码的多肽的表达或组成的各种方式对本领域技术人员来说是已知的并可以被使用,包括分光镜检查、比色法、电泳、等电点聚焦、和免疫测定(例如,Davidetal.,U.S.Pat.No.4,376,110)如免疫印迹(参见,例如,CurrentProtocolsinMolecularBiology,particularlych即ter10,上文)。例如,在一个实施方式中,可以使用能够结合到由与乳腺癌相关的核酸编码的多肽的抗体(例如,具有可检测标记的抗体)。抗体可以为多克隆或单克隆的。可以使用完整抗体,或其片段(例如,Fv、Fab、Fab'、F(ab')2)。关于所述探针或抗体,术语"标记的"旨在包括通过将可检测的物质偶联(即,物理地连接)至所述探针或抗体来直接标记所述探针或抗体,以及通过与被直接标记的另一试剂反应来间接标记所述探针或抗体。间接标记的实例包括利用标记的二级抗体(例如,荧光标记的二级抗体)和用生物素末端-标记DNA探针使得其可以用荧光标记的抗生蛋白链菌素检测而检测初级抗体。在该方法的一个实施方式中,将测试样品中由与乳腺癌相关的核酸编码的多肽(例如,FGF10、MRPS30、和HCN1)的水平或量与对照样品中的多肽的水平或量进行比较。高于或低于对照样品中多肽的水平或量,使得差异在统计学上显著的测试样品中的多肽的水平或量是由所述核酸编码的多肽的表达改变的指征,并且诊断负责造成表达差异的特定等位基因或单体型。可替换地,将测试样品中多肽的组成与对照样品中多肽的组成进行比较。在另一个实施方式中,测试样品和对照样品中多肽的水平或量和组成可以被评估。在另一个实施方式中,对乳腺癌的易感性的诊断通过检测本发明的至少一个标记物或单体型(例如,表12、表13和表14中列出的标记物的相关等位基因(SEQIDNO:1-237),以及在与其连锁不平衡中的标记物)连同另外的基于蛋白质的、基于RNA的或基于DNA的分析来进行。本发明的方法还可以结合受治疗者的家族史和风险因素(例如,环境风险因素、生活方式风险因素)的分析来使用。试剂盒可用于本发明的方法中的试剂盒包括这里描述的方法的任何一个中使用的组分(components),包括例如,用于核酸扩增的引物、杂交探针、限制性酶(例如,用于RFLP分析)、等位基因_特异性寡核苷酸、结合到由如这里描述的本发明的核酸编码的改变的多肽(例如,包含本发明的至少一个多态标记物和/或单体型的基因区段)或结合到由如这里描述的本发明的核酸编码的非改变的(天然)多肽的抗体,用于扩增与乳腺癌相关的核酸的装置、用于分析与乳腺癌相关的核酸的核酸序列的装置、用于分析由与乳腺癌相关的核酸编码的多肽的氨基酸序列的装置等。所述试剂盒可以例如包括必需的缓冲剂、用于扩增本发明的核酸的核酸引物(例如,如这里描述的一个或多个多态标记物)、以及用于利用这样的引物和必需的酶(例如,DNA聚合酶)扩增的片段的等位基因-特异性检测的试剂。此外,试剂盒可以提供用于与本发明的方法结合使用的分析的试剂,例如,用于乳腺癌诊断分析的试剂。在一个实施方式中,本发明是用于分析来自受治疗者的样品以检测受治疗者中乳腺癌或对乳腺癌的易感性的存在的试剂盒,其中所述试剂盒包括选择性检测个体的基因组中本发明的至少一个多态性的至少一个等位基因所必需的试剂。在特定的实施方式中,所述试剂包括至少一个连续寡核苷酸,所述寡核苷酸杂交到包含本发明的至少一个多态性的所述个体的基因组的片段。在另一个实施方式中,所述试剂包括至少一对寡核苷酸,其杂交到从受治疗者获得的基因组区段的相反链,其中每个寡核苷酸引物对被设计成选择性扩增包括至少一个多态性的个体的基因组的片段,其中所述多态性选自由如表12、表13和表14中(SEQIDNO:1-237)列出的多态性,以及在与其连锁不平衡中的多态标记物组成的组。在又一个实施方式中,所述片段的大小为至少20个碱基对。这样的寡核苷酸或核酸(例如,寡核苷酸引物)可以利用作为乳腺癌的指征的多态性(例如,SNP或微随体)侧翼的核酸序列的部分来设计。在另一个实施方式中,所述试剂盒包括能够等位基因-特异性检测与乳腺癌相关的一个或多个特异性多态标记物或单体型的一个或多个标记的核酸,以及用于检测所述标记(label)的试剂。合适的标记包括,例如,放射性同位素、荧光标记、酶标记、酶辅因子标记、磁性标记、自旋标记、表位标记。在特定的实施方式中,待通过所述试剂盒的试剂检测的多态标记物或单体型包括选自由表12、表13和表14中的标记物组成的组中的一个以上标记物、两个以上标记48物、三个以上标记物、四个以上标记物、或五个以上标记物。在另一个实施方式中,待检测的所述标记物选自标记物rs10941679、rs7703618、rs4415084、rs2067980、rsl0035564、rsl1743392、rs7716600和rsl219648。在另一个实施方式中,待被检测的所述标记物或单体型包括来自在与表12、表13和表14中列出的标记物组成的标记物的组中的至少一个强连锁不平衡(如通过大于0.2的r2值限定的)中的标记物的组中的至少一个标记物。在又一个实施方式中,待被检测的标记物或单体型包括至少一个选自由标记物rs10941679、rs7703618、rs4415084、rs2067980、rsl0035564、rsl1743392、rs7716600和rsl219648,以及在与其连锁不平衡中的标记物组成的标记物的组中的至少一个标记物。在一个优选的实施方式中,用于检测本发明的标记物的试剂盒包括检测寡核苷酸探针(其杂交到包含待检测的SNP多态性的模板DNA的区段)、增强子寡核苷酸探针和核酸内切酶。所述检测寡核苷酸探针包括在其3'末端的荧光部分或基团和在其5'末端的猝灭剂,并且采用增强子寡核苷酸,如Kutyavinetal.(NucleicAcidRes.34:el28(2006))所描述的。所述荧光部分可以为GigHarborGreen或YakimaYellow,或其他合适的荧光部分。检测探针被设计成杂交到包括待被检测的SNP多态性的短核苷酸序列。优选地,所述SNP在从来自检测探针的3'端的末端残基到-6残基的任何地方。增强子为杂交到3'相对于所述检测探针的DNA模板的短寡核苷酸探针。所述探针被设计成使得在两者均结合到模板时在检测探针与增强子核苷酸探针之间存在单一的核苷酸间隙。所述间隙造成被核酸内切酶,如核酸内切酶IV识别的合成无碱基位点。所述酶从完全互补的检测探针切下染料,但是不能切下包含错配的检测探针。因此,通过测量释放的荧光部分的荧光,由检测探针的核苷酸序列限定的特定等位基因的存在的评估可以被进行。所述检测探针可以为任何合适的大小,虽然优选地,所述探针较短。在一个实施方式中,所述探针的长度为5-100个核苷酸。在另一个实施方式中,所述探针的长度为10-50个核苷酸,并且在另一个实施方式中,所述探针的长度为12-30个核苷酸。所述探针的其他长度是可能的并在本领域普通技术人员的技术范围内。在优选的实施方式中,包含SNP多态性的DNA模板在检测前通过聚合酶链反应(PCR)来扩增,并且用于这样的扩增的引物被包括在试剂盒(reagentkit)中。在这样的实施方式中,扩增的DNA用作用于检测探针和增强子探针的模板。用于通过PCR进行的模板扩增的检测探针、增强子探针、和/或引物的一些实施方式包括使用修饰的碱基,包括修饰的A和修饰的G。修饰的碱基的应用可以用于调节所述核苷酸分子(探针和/或引物)与模板DNA的解链温度,例如,用于在包含低百分比的G或C碱基的区域增加解链温度,其中可以使用具有与其互补的T形成三个氢键的能力的修饰的A,或者用于降低包含高百分比的G或C碱基的区域中的解链温度,例如通过利用与它们的互补的C碱基在双链DNA分子中仅形成两个氢键的修饰的G碱基。在优选的实施方式中,修饰的碱基在检测核苷酸探针的设计中被使用。在这些方法中可以选择技术人员已知的任何修饰的碱基,并且基于这里的教导和如技术人员已知的可从商业来源获得的已知碱基,合适的碱基的选择完全在技术人员的范围内。在这样的实施方式之一中,标记物或单体型的存在指示对乳腺癌的易感性(增加的易感性或降低的易感性)。在另一个实施方式中,所述标记物或单体型的存在是对乳腺癌治疗药剂的反应的指征。在另一个实施方式中,所述标记物或单体型的存在是乳腺癌预后49的指征。在又一个实施方式中,所述标记物或单体型的存在指示乳腺癌治疗的进展。这样的治疗可以包括通过手术、药物或通过其他方式(如生活方式改变)进行的干涉。治疗药剂本发明的变异体(例如,本发明的标记物和/或单体型,如表12、表13和表14中列出的标记物,如,rs4415084、rsl0941679、rs1219648)可以用来鉴定用于乳腺癌的新型治疗靶标。例如,包含与乳腺癌相关的变异体(标记物和/或单体型)的基因,或在与乳腺癌相关的变异体(标记物和/或单体型)连锁不平衡中的基因(例如,FGFIO、MRPS30、HCN1和FGFR2基因中的一个或多个),或它们的产物,以及直接或间接由这些变异体基因或它们的产物调节或直接或间接与这些变异体基因或它们的产物相互作用的基因或它们的产物,可以靶向用于治疗药剂的开发以治疗乳腺癌,或防止或延迟与乳腺癌相关的症状的发作。治疗药剂例如可以包括小非蛋白和非核酸分子、蛋白质、肽、蛋白片段、核酸(DNA、RNA)、PNA(肽核酸)、或它们的衍生物或模拟物(其可以调节所述耙基因或它们的基因产物的功能和/或水平)中的一个或多个。本发明的核酸和/或变异体,包含本发明的一个或多个变异体的核酸(例如,具有如SEQIDNO:1-237中的任何一个中列出的序列的核酸,或其片段)或包含它们的互补序列的核酸可以用作反义构建体(constructs)以控制细胞、组织或器官中的基因表达。与反义技术相关的方法对技术人员是熟知的,并且在AntisenseDrugTechnology:Principles,Strategies,andApplications,Crooke,ed.,MarcelDekkerInc.,NewYork(2001)中描述和综述。通常,反义核酸分子被设计成互补于由基因表达的mRNA的区,使得反义分子杂交到mRNA,由此阻断mRNA翻译为蛋白质。反义寡核苷酸的几个类别对于本领域技术人员来说是已知的,包括剪切物和阻断物。前者结合到靶RNA位点,活化细胞内核酸酶(例如,核糖核酸酶H或核糖核酸酶L),其剪切靶RNA。阻断物结合到靶RNA,通过核糖体的位阻抑制蛋白质翻译。阻断物的实例包括核酸、吗啉化合物、闭锁的核酸和膦酸甲酯(Thompson,DrugDiscoveryToday,7:912-917(2002))。反义寡核苷酸直接用作治疗药剂,并且还用于确定和确认基因功能,例如通过基因敲除或基因拆除(knock-down)实验。反义技术被进一步描述在Laveryetal.,Curr.Opin.DrugDiscov.Devel.6:561-569(2003),St印hensetal,Curr.Opin.Mo1.Ther5:118-122(2003),Kurreck,Eur.J.Biochem.270:1628-44(2003),Diasetal.,Mol.CancerTer.1:347-55(2002),Chen,MethodsMol.Med.75:621-636(2003),Wangetal.,Curr.CancerDrugTargets1:177-96(2001),和Be騰tt,AntisenseNucleicAcidDrug.Dev.12:215-24(2002)中。这里描述的变异体可以用于选择和设计对于特定变异体特异性的反义试剂。利用这里描述的关于变异体的信息,可以设计特异性靶向包含本发明的一个或多个变异体的mRNA分子的反义寡核苷酸或其他反义分子。以这样的方式,包含本发明的一个或多个变异体(标记物和/或单体型)的mRNA分子的表达可以被抑制或阻断。在一个实施方式中,所述反义分子被设计成特异性结合所述靶核酸的特定等位基因形式(即,一个或几个变异体(等位基因和/或单体型)),从而抑制起源于该特异性等位基因或单体型的产物的翻译,但是其不结合在靶核酸分子的特定多态位点处的其他或可替换的变异体。因为反义分子可以用于使mRNA失活以便抑制基因表达,由此抑制蛋白质表达,因此所述分子可以用于治疗疾病或障碍,如乳腺癌。所述方法可以涉及通过包含互补于所述mRNA中的一个或多个区的核苷酸序列的核糖核酸酶进行的剪切,其消弱待翻译的mRNA的能力。这样的mRNA区包括,例如,蛋白质编码区,尤其是对应于催化活性的蛋白质编码区,底物和/或配体结合位点,或蛋白质的其他功能结构域。RNA干涉(RNAi)现象在最近十年已经被活跃地研究,因为它最初在C.elegans中发现(Fireetal.,Nature391:806-11(1998)),并且近年来,它在人类疾病治疗中的潜在应用被活跃地追踪(在Kim&Rossi,NatureRev.Genet.8:173-204(2007)中综述)。RNA干涉(RNAi),又称为基因沉默,是基于利用双链RNA分子(dsRNA)以关闭特异性基因。在细胞中,细胞质双链RNA分子(dsRNA)被细胞复合体加工为小干涉RNA(siRNA)。siRNA指导蛋白质-RNA复合体耙向耙mRNA上的特定位点,导致mRNA的剪切(Thompson,DrugDiscoveryToday,7:912-917(2002))。siRNA分子的长度通常为约20、21、22或23个核苷酸。因此,本发明的一个方面涉及分离的核酸分子,以及那些分子在RNA干涉中的应用,S卩,作为小干涉RNA分子(siRNA)。在一个实施方式中,所述分离的核酸分子的长度为18-26个核苷酸,优选长度为19-25个核苷酸,更优选长度为20-24个核苷酸,并且更优选长度为21、22或23个核苷酸。用于RNAi-介导的基因沉默的另一途径起源于内源性编码的初始微RNA(pri-miRNA)转录物,其在细胞中被加工以产生前体miRNA(前-miRNA)。这些miRNA分子从细胞核被输出到细胞质,在那里它们经历加工以产生成熟的miRNA分子(miRNA),其通过识别mRNA的3'非翻译区中的靶位点引导翻译抑制,以及通过加工P-体引导随后的mRNA降解(在Kim&Rossi,NatureRev.Genet.8:173-204(2007)中综述)。RNAi的临床应用包括合成siRNA双链体的并入,其优选大小为约20_23个核苷酸,并优选具有2个核苷酸的3'重叠。基因表达的拆除通过用于靶mRNA的序列-特异性设计建立。用于这样的分子的最佳设计和合成的几个商业位点对于本领域技术人员来说是已知的。其他应用提供了较长的siRNA分子(典型地长度为25_30个核苷酸,优选约27个核苷酸),以及小发卡RNA(shRNA,典型地长度为约29个核苷酸)。后者被自然地表达,如在Amarzguiouietal.(FEBSLett.579:5974-81(2005))中描述的。化学合成的siRNA和shRNA是用于体内加工的底物,并且在一些情况下提供比较短设计更强大的基因_沉默(Kimetal.,NatureBiotechnol.23:222-226(2005);Siolasetal.,NatureBiotechnol.23:227-231(2005))。通常,siRNA提供基因表达的瞬时沉默,因为它们的细胞内浓度通过随后的细胞分裂被稀释。相反,表达的shRNA介导长期稳定的靶转录物的拆除,只要shRNA的转录发生(Marquesetal.,NatureBiotechnol.23:559-565(2006);Br翻elkampetal.,Science296:550-553(2002))。由于RNAi分子,包括siRNA、miRNA和shRNA,以序列-依赖性方式起作用,因此本发明的变异体(例如,表12、表13和表14中列出的标记物和单体型)可以用于设计这样的RNAi试剂,所述RNAi试剂识别包含特异性等位基因和/或单体型(例如,本发明的等位基因和/或单体型)的特异性核酸分子,同时不识别包含其他等位基因或单体型的核酸分子。这些RNAi试剂可以由此识别并破坏靶核酸分子。如同反义试剂一样,RNAi试剂可以用作治疗药剂(即,用于关闭疾病-相关的基因或疾病-相关的基因变异体),但是也可以用于表征和确认基因功能(例如,通过基因敲除或基因拆除实验)。RNAi的递送可以通过本领域技术人员已知的一系列方法来进行。利用非_病毒递送的方法包括胆固醇、稳定的核酸-脂质颗粒(SNALP)、重-链抗体片断(Fab)、适配子(即tamers)和纳米颗粒。病毒递送方法包括使用慢病毒(lentivirus)、腺病毒和腺相关病毒。siRNA分子在一些实施方式中被化学修饰以提高它们的稳定性。这可以包括在核糖的2'位的修饰,包括2'-0-甲基嘌呤和2'-氟代嘧啶,其提供了对核糖核酸酶活性的抗性。其他化学修饰是可能的并且对于本领域技术人员来说是已知的。下面的参考文献提供了RNAi的进一步总结,以及利用RNAi靶向特异性基因的可會g性Kim&Rossi,Nat.Rev.Genet.8:173-184(2007),Chen&Rajewsky,Nat.Rev.Genet.8:93-103(2007),Reynolds,etal.,Nat.Biotechnol.22:326-330(2004),Chietal.,Proc.Natl.Acad.Sci.USA100:6343-6346(2003),Vickersetal.,J.Biol.Chem.278:7108-7118(2003),Agarni,Curr.Opin.Chem.Biol.6:829-834(2002),Lavery,etal.,Curr.Opin.DrugDiscov.Devel.6:561-569(2003),Shi,TrendsGenet.19:9-12(2003),Shueyetal.,DrugDiscov.Today7:1040-46(2002),McMa皿setal.,Nat.Rev.Genet.3:737-747(2002),Xiaetal.,Nat.Biotechnol.20:1006-10(2002),Plasterketal.,curr.Opin.Genet.Dev.10:562-7(2000),Bosheretal.,Nat.CellBiol.2:E31-6(2000),以及Hunter,Curr.Biol.9:R440_442(1999)。导致增加的对于乳腺癌发展的诱因或风险的遗传缺陷,或造成乳腺癌的缺陷,可以通过给予携带缺陷的受治疗者并入在遗传缺陷的位点供应正常/野生型核苷酸的修复序列的核酸片段而永久校正。这样的位点-特异性修复序列可以包括(concompass)RNA/DNA寡核苷酸,其运行以促进受治疗者的基因组DNA的内源性修复。修复序列的给予可以通过合适的载体进行,如与聚乙烯亚胺(polyethelenimine)的复合体,包在阴离子脂质体中,病毒载体如腺病毒载体,或其他适于促进给予的核酸的细胞内摄取的药物组合物。所述遗传缺陷随后可以被克服,因为嵌合的寡核苷酸诱导正常序列并入受治疗者的基因组中,导致正常/野生型基因产物的表达。置换被扩增(propagated),由此提供永久的修复和与疾病或病症相关的症状的缓解。本发明提供了用于鉴定可以用于治疗乳腺癌的化合物或药剂的方法。因此,本发明的变异体被用作用于鉴定和/或开发治疗药剂的靶标。在一些实施方式中,这样的方法包括分析药剂或化合物调节包括本发明的至少一个变异体(标记物和/或单体型)的核酸或者所述核酸的编码的产物的活性和/或表达的能力。这包括,例如,FGF10、MRPS30、HCN1和FGFR2基因中的一个或多个,以及它们的基因产物。这又可以用于鉴定抑制或改变编码的核酸产物的不期望的活性或表达的药剂或化合物。用于进行这样的实验的分析可以在基于细胞的系统中或无细胞系统中进行,如本领域技术人员已知的。基于细胞的系统包括天然表达感兴趣的核酸分子的细胞,或者已经被遗传修饰以便表达某一期望的核酸分子的重组细胞。患者中的变异体基因表达可以通过包含变异体的核酸序列的表达被评估(例如,包含本发明的至少一个变异体的基因,其可以被转录到包含至少一个变异体的RNA中,并进而翻译成蛋白质),或者通过由于影响正常转录物的表达的水平或模式的变异体(例如在基因的调节或控制区中的变异体)的正常/野生型核酸序列的改变的表达而评估。用于基因表达的分析包括直接核酸分析(mRNA)、用于表达的蛋白质水平的分析,或者途径如信52号途径中涉及的并行化合物(collateralcompounds)的分析。此外,响应于信号途径而被上调或下调的基因的表达也可以被分析。一个实施方式包括将报告基因如萤光素酶可操作性地连接至感兴趣的基因的调节区。在一个实施方式中,基因表达的调节剂当细胞与候选化合物或药剂接触以及mRNA的表达被确定时可以被鉴定。在候选化合物或药剂存在下,将mRNA的表达水平与所述化合物或药剂缺乏时的表达水平进行比较。基于该比较,用于治疗乳腺癌的候选化合物或药剂可以作为那些调节变异体基因的基因表达的化合物或药剂而被鉴定。当mRNA的表达或编码的蛋白质在候选化合物或药剂存在的情况下比其缺乏的情况下统计学上显著更大时,候选化合物或药剂作为核酸表达的剌激剂或上调剂被鉴定。当核酸表达或蛋白质水平在候选化合物或药剂存在的情况下比其缺乏的情况下显著更少时,所述候选化合物作为核酸表达的抑制剂或下调剂被鉴定。本发明进一步提供了利用通过药物(化合物和/或药剂)筛查鉴定的化合物作为基因调节剂(即,基因表达的剌激剂和/或抑制剂)的治疗方法。评估对治疗药剂反应可能性的方法,监测治疗进展的方法以及用于用于治疗乳腺癌的方法如本领域已知的,个体对特定治疗(例如,治疗药剂或治疗方法)具有不同的反应。差异反应的基础可以是部分遗传决定的。药物基因组学致力于由于改变的药物配置和/或药物的异常或改变的作用,遗传变异(例如,本发明的变异体(标记物和/或单体型))如何影响药物反应的问题。因此,差异反应的基础可以是部分遗传决定的。由于影响药物反应的遗传变异的临床结果在一些个体(例如,本发明的遗传变异体的携带者或非携带者)中可能导致药物毒性,或者药物的治疗失败。因此,本发明的变异体可以决定治疗药剂和/或方法作用于身体的方式,或者身体代谢所述治疗药剂的途径。因此,在一个实施方式中,多态位点处的特定等位基因或单体型的存在指示对特定治疗形式的不同反应率。这意味着诊断有乳腺癌,并且携带本发明的多态处的某一等位基因或单体型(例如,本发明的风险中和保护性的等位基因和/或单体型)的患者将更好或更坏地响应于用于治疗所述疾病的特定治疗、药物和/或其他治疗。因此,标记物等位基因或单体型的存在或缺乏将会辅助决定什么治疗应当用于所述患者。例如,对于新诊断的患者,本发明的标记物或单体型的存在可以被评估(例如,通过测试来自血液样品的DNA,如这里描述的)。如果所述患者对标记物等位基因或单体型是阳性的(即,标记物的至少一个特异性等位基因,或单体型存在),则医师建议一种特别的疗法,而如果患者对标记物的至少一个等位基因或单体型是阴性的,则可以建议不同的疗程(其可以包括建议没有直接的治疗,除了连续监测疾病进展,被进行)。因此,患者的携带状况可以用于帮助确定是否特定治疗形式应当被给予。价值存在于以下可能性内能够早期诊断疾病,选择最合适的治疗,以及为临床医师提供关于疾病的预后/侵蚀性的信息,以便能够应用最合适的治疗。如这里进一步描述的,目前用于乳腺癌的临床预防选择主要是化学预防(chemopreventive)(化学治疗,或激素治疗)和预防性手术。最常见的化学预防剂是他莫昔芬和雷洛昔芬;其他选择包括其他选择性雌激素受体调节剂(SERM)和芳香酶抑制剂。治疗选择还包括放射治疗,对于其部分患者经历不利症状。如这里描述的,本发明的标记物可以用来评估对这些治疗选择的反应,或者预测利用这些治疗选择的任何一个的治疗进展。因此,遗传识别可以用于基于个体的基因状况来选择合适的治疗策略,或者它可以用于预测特定治疗选择的结果,由此用在治疗选择或可利用的治疗选择的结合的策略选择中。本发明还涉及监测用于乳腺癌的治疗的进展或效果的方法。这可以基于本发明的标记物和单体型的基因型和/或单体型状况进行,即,通过评估如这里描述的至少一个多态标记物的至少一个等位基因的缺乏或存在,或通过监测与本发明的变异体(标记物和单体型)相关的基因的表达来进行。风险基因mRNA或编码的多肽可以在组织样品(例如,外周血样品,或活组织检查样品)中被测量。表达水平和/或mRNA水平由此可以在治疗前和治疗期间被确定以监测其效果。可替换地,或伴随地,如这里出现的用于乳腺癌的至少一个风险变异体的基因型和/或单体型状态在治疗前和治疗期间被确定以监测其效果。可替换地,通过确定mRNA和或多肽水平,可以监测与本发明的标记物和单体型相关的生物网络或代谢途径。这可以例如通过监测治疗前和治疗期间采集的样品中属于所述网络和/或途径的几个基因的表达水平或多肽来进行。可替换地,属于生物网络或代谢途径的代谢物可以在治疗前和治疗期间被确定。治疗的效果通过比较治疗期间表达水平/代谢物水平的观察到的变化与来自健康受治疗者的相应数据来确定。在另外的方面中,本发明的标记物可以用来提高临床试验的能力和效果。因此,作为本发明的风险中的变异体的携带者的个体,即,作为提供发展乳腺癌的增加的风险的至少一个多态标记物的至少一个等位基因的携带者的个体,将更可能响应于特定治疗模式(药征,modality)。在一个实施方式中,携带途径和/或代谢网络中的基因的风险中的变异体的个体(对于其,靶向特定治疗(如小分子药物))更可能是治疗的响应者。在另一个实施方式中,携带基因(其表达和/或功能通过所述风险中的变异体被改变)的风险中的变异体的个体更可能是靶向所述基因、其表达或其基因产物的治疗模式的响应者。在另外的方面中,本发明的标记物和单体型可以用于靶向用于特定个体的药物药剂的选择。治疗模式的个性化的选择,生活方式的改变或两者的结合,可以通过本发明的风险中的变异体的利用而实现。因此,对于本发明的特定标记物的个体的状态的知识,可以用于选择靶向被本发明的风险中的变异体影响的基因或基因产物的治疗选择。变异体的一些组合可以适用于治疗选项的一个选择,而其他基因变异体组合可以耙向其他治疗选项。这样的变异体的组合可以包括一个变异体、两个变异体、三个变异体、或四个或更多变异体,当需要时以具有临床可靠的准确度确定治疗模式的选择。计算机-实施的方面本发明还涉及这里描述的与乳腺癌相关的多态标记物和单体型的计算机_实施的应用。这样的应用可以用于存储、操作或以其他方式分析用在本发明的方法中的基因型数据。一个实例涉及将来自个体的基因型信息储存在可读介质上,以便能够将所述基因型信息提供给第三方。所述第三方可以为基因型数据来源的个体。第三方也可以为用于分析基因型信息的服务提供者,例如,基于在特定遗传标记物处的个体的基因型计算遗传风险的服务提供者。在一个这样的实施方式中,所述服务提供者从基因型服务提供者接受基因型信息,并将所述基因型信息存储在可读介质上用于随后的分析。在另一实施方式中,所述基因型提供者也是所述服务提供者,即,相同的一方从来自个体的DNA样品产生基因型,将所述基因型数据存储在可读介质上,并提供关于所述基因型数据的风险评估或其他解释的服务。另外的解释可以例如包括评估或预测个体的世系,或所述个体与参考个体之间的系54谱关系。所述参考个体可以例如为朋友、亲属或所述个体希望比较他的/她的基因型的任何其他人。在一个特别的实施方式中,所述基因型数据用于得出关于有助于对乳腺癌的增加的易感性的遗传风险因素的信息,并基于这样的比较报告结果。在一个方面中,本发明涉及计算机可读介质。一般地说,这样的介质具有存储以下的能力(i)用于至少一个多态标记物或单体型的鉴定者信息;(ii)患有乳腺癌的个体中的所述至少一个标记物的至少一个等位基因的频率,或单体型的频率的指征;以及参考群体中的所述至少一个标记物的至少一个等位基因的频率,或单体型的频率的指征。所述参考群体可以为个体的无疾病的群体。可替换地,所述参考群体为来自总的群体的随机样本,并由此代表全体群体。频率指征可以为计算的频率、等位基因和/或单体型拷贝的计数、或适于特定介质的实际频率的正规化或以其他方式操作的值。关于所述个体的另外的信息可以存储在介质上,如世系信息,关于性别、身体素质或特征(包括身高和体重)的信息、生物化学测量值(如血压、血液脂质水平等),或在特定个体的基因型状况的范围中期望存储或操作的其他有用信息。本发明进一步涉及一种适于确定或操作用于确定人类个体中对乳腺癌的易感性的遗传数据的装置。这样的装置可以包括计算机可读的存储器、用于操作存储在计算机可读的存储器上的数据的程序、以及用于产生包括遗传数据的测量值的输出的程序。这样的测量值可以包括这样的值,如等位基因或单体型频率、基因型计数、性别、年龄、基因型信息、用于优势比(0R)或相对风险(RR)的值、群体特异风险(PAR)、或原始基因型数据的直接统计量或基于根据遗传数据的计算的其他有用信息。这里显示的与乳腺癌的增加的易感性(如,增加的风险)相关的标记物和单体型,在一些实施方式中,可用于解释和/或分析基因型数据。因此在一些实施方式中,乳腺癌的风险中的等位基因的鉴定,如这里是出的,或者与这里示出的与乳腺癌相关的标记物的任何一个在LD中的多态标记物处的等位基因,是所述基因型数据起源的个体处于乳腺癌的增加的风险中的指征。在一个这样的实施方式中,对于这里示出的与乳腺癌相关的至少一个多态标记物或在与其连锁不平衡中的标记物的基因型数据被产生。所述基因型数据随后对于所述数据起源的个体是可获得的,例如经由经过因特网可进入的用户界面,连同基因型数据的解释,例如以对于疾病(如乳腺癌)的风险测量值(如绝对风险(AR)、风险比(RR)或优势比(0R))的形式。在另一个实施方式中,在来自个体的基因型数据组中鉴定的风险中的标记物被评估并来自由数据组中这样的风险中的变异体的存在提供的风险的评估的结果例如经由安全的网络界面,或者通过其他通讯方式使得对于所述个体是可获得的。这样的风险评估的结果可以以数字形式(例如,通过风险值,如绝对风险、相对风险、和/或优势比,或通过与参考相比的风险的百分比增加),通过绘图方式,或通过适合向基因型数据来源的个体阐明风险的其他方式报道。在特定的实施方式中,风险评估的结果对于第三方,如医师,其他卫生保健工作者或遗传顾问是可获得的。用在本发明多个方面中的标记物上述应用可以均借助本发明的标记物和单体型来实施,其已经在关于评估对乳腺癌的易感性的方法中更详细地描述。因此,这些应用通常可以归纳为利用如这里限定的Chr5pl2和Chrl0q26基因组区内的标记物来实施,包括如表12、表13和表14中列出的标记物,以及在与其连锁不平衡中的标记物。在一个实施方式中,用在本发明的多个方面和实施方式中的标记物选自表12、表13和表14中列出的标记物(SEQIDNO:1-237)。在一个实施方式中,所述标记物选自标记物rs10941679、rs7703618、rs4415084、rs2067980、rsl0035564、rsll743392、rs7716600、和rs1219648,以及在与其连锁不平衡中的标记物。在另一实施方式中,所述标记物选自标记物rsl0941679、rs7703618、rs4415084、rs2067980、rsl0035564、rsl1743392、rs7716600和rsl219648。在另一实施方式中,所述标记物选自rs10941679,以及在与其连锁不平衡中的标记物。在一个实施方式中,所述标记物选自表13中列出的标记物。在另一实施方式中,所述标记物选自标记物rs4415084,以及在与其连锁不平衡中的标记物。在另一实施方式中,所述标记物选自表12中列出的标记物。在另一实施方式中,所述标记物选自标记物rs1219648,以及在与其连锁不平衡中的标记物。在另一实施方式中,所述标记物选自表14中列出的标记物。在另一实施方式中,所述标记物为rs4415084。在另一实施方式中,所述标记物为rsl0941679。在另一实施方式中,所述标记物为rsl219648。在另一实施方式中,所述标记物为rs4415084或rsl0941679。在另一实施方式中,提供乳腺癌的增加的风险或易感性的标记物等位基因选自rsl0941679等位基因G、rs7703618等位基因T、rs4415084等位基因G、rs2067980等位基因G、rsl0035564等位基因G、rsl1743392等位基因T、rs7716600等位基因A、和rsl219648等位基因G。核酸和多肽这里描述的核酸和多肽可以用在本发明的方法和试剂盒中,如上文中描述的。如这里所使用的,"分离的"核酸分子是这样的核酸分子,其从通常在所述基因或核苷酸序列侧翼的核酸分离(如在基因组序列中)和/或已经从其他转录的序列完全或部分纯化(例如,如在RNA库中的)。例如,本发明的分离的核酸可以关于其中它天然存在的复合体细胞环境,或在通过重组技术产生时的培养基,或化学合成时的化学前体或其他化学制品而被基本上分离。在一些实例中,分离的物质将形成组合物(例如,包含其他物质的粗提物)、缓冲系统或试剂混合物的一部分。在其他情况中,所述物质可以被纯化到实质的同质性,例如,如通过聚丙烯酰胺凝胶电泳(PAGE)或柱色谱法(如,HPLC)所确定的。本发明的分离的核酸分子可以包括存在的所有大分子种类的至少约50%,至少约80%或至少约90%(在摩尔基础上)。关于基因组DNA,术语"分离的"也可以指从基因组DNA天然相关的染色体分离的核酸分子。例如,所述分离的核酸分子可以包含少于约250kb、200kb、150kb、100kb、75kb、50kb、25kb、10kb、5kb、4kb、3kb、2kb、lkb、0.5kb或0.lkb的核苷酸,其在所述核酸分子来源的细胞的基因组DNA中的核酸分子的侧翼。所述核酸分子可以被融合到其他编码或调节序列并仍被认为是分离的。因此,包含在载体中的重组DNA被包括在如这里所用的"分离的"定义内。并且,分离的核酸分子包括异源宿主细胞或异源有机体中的重组DNA分子,以及溶液中部分或基本上纯化的DNA分子。"分离的"核酸分子还包括本发明的DNA分子的体内和体外RNA转录物。分离的核酸分子或核苷酸序列可以包括化学合成或通过重组方式合成的核酸分子或核苷酸序列。这样的分离的核苷酸序列例如可用于编码的多肽的生产,作为探针用于分离同源序列(例如,从其他哺乳动物种类),用于基因作图(例如,通过与染色体原位杂交),或用于检测基因在组织(例如,人类组织)中的表达,如通过RNA印迹分析或其他杂交技术。本发明还涉及这样的核酸分子,其在高严格性杂交条件(如用于选择性杂交)下杂交至这里描述的核苷酸序列(例如,特异性地杂交到包含与这里描述的标记物或单体型相关的多态位点的核苷酸序列的核酸分子)。这样的核酸分子可以通过等位基因-或序列-特异性杂交(例如,在高严格性条件下)而检测和/或分离。用于核酸杂交的严格性条件和方法对于技术人员来说是熟知的(参见,例如,CurrentProtocolsinMolecularBiology,Ausubel,F.etal,JohnWiley&Sons,(1998),andKraus,M.andAaronson,S.,MethodsEnzymol.,200:546-556(1991),将其全部教导以引用方式并入本文中)。两个核苷酸或氨基酸序列的百分比同一性可以通过对准(序列对比,排列,aligning)所述序列用于最佳比较目的来确定(例如,间隙可以被引入第一序列的序列中)。然后比较相应位置处的核苷酸或氨基酸,并且两个序列之间的百分比同一性是由序列分享的相同位置的数目的函数(即,%同一性=相同位置的#/位置的总#乂100)。在一些实施方式中,用于比较目的的对准的序列的长度是参考序列的长度的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%。所述两个序列的实际比较可以通过熟知的方法来实现,例如,利用数学算法。这样的数学算法的非限制性实例描述在Karlin,S.andAltschul,S.,Proc.Natl.Acad.Sci.USA,90:5873-5877(1993)中。这样的算法被并入NBLAST和XBLAST程序(版本2.0)中,如在Altschul,S.etal.,NucleicAcidsRes.,25:3389-3402(1997)中描述的。当利用BLAST和G即pedBLAST程序时,可以使用相应的的程序(如,NBLAST)的缺省参数。参见万维网络上的站点ncbi.nlm.nih.gov。在一个实施方式中,用于序列比较的参数可以被设置为得分(score)=100、字长(wordlength)=12,或可以被改变(例如,W=5或W=20)。其他实例包括Myers和Miller的算法,CABI0S(1989),ADVANCE和ADAM,如在Torellis,A.andRobotti,C,Comput.Appl.Biosci.10:3-5(1994)中描述的;以及在Pearson,W.andLipman,D.,Proc.Natl.Acad.Sci.USA,85:2444-48(1988)中描述的FASTA。在另一个实施方式中,两个氨基酸序列之间的百分比同一性可以利用GCG软件包中的GAP程序来实现(Accelrys,Cambridge,UK)。本发明还提供了分离的核酸分子,其包含这样的片断或部分,所述片断或部分在高度严格性条件下杂交到包括以下或由以下组成的核酸包括表12、表13和表14中列出的多态标记物的核苷酸序列(SEQIDNO:1-237),以及FGF10、MRPS30、HCN1和FGFR2基因的核苷酸序列;或者包括或由以下组成的核苷酸序列包括表12、表13和表14中列出的多态标记物的核苷酸序列(SEQIDNO:1-237),以及FGF10、MRPS30、HCN1和FGFR2基因的核苷酸序列的核苷酸序列的互补物,其中所述核苷酸序列包括在这里描述的标记物和单体型中所包括的至少一个多态等位基因。本发明的核酸片段的长度为至少约15、至少约18、20、23或25个核苷酸,并且可以为30、40、50、100、200、500、1000、10,000或更多个核苷酸。本发明的核酸片段在如这里描述的那些分析中被用作探针或引物。"探针"或"引物"是以碱基-特异性方式杂交到核酸分子的互补链的寡核苷酸。除了DNA和RNA之外,这样的探针和引物包括多肽核酸(PNA),如在Nielsen,P.etal.,Science254:1497-1500(1991)中描述的。探针或引物包括杂交到核酸分子的至少约15、典型地约20-25,并且在一些实施方式中约40、50或75个连续核苷酸的核苷酸序列的区。在一个实施方式中,所述探针或引物包括这里描述的至少一个多态标记物的至少一个等位基因或至少一个单体型,或其互补物。在特定的实施方式中,探针或引物可以包括100或较少的核苷酸;例如,在一些实施方式中,6到50个核苷酸,或者,例如,12到30个核苷酸。在其他实施方式中,所述探针或引物与连续的核苷酸序列或与连续的核苷酸序列的互补物是至少70%相同的、至少80%相同的、至少85%相同的、至少90%相同的、或至少95%相同的。在另一实施方式中,所述探针或引物能够选择性杂交到连续核苷酸序列或所述连续核苷酸序列的互补物。通常,所述探针或引物进一步包括标记,例如放射性同位素、荧光标记、酶标记、酶辅因子标记、磁标记、自旋标记、表位标记。本发明的核酸分子,如上面描述的那些,可以利用本领域技术人员熟知的标准分子生物学技术来鉴定和分离。扩增的DNA可以被标记(如,放射性同位素标记的)并用作探针用于筛查来自人类细胞的cDNA库。CDNA可以来自mRNA并包含在合适的载体中。相应的克隆可以被分离,DNA可以在体内切除后获得,并且克隆的插入物可以在一个或两个方向上通过本领域公认的方法测序以鉴定编码适当的分子量的多肽的正确的阅读框。利用这些或类似的方法,多肽和编码多肽的DNA可以被分离、测序和进一步表征。通常,本发明的分离的核酸序列可以用作Southern凝胶上的分子量标记物,并被用作染色体标记物,其被标记以绘制相关的基因位置。所述核酸序列还可以用于与患者中的内源性DNA序列进行比较以鉴定乳腺癌或对乳腺癌的易感性,以及作为探针,以便杂交和发现相关的DNA序列或从样品减去已知的序列(例如,减法杂交(subtractivehybridization))。所述核酸序列可以进一步用于衍生引物用于基因指纹识别,以利用免疫技术发展抗_多肽抗体,和/或作为抗原以发展抗-DNA抗体或引发免疫反应。抗亍本还提供了特异性结合一种形式的基因产物但不结合另一种形式的基因产物的多克隆抗体和/或单克隆抗体。结合包含多态位点或多个位点的变异体或参考基因产物的部分的抗体也被提供。如这里所用的术语"抗体"指的是免疫球蛋白分子和免疫球蛋白分子的免疫活性部分,即,包含特异性结合抗原的抗原_结合部位的分子。特异性结合至本发明的多肽的分子是结合至所述多肽或其片段的分子,但是基本上不结合样品(例如,生物样品)中的其他分子,其天然包含多肽。免疫球蛋白分子的免疫活性部分的实例包括F(ab)和F(ab')2片段,其可以通过用酶如胃蛋白酶处理抗体而产生。本发明提供了结合至本发明的多肽的多克隆和单克隆抗体。如这里所用的,术语"单克隆抗体"或"单克隆抗体组合物"指的是仅包含一个种类的能够与本发明的多肽的特定表位免疫反应的抗原结合部位的抗体分子群。由此单克隆抗体组合物通常表现出对于其与之免疫反应的本发明的特定多肽的单一结合亲和力。多克隆抗体可以通过用期望的免疫原,如本发明的多肽或其片段免疫合适的受治疗者而如上所述制备。免疫的受治疗者中的抗体效价可以通过标准技术,如用酶联免疫吸附分析(ELISA)利用固定的多肽随时间进行监测。如果期望,针对所述多肽的抗体分子可以从哺乳动物(例如,从血液)分离并通过熟知的技术(如蛋白A色谱)进一步纯化以获得IgG部分。在免疫后合适的时间,例如,当抗体效价最高时,产生抗体的细胞可以从受治疗者获得并用于通过标准技术来制备单克隆抗体,如KohlerandMilstein,Nature256:495-497(1975)最初描述的杂交瘤技术、人类B细胞杂交瘤技术(Kozboretal.,Immunol.Today4:72(1983))、EBV-杂交瘤技术(Coleetal.,MonoclonalAntibodiesandCancerTherapy,AlanR.Liss,1985,Inc.,pp.77-96)或三源杂交瘤(trioma)技术。用于产生杂交瘤的技术是熟知的(参见,generallyCurrentProtocolsinlmm皿ology(1994)Coliganetal.,(eds.)JohnWiley&Sons,Inc.,NewYork,NY)。简单地,永生细胞系(典型地,骨髓瘤)被融合到来自用如上所述的免疫原免疫的哺乳动物的淋巴细胞(典型地,脾细胞),并且筛选所获得的杂交瘤细胞的培养上清液以鉴定产生结合本发明的多肽的单克隆抗体的杂交瘤。用于融合淋巴细胞和永生细胞系的许多熟知方案中的任何一个可以用于产生针对本发明的多肽的单克隆抗体的目的(参见,例如,CurrentProtocolsinImmunology,supra;Galfreetal.,Nature266:55052(1977);R.H.Kenneth,inMonoclonalAntibodies:ANewDimensionInBiologicalAnalyses,PlenumPublishingCorp.,NewYork,NewYork(1980);以及Lerner,YaleJ.Biol.Med.54:387-402(1981))。此外,普通技术人员将认识到存在许多这样的方法的变化,其也将是有用的。制备单克隆抗体-分泌杂交瘤的替换方式,针对本发明的多肽的单克隆抗体可以被鉴定并通过筛选具有所述多肽的重组体组合的免疫球蛋白库(例如,抗体噬菌体展示库)分离,从而分离结合所述多肽的免疫球蛋白库成员。用于产生和筛选噬菌体展示库的试剂盒是商业上可获得的(例如,PharmaciaRecombinantPhageAntibodySystem,CatalogNo.27_9400_01;禾口StratageneSurfZAPPhageDisplayKit,CatalogNo.240612)。此外,特别适于在产生和筛选抗体展示库中使用的方法和试剂的实例可以在例如美国专利第5,223,409号;PCT公开第W092/18619号;PCT公开第W091/17271号;PCT公开第W092/20791号;PCT公开第W092/15679号;PCT公开第W093/01288号;PCT公开第W092/01047号;PCT公开第W092/09690号;PCT公开第W090/02809号;Fuchsetal.,Bio/Technology9:1370-1372(1991);Hayetal.,Hum.Antibod.Hybridomas3:81-85(1992);Huseetal.,Science246:1275-1281(1989);和Griffithsetal.,EMBOJ.12:725-734(1993)中被发现。此外,重组抗体,如嵌合体和人源化的单克隆抗体,包括人类和非人类部分,其可以利用标准重组DNA技术制备,在本发明的范围内。这样的嵌合和人源化单克隆抗体可以通过本领域已知的重组DNA技术来产生。通常,本发明的抗体(例如,单克隆抗体)可以用于通过标准技术如亲和色谱法或免疫沉淀反应来分离本发明的多肽。多肽-特异性抗体可以促进天然多肽从细胞的纯化和在宿主细胞中表达的重组产生的多肽的纯化。此外,对于本发明的多肽特异性的抗体可以用于检测所述多肽(例如,在细胞裂解液、细胞上清液或组织样品中)以便评估所述多肽的丰度和表达模式。抗体可以用于作为临床测试过程的部分诊断性地监测组织中的蛋白水平,例如,用于例如测定给定治疗方案的效力。所述抗体可以被偶联到可检测的物质以促进其检测。可检测的物质的实例包括各种酶、辅基、荧光物质、发光物质、生物荧光物质以及放射性物质。合适的酶的实例包括辣根过氧化物酶、碱性磷酸酶、P-半乳糖苷酶、或乙酰胆碱酯酶;合适的辅基复合体的实例包括抗生蛋白链菌素/生物素和抗生物素蛋白/生物素;合适的荧光物质的实例包括伞形酮、荧光素、荧光素异硫氰酸盐、罗丹明、二氯三嗪基胺荧光素、丹磺酰氯或藻红蛋白;发光物质的实例包括鲁米诺;生物荧光物质的实例包括萤光素酶、萤光素、和水母发光蛋白,而合适的放射性物质的实例包括1251、1311、353或311。抗体还可以用在药物基因组(pharmacogenomic)分析中。在这样的实施方式中,针对由根据本发明的核酸编码的变异体蛋白的抗体,如由包含本发明的至少一个多态标记物的核酸编码的变异体蛋白,可以用于鉴定需要修改的治疗模式的个体。抗体可以进一步用于评估疾病状态中(如疾病的活性阶段中)或具有与所述蛋白质的功能相关的疾病(尤其是乳腺癌)的诱因的个体中变异体蛋白的表达。对于由包括如这里所述的至少一个多态标记物或单体型的核酸编码的本发明的变异体蛋白特异性的抗体可以用于筛查所述变异体蛋白的存在,例如筛查对于乳腺癌的诱因,如通过所述变异体蛋白的存在表示的。抗体可以用于其他方法中。因此,抗体连同通过电泳迁移率、等电点、胰蛋白酶或其他蛋白酶消化的分析而用作用于评估蛋白质的工具,如本发明的变异体蛋白,或用在本领域技术人员已知的其他身体分析中。抗体还可以用在组织分型中。在一个这样的实施方式中,特异性变异体蛋白与在特异性组织类型中的表达有关,并且对于变异体蛋白特异性的抗体然后可以用于鉴定特异性组织类型。蛋白质,包括变异体蛋白的亚细胞定位,也可以利用抗体来确定,并且可以用于评估各种组织中的细胞中所述蛋白质的异常亚细胞定位。这样的应用可以用在遗传测试中,但是也可以用在检监测特定的治疗模式中。在其中治疗针对校正所述变异体蛋白的表达水平或存在或所述变异体蛋白的异常组织分布或发育表达的情况中,对于所述变异体蛋白或其片段特异性的抗体可以用于监测治疗效力。抗体被进一步用于抑制变异体蛋白功能,例如通过阻断变异体蛋白结合到结合分子或伙伴。这样的应用也可以被用在治疗环境中,其中治疗涉及抑制变异体蛋白的功能。抗体可以例如用于阻断或竞争性抑制结合,从而调节(即,激动(agonizing)或拮抗)所述蛋白质的活性。针对包含特定功能所需的位点的特异性蛋白片段或针对与细胞或细胞膜相关的完整蛋白的抗体可以被制备。对于体内给予,抗体可以与另外的治疗性运载物(payload)相连,所述治疗性运载物为例如放射性核素、酶、免疫原表位、或细胞毒性剂,包括细菌毒素(白喉或植物毒素,如蓖麻毒素)。抗体或其片段的体内半衰期可以通过与聚乙二醇结合的聚乙二醇化(pegylation)而增加。本发明进一步涉及用于利用这里描述的方法中的抗体的试剂盒。这包括,但不限于,用于检测测试样品中变异体蛋白的存在的试剂盒。一个优选的实施方式包括抗体如标记或可标记的抗体以及用于检测生物样品中的变异体蛋白的化合物或试剂,用于确定样品中变异体蛋白的量或存在和/或缺乏的装置,以及用于比较样品中变异体蛋白的量与标准的装置,以及试剂盒的使用说明书。现在将通过下面的非限制性实施例来说明本发明。实施例1.染色体5pl2上与乳腺癌的风险相关的变异体的鉴定介绍乳腺癌易感性基因BRCA1和BRCA2中的突变占乳腺癌风险的家族构成(familialcomponent)的15-25%[Easton,(1999),BreastCancerRes,l,14-7;Balmain,etal.,(2003),NatGenet,33Suppl,238-44]。许多乳腺癌的风险的基因成分还未表征并被认为起因于个别地,可以是非常常见的较少外显变异体的组合[Pharoah,etal.,(2002),NatGenet,31,33-6]。对于较少外显乳腺癌风险变异体的许多研究已经利用候选基因、病例-对照关联方法被实施。来自这些研究的发现经常被证明难以复制[BreastCancerAssociation,(2006),JNatlCancerInst,98,1382-96]。最近通过利用动力充分的多中心分析已经显示在两个基因CASP8和TGFB1中的常见错义变异体与乳腺癌风险相关[Cox,etal.,(2007),NatGenet,39,352-8]。这些报道强调在目标是鉴定提供乳腺癌风险的适度增加的常见变异体时,具有足够的复制的大规模研究的重要性。结果染色体5pl2上的区中多个IlluminaSNP与冰岛中乳腺癌的增加的风险相关为了广泛地寻找与乳腺癌易感性相关的常见SNP的等位基因,我们利用IlluminaH咖anHap300微阵列技术进行了基因组范围(genomeiide)的SNP关联研究。基因型测定在大约1,600个冰岛乳腺癌患者和11,563个对照上进行。该发现样品组被指定为"冰岛1"。在去除不能质量控制检查的SNP后,311,524个SNP剩余并被测试与乳腺癌的关联。所述结果被调节用于个体间的相关性和利用基因组对照的方法的潜在群体分层[DevlinandRoeder,(1999),Biometrics,55,997-1004](参见方法)。信号通过P值分级。来自染色体5pl2上的相同区域的SNP的组占顶端50个级别的39个。由位于5pl2中的SNP占有的最高级别是级别5到9。包含这些SNP的感兴趣的区从大约染色体5坐标44,094,392bp(标记物rs7704166的位置;这里所有的坐标是来自NCBIBuild34)延伸到着丝粒前最后的IlluminaSNP的位置;即,在46,393,984bp的rsl0941803。来自该区中IlluminaSNP的基因型测定的结果被呈现在表1中并在图1中用图表示出。为了进一步研究与高级的SNP之一相关的信号,chr5pl2上的标记物rs7703618,我们产生并证实了用于该SNP的Centaurus分析。所述Centaurus分析被指定SG05S3065.cl。该SNP分析被用于测定大约591个冰岛乳腺癌患者和1314个对照的独立的样品的基因型。该独立的样品被指定为冰岛2。如表2中所示,SNP在冰岛2样品中显示出与乳腺癌的显著的关联,证实用冰岛1的原始观察。我们因此在独立的冰岛2样品中复制了在冰岛1样品中观察到的原始发现。对于冰岛l&冰岛2的联合P值接近这样的水平,其在对于测试的311,524个SNP采用保守的Bonferroni校正后将被认为是基因组范围显著的[Skol,etal.,(2006),NatGenet,38,209-13]。在CGEMS数据中确定的与染色体5pl2的关联在与CGEMS的联合分析后是基因组范围显著的美国国家癌症研究所(U.S.NationalCancerInstitute)的CancerGeneticsMarkersofSusc印tibility(CGEMS)项目已经向公众域发布了对于乳腺癌易感性的基因组范围的SNP关联研究上的数据,所述研究基于利用Illumina平台用大约530,000个SNP测定基因型的1145个患者和1142个对照。这些数据在https:〃caintegrator.nci.nih.gov/cgems/可获得。CGEMS项目在5pl2区中没有发现基因组范围的显著信号。然而,我们注意到在来自冰岛的数据(冰岛1同龄组)和CGEMS数据组被联合分析时,一个SNP,即rs4415084,具有1.38E-07的P值,即,在Bonferroni校正后是基因组范围显著的。该SNP在CGEMS数据组中具有2.21E-03的不显著的P值,联合值的基因组范围的显著性主要由9.02E-06的冰岛1P值携带。因此,CGEMS数据,虽然本身一点不显著,但是提供了我们我们的与染色体5pl2的关联的原始观察的证据。许多H即M即(非Illumina)SNP标记物通过它们与在5pl2区中显示关联的IlluminaSNP的关联而显示出BC风险关联我们预期在这个基因座处可能存在等位基因异质性,即,可能在5pl2区中存在超过一个潜在的风险中的变异体,其与测试的IlluminaSNP组不同程度的相关并在不同的群体中以不同的频率存在。这是基于这样的观察,即,在最显著的标记物的集簇的远侧似乎存在显著信号(参见图1)。此外,我们注意到在一些情况中,在冰岛l材料中关联信号非常强,但是在CGEMS数据中并不强例如,上面描述的rs4415084SNP在冰岛1中产生非常强的信号,但是在CGEMS数据中没有产生。类似地,在冰岛中被成功地检测用于复制的SNP,rs7703618,产生6.93E-06的P值,而在CGEMS数据组中仅为2.37E_02。假设在5pl2区中可能存在等位基因异质性,我们限定H即M即SNP的组,其通过它们与我们在冰岛1数据组中观察到的信号的关联,可以用于检测5pl2区中所有的致病突变。为了鉴定这样的H即M即SNP的组,我们首先鉴定SNP的类,其在冰岛1数据组中产生10E-3或更小的P值。随后我们将这个组分成相等(等价)的类,特定相等类(等价类)的成员被限定为它们之间具有X).8的r2值的两个SNP。这导致6个相等类的组,我们指定其为A到F。对于每个相等类,我们从在类中产生最显著的信号的SNP开始(我们标记其为"关键"SNP),随后通过参考H即M即数据,我们鉴定所有的H即M即SNP,其以0.2或更大的r2值与关键SNP相关,并且本身没有表现在Ill咖inaH即300芯片上。因此,利用冰岛1数据,我们在几个不同的相等类中观察到信号,该事实本身提供了等位基因异质性的证据。这些H即M即SNP也能够,通过它们与我们鉴定的一个或多个相等类中的SNP的关联,用于检测我们原来观察到的相同的乳腺癌风险关联。关键SNP及它们与H即M即SNP的关联的列表在表4中示出。FGF10和MRPS30是5pl2区中最可能的候选基因图l示出了加在重组热点、染色体带、已知基因、和重组率的图上的5pl2区中获得的关联信号的图。重组热点和重组率被确定,如由McVean等人描述的[McVean,etal.,(2004),Science,304,581-4]。也示出了所述区中H即M即SNP之间的r2值的代表。可以看出在所述区中存在三个著名的已知基因FGFIO、MRPS30和HCN1,连同一个不良表征的基因L0C441070。这些中的两个,FGF10和MRPS30是用于乳腺癌诱因中涉及的强制候选物。如由Howard禾口Ashworth综述的[HowardandAshworth,(2006),PLoSGenet,2,ell2],FGFIO是乳房的正常胚胎发育所必需的。FGF10在通过匪TV插入诱变的小鼠乳腺癌模型中作为癌基因被涉及,并且FGF10在人类乳腺癌中被过度表达约10%[Theodorou,etal.,(2004),Oncogene,23,6047-55]。如从图1中可以看到的,FGFIO基因通过重组热点与关联信号的主要集簇分离。然而,控制FGFIO的调节的关键元件可以存在于其中强关联信号发生的区中。可替换地,关联信号可以与FGF10基因本身内的致病突变处于连锁不平衡中。MRPS30编码线粒体28S核糖体亚单位。它还称为程序化细胞死亡蛋白9(PDCD9)。这是Gallusgallus前凋亡蛋白p52的哺乳动物对应物(counterpart)。它已经显示在哺乳动物细胞中诱导凋亡并活化应激反应性JNK1途径。所述蛋白似乎至少部分通过Bcl-2途径在凋亡中起作用[Sun,etal.,(1998),Gene,208,157-66;Carim,etal.,(1999),CytogenetCellGenet,87,85-8;CavdarKoc,etal.,(2001),FEBSLett,492,166-70]。虽然它在乳腺癌中先前还没有被涉及,但是它在上面途径中的涉及表明MRPS30中的遗传变异体可以在修改乳腺癌风险中被涉及。方法患者和对照选择62这项研究的资助由NationalBioethicsCommitteeofIceland禾口IcelandicDataProtectionAuthority给予。乳腺癌诊断的记录从IcelandicCancerRegistry(ICR)获得。ICR包含从1955年1月1日的冰岛中诊断有侵袭性乳腺肿瘤和导管或小叶癌原位的所有病例。具有进入ICR的诊断直到2005年12月末的住在冰岛的所有人均适合参加所述研究。ICR包含在这个期间诊断的4603名个体的记录。包含所有存活的患者(大约2840个)的流行同龄组适合招募入所述研究。我们获得来自2210个患者的被告知的同意、血液样品、和诊断信息,参与率为大约78%。对于rs7703618的基因型测定在总共2190个患者上是成功的。这个患者组的募集的进一步的细节先前已经被报道[Stacey,etal.,(2006),PLoSMed,3,e217]。12,904个冰岛对照由846名随机选自冰岛系谱数据库(IcelandicGenealogicalDatabase)的个体和12,058名来自在deC0DE的其他正在进行的基因组范围的关联研究的个体。排除在ICR中诊断有乳腺癌的个体。男性和女性性别均被包括。Illumina基因型测定DNA样品根据制造商的说明在11l咖inaInfini咖HumanH即300SNP珠微阵列(Illumina,SanDiego,CA,USA)上进行,包含源自InternationalH即M即项目的阶段I的317,503个SNP。这个芯片在UtahCEPH(CEU)HapM即样品中提供约75%的基因组覆盖,对于常见SNP,r28[BarrettandCardon,(2006),NatGenet,38,659-62]。芯片上SNP的总数中,5979个被认为是不适合的,因为它们是单态的(即,组合的患者和对照组中次要等位基因频率小于O.001),或者具有低(<95%)产率或者在对照中显示出从Hardy-Weinberg平衡的非常显著的畸变(P〈1X10—,。所有的这些问题SNP从分析中被去除。因此311,524个SNP被用在关联分析中。具有低于98X的SNP的总呼叫率(callrate)的任何芯片也从基因组范围的关联分析被排除。CentaurusSNP基因型测定Centa訓s分析[Kutyavin,etal.,(2006),NucleicAcidsRes,34,e128]被设计用于rs7703618并通过基因型测定H即M即CEU样品和比较所述基因型与公开的数据来证实。所述分析伴随H即M即数据产生<1.5%错配。表5示出了对于这里讨论的关键SNP的序列上下文。表6示出了用于被开发用于这个研究中的基因型测定的标记物rs7703618的Centaurus分析的描述。统计方法我们计算SNP等位基因的优势比(OR),假定乘法模型,即,假定个人携带的两个等位基因的相对风险相乘。对于标记物,等位基因频率而不是携带者频率被呈现。相关的P值借助标准似然比x2统计被计算,如在NEMO软件包中实施的[Gretarsdottir,etal.,(2003),NatGenet,35,131-8]。计算置信区间,假定OR的估计具有对数正态分布。—些冰岛患者和对照在组内和组间是相关的,造成x2检验统计量具有大于1的平均值以及大于0.6752的中位值。我们利用基因组对照的方法[DevlinandRoeder,(1999),Biometrics,55,997-1004],通过计算对于基因组范围的SNP组的观察到的乂2统计量的平均值估计对于冰岛1的膨胀因子(膨胀系数,inflationfactor),其说明相关性和潜在的群体分层。对于冰岛2,其还没有用标记物的基因组范围的组分类,膨胀因子通过冰岛系谱的模拟基因型估计[Grant,etal.,(2006),NatGenet,38,320-3]。估计的膨胀因子对于冰岛1为1.105,而对于冰岛2为1.11。对于冰岛1和冰岛2样品组的联合分析的估计的膨胀因子为1.08,通过模拟获得。所有的P值作为双侧被报道。表1:5pl2区中对于Ill咖inaSNP的关联结果<table>tableseeoriginaldocumentpage64</column></row><table>SNP等位基因位置Wd34P值OR病例频率病例对照频率对照rs6885754A448115549.68E-011.00716600.014"5500.013rs7712949T448158461-19E-051.19316590.392115470.350rs11746980A448233791.98E-051-18616600.405"5610.365rs16901964T448287561.97E-051.18816590.390115600.350rs727305C448415431.51E-051.19116600.390115160.349rs10462081A448461662.13E-051.18716570,390115570.350rs13183209A448492501.92E-051-18816600.390"5550.350rs13159598G448514273.31E-051,18216440.402115130.363rs3761648G448535808.57E-061.20215890,387108440-344rs13174122G3.63E"05"8116580:390114980.351rs11746506T448580672.12E-051.18716600,389"5610.350rs12188871A448595051.50E-051.19116570,390115320.349rs96377B3G448651471.74E"051,19016550,389115200.349rs4457089T448672372,06E-051,18716600.389115600.349rs6867533T448727936.23E-061.20016410.398113550.355re689635t)C448780722.09E-051.1871卿0.389"5590.350rs1371025C448797342.06E-051.18716600-389115570.349rs6451775G448822892.21E-051.187■0.389"5610.350rs729599C448877612.21E-051,18716600,389115610.350rs987394T448918792.16E~051.18716600,389"5580.349rs4440370A448988532.17E-051.18716590.389115590,350rs4492"9A449011157.18E061.20016450.387113400.345re7703497A449025292.12E-051.18716590.38911559D.349rs4395640T449146018.63E-061.19716520.395"497.0.353rs7716600A449205063.12E-051.21416600.241115600.208rs4412123T449217891.10E-051,19216600.409"5600.367rs7705343G449250781.31E-051,16580409115580.368rs4129642G449436301-11E-051.19416550.396115180.355rs9790879C449453861.27E-051.19116590,409"5610.368rs10462084G449468502.31E-011.06716590,155115620,147rs9791056T449493927.66E-061.19716600.396115620.354rs6880275T449544367.76E-061.19816480.395"4840.353rs6870136G449561637.51E-061.19716600,396115590.354rs6881563C449583547.28E-061.19816600.396115610.354rs7703618G44恥00806.93E-061.19816590,396115570.354rs10077B14C449622901.24E-051.19116590.407"5610.366rs6451783G449637949.41E>061.19516600.395115630.353rs4298259G449662129.35E"061.19516600,395115620.353rs7728431T449681809.96E-061.19516600,394115590,353rs12517690A449847949.56E-061.19516600.395115620.353re3935213A450069453力9E-021.11216590.182115610.167rs6866995C450223483.77E-021.112■0.182115630.167rs206798DG450278189.89E-041.20016600,155"5550.132rs3923826C451182782.49E-021.13716600.870115620,855rs11743309A451678892.15E-011,06716600.836115590,826rs12654948T452112161.28E-011.09416510.878"2600細rs12515820G452389704.07E-021.12616600.135,115580.122rsl2515179C452925964.86E-021.12016600.138115620.125rs10512876G452951057.73E-011,02516600.055"5610.054rs1D035564G452980011.79E-041,17816500291114770.25Brs131咖87C453112695.28E-021.127化590.117115630.105rs4866929A453120909.34E-021.06816600.484115600,468re981782丁453312192.28E-041.15916010.458107060.421等位基因位置Wd34P值OR病例频率病例对照频率对照rs981782T453312191.05E-011,066細0.470115620.454rs9790873C453370153.61E-021.13316600.128115540.115rs9292918G453465364.21E-031.16116560,176115460.155rs6的5055A453669092.34E-031.17216600.177115510.155rs6888352A453714162.72E-031.16916590.177"5510.155rs994092G453812602.49E-031.17116590.177115570.155rs10473384A453893112.34E-031.1721659o.m115600.155rs1501357G454103762.61E-031.17016600,177'115630.155rs12517615C454122896.70E-021,19016470.047112860.040rs1501362T454237082.85E-031.16716600.179115580.157rs6451798T454333553,11E-031.16616600.179115600,157rs6414906C454518229.05E-031.11216580,375115600.351rs13162651C454554015.54E-021.08116550.375113630.357fs1483310G454598597.27E-021,17816550,051114130.044rs12659024T454631919.87E-011.00116580.080115490,080rs6892290G454726381.08E-021,10916600.375115600,351rs6451801A454849341.02E-021.11016600.375'"5600.351rs13354798C455025781.16E>021,10816600.377115630.353rs12651887T455159241.19E-011.07616570.225115490.212rs1471683A455249267.07E-021,08816600.232115620.217rs2337414A456141701.12E-011.10016600.884115620.874rs1852598G456484772.93E-011.04916600.245115620.237rs11743392T456604764.43E-041.15016140.490108260.455rs1534391T457145396.74E-021.11716520.884"3960.873rs2879074C457617101.10316600.384115600.361rs4380674C458148982.50E-011.05316600.259115630.249rs7447717A458157531.29E-021.10516600.384"5590.361rs4388219A458262511.41E-011.06316600.328115550.315rs10941703C458273731.02E-011.06916600.364115610.349rs10941704G458290072.99E力11.04916570.245115310.236rs4551074T458382542.15E-011.05716600.260115610.249rs13155321G;158420479-36E-021,07116600.367115590.351rs7733616C458442241.59E-011.06316300.2恥113720.278rs10069793G458486526.09E-021.07916500.367"4650.349rs13176359T45859776272E-011.05016600.267115520,258rs4866973A458621872.03E-011.05916570.259115300.248rs4242126A458718742.80E-011,05116600.245115610.236rs6865429G458760099.87E-021,06916590.366115610.351rs10461763G458847085.07E-011.07516590.034115570.032rs7730617A458858041.53E-011.06316590.294115570.281rs13175559C459001281.10E-011.0671660,0,368115600.353rs11951003A459026301.09E-011.06716590.368"5590.353rs43319"G459048761.55E-011.06016270.360112970.347rs13340341T459064371.53E-011.06016600.363115560.349rs12109205G459221792.53E-011.05116600,288115590.278rs4368738T459382891.67E^011,06116590,294115610.281rs9637799G459481095.03E011,07516600.034"5600.032rs6862657A459514981.03E~011,06916560.366115330.351rs7443189A459584686.0犯-011.05716540,034115190.032rs11948152C460001281.89E^011.05416440,580113770.567rs7443384G460063941.01E-011.07016600.345115620.330rs7701444C460143631.05E-011,068化600.369115610.354rs13352566丁460424032.03E-011.05916480.260114200'24966<table>tableseeoriginaldocumentpage67</column></row><table>所示的是SNP名称,风险等位基因的身份、位置(在NCBIBuild34坐标中)、对于乳腺癌关联的P值和优势比(OR)、分别在乳腺癌病例和对照组中测试的个体的数量和等位基因频率。表2.在独立的冰岛乳腺癌病例/对照样品中来自SNPrs7703618的信号的复制<table>tableseeoriginaldocumentpage67</column></row><table>表3.在相等类A-F中关于关键SNP中具有>0.2的r2值的HapM即SNP。SNP1是相等类A-F的每个中具有最低P值的Ill咖inaSNP。SNP2是与SNP1相关的H即M即SNP。D'是穿过SNPl和SNP2的等位基因的所有组合的平均D'值。R2是两个SNP之间的相关系数的平方。p-min是在SNPl和SNP2的等位基因之间观察到的对应于最强的连锁不平衡的P值。<table>tableseeoriginaldocumentpage67</column></row><table><table>tableseeoriginaldocumentpage68</column></row><table><table>tableseeoriginaldocumentpage69</column></row><table><table>tableseeoriginaldocumentpage70</column></row><table><table>tableseeoriginaldocumentpage71</column></row><table><table>tableseeoriginaldocumentpage72</column></row><table>SNPA=rs4415084rs4415084rs77096610.8430.2649.59E-08rs4415084rs68949740.8430.2649.59E-08rs4415084rs68853070.8430.2649.59E-08rs4415084rs45338940.8430.2649.59E-08rs4415084rsl25216390.8430.2649.59E-08rs4415084rsl20549760.8430.2649.59E-08rs4415084rs77310990.8390.2641.12E-07rs4415084rs77016790.8410.2631.15E-07rs4415084rs68626550.7390.2623.65E-08rs4415084rsl00597450.7390.2623.65E-08rs4415084rs64517960.8400.2551.80E-07rs4415084rs39230550.8400.2551.80E-07rs4415084rsl5013610.8400.2551.80E-07rs4415084rsl3929730.8400.2551.80E-07rs4415084rs68663540.7340.2545.71E-08rs4415084rs46392380.7360.2545.70E-08rs4415084rsl23745070.7360.2545.70E-08rs4415084rsl00669530.7360.2545.70E-08rs4415084rs43717610.8390.2522.37E-07rs4415084rsl00545210.7330.2498.38E-0873<table>tableseeoriginaldocumentpage74</column></row><table><table>tableseeoriginaldocumentpage75</column></row><table><table>tableseeoriginaldocumentpage76</column></row><table>SNPA=rs4415084rs7703618rsl00532471.0001.0002.19E-35rs7703618rsl00404881.0001.0002.19E-35rs7703618rsl00400821.0001.0001.50E-34rs7703618rsl4388271.0000.9642.55E-33rs7703618rs77116971.0000.9292.12E-31rs7703618rsll9588081.0000.9297.53E-32rs7703618rsl00440961.0000.9297.53E-32rs7703618rs73805591.0000.9297.53E-32rs7703618rs45184091.0000.9297.53E-32rs7703618rs43290281.0000.9292.12E-31rs7703618rsl4388211.0000.9297.53E-32rs7703618rsl4388201.0000.9297.53E-32rs7703618rsl33621321.0000.9297.53E-32rs7703618rsl31602591.0000.9297.53E-32rs7703618rsl0613101.0000.9297.53E-32rs7703618rsl05128651.0000.9297.53E-32rs7703618rsl0487581.0000.9297.53E-32rs7703618rs77165711.0000.9294.57E-31rs7703618rs92929131.0000.9281.15E-31rs7703618rs73808781.0000.9283.22E-3177SNPA=rs4415084rs7703618rsl31777111.0000.9281.15E-31rs7703618rsl00433441.0000.9284.91E-31rs7703618rsll9498471.0000.9281.75E-31rs7703618rs97908960.9620.8587.84E-27rs7703618rs9203280.9230.7641.31E-23rs7703618rs45714800.9220.7312.33E-22rs7703618rsll9481860.8830.7231.25E-21rs7703618rsl00515920.8830.7231.25E-21rs7703618rs77358810.9210.7087.34E-22rs7703618rs77235390.9210.7087.34E-22rs7703618rs7141300.9210.7087.34E-22rs7703618rs68615600.9210.7087.34E-22rs7703618rs64517700.9210.7087.34E-22rs7703618rs44196000.9210.7087.34E-22rs7703618rs44150850.9210.7087.34E-22rs7703618rs43217550.9210.7087.34E-22rs7703618rs22180810.9210.7087.34E-22rs7703618rsl4388250.9210.7087.34E-22rs7703618rsl31569300.9210.7087.34E-22rs7703618rsl25150120.9210.7087.34E-2278<table>tableseeoriginaldocumentpage79</column></row><table><table>tableseeoriginaldocumentpage80</column></row><table><table>tableseeoriginaldocumentpage81</column></row><table>SNPA=rs4415084rs7703618rsl3929730.7860.2671.07E-07rs7703618rs45668050.9030.2661.31E-07rs7703618rsl25204300.9060.2665.16E-08rs7703618rsl4059180.6360.2658.95E-08rs7703618rsl31834340.9070.2625.17E-08rs7703618rs74460900.8350.2591.68E-07rs7703618rs44936820.8330.2591.97E-07rs7703618rs77201040.8310.2582.29E-07rs7703618rs43084900.8310.2582.75E-07rs7703618rs77114440.9010.2544.18E-07rs7703618rs68934940.8310.2502.47E-07rs7703618rsl25231570.8310.2502.47E-07rs7703618rsll9545980.8310.2502.47E-07rs7703618rs68641490.8270.2492.79E-07rs7703618rsl25144140.8230.2474.51E-07rs7703618rsl25201240.5910.2476.18E-07rs7703618rs68767730.8220.2466.39E-07rs7703618rsl31875650.6030.2461.02E-06rs7703618rs77114460.8210.2467.62E-07rs7703618rs23374830.6230.2462.67E-0782<table>tableseeoriginaldocumentpage83</column></row><table><table>tableseeoriginaldocumentpage84</column></row><table>SNPA=rs4415084rs2067980rs64517960.7790.4347.64E-10rs2067980rs39230550.7790.4347.64E-10rs2067980rsl5013610.7790.4347.64E-10rs2067980rsl3929730.7790.4347.64E-10rs2067980rs68741270.7780.4309.74E-10rs2067980rs77092620.7760.4081.92E-09rs2067980rs9303950.7740.3834.51E-09rs2067980rs64517950.6400.3508.08E-08rs2067980rsll9481861.0000.3298.10E-11rs2067980rsl00515921.0000.3298.10E-11rs2067980rs68611500.5770.3243.93E-07rs2067980rsl04733870.7430.2984.83E-07rs2067980rsl69020861.0000.2944.OOE-10rs2067980rs77116971.0000.2914.65E-10rs2067980rs77165711.0000.2881.57E-09rs2067980rsl09416790.7590.2881.55E-07rs2067980rsl00433441.0000.2866.31E-10rs2067980rs73805591.0000.2836.59E-10rs2067980rs45184091.0000.2836.59E-10rs206798Qrs43290281.0000.2831.89E-0985SNPA=rs4415084rs2067980rsl4388211.0000.2836.59E-10rs2067980rsl4388201.0000.2836.59E-10rs2067980rsl33621321.0000.2836.59E-10rs2067980rsl31602591.0000.2836.59E-10rs2067980rsll9588081.0000.2836.59E-10rs2067980rsl0613101.0000.2836.59E-10rs2067980rsl05128651.0000.2836.59E-10rs2067980rsl0487581.0000.2836.59E-10rs2067980rsl00440961.0000.2836.59E-10rs2067980rs92929131.0000.2807.66E-10rs2067980rs73808781.0000.2802.18E-09rs2067980rsl31777111.0000.2807.66E-10rs2067980rsll9498471.0000.2788.92E-10rs2067980rs77217310.7360.2761.54E-06rs2067980rs97908961.0000.2751.04E-09rs2067980rsl4833090.7530.2702.69E-07rs2067980rsl4833060.7530.2702.69E-07rs2067980rsl33587180.7530.2702.69E-07rs2067980rsl00730550.7530.2702.69E-07rs206798Qrsl04724Q40.7500.2685.28E-0786<table>tableseeoriginaldocumentpage87</column></row><table>SNPA=rs4415084rs2067980rs44150851.0000.2542.71E-09rs2067980rs43217551.0000.2542.71E-09rs2067980rs22180811.0000.2542.71E-09rs2067980rs21650101.0000.2547.25E-09rs2067980rsl4388251.0000.2542.71E-09rs2067980rsl31569301.0000.2542.71E-09rs2067980rsl25150121.0000.2542.71E-09rs2067980rsl21871961.0000.2542.71E-09rs2067980rs44525660.8130.2545.19E-07rs2067980rsl00400820.9060.2521.42E-07rs2067980rs37474790.9000.2523.55E-07rs2067980rs9203291.0000.2513.15E-09rs2067980rsl8219361.0000.2513.15E-09rs2067980rsl09416781.0000.2513.15E-09rs2067980rsl08056851.0000.2513.15E-09rs2067980rs77174590.9050.2491.51E-07rs2067980rs68933190.9050.2491.51E-07rs2067980rs68759330.9050.2491.51E-07rs2067980rs68722540.9050.2491.51E-07rs206798Qrs64517780.9050.2491.51E-0788SNPA=rs4415084rs2067980rs43732870.9050.2491.51E-07rs2067980rsl8664060.9050.2491.51E-07rs2067980rsl4388220.9050.2491.51E-07rs2067980rsl4388190.9050.2491.51E-07rs2067980rsl31891200.9050.2491.51E-07rs2067980rsl31556980.9050.2491.51E-07rs2067980rsl31547810.9050.2491.51E-07rs2067980rsl04620800.9050.2491.51E-07rs2067980rsl00656380.9050.2491.51E-07rs2067980rsl00590860.9050.2491.51E-07rs2067980rsl00575210.9050.2491.51E-07rs2067980rsl00532470.9050.2491.51E-07rs2067980rsl00415180.9050.2491.51E-07rs2067980rsl00404880.9050.2491.51E-07rs2067980rsl00398660.9050.2491.51E-07rs2067980rs68752870.9040.2492.50E-07rs2067980rs44921181.0000.2493.66E-09rs2067980rs21650091.0000.2493.66E-09rs2067980rsl25226261.0000.2493.66E-09rs206798Qrsl25137490.9030.2483.02E-0789<table>tableseeoriginaldocumentpage90</column></row><table><table>tableseeoriginaldocumentpage91</column></row><table><table>tableseeoriginaldocumentpage92</column></row><table>SNPA=rs4415084rsl0035564rsl69020861.0000.8946.99E-30rsl0035564rs92929140.9540.8748.22E-24rsl0035564rs77116970.9590.8228.14E-25rsl0035564rs39350861.0000.8192.75E-26rsl0035564rsl05128751.0000.8192.75E-26rsl0035564rs73805590.9590.7941.31E-24rsl0035564rs45184090.9590.7941.31E-24rsl0035564rsl4388210.9590.7941.31E-24rsl0035564rsl4388200.9590.7941.31E-24rsl0035564rsl33621320.9590.7941.31E-24rsl0035564rsl31602590.9590.7941.31E-24rsl0035564rsll9588080.9590.7941.31E-24rsl0035564rsl0613100.9590.7941.31E-24rsl0035564rsl05128650.9590.7941.31E-24rsl0035564rsl0487580.9590.7941.31E-24rsl0035564rsl00440960.9590.7941.31E-24rsl0035564rs43290280.9580.7933.59E-24rsl0035564rs77165710.9580.7924.90E-24rsl0035564rsl31777110.9590.7921.92E-24rsl0035564rs92929130.9590.7923.86E-2493<table>tableseeoriginaldocumentpage94</column></row><table>SNPA=rs4415084rsl0035564rsl00575210.8800.7211.72E-21rsl0035564rsl00532470.8800.7211.72E-21rsl0035564rsl00415180.8800.7211.72E-21rsl0035564rsl00404880.8800.7211.72E-21rsl0035564rsl00398660.8800.7211.72E-21rsl0035564rsl25137490.8800.7213.45E-21rsl0035564rs68759330.8800.7203.43E-21rsl0035564rs77360920.8800.7192.46E-21rsl0035564rs68710520.8800.7192.46E-21rsl0035564rsl00700370.8800.7192.46E-21rsl0035564rs77085060.8800.7193.76E-21rsl0035564rs46423770.8770.7184.69E-21rsl0035564rsl26519490.8590.7183.09E-17rsl0035564rs37474790.8770.7176.57E-21rsl0035564rs68943240.8770.7166.70E-21rsl0035564rs44570880.8770.7166.70E-21rsl0035564rsl00385540.8770.7166.70E-21rsl0035564rs68682320.8740.7151.28E-20rsl0035564rsl00400820.8770.7149.58E-21rsl0035564rsll9517600.8750.7061.16E-1995<table>tableseeoriginaldocumentpage96</column></row><table><table>tableseeoriginaldocumentpage97</column></row><table><table>tableseeoriginaldocumentpage98</column></row><table><table>tableseeoriginaldocumentpage99</column></row><table>SNPA=rs4415084rsl0035564rsl25146151.0000.3646.12E-12rsl0035564rs68741270.8650.3573.92E-10rsl0035564rsl31875650.7470.3571.02E-09rsl0035564rs46137181.0000.3566.97E-14rsl0035564rs26254940.7660.3549.14E-11rsl0035564rs25802580.7660.3549.14E-11rsl0035564rsl3517200.7660.3549.14E-11rsl0035564rsl21101370.7660.3549.14E-11rsl0035564rsl00736360.7660.3549.14E-11rsl0035564rsl00437920.7660.3549.14E-11rsl0035564rsl25201240.7220.3517.29E-10rsl0035564rs45668051.0000.3503.68E-11rsl0035564rsl25204301.0000.3492.49E-11rsl0035564rs64517960.8630.3455.58E-10rsl0035564rs39230550.8630.3455.58E-10rsl0035564rsl5013610.8630.3455.58E-10rsl0035564rsl3929730.8630.3455.58E-10rsl0035564rs25891620.7560.3406.65E-10rsl0035564rsl31834341.0000.3402.99E-11rsl0035564rs744609Q0.9220.3396.66E-10100<table>tableseeoriginaldocumentpage101</column></row><table><table>tableseeoriginaldocumentpage102</column></row><table><table>tableseeoriginaldocumentpage103</column></row><table><table>tableseeoriginaldocumentpage104</column></row><table><table>tableseeoriginaldocumentpage105</column></row><table>SNPA=rs4415084rsll743392rs68602001.0000.4835.74E-18rsll743392rsl31875651.0000.4791.77E-16rsll743392rsl25201241.0000.4755.19E-17rsll743392rs74444050.9510.4611.77E-15rsll743392rsl00392830.9510.4611.77E-15rsll743392rs74439760.9510.4603.54E-15rsll743392rs68951910.9500.4603.12E-15rsll743392rs68784250.9500.4603.12E-15rsll743392rsl04620970.9500.4603.12E-15rsll743392rs68821390.9500.4445.53E-15rsll743392rsl31561980.9490.4441.11E-14rsll743392rsl00414780.9480.4383.12E-14rsll743392rs64518430.9480.4383.57E-14rsll743392rsl00421990.9470.4338.75E-14rsll743392rsl25209380.9480.4294.12E-14rsll743392rs77091310.9480.4283.36E-14rsll743392rs74455720.9480.4283.36E-14rsll743392rs68847160.9480.4283.36E-14rsll743392rs43025980.9480.4283.36E-14rsll743392rs42779240.9480.4283.36E-14106<table>tableseeoriginaldocumentpage107</column></row><table>SNPA=rs4415084rsll743392rsl26975230.8510.3781.23E-11rsll743392rsl26906780.8510.3781.23E-11rsll743392rsl26569530.8510.3781.23E-11rsll743392rs77187851.0000.3623.18E-14rsll743392rs77195001.0000.2761.59E-11rsll743392rs25891811.0000.2761.59E-11rsll743392rs43673081.0000.2761.59E-11rsll743392rs42823231.0000.2761.59E-11rsll743392rsl00417721.0000.2761.59E-11rsll743392rsl00417671.0000.2761.59E-11rsll743392rs42837981.0000.2742.54E-11rsll743392rsl31885851.0000.2706.52E-11rsll743392rs46263461.0000.2653.64E-11rsll743392rsl33616091.0000.2654.42E-11rsll743392rs49758891.0000.2606.07E-11rsll743392rsl8525951.0000.2606.07E-11rsll743392rsl02143691.0000.2606.07E-11rsll743392rs77002521.0000.2558.24E-11rsll743392rsl4833081.0000.2558.24E-11rsll743392rs96865801.0000.2558.24E-11108SNPA=rs4415084rsll743392rs77249711.0000.2558.24E-11rsll743392rs77197031.0000.2558.24E-11rsll743392rs77147131.0000.2558.24E-11rsll743392rs77034051.0000.2558.24E-11rsll743392rs74472321.0000.2558.24E-11rsll743392rs68986461.0000.2558.24E-11rsll743392rs68947841.0000.2558.24E-11rsll743392rs68942731.0000.2558.24E-11rsll743392rs68869501.0000.2558.24E-11rsll743392rs45605541.0000.2551.63E-10rsll743392rs44525661.0000.2551.16E-10rsll743392rs44373831.0000.2558.24E-11rsll743392rs44076371.0000.2558.24E-11rsll743392rs23379541.0000.2558.24E-11rsll743392rsl69022211.0000.2558.24E-11rsll743392rsl69022171.0000.2558.24E-11rsll743392rsl33599151.0000.2558.24E-11rsll743392rsl33574271.0000.2558.24E-11rsll743392rsl31593621.0000.2551.16E-10rsll743392rsl21091551.0000.2558.24E-11109<table>tableseeoriginaldocumentpage110</column></row><table><table>tableseeoriginaldocumentpage111</column></row><table><table>tableseeoriginaldocumentpage112</column></row><table><table>tableseeoriginaldocumentpage113</column></row><table><table>tableseeoriginaldocumentpage114</column></row><table><table>tableseeoriginaldocumentpage115</column></row><table>SNPA=rs4415084rs7716600rs64517701.0000.3921.56E-13rs7716600rs44196001.0000.3921.56E-13rs7716600rs44150851.0000.3921.56E-13rs7716600rs43217551.0000.3921.56E-13rs7716600rs22180811.0000.3921.56E-13rs7716600rs21650101.0000.3924.15E-13rs7716600rsl4388251.0000.3921.56E-13rs7716600rsl31569301.0000.3921.56E-13rs7716600rsl25150121.0000.3921.56E-13rs7716600rsl21871961.0000.3921.56E-13rs7716600rs44631881.0000.3907.67E-13rs7716600rs9203291.0000.3891.95E-13rs7716600rsl8219361.0000.3891.95E-13rs7716600rsl09416781.0000.3891.95E-13rs7716600rsl09416771.0000.3895.16E-13rs7716600rsl08056851.0000.3891.95E-13rs7716600rs44921181.0000.3852.44E-13rs7716600rs21650091.0000.3852.44E-13rs7716600rsl25226261.0000.3852.44E-13rs771660Qrsl69019371.0000.3783.20E-13116<table>tableseeoriginaldocumentpage117</column></row><table>rs7716600rs28771630.7740.2195.99E-07rs7716600rsl09416650.7740.2195.99E-07rs7716600rs73565970.7630.2141.35E-06rs771660Qrsl04733540.7600.2071.87E-06表4:关键SNP的序列范围。关键SNPA:rs4415084deC0DE名称SG05S3092(SEQIDNO:235)caggttatgctacttccctggaggacctctcaaaaggaagctgtttgttctatttctttctcatctgtcccaggactaggtattgcattaggagatcccttgcttcccactgctgcttttaaatcatttcatttccttcttcccttcattcttcccaaatgcaaggtctttcaactttcatttcgtgctacactctgccctttattgctgctctctggaatttgtggtcactgtccctcatacactgaaaactcacatacctctacctctagccctgttgtattcctgatgacttgagca[C/T]ccaagggagtgatacatacagcactggtcaatcatttctttacctgccacacatacagcaatctttaatttcaatagccttagccactcattcccaaataatgcttggatcatgcacattatcatgagtaaatacacccatgtctgaaatcctgatttcaagtacttcccaatttttctgtcttttctttactttcagetcacagaaacaattcttecaccatattaaaaactctaatccaattcacttgttccaccactttttttatteattattctctcctgtctttactttcttcct关键SNPB:rs7703618decODE名称SG05S3065(SEQIDNO:140)gtg3gg3C3C3g3gcc3肌cc3tttc3cc3g3gggctg3gt朋ctct肌tctggc3gg3tg3ttetcctec3C3ggttgc朋tggcccctg肌3tttgg3cgc3ctttgtg3g3g3cc3gtgtcteg3t朋ct3gg肌cteggtaaatgttggagagctgcttcccttcatttctgtcattgtctgtttcatttcctttgcattgtttgttgatctgta118ttaaacaaaaatgaaagcaaaccttgtatctgagtctccatttttaccaatcctcacatttatggttcagtgtcttagtct[A/G]gtttcgaataacaagaaccttttgtacttggaagtataaaacttgatagcagcaacattattgatat肌tttcttcctct^g肌ttcate肌ctg3teg3ct肌tettgg3g肌3g肌3tgc肌ttt^ttgctg肌3gtctgtttc3gtttectggtcttgt肌teg3ggte肌3ttcte肌c^cttgggg3gctttggtg3g肌tt^朋teggtgggtg关键SNPC:rs2067980deC0DE名称SG05S3114(SEQIDNO:160)gaatatgacgtcatataggcattaatttccatgttatgaattcaccagtaaaattgtttaaacagaga3gte^c肌gacggt肌tgttettc3ggt肌肌gteg3g3ggg肌肌g3肌tettgg肌cc3gttc3gc^cc3肌atggtgccagagcccaagcatgagttettaaaggctggtggttcctctctcctgacccatteccattcttatctctgatgctccaggctgtcagtttctttcttttttgaccatatacaggtaaggaaagcccatttatgagctattttatttcca[A/G]gttttaaaaatgtcaattgatataggctatgatctacagtaatgcttaatctattgaagtttttgc3tc3肌ttcc3tctt^g3tgc^gcctg肌gcccattt肌tgcc肌3tgte^tec肌gtgctegtttc3肌gggC肌g3ttC3肌g3肌g3C3肌C3g肌g3肌3gtetttt肌ttgCtetcte肌3g肌ggCtgtgttcttgggtg^tggctcc关键SNPD:rsl0035564deC0DE名称SG05S31043C^t^gtttttegtg3tetteg3tttttttcatttttgg^g肌g肌C3g3肌肌gtgte肌肌g3tgg肌t^teteg肌肌tggtegctgg3gg3ttc3肌g肌g^ctc3cttttetcatgtc肌3gct肌肌tete肌ttgteg3ttttgc3tetgtec肌tg3gc3g肌3C3C3tegctg肌g肌3g肌gtgtgcte肌te肌t肌3tg肌gtattaatgattgagcagagtcttagaaagttggacatgttaagagcattgaatctatttagcctttcatgccatgcccaaa[A/G]tcagaattttaacctatactaggactttaagacaaaaaataggcaaacaaaatcacaaagtgttacaattgacatatgcagtgaattgtttcccttaaaaacaacattttttttttagttatatcactactataaaatttattcttcaacaggcaactaaacgtaatctggtttaatctttttttataaaggaacattttaaagtaattcttttctcctaacagaccatctattttcctctaaatctctttagctttaatatctattttagcgataaacagtgcatgaaataaacagctc关键SNPE:rsll743392deC0DE名称SG05S3093aatctttcaaatatattcatctctcacttatttagggactgattatccaatttgtgaactatccctgtggcttctcctcttttctctaatgatttctcctctgcctatttccttaaatcgttttaatactaaatgagctgcatg肌肌C3g肌肌g肌gCt肌3gC3gC^肌tttg3t3C3tete肌C3gtectgC^肌g肌tttC3tttgtgCtC3tatgtttttgaattttcaattttctgttaccccacttccatatttcacactccagattatgtcaccccacccaactcccaa[C/T]aatttgaaattcaaatttggaaattcatctattggttcatttagttggaaactgcatattcacaggtgg3g3gtgg肌tetetttc肌肌cc3C3g3g肌肌肌肌肌肌acgt肌ttc肌cttcgtt^tttgttttt肌ttttcc肌3gctgg肌3ttgtctctetetctc肌ttg3tg3gtttctg3gcte^肌c3肌3c肌肌c3肌3c肌肌catcatttcctgtaaccagatttcactgctttcattctaagcaagatgatataaataacaatgagtagtcaagtatttattc关键SNPF:rs7716600(SEQIDNO:125)SG05S3097aggcctaatggttgtatatatatatttttttatttggtagcagaaaagactttaaaatatgttgatgtttgcgaggtaaagcatctatgtagggcattactatcaaggctttttttttctgcttgagtctatattacaaacattttattatgtctctgctgagattaatttaaatgtgcaaattttcaattcctaatataaagataaaatgtaaagttg3tcc3肌肌tec肌肌肌3gtg3t肌肌cttegtttgt肌teteg3ctc3tetetc3tetttttegttctetttcaatgct[A/G]tctagaatttttatcattgctttttacctgaagattcaaattgttttggcatcagtcgggaaatcatctc^g肌3tecggctec3gct肌ttgctetttctec3c肌3tt^c肌gc肌gctete肌ctggcatgtggg3ttttttttttttttttttctctgagacaaggtttcactctctctcccagacgggagtgcagtggtaccatcttggttcagggc表5:SNP和Centaurus分析描述SNP名称SG05S3065或rs7703618绘图信息(Build34)Chr5:44.960080+类型CENTAURUS的分析SG05S3065.cl,检验的状态正向引物GCAAACCTTGTATCTGAGTCTCCAT反向引物GTGACCTGATAAGCAAGAATACCTVic探针CTTA*GTCTGGTFam探针TCT*T*A*GTCTAGT增强子TCGAATAACAAGAACC*表明如在[Kutyavin,etal.,(2006),NucleicAcidsRes,34,e128]中描述的修饰的碱基。实施例2.染色体5pl2上关联信号的精修、与临床变量的关联和在染色体10q26上FGFR2基因座的研究我们已经在染色体5pl2上鉴定的信号定位至表现出低重组的染色体5pl2_ll的较大的延伸处。从该区域,我们选择了来自IlluminaHap300芯片组的10个SNP,CentaurusSNP分析产生的[Kutyavin,etal.,(2006),NucleicAcidsRes,34,el28],并将它们分类在来自冰岛的另外的样品中和来自瑞典、荷兰、西班牙和美国的复制样品中。总共,欧洲世系的5028个病例和32090个对照被研究。所述区中最强关联的IlluminaSNP是rs4415084,T等位基因产生1.16的组合优势比(OR)和6.4X10—1Q的P值,其符合用于基因组范围显著性的Bonferroni标准(表6)。在单独的复制样品中,rs4415084产生1.14的OR(P=7.5X10—5)。为了精修该信号,我们分类了另外的11个SNP,其不在Illumina芯片上,但是与产生基本信号的H即300SNP在LD中。来自这些SNP的数据在表6和表7中呈现。最强的综合信号(OR1.19,P=2.9X10—")起源于rsl0941679的G等位基因,与rs4415084相关的非IlluminaSNP(D'=0.99,r2=0.51,冰岛群体中,表8)。等位基因G-rsl0941679比T_rs4415084不常见并最完整地包含在T_rs4415084背景上。然而,在多变量分析中,T-rs4415084在校正后对于G_rsl0941679保持名义的显著性(P=0.042),并且反之亦然(P=0.0017,表9)。因此,尽管高度相关,但是没有SNP完全解释在5pl2处观察到的信号。我们推断T-rs4415084和G_rsl0941679均提供乳腺癌的风险。多变量分析揭示来自SNPrs7703618的信号能够完全被T-rs4415084或G-rs10941679解释(表9)。我们检查了患者的医学记录,如果它们是可获得的,并分析了来自冰岛和复制样品组对于5pl2处两个风险变异体和在染色体10上FGFR2基因座处标记物rsl219648的组合的数据。所有三个变异体提供比ER阴性肿瘤显著更大的雌激素受体(ER)阳性乳腺癌风险(表6和表10)。类似的优先风险对于孕激素阳性肿瘤对于5pl2变异体也被看到(表10)。我们先前报道了2q35和16ql2上的易感性变异体与ER阳性肿瘤特别相关[Stacey,etal.,(2007),NatGenet]。目前的发现增加了对这样的概念的进一步支持,即,ER阳性和ER阴性肿瘤具有对于它们的风险的不同的遗传成分。5pl2SNP还显示出与较低组织级别的关联,其通过在多变量分析中与ER状况的关联被解释。FGFR2SNP在结节阳性肿瘤中比结节阴性肿瘤中更频繁。没有与肿瘤阶段或组织病理学的显著关联(表IO)。在诊断中没有变异体显示出与年龄的显著关联。FGFR2SNP与乳腺癌的家族史有关,与先前的报道一致[Huijts,etal.,(2007),BreastCancerRes,9,R78;Easton,etal.,(2007),Nature447:1087-93]。类似的倾向(虽然不是统计学上显著的)对于5pl2SNP被观察到(表11)。方法患者和对照选择来自研究受治疗者的血液样品和医学信息的收集被进行告知的同意和按照DeclarationofHelsinki的伦理审查委员会(ethicalreviewboard)批准。:乳腺癌诊断的记录从IcelandicCancerRegistry(ICR)获得。ICR包含从1955年1月1日在冰岛诊断的侵袭性乳腺肿瘤和导管或小叶癌原位的所有病例。具有进入ICR的诊断直到2006年12月末的冰岛所有活着的流行病例适合参与所述研究。ICR包含这个期间诊断的4785名个体的记录。同意、样品和成功的基因型从大约2277个患者获得。其中,基因型对于1791个患者从111咖inaHap300芯片获得,而对于486个患者从Centaurus分析获得。26,199个冰岛对照由选自在deC0DE正在进行的基于Illumina的基因组范围的关联研究的个体组成。在ICR中具有乳腺癌的诊断的个体被排除。男性和女性均被包括。在冰岛对照(以及下面描述的外来复制对照组)中,在表6列出的SNP的频率中性别之间没有显著差异。因此,我们认为这些对照组在研究中提供了SNP的群体频率的合理代表。西班牙:西班牙研究患者在2006年3月与2007年8月之间从OncologyD印artmentofZaragozaHospital被募集。基因型测定(genotyping)在大约642个患者上满意地进行。1540个成功测定基因型的对照已经因为疾病而不是癌症加入了Zaragoza的UniversityHospital。对照在抽取血液样品前被询问以排除先前的癌症。所有的患者和对照是欧洲人种族。:瑞典样品组由家族和连续患者系列组成。家族乳腺癌募集组由347名乳腺癌患者组成,其已经涉及到KarolinskaUniversityHospital,Stockholm的癌基因建议门诊以进行乳腺癌的家族史的调查。每个患者来自不同的家族。符合对于BRCA突变筛查的目前标准的所有病例已经测试是阴性的。连续乳腺癌募集组包括482名连续募集的患者,其从1998年10月至lj2000年5月在D印artmentsof0ncologyatHuddingeandS6deritospitals(覆盖南斯德哥尔摩的群体)被手术处理原发侵袭性乳腺癌。家族史在募集的患者的选择中没有被考虑。对照是1302名献血者和448名两个性别的无癌个体。所有的对照在KarolinskaUniversityHospital,Stockholm被收集。对于测试的SNP中的121任何一个均没有家族和连续系列之间的显著异质性的证据。:在2005-2006期间诊断有乳腺癌的女性患者从由ComprehensiveCancerCentreEastinNijmegen,theNetherlands进行的地区癌症登记处选择。该癌症中心保持基于群体的癌症登记并覆盖荷兰东部,具有1.3百万居民的区域。70岁前诊断有乳腺癌的所有患者被邀请参与所述研究。ComprehensiveCancerCentreEast从癌症登记处的所有患者收集临床和病理数据。这些标准癌症登记数据通过从治疗患者的医院中的医疗文件提取而补充更详细的数据。对照在2002-2003中的调查中由RadboudUniversityNijmegenMedicalCenter收集。这个调查,NijmegenBiomedicalStudy,是基于Nijmegen的群体的年龄-分层的随机样品。来自这个组的2034个对照个体,通过与患者群体的频率的年龄-匹配,被选择并测定基因型。美国多种族组多种族群组研究(MultiethnicCohortstudy)(MEC)由夏威夷和洛杉矶的超过215,000名男性和女性组成(还有另外的来自加利福尼亚其他地方的非洲-美国人)。所述组主要包括非洲美国人、当地夏威夷人、日本美国人、拉丁美洲人和欧洲美国人,其在1993年和1996年之间通过完成26页的自我-管理的调查表进入所述研究,所述调查表询问关于饮食习惯、人口统计因素、个人行为、先前医疗状况的历史、常见癌症的家族史、以及对于女人的生产史和外源激素使用的详细的信息。参与者登记年龄在45岁与75岁之间。MEC中的偶发癌症通过与覆盖夏威夷和洛杉矶地区的基于群体的癌症监督、流行病学和最终结果(Surveillance,EpidemiologyandEndResults)(SEER)登记处和覆盖所有加利福尼亚的加利福尼亚州癌症登记处的组连锁(cohortlinkage)来鉴定。开始于1994年,血液样品从偶发乳腺癌病例和MEC参与者的随机样品收集以用作组中遗传分析的对照池。巢式乳腺癌病例_对照研究中的合适的病例由到2002年12月31日加入MEC中后诊断的具有偶发侵袭性癌症的女性组成。对照是在进入所述组前没有乳腺癌并直到2002年12月31日没有诊断的参与者。对照基于种族/性别和年龄(在5年间隔内)与病例是频率匹配的。尼日利亚:我们从来自尼日利亚伊巴丹的689个偶发乳腺癌病例和469个对照获得基因型。病例在呈递中被连续募集并随后在D印artmentsofSurgeryandRadiotherapy,UniversityCollegeHospital,Ibadan,Nigeria中被组织学石角认。这个医院供应3百万人的服务范围并且是所述区中其他医院的肿瘤学分派中心。基于群体的对照从邻近所述医院的社区随机募集。在社区会诊过程后,对照受治疗者被邀请参加为所述研究目的设立的诊所。对照是募集时无癌的并超过18岁。基因型测定大约1791个冰岛患者和26199个对照在IlluminaH即300SNP阵列上被测定基因型,如先前所描述的[Stacey,etal.,(2007),NatGenet39:865-9]。所有其他基因型测定利用NanongenCentaurus分析进行[Kutyavin,etal.,(2006),NucleicAcidsRes,34,el28],其被产生用于SNP,在表7中示出。引物序列函索获得。CentaurusSNP分析通过基因型测定H即M即CEU样品以及比较所述基因型与公开的数据来证实。如果它们显示与H即M即数据>1.5%的错配,则分析被拒绝。大约10%的冰岛病例样品在Illumina和Nanogen平台上被基因型测定,并且观察到的错配率低于0.5%。所有的基因型测定在deCODEGenetics设备上进行。所有的物理坐标根据NCBIBuild35给出。临床参数雌激素和孕酮受体状况来自在医疗档案中报道的免疫组织化学或免疫试验(免疫分析)结果。>10fmol/mg的受体水平或^10%阳性细胞核的免疫组织化学观察被认为是阳性的。根据AmericanjointCommitteeonCancer,6thEdition确定阶段。组织亚型从如下的SNOMED-M(或相当的ICD0)编码来确定"侵袭性导管癌"8500/3,8521/3;"DCIS"(导管癌原位和相关原位癌)8500/2,8050/2,8201/2,8501/2,8503/2,8507/2,8522/2;"侵袭性小叶癌":8520/3;"LCIS"(小叶癌):8520/2;"导管或Mucinous":8211/3,8480/3,8481/3;"髓样癌"8510/3,8512/3;"混合侵袭性"8522/3,8523/3,8524/3,8541/3,8543/3;"其他侵袭性":8050/3,8141/3,8200/3,8260/3,8323/3,8401/3,8490/3,8501/3,8503/3,8504/3,8530/3,8540/3。具有下面的非特异性编码的肿瘤从组织病理类型的分析中被排除8000/3,8010/2,8010/3,8010/6,8020/3,8140/2,8140/3,8230/3。组织级别根据Nottingham(Elston-EllismodificationoftheScarff_Bloom_Richardson)系统被指定。结节状况被分析用于阶段1到IIIB,并基于通过腋窝淋巴结解剖法和/或前哨淋巴结活组织检查获得的病例分级。SwedenFamilal样品组没有用在临床参数的分析中。统计分析我们计算对于每个SNP等位基因的0R,假定乘法模型;S卩,假定个人携带的两个等位基因的相对风险相乘。对于标记物等位基因频率和OR被示出。相关的P值用标准似然比x2统计量计算,如在NEMO软件包中实施的(GretarsdottirS.,etal.,Nat.Genet.35:131-38(2003))。置信区间被计算,假定OR的估计具有对数_正态分布。对于在强LD中的SNP,无论何时一个SNP的基因型从个体缺失,相关的SNP的基因型用于通过如先前所述的似然方法归因(impute)基因型(GretarsdottirS.,etal.,Nat.Genet.35:131-38(2003))。这确保对于不同SNP呈现的结果是基于相同数量的个体,允许OR和P_值的有意义的比较。多病例-对照复制组的联合分析利用Mantel-Haenszel模型进行,其中所述组被允许对于等位基因或基因型具有不同的群体频率但是被假定具有相同的相对风险。通过假定等位基因频率在零假设下在所有组中相同,但是每个组在备选假设下具有不同的等位基因频率来进行异质性的测试。病例的多个组的联合分析利用扩展的Mantel-Haenszel模型进行,其对应于利用组指征(组指示符,groupindicator)作为共变量的多分类有序反应变量logistic回归(polytomouslogisticregression)。对于领lj试的SNP中的任何一个均没有复制样品组之间异质性的证据。诊断中风险变异体与年龄的关联和与组织学级别的关联通过参数值与每个个体携带的风险等位基因的拷贝数之间的线性回归来测试。为了分析家族史,我们对于每个基因型通过改编我们先前描述的方法(AmundadottirL.T.,etal.,PLoSMed.1:e65(2004))以适应基因型_特异性家族相对风险(gfRRgt)来计算对于一级亲属的家族相对风险。对于每个SNP基因型,我们测定gfRRgt为123其中r为具有基因型gt的乳腺癌患者的一级亲属的数量(计数乘以倍数那些个体,所述个体与超过一个具有基因型gt的患者相关),而a是具有基因型gt的乳腺癌患者的一级亲属的数量,其本身受乳腺癌影响。在分母中,n为群体的大小,而x为受疾病影响的群体中人的数量(来自ICR记录)。为了比较一个基因型的观察到的gfRRgt与另一个,我们计算了比率gfRR^/gfRR^。这些后面的比率的显著性通过模拟来确定对于每个gfRRgt的对照组从对于所讨论的SNP基因型测定的乳腺癌患者的组随机抽取。对照组是与每个相应的观察到的gfRRgt组相同的大小,并在IcelandicGenealogicalDatabase中列出的双亲的数量上是匹配的(0、1或2)。计算对照组gfRRgtl/gfRRgt2比率的一万个重复倍,并且P值通过计数对于对照组的比率每隔多久匹配或超出观察的gfRRgtl/gfRRgt2来确定。我们通过假定Hardy-Weinber平衡,估计群体中的基因型频率来计算基因型特异的0R。没有观察到显著的与多重性(multiplicity)的偏差。基因座之间的潜在相互作用利用等位基因计数的相关性检验和通过携带者和非携带者的病例-对照关联来检验。没有观察到显著的相互作用。—些冰岛患者和对照彼此相关,在组内和组之间,造成x2统计量具有>1的平均值。我们通过冰岛人系谱通过模拟基因型估计膨胀因子(inflationfactor),如先前描述的(GrantS.F.,etal.,NatGenet38:320-3(2006)),并由此校正对于冰岛OR的x2统计量。估计的膨胀因子对于冰岛人的完整组(病例和对照)是1.08,而对于用在临床表型分析中的所有其他亚组较小,但是^1。表6.5pl2和10q26基因座中SNP与对于乳腺癌的风险的关联<table>tableseeoriginaldocumentpage125</column></row><table>数量_频率位置SNP等位基因样品组病例对照病例对照0Ra95。/oCIP*a等位基因Odd比在乘法模型下计算。V斤有的P值是双侧的并已经被调整用于水岛病例和对照的相关性和其他潜在分层。e水岛凄t据一皮组合Illumina和Centaurus分片斤-来源的复制数据组。d为了对于"非水岛人"、"所有样品,,和ER组的组合的数据的分析,OR和P4直利用Mantel-Haenszel方法计算,并且频率作为个体组的频率的筒单(算术)方式。eCGEMS数据仅为了比较目的被显示并且不包括在任何计算中。10q26rs121恥482270<table>tableseeoriginaldocumentpage126</column></row><table><table>tableseeoriginaldocumentpage127</column></row><table><table>tableseeoriginaldocumentpage128</column></row><table><table>tableseeoriginaldocumentpage129</column></row><table><table>tableseeoriginaldocumentpage130</column></row><table><table>tableseeoriginaldocumentpage131</column></row><table><table>tableseeoriginaldocumentpage132</column></row><table><table>tableseeoriginaldocumentpage133</column></row><table><table>tableseeoriginaldocumentpage134</column></row><table><table>tableseeoriginaldocumentpage135</column></row><table><table>tableseeoriginaldocumentpage136</column></row><table><table>tableseeoriginaldocumentpage137</column></row><table><table>tableseeoriginaldocumentpage138</column></row><table><table>tableseeoriginaldocumentpage139</column></row><table><table>tableseeoriginaldocumentpage140</column></row><table><table>tableseeoriginaldocumentpage141</column></row><table><table>tableseeoriginaldocumentpage142</column></row><table><table>tableseeoriginaldocumentpage143</column></row><table><table>tableseeoriginaldocumentpage144</column></row><table>表12.用于标记物rs4415084的代理标记物。选择与HapMapCEU数据组(http:〃www.hapmap.org)中的rs4415084具有大于0.2的r2值、lMb间隔,在所述标记物侧翼的标记物。示出的是相关SNP的名称、与rs4415084的r2和D'值、和相应的P值、以及代理标记物在NCBIBuild36中的位置和包含对于所述标记物的侧翼序列的序列id的参考。<table>tableseeoriginaldocumentpage145</column></row><table><table>tableseeoriginaldocumentpage146</column></row><table><table>tableseeoriginaldocumentpage147</column></row><table><table>tableseeoriginaldocumentpage148</column></row><table><table>tableseeoriginaldocumentpage149</column></row><table><table>tableseeoriginaldocumentpage150</column></row><table><table>tableseeoriginaldocumentpage151</column></row><table><table>tableseeoriginaldocumentpage152</column></row><table><table>tableseeoriginaldocumentpage153</column></row><table><table>tableseeoriginaldocumentpage154</column></row><table><table>tableseeoriginaldocumentpage155</column></row><table><table>tableseeoriginaldocumentpage156</column></row><table><table>tableseeoriginaldocumentpage157</column></row><table><table>tableseeoriginaldocumentpage158</column></row><table><table>tableseeoriginaldocumentpage159</column></row><table><table>tableseeoriginaldocumentpage160</column></row><table><table>tableseeoriginaldocumentpage161</column></row><table><table>tableseeoriginaldocumentpage162</column></row><table>发现SNP相关SNPR2D,P-值在Bld36中的位置SEQIDNO:rsl0941679rsl00440960.8372220.41.49E-1144963122150rsl0941679rsl00415180.8415730.4348942.26E-1244963163151rsl0941679rsl25176900.8415730.4348942.26E-1244975050152rsl0941679rs68752870.8332880.4199683.75E-1144977387153rsl0941679rsll9588080.8372220.41.49E-1144980847154rsl0941679rs20679800.7670840.3047484.34E-0845018074160rsl0941679rsll9481860.6345930.2665431.36E-0745087191171rsl0941679rsl31834340.6854810.2433589.99E-0745110390175rsl0941679rsl00515920.6345930.2665431.36E-0745126063177表14.用于标记物rsl219648的代理SNP标记物。选择与HapM即CEU数据组(http:〃丽w.h即map.org)中的rsl219648具有大于0.2的r2值、lMb间隔,在所述标记物侧翼的标记物。示出的是相关SNP的名称、与rs1219648的一和D'值、和相应的P值、以及代理标记物在NCBIBuild36中的位置和包含对于所述标记物的侧翼序列的序列id的参考。发现SNP相关SNPR2D'P-值在Bld36中的位置SEQIDNO:rsl219648rs375081710.4878055.60E-18123322567220rsl219648rsll20001410.9643929.67E-33123324920221rsl219648rs291278010.9654182.47E-34123327107222rsl219648rs298157910.9654182.47E-34123327325223rsl219648rsl07880610.9663873.53E-35123328965224163<table>tableseeoriginaldocumentpage164</column></row><table>权利要求一种用于确定人类个体中对乳腺癌的易感性的方法,包括确定至少一个多态标记物的至少一个等位基因是否存在于从所述个体获得的核酸样品中或存在于来自所述个体的基因型数据组中,其中所述至少一个多态标记物选自rs10941679(SEQIDNO236)、rs4415084(SEQIDNO235)、和rs1219648(SEQIDNO237)、以及在与其连锁不平衡中的标记物,并且其中所述至少一个等位基因的存在指示所述个体对乳腺癌的易感性。2.根据权利要求1所述的方法,其中,所述至少一个多态标记物选自表12、表13和表14中列出的标记物。3.根据权利要求1或权利要求2所述的方法,其中,所述至少一个多态标记物选自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237)。4.根据前述权利要求中任一项所述的方法,进一步包括评估所述个体中至少一个单体型的频率。5.根据前述权利要求中任一项所述的方法,其中,由所述至少一个等位基因或单体型的存在提供的所述易感性是增加的易感性。6.根据权利要求6所述的方法,其中,所述rs4415084(SEQIDNO:235)中等位基因T、rsl0941679(SEQIDNO:236)中等位基因G和/或rsl219648(SEQIDNO:237)中等位基因G的存在指示所述个体中对乳腺癌增加的易感性。7.根据权利要求5或6所述的方法,其中,所述至少一个等位基因或单体型的存在指示具有至少1.15的相对风险(RR)或优势比(OR)的对乳腺癌的增加的易感性。8.根据权利要求5或6所述的方法,其中,所述至少一个等位基因或单体型的存在指示具有至少1.16,包括至少1.17、至少1.18、至少1.19、至少1.20、至少1.21、至少1.22、至少1.23、至少1.24、至少1.25、至少1.26、至少1.27、至少1.28、至少1.29和至少1.30的相对风险(RR)或优势比(OR)的增加的易感性。9.根据权利要求1-4中任一项所述的方法,其中,由所述至少一个等位基因或单体型的存在提供的所述易感性是降低的易感性。10.根据前述权利要求中任一项所述的方法,进一步包括确定不与表12、表13和表14中列出的所述标记物中的任何一个连锁不平衡的对于乳腺癌的至少一个风险中的变异体的至少一个风险中的等位基因是否存在于包含来自人类个体的基因组DNA的样品中或存在于来自人类个体的基因型数据组中。11.根据权利要求1-9中任一项所述的方法,包括确定在至少两个多态标记物的每一个中的至少一个等位基因是否存在于包含来自人类个体的基因组DNA的样品中或存在于来自人类个体的基因型数据组中,其中在所述至少两个多态标记物中的所述至少一个等位基因的存在指示对乳腺癌增加的易感性。12.根据前述权利要求中任一项所述的方法,进一步包括确定对于乳腺癌的至少一个高外显遗传因子在从所述个体获得的核酸样品中或来自所述个体的基因型数据组中的存在或缺乏的步骤。13.根据权利要求12所述的方法,其中,所述高外显遗传因子是在BRCA1、BRCA2、TP53和/或PTEN中的突变。14.根据前述权利要求中任一项所述的方法,进一步包括分析非遗传信息以进行所述个体的风险评估、诊断、或预后。15.根据权利要求14所述的方法,其中,所述非遗传信息选自年龄、性另ij、种族、社会经济状态、先前疾病诊断、受治疗者的医疗史、乳腺癌的家族史、生物化学测量、以及临床测16.根据权利要求11-15中任一项所述的方法,进一步包括计算组合的风险。17.—种确定在先前诊断有乳腺癌的个体中至少发展第二原发肿瘤的风险的方法,所述方法包括确定至少一个多态标记物的至少一个等位基因是否存在于从所述个体获得的核酸样品中,或存在于来自所述个体的基因型数据组中,其中所述至少一个多态标记物选自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237)、以及在与其连锁不平衡中的标记物,并且其中所述至少一个等位基因的存在指示至少发展第二原发肿瘤的风险。18.根据权利要求17所述的方法,其中,所述至少一个多态标记物选自表12、表13和表14中列出的所述标记物。19.一种用于评估人类个体中对乳腺癌的易感性的试剂盒,所述试剂盒包括用于选择性检测所述个体的基因组中至少一个多态标记物的至少一个等位基因的试剂,其中所述多态标记物选自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDN0:235)、和rsl219648(SEQIDNO:237)、以及在与其连锁不平衡中的标记物,并且其中所述至少一个等位基因的存在指示对乳腺癌的易感性。20.根据权利要求19所述的试剂盒,其中,所述至少一个多态标记物选自表12、表13和表14中列出的所述标记物。21.根据权利要求19或权利要求20所述的试剂盒,其中,所述试剂包括杂交到包括所述至少一个多态标记物的所述个体的基因组的片段的至少一个连续寡核苷酸、缓冲剂以及可检测的标记。22.根据权利要求19-21中任一项所述的试剂盒,其中,所述试剂包括杂交到从所述受治疗者获得的基因组核酸区段的相反链的至少一对寡核苷酸,其中每个寡核苷酸引物对被设计成选择性地扩增包括一个多态标记物的所述个体的基因组的片段,并且其中所述片段的大小为至少30个碱基对。23.根据权利要求21或权利要求22所述的试剂盒,其中,所述至少一个寡核苷酸完全互补于所述个体的所述基因组。24.根据权利要求19-23中任一项所述的试剂盒,其中,所述试剂盒包括a.长度为5-100个核苷酸的检测寡核苷酸探针;b.长度为5-100个核苷酸的增强子寡核苷酸探针;以及c.核酸内切酶;其中所述检测寡核苷酸探针特异性杂交到其核苷酸序列在SEQIDNO:1-237的任何一个中列出的所述核酸的第一区段,并且其中所述检测寡核苷酸探针包括在其3'末端的可检测的标记和在其5'末端的猝灭部分;其中所述增强子寡核苷酸的长度为5-100个核苷酸并互补于相对于所述寡核苷酸探针为5'的所述核苷酸序列的第二区段,使得当两个寡核苷酸均杂交到所述核酸时,所述增强子寡核苷酸相对于所述检测寡核苷酸探针位于3';其中单一碱基间隙存在于所述第一区段与所述第二区段之间,使得当所述寡核苷酸探针和所述增强子寡核苷酸探针均杂交到所述核酸时,单一碱基间隙存在于所述寡核苷酸之间;以及其中在所述检测探针杂交到所述核酸时,用所述核酸内切酶处理所述核酸将从所述检测探针的3'末端剪切所述可检测的标记以释放游离的可检测的标记。25.—种用于确定人类个体中对于乳腺癌的遗传指征的装置,包括计算机可读存储器;以及存储在所述计算机可读存储器上的程序;其中所述程序适于在处理器上被执行以分析对于至少一个人类个体关于至少一个多态标记物的标记物和/或单体型信息,所述至少一个多态标记物选自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237),以及与在其连锁不平衡中的标记物,并产生基于所述标记物或单体型信息的输出,其中所述输出包括作为对于所述人类个体的乳腺癌的遗传指征的所述至少一个标记物或单体型的个体风险测量。26.根据权利要求25所述的装置,其中,所述程序进一步包括与所述至少一个标记物等位基因和/或单体型相关的乳腺癌的风险测量,其中所述风险测量基于多个诊断有乳腺癌的个体中至少一个多态标记物的至少一个等位基因和/或单体型的频率与多个参考个体中至少一个多态标记物的至少一个等位基因和/或单体型的频率的指征的比较,并且其中对于所述人类个体的个体风险是基于所述个体对于所述至少一个标记物等位基因和/或单体型的携带者状态与对于所述至少一个标记物等位基因和/或单体型的所述风险测量的比较。27.根据权利要求25或26所述的装置,其中,所述至少一个多态标记物选自表12、表13和表14中列出的所述标记物。28.—种用于评估对乳腺癌的易感性的标记物的鉴定方法,所述方法包括a.鉴定在与rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237)中的至少一个连锁不平衡中的至少一个多态标记物;b.确定诊断有乳腺癌或具有对乳腺癌的易感性的个体的样品的基因型状态;以及c.确定对照个体的样品的所述基因型状态;其中与所述对照样品中所述至少一个等位基因的所述频率相比,诊断有乳腺癌或具有对乳腺癌的易感性的个体中至少一个多态性中至少一个等位基因的频率的显著差异指示被用于评估对乳腺癌的易感性的所述至少一个多态性。29.根据权利要求28所述的方法,其中,与所述对照样品中所述至少一个等位基因的频率相比,诊断有乳腺癌或具有对乳腺癌的易感性的个体中的所述至少一个多态性中所述至少一个等位基因频率的增加指示被用于评估对乳腺癌的增加的易感性的所述至少一个多态性。30.根据权利要求28或权利要求29所述的方法,其中,与所述对照样品中所述至少一个等位基因的频率相比,诊断有乳腺癌或具有对乳腺癌的易感性的个体中所述至少一个多态性中所述至少一个等位基因的频率降低指示用于评估对乳腺癌的降低的易感性或针对乳腺癌的保护的所述至少一个多态性。31.—种对从人类个体获得的核酸样品进行基因型测定的方法,包括确定至少一个多态标记物的至少一个等位基因是否存在于来自所述个体样品的核酸样品中,其中所述至少一个标记物选自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDN0:235)、和rsl219648(SEQIDNO:237)、以及在与其连锁不平衡中的标记物,并且其中所述样品中所述至少一个等位基因的存在的确定指示所述个体中对乳腺癌的易感性。32.根据权利要求31所述的方法,其中,rs4415084(SEQIDNO:235)中等位基因T、rsl0941679(SEQIDNO:236)中等位基因G和/或rsl219648(SEQIDNO:237)中等位基因G的存在的确定指示所述个体中乳腺癌的增加的易感性。33.根据权利要求31或32所述的方法,其中,基因型测定包括利用位于所述至少一个多态标记物侧翼的核苷酸引物对,通过聚合酶链反应(PCR)来扩增包括所述至少一个多态标记物的核酸的区段。34.根据权利要求31-33中任一项所述的方法,其中,基因型测定利用选自等位基因-特异性探针杂交、等位基因-特异性引物延伸、等位基因-特异性扩增、核酸测序、5'-核酸外切酶消化、分子标志分析、寡核苷酸连接分析、大小分析、单链构象分析以及微阵列技术的方法来进行。35.根据权利要求34所述的方法,其中,所述方法包括等位基因-特异性探针杂交。36.根据权利要求34所述的方法,其中所述方法是微阵列技术。37.根据权利要求31-35中任一项所述的方法,包括1)在用于所述寡核苷酸探针与所述核酸的特异性杂交的条件下,使所述核酸的拷贝与检测寡核苷酸探针和增强子寡核苷酸探针接触;其中,a)所述检测寡核苷酸探针的长度是5-100个核苷酸并且特异性地杂交到其核苷酸序列由SEQIDNO:1-237中的任一个给出的核酸的第一区段;b)所述检测寡核苷酸探针包括在其3'末端处的可检测的标记和在其5'末端处的猝灭部分;c)所述增强子寡核苷酸的长度是5-100个核苷酸并且互补于相对于所述寡核苷酸探针在5'的所述核苷酸序列的第二区段,使得当两个寡核苷酸杂交到所述核酸时,所述增强子寡核苷酸相对于所述检测寡核苷酸探针位于3';以及d)单一碱基间隙存在于所述第一区段与所述第二区段之间,使得当所述寡核苷酸探针和所述增强子寡核苷酸探针均杂交到所述核酸时,单一碱基间隙存在于所述寡核苷酸之间;2)用核酸内切酶处理所述核酸,当所述检测探针被杂交到所述核酸时,所述核酸内切酶将从所述检测探针的3'末端剪切所述可检测的标记以释放游离的可检测的标记;以及3)测量游离的可检测的标记,其中所述游离的可检测的标记的存在表明所述检测探针特异性杂交到所述核酸的所述第一区段,并表明作为所述检测探针的互补物的所述多态位点的所述序列。38.—种评估个体对乳腺癌治疗剂的反应的可能性的方法,包括确定至少一个多态标记物的至少一个等位基因是否存在于从所述个体获得的核酸样品中或存在于来自所述个体的基因型数据组中,其中所述至少一个多态标记物选自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237),以及在与其连锁不平衡中的标记物,其中所述至少一个标记物的所述至少一个等位基因的存在指示对所述治疗剂的阳性反应的可能性。39.—种预测诊断有乳腺癌的个体的预后的方法,所述方法包括确定至少一个多态标记物的至少一个等位基因是否存在于从所述个体获得的核酸样品中,或存在于来自所述个体的基因型数据组中,其中所述至少一个多态标记物选自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237)、以及在与其连锁不平衡中的标记物,其中所述至少一个等位基因的存在指示所述个体中所述乳腺癌的较坏预后。40.—种监测经历对于乳腺癌的治疗的个体的治疗进展的方法,所述方法包括确定至少一个多态标记物的至少一个等位基因是否存在于从所述个体获得的核酸样品中,或者存在于来自所述个体的基因型数据组中,其中所述至少一个多态标记物选自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237),以及在与其连锁不平衡中的标记物,其中所述至少一个等位基因的存在指示所述个体的治疗结果。41.根据权利要求38-40中任一项所述的方法,其中,所述至少一个多态标记物选自表12、表13和表14中列出的所述标记物。42.寡核苷酸探针在制备用于诊断和/或评估对人类个体中乳腺癌的易感性的试剂中的应用,其中所述探针杂交到具有如在SEQIDNO:1-237的任一个中列出的核苷酸序列的核酸的区段,其中所述探针的长度为15-500个核苷酸。43.—种计算机可读介质,在所述计算机可读介质上储存有a.用于至少一个多态标记物的标识符;b.诊断有乳腺癌的多个个体中所述至少一个多态标记物的至少一个等位基因的频率的指征;以及c.多个参考个体中所述至少一个多态标记物的所述至少一个等位基因的频率的指征;其中,所述至少一个多态标记物选自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237),以及在与其连锁不平衡中的多态标记物。44.根据权利要求43所述的介质,其中,所述多态标记物选自表12、表13和表14中列出的所述标记物。45.根据权利要求43或44所述的介质,进一步包括关于所述多个个体的世系的信息。46.根据前述权利要求中任一项所述的方法、试剂盒、应用、介质或装置,其中,所述至少一个等位基因的存在是雌激素受体阳性或孕酮受体阳性乳腺癌的预兆。47.根据前述权利要求中任一项所述的方法、试剂盒、应用、介质或装置,其中,标记物之间的连锁不平衡的特征在于所述连锁不平衡测量值r2和/或ID'I的特定数值。48.根据前述权利要求中任一项所述的方法、试剂盒、应用、介质或装置,其中,标记物之间的连锁不平衡的特征在于至少0.2的r2值。49.根据前述权利要求中任一项所述的方法、试剂盒、应用、介质或装置,其中,所述人类个体是包括欧洲世系的世系。全文摘要本发明涉及作为乳腺癌的易感性变异体的Chr5p12和Chr10q26上的一些遗传变异体。描述了利用这样的变异体的疾病管理方法,包括诊断对乳腺癌的增加和/或降低的易感性,预测对治疗的反应的方法和预测预后的方法。本发明进一步涉及用在本发明的方法中的试剂盒。文档编号C12Q1/68GK101772578SQ200880100074公开日2010年7月7日申请日期2008年5月21日优先权日2007年5月25日发明者安德烈·马诺列斯库,帕特里克·萨利姆,西蒙·斯塔塞申请人:解码遗传学私营有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1