用于乳腺癌风险评估的遗传变型的制作方法

文档序号:1546010阅读:306来源:国知局
专利名称:用于乳腺癌风险评估的遗传变型的制作方法
用于乳腺癌风险评估的遗传变型引言乳腺癌是迄今为止全世界妇女最常见的癌症。目前全球发病率每年超过 1,151,000 新诊断的病例[Parkin,等人,(2005),CA Cancer J Clin,55,74-108]。乳腺癌发 病在发达国家特别是在北欧人族源(ethnic origin)的人群中最高,并且正日益增加。在美 国,每年年龄标准化的发病率为每100,000人口大约125例,是世界平均水平的3倍以上。 北欧国家的发病率相似地高。在2008年,据估计将在美国诊断出184,450例浸润性乳腺癌 新病例并且 40,930 人将死于该疾病[Jemal,等人,(2008),CA Cancer J Clin,58,71-96]。 必须将该数字加上2008中预计的另外67,770例原位导管癌和小叶原位癌诊断。从个体角 度来看,在美国妇女中发生乳腺癌的终生概率为12. 3% (即,8个妇女中有1个将在其生命 中发生乳腺癌)。与大多数癌症一样,早期检出和适当的治疗是非常重要的因素。总体上, 乳腺癌的5年存活率是89%。然而,在呈现局部浸润性(invasive)或转移性疾病的个体 中,该比率分别下降至 84%和 27% [Jemal,等人,(2008),CA Cancer J Clin,58,71-96]。逐渐地,重点落在了鉴定处于患原发性或复发性乳腺癌的高风险中的个体。此类 个体可利用更密集的筛查、预防性化学疗法、激素疗法和在当个体处于极高风险的情况下 预防性手术来治疗。普查程序对卫生服务造成了巨大的经济负担,然而预防性治疗与风险 度和生活质量后果相关。对乳腺癌的遗传易感性(Genetic Predisposition)两个主要的已知乳腺癌风险因素类别是内分泌因素和遗传因素。关于后者,大约 12%的乳腺癌患者具有一个或多个患乳腺癌的一级亲属K2001),Lancet, 358,1389-99]。 众所周知的显性乳腺癌易感基因BRCAl和BRCA2赋予携带者显著增加的患乳腺癌的风险, 终生外显率估计在40至80%的范围内。BRCAl和BRCA2突变的存在可解释大多数具有6例 或更多例乳腺癌的家族以及解释大部分包括乳腺癌和卵巢癌或男性乳腺癌的家族。然而, 此类家族事实上非常罕见。在具有更少的病例的家族或特征在于只有乳腺癌病家族中发现 BRCAl和BRCA2突变的频率要低得多。结合起来,BRCAl和BRCA2中的突变可解释15-20%的 患家族性乳腺癌的风险。在非祖先个体(non-founder)群体中,如果可检测所有常见BRCA 突变,那么预期2至3%的偶发性乳腺癌患者(incident breast cancer patient)可具有 突变[Gorski,等人,(2005),Breast Cancer Res Treat,92,19-24 ; (2000),Br J Cancer, 83,1301-8]。该低“发现概率(chance to find) ”统计量将BRCA突变测试的可靠使用排 除在具有明显的遗传易感性(hereditary predisposition)的家族之外(Anon[ (2003), J Clin Oncol,21,2397-406])。已知罕见的高外显率突变在TP53和PTEN基因中发生,然 而,这些一起解释不超过5%的患乳腺癌的总遗传风险度[Easton,(1999), Breast Cancer Res, 1,14-7]。连锁研究在鉴定赋予患乳腺癌的高风险度的广泛突变中很大程度上不再成 功[Smith,等人,(2006),Genes Chromosomes Cancer,45,646-55]。最近的流行病学研究已表明大多数乳腺癌病例发生在易患病、易感性的少数群体 中[Antoniou,等人,(2002),Br J Cancer,86,76-83 ;Pharoah,等人,(2002),Nat Genet, 31,33-6]。来自双胞胎研究和原发性乳腺癌存活患者的对侧乳腺中癌症的恒定的高发病率的观察数据表明大部分未表征的患乳腺癌的风险与内源性因素,很可能遗传因素相 失[Lichtenstein,·入,(2000), N Engl J Med, 343, 78-85 ;Peto andMack, (2000), Nat Genet二6,411-4]。支持该广泛的风险遗传因素的知识极为有限。分离分析预测未表征的患 乳腺癌的遗传风险在本质上很可能是多基因的,因为风险性等位基因赋予低至中度的风险 并且可以彼此之间以及与激素风险因子相互作用。然而,此类研究预测多达40倍的可通过 捕获此类低至中度的风险性等位基因的遗传特征(geneticprofiling)确定的最高分布分 位数与最低分布分位数之间的相对风险度的差异[Antoniou,等人,(2002),Br J Cancer, 86,76-83 ;Pharoah,等人,(2002),Nat Genet,31,33-6]。预期 88% 的所有乳腺癌病例在易 感染的50%的群体中发生并且12%的处于最高风险的群体占据了 50%的所有乳腺癌病例 [Pharoah,等人,(2002),Nat Genet, 31, 33-6 ;Pharoah, (2003),Recent Results Cancer Res, 163,7-18 ;discussion264-6]。因此许多精力集中在鉴定此类具有遗传易感性的个体 和发展针对他们的个性化医学管理策略。我们和其他研究小组已证明在冰岛存在显著的乳腺癌的家族风险性,其扩展至至 少第五级亲属[Amundadottir,等人,(2004),PLoS Med, 1, e65 ;Tulinius,等人,(2002),J Med Genet,39,457-62]。在冰岛,BRCAl突变对家族风险性的贡献被认为是最小的[Arason, 等人,(1998),J Med Genet,35,446-9 ;Bergthorsson,等人,(1998),Hum Mutat,Suppl 1, S195-7]。BRCA2基因中的单个祖先个体突变(founder mutation) (999del5)在普通冰岛 人群中以0. 6-0. 8%的携带者频率和在女性乳腺癌患者中以7. 7-8. 6%的携带者频率存在 [Thorlacius,等人,(1997),Am J Hum Genet,60,1079-84 ;Gudmundsson,等人,(1996) ,Am J Hum Genet, 58,749-56]。该单个突变估计可解释针对一至三级亲属的大约40%的遗传性乳 腺癌风险[Tulinius,等人,(2002), J Med Genet,39,457-62]。虽然该估计高于 15-25% 的 归因于非祖先个体群体中组合的所有BRCA 1和2突变的家族风险性,但仍然有大约60%的 冰岛人家族乳腺癌风险有待解释。BRCA2 999del5测试为阴性的患者的一级亲属保持1.72 倍的患乳腺癌的群体风险(95% CI 1. 49-1. 96) [Tulinius,等人,(2002),JMed Genet,39, 457-62]。遗传风险由人群中个体间基因组中的细微差异赋予。人基因组中的变异最频繁地 由单核苷酸多态型(SNP)引起,虽然其它变异也是非常重要的。在人基因组中平均每1000 个碱基对存在一个SNP。因此,包含250,000个碱基对的典型人基因可包含250个不同的 SNP。只有少数SNP位于外显子中并且改变由该基因编码的蛋白质的氨基酸序列。大多数 SNP对基因功能可能几乎没有影响或没有影响,然而其它SNP可改变由基因编码的mRNA的 转录、剪接、翻译或稳定性。人基因组中的另外的遗传多态型是由DNA的短区段或长区段的 插入、缺失、易位或倒位引起的。赋予患疾病风险的遗传多态型可直接改变蛋白质的氨基酸 序列,可增加从基因产生的蛋白质的量,或可减少由基因产生的蛋白质的量。随着赋予患常见疾病风险的遗传多态型被发现,此类风险因素的遗传检测对于临 床医学变得日益重要。实例是鉴定痴呆患者中apoE4多态型的基因携带者以进行阿尔茨 海默病的鉴别诊断的载脂蛋白E测试、和对深部静脉血栓形成的易感性的因子V的Leiden 测试。更重要地,在癌症的治疗中,肿瘤细胞的遗传变型的诊断对于个体患者的最适当治疗 方案的选择是有用的。在乳腺癌中,雌激素受体表达或神经生长因子2型(Herf)受体酪氨 酸激酶表达的遗传变异决定是否要将抗雌激素药(他莫昔芬)或抗Her2抗体(赫赛汀)整合入治疗方案。在慢性髓样白血病(CML)中,融合编码Bcr和Abl受体酪氨酸激酶的基 因的费城染色体基因易位(genetic translocation)的诊断表明应当将Gleevec (STI571) (Bcr-Abl激酶的特异性抑制剂)用于治疗癌症。对于具有这样的遗传改变的CML患者, Bcr-Abl激酶的抑制导致肿瘤细胞的快速消除和白血病缓解。此外,遗传检测服务现今是可 获得的,从而为个体提供关于他们的患疾病风险的信息(基于特定SNP已与患许多常见疾 病的风险关联的发现)。对引起患乳腺癌的残余遗传风险的遗传因素的了解非常有限。2个基因的变体 已被严格地证实为低外显率乳腺癌风险基因;CHEK2和ATM[Renwick,等人,Q006),Nat Genet,38,873-5 ; (2004),Am J HumGenet, 74,1175-82] 此外,最近的报导建立 了染色 体2q35和16ql2上的变体与增加的患雌激素受体阳性乳腺癌的风险之间的关联(Simon, SN.等人 Nat Genet 39 865-9 (2007)) 此夕卜,已报导了 FGFR2、TNRC9、MAP3K1 和 LSPl 基因(Easton,D. F.,等人Nature 447 :1087-93(2007))以及FGFR2基因中或其附近的 变体(Hunter,D. J.,et al Nat Genet39 :870-4 (2007)) 许多其他基因已被涉及,然而 它们对乳腺癌风险的贡献在使用很大的样品组的分析中还未得到验证[Breast Cancer Association, (2006), J Natl Cancer Inst,98,1382-96]。用于预防或治疗乳腺癌的通用成功方法目前是不可获得的。乳腺癌的治疗目前依 赖于一级预防、早期诊断、适当的治疗和二级预防的组合。存在将基因测定整合入这些管理 领域的所有方面的明确的临床紧迫性。癌症易感性基因的鉴定还可揭示可进行操作(例 如,使用小或大分子量的药物)并且可带来更有效的治疗的至关重要的分子途径。本发明 提供了针对乳腺癌的另外的遗传变型,可将其整合在乳腺癌的预防程序中。发明概述本发明涉及评估对乳腺癌的易感性的方法。本发明包括通过评估某些已经发现与 增加的或减少的患乳腺癌的易感性关联的标志或单倍型,诊断增加的对乳腺癌的易感性的 方法以及诊断减少的对乳腺癌的易感性或诊断抗癌保护作用的方法。本发明还涉及评估经 诊断患有乳腺癌的个体的预后的方法、评估对乳腺癌治疗剂或乳腺癌治疗的反应可能性的 方法以及监控经诊断患有乳腺癌的个体的治疗进展的方法。在一个方面,本发明涉及诊断人个体中对乳腺癌的易感性的方法,所述方法 包括测定至少一个多态型标志的至少一个等位基因在获自个体的核酸样品中存在或 不存在,所述多态型标志选自下组rs999737(SEQ ID NO :6)、rs2005154 (SEQ ID NO: 1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、 rsl2291026(SEQID NO :5)、rs9956546(SEQ ID NO :7)、rsl1912922(SEQ ID NO :8)、 rs6001954(SEQ ID NO :9)和与它们处于连锁不平衡中的标志,其中至少一个等位基因的 存在标示着对乳腺癌的易感性。本发明还涉及通过测定至少一个多态型的至少一个等位 基因在获自个体的核酸品中的存在或不存在来测定对乳腺癌的易感性的方法,所述多态型 标志选自下组rs2005154(SEQ ID NO 1)、rs2184380 (SEQ ID NO :2)、rs2224696 (SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026 (SEQ ID NO :5)、rs999737 (SEQ ID NO :6)、 rs9956546(SEQ ID NO :7)、rsll912922 (SEQID NO :8)、rs6001954 (SEQ ID NO :9)和与它 们处于连锁不平衡中的标志,其中至少一个等位基因的存在的确定标示着对乳腺癌的易感 性。
在另一个方面,本发明涉及测定人个体中对乳腺癌的易感性的方法,所述方法 包括测定至少一个多态型标志上的至少一个有风险的等位基因是否存在于来源于该 个体的基因型数据集中,其中至少一个多态型标志选自下组rs20051M(SEQ ID NO: 1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503 (SEQ ID NO: 4)、rsl2291026(SEQID NO :5)、rs999737(SEQ ID NO :6)、rs9956546(SEQ ID NO :7)、 rsll912922(SEQ ID NO :8)、rs6001954(SEQ ID NO :9)和与它们处于连锁不平衡中的标志, 并且其中至少一个有风险的等位基因的存在的确定标示着该个体中增加的对乳腺癌的易 感性。本发明是还涉及测定人个体中对乳腺癌的易感性的方法,其包括确定至少一 个多态型标志的至少一个等位基因是否存在于获自该个体的核酸样品中或来源于该 个体的基因型数据集中,其中所述至少一个多态型标志选自rs2005154(SEQ ID NO 1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、 rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、rs9956546(SEQ ID NO :7)、 rsll912922(SEQID NO :8)、rs6001954(SEQ ID NO :9)和与它们处于连锁不平衡中的标志, 并且其中所述至少一个等位基因的存在标示着个体中对乳腺癌的易感性。在一个实施方案中,基因型数据集包括关于标志本体和个体的等位基因状态的信 息,即关于由个体携带的所述标志的2个等位基因的本体的信息。基因型数据集可包括关 于一个或多个标志(包括2个或更多个标志、3个或更多个标志、5个或更多个标志、100个 或更多个标志等)的等位基因信息。在一些实施方案中,基因型数据集包括来自个体的全 基因组评估(可包括数十万个标志或甚至1百万个或更多个标志)的基因型信息。在某些实施方案中,所述至少一个多态型标志与PAX5(成对基因盒5,也称为 BSAP)基因、TUB (Tubby同源物(小鼠,rd5))基因、SERPINH1 (丝氨酸蛋白酶抑制剂、 clade H(热激蛋白47)、成员1(胶原结合蛋白1))基因、RAD51L1(REC2 ;R51H2 ;hREC2 ; RAD51B ;MGC34245)基因、FH0D3 (含形成素同源性2域3,也称为FH0S2 ;Formactin2)基因 或TNRC6B (含三核苷酸串联重复的6B或KIAA1093)基因中的任意一个关联。在某些此类实施方案中,至少一个多态型标志与上述基因的任意一个即PAX5(成 对基因盒5,也称为BSAP)基因、TUB (Tubby同源物(小鼠,rd5))基因、SERPINH1 (丝氨酸 蛋白酶抑制剂,clade H(热激蛋白47),成员1,(胶原结合蛋白1))基因、RAD51L1 (REC2 ; R51H2 ;hREC2 ;RAD51B ;MGC34245)基因、FH0D3 (含形成素同源性 2 域 3,也称为 FH0S2 ; Formactin2)基因禾口 TNRC6B (含三核昔酸重复序列 6B (trinucleotide repeat containing 6B)或KIAA1093)基因的任意一个处于连锁不平衡中。本发明的另一个方面涉及测定人个体中对乳腺癌的易感性的方法,所述方法包 括获得关于人个体的核酸序列数据,鉴定至少一个多态型标志的至少一个等位基 因,所述标志选自 rs2005154(SEQ ID NO 1)、rs2184380 (SEQID NO :2)、rs2224696 (SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、 rs9956546 (SEQID NO :7)、rsl 1912922 (SEQ ID NO :8)、rs6001954 (SEQ ID NO :9)和与它们 处于连锁不平衡的标志,其中所述至少一个多态型标志的不同等位基因与人中对乳腺癌的 不同易感性关联,和根据核酸序列数据测定对乳腺癌的易感性。
在一般意义上,遗传标志在核酸水平上导致替代序列(alternate sequence) 0如 果核酸标志改变由核酸编码的多肽的密码子,那么该标志也将在氨基酸水平上导致所编码 的多肽(多肽标志)的替代序列。核酸中的多态型标志上的特定等位基因或多肽标志上的 特定等位基因的本体的测定包括特定等位基因是否存在于序列的特定位置上。鉴定标志上 的特定等位基因的序列数据包括足以检测所述特定等位基因的序列。对于本文中描述的单 核苷酸多态型(SNP)或氨基酸多态型,序列数据可包括单个位置上的序列,即,序列内单个 位置上的核苷酸或氨基酸的本体。鉴定多态型标志的特定等位基因的核酸序列数据有时也 称为基因型数据。可以例如通过分析该个体的生物样品中至少一个多态型标志的序列来获 取核酸序列数据。可选择地,从来自人个体的基因型数据集中可获取核酸序列数据并且分 析数据集中至少一个多态型标志的序列。此类分析在某些实施方案中包括确定特定多态型 标志的特定等位基因的存在或不存在。一般术语中特定等位基因的鉴定应被用来表示进行 等位基因的存在或不存在的确定。通常,通过测定特定多态型的所有可能的等位基因在特 定个体中的存在来进行个体的基因组中两个等位基因拷贝的测定(对于SNP,2个可能的核 苷酸中的每一个对于等位基因位点都是可能的)。还可能确定只有特定的等位基因存在还 是不存在。例如,在某些实施方案中,确定已显示与青光眼的风险关联的某些等位基因的存 在或不存在,但不必确定特定标志的其他等位基因的存在或不存在,基于这样的确定来进 行易感性的测定。在某些实施方案中,就至少2个多态型标志测定核酸序列可能是有用的。在其它 实施方案中,测定至少3个、至少4个或至少5个或更多个多态型标志的核酸序列。单倍型 信息可来源于2个或更多个多态型标志的分析。因此,在某些实施方案中,进行另外的步 骤,通过该步骤基于至少2个多态型标志的序列数据产生单倍型信息。本发明还提供了测定人个体中对乳腺癌的易感性的方法,该方法包括获得关于 人个体的核酸序列数据鉴定至少2个多态型标志和与它们处于连锁不平衡中的标志的 这两个等位基因,所述多态型标志选自rs2005154(SEQ ID NO 1)、rs2184380 (SEQ ID NO :2)、rs2224696(SEQID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO: 5)、rs999737(SEQ ID NO :6)、rs9956546(SEQ ID NO :7)、rsl1912922(SEQID NO :8)、 rs6001954 (SEQ ID NO :9),基于序列数据测定至少一个单倍型的本体,和由单倍型数据测 定对乳腺癌的易感性。在某些实施方案中,易感性的测定包括将核酸序列数据与数据库相比较,所述数 据库包含至少一个多态型标志与对乳腺癌的易感性之间的关联数据。在一些实施方案中, 数据库包括针对至少一个标志的对乳腺癌的易感性的至少一个风险测量。可以例如以查找 表的方式提供序列数据库,所述查找表包含针对任何一个或多个特定多态型标示对乳腺癌 的易感性的数据。所述数据库还可包括针对包含至少2个多态型标志的特定单倍型标示易 感性的数据。获取核酸序列数据可以在某些实施方案中包括获取源自人个体的生物样品和分 析该样品的核酸中的至少一个多态型标志的序列。分析序列可包括确定至少一个多态型标 志的至少一个等位基因是否存在。特定易感性等位基因(例如,有风险的等位基因)的存 在的确定标示着人个体中对乳腺癌的易感性。特定易感性等位基因的不存在的确定标示着 所述特定易感性不存在于个体。
在一些实施方案中,获取核酸序列数据包括从既存记录获取核酸序列信息。所述 既存记录可以例如是包含序列数据的计算机文件或数据库,所述序列数据例如人个体的、 至少一个多态型标志的基因型数据。可将通过本发明的诊断方法测定的易感性报告给特定的实体。在一些实施方案 中,所述至少一个实体选自下组个体、个体的监护人、基因服务提供商、医生、医疗机构和 医疗保险公司。在本发明的某些实施方案中,易感性的测定包括将核酸序列数据与数据库相比 较,所述数据库包含至少一个多态型标志与对乳腺癌的易感性之间的关联数据。在一个这 样的实施方案中,数据库包括针对至少一个多态型标志的对乳腺癌的易感性的至少一个风 险测量。在另一个实施方案中,数据库包括查找表,所述查找表包括针对至少一个多态型标 志的至少一个病症的至少一个风险测量。在某些实施方案中,获取核酸序列数据包括获取源自人个体的生物样品和分析该 样品的核酸中的至少一个多态型标志的序列。分析至少一个多态型标志的序列可包括确定 至少一个多态型标志的至少一个等位基因的存在或不存在。获取核酸序列数据还可包括从 既存记录获取核酸序列信息。本发明的某些实施方案涉及获得关于至少2个多态型标志的核酸序列数据,所 述标志选自 rs2005154(SEQ ID NO 1)、rs2184380 (SEQ IDNO :2)、rs2224696 (SEQ ID NO: 3)、rs2242503(SEQ ID NO 4), rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、 rs9956546(SEQID NO :7)、rsl 1912922 (SEQ ID NO :8)、rs6001954 (SEQ ID NO :9)和与它们 处于连锁不平衡中的标志。在本发明的某些实施方案中,至少一个多态型标志选自表4中所示的标志。在一 个实施方案中,至少一个多态型标志选自SEQ ID NO :1-562中所示的标志。在一个实施方案 中,至少一个标志与 rs2005154,rs2184380,rs2224696,rs2242503,rsl2291026,rs999737, rs9956546, rsll912922和rs6001卯4中的至少一个处于连锁不平衡中。在一个实施方案 中,与rs999737处于连锁不平衡中的标志选自下组rs999737、rsl0134446、rsl0138140、 rsl0146772、rsl0467820、rsl0483812、rsl0483813、rslll58749、rslll58751、rsll621276、 rsll624097、rsll624164、rsll624333、rsll628293、rsll846360、rsll847185、rsll849916、 rsl2878761、rsl2879200、rsl2886864、rsl2889251、rsl2894230、rsl468279、rsl468280、 rsl547012、rsl7105675、rsl7755657、rsl7755734、rsl7755752、rsl7755925、rsl7756000、 rsl7828691、rsl7828721、rsl7828763、rsl7828907、rsl7828955、rsl956534、rs2074563、 rs2074565、 rs2097800、 rs2107340、 rs2145157、 rs2158357、 rs2189517、 rs2253317、 rs2257111、 rs2257116、 rs2257127、 rs2331701、 rs2331705、 rs2331775、 rs2525503、 rs2525530、rs2842327、rs3784121、rs4531674、rs4899246、rs4902604、rs4902606、 rs4902608、rs5004090、rs6573837、rs7140266、rs7146456、rs7153476、rs739874、 rs746663、rs8007194、rs8010439、rs8012610、rs9323512、rs9323513 和 rs9323514。在一个实施方案中,与rs20051M处于连锁不平衡中的标志选自下组 rs2005154、rs4878662 和 rs4880019。在一个实施方案中,与rs2184380处于连锁不平衡中的标志选自下组 rs2184380、rsl0466295、rsl0508363、rsl0508364、rsl0508365、rsl0795670、rsl090541Ursl0905414、rsl0905415、rsl0905430、rsl0905437、rsl0905439、rsl0905440、rsl0905443、 rsl0905444、rsl0905445、rsl0905446、rsl0905447、rsl0905454、rsll255764、rsll255776、 rsll255777、rsll255778、rsll255779、rsll255790、rsll255795、rsll255797、rsll255800、 rsll255804、rsll255805、rsll255820、rsll255821、rsll255822、rsll255832、rsll255836、 rsll255840、rsll255858、rsll255862、rsll255869、rsll255870、rsll255871、rsll255882、 rsll255884、rsl2049705、rsl2218610、rsl2250379、rsl2259226、rsl325874、rsl334549、 rsl334550、rsl334559、rsl360749、rsl413678、rsl413683、rsl537601、rsl537602、 rsl537603、rsl7407711、rsl7407781、rsl7407830、rsl7408204、rsl7408337、rsl7408580、 rsl7484150、rsl7485426、rsl7485998、rsl7486082、rsl7486795、rsl7486816、rsl970170、 rsl999638、 rs2031561、 rs2182292、 rs2388821、 rs2388825、 rs2388826、 rs2892613、 rs4112287、rs4112288、rs4345867、rs4454616、rs4747806、rs4749805、rs4749807、 rs4749812、rs6602328、rs6602329、rs7069110、rs7080765、rs7083359、rs7477023、 rs7904921、rs7912413、rs7912704、rs791283Urs827389 和 rs966562。在一个实施方案中,与rs2224696处于连锁不平衡中的标志选自下组 rs2224696、rsl0905509, rsll256045、rsl2761213、rsl2761461、rsl2766048、rsl2772042、 rsl2776383、 rsl2778120、 rsl2780218、 rsl2781427、 rsl475189、 rsl573109、 rsl573110、 rsl7145088、rsl7145095、rsl7145118、rsl7145120、rsl7145151、rsl7145164、rsl7145169、 rsl7145188、 rsl7145193、 rsl7145221、 rsl7363338、 rsl775559、 rsl857230、 rsl891532、 rsl935813、 rs2013364、 rs2025289、 rs2057442、 rs2093625、 rs2093626、 rs2146598、 rs2185817、rs2397336、rs2760204、rs2797266、rs391733、rs4550140、rs7081544、 rs852273、rs860418、rs861172、rs962993 和 rs965307。在一个实施方案中,与rs2M2503处于连锁不平衡中的标志选自下组 rs2242503、rsl0431029、rsl055233、rsl0734629、rsl0743052、rsl0743053、rsl0743054、 rsl0743055、rsl0769872、rsl0769873、rsl0769878、rsl0769882、rsl0839976、rsl0839984、 rsll041740、rsll041742、rsll041788、rsll041791、rsll041794、rsll08277、rsl2146654、 rsl2808387、 rsl528125、 rsl569128、 rsl970880、 rsl997262、 rs2049684、 rs2141321、 rs2242501, rs2272383、rs3750955、rs3752898、rs3849986、rs3849990、rs3911309、 rs3911310、 rs4340037、 rs4343012、 rs4385931、 rs4575312、 rs4578424、 rs4636658、 rs4758040、 rs4758042、 rs4758287、 rs4758309、 rs4758310、 rs7103334、 rs7112519、 rs7115706、和 rs7122690、rs7127738、rs7358396、rs7479156、rs7479738、rs7480804、 rs7481667、rs7481683、rs748261U rs7927368 和 rs7940668。在一个实施方案中,与处于连锁不平衡中的标志选自下组 rsl2291026、rsl004856、rsl0899091、rsll236449、rsll236452、rsll236454、rsl2362081、 rsl540210、 rsl54021U rsl557471、 rsl631470、 rsl783551、 rsl783556、 rsl783559、 rsl790144、 rsl790152、 rsl790307、 rsl793396、 rsl793397、 rsl793398、 rsl793399、 rsl793414、rsl938800、rs2853066、rs499613、rs504793、rs514477、rs549034、rs550881、 rs581007、rs589724、rs600387、rs606460、rs617617、rs618202、rs628972、rs640649、 rs662279、rs667410、rs667531、rs670100、rs670491、rs682292、rs7128888、rs7129014、 rs7129150 和 rs947844。
在一个实施方案中,与rsll9U922处于连锁不平衡中的标志选自下组 rsll912922、rsll089967、rsll704971、rsll705454、rsl7406386、rsl7406434、rs2071771、 rs2958650、 rs2958651、 rs2958659、 rs7284488、 rs7285507、 rs7291782、 rs739145、 rs9611246 和 rs9611265。在一个实施方案中,与rs6001%4处于连锁不平衡中的标志选自下组 rs6001954、rsl0483203、rsl0483204、rsl0483205、rsl0483206、rsll06673、rsll913132、 rsl2158399、rsl2158872、rsl2159200、rsl2159970、rsl2484697、rsl2627881、rsl33036、 rsl33038、rsl6985899、rsl7001846、rsl7001868、rsl7001943、rsl7001974、rsl7001977、 rsl7001993,rsl7001994,rsl7001997,rsl7002019,rsl7002020,rsl7002026,rsl7002027, rsl7002034、rsl7002036、rsl7002038、rsl7002069、rs2075764、rs2187832、rs2235318、 rs2280790、 rs2294348、 rs2294350, rs2294352、 rs2413624、 rs3788577、 rs3788578、 rs3788579、rs3827381、rs3827382、rs4140512、rs470113、rs5750957、rs5750960、 rs5750966、rs5757976、rs5757998、rs5758001、rs5995849、rs5995856、rs5995870、 rs5995871、 rs5995886、 rs6001900、 rs6001910、 rs600191U rs6001912、 rs6001913、 rs6001930、rs6001931、rs6001932、rs6001935、rs6001950、rs6001974、rs6001980、 rs6001990、rs6002000、rs718193、rs7292804、rs7293100、rs742140、rs760700、rs760701、 rs9306345、rs932379、rs9607721、rs9611310、rs9611311、rs9611312、rs9611316、 rs9611318、rs9611324、rs9611325、rs9611328 和 rs9611329。在发明的某些实施方案中,进行估量至少一个单倍型在个体中的频率的额外步 骤。在此类实施方案中,单倍型中可包括2个或更多个标志,包括3、4、5、6、7、8、9或10 或更多个标志。在某些实施方案中,所述至少一个单倍型包括全部都与rs20051M(SEQ ID NO 1), rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO: 4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、rs9956546(SEQID NO :7)、 rsll912922(SEQ ID NO :8)和 rs6001954(SEQ ID NO :9)的至少一个处于 LD 中的标志。在 此类实施方案中,所述至少一个单倍型代表上述标志的任意一个存在于其中的特定基因组 区域(LD区段)的基因组结构。在一个实施方案中,单倍型包括与rs999737处于连锁不平 衡中的标志。可将本文中描述的赋予乳腺癌的风险的标志与乳腺癌的其他遗传标志组 合。此类标志通常不与本文中描述的任一标志,特别是标志rs2005154(SEQ ID NO: 1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQID NO :3)、rs2242503(SEQ ID NO :4)、 rsl2291026(SEQ ID NO :5)、rs999737 (SEQ ID NO :6)、rs9956546 (SEQ ID NO :7)、 rsll912922 (SEQID NO :8)、rs6001954 (SEQ ID NO :9)和与它们处于连锁不平衡中的标志处 于连锁不平衡中。可通过将本文中描述的遗传风险因素与针对乳腺癌的另外的遗传风险因 素组合来实施本文中描述的任何方法。因此,在某些实施方案中,包括另外的步骤,其包括确定乳腺癌的至少一个有风险 的变体(其不与表1和/或表4中所示的任一个标志处于连锁不平衡中)的至少一个有 风险的等位基因是否存在于个体中。换句话说,可将基因组的其他位置中的遗传标志与本 发明的标志组合使用,以基于多个遗传因素测定乳腺癌的总体风险。不处于连锁不平衡中 (不在LD中)的标志的选择可基于对连锁不平衡的适当测量,如本文中进一步描述的。在某些实施方案中,不处于连锁不平衡中的标志具有小于0. 2的标志之间的LD测量r2值。在 某些其他实施方案中,不存在于LD中的标志具有小于0. 15、包括小于0. 10、小于0. 05、小于 0.02和小于0.01的标志之间的r2值。涉及确定标志不处于LD中的其他适当的截断值,包 括此类值的任意值之间的值。此类遗传风险因素的实例包括染色体5pl2和染色体10明6 上的标志,例如,标志rsl0941679和标志rsl219648。可选择地,可评估与任一个此类标志 处于LD中的标志。还可将已知赋予患乳腺癌的风险的其他标志与本文中描述的标志一起 评估,包括染色体2ql4 (例如,标志rs4848543或与其处于连锁不平衡中的标志)、2q35 (例 如,标志rs 13387042或与其处于连锁不平衡中的标志)和染色体16 (例如,标志rs3803662 或与其处于连锁不平衡中的标志)上的标志。在某些实施方案中,确定本文中描述的多个标志以测定患乳腺癌的总体风险 度。因此,在某些实施方案中,包括另外的步骤,所述步骤包括在包含源自人个体的基因 组DNA的样品中或来源于人个体的基因型数据集中确定至少一个等位基因在至少2个多 态型标志的每一个标志中是否存在,其中所述至少一个等位基因在至少2个多态型标志 中的存在标示着增加的对乳腺癌的易感性。在一个实施方案中,标志选自rs20051M(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO: 4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQID NO :6)、rs9956546(SEQ ID NO :7)、 rsll912922(SEQ ID NO :8)和rs6001卯4(SEQ ID NO :9)以及与它们处于连锁不平衡中的 标志ο还可将基于本发明的标志的风险评估与乳腺癌的至少一个高外显率遗传因素在 获自个体的核酸样品中或在来源于个体的基因型数据集中的存在或不存在的评估组合。乳 腺癌的高外显率遗传因子可以例如是BRCAl突变、BRCA2突变、TP53突变或PTEN突变。结 合起来,BRCAl和BRCA2中的突变可解释15-20%的患家族性乳腺癌的风险,并且这些突变 可解释2至3%的偶发性乳腺癌患者[Gorski,等人,(2005),Breast Cancer Res Treat, 92,19-24 ; (2000), Br J Cancer,83,1301-8]。TP53 和 PTEN 基因中的已知突变解释大约 5%的患乳腺癌的总体遗传风险[Easton,(1999) ,Breast Cancer Res, 1,14-7] 在一个实 施方案中,高外显率遗传因子是BRCA2 999del5。还可将本发明的遗传标志与非遗传信息组合以确定个体的总体风险度。因此,在 某些实施方案中,包括另外的步骤,所述步骤包括分析非遗传信息以进行个体的风险度评 估、诊断或预后。非遗传信息可以是涉及个体的疾病状态的任何信息或可影响个体患乳腺 癌的总体风险度的评估的其他信息。在一个实施方案中,非遗传信息选自受试者的年龄、性 别、种族性、社会经济地位、以前的疾病诊断、医疗史、乳腺癌的家族史、生物化学测量和临 床测量。在另一个方面,本发明涉及评估在之前经诊断患有乳腺癌的个体中发生至少第二 原发肿瘤的风险度的方法,所述方法包括确定至少一个多态型标志的至少一个等位基因在 获自个体的核酸样品中的存在或不存在,其中所述至少一个多态型标志选自表1和4中所 列的多态型标志和与它们处于连锁不平衡中的标志组成的组,其中所述至少一个等位基 因的存在标示着发生至少第二原发肿瘤的风险。可选择地,本发明涉及测定之前经诊断 患有乳腺癌的个体中发生至少第二原发肿瘤的风险度的方法,所述方法包括确定至少一 个多态型标志的至少一个等位基因存在于获自个体的核酸样品中或来源于个体的基因型数据集中,其中所述至少一个多态型标志选自rs2005154(SEQ ID NO 1)、rs2184380 (SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503 (SEQ ID NO :4)、rsl2291026 (SEQ ID NO: 5)、rs999737(SEQ ID NO :6)、rs9956546 (SEQ ID NO :7)、rsll912922 (SEQ ID NO :8)禾口 rs6001954(SEQ ID NO :9)以及与它们处于连锁不平衡中的标志,并且其中所述至少一个等 位基因的存在标示着发生至少第二原发肿瘤的风险。在一个这样的实施方案中,所述至少 一个多态型标志选自表4中所列的标志。本发明还提供了计算机实现的方面。在一个这样的方面中,本发明提供 了具有用于测定个体中对乳腺癌的易感性的计算机可执行指令的计算机可读介质 (computer-readable medium),该计算机可读介质包括标示着至少一个多态型标志的数据;和存储在计算机可读介质上并且适合于用处理器执行以基于所述至少一个多态型 标志的至少一个等位基因在个体中的等位基因状态确定个体中对乳腺癌的易感性的例程。在一个实施方案中,代表至少一个多态型标志的所述数据包括至少一个标示着 对与所述至少一个多态型标志关联的乳腺癌的易感性的参数。在另一个实施方案中, 代表至少一个多态型标志的所述数据包括标示着所述至少一个等位基因标志的至少一 个等位基因在所述个体中的等位基因状态的数据。在另一个实施方案中,所述例程适 合于接受标示着所述至少一个等位基因标志的至少一个等位基因在所述个体中的等位 基因状态的输入数据。在优选实施方案中,所述至少一个标志选自rs20051M(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696 (SEQ ID NO :3)、rs2242503 (SEQ ID NO: 4), rsl2291026 (SEQ ID NO :5)、rs999737 (SEQ ID NO :6)、rs9956546 (SEQ ID NO :7)、 rsll912922(SEQ ID NO :8)、rs6001954(SEQ ID NO :9)和与它们处于连锁不平衡中的标志。 在另一个优选实施方案中,所述至少一个多态型标志选自表4中所示的标志。本发明还提供了用于测定针对人个体的乳腺癌的遗传指标(indicator)的装置, 其包括处理器,计算机可读存储器,其具有适合在处理器上执行用以就至少一个乳腺癌分析至少 一个人个体的标志和/或单倍型信息的计算机可执行指令,和产生基于标志或单倍型信息 的输出,其中所述输出包括至少一个标志或单倍型的风险度测量作为人个体的乳腺癌的遗 传指标。在一个实施方案中,计算机可读存储器包括标示着至少一个多态型标志的至少一 个等位基因或至少一个单倍型在多个经诊断患有乳腺癌的个体中的频率的数据,和标示着 至少一个多态型标志的至少一个等位基因或至少一个单倍型在多个参照个体中的频率的 数据,其中风险度测量基于人个体的至少一个标志和/或单倍型状态与标示着多个经诊断 患有乳腺癌的个体的至少一个标志和/或单倍型频率的信息的数据的比较。在可选择的 实施方案中,计算机可读存储器还包括标示着发生与至少一个多态型标志的至少一个等位 基因或至少一个单倍型关联的乳腺癌的风险的数据,其中人个体的风险度测量基于人个体 的基因型状态与与至少一个多态型标志的至少一个等位基因或至少一个单倍型关联的风 险度的比较。在另一个实施方案中,计算机可读存储器还包括标示着至少一个多态型标 志的至少一个等位基因或至少一个单倍型在多个经诊断患有乳腺癌的个体中的频率的数 据,以及标示着至少一个多态型标志的至少一个等位基因或至少一个单倍型在多个参照个体中的频率的数据,并且其中发生乳腺癌的风险度基于至少一个等位基因或单倍型在 经诊断患有乳腺癌的个体中的频率与参照个体中的频率的比较。在优选实施方案中,至 少一个标志选自 rs20051M(SEQ ID NO 1)、rs2184380 (SEQ ID NO :2)、rs2224696 (SEQID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、 rs9956546(SEQ ID NO :7)、rsl 1912922 (SEQID NO :8)、rs6001954 (SEQ ID NO :9)和与它们 处于连锁不平衡中的标志。在另一个优选实施方案中,至少一个多态型标志选自表4中所 示的标志。在另一个方面,本发明涉及鉴定用于评估对乳腺癌的易感性的标志的方法,所述 方法包括鉴定与rs2005154(SEQ ID NO :1)、rs2184380 (SEQ ID NO :2)、rs2224696 (SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、 rs9956546(SEQ ID NO :7)、rsl 1912922 (SEQ ID NO :8)和 rs6001954 (SEQID NO :9)中的至 少一个处于连锁不平衡中的至少一个多态型标志;确定经诊断患有乳腺癌或具有对其的易 感性的个体的样品的基因型状态;和确定对照个体的样品的基因型状态;其中,与至少一 个等位基因在对照样品中的频率相比较,至少一个多态型的至少一个等位基因在经诊断患 有乳腺癌或具有对其的易感性的个体中的频率的显著差异标示着至少一个多态型对于评 估对乳腺癌的易感性是有用的。可基于乳腺癌患者和对照中特定多态型标志上的等位基因 的计数的统计分析来评估显著差异。在一个实施方案中,显著差异基于小于0. 05的乳腺癌 患者与对照之间计算的P值。在其他实施方案中,显著差异基于计算的P值的更小的值,例 如小于0. 005,0. 0005或0. 00005的值。在一个实施方案中,与至少一个等位基因在对照样 品中的频率相比较,至少一个多态型的至少一个等位基因在经诊断患有乳腺癌或具有对其 的易感性的个体中的频率的增加标示着所述至少一个多态型对于评估增加的对乳腺癌的 易感性是有用的。在另一个实施方案中,与至少一个等位基因在对照样品中的频率相比较, 至少一个多态型中的至少一个等位基因在经诊断患有乳腺癌或具有对乳腺癌易感性的个 体中的频率的增加标示着所述至少一个多态型对于评估减少的对乳腺癌的易感性或抗乳 腺癌的保护性是有用的。本发明还涉及对获自人个体的核酸样品进行基因分型的方法,其包括确定至少一 个多态型标志的至少一个等位基因是否存在于来自个体样品的核酸样品中,其中所述至少 一个标志选自 rs2005154(SEQ ID NO 1)、rs2184380 (SEQ ID NO :2)、rs2224696 (SEQ ID NO :3)、rs2242503 (SEQID NO :4)、rsl2291026 (SEQ ID NO :5)、rs999737 (SEQ ID NO :6)、 rs9956546(SEQ ID NO :7)、rsl 1912922 (SEQ ID NO :8)和 rs6001954 (SEQID NO :9)以及与 它们处于连锁不平衡中的标志,并且其中至少一个等位基因在样品中的存在的确定标示着 个体中对乳腺癌的易感性。在一个实施方案中,rs20051M等位基因T、rs2184380等位基 因G、rs2224696等位基因T、rs2242503等位基因C、rsl2291(^6等位基因G、rs999737等位 基因C、rs9956546等位基因A、rsll912922等位基因T和rs6001卯4等位基因G的存在的 确定标示着个体中增加的对乳腺癌的易感性。在一个实施方案中,基因分型包括使用侧翼 连接至少一个多态型标志的核苷酸引物对,通过聚合酶链式反应(PCR)扩增核酸的区段, 所述核酸的区段包括所述至少一个多态型标志。在另一个实施方案中,使用方法进行基因 分型,所述方法选自等位基因特异性探针杂交、等位基因特异性引物延伸、等位基因特异性 扩增、核酸测序、5'-外切核酸酶降解、分子信标测定、寡核苷酸连接测定、大小分析、单链构象多态型分析(single-stranded conformation analysis)和微阵列技术。在一个实施 方案中,微阵列技术是Molecular Inversion Probe阵列技术或BeadArray技术。在一个 实施方案中,方法包括等位基因特异性探针杂交。在另一个实施方案中,方法包括微阵列技 术。一个优选实施方案包括步骤(1)将核酸的拷贝在用于寡核苷酸探针与所述核酸的特 异性杂交的条件下与检测寡核苷酸探针和增强子寡核苷酸探针接触;其中(a)检测寡核苷 酸探针在长度上为5至100个核苷酸并且与核酸的第一区段特异性杂交,所述核酸的第一 区段的核苷酸序列由SEQ ID NO :1-562中的任一个提供;(b)检测寡核苷酸探针在其3' 末端包含可检测标记并且在其5 ‘末端包含猝灭部分;(c)增强子寡核苷酸在长度上为5至 100个核苷酸并且与核酸序列的第二区段互补,所述核酸的第二区段的核苷酸序列相对于 寡核苷酸探针为5',以便当两个寡核苷酸探针都与核酸杂交时增强子寡核苷酸探针相对 于检测寡核苷酸探针位于3';和(d)在第一区段与第二区段之间存在单个碱基缺口,以便 当寡核苷酸探针和增强子寡核苷酸探针都与核酸杂交时,单个碱基缺口存在于寡核苷酸之 间;( 用内切核酸酶处理核酸,当检测探针与核酸杂交时,所述内切核酸酶将从检测探针 的3'末端切割可检测的标记以释放游离的可检测标记;和(3)测量游离的可检测标记,其 中游离可检测标记的存在表明所述检测探针与核酸的第一区段特异性杂交,以及表明多态 型位点的序列为检测探针的互补序列。本发明的另外的方面涉及就对乳腺癌治疗剂的反应的可能性评估个体的方法,其 包括确定至少一个多态型标志的至少一个等位基因在获自个体的核酸样品中或在来源 于个体的基因型数据集中的存在或不存在,其中至少一个多态型标志选自rs20051M(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696 (SEQ ID NO :3)、rs2242503 (SEQ ID NO: 4)、rsl2291026(SEQ ID NO :5)、rs999737 (SEQ ID NO :6)、rs9956546 (SEQ ID NO :7)、 rsll912922(SEQ ID NO :8)和rs6001954(SEQ ID NO :9)以及与它们处于连锁不平衡中的 标志,其中所述至少一个标志的至少一个等位基因的存在标示着对治疗剂的阳性反应的可 能性。本发明在另一方面涉及预测经诊断患有乳腺癌的个体的预后的方法,所述方法 包括确定至少一个多态型标志的至少一个等位基因在获自个体的核酸样品中或来源于个 体的基因型数据集中的存在或不存在,其中所述至少一个多态型标志选自rs20051M(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696 (SEQ ID NO :3)、rs2242503 (SEQ ID NO: 4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、rs9956546(SEQ ID NO :7)、 rsll912922(SEQ ID NO :8)和rs6001954(SEQ ID NO :9)以及与它们处于连锁不平衡中的 标志,其中至少一个等位基因的存在标示着个体的乳腺癌的恶化预后。本发明的另一个方面涉及监控正在经历乳腺癌治疗的个体的治疗进展的方 法,所述方法包括确定至少一个多态型标志的至少一个等位基因在获自个体的核酸样 品中或来源于个体的基因型数据集中的存在或不存在,其中至少一个多态型标志选 自 rs2005154(SEQ ID NO 1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、 rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、 rs9956546(SEQ ID NO :7)、rsll912922 (SEQ ID NO :8)和rs6001954 (SEQ ID NO :9)以及与 它们处于连锁不平衡中的标志,其中至少一个等位基因的存在标示着个体的治疗结果。在 一个实施方案中,所述治疗是利用手术的治疗、利用放射疗法的治疗或利用药物施用的治疗。本发明还涉及寡核苷酸探针在用于诊断和/或评估人个体中对乳腺癌的易感性 的试剂的制造中的用途,其中将探针与具有SEQ ID NO :1-562的任一个中所示的核苷酸序 列的核酸的区段杂交,其中探针在长度上为15至500个核苷酸。在某些实施方案中,探针 在长度上为大约16至大约100个核苷酸。在某些其他实施方案中,探针在长度上为大约20 至大约50个核苷酸。在某些其他实施方案中,探针在长度上为大约20至大约30个核苷酸。乳腺癌表型的各种诊断和分类在本发明的范围内。在其广义上,本发明涉及任何 乳腺癌表型。在某些实施方案中,乳腺癌包括乳腺癌的任何临床诊断,包括但不限于浸润 性导管癌、浸润性小叶癌、管状癌或浸润性或混合浸润性髓性DCIS (导管原位癌),LCIS (小 叶原位癌)或非浸润性癌;浸润性乳腺癌,包括0期、1期、2期(包括加期和2b期)、3期 (包括3a期、北期和3c期)以及4期乳腺癌。在某些实施方案中,乳腺癌表型选自所有乳 腺癌,多原发性乳腺癌和早发性乳腺癌。在一些实施方案中,本发明的标志与具有乳腺癌家 族史的个体的乳腺癌的风险关联。在一个这样的实施方案中,总计家族史(summed family history) (FHS)是与乳腺癌关联的表型。在另一个实施方案中,与本发明的变体关联的乳腺 癌是雌激素受体(ER)阳性和/或孕激素受体(PR)阳性乳腺癌。在一个实施方案中,与本 发明的变体关联的乳腺癌是雌激素受体(ER)阳性的。在另一个实施方案中,与本发明的变 体关联的乳腺癌是孕激素受体(ER)阳性的。在一个这样的实施方案中,本文中描述的与增 加的患乳腺癌的风险或易感性关联的标志赋予增加的患ER阳性和/或PR阳性乳腺癌的风 险或易感性。因此,在某些实施方案中,本发明的至少一个有风险的变体的存在标示着个体 的ER阳性或ra阳性乳腺癌。在本发明的方法的一些实施方案中,方法中测定的易感性是增加的易感性。在一 个这样的实施方案中,增加的易感性的特征在于至少1. 10的相对风险度(RR)。在另一个实 施方案中,增加的易感性的特征在于至少1. 20的相对风险度。在另一个实施方案中,增加 的易感性的特征在于至少1. 30的相对风险度。在另一个实施方案中,增加的易感性的特征 在于至少L40的相对风险度。在另一个实施方案中,增加的易感性的特征在于至少1.50 的相对风险度。在其他实施方案中,增加的易感性的特征在于至少1.70的相对风险度。在 另一个实施方案中,增加的易感性的特征在于至少2. 0的相对风险度。其他实施方案的特 征在于至少 1. 10,1. 11、1. 12,1. 13,1. 14,1. 15,1. 16,1. 17,1. 18,1. 19、1. 20、1. 21、1. 22、 1. 23,1. 24,1. 25,1. 26,1. 27,1. 28,1. 29,1. 30,1. 31,1. 32,1. 33,1. 34,1. 35 的相对风险度。 上述这类值的任意值之间的风险度的其他数值也是可能的,并且这类数值也在本发明的范 围内。在本发明的方法的一些实施方案中,方法中测定的易感性是减少的易感性。在一 个这样的实施方案中,减少的易感性的特征在于小于0.9的相对风险度(I )。在另一个实 施方案中,减少的易感性的特征在于小于0.8的相对风险度(I )。在另一个实施方案中, 减少的易感性的特征在于小于0.7的相对风险度(I )。在另一个实施方案中,减少的易感 性的特征在于小于0. 5的相对风险度(RR)。其他截断值,例如小于0. 89,0. 88,0. 87,0. 86、 0. 85,0. 84,0. 83,0. 82,0. 81,0. 80,0. 79,0. 78,0. 77,0. 76,0. 75,0. 74,0. 73,0. 72,0. 71、 0. 70等的相对风险度在本发明的范围内。本发明还涉及试剂盒。在一个这样的方面,本发明涉及用于评估人个体中对乳腺癌的易感性的试剂盒,所述试剂盒包括选择性检测个体的基因组中至少一个多态 型标志的至少一个等位基因所必需的试剂,所述多态型标志选自rs2005154(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696 (SEQ ID NO :3)、rs2242503 (SEQ ID NO: 4)、rsl2291026(SEQID NO :5)、rs999737(SEQ ID NO :6)、rs9956546(SEQ ID NO :7)、 rsll912922(SEQ ID NO :8)、rs6001954(SEQ ID NO :9)和与它们处于连锁不平衡中的标 志,其中至少一个等位基因的存在标示着增加的对乳腺癌的易感性。在一个实施方案中, 试剂盒还包括包含至少一个多态型与对乳腺癌的易感性之间的关联数据的数据集。关联 数据可以以任何适当的形式例如相对风险度测量0 )、比值比(OR)或本领域技术人员已 知的其他方便的测量存在。在一个实施方案中,数据集存在于计算机可读介质上。在另一 个方面,本发明涉及用于评估人个体中对乳腺癌的易感性的试剂盒,所述试剂盒包括选择 性检测个体的基因组中至少一个多态型标志的至少一个等位基因所必需的试剂,其中所述 多态型标志选自 rs2005154(SEQ ID NO 1)、rs2184380 (SEQ ID NO :2)、rs2224696 (SEQID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、 rs9956546(SEQ ID NO :7)、rsll912922 (SEQID NO :8)和 rs6001954 (SEQ ID N0:9),并且其 中所述至少一个等位基因的存在标示着对乳腺癌的易感性。在一个实施方案中,至少一个 多态型标志选自表4中所示的标志。在一个实施方案中,试剂盒试剂可包括至少一个连续寡核苷酸,所述寡核苷酸 与包含至少一个多态型标志的个体的基因组的片段杂交。在另一个实施方案中,试剂盒 包括至少一对寡核苷酸,所述至少一对寡核苷酸与获自受试者的基因组区段的相反链 (opposite strand)杂交,其中每一个寡核苷酸引物对经设计用以选择性扩增包含一个多 态型的个体的基因组的片段,其中所述多态型选自表4中定义的多态型组成的组,其中所 述片段大小为至少20个碱基对。在一个实施方案中,寡核苷酸与个体的基因组完全互补。 在另一个实施方案中,试剂盒还包括用于扩增所述区段的缓冲液和酶。在另一个实施方案 中,试剂还包括用于检测所述片段的标记。在一个优选实施方案中,试剂盒包括长度为5至100个核苷酸的检测寡核苷酸探 针;长度为5至100个核苷酸的增强子寡核苷酸探针;和内切核酸酶;其中所述检测寡核苷 酸探针与其核苷酸序列示于SEQ ID NO :1-562的任一个中的核酸的第一区段特异性杂交, 并且其中所述检测寡核苷酸探针在其3'末端包含可检测标记和在其5'末端包含猝灭部 分;其中所述增强子寡核苷酸在长度上为5至100个核苷酸并且与相对于寡核苷酸探针为 5'的核酸序列的第二区段互补,以便当这两个寡核苷酸都与核酸杂交时增强子寡核苷酸 相对于检测寡核苷酸探针位于3';其中单个碱基缺口存在于第一区段与第二区段之间,以 便当寡核苷酸探针和增强子寡核苷酸探针都与核酸杂交时,单个碱基缺口存在于寡核苷酸 之间;以及其中当检测探针与核酸杂交时,用内切核酸酶处理核酸将从检测探针的3'末 端切割可检测标记以释放游离可检测标记。根据本发明的方法还可用于本发明的其他方法,包括评估在之前经诊断患有乳腺 癌的个体中发生至少第二原发性肿瘤的风险的方法,就对乳腺癌治疗剂起反应的可能性评 估个体的方法和监控经诊断患有乳腺癌并且接受疾病治疗的个体的治疗进展的方法。本文中描述的与乳腺癌关联的标志可全部用于本发明的不同方面,包括本文中描 述的方法、试剂盒、用途、装置和程序。在一般意义上,本发明涉及与本文中定义的LD区段 C09、LD 区段 C10A、LD 区段 10B、LD ±夬 C11A、LD 区段 C11B、LD 区段 C14、LD 区段 C18、LD 区段C22A和LD区段C22B的任一个关联的标志。在某些实施方案中,本发明涉及表1或 表4中所示的标志和与它们处于连锁不平衡中的标志。在某些其他实施方案中,本发明涉 及表4中所示的标志。在某些其他实施方案中,本发明涉及标志rs2005154、rs2184380、 rs2224696、rs2242503、rsl2291026、rs999737、rs9956546、rsll912922 和 rs6001954 以及 与它们处于连锁不平衡中的标志。在一些其他优选实施方案中,本发明涉及rs2005154(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO: 4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、rs9956546(SEQ ID NO :7)、 rsl 1912922 (SEQ ID NO :8)和 rs6001954 (SEQ ID NO :9)中的任一个。在某些实施方案中,赋予增加的患乳腺癌的风险的至少一个标志等位基因选自 rs2005154等位基因T、rs2184380等位基因G、rs2224696等位基因T、rs2242503等位基因 C,rsl2291026 等位基因 G、rs999737 等位基因 C、rs9956546 等位基因 A,rsll912922 等位 基因T和rs6001%4等位基因G。在此类实施方案中,等位基因(有风险的等位基因)的存 在标示着增加的患乳腺癌的风险度。在本发明的某些实施方案中,使用连锁不平衡测量r2和ID' I测定连锁不平衡, 所述r2和ID' I给出两个遗传成分(例如,多态型标志)之间的连锁不平衡(LD)的程度。 针对特定标志的此类测量的某些数值标示着标志处于连锁不平衡中,如本文中进一步描述 的。在本发明的一个实施方案中,标志之间的连锁不平衡(即,标示着标志处于连锁不平衡 中的LD值)被定义为r2> 0.1。在另一个实施方案中,连锁不平衡被定义为r2> 0.2。其 它实施方案可包括连锁不平衡的其它定义,例如r2 > 0. 25、r2 > 0. 3、r2 > 0. 35、r2 > 0. 4、 r2 > 0. 45、r2 > 0. 5、r2 > 0. 55、r2 > 0. 6、r2 > 0. 65、r2 > 0. 7、r2 > 0. 75、r2 > 0. 8、r2 > 0. 85、r2 > 0. 9、r2 > 0. 95、r2 > 0. 96、r2 > 0. 97、r2 > 0. 98 或 r2 > 0. 99。在某些实施方 案中连锁不平衡还可定义为ID' I >0.2或定义为|D' |>o.3、|D' |>O.4、|D' > 0.5、|d' I >0.6、|D' |>O.7、|D' |>O.8、|D' |>O.9、|D' |>O.95、|D' > 0.98或|D' I >0.99。在某些实施方案中,连锁不平衡被定义为满足r2和|D' |两个标 准,例如r2>0.2并且ID' I >0.8。r2和ID' I的值的其它组合也是可能的并且在本发 明的范围内,包括但不限于上文所示的这些参数的值。应当理解,本文中描述的特征的所有组合是被涉及的,即使特征的组合未明确地 见于本文中相同的句子或段落中。这特别地包括本文中公开的全部标志,单独地或组合地 用于个别分析或在单倍型中,在本文中描述的本发明的所有方面中的用途。附图概述本发明的上述和其它目的、特征和有利方面由以下本发明的优选实施方案的更具 体的描述将变得透彻。

图1提供了举例说明利用本文中描述的风险变体的计算机实现系统的图解。详述本发明公开了已发现与乳腺癌关联的多态型变体和单倍型。已发现染色体9、10、 11、14、18和22上的多态型标志上的特定等位基因与发生乳腺癌的风险关联。此类标志和 单倍型用于诊断目的、用于预测药物反应的方法和用于预测治疗进展的方法,如本文中进 一步描述的。本发明的其他应用包括利用本发明的多态型标志来评估对利用手术或放射疗法进行的乳腺癌治疗的反应的方法以及用于本发明的方法的试剂盒。定义除非另外指出,否则核酸序列以5'至3'方向从左向右书写。说明书中引用的数 值范围包括界定范围的数字并且包括界定的范围内的每一个整数或任意非整数分数。除非 另外定义,否则本文中使用的全部技术和科学术语具有与本发明所属领域的技术人员的通 常理解相同的意义。在本说明书中下列术语将具有所指出的意义如本文中所描述的“多态型标志”,有时称为“标志”意指基因组多态型位点。每一 个多态型标志在多态型位点上具有特定等位基因的至少2个序列差异特征。因此,多态型 标志的遗传关联性(genetic association)意指存在与该特定多态型标志的至少一个特定 等位基因的关联性。标志可包括基因组中发现的任何变型的任何等位基因,包括单核苷酸 多态型(SNP)、小卫星或微卫星、易位和拷贝数变化(插入、缺失、重复)。多态型标志在群 体中可具有任何可测量的频率。为了定位疾病基因,具有高于5-10%的群体频率的多态型 标志通常最为有用。然而,多态型标志还可具有更低的频率,例如1-5%的频率或甚至更低 的频率,特别是拷贝数变异(CNV)。在本发明书中,术语将被用来包括具有任何群体频率的 多态型标志。“等位基因”意指染色体上给定的基因座(位置)的核苷酸序列。因此多态型标 志等位基因意指染色体上标志的组成(即,序列)。个体的基因组DNA对于任何给定的多 态型标志包含2个等位基因,代表每一条染色体上标志的每一个拷贝。本文中使用的核苷 酸的序列码是A = 1、C = 2、G = 3、T = 4。对于微卫星等位基因,将CEPH样品(Centre d' Etudesdu Polymorphisme Humain、基因组数据库、CEPH 样品 1347-02)用作参照,将该 样品中每一个微卫星的较短等位基因设置为0并且根据该参照给其它样品中所有其它等 位基因编号。因此,例如等位基因1比CEPH样品中的所述较短等位基因长lbp,等位基因2 比CEPH样品中的所述较短等位基因长2bp,等位基因3比CEPH样品中的所述较短等位基 因长3bp等,以及等位基因-1比CEPH样品中的所述较短等位基因短lbp,等位基因-2比 CEPH样品中的所述较短等位基因短2bp等。“单核苷酸多态型”或“SNP”是当基因组中特定位置上单个核苷酸在种的成员之间 或个体的成对染色体之间不同时存在的DNA序列差异。大多数SNP多态型具有2个等位基 因。每一个个体在该情况下对于多态型的一个等位基因是纯合的(即个体的两个染色体拷 贝在该SNP位置都具有相同的核苷酸)或个体是杂合的(即个体的两个姊妹染色体包含不 同的核苷酸)。本文中报导的SNP命名是指由美国国家生物技术信息中心(NCBI)分配给每 一个独特的SNP的官方参考SNP (official Reference SNP) (rs) ID标识符。本文中所述的序列共核苷酸错读(Sequence conucleotide ambiguity)是如 IUPAC-IUB所提出的。此类代码与由EMBL、GenBank和MR数据库使用的代码兼容。
权利要求
1.测定人个体中对乳腺癌的易感性的方法,其包括确定至少一个多态型标志的至少 一个等位基因是否存在于获自个体的核酸样品中或来源于个体的基因型数据集中,其中 所述至少一个多态型标志选自下组rs999737(SEQ ID NO 6), rs2005154 (SEQ ID NO: 1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、 rsl2291026(SEQ ID NO :5)、rs9956546(SEQ ID NO :7)、rsl1912922(SEQ ID NO :8)、 rs6001954(SEQ ID NO :9)和与它们处于连锁不平衡中的标志,并且其中至少一个等位基因 的存在的确定标示着个体中对乳腺癌的易感性。
2.权利要求1的方法,其中所述至少一个多态型标志选自表4中所示的标志。
3.权利要求1或权利要求2的方法,其中所述至少一个多态型标志选自rs999737(SEQ ID NO :6)、rs2005154(SEQ ID NO 1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO: 3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、rs9956546(SEQ ID NO :7)、 rsll912922(SEQ ID NO :8)、rs6001954(SEQ ID NO :9)。
4.前述权利要求的任一项的方法,其还包括评估个体中至少一个单倍型的频率。
5.前述权利要求的任一项的方法,其中由至少一个等位基因或单倍型的存在赋予的易 感性是增加的易感性。
6.权利要求6的方法,其中rs20051M中的等位基因T、rs2184380中的等位基因 G、rs2224696中的等位基因T、rs2242503中的等位基因C、rsl2291026中的等位基因 G、rs999737中的等位基因C、rs9956546中的等位基因A、rsll912922中的等位基因T、 rs6001954中的等位基因G的存在标示着个体中增加的对乳腺癌的易感性。
7.权利要求5或6的方法,其中至少一个等位基因或单倍型的存在标示着相对风险度 (RR)或比值比(OR)为至少1.08的增加的对乳腺癌的易感性。
8.权利要求5或6的方法,其中至少一个等位基因或单倍型的存在标示着相对风险 度(RR)或比值比(OR)为至少1. 09,包括至少1. 10、至少1. 11、至少1. 12、至少1. 13、至少 1. 14、至少1. 15、至少1. 16和至少1. 17的增加的易感性。
9.权利要求1至4的任一项的方法,其中由至少一个等位基因或单倍型的存在赋予的 易感性是减少的易感性。
10.前述权利要求的任一项的方法,其还包括确定不与表4中所示的标志中的任意一 个处于连锁不平衡中的至少一个对于乳腺癌有风险的变体的至少一个有风险的等位基因 是否存在于包含源自人个体的基因组DNA的样品中或来源于人个体的基因型数据集中。
11.权利要求1至9的任一项的方法,其包括在包含源自人个体的基因组DNA的样品中 或来源于人个体的基因型数据集中确定至少一个等位基因在至少2个多态型标志的每一 个标志中是否存在,其中所述至少一个等位基因在至少2个多态型标志中的存在标示着增 加的对乳腺癌的易感性。
12.前述权利要求的任一项的方法,其还包括确定至少一个乳腺癌的高外显率遗传因 子在获自个体的核酸样品中或来源于个体的基因型数据集中的存在或不存在的步骤。
13.权利要求12的方法,其中所述高外显率遗传因子是BRCAl、BRCA2、TP53和/或PTEN 中的突变。
14.前述权利要求的任一项的方法,其还包括分析非遗传信息以进行个体的风险度评 估、诊断或预后。
15.权利要求14的方法,其中所述非遗传信息选自受试者的年龄、性别、种族、社会经 济地位、以前的疾病诊断、医疗史、乳腺癌的家族史、生物化学测量和临床测量。
16.权利要求11至15的任一项的方法,其还包括计算组合风险度。
17.测定之前经诊断患有乳腺癌的个体中发生至少第二原发肿瘤的风险度的方法,所 述方法包括确定至少一个多态型标志的至少一个等位基因是否存在于获自个体的核酸样 品中或来源于个体的基因型数据集中,其中所述至少一个多态型标志选自rs999737(SEQ ID NO :6)、rs2005154(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQID NO:3)、rs2242503(SEQ ID NO :4)、rsl2291026 (SEQ ID NO :5)、rs9956546 (SEQ ID NO :7)、 rsll912922(SEQ ID NO :8)、rs6001954 (SEQID NO :9)和与它们处于连锁不平衡中的标志,以及其中所述至少一个等位基因的存在标示着发生至少第二原发肿瘤的风险。
18.权利要求17的方法,其中所述至少一个多态型标志选自表4中所示的标志。
19.用于评估人个体中对乳腺癌的易感性的试剂盒,所述试剂盒包括用于选择性检测个体基因组中至少一个多态型标志的至少一个等位基因的试剂,其中 所述多态型标志选自 rs999737(SEQ ID NO :6)、rs2005154 (SEQ ID NO 1)、rs2184380 (SEQ ID NO :2)、rs2224696(SEQID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO: 5)、rs9956546(SEQ ID NO :7)、rsl 1912922 (SEQ ID NO :8)、rs6001954 (SEQID NO :9)和与 它们处于连锁不平衡中的标志,和包括至少一个多态型与对乳腺癌的易感性之间的关联数据的数据集。
20.权利要求19的试剂盒,其中所述至少一个多态型标志选自表4中所示的标志。
21.权利要求19或20的试剂盒,其中所述试剂包括至少一个连续寡核苷酸、缓冲剂和 可检测标记,所述寡核苷酸与包含至少一个多态型标志的个体的基因组的片段杂交。
22.权利要求19至21的任一项的试剂盒,其中所述试剂包括至少一对与获自受试者 的基因组核酸区段的相反链杂交的寡核苷酸,其中每一个寡核苷酸引物对经设计用以选择 性扩增包括一个多态型标志的个体的基因组的片段,并且其中所述片段在大小上是至少30 个碱基对。
23.权利要求21或权利要求22的试剂盒,其中所述至少一个寡核苷酸与个体的基因组 完全互补。
24.权利要求19至22的任一项的试剂盒,其中所述试剂盒包括用于检测个体的基因组 中不超过100个等位基因的试剂。
25.具有用于测定人个体中对乳腺癌的易感性的计算机可执行指令的计算机可读介 质,所述计算机可读介质包括标示着至少一个多态型标志的数据;存储在计算机可读介质上并且适合于用处理器执行以针对至少一个多态型标志测定 发生乳腺癌的风险度的例程,其中所述至少一个多态型标志选自rs999737(SEQ ID NO 6), rs2005154(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQID NO :3)、rs2242503(SEQ ID NO:4)、rsl2291026(SEQID NO :5)、rs9956546 (SEQ ID NO :7)、rsll912922 (SEQ ID NO :8)、 rs6001954(SEQID NO :9)以及与它们处于连锁不平衡中的标志。
26.权利要求25的计算机可读介质,其中所述计算机可读介质包含标示着至少2个多态型标志的数据。
27.权利要求25或权利要求沈的计算机可读介质,其中所述至少一个多态型标志选自 表4中所示的标志。
28.权利要求25至27的任一项的计算机可读介质,其中所述至少一个多态型标 志选自 rs2005154(SEQ ID NO 1)、rs2184380 (SEQ IDNO :2)、rs2224696 (SEQ ID NO: 3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、rs999737(SEQ ID NO :6)、 rs9956546(SEQID NO :7)、rsl1912922(SEQ ID NO :8)和 rs6001954(SEQ ID NO :9)。
29.权利要求25至28的任一项的计算机可读介质,其还包括表示包含2个或更多个多 态型标志的至少一个单倍型的数据。
30.用于测定人个体中的乳腺癌的遗传指标的装置,其包括处理器,计算机可读存储器,其具有适合在处理器上执行用以就至少一个多态型标志分 析至少一个人个体的标志和/或单倍型信息的计算机可执行指令,所述多态型标志选 自 rs999737(SEQ ID NO :6)、rs2005154(SEQID NO 1)、rs2184380(SEQ ID NO :2)、 rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、 rs9956546 (SEQID NO :7)、rsll912922 (SEQ ID NO :8)、rs6001954 (SEQ ID NO :9)以及与它 们处于连锁不平衡中的标志,和产生基于所述标志或单倍型信息的输出,其中所述输出包括至少一个标志或单倍型的 风险度测量作为人个体的乳腺癌的遗传指标。
31.权利要求30的装置,其中计算机可读存储器还包括标示发生与至少一个多态型标 志的至少一个等位基因或至少一个单倍型关联的乳腺癌的风险度的数据,并且其中人个体 的风险度测量基于人个体的基因型状态与发生与至少一个等位基因或至少一个单倍型关 联的乳腺癌的风险度的比较。
32.权利要求31的装置,其中计算机可读存储器还包括标示着多个经诊断患有乳腺癌 的个体中至少一个多态型标志的至少一个等位基因或至少一个单倍型的频率的数据,和标 示着多个参照个体中至少一个多态型标志的至少一个等位基因或至少一个单倍型的频率 的数据,并且其中发生与至少一个等位基因或单倍型关联的乳腺癌的风险度基于经诊断患 有乳腺癌的个体与参照个体中至少一个等位基因或单倍型的频率的比较。
33.权利要求30至32的任一项的装置,其中至少一个标志或单倍型包括选自表4中所 示的标志的至少一个标志。
34.权利要求30至33的任一项的装置,其中至少一个标志或单倍型选自下组 rs999737(SEQ ID NO :6)、rs2005154 (SEQ ID NO 1)、rs2184380 (SEQ ID NO :2)、 rs2224696(SEQ ID NO :3)、rs2242503 (SEQID NO :4)、rsl2291026(SEQ ID NO :5)、 rs9956546(SEQ ID NO :7)、rsl1912922(SEQ ID NO :8)、rs6001954(SEQ ID NO :9)。
35.权利要求30至34的任一项的装置,其中风险度测量以比值比(OR)或相对风险度 (RR)来表征。
36.鉴定用于评估对乳腺癌的易感性的标志的方法,所述方法包括a.鉴定至少一个多态型标志,所述多态型标志与选自下组的至少一个标志处于连锁 不平衡中rs999737(SEQ ID NO :6)、rs2005154 (SEQID NO 1)、rs2184380 (SEQ ID NO:2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、 rs9956546(SEQID NO :7)、rsl1912922(SEQ ID NO :8)、rs6001954(SEQ ID NO :9);b.测定经诊断患有乳腺癌或具有对乳腺癌易感性的个体的样品针对至少一个多态型 标志的基因型状态;和c.测定对照个体的样品针对至少一个多态型标志的基因型状态;其中经诊断患有乳腺癌或具有对乳腺癌易感性的个体中至少一个多态型中的至少一 个等位基因的频率与对照样品中所述至少一个等位基因的频率相比的显著差异标示着所 述至少一个多态型对于评估对乳腺癌的易感性是有用的。
37.权利要求36的方法,其中经诊断患有乳腺癌或具有对乳腺癌易感性的个体的至少 一个多态型中的至少一个等位基因的频率与对照样品中所述至少一个等位基因的频率相 比较的增加标示着所述至少一个多态型对于评估增加的对乳腺癌的易感性是有用的。
38.权利要求36或权利要求37的方法,其中经诊断患有乳腺癌或具有对乳腺癌易感性 的个体中至少一个多态型中的至少一个等位基因的频率与对照样品中所述至少一个等位 基因的频率相比较的减少标示着所述至少一个多态型对于评估减少的对乳腺癌的易感性 或对抗乳腺癌的保护作用是有用的。
39.对获自人个体的核酸样品进行基因分型的方法,所述方法包括确定至少一个多 态型标志的至少一个等位基因是否存在于来自个体样品的核酸样品中,其中所述至少一 个标志选自 rs999737(SEQ ID NO :6)、rs2005154 (SEQ ID NO 1)、rs2184380 (SEQ ID NO: 2)、rs2224696(SEQID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、 rs9956546(SEQ ID NO :7)、rsll912922 (SEQ ID NO :8)、rs6001954 (SEQID NO :9)以及与它 们处于连锁不平衡中的标志,并且其中所述至少一个等位基因在样品中的存在的确定标示 着个体中对乳腺癌的易感性。
40.权利要求39的方法,其中rs20051M中的等位基因T、rs2184380中的等位基因 G、rs2224696中的等位基因T、rs2242503中的等位基因C、rsl2291026中的等位基因G、 rs999737中的等位基因C、rs9956546中的等位基因A、rsll912922中的等位基因T或 rs6001954中的等位基因G的存在的确定标示着个体的增加的对乳腺癌的易感性。
41.就对乳腺癌治疗剂的反应的可能性评估个体的方法,所述方法包括确定至 少一个多态型标志的至少一个等位基因是否存在于获自个体的核酸样品中或来源于 个体的基因型数据集中,其中所述至少一个多态型标志选自rs999737(SEQ ID NO 6)、rs2005154(SEQ ID NO : 1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、 rs2242503(SEQID NO :4)、rsl2291026(SEQ ID NO :5)、rs9956546(SEQ ID NO :7)、 rsll912922(SEQ ID NO :8)、rs6001954(SEQ ID NO :9)以及与它们处于连锁不平衡中的标 志,其中所述至少一个标志的所述至少一个等位基因的存在标示着对所述治疗剂的阳性反 应的可能性。
42.预测经诊断患有乳腺癌的个体的预后的方法,所述方法包括确定至少一个多态 型标志的至少一个等位基因是否存在于获自个体的核酸样品中或来源于个体的基因型数 据集中,其中所述至少一个多态型标志选自rs999737(SEQ ID NO 6), rs2005154(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、 rsl2291026(SEQ ID NO :5)、rs9956546(SEQ ID NO :7)、rsll912922(SEQ ID NO :8)、rs6001954(SEQ ID NO 9)以及与它们处于连锁不平衡中的标志,其中所述至少一个等位基 因的存在标示着个体的乳腺癌的恶化预后。
43.监控正在经历乳腺癌治疗的个体的治疗进展的方法,所述方法包括确定至少一个 多态型标志的至少一个等位基因是否存在于获自个体的核酸样品或来源于个体的基因型 数据集中,其中所述至少一个多态型标志选自rs999737(SEQ ID NO 6), rs2005154(SEQ ID NO :1)、rs2184380(SEQ ID NO :2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQID NO: 4), rsl2291026(SEQ ID NO :5)、rs9956546(SEQ ID NO :7)、rsll912922(SEQ ID NO :8)、 rs6001954(SEQ ID NO :9)以及与它们处于连锁不平衡中的标志,其中所述至少一个等位基 因的存在标示着个体的治疗结果。
44.权利要求41至43的任一项的方法,其中所述至少一个多态型标志选自表4中所示 的标志。
45.寡核苷酸探针在用于诊断和/或评估人个体中对乳腺癌的易感性的试剂的制造中 的用途,其中所述探针与具有SEQ ID NO :1-562的任意一个中所示的核苷酸序列的核酸的 区段杂交,并且其中所述探针在长度上为15至500个核苷酸。
46.测定人个体中对乳腺癌的易感性的方法,所述方法包括获得关于人个体的核酸序列数据鉴定至少一个多态型标志的至少一个等位基因,所 述标志选自 rs999737(SEQ ID NO :6)、rs2005154 (SEQID NO :1)、rs2184380 (SEQ ID NO: 2)、rs2224696(SEQ ID NO :3)、rs2242503(SEQ ID NO :4)、rsl2291026(SEQ ID NO :5)、 rs9956546 (SEQID NO :7)、rsll912922 (SEQ ID NO :8)、rs6001954 (SEQ ID NO :9)以及与它 们处于连锁不平衡中的标志,其中所述至少一个多态型标志的不同等位基因与人中对乳腺 癌的不同易感性关联,和根据核酸序列数据测定对乳腺癌的易感性。
47.权利要求46的方法,其包括获得关于至少2个多态型标志的核酸序列数据,所 述标志选自 rs999737(SEQ ID NO :6)、rs2005154 (SEQ ID NO 1)、rs2184380 (SEQ ID NO: 2)、rs2224696(SEQ ID NO :3)、rs2242503 (SEQ ID NO :4)、rsl2291026 (SEQ ID NO :5)、 rs9956546 (SEQID NO :7)、rsl 1912922 (SEQ ID NO :8)、rs6001954 (SEQ ID NO :9)以及与它 们处于连锁不平衡中的标志。
48.权利要求46或权利要求47的方法,其中易感性的测定包括将核酸序列数据与包含 至少一个多态型标志与对乳腺癌的易感性之间的关联数据的数据库相比较。
49.权利要求48的方法,其中所述数据库包括针对至少一个多态型标志的对乳腺癌的 易感性的至少一个风险度测量。
50.权利要求48的方法,其中所述数据库包括查找表,其包括针对至少一个多态型标 志的至少一个病症的至少一个风险度测量。
51.权利要求46至50的任一项的方法,其中获取核酸序列数据包括获取源自人个体的 生物样品和分析该样品的核酸中的至少一个多态型标志的序列。
52.权利要求51的方法,其中分析至少一个多态型标志的序列包括确定所述至少一个 多态型标志的至少一个等位基因的存在或不存在。
53.权利要求46至50的任一项的方法,其中获取核酸序列数据包括从既存记录获取核 酸序列信息。
54.权利要求46至53的任一项的方法,其还包括将易感性报告给至少一个实体,所述 实体选自个体、个体的监护人、基因服务提供商、医生、医疗机构和医疗保险公司。
55.权利要求46至M的任一项的方法,其中所述至少一个多态型标志选自表4中所列 的标志组成的组。
56.权利要求46至55的任一项的方法,其中所述至少一个多态型标志选自 rs999737(SEQ ID NO :6)、rs2005154(SEQ ID NO 1)、rs2184380(SEQ ID NO :2)、 rs2224696(SEQ ID NO :3)、rs2242503 (SEQID NO :4)、rsl2291026(SEQ ID NO :5)、 rs9956546(SEQ ID NO :7)、rsl1912922(SEQ ID NO :8)、rs6001954(SEQ ID NO :9)。
57.前述权利要求的任一项的方法、试剂盒、用途、介质或装置,其中针对乳腺癌等位基 因的至少一个风险性等位基因的存在的确定预示着雌激素受体阳性或孕激素受体阳性乳 腺癌。
58.前述权利要求的任一项的方法、试剂盒、用途、介质或装置,其中标志之间的连锁不 平衡由连锁不平衡测量r2和/或ID' ι的特定数值表征。
59.前述权利要求的任一项的方法、试剂盒、用途、介质或装置,标志之间的连锁不平衡 由为至少0.2的r2值表征。
60.前述权利要求的任一项的方法、试剂盒、用途、介质或装置,其中所述人个体是包括 欧洲人祖先的祖先。
全文摘要
本发明涉及经测定为乳腺癌的易感性变体的某些遗传变型。描述了疾病处治包括诊断增加的对乳腺癌的易感性的方法,预测对治疗的反应的方法和使用变体预测预后的方法。本发明还涉及用于本发明的方法的试剂盒。
文档编号C12Q1/68GK102144036SQ200980134453
公开日2011年8月3日 申请日期2009年7月3日 优先权日2008年7月7日
发明者P·苏勒姆, S·斯达赛 申请人:解码遗传学私营有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1