Chr8q24.21上的变异造成癌症风险的制作方法

文档序号:432251阅读:1081来源:国知局

专利名称::Chr8q24.21上的变异造成癌症风险的制作方法CHR8Q24.21上的变异造成癌症风险相关申请本申请与2005年5月18日提交的美国临时专利申请No.60/682,147和2006年4月28日提交的美国临时专利申请No.60/795,768有关。上述申请的全部描述在此引为参考。发明背景癌症,恶性细胞的不受控制的生长,是现代医学时代的主要健康难题,在发达国家中是主要死因之一。在美国,四分之一的死亡是由癌症引起的(Jemal,A.等,C4C羅e".C//w.52:23-47(2002))。在过去的几十年间,前列腺癌的发生率急剧上升,现在,在美国和西欧,前列腺癌是主要的死因(Peschel,R.E.和J.W.Colberg,丄a"c"(233-41(2003);Nelson,W.G.等,TV.J.Mec/.34外":366-81(2003))。在工业化国家,前列腺癌是男性中最频繁诊断出的非皮肤恶性肿瘤,仅在美国,八个男性中就有一个在其一生中将发展出前列腺癌(Simard,J.等,fW簡W,"3问:2029-40(2002))。尽管环境因素例如饮食因素和与生活方式有关的因素对前列腺癌的风险有贡献,遗传因素也已经被显示出扮演了重要角色。事实上,阳性家族史是前列腺癌最强的流行病学风险因素之一,在同卵双胞胎中比较前列腺癌的一致发生的双胞胎研究,也始终表明在前列腺癌的风险中比在任何其它类型的癌症的风险中存在更强的遗传成分(Nelson,W.G.等,tV.五"g/.Af^/.345Y力:366-81(2003);LichtensteinP.等,AA.五wg/.J.W3f2力78-85(2000))。此外,在关于冰岛从1955年到2003年所有诊断出的癌症病例的家族性的全国范围研究中,在前列腺癌病例的第一到第五级亲属中观察到了增加的前列腺癌风险(Amundadottir等,P丄oSMe^d"e/f":e65(2004))。由亲属间的增加的风险所显示出的这种疾病的遗传基础,进一步得到了在特定人群中进行的前列腺癌研究的支持例如非裔美国人有最高的前列腺癌发生率和由此疾病引起的死亡率,与欧裔美国人相比,他们有1.6倍可能性发展出前列腺癌,2.4被可能性死于该疾病(Ries,L.A.G.等,AW/尸"Z).99-柳9(1999))。前列腺癌影响男性,预期寿命平均减少40%。如果检测得早,在转移和局部扩散到囊之外以前,前列腺癌可以被治愈(例如使用外科手术)。但是,如果在从前列腺扩散和转移之后被诊断,前列腺癌典型来说是致死的疾病,治愈率低。尽管基于前列腺特异性抗原(PSA)的筛选方法对前列腺癌的早期诊断有帮助,但它的灵敏度和特异性都不高(Punglia等,A^wg〃Mec/.3萍」:335-42(2003))。这意味着这种测试伴随着高百分率的假阴性和假阳性诊断。结果是许多情况下漏检了癌症,或对没有癌症的人进行了不必需的进一步活组织检査。多达65%到85%的患前列腺癌个体(依赖于年龄)的PSA值小于或等于4.0ng/mL,该值一般被用作正常PSA水平的上限(Punglia等,WJ.脸d.J所力:335-42(2003》Cookston,M.S.,C騰erCow加/柳133-40(2001);Thompson,LM.等,TV£"g/.丄Mo/.350:2239-46(2004))。那些具有低PSA水平的癌症中的很大一部分被划分为Gleason7级或以上,这是侵袭性前列腺癌的度量。W。除了上述的灵敏度问题之外,PSA测试也有特异性和预测预后的难题。在没有前列腺癌的人中PSA水平可能是异常的。例如,良性前列腺肥大(BPH)是PSA测试假阳性的一个常见原因。此外,多种非癌症的病症可能提高血清PSA水平,包括尿潴留、前列腺炎、激烈的前列腺按摩和射精。W。在阳性PSA水平的病人中,如果肿瘤太小而不能通过超声看见,随后的使用活组织针检来证实前列腺癌将是困难的。一般来说会取多个随机样品,但是由于仅取样少量组织,前列腺癌诊断可能被遗漏。数字式直肠检査(DRE)也会遗漏许多癌症,因为只检查前列腺的后叶。由于早期癌症是不可触知的,通过DRE检测的癌症可能已经扩散到前列腺之外了(MistryKJ.,Fam.户rad./6(%):95-101(2003))。因此,对于能够便利前列腺癌的早期检测和预后、以及帮助预防性或治疗性治疗该疾病的改进的诊断方法,显然有极大的需求。此外,也需要开发工具,以更好地鉴别更可能患有侵袭性形式的前列腺癌的病人与更可能患有更良性形式的、仍然位于前列腺之内、因此对于发病率和死亡率没有显著贡献的前列腺癌的病人。这将帮助没有明显危险的病人避免侵入性的和昂贵的步骤。乳腺癌在美国和全世界是女性的重要健康问题。尽管在该疾病的检测和治疗方面已经取得了许多进展,乳腺癌仍然是女性中与癌症相关的第二大致死原因,在美国每年侵袭超过180,000名女性。对于北美女性来说,在一生中患乳腺癌的几率现在是八分之一。目前没有普遍成功的治疗或预防乳腺癌的方法可用。目前,乳腺癌的管理依赖于早期诊断(例如通过常规的乳腺筛选步骤)和侵袭性治疗的结合,后者可以包含一种或多种不同的治疗,例如外科手术、放射性治疗、化学治疗和激素治疗。具体的乳腺癌的治疗过程通常根据各种预后参数进行选择,包括分析特定的肿瘤标记物,参见例如Porter-Jordan禾口Lippman,B-ec^5:73-100(1994)。尽管BRCA1和BRCA2的发现是鉴定参与乳腺癌的关键遗传因素的重要步骤,但现在已经清楚BRCA1和BRCA2中的突变只能解释一部分对乳腺癌的遗传易感性(Nathanson,K丄.等,Mo/./0(7力715-720(2001);AnglicanBreastCancerStudyGroup.,CawcerS3(76^:1301-08(2000);以及SyrjakoskiK.等,丄A^/.Ca"cer/"w.1529-31(2000))。尽管对乳腺癌的治疗方法进行了相当多的研究,乳腺癌仍然难以有效诊断和治疗,在乳腺癌病人中观察到的高死亡率表明在该疾病的诊断、治疗和预防中的改进是需要的。关于冰岛从1955年到2003年所有诊断出的癌症病例的家族性的全国范围研究中,deCODE在乳腺癌病例的第一到第五级亲属中证实了增加的乳腺癌风险(Amundadottir等,尸丄oS"Med.柳e65(2004);LichtensteinP.等,TV.五"g/.M/.WV":78-S5(2000)),其中作者显示出在接近45,000对双胞胎人群中测试的所有癌症中,乳腺癌是具有最高遗传率的癌症之一。在世界范围内,肺癌比任何其它形式的癌症引起了更多的癌症死亡(Goodman,G.E.,TAorax57:994-999(2002))。在美国,肺癌在男性和女性中都是癌症死亡的主要原因。在2002年,肺癌的死亡率估计为134,900例,超过乳腺癌、前列腺癌和结肠癌的总和。W。在所有欧洲l国家,肺癌也是癌症死亡的主导因素,在发展中国家肺癌也在快速增加。尽管环境因素例如生活方式因素(例如吸烟)和饮食因素在肺癌中扮演了重要角色,遗传因素也对该疾病有贡献。例如,一组负责致癌物活化、降解和随后的DNA修复的酶已经被发现与肺癌的易感性有关。W。此外,deCODE的遗传学家通过分析在48年间在冰岛诊断出的所有肺癌病例,已经显示出核心家族之外的家族成员的增加的风险。该增加的风险不能完全用吸烟解释,表明遗传变异可能使某些个体易患肺癌(Jo励n等,,间:2977-83(2004);Amundadottir等,仰:e65(2004))。所有肺癌病人的五年存活率,不论诊断时疾病处于什么阶段,仅为13%。这与疾病仍然位于局部时检测到的病例中46%的五年存活率形成对比。但是,仅有16%的肺癌是在疾病扩散前被发现。早期检测是困难的,因为临床症状直到疾病达到高级阶段才能观察到。目前,使用胸部x-射线、分析痰液中包含的细胞的类型以及支气管的光纤检查来帮助诊断。治疗方案由癌症的类型和阶段所决定,包括外科手术、放疗和/或化疗。尽管对于这种和其它癌症的治疗方法进行了相当多的研究,肺癌仍然难以有效诊断和治疗。因此,在本
技术领域
对检测和治疗这种癌症的改进的方法有极大的需求。在北美,恶性黑素瘤的发生率比任何其它类型的人类癌症增加得更快(Armstrong等,C羅e"脏79-^:219-240(1994))。尽管黑素瘤在早期阶段被鉴定出时是可治愈的,但这需要在原发肿瘤扩散到远处位点之前将其检测并移除。恶性黑素瘤具有极大的转移倾向,对于常规的癌症治疗方法例如化疗和口-照射具有显著的抗性。一旦转移发生,预后非常不好。因此,黑素瘤的早期检测在黑素瘤的治疗和控制中是极其重要的。研究已经证实遗传因素在黑素瘤中扮演了重要角色。基于瑞典和冰岛人群的研究报道了在第一级亲属中标准化的发生率是大约2(HemminkiK.,丄/騰".D簡Wo/.",:217-23(2003);Amundadottir等,"oSMd/:e65(2004))。家族性病例趋向于具有较早的发病年龄和较高的多个原发肿瘤的风险,这进一步建议了遗传因素的参与(参见例如TuckerM.,Oncogene22(20):3042-52(2003))。遗传和环境风险因素的相互作用可能在黑素瘤中扮演了重要角色。但是,正常的黑素细胞如何转化成黑素瘤细胞的分子和生物学机制仍然不清楚。显然,鉴定负责对特定形式的癌症(例如前列腺癌、乳腺癌、肺癌、黑素瘤)的易感性的标记物和基因是今天肿瘤学所面临的主要挑战之一。对于对癌症具有遗传易感性的个体进行早期检测的鉴定方法有需求,以便对于癌症的早期检测和治疗可以建立起更具有效的筛选和干预方案。癌症基因也可以揭示出可以被操作的关键分子途径(例如使用小或大分子量的药物),以及不论特定的癌症首先被诊断出时是什么癌症阶段,可以产生出更有效的治疗方案。发明简述正如在本文中描述的那样,染色体8q24.21上的基因座已经被证明在癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)中扮演重要角色。已经发现该基因座中特定DNA片段中的特定标记物和/或遗传标记物的组合("单倍型")是对特定癌症易感性的指示。在一个实施方案中,本发明是诊断受试者中对癌症易感性的方法,包括检测与LD区块A有关的标记物或单倍型,其中标记物或单倍型的存在是对癌症易感性的指示。在特定的实施方案中,本发明是诊断选自前列腺癌、乳腺癌、肺癌和黑素瘤的癌症的易感性的方法。在某些实施方案中,是癌症或癌症易感性的指示的标记物或单倍型,包含至少一种从含有表13中列出的标记物的组中选择的标记物。在另一个实施方案中,方法包括了检测含有表13中的至少两种标记物的单倍型。在一个实施方案中,标记物或单倍型(例如与LD区块A有关的标记物或单倍型)的存在是对特定治疗方式(例如特定的治疗药剂、抗技术药物、化学治疗药剂、放射性治疗)的不同反应率的指示。因此,通过确定受试者是否带有标记物或单倍型,人们可以确定受试者是否将对用于治疗癌症的特定治疗、抗激素药物和/或放射性疗法反应得更好或更坏。在一个实施方案中,标记物或单倍型(例如与LD区块A有关的标记物或单倍型)的存在是对肿瘤或其前体中Chr8q24.21的体细胞重排(例如扩增、易位、插入和/或缺失中的一或多种)的倾向性的指示。在一个实施方案中,标记物或单倍型包含一个或多个与Chr8q24.21相关的标记物,它们与从含有表13中列出的标记物的组中选出的一个或多个标记物处于连锁不平衡(定义为相关系数的平方,r2,大于0.2)。在一个实施方案中,本发明是诊断对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的方法,包括检测与Chr8q24.21有关的标记物或单倍型,其中标记物或单倍型的存在是对癌症易感性的指示。在一个实施方案中,本发明是预测受试者中侵袭性前列腺癌的增加的风险(例如Gleason评分7(4+3)级到10级,增加的阶段,更坏的结果)的方法,包括检测与LD区块A有关的标记物或单倍型,其中标记物或单倍型的存在是侵袭性前列腺癌的增加的风险的指示。在特定的实施方案中,受试者己经被诊断患有前列腺癌,或还没有被诊断为前列腺癌。在一个实施方案中,标记物或单倍型具有大于1的相对风险,即标记物或单倍型赋予了增加的癌症风险(标记物或单倍型是有风险的)。在另一个实施方案中,标记物或单倍型具有小于1的相对风险,即标记物或单倍型赋予了减小的癌症风险(标记物或单倍型是保护性的)。在一个实施方案中,本发明是用于分析受试者的样品(例如组织、血液)以检测对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)的遗传易感性的试剂盒。这样的试剂盒包含一种或多种用于检测与LD区块A有关的标记物或单倍型的试剂。在具体的实施方案中,这样的试剂包含了至少一种连续的核苷酸序列,该序列与含有至少一种选自表13中列出的标记物的区域完全互补。在具体的实施方案中,这样的试剂包含了至少一种连续的核苷酸序列,该序列与含有rs1447295A等位基因或DG8S737-8等位基因的区域完全互补。在一个实施方案中,本发明是用于在受试者中诊断癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)的增加的风险的方法,包括筛选与LD区块A相关的标记物或单倍型,其中的标记物或单倍型在患有癌症的受试者中比在不患有癌症的受试者中更频繁存在,其中标记物或单倍型的存在增加了受试者患有癌症的风险。在具体的实施方案中,防线增加了至少大约5%,或者风险的增加被鉴定为至少大约1.2的相对风险。在一个实施方案中,本发明是在受试者中诊断对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)的易感性的方法,包括从受试者获得核酸样品并分析核酸样品中是否存在至少一种标记物或单倍型,其中的标记物或单倍型含有一个或多个从含有表13中列出的标记物的组中选择的标记物。在本实施方案中,标记物或单倍型的存在是对癌症易感性的指示。在一个实施方案中,本发明是在受试者中诊断对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)的易感性的方法,包括从受试者获得核酸样品并分析核酸样品中是否存在至少一个与LD区块A相关的标记物或单倍型,其中标记物或单倍型的存在是对癌症易感性的指示。在具体的实施方案中,标记物或单倍型含有一个或多个从含有表13中列出的标记物的组中选择的标记物。在另一个实施方案中,标记物或单倍型具有大于1的相对风险,含有DG8S737-8等位基因或rs1447295A等位基因。在一个实施方案中,本发明是在受试者中诊断对癌症易感性的方法,包括分析从受试者获得的核酸样品中至少一个与LD区块A有关的标记物或单倍型的存在,其中标记物或单倍型的存在是对癌症易感性的指示。在具体的实施方案中,标记物或单倍型含有一个或多个从含有表13中列出的标记物的组中选择的标记物。在另一个实施方案中,标记物或单倍型具有大于1的相对风险,含有DG8S737-8等位基因或rsl447295A等位基因。在另一个实施方案中,受试者是黑人非洲血统。在本发明的一个实施方案中,癌症选自前列腺癌、乳腺癌、肺癌和黑素瘤。在一个优选实施方案中,癌症是前列腺癌,标记物或单倍型具有至少1.5的相对风险。在另一个实施方案中,前列腺癌是侵袭性前列腺癌,被定义为组合的Gleason7(4+3)级到10级。在另一个实施方案中,前列腺癌是侵袭性较低的前列腺癌,被定义为组合的Gleason2级到7(3+4)级。在另一个实施方案中,标记物或单倍型的存在是更具侵袭性的前列腺癌和/或更坏的预后的指示。在另一个实施方案中,癌症是乳腺癌,标记物或单倍型具有至少1.3的相对风险。在另一个实施方案中,癌症是肺癌,标记物或单倍型具有至少1.3的相对风险。在另一个实施方案中,癌症是黑素瘤,标记物或单倍型具有至少1.5的相对风险。在另一个实施方案中,黑素瘤是恶性皮肤黑素瘤。在本发明的另一个实施方案中,标记物或单倍型的存在是受试者对特定治疗方式的不同反应率的指示。在另一个实施方案中,标记物或单倍型的存在是肿瘤或其前体中Chr8q24.21的体细胞重排的倾向性的指示。在特定的实施方案中,体细胞重排选自扩增、易位、插入和缺失。在本发明的另一个实施方案中,用于诊断对癌症易感性的标记物或单倍型含有一个或多个与Chr8q24.21相关的标记物,它们与选自表13中列出的标记物的一个或多个标记物处于强烈的连锁不平衡,正如由(|D'|〉0.8)禾口/或一〉0.2所确定的那样。在一个实施方案中,一个或多个标记物选自表13中的标记物,含有rs1447295A等位基因或DG8S737-8等位基因。在另一个实施方案中,用于诊断对癌症易感性的至少一种标记物或单倍型具有小于1的相对风险,并含有rsl2542685等位基因T和rs7814251等位基因C。在另一个实施方案中,至少一种标记物或单倍型含有至少一个表13中显示的具有小于1的相对风险的标记物。在优选实施方案中,癌症是前列腺癌。在另一个实施方案中,受试者是黑人非洲血统。在一个实施方案中,本发明涉及分析来自受试者的样品以检测对癌症易感性的试剂盒,其中的试剂盒含有一个或多个用于检测与LD区块A相关的标记物或单倍型的试剂。在一个实施方案中,一或多种试剂含有至少一种连续的核苷酸序列,该序列与含有至少一种标记物的区域完全互补,该标记物选自表13中列出的标记物。在一个实施方案中,癌症是前列腺癌。在优选实施方案中,一或多种试剂含有至少一种连续的核苷酸序列,该序列与含有rsl447295A等位基因或DG8S737-8等位基因的区域完全互补。在具体的实施方案中,受试者是黑人非洲血统。在一个实施方案中,本发明是在受试者中诊断与Chr8q24.21相关的癌症的方法,包括检测与Chr8q24.21相关的标记物或单倍型(例如本文描述的标记物或单倍型)的存在,其中标记物或单倍型的存在是与Chr8q24.21相关的癌症的指示。在具体的实施方案中,与Chr8q24.21相关的癌症是与Chr8q24.21相关的前列腺癌、与Chr8q24.21相关的乳腺癌、与Chr8q24.21相关的肺癌或与Chr8q24.21相关的黑素瘤。在另一个实施方案中,本发明是通过检测标记物DG8S737或标记物rs1447295来诊断对前列腺癌易感性、或对前列腺癌(例如侵袭性前列腺癌)增加的风险的方法,其中标记物DG8S737的等位基因-8或标记物rsl447295的等位基因A的存在是对前列腺癌易感性、或对前列腺癌的增加的风险的指示。在另一个实施方案中,本发明通过检测标记物DG8S737在具有包括非洲血统的血统的人类中来诊断对前列腺癌的易感性,其中标记物DG8S737的等位基因-8的存在是对前列腺癌易感性的指示。附图简述根据下面对本发明的优选实施方案的更具体的描述,以及在下面的图中所进行的描述,本发明的前述的和其它的目标、特点和优点将变得明显。图1是染色体8的连锁扫描图,描述染色体8q24上的染色体范围上重要的LOD分数为4.0。图2描述了使用352微卫星标记物在Chr8q24.21上进行的前列腺癌的单倍型相关性分析。图3A和3B描述了与前列腺癌相关的单倍型区域中的LD结构(HAPMAP)。等效间隔意味着每个标记物在两个邻近的标记物之间以连续的次序以相同的距离显示(图3A)。实际位置意味着任何两个标记物之间的正确间隔(NCBIBuild34)被表示在图(图3B)中。图4描述了冰岛人的LD结构。等效间隔意味着每个标记物在两个邻近的标记物之间以连续的次序以相同的距离显示。图5描述了示意性的对染色体8q24.21的鉴定已知基因作图。图6A1-6A31描述了NCBIBuild34(SEQIDNO:1;Build34,hgl6一chr8:1284140007128506000.正(+)链)中的从128.414到128.506的基因组DNA序列。图6中的号码以及其中包含的表中指示的bp是指在NCBIBuild34的染色体8中的位置。图7A-7D描述了染色体8q24.21上的区域中前列腺癌的连锁和群丛(association)结果、标记物密度和LD结构的示意图。图7A显示了使用冰岛323个大家庭中的871个前列腺癌病人进行的染色体8q的连锁扫描结果。图7B描述了不相关的前列腺癌病例(对照病例组l,n=869)的单一标记物群丛结果,使用了在10Mb区域中分布的358个微卫星和插入缺失(蓝色菱形)。图7C显示了所有前列腺癌病例(n=1291)的单一标记物群丛结果,红色方框表示加入到该区域的63个SNPs和12个微卫星的P值,蓝色菱形表示已经从7B输入到该区域中的其它标记物的值。图7D描述了图7C的600kb区域的CEUHapMap人群(II期)的两两配对的LD,底部的灰色三角形指示了在正文中讨论的c-MYC基因和AW183883EST的位置。在右边提供了r"的标度。黑色竖线代表了微卫星(图7B)以及用于群丛分析的微卫星和SNPs(图7C)的密度。图8描述了HapMap样品的46个SNPs和DG8S737微卫星的系统发育网络。图9A-9C描述了CEU和非裔美国人群中典型的17个SNPs和DG8S737的-8等位基因之间的连锁不平衡。CEU的17个SNPs和DG8S737的-8等位基因的连锁不平衡(LD)被显示在图9A中,非裔美国人的密西根组的的LD显示在9B中。这里显示的是等位基因对之间的D'(左上)和r2(右下)。标记物之间以相等的距离作图,物理位置在图9C中给出。标记物的名字显示在纵轴上,碱基对位置显示在横轴上。图IO是鉴定的AW剪接变异体的示意图。外显子被显示成方框,内含子显示为线形。转录本在Chr8q24上从128,258延伸到128,451Mb。外显子的长度如下外显子1:503bp's;外显子2:343bp's;外显子3:103bp's;外显子4:88bp's;外显子5:371bp's;外显子6:135bp's;长外显子6:546bp's;外显子7:140bp's和外显子8:246bp's。注意图没有按比例画出。发明详述包含癌症病人的人群的扩展的系谱信息与强有力的基因共享方法相结合,对染色体8q24.21上的基因座进行了作图,该基因座已经被证实在癌症(例如乳腺癌、前列腺癌、肺癌、黑素瘤)中扮演了重要角色。使用了基因组范围的标记物组对不同癌症病人及其亲属进行了基因分型,该标记物组包含了1100个微卫星标记物,平均标记物密度3-4cM。这里显示了对引起癌症(例如乳腺癌、前列腺癌、肺癌、黑素瘤)的遗传位点进行基因组范围的搜索的结果。与不娜式游舰被游基鹏欽鄉線在过去的几十年间,前列腺癌的发生率急剧增加。前列腺癌是多种因素引起的疾病,其病因学中有遗传和环境的成分参与。其特征为不均匀的生长形式,范围从缓慢生长的肿瘤到非常快速的高度转移性的病变。尽管遗传因素是前列腺癌最强的流行病学风险因子之一,对参与该疾病的遗传决定因子的搜索正在艰难地进行中。研究表明,将参选的遗传标记物与前列腺癌相联系比鉴定其它癌症、例如乳腺癌、卵巢癌和结肠癌的易感性基因更为困难。对于这种增加的困难性提出的几个原因包括前列腺癌通常在晚年被诊断出来,因此通常难以从超过一代的活的患病个体获得DNA样品;在高风险谱系中存在与遗传和偶发形式之间缺少可分辨的特征有关的拟表型;以及前列腺癌的遗传异质性和为这种复杂的疾病开发适合的统计传输模型所伴随的困难(Simard,J.等,五油cn',油gj附2029-40(2002))。在基因组上已经进行了多次前列腺癌易感性基因组搜索,并报道了几个前列腺癌易感性基因座。例如,已经提出HPCl(lq24-q25)、PCAP(lq42-q43)、HCPX(Xq27-q28)、CAPB(lp36)、HPC20(20ql3)、HPC2/ELAC2(17pll)和16q23作为前列腺癌易感性基因座(Simard,J.等,^!^cn.wo/og;;(^):2029-40(2002);Nwosu,V.等,Hwm.Mo/./0卩W:2313-18(2001))。在Smith等进行的基因组搜索中,最有力的连锁证据位于HPC1,尽管两点分析也显示出D4S430上LOD分值〉1.5,在几个基因座包括Xq27-28上的标记物的LOD分值〉1.0(OstranderE.A.禾口J丄.Stanford,力w.//應.Gewet67:1361-15(2000))。另一个基因组搜索报道了使用常染色体遗传显性模型得到染色体10q、12q和14q的两点LOD分值^1.5,使用遗传的隐形模型得到染色体lq、8q、10q和16p的两点LOD分值>1.5。A/。另一个基因组搜索鉴定出在2q、12p、15q、16q和16p上不太明显连锁的区域。A/。使用一小组犹他州高风险前列腺癌系谱和一组300个多态性标记物进行的前列腺癌易发性基因座的基因组搜索提供了与染色体17p上的基因座连锁的证据(Simard.J.等,五"^cr/wo/og;;743(^):2029-40(2002))。在2003年后期,发表了8个新的连锁分析,描述了显著的不均一性。报道了11个LOD分值超过2.0的峰,它们之中没有重叠(参见Actaneconsortium,Schleutker等,Wiklund等,Witte等,Janer等,Xu等,Lange等,Cunningham等;它们所有都出现在《前列腺》(第57巻)Prostate,vol.57(2003)中)。如上所述,涉及前列腺癌的特定基因的鉴定是有挑战的。已经发现关联的一个基因是RNASEL,它编码广泛表达的潜在酶内切核酸酶,该酶参与干扰素诱导的RNA衰减途径,据信能够降解病毒和细胞的RNA,该基因已经被联系到HPC位点(Carpten,J.等,A^.Ge""30:181-84(2002);Casey,G.等,A^,3V":581-83(2002))。RNASEL中的突变已经与对前列腺癌的增加的易感性相关联。例如在一个家庭中,4个患有前列腺癌的兄弟在RNASEL上带有失活突变,而在另一个家庭中6个患有前列腺癌的兄弟中的4个带有碱基取代,影响了RNASEL的起始甲硫氨酸密码子。W。另一项研究表明突变的RNASEL等位基因与患有家族性前列腺癌的芬兰男性和东欧犹太人群中前列腺癌的增加的风险有关(Rokman,A.等,J.Hwm.Ge""70:1299-1304(2002);Rennert,H.等,i^w.77:981-84(2002))。此外,已经提出Ser217Leu基因型占美国65岁以下高加索人中所有偶发性病例的大约9%(Stanford,J丄.,Cfl"cer五pWe""W.SZomflry^^/Vev.7^9」:876-81(2003))。但是,与这些阳性报道相反,某些研究没能成功检测到具有失活突变的RNASEL等位基因和前列腺癌之间的任何相关性(Wang,L.等,Jm.//wm.7/:l16-23(2002);Wiklund,F.等,C"m.Omcer70(27):7150-56(2004);Maier,C.等,Ca"cer92(^:1159-64(2005))。位于8p22上的巨噬细胞清除剂受体1(MSR1)基因也已经被鉴定为候选的前列腺癌易感性基因(Xu,J.等,A^.Ge""W:321-25(2002))。在大约3%的患有非遗传性前列腺癌的男性中检测到了突变的MSR1等位基因,但是只在0.4%的未患病男性中检测到。A/。但是,不是所有后续的报道都证实了这些最初的发现(参见例如Lindmark,F.等,5P(7力132-40(2004);Seppala,E.H.等,C/f".Oz"cer9(7力:5252-56(2003);Wang,L.等,淑3柳:128-29(2003);Miller,D.C.等,Ca"ceri仏63(7":34S6-S9(2003))。MSR1为巨噬细胞清除剂受体的亚基编码,该受体能够结合多种配体、包括细菌脂多糖和脂胞壁酸、以及血清中的氧化型高密度脂蛋白和低密度脂蛋白(Nelson,W.G.等,W.丄Mec/.3:366-Sl(2003))。17号染色体上的ELAC2基因是第一个被克隆的前列腺癌易感性基因,存在于犹他州的高风险前列腺癌家族中(Tavtigian,S.V.,等,A^.27^:172-80(2001))。在一个系谱中发现了移码突变(1641InsG)。另外也发现了三个其它的错义变化Ser217Leu、Ala541Thr和Arg781His与前列腺癌风险的增加有关。在不是在前列腺癌家族史基础上选择的组中,带有Ser217Leu和Ala541Thr的男性中前列腺癌的相对风险被发现是2.37(Rebbeck,T.R.,等,爿m.丄//訓.67^:1014-19(2000))。另一项研究描述了在一个高发病率的前列腺癌家族中的新的终止突变(Glu216X)(Wang,L.,等,Ca"c^A"6"77J:6494-99(2001))。其它的报告还未证实与这三个错义突变的强烈关联性,最近的元分析建议与这些突变有关的家族性风险比在最初报告中指出的要更弱一些(Vesprini,D.,等,,/fww.Ge"W.(5Sr":912-11(2001);Shea,P.R.,等,//"m."7(^-":398-400(2002);Suarez,B.K.,等,Oz膨rto.6/(7":4982-84(2001);Severi,G.,等,J.Natl.CancerInst.95(11):818-24(2003);Fujiwara,H.,等,if謂.47(7":641匿48(2002);Camp,NJ.,等,爿w.,Ge"e/.7/附1475-78(2002))。参与雄激素作用的基因(例如雄激素受体(AR)基因、细胞色素P-450cl7(CYP17)基因、以及II型类固醇-5-口-还原酶(SRD5A2)基因)的多态性变异体也已经被显示与前列腺癌增高的风险有关(Nelson,W.G.等,N.Engl.J.Med.349(4):366-81(2003))。对于编码雄激素受体的AR来说,几项遗传流行病学研究已经显示出在前列腺癌增加的风险与短的雄激素受体多聚谷氨酰胺重复之间有相关性,但其它的研究没能检测出这种相关性。Id。连锁数据也已经显示出催化性-类固醇生物合成的关键反应的酶CYP17的等位形式与前列腺癌有关(Chang,B.等,Int.J.Cancer95:354-59(2001))。在前列腺中编码5-口-还原酶主要同工酶、功能是将睾酮转化为更有力的二氢睾酮的SRD5A2的等位变异体,己经被发现与前列腺癌的增加的风险并与患有前列腺癌的男性的不好的预后有关(Makridakis,N.M.等,丄a"c""4:915-1%(1999);Nam,R.K.等,C/油gy57:199-204(2001))。简而言之,尽管经过全世界许多研究组的努力,负责前列腺癌风险的主要部分的基因还没有被鉴定。尽管双胞胎研究显示出遗传因素在前列腺癌中可能是主要的,但仅有少量基因被鉴定出与前列腺癌增加的风险有关,并且这些基因仅占病例中的低百分率。因此,显然前列腺癌遗传风险因子中的大部分仍然有待发现。可能这些遗传风险因子将包括相当大量的低到中度风险遗传变异体。但是这些低到中度风险遗传变异体可能负责大部分的前列腺癌,因此,它们的鉴定对于公共卫生来说有极大的好处。此外,还没有报道过有发表的前列腺癌基因能够预测出侵袭性前列腺癌比侵袭性较低的前列腺癌的更大的风险。正如本文所述,已经证明染色体8q24.21上的基因座在前列腺癌中扮演重要角色,已经发现在前列腺癌患者中,该基因座中特定的DNA片段中的特定的标记物和/或单倍型出现的频率比预期在前列腺癌个体中的频率髙。因此,在本发明的各种实施方案中,使用本文描述的方法鉴定的某些标记物和/或SNPs,可以被用于诊断对前列腺癌的易感性,也可用于诊断对前列腺癌的减少的易感性,或用于鉴定针对前列腺癌的保护性变异体。下面描述的诊断分析方法可以用于鉴定是否存在这些特定的变异体。因此,在一个实施方案中,本发明是诊断对前列腺癌(例如侵袭性的或高Gleason级别的前列腺癌,低侵袭性的或低Gleason级别的前列腺癌)的易感性的方法,包括检测与LD区块A相关的标记物或单倍型(例如表13中列出的标记物,具有大于1的RR值,表明标记物与对疾病的易感性/疾病的增加的风险有关,因此是"有风险的"变异体,RR值小于1表明标记物与对疾病的减小的易感性/疾病的减小的风险有关,因此是"保护性"变异体),其中标记物或单倍型的存在是对前列腺癌易感性的指示。在另一个实施方案中,本发明是诊断对前列腺癌(例如侵袭性的或高Gleason级别的前列腺癌,低侵袭性的或低Gleason级别的前列腺癌)易感性、或前列腺癌增加的风险的方法,包括检测标记物DG8S737或标记物rs1447295,其中标记物DG8S737的等位基因-8或标记物rsl447295的等位基因A的存在是对前列腺癌易感性、或前列腺癌的增加的风险的指示。在另一个实施方案中,本发明在具有包含非洲血统的血统的人类中来诊断对前列腺癌的易感性的方法,包括检测标记物DG8S737,其中标记物DG8S737的等位基因-8的存在是对前列腺癌易感性或对前列腺癌增加的风险的指示。在具体的实施方案中,与前列腺癌易感性相关的标记物或单倍型具有至少1.5、或至少2.0的相对风险。在另一个实施方案中,前列腺癌是侵袭性前列腺癌,可以通过组合的Gleason分值7(4+3)到10、和/或前列腺癌的高级阶段(例如阶段2到4)来确定。在另一个实施方案中,前列腺癌是较低侵袭性的前列腺癌,可以通过组合的Gleason分值2到7(3+4)、和/或前列腺癌的早期阶段(例如阶段1)来确定。在另一个实施方案中,与LD区块A有关的标记物或单倍型的存在、与患者具有大于4ng/ml的PSA水平相结合,是更具侵袭性前列腺癌和/或更坏的预后的指示。在另一个实施方案中,在具有正常PSA水平(例如低于4ng/ml)的病人中,标记物或单倍型的存在是更具侵袭性前列腺癌和/或更坏的预后的指示。在其它的实施方案中,本发祖是诊断对前列腺癌减少的易感性的方法,包括检测与LD区块A相关的标记物或单倍型,其中该标记物或单倍型的存在是对前列腺癌减少的易感性或针对前列腺癌的保护性标记物或单倍型的指示。在某些实施方案中,标记物是表13中列出的标记物、或含有表13中列出的一或多种标记物的单倍型(例如表13中列出的标记物、或含有表13中列出的一或多种标记物的单倍型,其中的标记物具有小于1的RR值,表明标记物与对疾病的减小的易感性/疾病的减小的风险有关,因此是"保护性"变异体;RR值大于1表明标记物与对疾病的增加的易感性/疾病的增加的风险有关,因此是"有风险的"变异体)。在另一个实施方案中,本发明是诊断对前列腺癌的减小的易感性、或前列腺癌减小的风险的方法,包括检测标记物DG8S737或标记物rs1447295,其中标记物DG8S737的等位基因-8或标记物rsl447295的等位基因C的存在之外的等位基因的存在是对前列腺癌减小的易感性、或前列腺癌的减小的风险(针对前列腺癌具有保护性)的指示。在另一个实施方案中,本发明是在具有包含非洲血统的血统的人类中来诊断对前列腺癌的减小的易感性的方法,包括检测标记物DG8S737,其中标记物DG8S737的等位基因-8之外的等位基因的存在是对前列腺癌减小的易感性、或前列腺癌的减小的风险(针对前列腺癌具有保护性)的指示。,蘼正如本文所描述的那样,尽管BRCA1和BRCA2的发现是重要的里程碑,鉴定了涉及乳腺癌的两个关键遗传因子,但逐渐已经明了BRCA1和BRCA2的突变仅占对乳腺癌的易感性的一部分。据估计,在女性所有的乳腺癌中,仅有5-10%与由常染色体显性基因例如BRCA1,、BRCA2、p53、pTEN和STK11/LKB1的突变造成的遗传易感性有关(Mincey,B.A.(9"co/og/W5:466-73(2003))。已经提出染色体8p上的一个遗传基因座是乳腺癌易感性基因座,这是根据在偶发性乳腺癌中该区域中记录等位基因丧失的研究提出的(Seitz,S.等,Sr.丄Cfl"cer75:983-91(1997);Kerangueven,F.等,O"cog騰70:1023(1995))。研究也已经提示乳腺癌易感性基因可能位于13q21(Kainu,T.等,/Voc.A^/.^ca《Z7&497:9603-08(2000))。但是,与前列腺癌的情况相似,其它的乳腺癌易感性基因的鉴定很困难。正如本文所描述的那样,已经证实染色体8q24.21上的位点在乳腺癌中扮演了重要角色,已经发现乳腺癌患者中该基因座中特定DNA片段上特定的标记物和/或单倍型的出现高于预期的乳腺癌患者中的频率。因此,在一个实施方案中,本发明是诊断对乳腺癌易感性的方法,包括检测与LD区块A有关的标记物或单倍型,其中标记物或单倍型的存在是对乳腺癌易感性的指示。在具体的实施方案中,与乳腺癌易感性有关的标记物或单倍型的相对风险为至少1.3。在其它实施方案中,本发明描述了诊断对乳腺癌的减少的易感性的方法,包括检测与LD区块A有关的标记物或单倍型,其中标记物或单倍型的存在是对乳腺癌减少的易感性或针对乳腺癌的保护性标记物或单倍型(针对乳腺癌具有保护性)的指示。在具体的实施方案中,与乳腺癌减少的易感性(针对乳腺癌具有保护性)有关的标记物或单倍型具有小于0.75的相对风险。/纖尽管环境、生活方式(例如吸烟)和饮食因素在肺癌中扮演了重要角色,遗传因素也是重要的。研究显示,p53和RB/pl6途径的缺陷对于肺上皮细胞的恶性转化是重要的(Yokota,J.禾nT.Kohno,Ca"cerS"'95(^」197-204(2004))。其它的基因例如K-ras、PTEN和MYOl8B在肺癌细胞中遗传改变的频率比p53和RB/pl6低,表明这些基因的改变与一部分肺癌细胞中迸一步的恶性发展或独特表型有关。/"。在p53突变和RB/pl6缺失位点进行的分子足迹研究进一步证明,DNA双链断裂的DNA修复活性和非同源的末端连接在肺癌细胞中遗传变化的积累中是重要的。/"。此外,研究已经鉴定了候选的肺部腺癌易感性基因,例如致癌药物代谢基因例如NQOKNAD(P)H:醌氧化还原酶)和GSTTl(谷胱甘肽S-转移酶Tl)、和DNA修复基因例如XRCC1(X-ray交联互补组1)(Yanagitani,N.等,Cawcer五/nV/emi'o/.Bi'omaAersfVev.72:366-71(2003);Lin,P.等,丄To;dco/.五wWro".ifea/AA5&187-97(1999);Divine,K.K.等,Mw組b.祉273-78(2001);S画ga,N.等,Ca"cer五;Wem/0/.5"maAeAs/Vev.77:730-38(2002))。染色体19ql3.3上包含基因座D19S246的区域已经被提示含有与肺部腺癌有关的基因(Yanagitani,N.等,Cawcer£^>/dem/o/.尸rev.72:366-11(2003))。正如本文所描述的那样,染色体8q24.21上的基因座已经被证实在肺癌中扮演重要角色,已经发现肺癌患者中该基因座中特定DNA片段上特定的标记物和/或单倍型的出现高于预期在肺癌患者中的频率。在一个实施方案中,本发明是诊断对肺癌易感性的方法,包括检测与LD区块A有关的标记物或单倍型,其中标记物或单倍型的存在是对肺癌易感性的指示。在具体的实施方案中,与肺癌易感性有关的标记物或单倍型的相对风险为至少1.3。在其它实施方案中,本发明描述了诊断对肺癌减少的易感性的方法,包括检测与LD区块A有关的标记物或单倍型,其中标记物或单倍型的存在是对肺癌减少的易感性或针对肺癌的保护性标记物或单倍型(针对肺癌具有保护性)的指示。在具体的实施方案中,与肺癌减少的易感性(针对肺癌具有保护性)有关的标记物或单倍型具有小于0.75的相对风险。潔蕭研究已经证明遗传因素在正常色素细胞逐步发展到异常痣、到侵入性原发黑素瘤、最后到具有侵袭性转移能力的细胞的过程中扮演重要角色(Kim,C.J.,等,Ca"cerCo",ro/9(7,:49-53(2002))。例如遗传畸变例如含有肿瘤抑制基因的染色体1上的重排,已经被发现与恶性黑素瘤有关。/么但是,成年人皮肤的正常黑素细胞如何转化成黑素瘤细胞的分子和生物学机制尚不清楚。各种研究已经显示遗传因素与黑素瘤有关。例如,通过检测犹他州人群数据库注意到黑素瘤早期发作的升高的家族风险(Cannon-Albright,L.A.,等,Ca"cer紐,5柳:2378-85(1994))。此外,瑞典家族癌症数据库报告,在具有患病的父母或近亲的个体中,皮肤恶性黑素瘤(CMM)的家族性标准化发病率(SIR)分别是2.54和2.98。对于其父母有多发性原发黑素瘤的后代来说,SIR升高到61.78(Hemminki,K.,等,/"ve"Demw/o/./20(7」:217-23(2003))。尽管数据不一,已经报道大约10%的CMM病例是家族性的(Hansen,CB.等,丄朋cW(9"co/.5":314-19(2004))。除了已知的黑素瘤环境风险因子之外,共有的环境以及遗传学可能也是这些估算的因素。但是,家族性病例倾向于具有较早的发病年龄和较高的多发性原发肿瘤的风险,表明有遗传的影响在其中。一系列基于连锁的研究表明Chr9p21上的CDKN2a可能是主要的CMM易感性基因(Bataille,V"Oz匿r1341-47(2003))。紧接其后CDK4被鉴定为途径候选者,但是,CDK4中的突变仅仅在世界范围内的几个家族被观察到(Zuo,L.,等,"(7,91-99(1996))。CDKN2a编码周期蛋白依赖性激酶抑制剂p16,它抑制CDK4和CDK6,从而阻止Gl到S期的细胞周期转变。CKDN2a的另一个转录本产生pl4ARF,它编码作用于MDM2-p53途径的细胞周期抑制剂。可能CDKN2a突变的黑素细胞在细胞周期控制中有缺陷,或作为发育阶段或对DNA损伤作出反应进入衰老阶段(Ohtani,N.,等,^T^/./"ve"W卩-力:146-53(2004))。到80岁时,CDKN2a突变在家族性CMM病例中的总外显率是67%。但是,在黑素瘤高度流行的地区外显率增加(Bishop,D.T.,等,丄A^/Cfl"cer/"W.94(7":894-903(2002))。黑素瘤遗传学协会最近使用一组与9p21或CDK4无关的主要的澳大利亚高风险家族完成了基因组范围的CMM搜索(Gillanders,E.,等,丄//ww.730:301-13(2003))。该分辨率为10cM的搜索在lp22区域中给出了非参数性的多点LOD分值2.06。其它在染色体4、7、14和18上的位点给出的LODs超过1.0。加上lp22的其它标记物和使用发病年龄限制,观察到的非参数性的LOD分值超过5.0。证据表明该位点上存在肿瘤抑制基因的高外显率突变,但是LOH的形式是复杂的(Walker,G.J.,等,Ge節C/ira附謂mesC纖er,4/(7力56-64(2004))。另一个可能与CMM有关的遗传基因座是编码黑素细胞皮质激素受体l(MC1R)的位点。MC1R是G蛋白偶联受体,参与促进从嗜铬黑色素到真黑色素合成的转换。大量被详细研究过的MC1R基因变异体已经被显示与红发,白肤和雀斑倾向表现型有关。超过一半的红发个体带有至少一种这些MC1R变异体(Valverde,P.,等,A^.Ge"W./〃":32S-30(1995);Palmer,J.S.,等,爿肌.丄//画.Ge威6柳176S6(2000))。其次,已经显示出同样的变异体给出的CMM风险有不同的比率,对单一变异来说大约为2.0,对于复合的杂合子来说大约为4.0。最近的研究显示较强的MC1R变异体增加了CDKN2a突变的外显率并降低了发病年龄(Box,N.F.,等,丄i/謂.G匿A<5柳165-13(2001);vanderVelden,P.A.,等,爿w.Ge"",卯(^」11A-19(2001))。已经显示有许多其它候选基因可能与CMM有关。例如,一项在癌症遗传学上划时代的研究在60%的黑素瘤中鉴定出BRAF(v-raf鼠肉瘤病毒癌基因的人类Bl类似物)中的体细胞突变(Davies,H.,等,Mm^eW7^砂":949-54(2002))。在典型的和非典型的痣中突变也是常见的,表明突变是早期事件。/么种系突变还没有被报道,但是BRAF的种系SNP变异体已经被显示与CMM风险有关(Meyer,P.,等,,CaW"og.2^:7(2003))。其它通过相关性研究鉴定的并可能与CMM风险有关的候选基因包括例如XRCC3、XPD、EGF、VDR、NBS1、CYP2D6和GSTMl(Hayward,N.K.,"卿:3053陽62(2003))。但是,这些相关研究通常受到样品数量少、依赖于单一SNPs和潜在的人群阶层的限制。正如本文所描述的那样,染色体8q24.21上的基因座已经被证实在黑素瘤中扮演重要角色,已经发现黑素瘤患者中该基因座中特定DNA片段上特定的标记物和/或单倍型的出现高于预期频率。在一个实施方案中,本发明是诊断对黑素瘤易感性的方法,包括检测与LD区块A有关的标记物或单倍型,其中标记物或单倍型的存在是对黑素瘤易感性的指示。在具体的实施方案中,与黑素瘤易感性有关的标记物或单倍型的相对风险为至少1.5。在另一个实施方案中,黑素瘤是恶性皮肤黑素瘤。在另一个实施方案中,与恶性皮肤黑素瘤有关的标记物或单倍型的相对风险至少为1.7。在其它实施方案中,本发明描述了诊断对黑素瘤减少的易感性的方法,包括检测与LD区块A有关的标记物或单倍型,其中标记物或单倍型的存在是对黑素瘤减少的易感性或针对黑素瘤的保护性标记物或单倍型(针对黑素瘤具有保护性)的指示。在具体的实施方案中,与黑素瘤减少的易感性(针对黑素瘤具有保护性)有关的标记物或单倍型具有小于0.7的相对风险。在另一个实施方案中,黑素瘤是恶性皮肤黑素瘤。在另一个实施方案中,与恶性皮肤黑素瘤减少的易感性(针对恶性皮肤黑素瘤具有保护性)有关的标记物或单倍型的相对风险为小于0.6。标记物和单倍型的评估表现出遗传多样性的个体人群不具有一致的基因组。而是,个体之间在基因组的许多位置上,基因组表现出序列可变性;换句话说,在群体中有许多多态性位点。在某些情况下,在多态性位点上用不同的等位基因作为对照,而不用选择参比等位基因。此外,参比序列也可以被指定为特定的多态性位点。参比等位基因有时被称为"野生型"等位基因,它通常被选择为或是第一个被测序的等位基因、或是来自"未被影响的"个体(例如没有表现出疾病或异常表现型的个体)的等位基因。与参比不同的等位基因被称为"变异体"等位基因。本文中描述的"标记物"是指表现了特定变异体等位基因(即多态性位点)的特征的基因组序列。标记物可以含有在基因组中发现的任何变异体类型的任何等位基因,包括SNPS、微卫星、插入、缺失、重复和易位。本文报告的SNP名称是指官方参考SNP(rs)ID身份标签,由国家生物技术信息中心(NCBI)为每个独特的SNP进行指派。本文描述的"单倍型"是指基因组DNA片段,其特征为片段上排列的遗传标记物("等位基因")的特定组合。等位基因的组合、例如单倍型1和单倍型la,分别被描述在表2和4中。在某些实施方案中,单倍型可以包含一个或多个等位基因、两个或以上等位基因、三个或以上等位基因、四个或以上等位基因、或五个或以上等位基因。遗传标记物是"多态性位点"上与Chr8q24.21和/或LD区块A相关的特定的"等位基因"。在本文中使用的"Chr8q24.21"和"8q24.21"是指UCSCBuild34(来自www.genome.ucsc.edu的USCS基因组浏览器Build34)的染色体带8q24.21或127,200,001-131,400,000bp。本文中使用的"LD区块A"是指Chr8q24.21上的LD区块,其中变异体与前列腺、乳腺、肺癌和黑素瘤的关联被观察到。该LD区块的NCBIBuild34位置是从128,414,000-128,506,000bp。本文中描述的术语"非洲血统"是指个体自己报告的非洲血统。本文中使用的术语"易感性"包含了增加的易感性和减少的易感性。因此,本发明的特定的标记物和/或单倍型可以是癌症增加的易感性的特征,正如相对风险大于1所表示的。此外,本发明的标记物和/或单倍型也可以是癌症减小的易感性的特征,正如相对风险小于1所表示的。在种群中(例如自然种群或合成种群例如合成分子的文库),在一个核苷酸位置上可能存在一种以上的序列的核苷酸位置在本文中被称为"多态性"位点。当多态性位点长度为单个核苷酸时,该位点被称为单核苷酸多态性("SNP")。例如,如果在特定的染色体位置,种群中的一个成员有腺嘌呤,而种群中的另一个成员在同样位置上有胸腺嘧啶,那么该位点是多态性位点,更具体来说,该多态性位点是SNP。在本文中指出的SNP标记物的等位基因,当它们出现在使用的SNP分析中的多态性位点上时,是指碱基A、C、G或T。本领域的专业技术人员将会认识到通过分析或读取相反链,在每种情况下可以计算出互补的等位基因。因此,对于含有A/G多态性的多态性位点来说,所用的分析方法可以计算出可能的两种碱基、即A和G的百分比或比率。此外,通过设计对确定DNA模板的相反链的分析方法,可以计算出互补碱基T/C的百分比或比率。定量的(例如关于相对风险来说)、一致的结果可以从测量任何一条DNA链(+链或-链)获得。基于取代、插入或缺失,多态性位点可以允许序列上的不同。例如,多态性微卫星在特定的位点上有多个小的碱基重复(例如CA重复),其中重复长度的数量在普通人群中变化。对于多态性位点来说每种序列版本在本文中被称为多态性位点的一个"等位基因"。因此,在上述的例子中,SNP允许腺嘌呤等位基因和胸腺嘧啶等位基因。与癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)有关的SNPs和微卫星标记物被描述在表1和13中。一般来说,参比序列是一个具体的序列。与参比不同的等位基因被称为"变异体"等位基因。例如来自参考染色体8中的NCBIBuild34的位置128,414,000-128,506,000bp的参比基因组DNA序列在本文中被描述为SEQIDNO:l(图FIG.6A1-6A31)。本文中使用的变异体序列是指与SEQIDNO:l不同但基本上相似的序列。组成本文描述的单倍型的遗传标记物是变异体。其它的变异可以包括影响多肽、例如SEQIDNO:l编码的多肽的变化。这些序列差异,当与参比核苷酸序列相比时,可以包括单个核苷酸或一个以上的核苷酸的插入或缺失,导致移码;至少一个核苷酸的变化,导致编码的氨基酸的变化;至少一个核苷酸的变化,导致产生了过早的终止密码;几个核苷酸的缺失,导致核苷酸编码的一个或多个氨基酸的缺失;一个或几个核苷酸的插入、例如通过不对等的重组或基因变换,导致阅读框编码序列的中断;全部或部分序列的重复;易位;或核苷酸序列的重排,正如在本文中详细描述的那样。这样的序列变化改变了核酸编码的多肽。例如,如果核酸序列中的变化引起了移码,移码可能导致编码的氨基酸的变化、和/或可能导致过早的终止密码的产生,导致生成了截短的多肽。此外,与癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)或癌症易感性有关的多态性在一个或多个核苷酸上可以是同义变化(即不导致氨基酸序列变化的变化)。这样的多态性可以例如改变剪接位点、影响mRNA的稳定性或运输,或者影响编码的多肽的转录或翻译。也可以改变DNA以增加肿瘤中体细胞水平上发生结构变化、例如扩增或缺失、的可能性。参比核苷酸序列编码的多肽是具有特定参比氨基酸序列的"参比"多肽,由变异体等位基因编码的多肽被称为带有变异的氨基酸序列的"变异体"多肽。本文描述的单倍型是各种在多态性位点上具有特定等位基因的遗传标记物例如SNPs和微卫星的组合。单倍型可以包含各种不同遗传标记物的组合,因此,检测单倍型可以通过本
技术领域
中现有的用于检测多态性位点的序列的方法来完成。例如可以使用用于对SNPs和/或微卫星标记物的存在进行基因分型的标准技术,例如基于荧光的技术(Chen,X.等,Ge"owei仏492-98(1999))、PCR、LCR、嵌套PCR和其它用于核酸扩增的技术。这些标记物和SNPs可以在有风险的单倍型中鉴定出来。某些鉴定相关标记物和SNPs的方法包括使用连锁不平衡(LD)和/或LOD分值。遂缀不"T薪连锁不平衡(LD)是指两个遗传元件的非随机的分配。例如,如果特定遗传元件(例如多态性位点上的"等位基因")在种群中出现的频率是0.25,另一个遗传元件的出现频率也是0.25,假设元件是随机分配的,那么预计一个人具有两个元件的发生率是0.125。但是,如果发现两个元件同时出现的频率高于0.125,那么元件被说成是连锁不平衡的,因为它们趋于以比根据它们的独立的等位基因频率所预测的频率更高的比率一起遗传。大体上讲,LD—般与两个元件之间重组事件的频率有关。种群中等位基因的频率可以通过对种群中的个体进行基因分型和测定种群中每个等位基因的发生率来确定。对于二倍体种群例如人类种群来说,对每个遗传元件(例如标记物或基因)来说个体一般具有两个等位基因。为了评估连锁不平衡(LD)的强度提出了许多不同的计算。大多数计算双等位基因位点对之间联系的强度。LD的两个重要的成对计算是r2(有时被表示为A2)和ID'I。两种计算值的范围是从0(没有不平衡)到1("完全"不平衡),但是它们的解释稍微有些不同。如果只存在两个或三个可能的单倍型,ID'I被定义为等于1,如果所有四种可能的单倍型都存在,它就小于1。所以,ID'I值小于1表明两个位点之间可能在历史上发生过重组(回复突变也可能引起ID'I小于1,但是对于单核苷酸多态性(SNPs)来说,这种情况通常被认为比重组的可能性小)。计算的?表示两个位点之间的统计相关性,如果只存在两个单倍型,取值为1。有争议的观点认为它是对关联作图进行的最相关的计算,因为在^和检测易感性基因座和SNPs之间的关联所需的样品大小之间存在简单的倒数关系。这些计算被限定于成对的位点,但是对于某些应用来说,可能需要确定在含有许多多态性位点的整个区域上有多强的LD(例如检测基因座间或种群中LD的强度是否有显著的不同,或者在特定的模型中在一个区域中是否存在比预期更大或更小的LD)。计算整个区域的LD不是直接进行的,但是一种方法是使用在种群遗传学中开发的计算值r。大体来说,r度量了在特定种群模型下为了产生数据中看见的LD需要多少重组。这种类型的方法对于确定LD数据是否为重组热点的存在提供了证据的问题也可能提供了统计学上有力的方法。对于本文描述的方法来说,显著的一值可以是至少0.2、例如至少0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1.0。因此,LD代表了不同标记物的等位基因之间的相关性。它通过相关系数或ID'沐度量(一最大为1.0,ID'I最大到1.0)。正如本文所描述的那样,染色体8q24.21上的基因座已经被证实在癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)中扮演了重要角色。已经发现在特定的癌症患者中特定的标记物和/或单倍型的出现高于预期频率。在一个实施方案中,标记物或单倍型含有一个或多个与Chr8q24.21有关的标记物,它们与由表13中的标记物的一个或多个标记物处于连锁不平衡(被定义为相关系数的平方r2大于0.2)。氣感丝基厉座游卓舒盧浙丄OD分澄定乂在某些实施方案中,候选的易感性基因座使用LOD分值来定义。然后对被定义的区域使用SNP和微卫星标记物进行超精细作图,标记物间的平均间隔小于100kb。所有在公共数据库中发现的并在该区域中作图的可用的微卫星和SNP标记物都可以使用。此外,在人类基因组的deCODE遗传学序列集合中鉴定的微卫星标记物也可以使用。在病人和对照组中单倍型的频率可以使用期望值-最大化算法(DempsterA.等,JUW.S,39:1-38(1977))来估算。可以使用该算法来处理遗漏的基因型和阶段的不确定性。在原假设(millhypothesis)下,病人和对照被假设具有同样的频率。使用似然法,对可选的其它假设进行测试,其中候选的、可以包含本文描述的标记物的有风险的单倍型被允许在病人中具有比对照中更高的频率,而其它单倍型的频率比率被假设在两个组中是相同的。在两种假说下似然性被分别最大化,相应的l-df似然比统计数值被用于评估统计学显著性。为了在连锁区域中寻找有风险的或保护性的标记物和单倍型,例如,对基因分型的标记物的所有可能组合的关联进行了研究,只要那些标记物跨越实际研究区域。合并的病人和对照组可以被随机地分成两组,其大小与最初的病人和对照组相等。然后重复标记物和单倍型分析,确定出记录到的最显著的p值。这种随机化的流程可以被重复例如超过100次,以建立起p值的经验性分布。在优选实施方案中,p值小于0.05表明了显著的标记物和/或单倍型关联。单倍型分析的详细讨论如下文所述。稀微#进行单倍型分析的一种常用方法包括将基于似然性的推论结果应用于NEstedModels(GretarsdottirS.,等,A^aA35:131-38(2003))。该方法在NEMO程序中执行,该程序考虑到了许多多态性标记物、SNPs和微卫星。该方法和软件是为其目的是鉴定能够带来不同风险的单倍型组的病例-对照研究而特别设计的。它也是研究LD结构的工具。在NEMO中,在EM算法的帮助下直接计算了最大似然性推定值、似然比和p值,对于观察到的数据作为遗漏数据问题进行处理。尽管基于从观察到的数据直接计算的似然性进行的似然比测试已经收集了由于阶段的不确定性和遗漏的基因型导致的信息丢失,仍可以被用来给出有效的p值,但是了解有多少信息已经由于信息不完整而丢失仍然是有意义的。用于单倍型分析的信息计算被描述在Nicolae禾口Kong的文献中(TechnicalReport537,DepartmentofStatistics,UniversityofStatistics,UniversityofChicago;5/o膨Wcs,(50(%):368-75(2004)),作为被定义用于连锁分析的信息计算的自然扩展,并在NEMO中执行。对于与疾病相关的单个标记物来说,Fisher确切条件检验可以被用来计算每个个体等位基因的两边的p值。除非特别指明,对于多重比较来说,所有的p值都不被调整地显示。显示的频率(对于微卫星、SNPS和单倍型来说)是等位基因频率而不是载体频率。为了最小化由于作为家庭被吸收的病人之间的亲缘关系而引起的偏差,第一和第二级亲属可以从病人名单中消除。此外,可以通过扩展在Risch,N.和Teng,J.(Tes.,1273-1288(1998))中描述的方差调整方法和将亲属的DNA合并的方法(同上),重复进行相关性检验以校正病人之间任何残留的亲缘关系,以便它可以用于普遍的家族关系,并同时显示出调整过的和未调整过的p值用于比较。该差异正如预期一般是非常小的。为了评估被校正用于多重检验的单标记物相关性的重要性,我们使用同样的基因型数据进行了随机化测试。病人和对照组可以被随机化,重新进行多次关联性分析(例如多达500,000次),p值是对某些标记物等位基因产生的p值低于或等于我们使用最初的病人和对照组观察至ij的p值的重复试验的分数。对于单个标记物和单倍型分析来说,相对风险(RR)和种群可归因风险(PAR)可以按照乘法模型(单倍型相对风险模型)来计算(Terwilliger,J.D.和Ott,J.,//鼠Z/eW.42:337-46(1992)和Falk,CT.和Rubinstein,P,i/wm.G匿A5/fP"」:221-33(1987)),一个人携带的两个等位基因/单倍型的风险相乘。例如,如果RR是A相对于a的风险,那么一个人纯合子AA的风险将是杂合子Aa的RR倍、纯合子aa的RRM咅。乘法模型有简化分析和计算的好性质,即在Hardy-Weinberg平衡中,在患病的人群以及对照人群中单倍型是独立的。结果,患病者和对照组的单倍型计数每个都有多项式分布,但是在不同的假说下具有不同的单倍型频率。具体来说,对于两个单倍型&和~来说,风险(A,)/风险(&"(/;/A)l(/;^),其中f和p分别是患病人群和对照人群中的频率。尽管如果真实的模型不是乘法模型的话将会有一些倍率损失(powerloss),但除了极端的情况之外,这种损失趋于轻微。更重要的是,因为p值是根据空假说来计算的,它们总是有效的。,賴A^MO游遂徵'不f銜成对标记物之间的LD可以使用1D'I和R2的标准定义来计算(Lewontin,R.,Gewe"cs":49-67(1964);Hill,W.G.禾卩Robertson,A.7Teor.々;/Ge"et":226-231(1968))。使用NEMO,两个标记物等位基因组合的频率可以通过最大似然性估算,与连锁不平衡的偏差通过似然率检验来评估。通过对两个标记物经过临界等位基因可能性加权的所有可能的等位基因组合的值进行平均,ID'I和W的定义被扩展到包含了微卫星。当对所有标记物组合进行作图以阐述特定区域中的LD结构时,我们将ID'I作图在左上角,p值作图在右下角。在LD图中,如果需要,标记物可以等距离作图而不是按照它们物理上的位置作图。遂缀分析游统^学方泫在分析中可以使用多点的、只在患者中的等位基因共享方法来评估连锁的证据。LOD分值和非参数性连锁(NPL)分值的结果可以使用Allegro程序(Gudbjartsson等,淑.G潔r.":12-3(2000))获得。我们的基线连锁分析使用Sp,计数函数(Whittemore,A.S.,Halpern,,5/om"〃'"50:118-27(1994);KruglyakL.等,爿m.55:1347-63(1996)),指数等位基因共享模型(Kong,A.禾nCox,N.J.,4m.//t,m.Ge/ieZ.(57:1179-88(1997))和家族加权方案在对数标度上处于每个被影响的对同等加权和每个家族同等加权之间的途中。我们使用的信息计算是Allegro程序输出结果的一部分,如果标记物基因型完全不提供消息,信息值等于零,而如果基因型确定了患病亲属之内后裔所共享的等位基因的准确的量,该信息值等于l(Gretarsdottir等乂m.丄i/wm.70:593-603(2002))。P值用两种不同方法计算,不太显著的结果报道在这里。第一个p值可以在大样品理论的基础上计算;在没有连锁的原假设下,=口(2[loge(10)LOD])的分布近似于标准的正常变量(Kong,A.禾tlCox,NJ.,爿m.J.//wm.1179-88(1997))。第二个p值可以通过比较观察到的LOD分值及其在原假设下完整的数据取样分布来计算(例如Gudbjartsson等,淑.G匿,.Z5:12-3(2000))。当数据由几个以上的家族组成时,这两个p值趋于非常近似。^感丝基历座游卓舒M浙"卓舒M^"炎"定乂在某些实施方案中,标记物和单倍型分析包括了基于"单倍型区块"(也称为"LD区块")确定候选的易感性基因座。已经报道人类基因组的部分可以被分成一系列含有几个常见单倍型的不连续的单倍型区块;对于这些区块来说,连锁不平衡数据几乎不能提供指示重组的证据(参见例如Wall.,J.D.禾口Pritchard,J.K.,A^似reieWe體(587-597(2003);Daly,M,等,淑,Ge"W.":229-232(2001);Gabriel,S.B.等,Sc/e"ce,:2225-2229(2002);Patil,N.等,炭1719-1723(2001);Dawson,E.等,胸騰475:544-548(2002);Phillips,M.S.等淑匿G匿"3:382-387(2003))。有两种主要的方法定义这些单倍型区块区块可以被定义为限制了单倍型多样性的DNA区域(参见例如Daly,M.等,Ato『eGenW.":229-232(2001);Patil,N.等,Sc/e"ce厕:1719-1723(2001);Dawson,E.等,胸廳(2002);Zhang,K.等,P亂麵.&〖99:7335-7339(2002)),也可以被定义为使用连锁不平衡鉴定的具有扩展的历史重组的过渡区之间的区域(参见例如Gabriel,S.B.等,"6:2225-2229(2002);Phillips,M.S.等,胸脏G匿Z.33:382-387(2003);Wang,N.等,」w.//謂.G匿f.77:1227-1234(2002);Stumpf,M.P.,和Goldstein,D.B.,Cwr.73:1-8(2003))。本文中使用的术语"单倍型区块"或"LD区块"包括了通过任何一种性质确定的区块。鉴定单倍型区块的代表性方法被显示在例如美国出版的专利申请Nos.20030099964、20030170665、20040023237禾口20040146870中。单倍型区块可以容易地用于对表现型和单倍型状态之间的关联进行作图。在每个单倍型区块中可以鉴定出主要的单倍型,然后可以鉴定一组"带标签的"SNPs或标记物(为了在单倍型之间进行区分所需的最小组的SNPs或标记物)。这些带标签的SNPs或标记物然后可以被用于评估来自个体组的样品,以鉴定表现型和单倍型之间的关联。如果需要,邻近的单倍型区块可以被同时进行评估,因为在单倍型区块之间也可能存在连锁不平衡。単錄潛,珍銜正如本文所描述的那样,某些标记物和单倍型被发现可用于确定对癌症的易感性,即它们被发现可用于诊断对癌症的易感性。特定的标记物和单倍型(例如单倍型1、单倍型la、和其它含有下面的任何一个表中描述的一个或多个标记物的单倍型)被发现在患有癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)的个体中比在没有癌症的个体中出现得更为频繁。因此,这些标记物和单倍型对于在个体中检测癌症或对癌症的易感性有预测的价值。含有某些带标签的标记物的单倍型区块在患有癌症的个体中比在没有癌症的个体中被发现出现得更为频繁。因此,这些单倍型区块中"有风险的"带标签的标记物对于在个体中检测癌症或对癌症的易感性也具有预测价值。单倍型或LD区块中"有风险的"带标签的标记物也可以包括其它能够区分单倍型的标记物,因为它们同样对检测癌症或对癌症的易感性也具有预测价值。作为人类基因组的单倍型区块结构的结果,包括这些与单倍型区块(LD区块)关联的标记物或变异体的大量标记物或其它变异体和/或单倍型可以被发现与某些形状和/或表现型有关。因此,存在于本文定义的LD区块A中或与LD区块A具有强烈LD(特征为一大于0.2)的标记物和/或单倍型有可能与癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)有关。这包含了在本文中描述的标记物(表13、20和21),但是也可以包含其它与表13、20和21中列出的一个或多个标记物具有强LD(特征为一大于0.2)的标记物。这种其它的变异体的鉴定可以通过本
技术领域
的专业人员所熟知的方法来完成,例如通过LD区块A基因组区域的DNA测序,本发明也包含了这种其它的变异体。正如本文所描述的那样(例如表13),已经发现LD区块A中的某些标记物以减小的频率存在于患有癌症的个体中,也已经发现含有两或多种表13、20和21中列出的标记物的单倍型以减小的频率出现在患有癌症的个体中。因此,这些标记物和单倍型是对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)有保护性的,即它们赋予带有这些标记物和/或单倍型的个体以减小的发展出癌症的风险。这种保护性单倍型的一个例子是包含标记物rs7814251C等位基因和rsl2542685等位基因T等位基因(表22)。本文描述的单倍型和标记物在某些情况下是不同遗传标记物例如SNPs和微卫星的组合。因此,可以通过本领域现有的和/或本文描述的用于检测多态性基因座序列的方法来进行单倍型的检测。此外,某些单倍型或成组标记物与疾病表现型之间的相关性可以使用标准的技术来证实。相关性的简单测试的代表性例子是在二乘二表上进行的Fisher精确检验。在具体的实施方案中,与LD区块A和/或Chr8q24.21相关的标记物或单倍型,是在有癌症风险(受影响的)的个体中出现的频率与在健康个体(对照)中出现的频率相比更频繁的标记物或单倍型,其中标记物或单倍型的存在是癌症或对癌症易感性的指示。在另一个实施方案中,与LD区块A和/或Chr8q24.21相关的一个或多个标记物处于连锁不平衡的单倍型区块中的有风险的带有标签的标记物,是在有癌症风险(受影响的)的个体中出现的频率与在健康个体(对照)中出现的频率相比更频繁的带标签的标记物,其中带标签的标记物的存在是癌症或对癌症易感性的指示。在另一个实施方案中,与LD区块A和/或Chr8q24.21相关的一个或多个标记物处于连锁不平衡的有风险的标记物,是在有癌症风险的个体中出现的频率与在健康个体(对照)中出现的频率相比更频繁的标记物,其中标记物的存在是癌症或对癌症易感性的指示。在本发明的具体实施方案中,标记物或单倍型与LD区块A有关。正如本文所描述或例举的那样,基因型分析显示出染色体8q24.21上的标记物和单倍型与癌症的关联。具体来说,本文描述的研究证实了与LD区块A相关的标记物和单倍型(即来自NCBIBuild34(SEQIDNO:1;FIG.6A1-6A31)的128,414,000-128,506,000bp的基因组DNA序列)与癌症的关联。应该注意到除了本文具体描述的那些之外,LD区块A中的其它标记物和单倍型也可能与癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)有关,并被包含在本发明中。基于本文描述的介绍和本领域的现有技术,人们可以不用进行过多的实验就鉴定出其它的标记物和单倍型(例如通过对患有或不患有癌症的受试者的LD区块A区域进行测序,或对与本文描述的标记物和/或单倍型处于强烈LD的标记物进行基因分型)。在一个实施方案中,标记物或单倍型含有至少一种表13中的标记物。在另一个实施方案中,标记物或单倍型含有rs1447295A等位基因和/或DG8S737-8等位基因。在本文描述的某些方法中,具有癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)风险的个体是其中有风险的单倍型被鉴定到的个体、或是其中有风险的标记物被鉴定到的个体。在一个实施方案中,标记物或单倍型的关联强度由相对风险(RR)来度量。RR是带有一个拷贝标记物或单倍型的受试者中病症的发生率与不带有标记物或单倍型的受试者中病症的发生率的比率。该比率等于有两个拷贝标记物或单倍型的受试者中病症的发生率与带有一个拷贝标记物或单倍型的受试者中病症的发生率的比率。在一个实施方案中,标记物或单倍型的相对风险为至少1.2。在另一个实施方案中,标记物或单倍型的相对风险为至少1.3、至少1.4、至少1.5、至少2.0、至少2.5、至少3.0、至少3.5、至少4.0或至少5.0。在一个实施方案中,本发明是诊断对前列腺癌的易感性的方法,包括检测与LD区块A和/或Chr8q24.21有关的标记物或单倍型,其中标记物或单倍型的存在是对前列腺癌易感性的指示,标记物或单倍型的相对风险至少为1.5。在另一个实施方案中,标记物或单倍型的相对风险至少为2.0。在一个实施方案中,本发明是诊断对乳腺癌的易感性的方法,包括检测与LD区块A和/或Chr8q24.21有关的标记物或单倍型,其中标记物或单倍型的存在是对乳腺癌易感性的指示,标记物或单倍型的相对风险至少为1.3。在一个实施方案中,本发明是诊断对肺癌的易感性的方法,包括检测与LD区块A和/或Chr8q24.21有关的标记物或单倍型,其中标记物或单倍型的存在是对肺癌易感性的指示,标记物或单倍型的相对风险至少为1.3。在一个实施方案中,本发明是诊断对黑素瘤的易感性的方法,包括检测与LD区块A和/或Chr8q24.21有关的标记物或单倍型,其中标记物或单倍型的存在是对黑素瘤易感性的指示,标记物或单倍型的相对风险至少为1.5。在另一个实施方案中,本发明是诊断对恶性皮肤黑素瘤的易感性的方法,包括检测与LD区块A禾B/或Chr8q24.21有关的标记物或单倍型,其中标记物或单倍型的存在是对恶性皮肤黑素瘤易感性的指示,标记物或单倍型的相对风险至少为1.7。在另一个实施方案中,与标记物或单倍型有关的显著性由相对风险度量。在一个实施方案中,显著增加的风险被计算为相对风险至少大约1.2,包括但不限于1.2、1.3、1.4、1.5、1.6、1.7、1.8禾B1.9。在另一个实施方案中,相对风险至少1.2是显著的。在另一个实施方案中,相对风险至少大约1.5是显著的。在另一个实施方案中,相对风险至少大约1.7是显著的。在另一个实施方案是,显著减少的风险被计算为小于l,包括但不限于小于0.8、0.7、0.6、0.5禾P0.4。在另一个实施方案中,相对风险小于0.8是显著的。在另一个实施方案中,相对风险小于0.6是显著的。在另一个实施方案中,与标记物或单倍型有关的显著性通过百分数度量。在一个实施方案中,风险的显著增加或减少是至少大约20%,包括但不限于大约25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%和98%。在另一个实施方案中,风险的显著增加或减少是至少大约50%。因此,本文中使用的术语对癌症的"易感性"表明当某些标记物(标记物等位基因)或单倍型存在时,癌症的风险以显著的量增加或减少;显著性按照上面的指示度量。本文中使用的术语对癌症"减少的易感性"或对癌症"有保护性"表明当某些其它标记物或单倍型存在时,癌症的相对风险因此减少。但是,可以理解的是,鉴定风险是否是医学上重要的,可能还依赖各种不同的因素,包括具体的疾病、标记物或单倍型、以及通常还有环境因素。本发明的具体实施方案包含了在个体中诊断对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)的易感性的方法,包括在个体中评估包含在与LD区块A和/或Chr8q24.21有关的核酸区域的一部分中的SNPs和/或微卫星的存在或频率,其中与健康的对照个体相比过量或较高频率的SNPs和/或微卫星是个体患有癌症、或对癌症易感性的指示(参见例如表1和13(下文)中可以用作筛选工具和/或是单倍型的部分的SNPs和微卫星标记物)。这些微卫星标记物和SNPs可以在单倍型中鉴定到。例如单倍型可以包含例如在下面的表中显示的微卫星标记物和/或SNPs。标记物或单倍型的存在是癌症或对癌症易感性的指示,因此是作为治疗性和/或预防性方法的好的候选者的个体的指示。这些标记物和单倍型可以用作筛选工具。本发明的其它具体实施方案包含了在个体中诊断对癌症易感性的方法,包括在一个或多个多态性基因座上检测一个或多个标记物,其中的一个或多个多态性基因座与LD区块A和/或Chr8q24.21处于连锁不平衡。遗//试游实1丝关于导致发展出癌症的风险的遗传变异的知识,为使用遗传测试来鉴别具有发展出疾病的增加的风险的个体(即风险变异体的携带者)和具有发展出疾病的减小的风险的个体(即保护性变异体的携带者)提供了机会。对于属于上面提到的两个组的个体来说,遗传测试的核心价值是能够在早期诊断疾病、以及为临床医生提供关于疾病的预后/侵袭性的信息以便使用最合适的治疗方法的可能性。1、帮助早期检测将遗传测试用于前列腺癌能够为在较早的时期检测疾病提供机会,如果发现是局部性时,这导致了较高的治愈率,并通过最小化肿瘤的局部或远距离扩散增加存活率。对于前列腺癌来说,遗传测试很可能增加已经普遍使用的前列腺特异性抗原(PSA)测试和数字式直肠检查(DRE)的灵敏性和特异性。这可以产生较低比率的假阳性(因此最小化了不必需的步骤例如活组织针检)和假阴性(从而增加了对潜伏的疾病的检测并最小化由于PCA引起的发病率和死亡率)。2、确定侵袭性遗传测试可以提供关于诊断前预后指示的信息,并能够鉴定对侵袭性肿瘤类型具有高或低风险的个体,这可以导致对筛选策略的修改。例如,被确定是发展出侵袭性前列腺癌的高风险等位基因的携带者的个体,将可能经历更频繁的PSA测试、检验,并且在存在异常PSA值的情况下对进行活组织针检具有较低的临界值。此外,鉴定是侵袭性肿瘤类型的高或低风险等位基因的携带者的个体将导致对治疗策略的修改。例如,如果被诊断出前列腺癌的个体是导致发展出侵袭性形式的前列腺癌的增加的风险的等位基因的携带者,那么临床医生将可能建议更具侵袭性的治疗策略例如前列腺切除术,而不是侵袭性较低的治疗策略。正如在本
技术领域
所了解的那样,前列腺特异性抗原(PSA)是由前列腺上皮细胞、包括癌细胞,分泌的蛋白。血液中PSA水平升高表明了前列腺的异常症状,可能是良性的也可能是恶性的。PSA被用于检测前列腺中潜在的问题,以及用于追踪前列腺癌治疗的进展。PSA水平高于4ng/ml是存在前列腺癌的指示(尽管正如本
技术领域
所了解的那样,该测试既不是非常特异也不是非常灵敏)。在一个实施方案中,本发明的方法与PSA分析相结合(可以在之前、同时或之后)使用。在具体的实施方案中,标记物或单倍型的存在,与受试者具有高于4ng/ml的PSA水平相结合,是更具侵袭性的前列腺癌和/或更坏的预后的指示。正如本文所描述的那样,特定的标记物和单倍型与高Gleason的(即更具侵袭性的)前列腺癌有关。在另一个实施方案中,在具有正常的PSA水平(例如低于4ng/ml)的病人中标记物或单倍型的存在是高Gleason的(即更具侵袭性的)前列腺癌和/或更坏的预后的指示。当癌症更可能将生长超出前列腺的边界、转移、逃脱治疗和/或杀死宿主时,发生"更坏的预后"或"坏的预后"。在一个实施方案中,标记物或单倍型的存在是在肿瘤或其前体中倾向于发生Chr8q24.21的体细胞重排(例如一个或多个扩增、易位、插入和/或缺失)的指示。体细胞重排自身随后可能导致更具侵袭性形式的前列腺癌(例如较高的组织学级别,如同诊断时较高的Gleason分值或较高的阶段所反映的那样,前列腺癌的增加的进展(例如到较高的阶段),更坏的结果(例如根据发病率、并发症或死亡))。正如在本
技术领域
中所熟知的那样,Gleason级别是广泛使用的方法,用于对前列腺癌组织的正常腺体结构(腺体的大小、形状和分化)的损失程度进行分类。从1到5的级别被成功指派给被检测的组织样品中存在的两个最显著的组织形式中的每一个,加在一起产生了总的或组合的Gleascm级别(级别2-10)。大的数字表示少的分化,因此是更具侵袭性的癌症。侵袭性前列腺癌是生长超出了前列腺,转移并最终杀死病人的癌症。正如本文所描述的那样,侵袭性的一种代用度量是高度组合的Gleason级别。级别2-10上级别越高,病人越可能患有侵袭性疾病。除非另外注明,在本文中使用的术语"阶段"被用于定义癌症(例如前列腺癌)的大小和生理范围。确定各种癌症的阶段的一种方法是TNM方法,其中在TNM的首字母縮写中,T代表肿瘤大小和侵染力(例如前列腺中的原初肿瘤);N与淋巴结参与(例如前列腺癌已经扩散到淋巴结中)有关;M表示转移(扩散到远处位点)的存在或不存在。本发明的方法用于诊断对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的方法被描述在本文中并包含在本发明中。用于分析来自受试者的样品以检测对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的的试剂盒也包含在本发明中。在其它的实施方案中,本发明是在受试者中诊断与Chr8q24.21相关的癌症(例如与Chr8q24.21相关的前列腺癌、与Chr8q24.21相关的乳腺癌、与Chr8q24.21相关的肺癌、与Chr8q24.21相关的黑素瘤)的方法。本发明的诊断和筛选分析方法在某些实施方案中,本发明属于通过检测在癌症受试者或对癌症具有易感性的受试者中更频繁出现的特定遗传标记物,来诊断或帮助诊断癌症或对癌症易感性的方法。在具体的实施方案中,本发明是通过检测一个或多个特定的遗传标记物(例如本文描述的标记物或单倍型)来诊断对前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌和/或黑素瘤的易感性的方法。本发明描述的方法中特定标记物或单倍型的检测是对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌和/或黑素瘤)易感性的指示。这种预后或预测性分析方法也可以用于在与这些癌症相关的症状发作之前确定对受试者的预防性治疗方案。此外,在某些其它实施方案中,本发明属于通过检测在癌症中出现频率较低的特定遗传标记物或单倍型,来诊断或帮助诊断对癌症减少的易感性的方法。在具体的实施方案中,本发明是通过检测一个或多个特定的遗传标记物(例如本文描述的标记物或单倍型)来诊断对前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌和/或黑素瘤的减少的易感性的方法。本发明描述的方法中特定标记物或单倍型的检测是对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌和/或黑素瘤)减少的易感性、或针对癌症的保护性标记物或单倍型的指示。正如在本文中描述和例举的那样,与LD区块A和/或Chr8q24.21有关的特定标记物或单倍型(例如单倍型)与癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌和/或黑素瘤)相关。在一个实施方案中,标记物或单倍型能够赋予对前列腺癌、乳腺癌、肺癌和/或黑素瘤的易感性的显著风险。在另一个实施方案中,本发明涉及通过筛选与LD区块A和/或Chr8q24.21有关的、在患有癌症或对癌症易感的(受影响的)受试者中与健康受试者(对照)中相比出现频率更高的标记物或单倍型,在受试者中诊断对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌和/或黑素瘤)易感性的方法。在某些实施方案中,标记物或单倍型的p值小于0.05。在这些实施方案中,标记物或单倍型的存在是对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌和/或黑素瘤)易感性的指示。这些诊断方法涉及检测与LD区块A和/或Chr8q24.21有关的的标记物或单倍型的存在与否。本文描述的单倍型包括各种不同遗传标记物(例如SNPs、微卫星)的组合。构成特定单倍型的特定遗传标记物的检测可以通过本文描述的和/或本
技术领域
已知的各种方法来进行。例如,遗传标记物可以在核酸水平(例如通过直接的核苷酸测序)检测,或者如果遗传标记物影响了与Chr8q24.21相关的核酸所编码的蛋白的编码序列,可以在氨基酸水平上检测(例如通过蛋白测序或通过使用识别这种蛋白的抗体进行免疫分析)。本文中使用的"与Chr8q24.21有关的核酸"是指是或对应于Chr8q24.21基因组DNA序列的片段。"与LD区块A相关的核酸"是指是或对应于LD区块A的基因组DNA序列的片段。在一个实施方案中,可以使用杂交方法例如Southern分析、Northern分丰斤禾口/或原j立杂交(参见CurrentProtocolsinMolecularBiology,Ausubel,F.等主编,JohnWiley&Sons,包括所有附录)来进行对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌和/或黑素瘤)易感性的诊断。来自测试受试者或个体的基因组DNA、RNA或cDNA的生物学样品("测试样品")是从被怀疑患有、易感于、或倾向于患有癌症的受试者("测试受试者")获得的。受试者可以是成年人、儿童或胎儿。测试样品可以来自任何含有基因组DNA的来源,例如血液样品、羊水样品、脑脊液样品、或来自皮肤、肌肉、口腔或结膜粘膜、胎盘、胃肠道或其它器官的组织样品。来自胎儿细胞或组织的DNA测试样品可以通过适合的方法获得,例如通过羊膜穿刺或绒膜绒毛取样。然后对DNA、RNA或cDNA样品进行检测。单倍型等位基因的存在可以通过用针对特定等位基因的特异性核酸探针进行序列特异性杂交来鉴定。序列特异性探针可以被导向与基因组DNA、RNA或cDNA杂交。本文使用的"核酸探针"可以是与互补序列杂交的DNA探针或RNA探针。本领域的专业技术人员将知道如何设计这样的探针,以便只有当测试样品的基因组序列中存在特定等位基因时才会发生序列特异性杂交。为了诊断对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌和/或黑素瘤)的易感性,通过将含有与Chr8q24.21有关的和/或与LD区块A有关的核酸的测试样品与至少一种核酸探针相接触,形成了杂交样品。用于检测mRNA或基因组DNA的探针的一个非限制的例子是能够与本文描述的mRNA或基因组DNA序列杂交的标记的核酸探针。核酸探针可以是例如全长的核酸分子或其一部分,例如长度至少为15、30、50、100、250或500个核苷酸的、能够在严紧条件下与适合的mRNA或基因组DNA杂交的寡聚核苷酸。例如,核酸探针可以是SEQIDNO:l的全部或一部分,任选包含在本文描述的单倍型中包含的至少一种等位基因,或者探针可以是这样的序列的互补序列。在具体的实施方案中,核酸探针是SEQIDNO:l的一部分,也可以任选包含在本文描述的单倍型中包含的至少一种等位基因,或者探针可以是这样的序列的互补序列。其它适合用于本发明的诊断分析方法的探针在本文中有描述。杂交样品被维持在足够允许核酸探针和与Chr8q24.21有关的核酸和/或与LD区块A有关的核酸发生特异性杂交的条件下。本文使用的"特异性杂交"是指完全杂交(例如没有误配)。特异性杂交可以在本文描述的高严紧条件或中严紧条件下进行。在一个实施方案中,特异性杂交的杂交条件是高严紧的(例如象本文描述的那样)。特异性杂交如果出现的话,然后可以使用标准的方法来检测。如果在核酸探针和测试样品中与Chr8q24.21有关的和/或与LD区块A有关的核酸之间发生了特异性杂交,那么样品中含有与核酸探针中存在的核苷酸互补的等位基因。对于构成单倍型的其它标记物可以重复这个过程,或者可以同时使用多个探针以便同时检测一个以上的标记物。设计出含有特定单倍型的一个以上标记物的单一探针(例如含有与构成特定单倍型的2、3、4、5或所有标记物互补的等位基因的探针)是可能的。样品中单倍型的特定标记物的检测是样品源具有特定单倍型(例如单倍型)、因此也是对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌和/或黑素瘤)易感性的指示。在另一种杂交方法中,Northern分析(参见CurrentProtocolsinMolecularBiology,Ausubel,F.等主编,JohnWiley&Sons,同上)被用来鉴定与癌症或对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌和/或黑素瘤)易感性有关的多态性的存在。对于Northern分析来说,RNA测试样品是从受试者通过适当方法获得的。正如本文描述的那样,核酸探针与来自受试者的RNA的特异性杂交是与探针互补的特定等位基因的指示。关于核酸探针的使用的代表性例子参见例如美国专利Nos.5,288,611禾B4,851,330。此外,或另外的,在本文描述的杂交方法中除了核酸探针之外可以使用肽核酸(PNA)探针,或代替核酸探针使用。PNA是DNA的模拟物,具有类似肽的无机骨架例如N-(2-氨基乙基)甘氨酸单位,带有通过亚甲基羰基连接体结合到甘氨酸氮原子上的有机碱基(A、G、C、T或U)(参见例如Nielsen,P.,等,5/oco"j^g.CTzem.5:3-7(1994))。PNA探针可以被设计成与怀疑含有与癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)有关的单倍型的一个或多个遗传标记物的样品中的分子进行特异性杂交。PNA探针的杂交是对癌症或癌症易感性的诊断。在本发明的一个实施方案中,对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)或癌症易感性的诊断是通过酶法扩增来自受试者的核酸来进行的。例如,含有基因组DNA的测试样品可以从受试者获得,然后可以使用聚合酶链反应(PCR)扩增测试样品中与Chr8q24.21有关的核酸和/或与LD区块A有关的核酸。正如本文中所描述的那样,与扩增的Chr8q24.21区域和/或LD区块A区域有关的特定标记物或单倍型(例如单倍型)的鉴定可以使用各种方法来进行(例如序列分析、限制性酶消化分析、特异性杂交、单链构象多态性分析(SSCP)、电泳分析等)。在另一个实施方案中,诊断通过使用定量PCR(动力学热循环反应)进行表达分析来完成。该技术可以使用例如商业化可用的技术,例如TaqMan(AppliedBiosystems,FosterCity,CA)以允许鉴定多态性和单倍型(例如单倍型)。该技术可以评估Chr8q24.21和/或LD区块A编码的多肽或剪接变异体的表达或组成的变化的存在。此外,变异体的表达可以按照物理或功能上的差别进行定量。在本发明的另一种方法中,限制性酶消化分析可以用于检测特定的等位基因,如果相对于参比序列来说等位基因导致了限制性酶基因座的产生或消除的话。从受试者获得含有基因组DNA的测试样品。可以使用PCR来扩增来自测试受试者的测试样品中的特定的Chr8q24.21和/或LD区块A区域。可以按照例如上述的CurrentProtocolsinMolecularBiology中的描述来进行限制性片段长度多态性(RFLP)分析。相关DNA片段的消化谱图表明了样品中特定等位基因的存在与否。序列分析也可以用于检测与Chr8q24.21禾卩/或LD区块A有关的多态性基因座上的特定等位基因。因此,在一个实施方案中,确定特定标记物或单倍型(例如单倍型)的存在与否包括序列分析。例如,可以从测试受试者获得DNA或RNA测试样品。可以使用PCR或其它适合的方法扩增Chr8q24.21禾卩/或LD区块A的一部分,然后可以通过对样品中基因组DNA的多态性位点进行测序来直接检测特定等位基因的存在。通过使用扩增的寡聚核苷酸与等位基因特异性的寡聚核苷酸(ASO)探针进行斑点杂交(参见例如Saiki,R.等,A^wre,3^:163-166(1986)),等位基因特异性的寡聚核苷酸也可用于检测与Chr8q24.21和/或LD区块A有关的多态性位点中特定等位基因的存在。"等位基因特异性的寡聚核苷酸"(在本文中也被称为"等位基因特异性的寡聚核苷酸探针")是大约10-50个碱基对或大约15-30个碱基对的寡聚核苷酸,能够与Chr8q24.21和/或LD区块A的区域特异性杂交,并且在多态性位点(例如本文描述的多态性)上含有特定的等位基因。可以使用标准的方法(参见例如CurrentProtocolsinMolecularBiology,同上)制备特异性针对与Chr8q24.21和/或LD区块A有关的一个或多个特定的多态性的等位基因特异性寡聚核苷酸探针。可以使用PCR来扩增所需的Chr8q24.21禾卩/或LD区块A区域。含有扩增的Chr8q24.21区域和/或LD区块A区域的DNA可以使用标准方法(参见例如CurrentProtocolsinMolecularBiology,同上)进行斑点印迹,印迹可以与寡聚核苷酸探针相接触。然后可以检测探针与扩增的Chr8q24.21区域和/或LD区块A区域的特异性杂交的存在。等位基因特异性寡聚核苷酸探针与来自受试者的DNA的特异性杂交是与Chr8q24.21和/或LD区块A有关的多态性位点上的特异性等位基因的指示(参见例如Gibbs,R.等,A^c/e/c^c^si仏,77:2437-2448(1989)和WO93/22456)。通过添加这样的类似物如锁核酸(LNAs),引物和探针的大小可以被减小到少至8个碱基。LNAs是一类新的双环DNA类似物,其中呋喃糖环的2'和4'位置上通过O-亚甲基(氧-LNA)、S-亚甲基(硫代-LNA)或氨基亚甲基(氨基-LNA)基团而连接。所有这些LNA变异体的共同之处是对互补核酸的亲和性,这种亲和性是到目前为止报道的DNA类似物中最高的。例如,已经显示特定的全氧-LNA九聚物在与互补的DNA或RNA形成复合物时熔点温度(Tm)分别为64°C和74°C,与此相反DNA和RNA与相应的DNA形成的九聚体的熔点是28。C。当LNA单体与标准DNA或RNA单体组合使用时,也可以获得显著的Tm增加。对于引物和探针来说,根据LNA单体所被包含的位置(例如3'末端、5'末端或在中间),Tm可以显著增加。在另一个实施方案中,与来自受试者的靶核酸序列片段互补的寡聚核苷酸探针阵列可以被用于鉴定与Chr8q24.21相关的核酸和/或与LD区块A相关的核酸中的多态性。例如,可以使用寡聚核苷酸阵列。寡聚核苷酸阵列一般含有多种不同的寡聚核苷酸探针,它们被连接到基底表面上已知的不同位置。这些寡聚核苷酸阵列、也被描述为"基因芯片TM"、已经在本
技术领域
内得到了普遍的描述(参见例如美国专利No.5,143,854、PCT专利申请Nos.WO90/15070和92/10092)。这些阵列一般可以使用机械合成方法或光指导的合成方法来生产,后一种方法整合了光刻方法和固相寡聚核苷酸合成方法(Fodor,S.等,S"'e"ce,257:161-113(1991);Pirrung等,美国专利No.5,143,854(也参见出版的PCT申请No.WO90/15070);以及Fodor.S.等,出版的PCT申请No.WO92/10092和美国专利No.5,424,186,每个文献的全部描述内容在此引为参考)。使用机械合成方法合成这些阵列的技术被描述在例如美国专利No.5,384,261中;其全部描述内容的教导在此引为参考。在另一个例子中,可以使用线性的阵列。一旦制备了寡聚核苷酸阵列,允许感兴趣的核酸与阵列杂交。杂交的检测是感兴趣的核酸中特定等位基因的检测。杂交和扫描一般通过本文描述的方法以及也在例如出版的PCT申请Nos.WO92/10092和WO95/11995、以及美国专利No.5,424,186中描述的方法来进行,这些文献中每一个的全部描述内容在此引为参考。简而言之,包含了一或多种以前鉴定的多态性标记物的靶核酸序列,通过现有的扩增方法(例如PCR)被扩增。一般来说这包括了使用与靶序列两条链多态性位点互补的上游和下游的引物序列。也可以使用不对称PCR技术。然后允许一般掾入了标记物的扩增的靶与阵列,在允许序列特异性杂交发生的适当条件下进行杂交。在阵列的杂交和清洗完成后,对阵列进行扫描以确定阵列上与靶序列杂交的位置。从扫描获得的杂交数据一般是作为阵列上位置的函数的荧光强度的形式。尽管最初的描述是关于例如用于检测单个多态性位点的单个检测块,但阵列也可以包含多个检测块,因此能够分析多个特定的多态性(例如特定单倍型(例如单倍型)的多个多态性)。在另一种方案中,一般被理解为可以经检测块分组成单个阵列或多个分离的阵列,以便在靶与阵列的杂交过程中可以使用不同的、最适的条件。例如,通常需要提供这种方法以分别检测位于基因组序列的富含G-C区域中的多态性与位于富含A-T区域中的多态性。这允许在每种情况下对杂交条件分别进行最适化。其它关于使用寡聚核苷酸阵列来检测多态性的描述可以在例如美国专利Nos.5,858,659和5,837,832中发现,二者的全部描述内容在此引为参考。其它的核酸分析方法可以用于检测与Chr8q24.21和/或LD区块A有关的多态性基因座上的特定等位基因。代表性的方法包括例如直接的手工测序(Church禾卩Gilbert,尸rac.A^/.Jcfld.tAS"AS/:1991-1995(1988);Sanger,F.,等,尸亂淑/.脂,74:5463-5467(1977);Beavis,等,美国专利No.5,288,644)、自动荧光测序、单链构象多态性分析(SSCP)、钳式变性凝胶电泳(CDGE)、变性梯度凝胶电泳(DGGE)(Sheffield,V"等,尸亂淑/.^cm/.SW."&4,55:232-236(1989))、泳动性迁移分析(Orita,M.,等,JcW.Sc/.S6:2166-2770(1989))、限制性酶分析(Flavell,R.,等,CW/,/5:25-41(1978);Geever,R.,等,尸roc.A^".爿c^/.tASM,75:5081-5085(1981))、异源双链体分析、化学误配切割(CMC)(Cotton,R.,等,尸rac.7VaW^cflA&〖.55:4397-4401(1985))、RNase保护性分析(Myers,R.,等,6We"ce,"0:1242-1246(1985))、识别核苷酸误配的多肽例如大肠杆菌mutS蛋白的使用、以及等位基因特异性性PCR。在本发明的另一个实施方案中,在本文描述的遗传标记物或单倍型导致多肽的组成或表达发生了变化的情况下,对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)的诊断或癌症易感性的诊断,可以通过检测由ChrSq24.21相关的核酸和/或与LD区块A相关的核酸所编码的多肽的表达和/或组成来进行。正如本文所描述的那样,作图在Chr8q24.21上的特定基因和预测的基因包括例如POU5FLC20(Genbank获取号AF268618;己知基因)、Genbank获取号BE676854(EST)、Genbank获取号AL709378(EST)、Genbank获取号BX108223(EST)、Genbank获取号AA375336(EST)、Genbank获取号CB104826(EST)、Genbank获取号BG203635(EST)、Genbank获取号AW183883(EST)、Genbank获取号BM804611(EST)、C-MYC(Genbank获取号NM—002467;已知基因)和PVT1(Genbank获取号XM—372058;已知基因)。因此,对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的诊断,可以通过检测这些多肽之一、或另一个由Chr8q24.21相关的核酸和/或与LD区块A相关的核酸所编码的多肽的表达和/或组成来进行,在本文描述的情况下本文描述的遗传标记物或单倍型导致多肽的成分或表达发生了变化。本文描述的显示出与癌症具有相关性的单倍型和标记物,通过它们对一个或多个这些邻近基因的影响,可能扮演了重要角色。影响这些基因的可能机制包括例如影响转录、影响RNA剪接、改变不同mRNA剪接形式的相对量、影响RNA的稳定性、影响从核到细胞质的运输、以及影响翻译的效率和准确性。Chr8q24.21上的c-myc基因编码c-MYC蛋白,它是在20多年前作为鸟类髓细胞组织增生反转录病毒的病毒癌基因v-myc(Vernistrom等,丄F/ro/ogyW:113-19(1982))的细胞对应物而被鉴定的。c-MYC蛋白是转录因子,在用促有丝分裂刺激物处理细胞时能够被快速诱导。通过异源双链体复合物中的E盒(CACGTG)与名为MAX的蛋白结合,c-MYC调节许多基因的表达。许多由c-MYC调控的基因参与细胞周期控制。c-MYC促进了细胞周期进展,抑制细胞分化,并诱导凋亡。c-MYC对于双链DNA修复也具有负效应(Karlsson,A,等,/Voc.Wa".爿cflAt/W/卯(77」9974-79(2003))。c-MYC也促进血管发生(Ngo,C.V.,等,Ce〃Dzj^r.〃r":201國10(2000);BaudinoT.A.,等,Ge腦Dev.:2530-43(2002))。c-myc基因在体外和体内是高度致瘤的。c-MYC与抑制凋亡的蛋白例如BCL、BCL-XL协调作用,或在转基因小鼠淋巴瘤生成中的p53或ARF的丢失协同作用(Strasser等,Nature348:331-333(1990);Blyth,K.,等,Oncogene70:1717-23(1990);Elson,A"等,O腳,e77:181-90(1995);Eischen,CM.,等,Ge腊Dev.73:2658-69(1999))。在前列腺癌中可以观察到c-myc基因的扩增和过量表达,这通常与侵袭性肿瘤、激素不依赖性和不好的预后有关(Jenkins,R.B.,等,Cawcer57卩力524-31(1997);ElGedaily,A.,等,Pm^fl^46f":184-90(2001);Saramaki,O.,等,^附.,PaAo/."外6力2089國94(2001);Bubendorf,L.,等,Cawcer5SY力:803-06(1999))。c-myc和Chr8q24.21区域也可以在前列腺、乳腺和肺部肿瘤以及黑素瘤中发现(BlancatoJ"等,Ca"cer,」:1612-9(2004);Kubokura,H"等,Jw仏7Tzorac.CanZ/ova^c.Swrg.7卩力197-203(2001);Treszl,A.,等,qy/ome^yM5(7力31-46(2004);Kraehn,G.M.,等,5广CawcerW(7力12-19(2001))。此外,许多其它的肿瘤类型显示出获得了该区域,包括结肠、肝、卵巢、胃、肠和膀胱癌。所有肿瘤类型合起来显示Chr8q24.21是最频繁被获得的染色体区域,在所有肿瘤类型中大约17%者卩获得了(www.progenetix.com)。参与Burkitt's淋巴瘤的癌基因是易位的结果,该易位将c-myc与免疫球蛋白增强子相并置,从而激活了基因的表达(Dalla-Favera,R.,等,A^/.」cW.fAS^7外":7824-27(1982);Taub,R.,等,尸rac.A^/.^c"A5W."&479f":7837-41(1982))。它也通过将人类乳头瘤病毒(HPV)整合到基因附近参与了宫颈癌。在大多数情况下,HPV整合发生在c-myc基因的跨越500kb的着丝粒和200kb的端粒的区域(Ferber,J.M.,等,Ca腳rC,g,""7W:l-9(2004);Ferber,MJ.,等,O打cogewe":7233-7242(2003))。两个不稳定位点FRA8C和FRA8D分别在Chr8q24.21上位于c-myc的着丝粒和端粒端。不稳定位点在存在制止DNA合成的试剂的情况下易于断裂。不稳定位点的复制被认为发生在S期后期,在诱导后甚至更晚。不稳定位点参与染色体的扩增、易位和/或病毒插入可能与这些位点的复制较晚有关,断裂在中止的复制叉处或接近中止的复制叉处引发(Hellman,A.,等,C騰erCW//:89-97(2002))。本文描述的在LD区块A中的或与LD区块A处于强烈LD(被度量为一大于0.2)的标记物或单倍型能够影响该区域的稳定性,导致c-myc基因或其它邻近基因的基因扩增的,这是可能的。也就是说,一个人可以从双亲中的一个或两个继承到LD区块A中或与LD区块A处于强烈LD的区域(被度量为—大于0.2),因此更可能在后来在一个或多个细胞中具有体细胞突变事件,导致癌症发展成更具侵袭性的形式。因此,在一个实施方案中,本发明的标记物或单倍型(例如与LD区块A有关的标记物或单倍型)的鉴定可以被用来诊断能够导致癌症发展成更具侵袭性形式的体细胞突变事件的易感性。在一个实施方案中,标记物或单倍型不包含位于c-myc开放阅读框(艮卩NCBIBuild34中的chr8:128,705,092-128,710,260bp)中白勺标记物。在另一个实施方案中,标记物或单倍型不包含位于c-myc启动子或开放阅读框中的标记物。在另一个实施方案中,标记物或单倍型不包含位于c-myc启动子、增强子或开放阅读框中的标记物。在另一个实施方案中,标记物或单倍型不包含位于c-myc开放阅读框的lkb、2kb、5kb、10kb、15kb、20kb或25kb之内的标记物。多种方法可以被用于进行这样的检测,包括酶联免疫吸附分析(ELISA)、Western印迹、免疫沉淀和免疫荧光。来自受试者的测试样品被评估由与Chr8q24.21相关的核酸和/或与LD区块A相关的核酸所编码的多肽的表达的变化和/或组成的变化的存在。与Chr8q24.21相关的核酸和/或与LD区块A相关的核酸所编码的多肽的表达的变化可以是例如多肽表达量(即产生的多肽的量)的变化。与Chr8q24.21相关的核酸和/或与LD区块A相关的核酸所编码的多肽的组成的变化是定性的多肽表达(例如突变多肽或不同剪接的变异体的表达)的变化。在一个实施方案中,对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的诊断,是通过检测与Chr8q24.21相关的核酸和/或与LD区块A相关的核酸所编码的特定剪接变异体或剪接变异体的特定形式来进行的。也可能同时存在这两种变化(定量的和定性的)。本文中使用的多肽表达或组成的"变化",是指测试样品中的表达或组成与对照样品中与Chr8q24.21相关的核酸和/或与LD区块A相关的核酸所编码的多肽的表达或组成相比的变化。对照样品是与测试样品相应的样品(例如来自同样类型的细胞),来自不患有癌症或对癌症没有易感性的受试者(例如不具有本文描述的标记物或单倍型的受试者)。相似地,与对照样品相比,测试样品中一或多种不同的剪接变异体的存在、或测试样品中显然不同量的不同剪接变异体的存在,可能是对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的指示。与对照样品相比,测试样品中多肽的表达或组成的变化,可能是在等位基因相对于对照样品中的参照物改变了剪接位点的情况下特定等位基因的指示。可以使用多种方法检测与Chr8q24.21相关的核酸和/或与LD区块A相关的核酸所编码的多肽的表达或组成,包括分光法、比色法、电泳、等点聚焦和免疫分析(例如David等,美国专禾UNo.4,376,110)例如免疫印迹(参见例如CurrentProtocolsinMolecularBiology,特别是第十章,同上)。例如,在一个实施方案中,可以使用能够结合与Chr8q24.21相关的核酸和/或与LD区块A相关的核酸所编码的多肽的抗体(例如带有可检测的标记物的抗体)。抗体可以是多克隆的也可以是单克隆的。可以使用完整的抗体或其片段(例如Fv、Fab、Fab'、F(ab')2)。对于探针或抗体来说,术语"标记的"打算包含通过将可检测的物质偶联(即物理连接)到探针或抗体上对探针或抗体进行直接的标记,以及通过与另一个被直接标记的试剂进行反应来对探针或抗体进行间接的标记。间接标记的例子包括使用标记的第二抗体(例如荧光标记的第二抗体)来检测最初的抗体,以及用生物素对DNA探针进行末端标记以便它可以用荧光标记的链亲和素检测。在这种方法的一个实施方案中,测试样品中与Chr8q24.21相关的核酸和/或与LD区块A相关的核酸所编码的多肽的水平或量与对照样品中与Chr8q24.21相关的核酸和/或与LD区块A相关的核酸所编码的多肽的水平或量相比较。测试样品中多肽的水平或量比对照样品中多肽的水平或量高或低,如果差别显著的话,是与Chr8q24.21相关的核酸和/或与LD区块A相关的核酸所编码的多肽的表达发生变化的指示,是负责导致表达差异的特定等位基因的诊断。此外,测试样品中与Chr8q24.21相关的核酸和/或与LD区块A相关的核酸所编码的多肽的组成与对照样品中与Chr8q24.21相关的核酸和/或与LD区块A相关的核酸所编码的多肽的组成相比较。在另一个实施方案中,在测试样品和对照样品中多肽的水平或量和组成二者都可以被评估。正如本文所描述和例举的那样,与Chr8q24.21禾P/或LD区块A相关的的特定标记物和单倍型(例如单倍型1、单倍型la、含有后面的表中列出的两个或多个标记物的单倍型)与癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)有关。在一个实施方案中,本发明涉及在受试者中诊断对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的方法,包括筛选与Chr8q24.21相关核酸禾卩/或LD区块A相关核酸有关的标记物或单倍型,其在患有癌症或对癌症易感的(受影响的)受试者中出现频率比在健康受试者(对照)中出现频率更高。在该实施方案中,标记物或单倍型的存在是对癌症易感性的指示。可以使用对与癌症有关的SNPs禾口/或微卫星的存在进行基因分型的标准技术,例如基于荧光的技术(Chen,X.,等,ies.,化492-498(1999))、PCR、LCR、嵌套PCR和其它用于核酸扩增的技术。在一个实施方案中,该方法包括在受试者中评估与Chr8q24.21和/或LD区块A有关的并与癌症和/或癌症易感性相关的一个或多个特定SNP等位基因和/或微卫星的存在或频率。在该实施方案中,与健康对照受试者相比过量或较高频率的等位基因是受试者对癌症易感的指示。在另一个实施方案中,对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的诊断是通过至少一个与Chr8q24.21有关的等位基因和/或与LD区块A有关的等位基因的检测与其它基于蛋白、基于RNA或基于DNA的分析方法(例如其它的癌症诊断分析方法,包括但不限于PSA分析、癌胚抗原(CEA)分析、BRCA1分析和BRCA2分析)相结合来进行的。这样的癌症诊断分析方法在本
技术领域
内是众所周知的。本发明的方法也可以与分析受试者的家族史和风险因子(例如环境风险因子、生活方式风险因子)结合使用。正如在本
技术领域
内所熟知和本文描述的那样,PSA测试帮助了前列腺癌的早期诊断,但是灵敏度和特异性都不高(Punglia等,ME"g/.WSY力:335-42(2003))。因此,单独使用PSA测试导致高百分率的假阴性和假阳性诊断,导致在许多情况下漏诊癌症和对未患癌症者进行不必需的随后活组织检查。在一个实施方案中,前列腺癌或对前列腺癌易感性的诊断是通过检测至少一种与Chr8q24.21有关的等位基因和/或与LD区块A有关的等位基因以及PSA分析相结合来进行的。试剂盒在诊断方法中使用的试剂盒包含可用于本文描述的任何方法的成分,包括例如杂交探针、限制性酶(例如用于RPLP分析)、等位基因特异性寡聚核苷酸、与Chr8q24.21相关核酸和/或LD区块A相关核酸编码的改变的多肽结合的抗体(例如与含有至少一种包括在本文描述的单倍型中的遗传标记的多肽结合的抗体)、或与Chr8q24.21相关核酸和/或LD区块A相关核酸编码的未改变的(天然的)多肽结合的抗体、扩增Chr8q24.21相关核酸和/或LD区块A相关核酸的方法、分析Chi"8q24.21相关核酸和/或LD区块A相关核酸的核酸序列的方法、分析由Chr8q24.21相关核酸和/或LD区块A相关核酸编码的多肽的氨基酸序列的方法等。此外,试剂盒可以提供与本发明的方法结合使用的分析方法所用的试剂,例如其它癌症诊断分析方法所用的试剂(例如用于检测PSA、CEA、BRCA1、BRCA2等的试剂)。在一个实施方案中,本发明是用于分析来自受试者的样品,以便在受试者中检测癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)或对癌症易感性的试剂盒,其中试剂盒中含有一种或多种用于检测与Chr8q24.21和/或LD区块A有关的标记物或单倍型的试剂。在具体的实施方案中,试剂盒含有至少一种连续的核苷酸序列,该序列与含有至少一种与Chr8q24.21禾卩/或LD区块A有关的标记物的区域完全互补。在另一个实施方案中,试剂盒中含有一或多种能够检测一或多种特定标记物或单倍型的核酸。在另一个实施方案中,试剂盒中含有一种或多种试剂,其中包含至少一个连续的核苷酸序列,该序列与含有来自表1或表13或下面的另一个表中的至少一种标记物的区域(例如含有至少一种来自表1或表13的标记物的SEQIDNO:l的区域)完全互补。这种连续的核苷酸序列或核酸(例如寡聚核苷酸引物)可以使用作为癌症或对癌症易感性指示的SNPs或微卫星侧翼的核酸的部分来设计。这样的核酸(例如寡聚核苷酸引物)被设计用来扩增与癌症标记物或单倍型有关的Chr8q24.21禾口/或LD区块A区域。在另一个实施方案中,试剂盒含有一或多种能够检测与Chr8q24.21禾口/或LD区块A有关的特定标记物或单倍型的标记的核酸以及用于检测标记的试剂。适合的标记包括例如放射性同位素、荧光标记、酶标记、酶辅助因子标记、磁性标记、自旋标记、表位标记。在具体的实施方案中,用试剂盒的试剂检测的标记物或单倍型包含选自由表13中的标记物的一种或以上的标记物、两种或以上的标记物、三种或以上的标记物、四种或以上的标记物、五种或以上的标记物。在另一个实施方案中,被检测的标记物或单倍型含有rsl447295等位基因A和/或DG8S737等位基因-8。在这样的实施方案中,标记物或单倍型的存在是对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的指示。与Chr8q24.21相关的前列腺癌的诊断尽管诊断方法已经在诊断对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的上下文中进行了大概的描述,该方法也可以用于诊断与Chr8q24.21相关的癌症(例如与Chr8q24.21相关的前列腺癌、与Chr8q24.21相关的乳腺癌、与Chr8q24.21相关的肺癌、与Chr8q24.21相关的黑素瘤)。例如,可以对患有癌症的个体进行评估以确定在个体中,在与Chr8q24.21有关的核酸和/或与LD区块A有关的核酸中是否存在多态性,和/或个体中单倍型的存在是否可能是个体癌症的贡献因素。在本文中使用的术语"与Chr8q24.21相关的癌症"、"与Chr8q24.21相关的前列腺癌"、"与Chr8q24.21相关的乳腺癌"、"与Chr8q24.21相关的肺癌"、"与ChrSq24.21相关的黑素瘤"是指在Chr8q24.21相关的核酸序列中或具有与Chr8q24.21有关的单倍型中具有多态性的受试者中,癌症、或特定形式的癌症的发生。与Chr8q24.21相关的癌症(例如与Chr8q24.21相关的前列腺癌、与Chr8q24.21相关的乳腺癌、与Chr8q24.21相关的肺癌、与Chr8q24.21相关的黑素瘤)的鉴定便利了治疗计划,因为治疗可以被设计,可以选择靶向适合的、与Chr8q24.21相关的基因或蛋白的治疗方案在本发明的一个实施方案中,与Chr8q24.21相关的癌症(例如与Chr8q24.21相关的前列腺癌、与Chr8q24.21相关的乳腺癌、与Chr8q24.21相关的肺癌、与Chr8q24.21相关的黑素瘤)的诊断是通过检测与Chr8q24.21相关的核酸中的多态性来进行的(例如使用本文中描述的方法和/或本
技术领域
中现有的其它方法)。在本文中描述了与Chr8q24.21相关的核酸序列中特定的多态性(参见例如表1和表13)。为了确定癌症是否与Chr8q24.21有关,从患有癌症的受试者获得基因组DNA、RNA或cDNA测试样品。然后对DNA、RNA或cDNA样品进行检测,以确定与Chr8q24.21有关的核酸序列中是否存在多态性。如果与Chr8q24.21有关的核酸序列有多态性,该多态性的存在是与Chr8q24.21有关的癌症的指示。例如在一个实施方案中,可以使用杂交方法例如Southern分析、Northern分析或原位杂交来检测多态性。在其它实施方案中,可以使用限制性酶消化突变分析或序列分析,等位基因特异性寡聚核苷酸或定量PCR(动力学热循环)方法也可以使用。与Chr8q24.21有关的癌症的诊断也可以通过检测与Chr8q24.21有关的核酸编码的多肽的表达和/或组成来进行,这可以使用各种方法,包括酶联免疫吸附分析(ELISAs)、Western印迹、免疫沉淀和免疫荧光。来自受试者的测试样品被评估与Chr8q24.21有关的核酸编码的多肽的表达的变化和/或组成的变化的存在,或与Chr8q24.21有关的核酸编码的特定变异体的存在。与Chr8q24.21有关的核酸编码的多肽的表达的变化可以是例如多肽表达的定量的变化(即产生的多肽的量);与Chr8q24.21有关的核酸编码的多肽的组成的变化是多肽表达的定型的变化(例如与Chr8q24.21有关的多肽或不同的剪接变异体的表达改变)。在其它的实施方案中,本发明涉及通过鉴定在本文中详细描述的与Chr8q24.21有关的标记物或单倍型的存在,在受试者中诊断和鉴定与Chr8q24.21相关的癌症(例如与Chr8q24.21相关的前列腺癌、与Chr8q24.21相关的乳腺癌、与Chr8q24.21相关的肺癌、与Chr8q24.21相关的黑素瘤)的方法。例如,在本文表1、2、4、5和13中描述的标记物和/或单倍型在患有癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)的受试者中比在未受癌症影响的受试者中出现得更加频繁。因此,这些标记物和/或单倍型对于检测与Chr8q24.21相关的癌症具有预测价值。在一个实施方案中,对于检测与Chr8q24.21相关的癌症具有预测价值的标记物和/或单倍型包含选自表13中的标记物的的一或多种标记物。在另一个实施方案中,对于检测与Chi"8q24.21相关的癌症具有预测价值的标记物和/或单倍型包含选自DG8S737等位基因-8和rsl447295等位基因A的一或多种标记物。在其它实施方案中,对于检测与Chr8q24.21相关的癌症具有预测价值的单倍型含有单倍型1或单倍型la。本文描述的方法可以用于评估来自受试者的样品中标记物或单倍型的存在与否;标记物或单倍型的存在是与Chr8q24.21相关的癌症的指示。正如在本
技术领域
中所熟知的那样,个体对于特定的治疗方案(例如治疗药剂)可能有不同的反应。不同的反应的基础可能部分是由遗传决定的。因此,在一个实施方案中,标记物或单倍型的存在是对特定治疗方式的不同反应率的指示。这意味着在Chr8q24.21上带有标记物或单倍型的癌症病人对用于治疗癌症的特定治疗方法、抗激素药物和/或放射疗法将有较好的或较差的反应。因此,标记物或单倍型的存在与否能够帮助决定对于癌症病人应该使用何种治疗。例如,对于新被诊断的前列腺癌病人来说,可以评估Chr8q24.21上标记物或单倍型的存在(例如通过本文描述的方法检测从血液样品衍生的DNA)。如果病人在Chr8q24.21上对标记物或单倍型阳性(也就是说存在标记物或单倍型),那么医生可以推荐一种特定治疗方法,而如果病人对标记物或单倍型阴性,那么可以推荐不同的治疗过程(可以包括推荐不进行立即治疗,而是连续监测前列腺癌的发展)。因此,病人的携带状态可以被用于帮助确定是否应该使用特定的治疗方式(例如化疗试剂、抗激素试剂、放射治疗)。本发明的核酸和多肽本文描述的核酸和多肽可以用于诊断对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)易感性的方法中,以及用于这样的诊断的试剂盒中。本文使用的"分离的"核酸分子是指已经与通常位于基因或核苷酸序列两侧(像在基因组中那样)的核酸分离开来,并且/或已经从其它被转录的序列(例如在RNA文库中那样)中完全或部分纯化的核酸分子。例如,本发明的分离的核酸可以是对其天然存在的复杂细胞环境来说、或通过重组技术生产时对培养基来说、或化学合成时对化学前体或其它化学物质来说是基本上被分离的。在某些情况下,分离的物质将构成组合物(例如含有其它物质的粗提液)、缓冲系统或试剂混合物的一部分。在其它情况下,物质可以被纯化到基本上均一,例如通过聚丙烯酰胺凝胶电泳(PAGE)或柱层析(例如HPLC)所确定的那样。本发明的分离的核酸分子可以含有存在的所有大分子物质的至少大约50%、至少大约80%或至少大约90%(在物质的量的基础上)。对于基因组DNA来说,术语"分离的"也可以指从与基因组DNA天然相关的染色体上分离开的核酸分子。例如,分离的核酸分子可以含有在核酸分子所来自的细胞的基因组DNA中位于核酸分子的两侧的少于大约250kb、200kb、150kb、100kb、75kb、50kb、25kb、10kb、5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核苷酸。核酸分子可以与其它编码或调节序列融合并仍然被认为是分离的。因此,载体中包含的重组DNA被包含在本文所用的"分离的"的定义中。分离的核酸分子也包括了异源宿主细胞或异源生物体中的重组DNA分子,以及溶液中的部分或基本上纯化的DNA分子。"分离的"核酸分子也包括本发明的DNA分子的体内和体外RNA转录本。分离的核酸分子或核苷酸序列可以包括通过化学或重组手段合成的核酸分子或核苷酸序列。这样的分离的核苷酸序列可用于例如生产编码的多肽、作为探针用于分离同源序列(例如从其它哺乳动物的种类中)、用于基因作图(例如通过与染色体进行原位杂交)、或用于检测组织中(例如人类组织)基因的表达,例如通过Northern印迹分析或其它杂交技术。本发明还涉及在高度严紧杂交条件例如用于选择性杂交的条件下,与本文描述的核苷酸序列杂交的核酸分子(例如与含有与本文描述的单倍型有关的多态性位点的核苷酸序列杂交的核酸分子)。在--个实施方案中,本发明包括了在高度严紧的杂交和清洗条件下(例如用于选择性杂交的条件下),与含有SEQIDNO:l或其片段的核苷酸序列(或含有SEQIDNO:l或其片段的互补序列的核苷酸序列)杂交的变异体,其中核苷酸序列含有至少一种包含在本文描述的单倍型(例如单倍型)中的多态性等位基因。这样的核酸分子可以通过等位基因或序列特异性杂交(例如在高度严紧条件下)来检测和/或分离。核酸杂交的严紧条件和方法在CurrentProtocolsinMolecularBiology(Ausubel,F.等,"CurrentProtocolsinMolecularBiology",JohnWiley&Sons,(1998))的2.10.1-2.10.16和6.3.1-6.3.6的页面中以及Rraus,M.和Aaronson,S"淑Wsfw"mo/,2卯:546-556(1991)中有解释,其全部内容在此引为参考。两条核苷酸或氨基酸序列的百分一致性可以通过以最适合比较的目的对序列进行比对(例如可以在第一个序列的序列中引入间隙)来确定。然后比较对应位置的核苷酸或氨基酸,两个序列之间的百分一致性是序列所共有的一致的位置数目的函数(即%—致性=一致的位置的数目/总的位置数目x100)。在某些实施方案中,出于比较目的而比对的序列的长度是对照序列的长度的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%。两条序列的准确比较可以通过众所周知的方法来完成,例如使用数学算法。这样的数学算法的非限制性的例子被描述在Karlin,S.和Altschul,S.,尸roc.A^/.90:5873-5877(1993)中。这种算法被整合在NBLAST和XBLAST程序(2.0版)中,如同在Altschul,S.等,AW"c爿c!Wsies.,25:3389-3402(1997)中描述的那样。当使用BLAST和GappedBLAST程序时,可以使用相应程序(例如NBLAST)的默认参数。参见万维网上的网点ncbi.nlm.nih.gov。在一个实施方案中,序列比较的参数可以被设置为分值=100、词长度=12,或者也可以改变(例如W=5或\¥=20)。用于序列比较的数学算法的另一个非限制的例子是Myers和Miller的算法CABIOS(1989)。这种算法被整合到ALIGN程序(2.0版本)中,它是GCG序列比对软件包的一部分。当使用ALIGN程序比较氨基酸序列时,可以使用PAM120权重残余表(weightresiduetable)、间隙长度罚分12和间隙罚分4。其它用于序列分析的算法在本
技术领域
中是熟知的,包括在Torellis,A.禾卩Robotti,C,Com/w/./0:3曙5(1994)中描述的ADVANCE禾BADAM,以及在Pearson,W.禾口Lipman,D.,/Voc.A^/.^o^.OS"A55:2444-48(1988)中描述的FASTA。在另一个实施方案中,两个氨基酸序列之间的百分一致性可以使用GCG软件包(Accelrys,Cambridge,UK)中的GAP程序来完成,使用Blossom63矩阵或PAM250矩阵,间隙权重为12、10、8、6或4,长度权重为2、3或4。在另一个实施方案中,两个核酸序列之间的百分一致性可以使用GCG软件包中的GAP程序来完成,使用间隙权重50和长度权重3。本发明也提供了分离的核酸分子,其中包含的片段或部分可以在高度严紧条件下与含有SEQIDNO:l或其片段或由SEQIDNO:l或其片段组成的核酸(或含有SEQIDNO:l或其片段或由SEQIDNO:l或其片段组成的互补序列的核苷酸序列)杂交,其中的核苷酸序列含有至少一个在本文描述的单倍型(例如单倍型)中包含的多态性等位基因。本发明的核酸片段长度为至少大约15、至少大约18、20、23或25个核苷酸,可以是30、40、50、100、200、500、1000、10000或以上的核苷酸长。本发明的核酸片段在例如本文描述的分析方法中被用作探针或引物。"探针"或"引物"是以碱基特异性的方式与核酸分子的互补链杂交的寡聚核苷酸。除了DNA和RNA之外,这种探针和引物包括在Nielsen,P.等,2^:1497-1500(1991)中描述的多肽核酸(PNA)。探针或引物含有的核苷酸序列区域可以与含有来自SEQDDNO:l的连续的核苷酸序列、并含有包含在本文描述的一个或多个单倍型中的至少一个等位基因及其互补序列的核酸分子的至少大约15个、典型大约20-25个、在某些情况下大约40、50或75个连续的核苷酸杂交。在具体的实施方案中,探针或引物可以含有100个或更少的核苷酸;例如在某些情况下从6到50个核苷酸,或例如从12到30个核苷酸。在其它的实施方案中,探针或引物与连续的核苷酸序列或连续的核苷酸序列的互补序列具有至少70%的一致性、至少80%的一致性、至少85%的一致性、至少90%的一致性或至少95%的一致性。在另一个实施方案中,探针或引物能够与连续的核苷酸序列或连续的核苷酸序列的互补序列选择性地杂交。通常情况下,探针或引物还含有标记物,例如放射性同位素、荧光标记物、酶标记物、酶辅助因子标记物、磁性标记物、自旋标记物、表位标记物。本发明的核酸分子例如上面描述的那些,可以使用标准的分子生物学技术和SEQIDN0:1中提供的序列信息来鉴定和分离。总的来说可以参见《PCR技术DNA扩增的原理和应用》(PCRTechnology:PrinciplesandApplicationsforDNAAmplification)(H.A.Erlich主编,FreemanPress,NY,NY,1992);《PCR方案方法和应用指南》(PCRProtocols:AGuidetoMethodsandApplications)(Innis,等主编,AcademicPress,SanDiego,CA,1990);Mattila,P.等,M/c/e/d油to.,/9:4967-4973(1991);Eckert,K.禾口Kunkel,T.,尸C7M"WsWy^p//c""o"s,7:17-24(1991);PCR(McPherson等主编,IRLPress,Oxford);和美国专利4,683,202,这些文献中的每个的全部内容在此引为参考。其它适合的扩增方法包括连接酶链反应(LCR;参见Wu,D.和Wallace,R.,G飾m.cs,4:560-469(1989);Landegren,U.等,Scfe打ce,2乾.1077-画0(1988))、转录扩增(Kwoh,D.等,尸亂胸/ifl""..园,組173-1177(1989))、自维持的序列复制(Guatelli,J.等,尸麼A^.JcaAS7:1874-1878(1990))和基于核酸的序列扩增(NASBA)。后两种扩增方法包含基于等温转录的等温反应,都产生单链RNA(ssRNA)和双链DNA(dsDNA)作为扩增产物,比率分别为大约30和100比1。扩增的DNA可以被标记(例如放射性标记)并用作探针来筛选来自人类细胞的cDNA文库。cDNA可以来自mRNA,并包含在zapexpress(Stratagene,LaJolla,CA)、ZIPLOX(GibcoBRL,Gaithesburg,MD)或其它适合的载体中。相应的克隆可以被分离,在体内切除后可以获得DNA,然后可以通过本领域所熟知的方法从一个或两个方向对克隆到的插入片段进行测序,以鉴定为具有适合的分子量的多肽编码的正确的开放阅读框。例如,本发明的核酸分子的核苷酸序列的直接分析可以通过商业化的众所周知的的方法来完成。参见例如Sambrook等,《分子克隆实验指南》(MolecularCloning,ALaboratoryManual)(第二版,CSHP,NewYork1989);Zyskind等,《重组DNA实验室指南》(RecombinantDNALaboratoryManual)(Acad.Press,1988)。此外,荧光方法也可用于分析核酸(Chen,X.等,Ge"ome化492-498(1999))和多肽。使用这些或类似的方法,多肽和编码多肽的DNA可以被分离、测序和进一步定性。一般来说,本发明的分离的核酸序列可以被用作Southern凝胶上的分子量标准,以及被标记用来对相关基因位置进行作图的染色体标准。核酸序列也可以被用来与病人中内源的DNA序列进行比较,以鉴定癌症或对癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)的易感性,以及作为探针,以例如杂交和发现相关的DNA序列或从样品中消减已知的序列(例如消减杂交)。核酸序列还可以被用来产生用于遗传指纹分析的引物、用来使用免疫技术产生抗多肽的抗体、和/或作为抗原来产生抗DNA抗体或引发免疫反应。在本文中使用时,当氨基酸序列至少大约45-55%同源或一致时,两个多肽(或多肽的区域)是基本上同源或一致的。在其它的实施方案中,当氨基酸序列至少大约70-75%、至少大约80-85%、至少大约90%、至少大约95%同源或一致、或完全一致时,两个多肽(或多肽的区域)是基本上同源或一致的。根据本发明,基本上同源的氨基酸序列是由含有SEQIDNO.l或其片段、并含有表1中显示的至少一个多态性的核酸分子所编码的,其中的编码核酸能够与SEQIDNO.l在严紧条件下杂交,正如本文所具体描述的那样。现在,本发明将通过下面的实施例进行描述,这些实施例不以任何方式构成限制。所有本文引用的出版物的相关内容中以前没有被引为参考的,在此以其全文引为参考。实施例1与癌症有关的区域的鉴定研究染色体8q24.21上的区域被鉴定能够造成对特定癌症(例如前列腺癌)的增加的风险。该区域首先是通过对与乳腺癌病例紧密相关的前列腺癌病人的前列腺癌(PrCa)家族进行连锁分析而检测到的。遗传学,究^涉i游疯乂自从1955年以来被诊断患有前列腺癌的病人群体包括3123个病人,其中大约三分之一在研究时还活着。被诊断患有乳腺癌的病人群体包括4045个病人。在进行研究时招募了大约950个前列腺癌病人。我们最初对发现对前列腺癌和乳腺癌都有贡献的基因感兴趣。因此,我们针对谱系数据库运行了我们招募的病人的名单以覆盖整个冰岛。我们仅仅涵盖了具有最多涉及6次减数分裂(6次减数分裂分离第二代表亲)的至少两个前列腺癌病人、并同时包含至少一个与前列腺癌病人有很近亲缘(最多3次减数分裂)的乳腺癌病人的家族(对于乳腺癌病人我们没有使用DNA或基因分型,我们仅仅通过亲属中乳腺癌的状态来设法分离我们的前列腺癌组)。这些标准产生了75个大的家族,含有167个前列腺癌病人。两个前列腺癌病人之间的最远距离是6次减数分裂,但是平均距离是3.5次减数分裂。基厉资范房游占蘇谱系数据库被用于产生含有两个或以上前列腺癌病人和至少一个与两个前列腺癌病人的亲缘关系在3次减数分裂事件(代)以内的乳腺癌病人的家族。对75个扩展家族中的167个前列腺癌病人进行了基因组范围的扫描。步骤与Gretarsd6ttir,等,/i/"mGe"e,.,7(Y":593-603(2002)中描述的相似。简单来说,使用含有1200个微卫星标记物、平均分辨率为3cM的框架标记物组对DNA进行基因分型。在签署了由冰岛数据保护机构和国家生物伦理委员会批准的知情同意表之后,研究中的受试者被抽取45mL血液。使用被调整成适合于高通量的Qiagen提取方法从全血中分离DNA。微卫星筛选组使用荧光标记的引物,所有的标记物通过多重PCR反应进行大规模试验以最适化收率。基因分型的错误率低于0.2%,这是基于对超过5000个用本框架标记物组进行两次基因分型的个体的基因型的比较得出的。使用Cyberlab机器人进行PCR扩增并合并,使用的反应体积为51,其中含有20ng基因组DNA。使用DAC程序自动或手动地调用等位基因,并使用deCODE-GT程序按照质量进行分离并编辑调用的基因型(Palsson,B.,等,Gewo/weie&,9"0」1002-1012(1999))。从多于30000个参与deCODE遗传学各种疾病项目的基因组范围研究的冰岛人组中,建立起群体中标记物等位基因的频率。基因座中被基因分型的微卫星标记物是可以公开获得的或在deCODE遗传学项目中设计的;那些标记物用DG标注指明。DNA序列中的重复被鉴定,这允许我们选择和设计在基因座上均匀地间隔开的的引物。重复序列和相对于其它标记物的位置的鉴定是基于deCODE遗传学项目的物理作图组的工作。对于在基因组范围扫描中使用的标记物来说,遗传位置从deCODE遗传学项目构建的最近发表的高分辨率遗传图谱(HRGM)(KongA.,等.,胸Gew",3/:241-247(2002))中获得。其它标记物的遗传位置或者从HRGM获得,如果可用的话,或者通过对为本特定的连锁研究进行基因分型的家族的材料使用与构建HRGM图谱中使用的同样的遗传作图方法来获得。连敏分析游统^学方法连锁分析使用Allegro软件(Gudbjartsson等,A^z,.Z5:12-3,(2000p进行,它通过使用非参数性的、仅受影响的、等位基因共享的方法(没有指定任何特定的疾病遗传模型)来确定相关病人间过量的共享的统计学重要性。Allegro是deCODE遗传学项目开发的连锁程序,在多点计算的基础上计算LOD分值。我们的基线连锁分析使用Spairei十分函数(Whittemore,A.S.和Halpern,J.,肠m欲/cs50:118-27(1994);EruglyakL,等,」m5&1347-63,(1996))、指数等位基因共享模型(Kong,A.禾PCox,N.J.,i/ww.(57:1179-88(1997))和家族加权方案,它在对数标度上处于每个被影响的对同等加权和每个家族同等加权之间的途中。在分析中,所有没有患病的被基因分型的个体作为为"未知的"被处理。因为关注小样品的行为,我们用两种不同的方法计算了相应的p值以进行比较。第一个p值是根据大样品理论来计算的;Z'产麵ge(10)LOD),基本上如在没有连锁的零设假设下标准的正态分布那样分布。第二个p值是通过将观察到的LOD分值与原假设下它的完全数据取样分布进行比较来计算的。当数据组由多于几个家族组成时,这些两个p值趋于非常相似。所有LOD分值大于2的建议基因座用一些额外的标记物进行追踪,以增加家族中共享的信息并减少LOD分值代表假阳性连锁的机会。所用的信息计算由Nicolae定义(D.L.Nicolae,论文,UniversityofChicago(1999)),是Allegro程序输出结果的一部分。该计算与以前由Dempster等(Dempster,A.P.,等,,兄脑.Soc.39:1-38(1977))描述的经典的信息计算方法紧密相关;当标记物的基因型完全不提供信息时,信息等于零,而如果基因型确定了受影响的亲属中后裔所共享的等位基因的准确的量,信息等于l。使用具有4cM的平均标记物间隔的框架标记物组,在用于我们的连锁分析的家族中一般可以产生大约0.7的信息含量。将标记物密度增加到每个分摩1个标记物时,通常可以将信息含量增加到0.85以上。/^关性与卓谱星^分析游-统^学方^对于与疾病的单个标记物相关性来说,Fisher确切条件检验可以被用来计算每个个体等位基因的两边的p值。在显示结果时,对于微卫星、SNPs和单倍型来说,我们使用了等位基因频率而不是携带者频率。单倍型分析使用我们在deCODE开发的被称为NEMO(NEstedModels)(Gretarsd6ttir,等,淑2,(9"力(7」131-8)的计算机程序来进行。NEMO被用于研究标记物一标记物之间的相关性和计算标记物之间的连锁不平衡(LD),以及用于病例对照单倍型分析。使用NEMO,可以通过最大似然性估算单倍型频率,并使用通用化的似然比测试来检验病人和对照之间的差别。被观察数据的最大似然性估计值、似然比和P值在EM算法的帮助下被直接计算,因此由于阶段的不确定性和遗漏的基因型所引起的信息的丢失被似然比自动地捕获,在大多数情况下,大样品理论可以被用来可靠地确定统计学显著性。等位基因或单倍型的相对风险(RR)、即等位基因与同样标记物的所有其它等位基因相比的风险,可以使用假定的乘法模型(Terwilliger,J.D.禾QOtt,J.检测等位基因关联性的基于单倍型的"单倍型相对风险"方法(Ahaplotype-based'haplotyperelativerisk'approachtodetectingallelicassociations.)T/謂.i/erec/.42,337-46(1992)禾口Falk,CT.禾卩Rubinstein,P.单倍型相对风险构建用于风险计算的适合的对照样品的容易可靠的方法(H叩lotyperelativerisks:aneasyreliablewaytoconstructapropercontrolsampleforriskcalculations.)Hww.GewW.5/(Pt3),227-33(1987))和群体可归因风险(PAR)来计算。在单倍型分析中,将单倍型合为一组并将该组作为整体来测试与疾病的相关性,可能是有用的。使用NEMO做到这一点是可能的。通过对所有可能的单倍型组进行分配定义了模型,其中同样的组中的单倍型被假定引起同样的风险,而不同组中的单倍型可以引起不同饿。当另一种假说对应于虚设假说来说划分得更为精细时,这两种假说被说成是嵌套。NEMO在划分单倍型空间时能够提供完全的灵活性。通过这种方式,测试多个单倍型共同的关联性以及测试不同的单倍型是否引起不同的风险,是有可能的。作为LD的度量,我们使用了两种LD的标准定义,ID'I和R2(Lewontin,R.,49:49-67(1964)禾口HillW.G.和A.Robertson,7Tz亂柳/.G潔/,":226-231(1968)),它们对于LD的量提供了补充的信息。为了估计ID'I和R2,使用最大似然性方法估算了所有两个等位基因组成的单倍型组合的频率,使用似然比测试评估与连锁不平衡的偏差。通过对用临界等位基因可能性加权的两个标记物的所有可能的等位基因的组合的值进行平均,ID"和W的标准定义被扩展到包含了微卫星。可以从在一滴LOD中被基因分型的密集的标记物组构建出的可能的单倍型的数量非常巨大,即使在病人和对照组中实际观察到的单倍型的数量比这小得多,测试所有这些单倍型与疾病的关联性仍然是一项艰难的任务。应该注意到,我们没有将我们的分析限制于从一组连续的标记物构成的单倍型,因为某些标记物可能是非常易突变的,可能将由周围的标记物构成的原本非常保守的单倍型分割开来。在本研究中,只有跨度小于300kb的单倍型被考虑在内。錄荣正如本文所描述的那样,染色体8q24.21的区域被鉴定为引起了对特定癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)的增加的风险。与对癌症增加的风险有关的特定单倍型和标记物被描述在表1中。正如表1中所示,单倍型包含了下列标记物(例如SNP、微卫星)和等位基因SG08S6863等位基因、SG08S7102等位基因、DG8S737-8等位基因、SG08S6874等位基因、SG08S7171等位基因、SG08S6642等位基因、SG08S7222等位基因、SG08S6892等位基因、SG08S6904等位基因、SG08S7204等位基因、DG8S17691等位基因、SG08S6912等位基因和DG8S1407-1等位基因。单倍型位于128,417,467和128,511,854bp(NCBIBuild34)之间的我们称为LD区块A中,每个标记物的位置指示在表1中。表1<table>tableseeoriginaldocumentpage81</column></row><table>*单倍型中SNPs的解码的等位基因编码如下1=A,2=C,3=G,4=T;对于微卫星等位基因来说,CEPH样品(Centred'EtudesduPolymorphismeHumain,基因组学库,CEPH样品1347-02)被用作参考,该样品中每个微卫星的较短的等位基因被设置为0,其它样品中所有其它的等位基因相对T该参考编号。因此,例如等位基因1比CEPH样品中较短的等位基因长1bp,等位基因2比CEPH样品中较短的等位基因长2bp,等位基因3比CEPH样品中较短的等位基因长3bp,依此类推,等位基因-1比CEPH样品中较短的等位基因短lbp,等位基因-2比CEPH样品中较短的等位基因短2bp,依此类推。INDEL是指插入(IN)或缺失(DEL),MNR=单核苷酸重复。20068002516LX转溢也被70/1365t为了发现这些与癌症相关的单倍型,首先使用前列腺癌和乳腺癌分离的家族进行基因组范围的连锁扫描。使用那些标准,总共167个前列腺癌病人共计与75个家族有关。图l描述了连锁扫描的结果,并详述了在Chr8q24上看到的峰。具体来说,连锁扫描显示了Chr8q24上基因组范围内分值为4.0的显著的LOD分值。染色体8上的峰值标记物是D8S1793,在从标记物DG8S507到标记物D8S1746的区域中、或125,594,794-135,199,182bp(NCBIBuild34)的区域中LOD分值下降了l个单位。该区域用352个微卫星标记物和73个SNP标记物进行基因分型,平均密度为每22.8kb—个标记物。对从前列腺癌病例和对照获得的基因型进行关联性分析产生了与前列腺癌显著相关的标记物和单倍型(图2,表2-5)。前列腺癌、乳腺癌、肺癌、黑素瘤和良性前列腺肥大的结果被详细描述在表2到5中。与前列腺癌有关的单倍型区域中的LD结构被显示在图3A和3B中。结构是从HAPMAP数据14版衍生而来的。具体来说,包含了单倍型1的LD区块被显示在图3A左部,由水平的箭头指示。该LD区块(LD区块A)位于Chr8q24.21上,在位于128,417,467bp的标记物rs7841228和位于128,511,854bp的标记物rs7845403之间,长度大约为95kb。现在已经进一步将LD区块A定位在Chr8q24.21的128,414,000bp和128,516,000bp之间。LD结构被看作是在图中被红色和蓝色所指示的标记物之间具有高的一和ID'I的DNA区块。在图3A中标记物以任何两个标记物之间相同的距离标注,但是在图3B中,以NCBIBuild34的坐标(标记物间的实际距离)标注。图4显示了冰岛前列腺癌病人组和对照组中与前列腺癌、乳腺癌、肺癌和黑素瘤有关的单倍型区域中的LD区块。该区块结构中大部分的标记物对具有高的|D'|(p'l〉0.S),标记物对的?最多达到1。该区域中包含了重组事件,正如在图3中可以很好地看到的棋盘图案所显示的那样。该区块结构中的标记物也与多达200kb远的较远的标记物(包括在128515000bps的标记物(rs7845403、rs6470531和rs7829243)和PVT1基因区域中的128720000bps附近的标记物(rsl0956383和rs6470572))具有中度的相关性(一小于0.2)。正如本文所描述的那样,作图在人类基因组染色体8q24.21中的基因和预测的基因包括已知的基因POU5FLC20(Genbank获取号AF268618)、C-MYC(Genbank获取号NM002467)和PVTKGenbank获取号XM—372058),以及预测的基因(例如GenbankAccessionNos.BE676854、AL709378、BX108223、AA375336、CB104826、BG203635、AW183883和BM804611)。正如图5中所描述的那样,本发明的标记物和单倍型位于两个已知的基因之间,即POU5FLC20/AF268618和C-MYC(来自www.genome.ucsc.edu网点上的USCS基因组浏览器Build34)。与该区域和癌症有关的标记物或单倍型中存在的变异可能影响附近的基因例如POU5FLC20、c-MYC、PVT1禾卩/或其它该区域中已知、未知或预测的基因的表达。此外,这些变异可能影响RNA或蛋白的稳定性,或可以产生结构上的结果、以至于在单倍型携带者中该区域更倾向于体细胞重排。这与在很大百分率的癌症、包括但不限于前列腺癌、乳腺癌、肺癌和黑素瘤中Chr8q24.21被扩增(www厕genetix.函)相一致。事实上,Chr8q21-24是所有包含的癌症中(大约17%)和前列腺癌中(大约20%)最频繁被获得的染色体区域(www.T3rogenetix.com)。因此,存在的变异能够影响直接与本文描述的单倍型相关的未被定性的基因,或能够影响不直接与本文描述的单倍型相关的邻近的基因。表2描述了一个单倍型——单倍型1(SG08S6863等位基因、DG8S737-8等位基因、SG08S6874等位基因、SG08S7171等位基因、SG08S6642等位基因、DG8S17610等位基因、SG08S7222等位基因、SG08S6892等位基因、SG08S6904等位基因、SG08S7204等位基因、DG8S17691等位基因、SG08S6912等位基因、DG8S1407-1等位基因),并显示出该单倍型增加了对前列腺癌的风险,以及对侵袭性前列腺癌(由组合的Gleason分值7(4+3)-10所定义)的较大的风险。该单倍型在第二组冰岛前列腺癌病例和新的对照组中被复制。正如在表2中所描述的那样,单倍型1被21.4%的前列腺癌病人和11.8%的对照者所携带。单倍型1携带者患有前列腺癌的相对风险是1.92(p值=1.71xl(T8)。值得注意的是等位基因频率被显示在所有表中,它们大约是携带者频率的一半。Gleason分值是最经常使用的前列腺癌分级系统(DeMarzo,A.M.等,丄a"c^M/:955-64(2003))。该系统是基于这样一个发现,即前列腺癌的预后介于最主要的癌症形式和第二主要的癌症形式的预后之间。Id。在来自前列腺肿瘤的组织学样品中鉴定这些最主要和第二主要的形式,每个按照从l(分化最大)到5(分化最小)分级,并将两个分值相加。因此,合并的Gleason等级、也被称为Gleason和或分值,从2(与形式1一致的肿瘤)到10(未分化的肿瘤)。大多数特别是在活组织针检中具有趋异模式的病例,其差别不超过一种模式。Id。Gleason分值是一种预后指标,主要的预后变化在6到7之间,当Gleason分值为7时肿瘤的行为更糟,分值为5或6的肿瘤相比导致更多的发生率和更高的死亡率。分值为7的肿瘤还可以进一步亚分类为3+4或4+3(第一个数字是活组织检测的肿瘤样品中最主要的组织学亚类,第二个数字是第二主要的组织学亚类),分值4+3与较坏的预后有关。病人的Gleason分值也影响治疗选择。例如,在活组织针检中具有有限的Gleason分值5-6和低的PSA浓度的较年轻男性可以仅仅被监测,而Gleason分值为7或以上的男性通常需要接受主动的管理。在表2中,显示了单倍型的频率和侵袭性前列腺癌(即组合的Gleason分值7(4+3)到10所指示的)以及侵袭性较低的前列腺癌(即组合的Gleason分值2到7(只是3+4)所指示的)的相关风险。但是,Gleason分值不是完美的预后预测指标。因此,具有低Gleason分值肿瘤的病人仍然可能具有更具侵袭性的前列腺癌(被定义为肿瘤超出了前列腺的局部范围或远距离转移)。<table>tableseeoriginaldocumentpage85</column></row><table>与单倍型1的某些单个标记物有关的风险和显著性(在表2的表头中列出的)与单倍型1的类似。表3列出了这些标记物以及与它们有关的风险。表3:与前列腺癌有关的单个标记物的频率和风险<table>tableseeoriginaldocumentpage86</column></row><table>使用较少的微卫星标记物检测的与单倍型1高度相关的单倍型与其它形式的癌症(例如乳腺癌、肺癌、黑素瘤)的增加的风险有关。表4显示了该单倍型(含有DG8S737-8等位基因、DG8S17691等位基因和DG8S1407-1等位基因的单倍型la)显著地(单边p-值0.05)增加了患有前列腺癌、高Gleason(侵袭性的)前列腺癌、乳腺癌、肺癌、黑素瘤和恶性皮肤黑素瘤的风险,但是没有增加患有原位黑素瘤的风险。单倍型la分别被22.2%、16.0%、15.4%和18.0%的前列腺癌、乳腺癌、肺癌和黑素瘤病人所携带。同样地,值得注意的是等位基因频率被显示在所有表中,它们大约是携带者频率的一半。<table>tableseeoriginaldocumentpage87</column></row><table>正如表5中所描述的那样,进一步的研究表明单倍型la没有增加受试者患有不被认为是前列腺癌的良性前列腺肥大(BPH)的风险。正如表5中所显示的,单倍型la被13.8。/。的BPH病人所携带,与对照的11.4%相比,具有不显著的相对风险1.22。表5:与BPH(良性前列腺肥大)相关的单倍型la的频率和风险(单倍型la:DG8S737-8等位基因、DG8S17691等位基因、DG8S1407-1等位基因)<table>tableseeoriginaldocumentpage88</column></row><table>tp-值是单边的**第一组(BPH(非PrCa))包括仅患有BPH的男性第二组(PrCa(非BPH))包括仅患有PrCa的男性第三组(PrCa和BPH)包括被诊断同时患有PrCa和BPH的男性表6描述了被用于扩增序列以检测微卫星标记物的扩增子。表7描述了被用于扩增序列以检测SNP标记物的扩增子。表6:微卫星扩增子和引物列表<table>tableseeoriginaldocumentpage88</column></row><table><table>tableseeoriginaldocumentpage89</column></row><table><table>tableseeoriginaldocumentpage90</column></row><table>表7:SNP扩增子和引物的列表。<table>tableseeoriginaldocumentpage90</column></row><table><table>tableseeoriginaldocumentpage91</column></row><table><table>tableseeoriginaldocumentpage92</column></row><table><formula>formulaseeoriginaldocumentpage93</formula>基因型统计以前验证无SNP人类编辑:C/C:591C/G:1353G/G:730Build34位置chr8:128,467013+别名rs4599773对等物独特的,没有其它SNP对等物对等物名称SG08S689<table>tableseeoriginaldocumentpage94</column></row><table>SNP:SG08S691aaattaacatatactttctttctcagtctcagttcttttccctaaaaataaaataaaataaaataaataggctgttgcactctagaaactactctaaaacaactacagatcaattatgcaaaaaaaagtctgaaagttacagtacatgaggggggaaggaacccttaggtttaacatagaattatctcagttaaggtgactgcataatgaatctgacataaacatcaatttgactgcatgttgctttcattaaagcaaagaaaccagaaaggtggaagaatccttataccttatgctgcatgcatcacaacacaccaagtatactagacctagttctgggaacctcatttcaagagcaatggtgcaaaggagagcagccagaatgaggagaggccaacagaccaggtccactctattccacagtgattcaagaaacgttactgaacatgttgactcctatgttccaggagctgtagagacggagttggatgccacattga[C/T〗gcttccctctagaaacttacattctagtagagggagccagtgtgcaatagaatateatggcaataaacacagggctatactgaatagtgggactgttgcatagctaagagttatgcaagcaccaagtataaagaagcagcttctgagttgatagtgctgttttgtgccttttcagaggtatgttttagaaaaaataactctaatggcagaataaataatggaaataagacagtgaaactaaaagtaaaagaaagccactggg3acccttgc3gt犯ttcccgtg33a3atgataacctcaca3act3aagtagtggtgatgaaaatcgagaagaaaagatgttctgagagctagtttagaaggtagaatcatgagaactcggtgactggataagtatgatggggaatgtagaggaaaagacatccaagatgactctagcttcaaataagagaaaggattgaggaacaagggaagtttggcattaaacaaacaaacaaaaa(SEQIDNO:19)基因型统计以前验证无SNP人类编辑C/C:1087C/T:1156T/T:296Build34位置chr8:128,501972+别名rs6991990对等物独特的,没有其它SNP对等物对等物名称SG08S691<table>tableseeoriginaldocumentpage96</column></row><table><table>tableseeoriginaldocumentpage97</column></row><table><table>tableseeoriginaldocumentpage98</column></row><table>讨论正如本文所描述的那样,已经证实在染色体Sq24.21上的基因座在癌症(例如前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌、黑素瘤)中扮演了重要角色。在患有癌症的受试者中,特定的标记物和单倍型(例如单倍型1、单倍型la、含有一个或多个表1中的标记物的单倍型)的出现比预期频率高。基于本文描述的与特定形式的癌症的倾向性有关的单倍型,可以使用遗传易感性分析(例如诊断筛选测试)来鉴定对癌症有风险的个体。本文描述的标记物和单倍型与良性前列腺疾病无关,在高Gleason前列腺癌病人中与低Gleason前列腺癌病人中相比具有较高的相对风险,因此是侵袭性的、快速生长的前列腺癌的增加的风险的指示。因为显著百分比的前列腺癌是不会发展到前列腺外并引起发病或死亡的非侵袭性形式,而且前列腺癌的治疗、包括前列腺切除术、放疗和化疗、都具有副作用并花费昂贵,因此,具有诊断标记物,例如本文描述的能够显示出与低侵袭性前列腺癌相比、侵袭性前列腺癌的较高的风险的标记物,将是有价值的。在具有本文描述的标记物和单倍型的个体中乳腺癌、肺癌和恶性黑素瘤的相对风险显著增加,进一步支持了它们在鉴定这些形式的癌症的增加的风险中的应用。因为单倍型导致了前列腺癌(例如侵袭性前列腺癌)、乳腺癌、肺癌和恶性黑素瘤的增加的风险,可能这些标记物和单倍型也与其它形式的癌症的增加的风险有关。实施例2:在几个组(Cohort)中证实与前列腺癌相关性其它的分析进一步支持了染色体8q24上与前列腺癌相关的变异体的存在。微卫星DG8S737上的等位基因-8与三个来自冰岛、瑞典和美国的欧洲系谱的组中的前列腺癌相关。该等位基因估算的相对风险是1.62(户=2.7x10—11)。大约19%的病人和13%的普通人群携带至少一个拷贝(PAR=7.4%)。在具有类似的相对风险的非裔美国人组中这种关联性也被重现。在非裔美国人中,该等位基因的频率较高,41%的病人和30%的人群是携带者,导致了较高的PAR(16.8%),并可能引起了前列腺癌的较高的发病率。该等位基因与侵袭性前列腺癌的关联更强。鼎敲法沐岛弱fiT,沐。该组是基于来自冰岛癌症登记处(ICR)的全国范围的名单,该名单包含了从1955年1月1日到2004年12月31曰期间被诊断的所有3815个冰岛前列腺癌病人(国际疾病分类第10次修订代码(ICD10)C61),其中1291个病人同意进行本研究。此外,平均三个第一级亲属和配偶也参加了(病人和亲属88%的参加比例)。来自ICR的病人的临床信息包括诊断时的年龄、SNOMED形态学代码和阶段。活体组织Gleason分值从医学记录获得,由病理学家KRB和BAA检査。被基因分型的病人被诊断时的平均年龄是71岁,在ICR中所有前列腺癌病人的平均年龄是73岁。BPH群体含有510个通过组织病理学证实了BPH诊断的在1982年到2000年间在冰岛被诊断出未患有前列腺的个体。997个个体的对照组从普通人群中招募。该组在三次减数分裂内无亲缘关系,性别比为1,年龄范围在25到85岁之间(中值年龄50岁)。在对照组中对于DG8S737的等位基因-8和rsl447295的等位基因A来说没有观察到性别差异。该研究被冰岛数据保护委员会和冰岛国家生物伦理学委员会批准。从所有病人、亲属和对照人员获得了书面的知情同意书。与医学信息和血液样品相关的个人身份标志使用以前描述的第三方加密系统进行加密(Gulcher,J.R.等,五w.丄i/wm.739-42(2000))。瑞舆,夷濕坏充##"。CAPS1(瑞典前列腺癌1)是一项基于群体的病例对照研究,其中的前列腺癌病人(ICD10C61)是从瑞典6个地区性癌症登记处中的4个中招募的,登记时间为从2001年1月1日或7月1日到2002年9月。该研究群体包含了1435个病例和779个在年龄、性别和居住地上相匹配的对照者。临床信息包括阶段和Gleason分值,大约80%来自活体组织检査,大约20%来自外科手术检查,是从癌症登记或国家前列腺癌登记处获得的。诊断时的病人平均年龄是66.6岁,对照组在被涵盖时的平均年龄是67.9岁。该研究获得了Karolinska研究所和Umea大学伦理学委员会的批准。从所有受试者获得了书面知情同意(Zheng,SX.等,C騰erto.":2918-22(2004);landmark,F.等,丄淑/.C匿e〃"W.96:1248-54(2004))。美国高加索人群体含有458个在芝加哥的西北纪念医院泌尿科进行外科手术的前列腺癌病人(ICD10C61)和260个在芝加哥大学人类遗传学系注册的基于群体的对照者。检査了医学记录以检索包括阶段和活组织Gleason分值的临床信息。病人在诊断时的平均年龄是59岁。病人和对照都是自己报告的欧裔美国血统。这通过使用随机分布在基因组上的30个微卫星标记物(见下文)进行的遗传祖先估计所证实。在该组中欧洲谱系的平均和中值分数都大于0.99(参见下文中详细描述的方法)。研究方案被西北大学和芝加哥大学机构评估委员会批准。所有受试者给出了书面知情同意。非裔美国人研究群体包含了通过Flint男性健康研究和前列腺癌遗传学项目所吸收的246个前列腺癌病人(ICD10C61)和352个对照者。Flint男性健康研究(FMHS)是在年龄在40到79岁之间的非裔美国人中进行的基于社区的病例对照前列腺癌研究,在1996年到2002年间在密歇根州Genesee郡中进行(Cooney,K.A.等,C/ra/ogy57:91-6(2001);Beebe-Dimmer,J丄.等.Pro加?eCawcer9,50-5(2006)),从该项研究中分析了113个病例和352个对照。在密歇根大学进行的前列腺癌遗传学项目(PCGP)是一项大型的基于家庭的研究,注册者包括具有两个或以上活着的患有前列腺癌的家庭成员的男性,或在56岁以前被诊断患有前列腺癌并且没有该疾病的记录的家族史的男t生(Douglas,.A.等,GawcerE/^dem/o/S/omarA;er51/Vev.74:2035-9(2005))。从该组中分析了来自109个家庭的153个病人,其中78个病人没有亲缘关系,75个病人分属31个家庭(大部分是一级亲属)。有15个前列腺癌病人同时出现在FMHS和PCGP组中。对医学记录进行了检查,以提取出与前列腺癌诊断相关的信息,包括阶段和活组织Gleason分值。病人和对照都是自己报告的非裔美国人血统。使用结构软件(Pritchard,J.K.等,^m.J.i/wm.67:170-81(2000年5月26日出电子版))分析了在基因组上随机分布的30个微卫星的基因型(Helgadottir,A.等,/.76:505-9(2005年1月7日出版电子版)),来评估该组中非裔和欧裔血统的比例。这些微卫星中的每个都具有在用于HapMap项目的成对群体样品(即CEU、YRI或东亚人)之间表现出频率的较大差别(〉0.4)的等位基因。来自密歇根州的基因型与来自YRI(作为非洲人对照样品)、CEUHapM叩样品和96个冰岛人样品(作为合并的欧洲人对照样品)的基因型在结构软件中运行。结构软件中的USEPOPINFO选择使用K=3,以便关于具有已知血统(非洲人和欧洲人对照样品)的个体的信息可以被用于帮助确定具有未知血统(来自密歇根的非裔美国人)的个体的血统。在密歇根组中得出的欧洲血统的平均比例在病人中估计是0.224(中值为0.21),在对照中是0.215(中值为0.207)。根据重复10000次的随机化测试,这种平均值的差别是统计学上不重要的(P=0.11)。根据这些血统的遗传评估对密歇根组的关联性计算进行了调整(详见下文)。从所有参加研究者获得了书面同意,研究方案被密歇根大学医学院机构评估委员会批准。,统^学力^#。象以前描述的那样使用1068个微卫星的框架扫描进行了基因组范围的搜索(Gretarsdottir,S.等,//ww.Ge"eA70:593-603(2002);Styrkarsdottir,U.等,Zo//./:E69(2003))。总共871个冰岛被诊断患有前列腺癌的病人和他们平均3个第一级亲属的基因型被分析。使用我们的冰岛人系谱数据库(Gulcher,J.和Stefansson,K.,C"w.C/固.MMec/.36:523-7(1998);Gulcher,J.等,Cawcer7:61-8(2001);Gulcher,J.等,丄//wm.Gew".5:739-42(2000))鉴定了他们的谱系。通过定义前列腺癌病人作为受影响者、所有其其他人为未知者进行了连锁分析。对于多点连锁分析来说,使用了仅受影响的等位基因共享方法(Kong,A.和Cox,NJ.,^m.//wm.G匿"7:1179-88(1997)),通过Allegro程序(Gudbjartsson,D.F.等,舰G認AZ5:12-3(2000))和deCODE遗传图谱(Kong,A.等,淑W:241-7(2002))来进行(参见下文)。另外25个标记物被输入建议的连锁区域中以增加信息的含量。对于单个标记物与前列腺癌的相关性来说,似然率测试被用来计算每个等位基因的双边p-值。对于通过合并组I和组II形成的冰岛组总体(1921个病例和997个对照)来说,某些患有前列腺癌的个体彼此有亲缘关系。有鉴于此,通过模拟整个冰岛系谱的基因型获得了测试统计的原假设分布(参见下文)。同样的方法被用于调整密歇根非裔美国人组中某些患有前列腺癌个体的亲属关系。对于标记物来说显示的是等位基因频率而不是携带者频率。等位基因特异性RR在假设乘法模型的条件下计算(Falk,CT.禾卩Rubinstein,P.,//wm.57(P/":227-33(1987))。在比较不同单倍型组的风险时,使用了利用似然性步骤的NEMO程序(Gretarsdottir,S.等,舰35:131-8(2003))。使用Mantel-Haenszel模型(Mantel,N.禾口Haenszel,W.,J.iV"WCa"cer/wW.22:719-48(1959))将来自多个组的结果合并,其中的组被允许具有不同的群体等位基因或基因型频率,但是被假设具有相同的相对风险。遂徵'分析。Spairs计分函数(Whittemore,A.S.禾卩Halpern,J.,6fomeWcs50:118-27(1994);Kruglyak,L.等,爿m.丄Hwm.58:1347-63(1996))和指数等位基因共享模型(Kong,A.禾口Cox,NJ.,d丄i/wm.6/:1179-88(1997))被用于产生相关的ldf(自由度)统计结果。当将家族分值合并获得整个分值,而不是对每个家庭或每个受影响的对同等加权时,使用的加权方案在对数标度上是两种加权方案的中间方案;家庭权重是两种方案的权重的几何平均值。袭缘关系皮iF。使用标有符号的(+表示病人中过量,-表示缺少)用于在病人和对照中计算等位基因计数的标准似然率统计结果的平方根来测试等位基因与前列腺癌的相关性,其中,如果受试者是不具有亲属关系的,在原假设下将有接近标准的正态分布。由于某些冰岛病人是有亲属关系的,它们的基因型不是独立的,所描述的统计数据具有大于1的标准偏差,忽略它将导致产生不保守的p-值。使用以前描述的方法(Grant,S.F.等,脂.G匿,.35:320-3(2006年1月15日出版电子版);Stefansson,H.等,WW,Ge"".57:129-37(2005年1月16日出版电子版))进行了调整。10,000组基因型被用来模拟整个708,683个冰岛人的谱系中的标记物DG8S737。对于每个模拟的组来说,通过将模拟的基因型作为研究中的病人和对照的真实基因型进行处理,重新计算了统计结果。根据模拟,在原假设下统计结果的真实标准偏差对于等位基因-8来说是1.018,该值被用于计算冰岛1291个前列腺癌病人和997个对照者的总的群体的P-值。基于同样的模拟,rs1447295的等位基因A的调整因子正如预期那样被发现略低,这是由于与等位基因-8相比,等位基因A出现的频率较高。为了简化,决定在整个过程中使用较高的调整因子1.018。因此对等位基因A报道的结果略微有些保守。对某些病人中具有亲属关系的密歇根非裔美国人组也使用了同样的方法,发现调整因子是1.032。遗传逾统游伊仿。结构程序(Pritchard,J.K.等,Gee"cs/":945-59(2000))被用于估算个体的遗传血统。结构软件在来自一组个体的多基因座基因型和用户定义的值K的基础上推断出K血统群体的等位基因频率,并根据对应于每个个体的每个推断出的K群体分配血统的比率。数据组的分析使用K=3运行,帮助鉴定每个个体中非洲人和欧洲人血统的比例。在非裔美国人病人和对照者之间平均的欧洲人血统的统计学显著的差异根据从10000个随机数据组衍生出的零分布进行评估。为了对来自美国的研究群体的血统进行遗传评估,从在以前描述过的(Pritchard,J.K.等,Ge"e""775:945-59(2000))35个欧裔美国人、88个非裔美国人、34个中国人和29个墨西哥裔美国人的多种族群体中被基因分型的大约2000个微卫星中选择了30个无关联的微卫星标记物。在这2000个微卫星标记物中,被选出的组在欧裔美国人、非裔美国人和亚洲人之间显示出了最显著的区别,同时也具有好的质量和产量D1S2630、D1S2847、D1S466、D1S493、D2S166、D3S1583、D3S4011、D3S4559、D4S2460、D4S3014、D5S1967、DG5S802、D6S1037、D8S1719、D8S1746、D9S1777、D9S1839、D9S2168、D10S1698、D11S1321、D11S4206、D12S1723、D13S152、D14S588、D17S1799、D17S745、D18S464、D19S113、D20S878禾CID22S1172。下面的引物对被用于DG5S802:DG5S802-F:CAAGTTTAGCTGTGATGTACAGGTTT(SEQIDNO:23)禾卩DG5S802-R:TTCCAGAACCAAAGCCAAAT(SEQIDNO:24)。cDA^4jt"^^PCij^遂。商购的cDNA文库被用于筛选AW转录本。被筛选的文库是前列腺Marathon-ReadycDNA文库(ClontechCat.7418-1)、睾丸Marathon-ReadycDNA文库(ClontechCat.7414-1)、骨髓-ReadycDNA文库(ClontechCat.7431-1),以及被构建用于全血和EBV转化的人类类淋巴母细胞的cDNA文库。从类淋巴母细胞株和全血中分别使用来自Qiagen(Cat.75144)的RNeasyRNA分离试剂盒和全血RNeasyRNA分离试剂盒(Cat52304)分离出总RNA。然后使用Agilent2001生物分析仪对RNA进行分析和定量。使用随机六聚物方法从RevertAidTMH负链第一链cDNA合成试剂盒(FermentasCat.K1631)制备了cDNA文库。在10体积中进行了PCR反应,终浓度为3.5tiM正向和反向引物、2mMdNTP、lxAdvantage2PCR缓冲液和0.5ulcDNA文库。PCR筛选使用Advantage2PCR酶RT-PCR系统(Clontech),按照制造商的说明书进行。使用的PCR引物对(OperonBiotechnologies)显示在表8中。<table>tableseeoriginaldocumentpage106</column></row><table>iMC^。AW转录本的5'陽和3'-RACE使用Marathon-ReadycDNA文库(Clontech)按照制造商的说明书进行。使用的引物(OperonBiotechnologies)显示在表9中。表9:用于RACE的引物<table>tableseeoriginaldocumentpage107</column></row><table>通过RACE鉴定的AW转录本的新剪接变异体通过在相应的cDNA文库上使用RT-PCR证实。PCR产物都被克隆并证实序列,以证实最初的RACE结果。潘應樣。下列的前列腺癌细胞株从ATCC获得。DU145,是从脑转移病变产生的前列腺癌细胞株;LNCaP,是从淋巴结转移病变产生的前列腺癌细胞株;CA-HPV-IO,是从HPV18转染后的腺癌产生的前列腺癌细胞株;PZ-HPV-7和RWPE-1,都是从HPV18转染后的正常前列腺组织产生的。此外,类淋巴母细胞株是从某些冰岛前列腺癌病人的外周血通过EBV转化产生的。这些细胞株被用于Southern印迹分析。A^W/^/tz伊_^分析。商业化的多组织Northern印迹从Clontech获得(HumanMTNBlotIICat.7759-1)。此外,印迹从上面描述的前列腺癌细胞株制作。简而言之,按照制造商的说明使用组合的Trizol(GIBCOBRLCatalog#15596-018)禾卩RNAeasy(QiagenCatalog#74106)纯化步骤从细胞株中分离出总RNA。Poly(A)RNA使用来自Ambion的Poly(A)PuristMAG试剂盒(Cat.1922)进一步纯化。1.5iigpoly(A)RNA在琼脂糖-甲醛凝胶上电泳,转印到HybondN尼龙膜上(Amersham),使用紫外交联进行固定。使用的探针包括1)从RZPDDeutschesRessourcenzentrumfurGenomforschimgGmbH,Germany(http:〃www.rzpd.de/products/genomecube.shtml)获得的AW1838833cDNA克隆(IMAGp998M216650Q);以及2)对应于从RT-PCR实验获得的AW转录本的外显子6-8的cDNA克隆。克隆被测序验证如下CTGGCGCCGTACTAGTGATCCGAGCTCGTAGCA(SEQIDNO:77)。使用Megaprime标记试剂盒(AmershamCat.RPN1607)用[a-32P]dCTP(比活性6000Ci/mmol)对cDNA片段进行放射性标记,未掺入的核苷酸用ProbeQuantG-50微柱(AmershamCat.27-5335-01)从反应中除去。膜在Rapid-hyb缓冲液中(AmershamCat.RPN1635)预杂交至少30分钟,然后与100-300ng标记的cDNA探针杂交。杂交在R叩id-hyb缓冲液中在68°C进行过夜,在使用cDNA探针时加入0.1-0.15ixg/ml剪切过的变性的鲑鱼精子DNA。在加入到预杂交溶液中的滤膜上之前,标记的探针在95。C加热5分钟。杂交后,将膜在2xSSC、0.05%SDS中在室温的低严紧条件下清洗30-40分钟,然后在0.1xSSC、0.1%SDS中在50°C的高严紧条件下清洗两次,每次40分钟。印迹被立即密封,对KodakBioMaxMRX-光胶片(Cat.8715187)曝光。^iV^^So"Aem伊^^分叛。琼脂糖块中的高分子量DNA通过将从前列腺癌病人外周血产生的成淋巴细胞株用Biorad10plugpleximould(Bioradcatalogno.170-3591)包埋到低熔点琼脂糖(Incert,FMCbioproducts)中而制备。琼脂糖中的细胞终浓度总是被调整到2xl07细胞/ml。DNA也是从新鲜冷冻的正常和恶性前列腺组织中分离出来的。对于每个病人来说,DNA是从4到5个20微米的包埋了新鲜冷冻组织样品(大于70%的肿瘤百分含量)的OCT切片中,使用MasterPureDNA纯化试剂盒(EpicentreInc.CatMC85200)分离的。然后使用GenomiPhiDNA扩增试剂盒(GEHealthcare,Cat.25-6600-02)按照制造商的说明扩增DNA,用等量的TE缓冲液稀释。相当于10"gDNA的琼脂糖块和WGA前列腺组织DNA样品用HindIII限制性内切酶按照标准程序(NewEnglandBiolabs)进行消化。消化后,琼脂糖块或WGADNA样品被上样到0.8。/。的琼脂糖凝胶中。电泳后,将凝胶在0.25MHC1中脱嘌呤化30分钟,然后在0.5MNaOH、1.5MNaCl中变性。然后将DNA转移到尼龙滤膜上(HybondN+)。然后将膜用放射性标记的纯化的BAC插入片段RP11367L7(Amershammegaprime)按照上述用于Northern印迹的标准程序进行探测。清洗后,将膜对胶片(KodakMR)在-80°C下曝光l-4天。沐萄#银炉游^,为了鉴定引起前列腺癌风险的遗传变异体,使用被分成323个扩展家庭的871个冰岛前列腺癌病人的群体中存在的1068个微卫星标记物进行了基因组范围的连锁扫描。该扫描在染色体Sq24上产生了建议的连锁信号,在加入增加信息含量的标记物后,它给出了最大的优势对数值2.11(148.25cM处的D8S529)禾B3.15(145.65cM处的D8S557)(图7A)。为了提炼出连锁信号的来源,横跨在染色体8的从125至lj135Mb(NCBIBuild34)的10Mb(18.6cM)区间中的358个微卫星和插入缺失标记物在869个无亲缘关系的前列腺癌病人和596个群体对照中进行基因分型(组1)(图7A和7B)。单个标记物与前列腺癌的相关性根据风险的乘法模型(Falk,CT.禾卩Rubinstein,P.,Z/wm.57&f",227-33(1987))进行计算。最强的关联性在微卫星DG8S737的等位基因-8上观察到,估算的每个拷贝携带的相对风险(RR)为1.79(P=3.0xl(r6)(图7B和表10)。该关联性在包含422个前列腺病人和401个基于群体的对照的第二个冰岛组(组2)中得到重复,估算的等位基因-8携带的相对风险(RR)是1.72(P=0.0018,所有的P-值都是双边的,包括从重复研究中获得的)。在含有1291个前列腺癌病人和997个对照的整个冰岛组(合并组1和组2)中,DG8S737-8等位基因在病人中的频率为13.1%,在对照中的频率为7.8%。在根据组1和组2中的病人之间的亲缘性进行调整后,获得的估计的RR为1.77(P=2.3xl(T8)、群体可归属风险(PAR)为11%(表10)。在HapMapCEU样品中,DG8S737标记物(128.433096Mb)位于染色体8q24.21上横跨92kb的连锁不平衡(LD)区块中(NCBIBuild34的从128.414到128.506Mb)。该LD区块在本文中被称为LD区块A。表10、在冰岛人染色体8q24上的等位基因与前列腺癌的相关性<table>tableseeoriginaldocumentpage111</column></row><table>显示了8q24.21上的标记物DG8S737和rs1447295的等位基因以及相应的病例和对照的数量(N)、在受影响的和对照个体中变异体的等位基因频率、比值比(RR)和双边P-值。3在3次减数分裂内没有亲属关系的个体b由于某些个体的亲缘性而对相关性分析迸行了调整。为了调查关联性信号的程度,对DG8S737周围600kb区域中的另外12个微卫星和63个SNPs进行了基因分型(图1C,表11和12)。在对DG8S737周围600kb区域中的另外的微卫星和SNPs进行定型后,发现SNPSG08S717(rsl447295)的等位基因A显示出最强的关联性(图7C)。其它与DG8S737禾BSG08S717(rsl447295)位于同样的LD区块中的与前列腺癌显著相关的等位基因/标记物显示在表13中,可以被用来检测与前列腺癌相关的风险变异体。这些标记物和等位基因因此可以作为DG8S737的-8等位基因和SG08S717(rsl447295)的A等位基因的代用品,许多含有表13中列出的至少两个标记物的可能的单倍型也是同样。表ll、在Chr8q24上600kb区域中被基因分型的微卫星和插入缺失标记物<table>tableseeoriginaldocumentpage112</column></row><table><table>tableseeoriginaldocumentpage113</column></row><table>表12、在Chr8q24上的600kb区域中被基因分型的SNP标记物<table>tableseeoriginaldocumentpage114</column></row><table><formula>formulaseeoriginaldocumentpage115</formula>显示的是在标记物DGSS737周围的600kb区域中被定型的SNP标记物。*NCBIBuild34<table>tableseeoriginaldocumentpage116</column></row><table><formula>formulaseeoriginaldocumentpage117</formula></column></row><row><column><table>tableseeoriginaldocumentpage119</column></row><table>总的来说,对包含了DG8S737的LD区块中的53个SNPs和6个微卫星进行了基因分型。按照UtahCEPH(CEU)HapMap数据(PhaseII,release19),这些基因座捕获了LD区块中的大部分单倍型多样性。在53个SNPs中,总共有37个与前列腺癌显著相关(P<0.001),其中SNPrsl447295的等位基因A显示出最强的关联性(RR=1.72,P=1.7xl0-9)(表10)。16个SNPs属于与CEUHapMap样品中的rs1447295同样的相当的类别(r2=1),因此显示出可比较的相关性结果。在冰岛人样品中,DG8S737的等位基因-8和rsl447295的等位基因A是基本上相关的(r2=0.5)。在对CEUHapMap样品中的DG8S737标记物迸行定型后,发现相关性降低了(r2=0.3),但是在HapMap(PhaseII)中仍然没有其它的SNP有比它更高的相关性(表13)。换句话说,与DG8S737的等位基因-8最相关的SNPs也是与前列腺癌最相关的SNPs。在两个欲游/i统邀中游重复实验在包含1435个无关联的前列腺癌病人和779个基于群体的对照的瑞典人组中和包含芝加哥458个欧裔美国人病人和247个对照的组中,使用标记物DG8S737和rsl447295对这种关联性进行了重复实验。在两个组中,病人中DG8S737-S等位基因的频率明显高于对照中的频率,瑞典人和欧裔美国人组中的RR分别为1.32(P=0.013)和2.10(P=0.0029)。对于rs1447295等位基因A也获得了相似的结果(表14),表明最初在冰岛人组中鉴定到的变异体可能在大多数欧洲血统的人群中与前列腺癌的增加的风险有关。为了研究DG8S737-8和rsl447295A等位基因合在一起的风险(Gretarsdottir,S.等,嵐Ge威35:131-8(2003)),将染色体分为三组i)带有DG8S737-8等位基因和一种rsl447295等位基因(绝大部分带有等位基因A)的染色体(-8&A/G);ii)带有rsl447295的等位基因A和DG8S737的等位基因-8之外任何等位基因(被称为X)的染色体(X&A);以及iii)既不带有等位基因-8也不带有等位基因A的染色体(X&G)。使用Mantel隱Haenszel模型(Mantel,N.和Haenszel,W"J.淑/.Cfl"cer/""22:719-48(1959))合并来自三个组的数据,(-8&A/G)相对于(X&G)的风险被估算为1.61(P=5.9x10-11)。(X&A)相对于(X&G)的估计的风险较低,为1.27,但仍然是显著的(P=0.0088)。因为DG8S737等位基因-8和rsl447295等位基因A本身都不能完全解释风险情况,因此在该区域内可能存在多功能的变异体,也可能这些等位基因都处于强烈的、但不完整的连锁不平衡。求裔夷腐义资#^/7乾丈游^沐#/7历^廢游置复实邀在包含246个前列腺癌病人和352个对照的非裔美国人组中进行了第三个重复实验研究,以确定上面在具有高的发病率的组中鉴定的变异体是否也与前列腺癌相关。此外,如果是这样的话,可以假定在非裔美国人中由于非洲人血统的较大比例而导致的加大的遗传多样性,将为正确指出未知的风险变异体的位置提供更高的分辨率。这个假设得到了对尼日利亚约鲁巴人(YRI)HapMap样品中横跨92kb的LD区块的区域进行的分析的支持,该分析显示出在该组中,在欧洲谱系群体中高度相关的SNPs之间中存在较大的遗传多样性和较弱的连锁不平衡。具体来说,尽管在CEUHapMap数据(PhaseII)中19个SNPs、包括rsl447295、都位于同样的等价类中(r2=1),在HapMapYRI样品中这些SNPs属于13个不同的等价类(表14)。因此,除了DG8S737之外,非裔美国人组用19个等价SNPs中的17个(包括rs1447295)进行基因分型。在被省略的两个中,其中一个与其它被基因分型的两个SNPs完全相关,而另一个在YRI样品中不具有多态性。YRIHapM叩样品和欧洲血统组的对照之间等位基因频率的差别提出了假阳性或假阴性相关性结果可能是由于欧洲血统在非裔美国人病人和对照中分布的差别所引起的。因此,为了作为血统的对照,对一组30个在基因组中随机分布、并对非洲和欧洲血统的鉴别具有指示性的微卫星进行了基因分型。使用结构软件(Pritchard,J.K.等,am.//"附.67:170-81(2000年5月26日出版电子版))对这些数据进行的分析显示出在病人和对照之间欧洲人血统没有显著的区别。此外,伴随或不伴随血统调整而进行的关联性分析给出了实际上相同的结果(Helgadottir,A.等,為.丄if謂.Ge威76:505-9(2005年1月7日出版电子版);Pritchard,J.K.等,^m.,//wm.57:170-81(2000年5月26日出版电子版))。在非裔美国人前列腺癌病人中DG8S737的等位基因-8的频率是23.4%,在对照中是16.1%,RR-1.60(P=0.0022,由于某些病人之间的亲缘关系而进行了调整)。给出最低P-值的SNP是rsl447295,其中在病人中等位基因A的频率是34.4%,在对照中是31.3%(RR=1.15),但是关联性不明显(P-0.29)。这些结果表明在欧洲人和非洲人血统的人群中,DG8S737等位基因-8本身或者是有功能的变异体,或者与目前尚未了解的风险变异体具有非常紧密的相关性。相反,在非裔美国人中,rs1447295和其它16个SNPs中的任何一个都与前列腺癌没有显著的相关性(表14)。检验H叩M叩YRI数据(PhaseII),可以注意到与DG8S737的等位基因-8具有最强的相关性的三个SNPs(1"2=0.32到0.34),都被包含于在非裔美国人样品中被基因分型的17个SNPs中(表14)。尽管在非洲人和欧洲人血统的人群中RR相同,但在非裔美国人中PAR相对较高(16.8%对5.8-11%),这是由于在前者组中DG8S737等位基因-8的频率较高。这种较高的频率可以用该等位基因在非洲人群体中的频率来解释,例如在YRIHapM叩样品中频率是22.5%。这提出了DG8S737等位基因-8的PAR在非洲人群体中可能甚至更高的可能性。DG8S737标记物是二核苷酸AC的重复序列,等位基因-8是来自该等位基因比用作微卫星基因型对照的CEPH样品1347-02的最小等位基因小8bp这个事实。尽管DG8S737显示出相当大范围的等位基因大小,但系统发育分析表明它具有中等程度的突变率,重复序列的大小与HapMap样品中SNP背景具有强烈的相关性(图8)。描述了136个不同的单倍型之间的谱系关系的中位数拼接网络(Bandelt,H丄,Forster,P.&Rohl,Mo/肠/£vo/76,37-48(1999)是从HapMap项目(NatureJZ/,1299-320(2005))数据库(第19版)和一个微卫星DG8S737获得的46个SNPs的基因型中推断出来的。所有这些基因座都被包含在染色体8上大约30kb的区域中(128,426,310-128,456,027,NCBIbuild34)。显示了用在HapMap项目中的来自60个具有北欧和西欧人血统的犹他州人CEPH(CEU)、60个尼日利亚约鲁巴人(YRI)、45个来自北京的中国人个体和44个来自东京的日本人个体(HCB&JPT)的单倍型。使用EM算法与来自犹他和约鲁巴样品的家庭三人组信息相结合,产生了分阶段的单倍型(其中来自每个群体样品中的30个儿童的基因型被用于帮助推断单倍型的等位基因阶段)。每个因突变而不同的单倍型用实心圆圈代表,其面积反映了在4个群体组中观察到的合并的拷贝数。在推测单倍型存在于一个以上的群体的情况下,扇形区表明了来自每个群体的单倍型拷贝数。圆圈之间的线表示单倍型的等位基因状态之间的差异,长度与差异的数量成正比,在等位基因上有差别的基因座用标记指示。线条代表了按照构成中位数拼接算法的进化简约性原则在单倍型之间存在的最可能的突变途径。单倍型之间的突变差异被显示为与和单倍型相关的进化途径相交叉的短的垂直线。在这种情况下,突变事件被认为是在单个SNPs上的点突变、DG8S737微卫星的逐步突变以及重组事件。当两个或多个突变事件的时间次序不能被分辨出来时,网络中显示出平行四边形。重复序列的大小与SNP单倍型相关的程度反映出微卫星的进化稳定性(突变率)。因此,预期相对稳定的微卫星在同样的或紧密相关的SNP单倍型的背景下将表现出相同的等位基因大小,而在关系更遥远的单倍型之间将具有较大的差别。相反,对于快速突变的微卫星来说则不能期望这样的相关性,其中由于微卫星上的回复突变事件在紧密相关的SNP单倍型上可能发现重复序列大小的显著差别,而在关系遥远的SNP单倍型上可能发现相同的重复序列大小。图S清楚地显示了对于DG8S737来说,紧密相关的SNP单倍型倾向于具有同样的重复序列大小,而关系遥远的SNP单倍型倾向于具有更趋异的重复序列大小。在所有单倍型对之间不同的SNP等位基因的数量和在所有单倍型对之间不同的DG8S737重复序列的数量之间的相关性被估算。根据对其中微卫星等位基因被随机指派给SNP单倍型的10000个数据组的相关性进行的评估,得到的Spearman's非参数性相关性系数P:0.334,经验性P值O.OOOOl。这表明DG8S737微卫星具有中等的突变率,足够产生大量不同的等位基因大小,但是不足以打破重复序列大小与SNP单倍型背景之间的相关性。表14、在冰岛人、瑞典人和美国人染色体8q24上的等位基因与前列腺癌的相关性<table>tableseeoriginaldocumentpage125</column></row><table>显示了8q24.21上的标记物DG8S737和rsl447295的等位基因、相应的病例和对照数(N)、在受影响的和对照个体中变异体的等位基因频率、相对风险(RR)、双边P-值和群体可归因风险(PAR)。a在3次减数分裂之内无亲缘关系的个体。20068002516LX转滔齿被114/1365t多个邀游分析表15显示了在HapMapCEU、冰岛人、HapMap约鲁巴人(YRI)和来自密歇根大学FMHS和PCGP研究的非裔美国人中DG8S737等位基因-8和其它19个与SG08S717/rs1447295属于同一等价类的SNPs的LD特性。在该区块结构中的标记物也与远达200kb以外的标记物(包括在PVT1基因区域中128515000bps附近(rs7845403、rs6470531和rs7829243)的标记物和128720000bps附近(rsl0956383和rs6470572)的标记物)有中度的相关性(—小于0.2)。表15A:在被研究的群体中DG8S737的等位基因-8和属于HapMap咼加索人(CEU)中rsl447295的等位基因A的等价类的其它19个SNPs的LD性质<table>tableseeoriginaldocumentpage127</column></row><table>显示了相对于HapMapCEU样品中的rsl447295的r2为LOO或更大的SNPs。对于HapMap高加索人(n-60)和冰岛人(n=2288)、HapMap尼日利亚的约鲁巴人(YRI)(n-60)和密歇根的非裔美国人(『598)给出了LD性质。Nd:未进行。Np:无多态性。Allfreq=等位基因频率。aBuild34b病例e对照d这些SNPs在HapMapYRI数据中(PhaseII)显示出与DG8S737的等位基因-8最强的相关性。20068002516LX势滞也被116/136s表15B:在被研究的群体中DG8S737的等位基因-8和属于HapMap商加索人(CEU)中rsl447295的等位基因A的等价类的其它19<table>tableseeoriginaldocumentpage128</column></row><table>显示了相对于HapMapCEU样品中的rsl447295的r2为1.00或更大的SNPs。对于HapMap高加索人(11=60)和冰岛人(n=2288)、HapMap尼曰利亚的约鲁巴人(YRI)(!1=60)和密歇根的非裔美国人(『598)给出了LD性质。Nd:未进行。Np:无多态性。Allfreq=等位基因频率。aBuild34b病例e对照a这些SNPs在HapMapYRI数据中(PhaseII)显示出与DG8S737的等位基因-8最强的相关性。20068002516LX转溢齿被117/1365t已经发现用于试验的乘法风险模型足够拟合欧洲和非洲血统的群体的数据。因此,我们在瑞典病例对照样品、包含458个欧裔美国人病人和247个来自美国芝加哥的对照的病例对照样品中,使用标记物DG8S737和SG08S717(rsl447295)重复实验了在冰岛前列腺癌病人和对照中看到的关联性。正如在表16中所显示的那样(XX基因型),对于所有4个被研究的群体来说,DGSS737等位基因-8或rs1447295等位基因A的纯合携带个体比杂合携带者具有更高的RR。因此,带有两个有风险等位基因的个体比仅带有一个有风险等位基因的个体具有更高的发展前列腺癌的风险。表16、在乘法模型下DG8S737-8和rsl447295A的相对风险与杂合(0X)、纯合(XX)和未携带者(00)基因型相对风险的无模型估算值之间的比较。<table>tableseeoriginaldocumentpage129</column></row><table>与虔袭性谅,蘼蘑存更蔬关凝丝游A澄变弄体接下来确定了有风险的变异体是否与高Gleason分值所反映出的前列腺癌的侵袭性形式具有更强的关联性。在所有4个病人-对照组中,在组合Gleason分值为7到10的前列腺癌病人中比在对照中DG8S737等位基因-8的频率明显更高(表17)。Gleason分值为2到6的前列腺癌病人与对照相比也是这样,只是在Gleason分值为7到IO的组中的RR比Gleason分值为2到6的组中的RR高。此外,在所有4个合并的病例-对照组(RR=1.21,P=0.02)和3个合并的欧洲人血统病例-对照组(RR=1.18,P=0.07)中,在具有高分值(7-10)的病人中等位基因-8的频率比低分值(2-6)组中的高。表17、在冰岛人、瑞典人和美国人染色体8q24上的等位基因与高和低Gleason分值的相关性。<table>tableseeoriginaldocumentpage130</column></row><table><table>tableseeoriginaldocumentpage131</column></row><table>显示了8q24.21上标记物DG8S737和rsl447295的等位基因以及相应的病例和对照数(N)、受影响的和对照个体的变异体频率、相对风险(RR)、双边P值和群体可归因风险(PAR)。大约80%的瑞典Gleason分值来自活检材料,其余来自外科手术。0.2730.1611.963.3x10-40.250.3520.3131.190.280.111此外,在所有4个组中(合并,差异比率=1.22,P=0.020),在高Gleason病人(7-10)中等位基因-8的频率比低Gleason病人(2-6)中的高。对510个被诊断患有良性前列腺肥大(BPH)但未患有前列腺癌的冰岛男性进行的分析显示DG8S737的等位基因-8或rsl447295的等位基因A都没有显著的过量(表18),表明这些变异体仅增加恶性前列腺肿瘤、特别是更具侵袭性的形式的风险。表18、冰岛人染色体8q24上的等位基因与良性前列腺肥大(BPH)的相关性<table>tableseeoriginaldocumentpage132</column></row><table>显示了8q24.21上的等位基因以及相应的病例和对照数(N)、受影响的和对照个体的变异体等位基因频率、相对风险(RR)、P值和群体可归因风险(PAR)。良性前列腺肥大(BPH)是在前列腺经尿道切除(TURP)、细针活检或前列腺切除的基础上诊断的。个体在3次减数分裂内无亲缘性。本分析中使用的对照与冰岛前列腺癌组的相关性分析中使用的对照是同样的个体。BPH+PrCa-表示被诊断患有BPH但不患有前列腺癌的个体。包#7,月澄^r#沐游丄",炎游功虔性性處研究因为只有微卫星等位基因在非裔美国人组中显示出明显的相关性,并且含有该基因座的LD区块较小并在非裔美国人中被分解成较小的单位,因此,可能最可能包含功能性变异体的区域可以被縮小到128.414-128.474Mb(NCBIbuild34)的位置范围内。该区域含有一个剪接的EST(AW183883)和三个单独的外显子ESTs(BE144297、CV364590和AF119310)以及几个预测的基因,但是没有已知的基因(Kent,WJ.等,Ge画eto.72:996-1006(2002))。在该区块中没有检测到微RNAs(Griffiths-Jones,S.,施c/e/c^c油L":D109-11(2004))。在不同cDNA文库中进行的表达分析证实了AW183883EST的表达,但是没有其它ESTs的表达(参见上面的力^^7方兹)。从AW183883EST通过cDNA末端的5'和3'快速扩增(RACE)鉴定了4个不同的剪接变异体,通过RT-PCR和Northern印迹分析进行了证实(图10)。这些转录本中的两个——都包含AW183883EST——被表达在睾丸细胞株中,但不表达在脾脏、胸腺、前列腺、卵巢、小肠、结肠、外周血白细胞或前列腺细胞株中(数据未显示)。相反,其它两个含有外显子6-8的转录本的表达仅仅在正常(0.6kb转录本)和恶性的前列腺细胞株(0.6和0.9kb转录本)中才能检测到(数据未显示)。这些转录本的预测的ORFs与已知蛋白没有显示出明显的同源性。在睾丸转录本中微卫星DG8S737和SNPrs1447295位于外显子4和5(或6)之间的内含子中,在前列腺特异性转录本中位于5'端(图10)。可以想到,这些标记物或其它与这些标记物处于连锁不平衡的标记物影响了该区域中一个或多个转录本的剪接形式。已经注意到8q24是在前列腺肿瘤中最经常获得的染色体区域(Baudis,M.禾BCleary,MX.,Ao/"/orma"w〃:1228-9(2001))。该区域中的获得与侵袭性肿瘤、激素不依赖性和不好的预后有关(ElGedaily,A.等,Pm/a/e":184-90(2001))。为了评估带有DG8S737等位基因-8的染色体是否与增加的基因组不稳定性相关,使用来自携带或不携带等位基因-8的前列腺癌病人的种系和肿瘤DNA,对覆盖了92kb的LD区域进行了Southern印迹分析。在14个肿瘤样品(非携带者)中只有一个显示出多态性限制形式,但是在来自携带者和未携带者的种系DNA中一个都没有观察到(数据未显示)。因此,似乎DG8S737等位基因-8种系变异体不可能与LD区块A区域的重排有关。另外,有趣的是DG8S737邻近于众所周知的癌基因c-MYC,距离仅为-270kb(端粒侧)。但是,在位于c-MYC基因中的SNPs与前列腺癌风险或本研究中鉴定到的风险变异体之间没有观察到明显的相关性(数据未显示)。然而,有可能风险变异体的作用是通过诱发基因组不稳定性或通过改变表达的长距离调控来修饰c-MYC的调控。W论总而言之,在3个欧洲人血统的组中,已经证实了前列腺癌风险与DG8S737等位基因-8和rs1447295等位基因A的显著相关性(其中rsl447295的等位基因与来自至少18个其它附近的SNPs的等位基因完全相关)。从这些组获得的合并的结果给出了对DG8S737等位基因-8的估计RR为1.59(P=1.40x10—1Q),对rs1447295的等位基因A的估计的相对风险为1.50(P=1.62x10—11)。假定对于这两个标记物来说群体频率分别为6.6%和10.7%(来自3个组的平均值),对应的PAR分别为7.4。/。禾卩9.9%。前列腺癌和等位基因-8之间的相关性在非裔美国人组中进行了重复实验,获得了接近相同的相对风险(1111=1.60,P=0.0022)。此时,在非裔美国人中,没有证明与该区域中任何HapMapSNPs的相关性。本文描述的变异体是通过从连锁分析开始的位置克隆方法鉴定的。也可以使用基因组范围的关联,使用rs1447295或其LD等价物之一上的常见SNPs。即使为了测试成百上千个常见的SNPs必需进行调整,结果仍然是非常显著的。相反,如果仅根据H叩M叩项目第19版中包含的SNPs,分析表明基因组范围的相关性研究不能在非裔美国人或非洲人组中捕获到该相关性信号。这是因为在非洲血统的群体中没有现有的HapMapSNPs足够与DG8S737等位基因-8相关联。因此,推测或者是等位基因-8本身引起了风险,或是某些变异体与等位基因-8比与任何现有的HapMapSNPs更紧密相关。如果后一种假设是真的,那么在非裔美国人中降低的LD表明未知的变异体位于含有DGSS737的60kb的区域中。同样重要的是等位基因-8在非裔美国人中相对高的群体频率,导致估计的PAR为16.8%。因此,仅是等位基因-8的频率就能够导致在非裔美国人中比在欧裔美国人中前列腺癌的发病例高14%,从而部分解释了前列腺癌在非裔美国人中异常高的发生率。也应该注意到这些被描述的与前列腺癌有关的有风险变异体在其它形式的癌症中(例如乳腺癌、肺癌、黑素瘤)也以较高的频率被看到。表19显示了DG8S737的等位基因-8和SG08S717(rsl447295)的等位基因A增加了侵入性的乳腺癌、肺癌和恶性皮肤性黑素瘤的风险。此外,应该注意到在所有表格中显示的等位基因频率大约等于携带者频率的一半。表19、在冰岛人染色体8q24上的等位基因和单倍型与黑素瘤、乳腺癌和肺癌的相关性。<table>tableseeoriginaldocumentpage135</column></row><table>显示了8q24.21上标记物DG8S737和rsl447295的等位基因以及相应的病例和对照数(N)、受影响的和对照个体的变异体的等位基因频率、相对风险(RR)和单边P值。表20包含了根据NCBI数据库(dbSNP125)在LD区块区间(128.414-128.506)中的所有已知的和描述的SNP标记物。表20、来自dbSNP125(NCBIdbSNPBuild125的图谱)的92Mb的LD区块区间中(128.414-128.506Mb)的所有SNPs。<table>tableseeoriginaldocumentpage135</column></row><table>rs64705178128416993dbSNP-125rs70087868128417319dbSNP-125rs78412288128417467dbSNP-125rsl00940598128418196dbSNP-125rsl07192948128418485dbSNP-125rsl17784178128418666dbSNP-125rsl17862818128420006dbSNP-125rsl00957468128420075dbSNP-125rsl01090688128420108dbSNP-125rs286262028128420942dbSNP-125rs284513378128421776dbSNP-125rs96428788128421857dbSNP-125rsll7814208128421931dbSNP-125rs96432218128422076dbSNP-125rs78363458128422269dbSNP-125rs78364688128422360dbSNP-125rsl05376508128422444dbSNP-125rsll3082688128422866dbSNP-125rsl01078308128423213dbSNP-125rsll2717968128423228dbSNP-125rs78412648128423403dbSNP-125rs78288558128423577dbSNP-125rs96432228128423694dbSNP-125rs96432238128423753dbSNP-.125rsl32739938128423809dbSNP-■125rs70176718128424343dbSNP-.125rsl00999058128424523dbSNP-.125rsl01001798128424672dbSNP-.125rs39997848128425358dbSNP--125rsl32503068128425382dbSNP--125rsl25442208128425504dbSNP-■125<table>tableseeoriginaldocumentpage137</column></row><table>rsl25459298128436814dbSNP-125rsl00893108128437573dbSNP-125rs78191028128437938dbSNP-125rs48717998128439231dbSNP-125rs4871歸8128439304dbSNP-125rs69814248128439685dbSNP-125rs70015138128439754dbSNP-125rs48718018128440503dbSNP-125rs69862858128440524dbSNP-125rs69864698128440699dbSNP-125rs64705188128440770dbSNP-125rs64705198128440812dbSNP-125rs64705208128440922dbSNP-125rs78185568128440988dbSNP-125rsl4472958128441627dbSNP-125rs48718028128442229dbSNP-125rs69930748128442270dbSNP-125rsl01097008128442553dbSNP-125rs92977588128443177dbSNP-125rs698楊l8128443731dbSNP-125rsl06105218128443970dbSNP-125rsl33633098128444111dbSNP-125rs96929648128444780dbSNP-125rs73879358128444971dbSNP-125rs73575478128445291dbSNP-125rsl32593968128445300dbSNP-125rsl326037S8128445339dbSNP-125rsl5970198128445342dbSNP-125rs78260428128445690dbSNP-.125rs78261798128445788dbSNP-.125rsl33648578128445897dbSNP國.125rsl32680498128445908dbSNP-125rsl19913868128447040dbSNP-125rsl09563738128447165dbSNP-125rs7836譜8128448381dbSNP-125rsl69021658128448411dbSNP-125rs78310288128448618dbSNP-125rsl9928338128448933dbSNP-125rs22卯0338128449663dbSNP-125rs284551568128449949dbSNP-125rsll9891368128450373dbSNP-125rs96432248128450700dbSNP-125rs96432258128450980dbSNP陽125rs96432268128451070dbSNP-125rsl17757498128451255dbSNP匿125rsl19943848128451916dbSNP-125rsl4472968128451948dbSNP-125rsl69021688128452197dbSNP-125rs96432278128452685dbSNP-125rsl19953788128453001dbSNP-125rsl69021698128453095dbSNP-125rsl3253127S128453180dbSNP-125rsll9884548128453351dbSNP-125rsll9921948128453353dbSNP-125rs69855048128453365dbSNP-■125rsl32585488128453436dbSNP國■125rsl32588128128453456dbSNP-.125rs48718048128454118dbSNP-.125rsl69021718128454315dbSNP--125rsl26799008128454604dbSNP--125rsl69021728128454631dbSNP--125rs78445618128455093dbSNP--125<table>tableseeoriginaldocumentpage140</column></row><table>rsl5624358128463046dbSNP-125rsl21556728128463613dbSNP-125rsl21561288128463780dbSNP-125rsl5624348128463908dbSNP-125rsl5624338128464039dbSNP-125rsl5624328128464191dbSNP-125rsl5624318128464240dbSNP-125rsl20564738128464511dbSNP-125rsl3746268128464584dbSNP-125rsl3746258128464650dbSNP-125rsl20567S88128464661dbSNP-125rsl13657828128464669dbSNP-125rs45997738128467013dbSNP-125rs40782418128467729dbSNP匿125rs125454878128467881dbSNP-125rs44618698128467959dbSNP-125rs40782408128468152dbSNP-125rsl32698958128468547dbSNP-125rs70138508128468613dbSNP-125rs286097918128469167dbSNP-125rs78130158128469646dbSNP-125rs69813218128469894dbSNP-■125rs48718078128469920dbSNP-125rs589柳68128470115dbSNP-.125rs48718088128470134dbSNP-.125rs78178358128470790dbSNP--125rs44123388128471606dbSNP--125rsl14083928128472364dbSNP-125rsll3931288128472372dbSNP--125rs284751368128472373dbSNP--125rs78274288128472636dbSNP--125rs78320318128473541dbSNP-125rsl01135778128473620dbSNP-125rs42423828128474162dbSNP-125rs42423838128474349dbSNP-125rs43146218128474604dbSNP-125rs42423848128475143dbSNP-125rs9297759S128475760dbSNP-125rs70183868128476546dbSNP-125rs78124298128476762dbSNP-125rs78128948128477068dbSNP-125rs48710268128477366dbSNP-125rs48710278128478096dbSNP-125rsl00994138128478652dbSNP-125rs78148378128478791dbSNP-125rs284296928128479233dbSNP-125rsl00883088128479503dbSNP-125rs92977608128479761dbSNP-125rsl1457275S128479S47dbSNP-125rs70075408128480229dbSNP-125rs78412518128480910dbSNP-125rs78248688128481003dbSNP-125rs70173008128481857dbSNP-125rsl32758308128481950dbSNP-125rs64705258128482127dbSNP-125rsl25478748128482221dbSNP-125rs64705268128482480dbSNP-125rs70043748128482574dbSNP-125rs70053438128483167dbSNP-125rs70101658128483880dbSNP-125rs96931138128484019dbSNP-125rs4S718098128484144dbSNP-125<table>tableseeoriginaldocumentpage143</column></row><table>rs48718108128492949dbSNP-125rsl32640918128493043dbSNP-125rsl19859498128493373dbSNP-125rsl32725438128493517dbSNP-125rsl25476068128493842dbSNP-125rsl25426858128494172dbSNP-125rsll9878118128494732dbSNP-125rs7814251812S494806dbSNP-125rsl12686438128494962dbSNP-125rs81809058128495413dbSNP-125rs96940938128495737dbSNP-125rs78376888128495949dbSNP-125rsl3256658128496050dbSNP-125rs78241188128496937dbSNP匿125rsl05519418128496952dbSNP-125rsl32659988128496973dbSNP陽125rsl32660008128496975dbSNP-125rsl01072638128496987dbSNP-125rsl3268425812S496989dbSNP-125rsl32687128128497079dbSNP-125rsl32663518128497100dbSNP-125rsl25497618128497365dbSNP-125rs48718118128497463dbSNP-.125rs42423868128497682dbSNP-.125rs78258238128498506dbSNP--125rs28489376812849卯33dbSNP--125rs74650748128499382dbSNP曙-125rsl13085708128499734dbSNP--125rsl19885568128500924dbSNP--125rs70071968128501145dbSNP--125rs64705298128501401dbSNP--125<table>tableseeoriginaldocumentpage145</column></row><table>*位置以bp为单位、禾艮据UCSC浏览器NCBIBuild34表21包含了所有被deCODE遗传学项目鉴定和试验的、位于染色体8上的LD区块区间(128.414-128.506)中的微卫星标记物。<table>tableseeoriginaldocumentpage145</column></row><table><table>tableseeoriginaldocumentpage146</column></row><table>表22、由标记物/等位基因rsl2542685等位基因T和rs7814251等位基因C组成的保护性单倍型p-值RR受影响的数量受影响的频率对照的数量对照的频率0,000150,750412800.1949950.242本文中引用的所有相关出版物的内容在此以其全文引为参考。尽管已经参考其优选实施方案对本发明进行了具体的显示和描述,本领域的专业技术人员将会理解,可以在其中进行各种形式上和细节上的改变,而不背离在随后的权利要求书中所包含的本发明的范围。权利要求1.在受试者中诊断对癌症易感性的方法,包括检测与LD区块A相关的标记物或单倍型,其中标记物或单倍型的存在是对癌症易感性的指示。2.权利要求1中的方法,其中的标记物或单倍型是选自表13中的标记物。3.权利要求2中的方法,其中的标记物是rs1447295等位基因A或DG8S737等位基因-8。4.权利要求l中的方法,其中的标记物或有风险的单倍型是含有选自单倍型1和单倍型la的单倍型的有风险的单倍型。5.权利要求1中的方法,其中的标记物或单倍型是含有选自表13中的标记物的一或多种标记物的单倍型。6.权利要求5中的方法,其中的单倍型含有rs1447295等位基因A或DG8S737等位基因-8。7.权利要求l中的方法,其中的癌症选自前列腺癌、乳腺癌、肺癌和黑素瘤。8.权利要求7中的方法,其中的癌症是前列腺癌,标记物或单倍型的相对风险至少为1.5。9.权利要求8中的方法,其中的前列腺癌是侵袭性前列腺癌,被定义为合并的Gleason分值为7(4+3)到10。10.权利要求8中的方法,其中的前列腺癌是侵袭性低的前列腺癌,被定义为合并的Gleason分值为2到7(3+4)。11.权利要求8中的方法,其中标记物或单倍型的存在是更具侵袭性的前列腺癌和/或更坏的预后的指示。12.权利要求7中的方法,其中的癌症是乳腺癌,标记物或单倍型的相对风险至少为1.3。13.权利要求7中的方法,其中的癌症是肺癌,标记物或单倍型的相对风险至少为1.3。14.权利要求7中的方法,其中的癌症是黑素瘤,标记物或单倍型的相对风险至少为1.5。15.权利要求7中的方法,其中的黑素瘤是恶性皮肤性黑素瘤。16.权利要求1中的方法,其中标记物或单倍型的存在是受试者对特定治疗方式的不同反应率的指示。17.权利要求1中的方法,其中标记物或单倍型的存在是在肿瘤或其前体中ChrSq24.21的体细胞重排倾向性的指示。18.权利要求17中的方法,其中的体细胞重排选自扩增、易位、插入和缺失。19.权利要求1中的方法,其中的标记物或单倍型含有一或多种与Chr8q24.21有关的标记物,该标记物与一或多种选自表13中的标记物处于强烈的连锁不平衡,该连锁不平衡被定义为(ID'I〉0.8)和/或r2〉0.2。20.权利要求19中的方法,其中的一或多种标记物包含rs1447295等位基因A或DG8S737等位基因-8。21.诊断对癌症易感性的方法,包括检测与Chr8q24.21有关的标记物或单倍型,其中标记物或单倍型的存在是对癌症易感性的指示。22.权利要求21中的方法,其中的癌症选自前列腺癌、乳腺癌、肺癌和黑素瘤。23.在受试者中预测对侵袭性前列腺癌的增加的风险的方法,包括检测与LD区块A相关的标记物或单倍型,其中标记物或单倍型的存在是对侵袭性前列腺癌增加的风险的指示。24.权利要求23中的方法,其中的标记物或单倍型包含rs1447295等位基因A或DG8S737等位基因-8。25.用于分析来自受试者的样品以检测对癌症易感性的试剂盒,其中的试剂盒含有一种或多种用于检测与LD区块A有关的标记物或单倍型的试剂。26.权利要求25中的试剂盒,其中的癌症选自前列腺癌、乳腺癌、肺癌和黑素瘤。27.权利要求26中的试剂盒,其中的一种或多种试剂包括至少一种连续的核苷酸序列,该序列与含有至少一种选自表13中的标记物的区域完全互补。28.权利要求26中的试剂盒,其中的一种或多种试剂包括至少一种连续的核苷酸序列,该序列与含有rsl447295等位基因A或DG8S737等位基因-8的区域完全互补。29.在受试者中诊断癌症的增加的风险的方法,包括筛选与LD区块A相关的标记物或单倍型,其中的标记物或单倍型在患有癌症的受试者中比在未患有癌症的受试者中以更高的频率出现,其中标记物或单倍型的存在增加受试者患有癌症的风险。30.权利要求29中的方法,其中的癌症选自前列腺癌、乳腺癌、肺癌和黑素瘤。31.在受试者中诊断对癌症易感性的方法,包括i)从受试者获得核酸样品;以及ii)分析核酸样品中是否存在至少一种与LD区块A有关的标记物或单倍型,其中标记物或单倍型的存在是对癌症易感性的指示。32.权利要求31中的方法,其中的标记物或单倍型含有一或多种选自表13中的标记物的等位基因。33.权利要求31中的方法,其中的标记物或单倍型包含DG8S737等位基因-8或rsl447295等位基因A。34.权利要求31中的方法,其中的癌症选自前列腺癌、乳腺癌、肺癌和黑素瘤。35.在受试者中诊断与Chr8q24.21有关的癌症的方法,包括检测与Chr8q24.21有关的标记物或单倍型的存在,其中标记物或单倍型的存在是与Chr8q24.21有关的癌症的指示。36.权利要求35中的方法,其中的标记物或单倍型含有一个或多个选自表13中的标记物。37.权利要求49中的方法,其中的标记物或单倍型包含DG8S737等位基因-8或rsl447295等位基因A。38.权利要求35中的方法,其中与Chr8q24.21有关的癌症选自与Chr8q24.21有关的前列腺癌、与Chr8q24.21有关的乳腺癌、与Chr8q24.21有关的肺癌和与Chr8q24.21有关的黑素瘤。39.在个体中诊断对前列腺癌易感性的方法,包括检测标记物DG8S737,其中在DG8S737中等位基因-8的存在是对前列腺癌易感性的指示。40.权利要求39中的方法,其中的前列腺癌是侵袭性前列腺癌,被定义为合并的Gleason分值为7(4+3)到10。41.权利要求39中的方法,其中的前列腺癌是侵袭性低的前列腺癌,被定义为合并的Gleason分值为2到7(3+4)。42.权利要求39中的方法,其中在DG8S737中等位基因-8的存在是更具侵袭性的前列腺癌和/或更坏的预后的指示。43.权利要求39中的方法,其中在DG8S737中等位基因-8的存在是受试者对特定的治疗方式的不同反应率的指示。44.在个体中诊断对前列腺癌的增加的风险的方法,包括检测标记物DG8S737,其中在DG8S737中等位基因-8的存在是前列腺癌的增加的风险的指示45.在受试者中预测前列腺癌的增加的风险的方法,包括检测标记物DG8S737,其中DG8S737中等位基因-8的存在是侵袭性前列腺癌的增加的风险的指示。46.在受试者中预测侵袭性前列腺癌的增加的风险的方法,包括检测标记物DG8S737,其中DG8S737中等位基因-8的存在是侵袭性前列腺癌的增加的风险的指示。47.在具有包括非洲人血统的血统的人中诊断对前列腺癌易感性的方法,包括检测标记物DG8S737,其中DG8S737中等位基因-8的存在是对前列腺癌易感性的指示。48.在个体中诊断对前列腺癌易感性的方法,包括检测标记物rs1447295,其中在rs1447295中等位基因A的存在是对前列腺癌易感性的指示。49.权利要求48中的方法,其中的前列腺癌是侵袭性前列腺癌,被定义为合并的Gleason分值为7(4+3)到10。50.权利要求48中的方法,其中的前列腺癌是侵袭性低的前列腺癌,被定义为合并的Gleason分值为2到7(3+4)。51.权利要求48中的方法,其中在rs1447295中等位基因A的存在是更具侵袭性的前列腺癌和/或更坏的预后的指示。52.权利要求48中的方法,其中在rs1447295中等位基因A的存在是受试者对特定治疗方式的不同反应率的指示。53.在个体中诊断前列腺癌的增加的风险的方法,包括检测标记物rsl447295,其中rs1447295中等位基因A的存在是前列腺癌的增加的风险的指示。54.在受试者中预测前列腺癌的增加的风险的方法,包括检测标记物rsl447295,其中rs1447295中等位基因A的存在是侵袭性前列腺癌的增加的风险的指示。55.在受试者中预测侵袭性前列腺癌的增加的风险的方法,包括检测标记物rsl447295,其中rs1447295中等位基因A的存在是侵袭性前列腺癌的增加的风险的指示。56.在个体中诊断对前列腺癌的降低的易感性的方法,包括检测表22中显示的单倍型,其中单倍型的存在是对前列腺癌降低的易感性的指示。57.在个体中诊断对前列腺癌的降低的易感性的方法,包括检测表13中显示的相对风险小于1的标记物,其中标记物的存在是对前列腺癌降低的易感性的指示。58.在个体中诊断对前列腺癌的增加的易感性的方法,包括检测表13中显示的相对风险大于1的标记物,其中标记物的存在是对前列腺癌增加的易感性的指示。59.在受试者中诊断对癌症易感性的方法,包括分析从受试者获得的核酸样品中至少一种与LD区块A有关的标记物或单倍型的存在,其中标记物或单倍型的存在是对癌症增加的易感性的指示。60.权利要求59中的方法,其中的标记物或单倍型含有一或多种选自表13中的相对风险大于1的标记物。61.权利要求60中的方法,其中的标记物或单倍型包含DG8S737等位基因-8或rsl447295等位基因A。62.权利要求59-61任何一个中的方法,其中的癌症选自前列腺癌、乳腺癌、肺癌和黑素瘤。63.权利要求62中的方法,其中的癌症是前列腺癌,标记物或单倍型的相对风险至少为1.5。64.权利要求62或63中的方法,其中的前列腺癌是侵袭性前列腺癌,被定义为合并的Gleason分值为7(4+3)到10。65.权利要求62或63中的方法,其中的前列腺癌是侵袭性低的前列腺癌,被定义为合并的Gleason分值为2到7(3+4)。66.权利要求63或64中的方法,其中标记物或单倍型的存在是更具侵袭性的前列腺癌和/或更坏的预后的指示。67.权利要求62中的方法,其中的癌症是乳腺癌,标记物或单倍型的相对风险至少为1.3。68.权利要求62中的方法,其中的癌症是肺癌,标记物或单倍型的相对风险至少为1.3。69.权利要求62中的方法,其中的癌症是黑素瘤,标记物或单倍型的相对风险至少为1.5。70.权利要求62中的方法,其中的黑素瘤是恶性皮肤性黑素瘤。71.权利要求59-70任何一个中的方法,其中标记物或单倍型的存在是受试者对特定治疗方式的不同反应率的指示。72.权利要求59-70任何一个中的方法,其中标记物或单倍型的存在是在肿瘤或其前体中Chr8q24.21的体细胞重排倾向性的指示。73.权利要求72中的方法,其中的体细胞重排选自扩增、易位、插入和缺失。74.权利要求59-73任何一个中的方法,其中的标记物或单倍型含有一或多种与Chr8q24.21有关的标记物,该标记物与一或多种选自表13中的标记物处于强烈的连锁不平衡,该连锁不平衡被定义为(ID'I>0.8)和/或r2〉0.2。75.权利要求74中的方法,其中选自表13中的一或多种标记物包含rs1447295等位基因A或DG8S737等位基因-8。76.权利要求59中的方法,其中至少一种标记物或单倍型的相对风险小于1,并包含rsl2542685等位基因T和rs7814251等位基因C。77.权利要求59中的方法,其中的至少一种标记物或单倍型包含至少一种表13中显示的相对风险小于1的标记物。78.权利要求76-77任何一个中的方法,其中的癌症是前列腺癌。79.权利要求59-79任何一个中的方法,其中的受试者具有非洲黑人血统。80.分析来自受试者的样品以检测对癌症易感性的试剂盒,其中的试剂盒含有一种或多种用于检测与LD区块A相关的标记物或单倍型的试剂。81.权利要求80中的试剂盒,其中的癌症选自前列腺癌、乳腺癌、肺癌和黑素瘤。82.权利要求81中的试剂盒,其中的癌症是前列腺癌。83.权利要求80-82任何一个中的试剂盒,其中的一或多种试剂含有至少一种连续的核苷酸序列,该序列与含有至少一种选自表13中的标记物的区域完全互补。84.权利要求80-83任何一个中的试剂盒,其中的一或多种试剂含有至少一种连续的核苷酸序列,该序列与含有rsl447295等位基因A或DG8S737等位基因-8的区域完全互补。全文摘要已经证实染色体8q24.21上的位点在特定形式的癌症中扮演重要角色。已经发现某些标记物和单体型是对特定癌症易感性的指示。描述了对癌症易感性进行鉴定的诊断应用。文档编号C12Q1/68GK101238223SQ200680025161公开日2008年8月6日申请日期2006年5月18日优先权日2005年5月18日发明者劳非·阿孟达多蒂尔,尤利乌斯·格维兹门松,帕特里克·舒莱姆申请人:解码遗传学私营有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1