用于心律不齐的风险管理的遗传标记物的制作方法

文档序号:439431阅读:488来源:国知局
专利名称:用于心律不齐的风险管理的遗传标记物的制作方法
用于心律不齐的风险管理的遗传标记物
背景技术
心律不齐是一类医学病症,其中心脏的电活动不规律,或与正常 相比更快或更慢。某些心律不齐是危及生命的,可以引起心脏停止或 突然死亡。其它的会引起或倾向于引起其它恶化的症状或疾病,包括
中风。纤颤是一种严重形式的心律不齐,其中由于收縮性细胞的功能 缺乏统一性而使心肌出现不规则的或振颤运动。纤颤可以影响心房(心
房纤颤(AF)或心房扑动(AF1))或心室(心室纤颤(VF))。
心房纤颤(AF)是涉及两个小的、位于上部的心脏腔室(心房) 的异常的心脏节律(心律不齐)。正常心脏中的心跳,在窦房结在心 房中产生的电通过心脏传播、并引起心肌收縮和泵出血液之后开始。 在AF中,窦房结的有规律的电脉冲被混乱的、快速的电脉冲所代替, 导致了不规则的心跳。
心房纤颤是最常见心律不齐。发生心房纤颤的风险随着年龄而增 加——AF在80岁时影响4%的个体。个体可以在AF和正常节律之间 自发轮换(突发性心房纤颤),或者可能持续地以AF作为主要心脏节 律而不返回正常节律(慢性心房纤颤)。心房纤颤通常是无症状的, 但是可能导致心悸、昏厥、胸痛或甚至心力衰竭的症状。当心房纤颤 导致心率太快或太慢时,这些症状特别常见。此外,心房的不稳定运 动导致血流淤积(停滞),增加了从心脏向脑部和其它区域移动的血 液凝块的风险。因此,AF是心房纤颤的最可怕的并发症——中风的重 要风险因素。
心房纤颤的症状可以用减慢心率的药物进行治疗。几种药物以及 心脏电复律可用于将AF转变为正常心脏节律。外科和基于支架的疗法
15也可用于在某些个体中预防心房纤颤。患有AF的人通常被给药血液稀 释剂例如华法林,以保护它们免于中风。
任何具有两次或以上被鉴定的心房纤颤的突然的患者,被说成是 具有复发的心房纤颤。根据发病何时不经过治疗就结束,而将它进一 步分类为突发性的和持久性的。当心房纤颤在7天内自发终止时,最 普遍在24小时内自发终止,它被说成是突发性的。持久性的或慢性的
心房纤颤是发病超过7天的AF。突发性与慢性或已确立的AF的区分 是基于AF的复发史和目前发作的时间长度(Levy S., / C^^/ovwc 8 Suppl, S78-82 (1998))。
孤立性心房纤颤(LAF)被定义为不存在心肺疾病的临床或超声 心动图发现的情况下的心房纤颤。
心房纤颤通常伴有与心率快或栓塞有关的症状。快速的、不规则 的心率可能被感受为心悸、运动不耐,并有时产生呼吸短促的心绞痛 和充血症状或浮肿。有时,心律不齐伴随着中风发作或短暂性缺血性 发作(TIA)而被鉴定。在常规的身体检查或心电图(ECG/EKG)上检 测到心房纤颤是不常见的,因为在某些病例中它可能是无症状的。突 发性心房纤颤是短暂发生的心律不齐,因此难以诊断。突然发作可能 发生在睡眠或运动时,它们的突然发作的本质可能需要长时间的ECG 监测(例如Holter监测器)来进行诊断。
当怀疑心跳不规律时,可以在常用的诊断方法一一心电图上诊断 心房纤颤。特征性的发现包括缺少P波,在其位置中的混乱的电活性, 以及由于脉冲向心室的不规则传导导致的R-R间期的不规律性。如果 怀疑是突发性AF,可以使用Holter监测来记录突然发作(连续进行ECG 记录24小时或以上)。
尽管许多AF病例没有确定的原因,但它可能是各种其它问题的结果(参见下文)。因此,对肾功能和电解质,以及促甲状腺激素和 血液计数进行了例行测定。通常也进行胸部X-射线检査。在伴有胸痛 的急性发作的AF中,可以进行心脏肌钙蛋白或其它损伤心肌的标记物
的检测。通常还进行凝结研究(INR/aPTT),因为可能进行抗凝结药 物治疗。经食道的超声心动图可以有助于鉴定任何心脏内血栓(Fuster V.,等,C7rcw/a"o".; 104, 2118-2150 (2001))。
心房扑动(AF1)的特征为心房中的异常快速心脏节律。出现心房 扑动的患者同样也经历心房纤颤,反之亦然(Waldo, A., /Vogr CWY^owwc/^yeaw, 48:41-56 (2005))。因此,机械上或生物学上,AF 和AF1可能是高度相关的。
AF (和AF1)与几种心脏原因相关,但是在可能发生在正常心脏 中。已知的关联包括高血压、二尖瓣狭窄(例如由风湿性心脏病或 二尖瓣脱垂引起)、二尖瓣回流、心脏外科手术、冠状动脉病、肥厚 型心肌病、过量饮酒("狂饮"或"假期心脏")、甲状腺机能亢进、 迷走神经过度刺激、通常由于过量进食("暴食")、肺病(例如肺 炎、肺癌、肺栓塞、肉状瘤病)、心包炎、极度情感混乱和先天性心 脏病。
心脏的正常电传导系统允许由心脏窦房结(SA结)产生的脉冲传 播到并刺激心肌(心脏的肌肉)。当心肌受到刺激时,它收縮。正是 对心肌的有序刺激使得心脏有效地收縮,从而将血液泵到身体中。在 心房纤颤中,由窦房结产生的提供心脏有节律的收缩的规则的脉冲, 被心房组织的较大区域产生的快速的随机产生的放电所淹没。心房中 有组织的电脉冲产生心房收縮;缺少这样的脉冲,正如在心房纤颤中 那样,导致血流停滞、特别是在心房附属部分中,并容易发生血液凝 结。从心房中中移出凝块将引起栓塞,产生的损伤取决于血液循环将 它带到何处。栓塞到达脑部产生心房纤颤的最可怕的并发症一一中风, 而栓塞也可能驻留在肠系膜循环(为腹部器官供血的循环)或指头中,
17产生器官特异性损伤。
心房纤颤的治疗针对两个主要目标 防止暂时循环不稳定;(ii) 防止中风。实现前者的最常用方法包括心率和节律控制,而抗血凝通
常是后者所需要的方法(Prystowsky E. N., Jm /C^y//o/. ;85, 3D-11D (2000); van Walraven C,等,儿m仏288, 2441-2448 (2002))。心率控
制、即将心率降低到正常水平的常用方法,包括P阻断剂(美托洛尔)、 强心苷(例如地高辛)和钙通道阻断剂(例如维拉帕米)。所有这些 药物通过减缓脉搏从心房的产生以及从心房向心室的传导来发挥作 用。其它常用的药物包括奎尼丁、氟卡尼、普罗帕酮、丙吡胺 (disopyramide)、索他洛尔和胺碘酮。节律控制可以通过心脏电复律、 即通过施加DC电击,或通过心脏化学复律,使用药物例如胺碘酮、普 罗帕酮和氟卡尼来实现。
用于中风的预防性措施包括抗凝血剂。代表性的抗凝血药剂的例 子是达肝素(例如法安明)、达那肝素(例如Orgaran)、依诺肝素(例 如Lovenox)、肝素(各种不同的)、Tinzaparin (例如Innohep)、华 法林(例如Coumadin)。某些患有孤立性心房纤颤的患者有时用阿司 匹林或氯吡格雷进行治疗。有证据表明,阿司匹林和氯吡格雷当一起 使用时是有效的,但组合的效能仍然低于华法林(ConnollyS.等,Lancet.; 367,1903-1912 (2006)) (2)。新的抗凝剂希美加曲(ximelagatran)已经 被显示与华法林具有同等的预防中风的效能,没有与华法林相关的困 难的监测过程,并可能具有较少的不利的出血现象。不幸的是, ximegalatran和其它类似的抗血凝药物(通常被称为凝血酶直接抑制剂) 还没有被广泛批准。
确定谁应该和不应该接受华法林的抗血凝治疗,不是直截了当的。 CHADS2分值是用于确定中风风险(以及因此谁应该进行抗血凝治疗) 的最好的被批准的方法。UKNICE准则代替了使用算法的选择。存在 的问题是如果患者的年中风风险低于2%,那么与使用华法林有关的风险将超过患中风的风险(GageB.F.等,S^oAre 29, 1083-1091 (1998))。
心房纤颤有时可以通过治疗来控制。但是,心房纤颤的自然趋势 是变成慢性病症。慢性AF导致增加的死亡风险。患有心房纤颤的患者 具有明显增加的中风的机会。
心房纤颤常见于老年人。在发达国家,由于老年个体的比例不断 增加,在下一个50年中,患有心房纤颤的患者的数量可能增加(Go A. S.等,J^ma., 285, 2370-2375 (2001)) (3)。在Framingham研究中,在 40岁及以上年龄的男性和女性中,在一生中发生AF的风险是四分之 一。在一生中AF的风险是高的(六分之一)。根据国家医院出院调査
(1996年到2001年)关于包含AF作为主要出院诊断的病例的数据, 发现45%的患者是男性,男性的平均年龄为66.8岁,女性为74.6岁。 入院的种族分类被发现是71.2%的白人,5.6%的黑人,2%的其它种族, 以及20%未明。此外,非洲裔美国人患者的平均年龄比其它种族更年 青。在男性中的发病率范围从年龄为15-44岁的患者的每年每十万人中 20.58人,到85岁及以上年龄的患者的每年每十万人中1203人。从 1996-2001年,以AF作为首要列明的诊断的住院治疗人数,增加了34y。。
中风是常见的严重疾病。在美国,每年有超过600,000人遭受中 风,有超过160,000人死于与中风相关的原因(Sacco, R丄.等,Stroke 28, 1507-17 (1997))。此外,在美国,每年有超过300,000人出现暂时性 缺血性发作,这是一种温和形式的中风。在西方国家,中风是严重丧 失劳动能力的主导原因,以及死亡的第三主导原因(Bonita, R.,i^"c^ 339,342-4 (1992))。超过40岁的人在生命期中中风的风险超过10%。
中风的临床表现型是复杂的,但是可以宽泛地分成缺血性(占 80-卯%)和出血性中风(10-20%) (Caplan, L.R. Caplan 's Stroke: A Clinical Approach,《Caplan 中风临床方法》,1-556 (Butterworth-Heinemann, 2000))。缺血性中风被进一步细分成大血管阻塞性疾病(在本文中称为颈动脉中风),它通常由于颈总动脉和颈 内动脉的动脉粥样硬化引起,以及小血管阻塞性疾病,它被认为是脑 中的小的末端动脉的非动脉粥样硬化狭窄,以及由通常在心房纤颤或 缺血性(动脉粥样硬化)心脏病的背景下从心脏产生的血液凝块造成
的心源性中风(Adams,H. P., Jr.等,Stroke 24, 35-41 (1993))。因此, 看来中风不是一种疾病,而是反映出不同病源性机制的疾病的异源组 (Alberts, MJ. Ge""/c51 o/ Cere6n9wwcw/ar Z)/^cwe《脑血管疾病的遗传 学》,386 (Futura Publishing Company, Inc., New York, 1999); Hassan, A. & Markus, H. S. 5ra/" 123, 1784- 812 (2000))。但是,所有形式的中风 具有共同的风险因子,例如高血压、糖尿病、高血脂和吸烟(Sacco, R丄. 等,S^oA:e 28, 1507-17 (1997); Leys, D.等,7Vewro/. 249, 507-17 (2002))。中风的家族史也是一个独立的风险因子,表明存在可以与环 境因子相互作用的遗传因子(Hassan, A. & Markus, H. S. 5ra/" 123, 1784-812 (2000); Brass, L.M. & Alberts, MJ. BflH/Zeres C7/". 7VeMro/. 4, 221-45 (1995))。
常见形式的中风的遗传决定因素仍然大部分未知的。有特定基因 中的突变可以引起罕见的孟德尔形式的中风的例子,例如CADASIL(伴 皮质下梗塞和白质脑病的常染色体显性遗传性脑动脉病)中的A^&W 基因(Tournier-Lasserve, E.等,A^aA 3, 256-9 (1993); Joutel, A.
等,Mm^e 383, 707-10 (1996))、冰岛型遗传性伴淀粉样病变的脑出血 中的半胱氨酸蛋白酶抑制剂C (Palsdottir, A.等,2, 603-4 (1988))、荷兰型遗传性脑出血中的APP (Levy, E.等,Sc/e"ce 248, 1124-6 (1990))和遗传性海绵状血管瘤患者中的/^/77基因(Gunel, M. 等,iVoc. Ato/. Jem/. 92, 6620-4 (1995); Sahoo, T.等,/fwm. Mo/,
Ge"". 8,2325-33 (1999))。这些罕见形式的中风中没有一种发生在动 脉粥样硬化的背景下,因此,相应的基因不可能在更通常伴随动脉粥 样硬化发生的常见形式的中风中发挥作用。
对于卫生护理系统来说,非常重要的是开发预防中风的策略。一旦中风发生之后,在受中风影响的血管所供应的脑部的大部分区域中 将发生不可逆的细胞死亡。不幸的是,死亡的神经元不能够复活或用 干细胞群体代替。因此,需要一开始就防止中风发生。尽管我们己经 知道了某些增加中风风险的风险因子(上面列出的),但对于确定参 与中风的遗传因子以便更精确地确定中风的风险,仍存在有尚未满足 的医学需求。此外,如果易感性等位基因在普通人群中是常见的,根 据它们的存在预测疾病的特异性低的话,则为了对疾病状态的易感性 进行有意义的预测,还需要其它的位点、例如保护性位点。对用于预 防第一次中风或在以前发生过中风或暂时性缺血性发作的个体中预防 再次中风的治疗性药剂,也存在着极大的需求。
AF是中风的独立的风险因子,使风险增加大约5倍。可归因于
AF的中风风险随年龄而增加。AF对所有中风中的大约15-20%负责。 AF也是中风复发和中风严重性的独立风险因子。最近的报告显示,患 有AF并且没有用抗凝血剂治疗的人,复发中风的风险增加了 2.1倍, 复发严重中风的风险增加了 2.4倍。已报道,患有由AF引起的中风的 人与患有其它原因引起的中风的人相比,卧床不起的可能性是2.23倍。
对于导致对AF和中风的增加的倾向性的易感性因子的理解,存 在着需求。AF的风险变体的鉴定,可用于例如评估哪个个体对于AF 和随后的中风有特别高的风险。此外,可以对患有AF的个体或AF和 /或中风的风险易感性变体的携带者进行预防性治疗。最后,AF和/或 中风的风险变体的鉴定,可以导致药物疗法的新的靶的鉴定,以及新 的治疗性措施的开发。
发明简述
本发明涉及发现了某些遗传标记物显示出与心律不齐、特别是心 房纤颤和心房扑动以及中风是相关联的。该发现可用于本文描述的各 种方法、步骤、装置、介质和试剂盒中,涉及了诊断和/或确定易感性 的方法和步骤、对相关变体进行基因分型的方法、预测对治疗型药剂的反应的方法、预测预后的方法、监测治疗的进展的方法、以及在这 些方法中使用的系统和试剂盒。
本发明的一个方面,涉及了在人类个体中确定对心律不齐或中风 的易感性的方法,方法包括在从个体获得的核酸样品中确定至少一个 多态性标记物的至少一个等位基因的存在或不存在,其中至少一个多 态性标记物选自表5中显示的多态性标记物、以及与其连锁不平衡的 标记物,其中至少一个等位基因的存在或不存在的确定,是个体中对 心律不齐或中风易感性的指示。在一个实施方案中,至少一个多态性
标记物位于LD区块C04中,显示在本文的SEQ ID NO: 50中。在另一 个实施方案中,至少一个多态性标记物选自表9中显示的标记物,以 及与其连锁不平衡的标记物。在一个实施方案中,至少一个标记物选 自标记物rs2220427 (SEQ ID NO: 1)和标记物rsl0033464 (SEQ ID NO:41),以及与其连锁不平衡的标记物。在另一个实施方案中,至少 一个多态性标记物选自表19中显示的标记物。在一个实施方案中,方 法还包括在个体中评估含有至少两个多态性标记物的至少一个单倍型 的步骤。
另一方面,本发明涉及在人类个体中确定对心律不齐或中风的易 感性的方法,包括确定在源自于个体的基因型数据组中是否存在至少 一个多态性标记物的至少一个风险等位基因,其中至少一个多态性标 记物选自表5中显示的标记物,以及与其连锁不平衡的标记物,其中 至少一个风险等位基因的存在的确定,表明了个体中对心律不齐或中 风的增加的易感性。
在一个实施方案中,基因型数据组包含关于标记物身份以及个体 的至少一个多态性标记物的等位基因状态的信息,即关于个体携带的
标记物的两个等位基因的身份的信息和/或关于个体是否是至少一个多 态性标记物的特定风险等位基因的携带者的信息。基因型数据组可以 包含关于一个或多个标记物、包括两个或两个以上标记物、三个或三个以上标记物、五个或五个以上标记物、 一百个或以上标记物等的等 位基因信息。在某些实施方案中,基因型数据组包含了来自个体的全 基因组评估的含有成百上千个标记物、或甚至一百万个或以上标记物 的基因型信息。
另一方面,本发明涉及了一种方法,包括对来自人类个体的核酸
进行分析,以确定与具有SEQIDNO:50中显示的序列的基因组序列相 关联的至少一个多态性标记物的至少一个等位基因或单倍型的存在或 不存在的步骤;以及根据至少一个标记物或单倍型的存在或不存在, 来确定个体中心律不齐或中风的遗传指标的状态的步骤。因此,个体 的基因型和/或单倍型状态被用作个体中心律不齐、包括心房纤颤和心 房扑动以及中风的指标。
本发明还涉及了在人类个体中评估对心律不齐或中风的易感性的 方法,包括在来自个体的核酸中筛选SEQ ID NO: 50中与心律不齐或中 风在人类群体中的增加的发病率相关的至少一个多态性标记物或单倍 型;其中核酸中至少一个多态性的风险标记物等位基因或风险单倍型 的存在的确定,将个体鉴定为对心律不齐和/或中风具有升高的易感性, 其中核酸中至少一个风险标记物等位基因或风险单倍型的不存在,将 个体鉴定为不具有升高的易感性。
在一个实施方案中,本发明的过程或方法需要含有SEQ ID NO: 50 中显示的LD区块C04的连续的核酸片段或其互补序列的至少一个多 态性标记物或单倍型,其中片段的大小小于500个核苷酸,并与LD区 块C04的互补区段特异性杂交。在一个实施方案中,片段的大小大于 15个核苷酸而小于400个核苷酸,其中片段与SEQ ID NO:50中显示的 LD区块C04的互补区段特异性杂交。
在可选的实施方案中,多态性标记物或单倍型赋予的易感性是降 低的易感性,即本发明的标记物和单倍型赋予了个体发生心律不齐、包括心房纤颤和心房扑动以及中风的降低的风险。在一个这样的实施
方案中,降低的易感性的特征为比值比(OR)或相对风险(RR)小于 0.8。在另一个实施方案中,降低的易感性的特征为比值比(OR)小于 0.7。在另一个实施方案中,降低的易感性的特征为OR或RR小于0.6。 在另一个实施方案中,降低的易感性的特征为OR或RR小于0.5。其 它的实施方案涉及其它的OR或RR值,包括值为0.9、 0.85、 0.75、 0.65、 0.55等。
本发明的另一方面涉及用于在人类个体中评估对与心律不齐和/ 或中风有关的症状的易感性的标记物的鉴定方法,方法包括鉴定SEQ ID NO: 50中的至少一个多态性标记物、或与SEQ ID NO: 50中的至少 一个标记物连锁不平衡的至少一个多态性标记物,确定被诊断患有心 律不齐和/或中风的个体的样品的基因型状态和对照个体的样品的基因 型状态,其中在被诊断患有心律不齐和/或中风的个体中至少一个多态 性的至少一个等位基因的频率,与对照样品中至少一个等位基因的频 率相比的显著差异,表明了至少一个多态性可用于评估对心律不齐和/ 或中风的易感性。在一个实施方案中,在被诊断患有心律不齐和/或中 风的个体中至少一个多态性的至少一个等位基因的频率,与对照样品 中至少一个等位基因的频率相比的增加,表明了至少一个多态性可用
于评估对心律不齐的增加的易感性。在另一个实施方案中,在被诊断 患有心律不齐和/或中风的个体中至少一个多态性的至少一个等位基因 的频率,与对照样品中至少一个等位基因的频率相比的降低,表明了 至少一个多态性可用于评估对心律不齐和/或中风的降低的易感性、或 保护性。在优选实施方案中,频率的显著差异是通过统计学测量值来 表征的。在一个实施方案中,统计学测量值是P-值。在具体的实施方 案中,显著的P-值是小于0.05、小于O.Ol、小于0.001、小于0.0001、 小于0.00001、小于0.000001、小于0.0000001、或小于0.00000001。 在其它实施方案中,显著的差异由具有特定置信区间(CE)值的比值 比(OR)或相对风险(RR)来表征。另一方面,本发明涉及对从人类个体获得的核酸样品进行基因分 型的方法,包括确定样品中预测心律不齐和/或中风的增加的风险至少 一个多态性标记物的至少一个等位基因的存在或不存在,其中至少一 个标记物选自表5中显示的标记物,以及与其连锁不平衡的标记物, 其中至少一个多态性标记物的至少一个等位基因的存在或不存在的确 定,可以预测个体中心律不齐和/或中风的增加的风险。在一个实施方 案中,基因分型使用选自等位基因特异性探针杂交、等位基因特异性 引物延伸、等位基因特异性扩增、核酸测序、5'-外切核酸酶消化、分 子信标分析、寡核苷酸连接分析、大小分析以及单链构象分析的方法 来进行。在优选的实施方案中,方法包括等位基因特异性探针杂交。 优选情况下,基因分型的方法包括使用位于至少一个多态性标记物两 侧的核苷酸引物对,通过聚合酶链反应(PCR)扩增含有至少一个多态 性标记物的核酸的区段。在基因分型的优选方法中,进行了下面的步 骤
1. 将核酸的拷贝与检测寡核苷酸探针和增强子寡核苷酸探针在 允许寡核苷酸探针与核酸特异性杂交的条件下相接触;其中
a) 检测寡核苷酸探针长度为5-100个核苷酸,并与含有至少一个多 态性位点、其核苷酸序列在SEQIDNO:50中给出的核酸的第一个区段 特异性杂交;
b) 检测寡核苷酸探针在其3'末端含有可检测标记,在其5'末端含 有淬灭基团;
c) 增强子寡核苷酸长度为5-100个核苷酸,并与相对于寡核苷酸探 针5'方向的核苷酸序列的第二个区段互补,以便当两个寡核苷酸都与 核酸杂交时,增强子寡核苷酸位于检测寡核苷酸探针的3'方向;以及
d) 在第一个区段和第二个区段之间存在单个碱基缺口,使得当寡 核苷酸探针和增强子寡核苷酸探针都与核酸杂交时,在寡核苷酸之间 存在单个碱基缺口-,
2. 使用当检测探针与核酸杂交时将从检测探针的3'末端裂解可 检测标记以释放游离的可检测标记的内切核酸酶来处理核酸;以及
测量游离的可检测标记,其中游离的可检测标记的存在表明检测
25探针与核酸的第一个区段特异性杂交,并表明多态性位点的序列与检 测探针互补。
本发明的另一方面涉及在人类个体中确定对心律不齐或中风的易 感性的方法,方法包括在从个体获得的核酸样品中确定至少一个多态 性标记物的至少一个等位基因的身份,其中至少一个标记物选自与 PITX2基因相关联的标记物,其中至少一个等位基因的存在表明了个 体中对心律不齐或中风的易感性。
本发明的某些实施方案涉及了另一个对心房纤颤、心房扑动或中 风的至少一个其它生物标记物进行评估的步骤,其中从标记物获得的 遗传信息的合并提供了对心房纤颤、心房扑动或中风的风险评估。在 某些这样的实施方案中,生物标记物是遗传标记物或单倍型,即显示 出或被设想与心房纤颤、心房扑动或中风的增加的或降低的风险相关 的遗传风险因子。在其它实施方案中,生物标记物是蛋白生物标记物。 在某些实施方案中,蛋白生物标记物选自纤维蛋白D-二聚体、凝血酶 原活化片段1.2 (F1.2)、凝血酶-抗凝血酶III复合物(TAT)、纤维 蛋白肽A (FPA)、脂蛋白相关的磷脂酶A2 (Ip-PLA2) 、 (3-血小板球 蛋白、血小板因子4、 P-选择素、von Willebrand因子、利尿钠肽前体 (BNP)、基质金属蛋白酶-9 (MMP-9) 、 PARK7、 二磷酸核苷激酶 (NDKA) 、 tau、神经元特异性烯醇化酶、B型神经营养性生长因子、 星形神经胶质蛋白S-100b、神经胶质纤丝酸性蛋白、C-反应性蛋白、 血清淀粉样肽A、基质金属蛋白酶-9、血管和细胞内细胞粘附分子、肿 瘤坏死因子cc和白介素,包括白介素-1、 -6和-8。在一个实施方案中, 至少一个生物标记物包括祖细胞。在特定实施方案中,测定了一个以 上的生物标记物。在优选实施方案中,生物标记物从个体的血浆中测 量。其它的实施方案还涉及了将非遗传信息进行合并,在个体中进行 心房纤颤、心房扑动或中风的风险评估、诊断或预后。非遗传信息可 以包括年龄、发病时的年龄、性别、种族、以前的疾病诊断例如心律 不齐(例如心房纤颤)和中风的诊断、个体的医学史、疾病的家族史、
26生物化学测量和临床测量(例如血压、血清脂含量)。通过本技术领 域的专业人员已知的方法,这种来自各种不同的遗传标记物、或遗传 标记物加上非遗传标记物的合并的信息的分析是可能的。在一个实施 方案中,通过逻辑回归进行了分析以计算总风险。
本发明还涉及了在人类个体中诊断对中风的增加的易感性的方 法,包括下列步骤(a)确定个体是否经历过与心房纤颤、心房扑动或 短暂性缺血性发作有关的症状;(b)确定来自个体的核酸样品是否含有 选自表5中显示的标记物以及与其连锁不平衡的标记物中的至少一个 多态性标记物的风险等位基因的至少一个拷贝;其中与心房纤颤、心 房扑动和/或短暂性缺血性发作有关的症状的存在,以及风险等位基因 的至少一个拷贝的存在,表明了中风的增加的易感性。
另一方面,本发明涉及评估个体对预防和/或缓解与心律不齐和/ 或中风相关的症状的治疗药剂的反应的可能性的方法,包括在从个 体获得的核酸样品中确定至少一个多态性标记物的至少一个等位基因 的存在或不存在,其中至少一个多态性标记物选自表9中显示的标记 物,以及与其连锁不平衡的标记物,其中至少一个标记物的至少一个 等位基因的存在的确定,表明了对心律不齐和/或中风治疗药剂发生阳 性反应的可能性。
在一个实施方案中,治疗药剂是抗凝血剂、抗心律失常药剂、心 率控制药剂、心脏复律药剂或心脏节律控制药剂。在另一个实施方案 中,治疗药剂选自华法林、肝素、低分子量肝素、因子Xa抑制剂和凝 血酶抑制剂、钠通道阻断剂、(3阻断剂、钾通道阻断剂和钙通道阻断剂。
在另一个实施方案中,治疗药剂选自华法林、ximelagatran、肝素、 依诺肝素、达肝素、亭扎肝素、阿地肝素、那屈肝素、瑞维肝素、磺 达肝素、艾卓肝素、来匹卢定、比伐卢定、阿加曲班、达那类肝素、 丙吡胺、莫雷西嗪、普鲁卡因胺、奎尼丁、利多卡因、美西律、妥卡胺、苯妥英、恩卡尼、氟卡胺、普罗帕酮、阿马林、西苯唑啉、地他 义铵、艾司洛尔、普萘洛尔、美托洛尔、烯丙洛尔、阿替洛尔、卡维
地洛、比索洛尔、醋丁洛尔、纳多洛尔、吲哚洛尔、拉贝洛尔、oxprenotol、
喷布洛尔、噻吗洛尔、倍他洛尔、卡替洛尔、索他洛尔、左旋布诺洛 尔、胺碘酮、阿齐利特、溴苄铵、多非利特、替地沙米、伊布利特、
司美利特、N-乙酰普鲁卡因胺、盐酸尼非卡兰、维纳卡兰(vernakalant)、 氨巴利特、维拉帕米、米贝拉地尔、地尔硫卓、地高辛、腺苷酸、伊 布利特、胺碘酮、普鲁卡因胺、丙胺苯丙酮和氟卡胺。
本发明的另一方面涉及对被诊断有心律不齐和/或中风的个体的 预后进行预测的方法,方法包括在从个体获得的核酸样品中确定至少 一个多态性标记物的至少一个等位基因的存在或不存在,其中至少一 个多态性标记物选自表9中显示的标记物,以及与其连锁不平衡的标 记物,其中至少一个等位基因的存在的确定,表明了个体中心律不齐 和/或中风的更糟的预后。
监测经历了心律不齐和/或中风治疗的个体的治疗进展的方法也 在本发明的范围之内,该方法包括在从个体获得的核酸样品中确定至 少一个多态性标记物的至少一个等位基因的存在或不存在,其中至少 一个多态性标记物选自表9中显示的标记物,以及与其连锁不平衡的 标记物,其中至少一个等位基因的存在的确定,表明了个体的治疗结 果。
在本发明的具体实施方案中,例如在本发明的各种不同方法、应 用、步骤、装置和试剂盒中,心律不齐的表现型的进一步特征为心房 纤颤或心房扑动。本发明人已经确定,本文描述的AF风险变体所赋予 的风险,对于发病年龄早的个体来说比发病年龄晚的个体更大。因此, 在一个实施方案中,心房纤颤或心房扑动的进一步特征为在个体中的 发病年龄小于80岁。在另一个实施方案中,心房纤颤或心房扑动的进 一步特征为在个体中的发病年龄小于70岁。在另一个实施方案中,心房纤颤或心房扑动的进一步特征为在个体中的发病年龄小于60岁。在 本发明的可选实施方案中,其它的年龄截止值也是可能的,并也被考
虑到了,包括但不限于年龄截止值小于75岁、小于65岁、小于55岁。 此外,在发病或诊断时的年龄大于55、 60、 65、 70、 75或80岁也被 考虑到了,并包含在本发明的范围内,因此症状的诊断或疾病发作时 的年龄范围包括但不限于50-80岁、55-75岁、60-80岁、65-75岁,等等。
在本发明的某些实施方案中,中风被进一步表征为缺血性中风。 在其他实施方案中,中风表现型的特征可以是一种或多种缺血性中风 亚表型大动脉粥样硬化(LAA)、心源性卒中(CES)和小血管疾病 (SVD)。
在本发明的具体实施方案中,连锁不平衡(LD)由特定的定量截 止值确定。正如在本文中详细描述的,连锁不平衡可以由测量值例如 一和ID'I来定义。因此,本发明的某些实施方案涉及由特定的^和/或ID'l 值所指明的某个范围内的测量值所定义的连锁不平衡的标记物。在一 个这样的实施方案中,LD的特征为 一的数值大于0.1。在另一个实施 方案中,LD的特征为—的数值大于0.1。在另一个实施方案中,LD的 特征为 一的数值大于0.5。在另一个实施方案中,LD的特征为一的数 值大于0.8。 ^的其它截止值也被考虑到了,正如在本文中更详细描述 的。在某些实施方案中,LD用 一和/或ID'l的某些截止值来表征。在一 个这样的实施方案中,LD的特征为一和/或ID'I分别大于0.2和0.8。这 些或其它LD的度量值的其它组合和排列对于实施本发明来说也是可 能的,并且也被考虑到了,并包含在本发明的范围内。
在某些实施方案中,本发明的过程、应用或方法还包括给被确定 具有发生心律不齐或中风的增加的风险的个体,施用含有至少一种有 效治疗或预防心律不齐或中风、或预防与心律不齐或中风有关的症状 的治疗性药剂的组合物。因此,本发明可用于确定个体是否适合于特定的治疗模式。
在本文描述的各种不同方法和过程中使用的试剂盒也包含在本发 明的范围内。因此, 一种情况下,本发明涉及在人类个体中评估对心 律不齐和/或中风的易感性的试剂盒,试剂盒包含用于在个体的基因组 中选择性检测至少一个多态性标记物的至少一个等位基因的试剂,其
中多态性标记物选自其序列显示在SEQ ID NO:50中的区段中的多态性 标记物,以及与其连锁不平衡的标记物,其中至少一个等位基因的存 在表明了对心律不齐和/或中风的易感性。
在一个实施方案中,至少一个多态性标记物选自表5中显示的标 记物。在另一个实施方案中,至少一个多态性标记物选自表9中显示 的标记物,以及与其连锁不平衡的标记物。在另一个实施方案中,至 少一个多态性标记物选自标记物rs2220427 ( SEQ ID NO: 1)和 rsl0033464 (SEQIDNO:41),以及与其连锁不平衡的标记物。在一个 优选实施方案中,至少一个多态性标记物选自表19中显示的标记物。 在另一个优选实施方案中,至少一个多态性标记物选自D4S406 (SEQ ID NO:45) 、 rs263術3 (SEQ ID NO:33 ) 、 rs2200733 (SEQ ID NO:28)、 rs2220427 (SEQIDNO: 1 ) 、 rsl0033464( SEQ ID NO:41 )和rsl3143308 (SEQIDNO:51)。在一个实施方案中,试剂含有至少一个与个体的 基因组的含有至少一个多态性标记物的区段杂交的连续的寡核苷酸、 缓冲液和可检测标记。
在另一个实施方案中,试剂含有至少一对与从对象获得的基因组 核酸区段的反向链杂交的寡核苷酸,其中每个寡核苷酸引物对被设计 成能选择性扩增个体的基因组中包含一个多态性标记物的片段,其中 片段的大小为至少30个碱基对。在优选实施方案中,至少一个寡核苷 酸与个体的基因组完全互补。在一个实施方案中,寡核苷酸的长度为 大约18到大约50个核苷酸。在另一个实施方案中,寡核苷酸的长度 为20-30个核苷酸。在一个优选实施方案中,试剂盒含有a. 长度为5-100个核苷酸的检测寡核苷酸探针;
b. 长度为5-100个核苷酸的增强子寡核苷酸探针;以及 C.内切核酸酶;
其中检测寡核苷酸探针与其核苷酸序列在SEQ ID NO: 2中给出核 酸的含有至少一个多态性位点的第一个区段特异性杂交;其中检测寡 核苷酸探针在其3'末端含有可检测标记,在其5'末端含有淬灭基团; 其中增强子寡核苷酸长度为5-100个核苷酸,并与相对于寡核苷酸探针 5'方向的核苷酸序列的第二个区段互补,以便当两个寡核苷酸都与核酸 杂交时,增强子寡核苷酸位于检测寡核苷酸探针的3'方向;其中在第 一个区段和第二个区段之间存在单个碱基缺口,使得当寡核苷酸探针 和增强子寡核苷酸探针都与核酸杂交时,在寡核苷酸之间存在单个碱 基缺口;并且其中当检测探针与核酸杂交时,使用内切核酸酶处理核 酸将从检测探针的3'末端裂解可检测标记,以释放游离的可检测标记。
本文描述的用于预测心律不齐(例如AF和心房扑动)和中风的 风险的多态性标记物可用作诊断标记物。因此, 一种情况下,本发明 涉及寡核苷酸探针在制造用于在人类个体中诊断和/或评估心律不齐和 /或中风的易感性的诊断试剂中的应用,其中探针与其核苷酸序列在 SEQIDNO:50中给出核酸的含有至少一个多态性位点的区段杂交,其 中片段的长度为15-500个核苷酸。
在一个这样的实施方案中,多态性位点选自表5中显示的多态性 标记物,以及与其连锁不平衡的多态性。在另一个实施方案中,至少 一个多态性标记物选自D4S406 (SEQIDNO:45) 、 rs2634073 (SEQ ID NO:33) 、 rs2200733 (SEQIDNO:28) 、 rs2220427 (SEQIDNO: 1)、 rsl0033464 (SEQIDNO:41)和rsl3143308 (SEQIDNO:51)。
用于储存关于本文描述的疾病相关的标记物的信息的计算机可读 介质,也在本发明的范围内。在一个这样的情况下,本发明涉及计算 机可读介质,其上储存有至少一个多态性标记物的识别符;该至少一个多态性标记物的至少一个等位基因在多个被诊断患有心房纤颤、心 房扑动和/或中风的个体中的频率的指示符;以及该至少一个多态性标 记物的至少一个等位基因在多个参比个体中的频率的指示符;其中至
少一个多态性标记物选自表5中显示的多态性标记物,以及与其连锁
不平衡的多态性。在优选实施方案中,至少一个多态性标记物选自
D4S406 (SEQIDNO:45) 、 rs2634073 (SEQIDNO:33) 、 rs2200733 (SEQIDNO:28) 、 rs2220427 (SEQIDNO: 1) 、 rsl0033464 (SEQ ID NO:41)和rsl3143308 (SEQIDNO:51)。
本发明还涉及了用于在人类个体中测定心律不齐和/或中风的遗
传指示符的装置,包含计算机可读存储器以及储存在计算机可读
存储器中的例行程序;其中例行程序适用于在处理器上执行,以分析
至少一个人类个体的至少一个多态性标记物的基因型和/或单倍型数
据,其中该至少一个多态性标记物选自表5中显示的标记物,以及与
其连锁不平衡的标记物,并根据标记物或单倍型数据产生输出,其中
输出包括作为人类个体的心律不齐和/或中风的遗传指示符的至少一个
标记物或单倍型的风险测量。在优选实施方案中,例行程序还包含测
定多个被诊断患有心律不齐和/或中风的个体中至少一个多态性标记物 的至少一个等位基因或至少一个单倍型的频率的指示符,以及多个参
比个体中至少一个多态性标记物的至少一个等位基因或至少一个单倍 型的频率的指示符,并在其基础上计算至少一个等位基因和/或单倍型 的风险测量值;其中个体的风险测量值的计算,是基于个体的至少一 个标记物和/或单倍型状态,与多个被诊断患有心房纤颤、心房扑动和/ 或中风的个体的至少一个标记物和/或单倍型信息的计算的风险的比 较。在某些实施方案中,风险测量值被表示为比值比(OR)或相对风 险(RR),正如在本文中更详细描述的。
本文描述的在本发明中发现的用于预测心律不齐和中风的多态性 标记物、以及与其连锁不平衡的标记物,都可用于实施本发明的各种 不同情况。因此,尽管本发明人使用了特定的多态性标记物来检测4
32号染色体上的特定区域与心律不齐(例如心房纤颤和心房扑动)和中 风的关联性,但评估与那些标记物强烈连锁不平衡的标记物也是同样 有用的。因此,在本发明的方法、应用、试剂盒、步骤、装置和介质 的一个实施方案中,用于本发明的方法或步骤的至少一个多态性标记
物或单倍型,包含了在表5 (例如表5A和5B)中显示的至少一个标记
物,以及与其连锁不平衡的标记物。在另一个实施方案中,至少一个
多态性标记物或单倍型包括表9中显示的至少一个标记物,以及与其
连锁不平衡的标记物。在一个实施方案中,至少一个多态性标记物或
单倍型包含表5中显示的至少一个标记物。在另一个实施方案中,至 少一个多态性标记物或单倍型包含表9中显示的至少一个标记物。在 另一个实施方案中,至少一个多态性标记物选自表4中显示的标记物。 在一个实施方案中,至少一个标记物选自标记物rs2220427 (SEQ ID NO:l)和标记物rsl0033464 (SEQIDNO:41),以及与其连锁不平衡 的标记物。在另一个实施方案中,至少一个多态性标记物选自表19中 显示的标记物。
在一个实施方案中,至少一个标记物或单倍型,包含至少一个标 记物D4S406 (SEQ ID IMO:45) 、 rs2723296 (SEQ ID NO:35)、 rsl6997168 (SEQ IDNO:36) 、 rs2723316 (SEQ ID NO:37) 、 rs6419178
(SEQIDNO:38) 、 rsl448817 (SEQIDNO:39) 、 rs263術3 (SEQID NO:33) 、 rs2200733 (SEQIDNO:28) 、 rs2220427 (SEQIDNO:l)、 rsl3105878(SEQ ID NO: 40) 、 rsl0033464(SEQ ID NO:41) 、 rsl3141190
(SEQIDNO:42) 、 rs3853444 (SEQIDNO:43)和rs4576077 (SEQID NO:44)。在另一个实施方案中,至少一个标记物或单倍型包含至少一 个标记物D4S406 (SEQIDNO:45) 、 rs2634073 (SEQIDNO:33)、 rs2200733 (SEQIDNO:28) 、 rs2220427 (SEQIDNO: 1) 、 rsl0033464
(SEQIDNO:41)和rsl3143308 (SEQIDNO:51)。在另一个实施方 案中,至少一个标记物选自rsl0033464、 rs2200733、 rsl3143308和 rs2220427,以及与其连锁不平衡的标记物。在另一个实施方案中,标记物D4S406的等位基因-2、 -4和/或-8、 标记物rs2723296的等位基因G、标记物rsl6997168的等位基因T、标 记物rs2723316的等位基因T、标记物rs6419178的等位基因A、标记 物rsl 1448817的等位基因G、标记物rs2634073的等位基因A、标记物 rs2200733的等位基因T、标记物rs2220427的等位基因T、标记物 rsl3105878的等位基因C、标记物rsl0033464的等位基因T、标记物 rsl3141190的等位基因A、标记物rs3853444的等位基因A、和/或标记 物rs4576077的等位基因T的存在,表明了个体中心律不齐或中风的增 加的易感性。
在本发明的特定的实施方案中,风险变体(即多态性标记物(例 如SNP)的特定等位基因或特定单倍型)所赋予的易感性是增加的易 感性,即本发明的标记物和单倍型赋予了个体发生心律不齐、包括心 房纤颤和心房扑动、以及中风的增加的风险。易感性典型情况下通过 度量比值比(OR)、或可选地通过相对风险(RR)来表征。在一个实 施方案中,增加的易感性的特征为比值比(OR)为至少1.3。在另一个 实施方案中,增加的易感性的特征为比值比(OR)为至少1.4。在另一 个实施方案中,增加的易感性的特征为比值比(OR)为至少1.5。在另 一个实施方案中,增加的易感性的特征为比值比(OR)或相对风险(RR) 为至少1.6。在另一个实施方案中,增加的易感性的特征为比值比(OR) 或相对风险(RR)为至少1.8。其它的实施方案涉及了其它的OR值或 相当的RR值,包括值1.25、 1.35、 1.45、 1.55等。
本发明的某些实施方案涉及了特定的种族或血统。在一个这样的 实施方案中,人类个体具有选自非洲黑人种族、亚洲种族、高加索人 种族、西班牙人种族和阿拉伯人种族的血统。在特定实施方案中,种 族是自己报告的。在其它实施方案中,血统通过特定的种族特异性遗 传标记物的评估来确定。
附图简述
34从下面对本发明的优选实施方案的更具体的描述,本发明的上述 以及其它的目标、特点和优点将变得明显。


图1显示了对CEPH群体(HapMap数据)在含有本发明的变体 的区域中的连锁不平衡(LD)作图。LD区块C04 (NCBIBuild35中 4号染色体上111,954,811-112,104,250的位置)在图上用黑框显示。图 中显示了 LD的两种度量,即位于图1的左上部分的D'和图的右下部 分的r2。
图2显示了在LD区块中相关区域的单倍型结构的示意图。深色 (左边)圆圈的面积与冰岛组中单倍型的单倍型频率成比例,浅色(右 边)圆圈的面积与香港组中的单倍型频率成比例。显示在图的中间的 居中的单倍型,不再能够确定存在于两个群体中的任何一个中(其估 算的频率低于0.2%,不能与基因分型误差区分开)。
图3是rs2200733和rs 10033464邻近的200kb的基因组区域的概 况。它包含了预测的ESTs,在CEUHapMap样品中三种主要类型的等 价的SNPs的位置,以及在各种不同种族的HapMap样品中区域的LD 结构的概况。
图4显示了 PITX2在人类心脏和主动脉中表达的Northern印迹分 析。PITX2 cDNA克隆HU3_p983E0327D被用作探针,分别检测了左 心房和主动脉中的1.8、 2禾B 3 kb的转录本以及2.2和3 kb的PITX2转
录本。第l道胎心,第2道整个心脏,第3道主动脉,第4道 心尖,第5道左心房,第6道右心房,第7道左心室,第8道
右心室。印迹使用PITX2 cDNA克隆(HU3_p983E0327D)探测。
发明详述
本发明的优选实施方案的描述如下。
定l
在本发明的文本中,下面的术语将具有所指示的意义
本文描述的心房纤颤(AF)是指按照已建立的医学标准所通常定义的AF。 AF按ICD-10分类在类别148中,按ICD-9分类在类别427.3 中。
本文描述的心房扑动(AF1)是指按照已建立的医学标准所通常定 义的AF1。AF1按ICD-10分类在类别148中,按ICD-9分类在类别427.3 中。
本文描述的"多态性标记物"、有时被称为"标记物",是指基 因组多态性位点。每种多态性标记物具有至少两个序列变体,其特征 为多态性位点上的特定等位基因。因此,与多态性标记物的遗传关联 表明存在与该具体多态性标记物的至少一个特定等位基因的关联。标 记物可以含有在基因组中发现的任何变体类型的任何等位基因,包括 SNPs、微卫星、插入、缺失、重复和易位。
"等位基因"是指染色体上给定位点(位置)的核苷酸序列。因 此,多态性标记物等位基因是指染色体上标记物的组成(即序列)。 来自个体的基因组DNA对于任何给定的多态性标记物来说含有两个等 位基因,代表了每条染色体上标记物的每个拷贝。
在本文中,在群体中(自然群体或合成的群体,例如合成分子的 文库)其上可能存在一种以上序列的核苷酸位置被称为"多态性位点"。
"单核苷酸多态性"或"SNP"是当基因组中特定位置上的单个 核苷酸在物种的成员之间或一个个体中成对的染色体之间不同时发生 的DNA序列变异。大多数SNP多态性具有两个等位基因。在这种情 况下,每个个体或者是多态性的一个等位基因的纯合子(即个体的两 个染色体拷贝在SNP位置处具有同样的核苷酸),或者个体是杂合子 (即个体的两条姊妹染色体含有不同的核苷酸)。在本文中报告的SNP
的命名是指官方的参考SNP (rs) ID身份标签,是由国家生物技术信息 中心(National Center for Biotechnological Information) (NCBI)为每个独特的SNP指定的。
本文描述的"变体"是指与参比DNA不同的DNA区段。"标记 物"或"多态性标记物"按照本文的定义,是变体。与参比不同的等 位基因被称为"变体"等位基因。
"微卫星"是在特定位点具有多个小的长度为2-8个核苷酸的碱 基重复(例如CA重复)的多态性标记物,其中重复长度的数量在总群 体中是变化的。"indel"是常见的多态性形式,含有一般只有几个核 苷酸长的小的插入或缺失。
本文描述的"单倍型"是指基因组DNA的一个区段,其特征为沿 着该区段排列有等位基因的特定组合。对于二倍体生物例如人类来说, 单倍型含有每个多态性标记物或位点的等位基因对的一个成员。在某 些实施方案中,单倍型可以含有两个或两个以上等位基因、三个或三 个以上等位基因、四个或四个以上等位基因、或五个或五个以上等位 基因。
本文描述的术语"易感性"包含了增加的易感性和降低的易感性。 因此,本发明的特定多态性标记物和/或单倍型的特征可以是心房纤颤 或中风的增加的易感性(即增加的风险),被表征为相对风险(RR) 或比值比(OR)大于1。或者,本发明的标记物和/或单倍型的特征可 以是心房纤颤或中风的降低的易感性(即降低的风险),被表征为相 对风险小于1。
"核酸样品"是从个体获得的含有核酸的样品。在某些实施方案、 即特定多态性标记物和/或单倍型的检测,核酸样品包含基因组DNA。 这样的核酸样品可以从任何含有基因组DNA的来源获得,包括例如血 液样品、羊水样品、脑脊液样品,或来自皮肤、肌肉、口腔或结膜粘 膜、胎盘、胃肠道或其它器官的组织样品。术语"心房纤颤和/或中风治疗药剂"是指可用于缓解或预防与心 房纤颤(AF)、心房扑动(AF1)或中风相关的症状的药剂,在本文中 有更详细的描述。
本文中描述的术语"与心律不齐(例如心房纤颤或心房扑动)和/
或中风相关的核酸"是指己经被发现与心律不齐、例如心房纤颤(AF)、 心房扑动(AF1)或中风相关的核酸。这包括但不限于本文描述的标记 物和单倍型,以及与其强烈连锁不平衡(LD)的标记物和单倍型。在 一个实施方案中,与心房纤颤、心房扑动或中风相关的核酸是指被发 现与心房纤颤和中风有关的LD区块C04。在另一个实施方案中,与心 房纤颤、心房扑动或中风相关的核酸是指PITX2基因。
本文描述的术语"LD区块C04"是指4号染色体上位于NCBI(国 立生物技术信息中心)Build 35中的111,954,811-112,104,250的位置之 间的连锁不平衡(LD)区块,其基因组序列显示在SEQIDNO:50中。
本文描述的"片段"是指核酸或蛋白序列的区段。片段的大小小
于它们的参比点,即大小为iooo个核苷酸的参比核酸分子的片段的大
小小于1000个核苷酸。本发明的核酸片段通常大小超过5个核苷酸, 典型情况下大小超过15个核苷酸,其上限由它们的参比核苷酸或核苷 酸片段的实际用途来决定。例如,在本发明的某些实施方案中,用作 杂交探针的核苷酸片段的大小大于15个核苷酸并小于大约500个核苷 酸。其它的大小范围适用于本发明的其它核苷酸片段和蛋白或肽片段。
本文描述的术语"PITX2"是指染色体4q25上的成对同源异型结 构域蛋白转录因子2基因。该基因也被称为脑垂体同源异形盒2 (PTX2) 、 rieg bicoid相关的同源异形盒转录因子1 (RIEG1) 、 solurshin 和all-l反应性基因1 (ARP1)。本发明涉及观察到人类基因组的染色体4q25上的某些多态性标记
物,被发现与心律不齐和中风有关联。在本发明的特定实施方案中,
染色体4q25上的多态性标记物与心律不齐性心房纤颤(AF)和心房扑 动(AF1)和中风相关。正如在本文中进一步详细描述的,这些观察与 诊断和治疗方法、应用、试剂盒和系统有着重要的、意想不到的牵连。
在赋予对AF的易感性的遗传变体的全基因组扫描中,在染色体 4q25上发现了几个与AF相关的标记物。对于标记物rs2220427和 rs2220733发现了与AF的最显著的关联性,二者都给出了接近10力的 p-值(表2),以及虽然较小但明显显著的与中风的关联性(表3)。 大量的标记物作为这些标记物的完美的替代物被鉴定到,包括微卫星 标记物D4S406 (表l)和许多SNP标记物(表4)。
对结果的进一步精炼,发现关联性信号出现在标记物rs2200733 和rsl0033464 (表7)、以及与那些标记物连锁不平衡的标记物(包括 但不限于表9中列出的SNP标记物)的、用遗传学术语来说的中心。
最初在冰岛人群体中进行的观察在独立的冰岛人AF/AF1组、瑞典 人AF组和美国AF组中进行了重复(表7)。当将冰岛人样品合并时, 与rs2200733的关联性是明确的(OR = 1.72,尸=3.3 x 10—41),与 rsl0033464的关联性也大大超过了基因组范围上显著性的阈值(OR = 1.39, P-6.9xl(T11)。假设乘法模型,两个变体合并的群体归因风险 (PAR)在欧洲人血统的群体中是大约20%。此外,关联性也在来自 香港的中国人AF组中进行了重复(表7)。
本发明人还发现,对于冰岛人样品来说,AF/AF1的诊断年龄与两 个SNPs rs2200733和rsl0033464相关。因此,对于每个rs2200733等 位基因T来说诊断的发生早2.28年,对于每个rsl0033464等位基因T 来说诊断发生早1.10年(组合的P-1.29x 1(T6)。这种效应由在诊断 年龄较小的个体中两个变体的关联性最强所表明,尽管即使在诊断年龄超过80岁的个体中风险仍然是显著的(表8)。在美国组中观察到 了类似的发病年龄的效应(表8)。
发明人还观察到了变体与AF1之间的强烈关联性,它们看起来比 与AF的关联性更强。与被诊断患有AF1的冰岛患者的亚组(N=116) 的关联性显示了这一点(对于rs2200733来说OR^2.60, 95%置信区间 (CI) =1.83-3.68,尸-7.5xl(T8,对于rsl0033464来说OR = 1.94, 95% CI=1.26-3.00,尸=麓8)。事实上,对于rs2200733来说,这些确定的 AF1病例的OR显著高于具有AF表型的病例的OR (P = 0.0026),对 于rsl0033464来说,接近于明显高(P = .084)。与SNPs rs2200733 和rsl0033464的关联性说明了这些AF和AF1都具有显著遗传风险因 子的结果。
本发明人还进一步确定了与AF/AF1相关的变体也与中风、特别是 缺血性中风相关(表21)。标记物rs2200733在缺血性中风和缺血性 中风(IS)心源性中风亚表型(CES)中得到了显著的重复。在对其它 的冰岛IS病例和对照(总共1,943个病例/25,708个对照)以及4个大 的IS病例/对照重复组(4,294个病例/3,709个对照)进行基因分型之 后,发现该标记物和标记物rsl0033464与AF是主要病因的CES关联 性最强(rs2200733: OR= 1.53, P=1.5x 10-12; rsl0033464: OR=1.27, =5.9xl0-4)(表21)。
在含有rs2200733和rsl0033464的LD区块中不存在已知的基因 (图3)。该LD区块含有一个剪接EST (DA725631)和两个单外显 子ESTs (DB324364和AF017091)。来自各种组织的cDNA文库的 RT-PCR没有检测到这些ESTs的表达(表16)。位于邻近上游LD区 块中的尸/7X2基因是与风险变体最接近的基因。含有尸/7X2基因的LD 区块中的几个标记物与表18中显示的对AF和Afl显示出关联性的标 记物相关。因此,可能P/7X2基因中的变体是潜在的病因变体。可选 地,有可能本文描述的本发明的变体影响了 PITX2的功能、稳定性、表达、翻译后修饰、剪接、信使稳定性,或通过其它的方式影响了基 因,导致了对与心房纤颤、心房扑动和/或中风相关的病症的倾向性。 该基因编码的蛋白、成对同源异型结构域转录因子2,是AF/AF1的目
的候选物,因为已知它通过指导心脏的不对称形态发生在心脏发育中
发挥重要作用(Franco, D" 7>e"& CaWo而c MW 13: 157-63 (2003))。 此外,在小鼠中,敲除模型Pitx2已经被显示抑制了左心房中窦房结形 成的缺省途径。在所有容易进入的组织例如血液和脂肪组织中,尸/7X2 的mRNA表达非常低,妨碍了对基因型和表达水平之间的关联性的研 究。/V7X2上游的下一个基因是^W^尸,是负责在血管内皮中分解血 管紧张肽II的氨肽酶。该基因的表达更加广泛,但是与AF相关的变体 显示出与其在血液和脂肪组织中的表达没有相关性。没有其它已注解 的基因位于有关联的变体的上游400kb区域和下游1.5Mb区域中。
标记激浙卓倍遭伊仿
当在个体间进行比较时,群体中的基因组序列是不相同的。相反, 个体间在基因组中的许多位置上表现出了基因组序列变异性。这种序 列的变化通常被称为多态性,在每个基因组中有许多这样的位点。例 如,人类基因组表现出在平均每500个碱基对就发生序列变异。最常 见的序列体包括基因组中单一碱基位置的碱基变化,这种序列变体或 多态性,通常被称为单核苷酸多态性("SNPs")。这些SNPs据信是 在单个突变事件中发生的,因此通常可能在每个SNP位点存在两个可 能的等位基因;原始的等位基因和突变的等位基因。由于自然遗传漂 移并可能也由于选择压力,最初的突变产生了多态性,其特征为在任 何给定的群体中其等位基因的特定频率。在人类基因组中发现了许多 其它类型的序列变异,包括微卫星、插入、缺失、倒置和拷贝数变化。 多态性微卫星在特定位点含有多个小的碱基重复(例如CA重复,互补 链上的TG重复),重复的长度的数量在总群体中是变化的。概括地说, 多态性位点的每个版本的序列都代表了多态性位点的特定等位基因。 这些序列变体都可以被称为多态性,它们发生在特定多态性位点,表
明了所述序列变体的特征。概括地说,多态性可以包含任何数量的特定等位基因。因此,在本发明的一个实施方案中,多态性的特征为在 任何给定群体中存在两种或两种以上等位基因。在另一个实施方案中, 多态性的特征为存在三种或三种以上等位基因。在其它实施方案中, 多态性的特征为四种或四种以上等位基因、五种或五种以上等位基因、 六种或六种以上等位基因、七种或七种以上等位基因、九种或九种以 上等位基因或十种或十种以上等位基因。所有这样的多态性都可用于 本发明的方法和试剂盒中,因此在本发明的范围内。
在某些情况下,对多态性位点处不同等位基因进行参比而不选择 参比等位基因。或者,对于特定多态性位点可以指定参比序列。参比 等位基因有时被称为"野生型"等位基因,它通常被选为第一个被测 序的等位基因或来自"未受影响的"个体(例如没有显示出性状或疾 病表型的个体)的等位基因。
本文指称的SNP标记物的等位基因,根据在使用的SNP分析中出 现在多态性位点上的碱基A、 C、 G或T进行指称。本文使用的SNPs 的等位基因编码如下1= A, 2=C, 3=G, 4=T。但是,本技术领域的 专业人员将会认识到,在每种情况下,通过分析或读取相反的DNA链, 可以测量到互补的等位基因。因此,对于其特征为A/G多态性的多态 性位点(多态性标记物)来说,使用的分析方法可以被设计成特异性 检测两种可能的碱基即A和G中的一种或两种的存在。可选地,通过 设计分析方法,使得它被设计成检测DNA模板上的相反链,可以测量 到互补碱基T和C的存在。从定量来说(例如根据相对风险),从任 一条DNA链(+链或-链)测量获得的结果是相同的。
典型情况下,对特定序列指定参比序列。与参比不同的等位基因 有时被称为"变体"等位基因。本文使用的变体序列是指与参比序列 不同但是基本上相似的序列。本文描述的多态性遗传标记物处的等位 基因是变体。其它的变体可以包含影响到多肽的变化。当与参比核苷 酸序列进行比较时,序列差异可以包括单个核苷酸或一个以上核苷酸的插入或缺失,从而导致阅读框移码;至少一个核苷酸的变化,导致 了所编码的氨基酸的变化;至少一个核苷酸的变化,导致产生了未成 熟的终止密码子;几个核苷酸的缺失,导致了核苷酸编码的一个或多 个氨基酸的缺失; 一个或几个核苷酸的插入,例如通过不对称重组或 基因转换,导致了阅读框编码序列的中断;序列的全部或一部分的复 制;易位;或核苷酸序列的重排。这样的序列变化可以改变核酸编码 的多肽。例如,如果核酸序列中的变化导致了阅读框移码,阅读框移 码可以导致编码的氨基酸的变化,和/或导致产生了未成熟的终止密码 子,导致产生了截短的多肽。可选地,与疾病或性状有关的多态性可 以是一个或多个核苷酸中的同义变化(即变化不导致氨基酸序列的变 化)。这样的多态性可能例如改变剪接位点、影响mRNA的稳定性或 运输,或影响转录或编码的多肽的翻译。也可以改变DNA,以增加在 体细胞水平上发生结构变化、例如扩增或缺失的可能性。参比核苷酸 序列编码的多肽是具有特定的参比氨基酸序列的"参比"多肽,由变 体等位基因编码的多肽被称为具有变异的氨基酸序列的"变体"多肽。 序列或参比序列可以表示双链DNA的(+)或(-)方向。正如专业技术人员 所熟知的,这样的序列是相关的,彼此为反向互补序列。
单倍型是指DNA的区段,其特征为沿着区段排列有等位基因的特 定组合。对于二倍体生物例如人类来说,单倍型含有每个多态性标记 物或位点的一对等位基因中的一个成员。在某些实施方案中,单倍型 可以含有两个或两个以上等位基因、三个或三个以上等位基因、四个 或四个以上等位基因、或五个或五个以上等位基因,每个等位基因对 应于区段上的特定多态性标记物。单倍型可以含有在多态性位点上具 有特定等位基因的各种多态性标记物、例如SNPs和微卫星的组合。因 此,单倍型含有各种不同遗传标记物等位基因的组合。
特定多态性标记物和/或单倍型的检测可以通过本技术领域已知 的检测多态性位点的序列的方法来完成。例如,可以使用用于基因分 型的标准技术检测SNPs和/或微卫星标记物的存在,例如基于荧光的
43技术(Chen, X.等,Ge"owe 7 " ^Y": 492-98 (1999)),利用PCR、 LCR、 巢式PCR以及其它用于核酸扩增的技术。可用于SNP基因分型的具体 的方法包括但不限于TaqMan基因分型分析方法和SNPlex平台 (Applied Biosystems)、质i普(例如来自Sequenom的MassARRAY系 统)、微型测序方法、实时PCR、 Bio-Plex系统(BioRad) 、 CEQ和 SNPstream系统(Beckman)、分子倒置探针阵列技术(例如Affymetrix GeneChip)以及BeadArray技术(例如Illumina GoldenGate禾B Infinium 分析方法)。通过这些以及其它本技术领域的专业人员可用的方法, 可以鉴定出多态性标记物包括微卫星、SNPs或其它类型的多态性标记 物的一个或多个等位基因。
在本文描述的某些方法中,对所研究的任何特定疾病或性状具有 增加的易感性(即增加的风险)的个体,是在其中鉴定到了赋予对疾 病或性状的增加的易感性的一个或多个多态性标记物的至少一个特定 等位基因或单倍型(即风险标记物等位基因或单倍型)的个体。在一 种情况下,风险标记物或单倍型是赋予了对疾病或性状的明显增加的 风险(或易感性)的标记物或单倍型。在一个实施方案中,与标记物 或单倍型相关的显著性通过相对风险(RR)来测量。在另一个实施方 案中,与标记物或单倍型相关的显著性通过比值比(OR)来测量。在 另一个实施方案中,显著性通过百分比来度量。在一个实施方案中, 显著增加的风险被测量为风险(相对风险和/或比值比)为至少1.2,包 括但不限于至少1.2、至少1.3、至少1.4、至少1.5、至少1.6、至少 1.7、至少1.8、至少1.9、至少2.0、至少2.5、至少3.0、至少4.0和至 少5.0。在具体的实施方案中,至少1.2的风险(相对风险和/或比值比) 是显著的。在另一个具体实施方案中,至少1.3的风险是显著的。在另 一个实施方案中,至少1.4的风险是显著的。在另一个实施方案中,至 少大约1.5的相对风险是显著的。在另一个实施方案中,至少大约1.7 的风险的显著增加是显著的。但是,也考虑到了其它的截止值,例如 至少1.15、 1.25、 1.35等,这些截止值也在本发明的范围内。在其它实 施方案中,风险的显著增加是至少大约20%,包括但不限于大约25%、30%、 35%、 40%、 45%、 50%、 550/0、 60%、 65%、 70%、 75%、 80%、 85%、 90%、 95%、 100%、 150%、 200%、 300%和500%。在一个具体 的实施方案中,风险的显著增加是至少20%。在其它实施方案中,风 险的显著增加是至少30%、至少40%、至少50%、至少60%、至少70%、 至少80%、至少90%和至少100%。但是,也考虑到了本技术领域的专 业技术人员认为适合于表征本发明的其它截止值或范围,它们也在本 发明的范围内。
本发明的风险多态性标记物或单倍型,是在具有疾病或性状(例 如心律不齐或中风)(受影响的)风险的个体中至少一个标记物的至 少一个等位基因或单倍型的出现频率,与它在对比组(对照)中的出 现频率相比更高的标记物或单倍型,其中标记物或单倍型的存在表明 了对疾病或性状的易感性。在一个实施方案中,对照组可以是群体样 品,即来自总群体的随机样品。在另一个实施方案中,对照组由一组 没有患病的个体代表。在一个实施方案中,这些没有患病的对照的特 征可以是不存在一种或多种与特定疾病相关的症状。在另一个实施方 案中,没有患病的对照组的特征为没有一种或多种疾病特异性风险因 子。在一个实施方案中,这样的风险因子是至少一种环境风险因子。 代表性的环境因子是已知影响或被考虑到影响发生特定疾病或性状的 风险的天然产品、矿物质或其它化学物质。其它环境风险因子是与生 活方式有关的风险因子,包括但不限于饮食习惯、主要居住地的地理 位置和职业性风险因子。在另一个实施方案中,风险因子是至少一种 遗传风险因子。
简单的相关性检验的例子是在2x2表格上进行的Fisher-精确检验。 给定一组染色体,使用含有两种标记物或单倍型、含有一种标记物或 单倍型而不含另一种、以及不含有标记物或单倍型的染色体的数量, 构建出2x2表格。
在本发明的另一个实施方案中,对疾病或性状具有降低的易感性(即降低的风险)的个体,是在其中鉴定到了赋予对疾病或性状的降 低的易感性的一个或多个多态性标记物的至少一个特定等位基因或单 倍型的个体。赋予降低的风险的标记物等位基因和/或单倍型也被说成 是保护性的。在一种情况下,保护性标记物或单倍型是赋予了对疾病 或性状的明显降低的风险(或易感性)的标记物或单倍型。在一个实 施方案中,显著降低的风险被测量为相对风险小于0.9,包括但不限于
小于0.9、小于0.8、小于0.7、小于0.6、小于0.5、小于0.4、小于0.3、 小于0.2和小于0.1。在一个具体的实施方案中,显著降低的风险是小 于0.7。在另一个实施方案中,显著降低的风险是小于0.5。在另一个 实施方案中,显著降低的风险是小于0.3。在另一个实施方案中,风险 (或易感性)的降低是至少20%,包括但不限于至少25%、至少30%、 至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、 至少65%、至少70%、至少75%、至少80°/。、至少85%、至少90%、 至少95%和至少98%。在一个具体实施方案中,风险的显著降低是至 少大约30%。在另一个实施方案中,风险的显著降低是至少大约50%。 在另一个实施方案中,风险的显著降低是至少大约70%。但是,也考 虑到了本技术领域的专业技术人员认为适合于表征本发明的其它截止 值或范围,它们也在本发明的范围内。
本技术领域的专业人员将会认识到,在被研究的群体中存在标记 物的两个等位基因,其中一个等位基因被发现在群体中具有性状或疾 病的个体组中的频率高于对照组,而标记物的另一个等位基因被发现 在具有性状或疾病的个体组中的频率低于对照组。在这种情况下,标
记物的一个等位基因(被发现在具有性状或疾病的个体中频率增加的 等位基因)将是有风险的等位基因,而另一个等位基因将是保护性等 位基因。
遂徵不乎欽
重组这种自然现象,对于每对染色体来说在每次减数分裂事件过 程中平均发生一次,代表了自然界为序列(因此也为生物学功能)提供变异的一种方式。已经发现,基因组中的重组不是随机发生的;相 反,在重组率的频率上存在很大的变化,产生了具有高重组频率的小 区域(也被称为重组热点)和具有低重组频率的较大的区域,这通常 被称为连锁不平衡(LD)区块(Myers, S.等,S/oc/^/w Soc 7>ww 34:526-530 (2006); Jeffreys, A丄,等,GeW 29:217-222 (2001); May, C.A.等,淑訓G匿"1:272-275(2002))。
连锁不平衡(LD)是指两个遗传元件的非随机的搭配。例如,如 果特定遗传元件(例如多态性标记物的等位基因,或单倍型)在群体 中出现的频率为0.25 (25%),另一个元件出现的频率为0.25 (25%), 假设元件随机分配,那么一个个体具有两个元件的预计的发生率为 0.125 (12.5%)。但是,如果发现两个元件一起出现的频率高于0.125, 那么元件被说成是连锁不平衡的,因为它们倾向于以比根据它们独立 的出现频率(例如等位基因或单倍型频率)预测的比例更高的比例一 起遗传。粗略地说,LD—般与两个元件之间的重组事件的频率相关。 群体中等位基因或单倍型的频率可以通过对群体中的个体进行基因分 型并确定群体中每个等位基因或单倍型出现的频率来测定。对于二倍 体群体例如人类群体来说,个体一般对每个遗传元件(例如标记物、 单倍型或基因)具有两个等位基因。
为了评估连锁不平衡(LD)的强度已经提出了许多不同的测量方 法。大多数捕获成对的双等位基因位点之间关联的强度。LD的两个重 要的成对度量是r2 (有时称为A2)和ID'I。两种度量的范围都是从0 (没 有不平衡)到1 ("完全"不平衡),但是它们的解释稍微有些不同。 ID'I被定义为如果仅存在两个或三个可能的单倍型则等于1,如果所有 四个可能的单倍型都存在则小于1。因此,小于l的ID'I值表明在两个 位点之间可能在历史上已经发生过重组(回复突变也能导致ID,I小于1, 但是对于单核苷酸多态性(SNPs)来说,通常认为这种情况发生的可 能性比重组低)。度量 一表示两个位点之间的统计学相关性,如果只 出现两个单倍型则取值为1。
47r2度量大概是相关性作图的最具相关性的度量,因为在—和检测 易感性位点与SNPs之间的关联性所需的样品大小之间存在简单的反 比关系。这些度量是针对成对位点定义的,但是对某些应用来说,可
能需要确定在含有许多多态性位点的整个区域上LD有多强(例如测试 在位点之间或群体范围内LD的强度是否有显著的差别,或者区域中的 LD比在特定模型下预测的更高还是更低)。对整个区域的LD的测量 不是直接进行的,而是使用一种方法测量r,这种方法是在群体遗传学 中开发的。简单来说,r测量了在特定的群体模型下为了产生在数据中 观察到的LD将需要多少重组。这种类型的方法也可能可以为确定LD 数据是否为重组热点的存在提供了证据的难题提供统计学上严格的方 法。对于本文描述的方法和过程来说,显著的—值可以是至少0.1,例 如至少O.l、 0.15、 0.2、 0.25、 0.3、 0.35、 0.4、 0.45、 0.5、 0.55、 0.6、 0.65、 0,7、 0.75、 0.8、 0.85、 0.9、 0.91、 0.92、 0.93、 0.94、 0.95、 0.96、 0.97、 0.98、 0.99或1.0。在一个优选实施方案中,显著的rM直可以是 至少0.2。可选地,本文描述的连锁不平衡是指其特征为ID'I的值为至 少0.2,例如0.3、 0.4、 0.5、 0.6、 0.7、 0.8、 0.85、 0.9、 0.95、 0.96、 0.97、 0.98、 0.99的连锁不平衡。因此,连锁不平衡表示了不同标记物的等位 基因之间的相关性。它由相关性系数或ID,沐度量(一最高为1.0, |D,| 最高为1.0)。连锁不平衡可以如本文描述在单一人类群体中测定,或 者可以在含有来自一个以上人类群体的个体的样品集合中测定。在本 发明的一个实施方案中,LD在来自一个或多个HapMap群体(高加索 人,非洲人,日本人,中国人)的样品中,按照(http:〃www.hapmap.org) 的定义来测定。在一个这样的实施方案中,LD在HapMap样品的CEU 群体中测定。在另一个实施方案中,LD在YRI群体中测定。在另一个 实施方案中,LD在来自冰岛人群体的样品中测定。
如果在群体水平上基因组中的所有多态性是一致的,那么它们中 每个单独的多态性将需要在关联性研究中进行调查。但是,由于多态 性之间的连锁不平衡,紧密连锁的多态性是强烈相关的,这减少了在关联性研究中为了观察到显著相关性所需调査的多态性的数量。LD的 另一个结果是,许多多态性由于它们是强烈相关的,可能给出关联性信号。
已经在基因组范围内产生了基因组LD谱图,这样的LD谱图已经 被建议用作框架对疾病基因进行作图(Risch, N. & Merkiangas, K, 5We"ce 273:1516-1517 (1996); Maniatis, N.等,/Voc 7VaW ^cac/"&4 99:2228-2233 (2002); Reich,DE等,A^wre 411:199-204 (2001))。
现在已经确定,人类基因组的许多部分可以被分成一系列不连续 的含有几个共同的单倍型的单倍型区块;对于这些区块来说,连锁不 平衡数据几乎没有提供表明重组的证据(参见例如Wall., J.D.和 Pritchard, J.K.,淑匿i ev/缩¥:587-597 (2003); Daly, M.等, 淑匿":229-232 (2001); Gabriel, S.B.等,Sc/置e腐:2225-2229 (2002);Patil, N.等,S"'匿e厕:1719-1723 (2001); Dawson, E.等,淑匿 福:544-548 (2002); Phillips, M.S.等,淑訓":382-387 (2003))。
有两种主要的方法用于定义这些单倍型区块区块可以被定义为
具有有限的单倍型多样性的DNA区域(参见例如Daly, M.等,7Va&"
":229-232 (2001); Patil, N.等,Sc/置e "(1719-1723 (2001); Dawson, E.等,A^m^e WS:544-548 (2002); Zhang, K.等,iVoc. Wfl〃,力c"cf.
tAS^4 99:7335-7339 (2002)),或者定义为使用连锁不平衡鉴定的具 有延长的历史上重组的过渡区之间的区域(参见例如Gabriel, S.B.等, Scie騰 296:2225-2229 (2002) ; Phillips, M.S.等,胸訓 W:382-387 (2003); Wang, N.等,颠.i/画.G匿t 77:1227-1234 (2002); Stumpf, MP.,和Goldstein, D.B., Cw".所o/. /3:1-8 (2003))。更 近些时候,在人类基因组范围上重组率的精细图的和相应的热点的图 谱已经被产生(Myers, S.等,5We"ce 310:321-32324 (2005); Myers, S. 等,Soc 7>ww 34:526530 (2006))。图谱显示出在基因组范围 内的重组中存在大量变化,在热点处重组率高达10-60 cM/Mb,而在过渡区中接近于0,因此代表了有限单倍型多样性和高LD的区域。因此, 谱图可用于将单倍型区块/LD区块定义为重组热点两翼的区域。在本文
中使用的术语"单倍型区块"或"LD区块"包含了由任何上述的特征、
或本技术领域的专业人员用于定义这种区域所用的其它可选方法定义 的区块。
使用单个标记物或含有多个标记物的单倍型,单倍型区块可用于 对表型和单倍型状态之间的相关性进行作图。可以在每个单倍型区块
中鉴定主要的单倍型,然后可以鉴定一组"标签"SNPs或标记物(在 单倍型中进行辨别所需的最小组的SNPs或标记物)。这些标签SNPs 或标记物然后可用于评估来自个体组的样品,以便鉴定表型和单倍型 之间的相关性。如果需要,可以对邻近的单倍型区块同时进行评估, 因为在单倍型区块之间也可能存在连锁不平衡。
因此,显然,对于任何给定的观察到的与基因组中的多态性标记 物的关联性来说,可能基因组中的其它标记物也显示出关联性。这是 基因组范围内LD的不均衡分布的自然结果,正如通过重组率的大的变 化所观察到的。因此,在某种意义上,用于检测关联性的标记物代表 了与给定疾病或性状有关的基因组区域(即单倍型区块或LD区块)的 "标签",并因此可用于本发明的方法和试剂盒中。在被发现与疾病 或性状有关的区域中可以存在有一个或多个引起结果的(功能性)变 体或突变。这样的变体可能赋予比用于检测关联性的标签标记物观察 到的更高的相对风险(RR)或比值比(OR)。因此,如本文所述,本 发明涉及了用于检测与疾病的关联性的标记物,以及与标记物连锁不 平衡的标记物。因此,在本发明的某些实施方案中,与本文所述的标 记物和/或单倍型连锁不平衡的标记物可以被用作替代标记物。在一个 实施方案中,替代标记物具有比最初被发现与本文所述的疾病相关的 标记物或单倍型更小的相对风险(RR)和/或比值比(OR)值。在其 它实施方案中,替代标记物具有比最初被发现与本文所述的疾病相关 的标记物所最初测定的更大的RR或OR值。这样的实施方案的一个例子是与最初被发现与疾病相关的更常见的变体(>10%群体频率)、例 如本文描述的变体连锁不平衡的稀有的或相对稀有的(<10%等位基因 群体频率)变体。鉴定和使用这些标记物用于检测本文描述的本发明 人发现的关联性,可以通过本技术领域的专业人员熟知的常规方法来 进行,因此也在本发明的范围内。
与本文显示的与心律不齐(例如心房纤颤和心房扑动)和中风有 关联的标记物连锁不平衡的某些多态性标记物,有可能位于本文SEQ
ID NO: 50中显示的序列所定义的LD区块C04的物理边界之外。这是 所述区域中历史上的重组率的结果,历史上的重组可能导致产生了强 烈连锁不平衡的区域(LD区块),它带有与区块内的标记物连锁不平 衡的区块外的剩余标记物。这样的标记物也在本发明的范围内,因为 利用它们与在本文中显示出的与心律不齐和中风相关联的标记物的遗 传关系,它们同样可用于实施本发明。这样的标记物的例子显示在表 18中(rs7668322 (SEQIDNO:46) 、 rs2197815 (SEQIDNO:47)、 rs6831623 (SEQIDNO:48) 、 rs2595110 (SEQIDNO:49))。
卓舒微率颜定
患者和对照组中单倍型的频率可以使用期望最大化算法来估算 (Dempster A.等,《/ 兄5, 39:1-38 (1977))。可以使用这种算 法来操作丢失的基因型和阶段的不确定性。在虚假设下,患者和对照 被假定具有同样的频率。使用或然性方法,测试可选的假说,其中候 选的风险单倍型、可以包含本文描述的标记物、被允许在患者中比对 照中具有更高的频率,而两个组中其它单倍型的频率的比率被假设是
相同的。在两种假说下分别将或然性最大化,并使用相应的l-df或然 性比率统计数值来评估统计学显著性。
为了在连锁区域中寻找有风险和保护性标记物,研究了例如被基 因分型的标记物的所有可能组合的关联性,只要那些标记物分布在可 实践的区域中。可以将合并的患者和对照组随机分成两组,其大小与
51原始的患者和对照组相等。然后重复标记物和单倍型分析,确定记录 到的最显著的p-值。这种随机化的流程可以被重复例如超过100次, 以构建p-值的经验性分布。在优选实施方案中,p-值〈0.05是显著的标 记物和/或单倍型关联性的指示。
卓燈麥分折
进行单倍型分析的一种通用方法包括将基于或然性的推论用于
NEstedMOdels (Gretarsdottir S.等,A^aA 35:131-38 (2003))。该
方法在NEMO程序中执行,允许使用许多多态性标记物、SNPs和微卫 星。所述方法和软件被特别设计用于病例-对照研究,其目的是鉴定赋 予了不同风险的单倍型组。它也是用于研究LD结构的工具。在NEMO 中,在EM算法的帮助下,直接计算了最大或然性估算值、或然性比 率和p-值,对于观察到的数据,将其作为缺失数据问题进行处理。
尽管基于从观察到的数据直接计算的或然率的或然率比率检验捕 捉到了由于阶段的不确定性和缺失的基因型而丢失的信息,可用于可 靠地给出有效的p-值,但了解由于信息的不完整而丢失了多少信息, 仍然是有趣的。用于单倍型分析的信息测量测量描述在Nicolae和Kong (技术报告537号,芝加哥大学统计学院统计学系;S/ome^", 60(2):368-75 (2004))中,作为为连锁分析定义的信息测量的自然延伸, 并在NEMO中执行。
对于单个标记物与疾病的关联性来说,可以使用Fisher精确检验 来计算每个单独等位基因的双边p-值。通常来说,除非特别指明,所 有显示的p-值没有对多重比较进行调整。显示的频率(对于微卫星、 SNPs和单倍型来说)是与携带者频率相反的等位基因频率。为了最小 化由于作为连锁分析的家庭召集的患者的亲缘性造成的任何偏差,一 级和二级亲属可以从患者名单中消除。此外,通过扩展在Risch, N. & Teng, J. (Ge"omei e、 8:1273-1288 (1998))中描述的偏差调整步骤, 合并具有亲缘关系的DNA (/^丄)以便它可以适用于普通家族关系、并呈递调整过的和未调整的p-值进行比较,可以重复检验,对患者间 任何残留的亲缘性进行关联性校正。差异一般来说正如预期一样非常 小。为了评估通过多次检验校正的单个标记物关联性的显著性,我们 可以使用同样的基因型数据执行随机测试。可以将患者和对照组随机
化,将关联性分析重做多次(例如多达500,000次),在某些重复中对
某些标记物等位基因产生的p-值小于或等于我们使用最初的患者和对 照组时观察到的p-值,p-值即是这样的重复的分数。
对于单个标记物和单倍型分析来说,通过假设的乘法模型(单倍
型相对风险模型)可以计算相对风险(RR)和群体归因风险度(PAR) (Terwilliger, J.D. & 。tt, J., //匿//e^W. 42:337-46 (1992)和Falk, C.T. & Rubinstein, P, J朋,//wm. 5/ 3」:227-33 (1987)),即一个人
携带的两个等位基因/单倍型的风险的乘积。例如,如果A相对于a的 风险是RR,那么纯合子AA的人的风险将是杂合子Aa的人的风险的 RR倍,以及纯合子aa的人的风险的RR"咅。乘法模型具有简化分析 和计算的良好性质一一单倍型在受影响的群体中以及对照群体中是独 立的,即处于Hardy-Weinberg平衡。因此,受影响的和对照的单倍型 的数量每个都具有多项式分布,但是在可选假设下具有不同的单倍型 频率。具体来说,对于两个单倍型&和^来说,风险(/z,)/风险化)=
(/^,)/W/乃),其中/和P分别是指受影响的群体和对照群体中的频率。 尽管如果真正的模型不是乘法的将会损失一些效能,但除了极端情况 下之外,损失趋于轻微。最重要的是,p-值总是有效的,因为它们是针 对虚假设计算的。
A^MO汙,遂缀不^翁—
成对标记物之间的LD可以使用标准定义的D'和r2来计算 (Lewontin, R., Ge""/" 49:49-67 (1964); Hill, W.G. & Robertson, A. 7Tzeor 4p; /. 22:226-231 (1968))。使用NEMO,通过最大或然
性来估算两个标记物等位基因组合的频率,通过或然性比率检验来评 估连锁不平衡的偏差。通过平均由边缘等位基因概率权重的两个标记物的所有可能的等位基因组合的值,D'和r2的定义被扩展到包含微卫 星。当对所有标记物组合进行作图以阐明特定区域中的LD结构时,我 们将D'作图于左上角,将p-值作图于右下角。在LD图中,如果需要 的话,标记物可以等间距作图而不按照它们的物理位置作图。
^Ai伊仿浙珍銜学
正如本文所述,某些多态性标记物和含有这样的标记物的单倍型 被发现可用于心律不齐(例如心房纤颤或心房扑动)或中风的风险评 估。风险评估可以包括使用标记物来诊断对心律不齐(例如心房纤颤 或心房扑动)或中风的易感性。多态性标记物的特定等位基因,在患 有心律不齐(例如心房纤颤或心房扑动)或中风的个体中发现的频率, 比在没有诊断出心律不齐(例如心房纤颤或心房扑动)或中风的个体 中的频率更高。因此,这些标记物等位基因对于在个体中检测心律不 齐(例如心房纤颤或心房扑动)或中风、或对心律不齐(例如心房纤 颤或心房扑动)或中风的易感性,具有预测价值。含有风险标记物、 例如本文描述的标记物的单倍型区块或LD区块中的标签标记物,可用 作单倍型区块或LD区块中其它标记物和/或单倍型的替代物。具有等 于1的^值的标记物是风险变体的完美的替代物,即一个标记物的基 因型完美地预测了另一个的基因型。具有小于1的—值的标记物也可 以作为风险变体的替代物,或者可选地代表相对风险值等于或可能甚 至高于风险变体的变体。鉴定到的风险变体本身可以不是功能变体, 但是在这种情况下与真正的功能变体连锁不平衡。本发明包括了为本 文公开的标记物评估这样的替代标记物。这样的标记物被注解、作图 和列表在专业技术人员熟知的公共数据库中,或者可选地,可以通过 对使用本发明的标记物在一组个体中鉴定到的区域或区域的一部分进 行测序,并在得到的序列组中鉴定多态性,来容易地鉴定。结果,本 技术领域的专业人员可以容易地并且不需要繁琐的实验,对与本文描 述的标记物和/或单倍型连锁不平衡的替代标记物进行基因分型。与检 测到的风险变体连锁不平衡的标签或替代标记物,对于在个体中检测 与心律不齐(例如心房纤颤或心房扑动)和/或中风的关联性或对心律不齐(例如心房纤颤或心房扑动)和/或中风的易感性,也具有预测价 值。这些与本发明的标记物连锁不平衡的标签或替代标记物也可以包 括其它在单倍型中不同的标记物,因为它们同样对于检测对心律不齐 (例如心房纤颤或心房扑动)和/或中风的易感性,具有预测价值。
本发明的标记物和单倍型,例如在表5和9中显示的标记物以及 与其连锁不平衡的标记物,可单独或组合地用于风险评估和诊断目的。
因此,即使是在单个标记物造成的风险增加相对温和、即在10-30%的 级别的情况下,关联性也可以具有明显的暗示。因此,相对普通的变 体可能对总的风险有显著的贡献(群体归因风险度高),或者标记物的 组合可用于定义基于标记物的组合风险、对发生疾病有显著的组合风 险的个体组。
因此,在本发明的一个实施方案中,多个变体(标记物和/或单倍 型)被用于总体风险评估。在一个实施方案中,这些变体选自本文公 开的变体。其它实施方案包括了使用本发明的变体与其它已知可用于 诊断对心律不齐(例如心房纤颤或心房扑动)和/或中风的易感性的变 体的组合。在这样的实施方案中,在个体中确定了多个标记物和/或单 倍型的基因型状态,并将个体的状态与相关变体的群体频率、或在临 床健康的对象例如年龄匹配和性别匹配的对象中变体的频率进行比 较。然后可以使用本技术领域已知的方法、例如多变量分析或联合风 险分析,来确定根据多个位点处的基因型状态所赋予的总的风险。然 后可以将基于这样的分析进行的风险评估用于本文描述的本发明的方 法和试剂盒中。
如上所述,人类基因组的单倍型区块结构具有这样的作用,即与 最初与疾病或性状相关的变体连锁不平衡的大量变体(标记物和/或单 倍型)可以用作替代标记物,用于评估与疾病和性状的关联性。这样 的替代标记物的数量依赖于几种因素,例如区域中的历史重组率、区 域中的突变频率(即区域中多态性位点或标记物的数量)、以及区域中连锁不平衡的程度(LD区块的大小)。这些标记物通常位于使用本文 描述的方法或通过本技术领域的专业人员已知的其它方法确定的所述 LD区块或单倍型区块的物理边界内。但是,有时会发现标记物和单倍 型关联性延伸到定义的单倍型区块的物理边界之外。在这样的情况下, 这些标记物和/或单倍型也可用作物理上位于定义的单倍型区块内的标 记物和/或单倍型的替代标记物和/或单倍型。因此,与本发明的标记物
和单倍型连锁不平衡(典型的特征为—大于0.1,例如r2大于0.2,包 括一大于0.3,也包括—大于0.4)的标记物和单倍型也在本发明的范 围之内,即使它们在物理上位于所定义的单倍型区块的边界之外。这 包括了本文描述的标记物(例如表5和表9),但是也可以包括与表5 和9中列出的一种或多种标记物强烈连锁不平衡(例如特征为 一大于 0.1或0.2,和/或|0'|>0.8)的其它标记物。
对于本文描述的SNP标记物来说,与在患者中被发现是过量的等 位基因(风险等位基因)相反的等位基因,在心律不齐(例如心房纤 颤或心房扑动)和/或中风患者中被发现具有降低的频率。这些标记物 和单倍型与这样的标记物连锁不平衡和/或含有它们,因此对心律不齐
(例如心房纤颤或心房扑动)和/或中风具有保护性,即它们赋予了携 带有这些标记物和/或单倍型的个体以降低的发生心律不齐(例如心房 纤颤或心房扑动)和/或中风的风险或易感性。
本发明的某些变体、包括某些单倍型,在某些情况下包含各种遗 传标记物例如SNPs和微卫星的组合。单倍型的检测可以通过本技术领 域已知的和/或本文描述的用于检测多态性位点的序列的方法来进行。 此外,某些单倍型或标记物组与疾病表型之间的关联性可以使用标准 的技术来证实。用于关联性的简单检验的一个代表性例子是在2x2表 格上进行的Fisher精确检验。
在特定实施方案中,被发现与心律不齐(例如心房纤颤或心房扑 动)和/或中风有关的标记物或单倍型(例如列于表5 (表5A和5B)、表9和/或表19中的标记物,以及与其连锁不平衡的标记物),是其中 标记物或单倍型在具有心律不齐(例如心房纤颤或心房扑动)和/或中 风风险的个体(受影响的人)中出现的频率,比它在健康个体(对照) 中出现的频率高的标记物或单倍型,其中标记物等位基因或单倍型的 存在是心律不齐(例如心房纤颤或心房扑动)和/或中风或对心律不齐 (例如心房纤颤或心房扑动)禾P/或中风易感性的指示。在其它实施方 案中,与一个或多个被发现与心律不齐(例如心房纤颤或心房扑动)
和/或中风有关的标记物(例如列于表5A和5B中的标记物等位基因, 以及与其连锁不平衡的标记物)连锁不平衡的风险标记物,是在具有 心律不齐(例如心房纤颤或心房扑动)和/或中风风险的个体(受影响 的人)中出现的频率比它们在健康个体(对照)中出现的频率高的标 签标记物,其中标签标记物的存在是对心律不齐(例如心房纤颤或心 房扑动)和/或中风的增加的易感性的指示。在另一个实施方案中,与 一个或多个被发现与心律不齐(例如心房纤颤或心房扑动)和/或中风 有关的标记物(例如列于表5A和5B中的标记物等位基因,以及与其 连锁不平衡的标记物)连锁不平衡的风险标记物等位基因(即赋予增 加的易感性),是含有一个或多个在具有心律不齐(例如心房纤颤或心 房扑动)禾n/或中风风险的个体中出现的频率,比它们在健康个体(对 照)中出现的频率高的等位基因的标记物,其中标记物的存在是对心 律不齐(例如心房纤颤或心房扑动)禾P/或中风增加的易感性的指示。
研究荐沐
从普遍意义上讲,本发明的方法和试剂盒可以使用含有来自任何 来源、即任何个体的基因组DNA的样品。在优选实施方案中,个体是 人类个体。个体可以是成年人、儿童或胎儿。本发明还提供了对属于 耙群体的成员的个体中标记物和/或单倍型的评估。在一个实施方案中, 这样的靶群体是根据其它遗传因子、生物标记物、生物物理参数(例 如体重、BMD、血压)、或总体健康和/或生活方式参数(例如疾病或 相关疾病史、以前对疾病的诊断、疾病的家族史),具有发生疾病的 风险的个体的群体或组。
57本发明提供了包含特定年龄亚组的个体的实施方案,例如超过40
岁、超过45岁、或超过50、 55、 60、 65、 70、 75、 80或85岁的年龄 亚组。本发明的其它实施方案对应于其它的年龄组,例如年龄小于85 岁的个体,例如小于80岁、小于75岁、或小于70、 65、 60、 55、 50、 45、 40、 35或30岁。其它实施方案涉及发病时的年龄在任何上述年龄 范围内的个体。在某些实施方案中,还考虑到了年龄的范围可以是相 关的,例如发病时的年龄大于45岁但小于60岁。但是,其它的年龄 范围也被考虑到了,包括由上面列出的年龄值界定的所有范围。
其它实施方案涉及了发病年龄在特定年龄或年龄段的个体。因此, 遗传的和非遗传的倾向性因子可能在什么年龄影响个体发生疾病,这 是已知的。对于心血管疾病、包括心律不齐和中风来说,常见的风险 因子可以影响个体是否以及在什么年龄发生疾病。因此,本发明的某 些实施方案涉及了在某个年龄段中心律不齐(例如心房纤颤和/或心房 扑动)或中风的发病年龄或诊断时的年龄。在一个实施方案中,具有 发生中心律不齐(例如心房纤颤和/或心房扑动)或中风的风险的个体 的发病年龄或诊断年龄在40岁以上。在其它实施方案中,个体的发病 年龄或诊断年龄超过45岁,或超过50、 55、 60、 65、 70、 75、 80或 85岁。本发明的其它实施方案I涉及了发病年龄或诊断年龄在85岁以 下,例如在80岁以下、75岁以下或70、 65、 60、 55、 50、 45、 40、 35或30岁以下的个体。 一个优选实施方案包含了在80岁以下被诊断 患有心房纤颤或心房扑动或中风的个体。另一个优选实施方案涉及了 在70岁以下被诊断患有心房纤颤或心房扑动或中风的个体。另一个优 选实施方案涉及了在60岁以下被诊断患有心房纤颤或心房扑动或中风 的个体。另一个优选实施方案涉及了在50岁以下被诊断患有心房纤颤 或心房扑动或中风的个体。其它实施方案涉及了发病年龄在上面描述 的具体年龄段中的个体。也考虑到了在某些实施方案中,年龄段可以
是相关的,例如发病年龄大于45岁但小于60岁,发病年龄大于60岁 但小于70岁,发病年龄大于70岁但小于80岁,或发病年龄大于60岁但小于80岁。但是,其它的年龄段也被考虑到了,包括由上面列出 的年龄值界定的所有年龄段。
本发明还涉及了任何性别、男性或女性的个体。它还提供了涉及 来自一个或多个人类种群的人类对象的实施方案,包括但不限于班图
人、Mandenk、约鲁巴人、San、木布提矮人、奥克尼群岛人、Adygel、 俄罗斯人、萨丁尼亚人、托斯卡尼人、莫扎比特人、贝多因人、Dmze、 巴勒斯坦人、俾路支人、布拉灰人、莫克兰人、信德人、帕坦人、布 鲁肖人、哈扎拉人、维吾尔人、kalash、汉族人、傣族人、达斡尔人、 赫哲族人、拉祜族人、苗族人、鄂伦春族人、畲族人、土家族人、土 族人、锡伯族人、彝族人、内蒙古族人、纳西族人、柬埔寨人、曰本 人、雅库特人、美拉尼西亚人、巴布亚人、加里提亚拿人、Sumi、哥 伦比亚人、玛雅人和皮玛族人。本发明还涉及了欧洲人群体、美洲人 群体、欧亚人群体、亚洲人群体、中/南亚人群体、东亚人群体、中东 人群体、非洲人群体、西班牙人群体和大洋洲人群体。欧洲人群体包 括但不限于瑞典人、挪威人、芬兰人、俄罗斯人、丹麦人、冰岛人、 爱尔兰人、凯尔特人、英格兰人、苏格兰人、荷兰人、比利时人、法 国人、德国人、西班牙人、葡萄牙人、意大利人、波兰人、保加利亚 人、斯拉夫人、塞尔维亚人、波斯尼亚人、捷克人、希腊人和土耳其 人群体。
在一个优选实施方案中,本发明涉及了含有非洲黑人血统的群体, 例如含有非洲人血统或谱系的人的群体。非洲黑人血统可以通过自己 报告确定为非洲裔美国人(African-Americans )、非裔美国人 (Afro-Americans)、美国黑人(BlackAmericans),是黑色人种的一 个成员,或黑人人种的一个成员。例如,非洲裔美国人或美国黑人是 居住在北美并且起源于任何非洲黑色人种组的人。在另一个例子中, 自己报告的非洲黑人血统的人可以具有至少一个非洲黑人血统的父 母,或至少一个非洲黑人血统的祖父母。
59个体对象中的种族组成也可以通过遗传分析来确定。血统的遗传
分析可以使用不连锁的微卫星标记物来进行,例如在Smith等"m / //wmGe"W74, 1001-13 (2004))中提出的那些。
在某些实施方案中,本发明涉及了如上所述在特定群体中鉴定到 的标记物和/或单倍型。本技术领域的专业人员将会认识到,在对不同 的群体使用时,连锁不平衡(LD)测量将给出不同的结果。这是由于 不同人类群体的不同群体史,以及在特定基因组区域中可能导致LD差 异的不同选择压力。对于本技术领域的专业人员来说,某些标记物例 如SNP标记物在一个群体中是多态性的但在另一个群体中不是,这种 情况是熟知的。但是,本技术领域的专业人员将使用可用的或如本文 教导的方法,在任何给定的人类群体中实施本发明。这可以包括评估 本发明的LD区域中的多态性标记物,以便鉴定出那些在特定群体中表 现出最强关联性的标记物。因此,本发明的有风险变体可以在不同的 单倍型背景上、并以不同的频率存在于各种不同人类群体中。但是, 使用本技术领域己知的方法和本发明的标记物,可以在任何给定人类 群体中实施本发明。
遗传/Jf试游賴遂
本技术领域的专业人员将会认识到并理解, 一般来说,本文描述 的变体本身不能提供将发生心律不齐(例如心房纤颤或心房扑动)和/ 或中风的个体的绝对鉴定。但是,本文描述的变体表明了携带有本发 明的风险或保护性变体的个体将发生与心律不齐(例如心房纤颤或心 房扑动)和/或中风有关的症状的增加的和/或降低的可能性。但是,该 信息本身是极具价值的,正如在下文中更详细指出的,因为它可以用 于例如在早期阶段启动预防性措施,进行定期的生理和/或心理检查以 监测症状的发展和/或出现,或计划定期的检査以鉴定所述的病症,以 便能够在早期阶段实施治疗。
关于赋予了发生心律不齐(例如心房纤颤或心房扑动)和/或中风的风险的遗传变体的知识,为使用遗传测试辨别具有发生疾病的增加 的风险的个体(即风险变体的携带者)和具有发生疾病的降低的风险 的个体(即保护性变体的携带者)提供了机会。对于属于上述两个组 的个体来说,遗传测试的核心价值是能够在早期阶段诊断心律不齐(例 如心房纤颤或心房扑动)和/或中风的可能性,或心律不齐(例如心房 纤颤或心房扑动)和/或中风的倾向性,以及为临床医师提供关于心律 不齐(例如心房纤颤或心房扑动)和/或中风的预后的信息,以便能够 实施最合适的治疗。
具有心律不齐(例如心房纤颤或心房扑动)和/或中风家族史的个 体和风险变体的携带者可以从遗传测试中获益,因为对遗传风险因子 的存在的了解、或成为一个或多个风险因子的携带者的增加的风险的 证据,可以为通过避免或最小化与心律不齐(例如心房纤颤或心房扑 动)和/或中风相关的心血管疾病的已知环境风险因子,来实行更健康 的生活方式提供增加的激励。心律不齐(例如心房纤颤或心房扑动) 和/或中风患者的遗传测试,可以进一步给出关于疾病的首要原因的有 价值的信息,可以帮助临床医生为每个个体选择最适合的疗法和药物 治疗。
本发明还涉及对心律不齐(例如心房纤颤或心房扑动)和/或中风 的风险评估,包括确定个体是否具有发生心律不齐(例如心房纤颤或 心房扑动)和/或中风的风险。本发明的多态性标记物可以单独或组合 使用,以及与其它因子、包括其它遗传风险因子或生物标记物相组合, 用于对个体进行心律不齐(例如心房纤颤或心房扑动)和/或中风的风 险评估。许多已知影响个体对发生心血管疾病的风险的倾向性的因子, 是心律不齐(例如心房纤颤或心房扑动)和/或中风的易感性因子,它 们对于本技术领域的专业人员来说是已知的,并可用于这样的评估的 中。这些包括但不限于年龄、性别、吸烟状态、体育活动、腰围臀围 比、心律不齐(特别是心房纤颤和/或心房扑动)和/或中风的家族史、 以前诊断的心律不齐(例如心房纤颤或心房扑动)和/或中风、肥胖症、高甘油三酯血症、低HDL胆固醇、高血压、升高的血压、胆固醇水平、
HDL胆固醇、LDL胆固醇、甘油三酯、载脂蛋白AI和B水平、纤维 蛋白原、铁蛋白、C反应性蛋白和白三烯水平。已经与心房纤颤/心房 扑动和中风相关联的具体的生物标记物被讨论在Allard等(C//" C/z, 51:2043-2051 (2005))禾Q Becker (J77womZ) 7T^om6o/" 19:71-75 (2005)) 中。它们包括但不限于纤维蛋白D-二聚体、凝血酶原活化片段1.2 (F1.2)、凝血酶-抗凝血酶III复合物(TAT)、纤维蛋白肽A (FPA)、 脂蛋白相关的磷脂酶A2 (Ip-PLA2) 、 (3-血小板球蛋白、血小板因子4、 P-选择素、von Willebrand因子、利尿钠肽前体(BNP)、基质金属蛋 白酶-9 (MMP-9) 、 PARK7、 二磷酸核苷激酶(NDKA) 、 tau、神经 元特异性烯醇化酶、B型神经营养性生长因子、星形神经胶质蛋白 S-100b、神经胶质纤丝酸性蛋白、C-反应性蛋白、血清淀粉样肽A、基 质金属蛋白酶-9、血管和细胞内细胞粘附分子、肿瘤坏死因子a和白介 素,包括白介素-1、 -6和-8。循环系统祖细胞也已经被暗示可以作为 AF的有用的生物标记物。在具体的实施方案中,对于个体确定了一个 以上的生物标记物,并与本文描述的至少一个多态性标记物的确定结 果相结合。优选情况下,测量来自个体的血浆或血清中的生物标记物, 可选地,可以在其它含有可测量量的生物标记物的适合的组织中测量 生物标记物,这样的实施方案也在本发明的范围之内。
本技术领域已知的方法可用于总体风险评估,包括多变量分析或 逻辑回归。
心房纤颤对于个体患者和卫生护理系统整体来说都是非常重要的 疾病。它可能是永久性的病症,但是也可以是突发性的并复发,在这 种病例中它对诊断可能非常具有挑战性。心房纤颤和心房扑动的最具 破坏性的并发症是衰弱性中风的发生。重要的是,中风在永久性和突 发性心房纤颤中风险是相等的。已经重复地显示出,使用华法林抗凝 结的疗法在心房纤颤的情况下可以显著降低中风的第一次和进一步的 突然发作。因此,法华令的抗凝结作用对于几乎所有患有心房纤颤的患者来说是用于预防中风的标准疗法,不论它们是永久性的还是突发 性类型。唯一不强烈推荐使用华法林的患者是年龄小于65岁的被认为 是低风险的患者,即它们不具有器质性心脏病,包括没有高血压、没 有冠状动脉疾病、没有以前的中风或暂时性缺血性发作史、没有糖尿 病。该组患者对中风具有较低的风险,推荐使用阿司匹林进行中风预 防。
由于突发性心房纤颤的本质,它可能非常难以诊断。当患者由于 疾病相关的症状例如心悸、胸痛、呼吸短促、眩晕、心衰、暂时性缺 血性发作或甚至中风而寻求医学关注时,可能已经恢复到正常的心脏 节律,从而妨碍了心律不齐的诊断。在这些情况中,频繁实施心律监
控以诊断病症。心律通常被连续监测24到48小时。不幸的是,心房
纤颤的发作时无法预料的,使用这种方法经常会错过。诊断心律不齐、 建立推荐的疗法、以及可能防止使人衰弱的第一次或复发的中风的机 会,可能被错过,导致对病人的毁灭性结果。当对心房纤颤的怀疑非 常强时,有时可以获得并使用延长的和更复杂的心律监测测量。这些 测试是昂贵的,使用现有方法的诊断率通常较低,它们被零散地用于 这种指征。在这些情况下,使用遗传测试的其它风险分级作用可能是 极其有用的。了解所述个体携带有风险还是保护性遗传变体,对于诊 断和/或治疗决定的做出可能是无法估价的贡献。在某些情况下,这种 方式可以避免不必需的测试和治疗,在其它情况下,在更具攻击性的 诊断方法的帮助下,心律不齐可以被诊断,和/或可以开始适当的治疗, 从而消除了后来的疾病的并发症。
发明方法
在这里描述了对心律不齐(例如心房纤颤或心房扑动)和/或中风 进行风险评估的方法,这些方法包含在本发明中。本发明还包含了评 估个体对心律不齐(例如心房纤颤或心房扑动)和/或中风的治疗药剂 发生反应的可能性的方法,以及用于预测治疗药剂对治疗患者心律不 齐(例如心房纤颤或心房扑动)和/或中风的有效性的方法。本发明还
63包含了用于分析来自对象的样品、以检测对心律不齐(例如心房纤颤 或心房扑动)和/或中风的易感性的试剂盒。
本发明的诊断和筛选分析方法
在某些实施方案中,本发明涉及了通过检测在心律不齐(例如心 房纤颤或心房扑动)和/或中风对象、或对心律不齐(例如心房纤颤或 心房扑动)和/或中风易感的对象中出现得更频繁的遗传标记物的特定 等位基因,来诊断、或帮助诊断心律不齐(例如心房纤颤或心房扑动) 和/或中风或对心律不齐(例如心房纤颤或心房扑动)和/或中风易感性 的方法。在特定实施方案中,本发明是通过检测至少一个多态性标记 物(例如本文描述的标记物)的至少一个等位基因,来诊断对心律不 齐(例如心房纤颤或心房扑动)和/或中风的易感性的方法。通过本发 明描述的方法,特定标记物的特定等位基因或单倍型的检测,是对心 律不齐(例如心房纤颤或心房扑动)和/或中风易感性的指示。这样的 预后或预测分析也可用于在心律不齐(例如心房纤颤或心房扑动)和/ 或中风的症状发作之前,确定对象的预防性治疗。
在某些实施方案中,本发明涉及了诊断、例如由专业医务人员执 行的诊断的临床应用的方法,该方法可以包括评估或确定遗传风险变 体及其说明。在其它实施方案中,本发明涉及了由外行人或非专业医 务人员执行的风险评估(或诊断)的方法。基因分型技术中的最新技
术进展,包括SNP标记物的高通量基因分型、例如分子倒置探针阵列 技术(例如Affymetrix GeneChip)禾口 BeadArray技术(例如Illumina GoldenGate和Infmium分析),已经使个体对他们自己的基因组的大量 变体、或多达一百万个SNPs同时进行评估成为可能。得到的对个体可 用的基因型信息,可以与来自公开的科学文献的关于与各种SNPs有关 的疾病或性状风险的信息相比较。因此,本文描述的与疾病相关的等 位基因的诊断应用,可以由健康专业人员根据临床测试的结果来进行, 也可以由外行人或非专业医务人员,包括通过SNP基因分型为执行 SNPs的评估提供服务的个体,在个体SNP的基础上或通过大规模的高通量的方法、例如阵列技术来进行。换句话说,根据遗传风险对易感 性进行的诊断或评估,可以由健康专业人员、遗传顾问、基因分型服 务提供者或外行人,根据他/她的基因型的信息以及关于各种不同风险 因子的出版物,来做出。在本发明的上下文中,术语"诊断"和"诊 断易感性",意指任何可用的诊断方法,包括上面提到的诊断方法。
此外,在某些其它的实施方案中,本发明涉及通过检测在心律不 齐(例如心房纤颤或心房扑动)和/或中风患者中比在没有诊断出心律 不齐(例如心房纤颤或心房扑动)和/或中风的个体中或总人群中出现 频率低的特定遗传标记物等位基因或单倍型,来诊断或帮助诊断对心 律不齐(例如心房纤颤或心房扑动)禾卩/或中风的降低的易感性的方法。
正如本文所述和示例的,特定的标记物等位基因或单倍型(例如
在表5(表5A和5B)中列出的标记物和单倍型,以及与其连锁不平衡 的标记物,例如在表4和/或9中列出的标记物以及与其连锁不平衡的 标记物,例如表19中显示的标记物)与心律不齐(例如心房纤颤或心 房扑动)和/或中风有关。在一个实施方案中,标记物等位基因或单倍 型是赋予了对心律不齐(例如心房纤颤或心房扑动)和/或中风的显著 风险或易感性的标记物等位基因或单倍型。在另一个实施方案中,本 发明涉及了在人类个体中诊断对心律不齐(例如心房纤颤或心房扑动) 和/或中风的易感性的方法,方法包括在从个体获得的核酸样品中确定 至少一个多态性标记物的至少一个等位基因的存在或不存在,其中至 少一个多态性标记物选自表5A和表5B中列出的多态性标记物,以及 与其连锁不平衡的标记物。在另一个实施方案中,本发明涉及通过筛 选在表5A和5B中列出的至少一个标记物等位基因或单倍型、或与其 连锁不平衡的标记物,在人类个体中诊断心律不齐(例如心房纤颤或 心房扑动)和/或中风的易感性的方法。在另一个实施方案中,标记物 等位基因或单倍型在患有心律不齐(例如心房纤颤或心房扑动)和/或 中风或对心律不齐(例如心房纤颤或心房扑动)和/或中风易感的对象 (受影响的)中出现的频率,与它在健康的对象(对照,例如群体对照)中出现的频率相比,更高。在某些实施方案中,至少一个标记物 等位基因或单倍型的关联性的显著性的特征为p-值〈0.05。在其它实施 方案中,关联性的显著性的特征为p-值更小,例如<0.01、 <0.001、 <0.0001 、 <0.00001 、 <0.000001 、 <0.0000001 、 <0細00001 或 <0.000000001。
在这些实施方案中,至少一个标记物等位基因或单倍型的存在是 对心律不齐(例如心房纤颤或心房扑动)禾p/或中风的易感性的指示。 这些诊断方法包括检测与心律不齐(例如心房纤颤或心房扑动)和/或 中风有关的至少一个标记物等位基因或单倍型的存在或不存在。本文
描述的单倍型包括各种不同遗传标记物(例如SNPs、微卫星)的等位
基因的组合。构成特定单倍型的特定遗传标记物等位基因的检测,可 以通过本文描述的和/或本技术领域已知的各种不同方法来进行。例如, 遗传标记物可以在核酸水平上(例如通过直接的核苷酸测序或通过其 它本技术领域的专业人员已知的方法)检测,也可以在氨基酸水平上 检测,如果遗传标记物影响了由心律不齐(例如心房纤颤或心房扑动) 和/或中风相关核酸编码的蛋白的编码序列的话(例如,通过蛋白测序 或通过使用识别这样的蛋白的抗体的免疫分析)。本发明的标记物等 位基因或单倍型对应于与心律不齐(例如心房纤颤或心房扑动)和/或
中风有关的基因组DNA序列的片段。这样的片段含有所述的多态性标 记物或单倍型的DNA序列,但是也可以含有与标记物或单倍型强烈 LD(连锁不平衡)的DNA区段。在一个实施方案中,这样的区段含有 由 一值大于0.2和/或ID'l > 0.8所确定的与标记物或单倍型连锁不平衡 的区段。
在一个实施方案中,对心律不齐(例如心房纤颤或心房扑动)和/ 或中风的易感性的诊断可以使用杂交方法来实现,例如Southern分析、 Northern分析、和/或原位杂交(参见《分子生物学现代方法》(Current Protocols in Molecular Biology) , Ausubel, F.等主编, John Wiley & Sons,包括所有附录)。来自测试对象或个体的基因组DNA、 RNA或CDNA生物样品("测试样品")是从怀疑患有心律不齐(例如心房纤颤 或心房扑动)和/或中风、对心律不齐(例如心房纤颤或心房扑动)禾口/ 或中风易感或对心律不齐(例如心房纤颤或心房扑动)和/或中风有倾 向性的对象("测试对象")获得的。对象可以是成年人、儿童或胎儿。
测试样品可以来自于任何含有基因组DNA的来源,例如血液样品、羊
水样品、脑脊液样品、或来自皮肤、肌肉、口腔或结膜粘膜、胎盘、
胃肠道或其它器官的组织样品。来自胚胎细胞或组织的DNA测试样品 可以通过适当的方法获得,例如通过羊膜穿刺术或绒毛膜绒毛取样。 然后检测DNA、 RNA或cDNA样品。特定标记物等位基因的存在可以 通过特异性针对特定等位基因的核酸探针的序列特异性杂交来指示。 一种以上特定标记物等位基因或特定单倍型的存在,可以通过使用几 种序列特异性核酸探针来指示,每种探针特异性针对特定等位基因。 在一个实施方案中,单倍型可以通过特异性针对特定单倍型的(即与 含有单倍型特征性的特定标记物等位基因的DNA链特异性杂交的)单 一核酸探针来指示。序列特异性探针可以被导向以与基因组DNA、RNA 或cDNA杂交。本文使用的"核酸探针"可以是与互补序列杂交的DNA 探针或RNA探针。本技术领域的专业人员将了解如何设计这样的探针, 使得只有在测试样品的基因组序列中存在特定等位基因时,才发生序 列特异性杂交。
为了诊断对心律不齐(例如心房纤颤或心房扑动)禾P/或中风的易 感性,通过将含有与心房纤颤和/或中风相关的核酸的测试样品、例如 基因组DNA样品,与至少一种核酸探针相接触来形成杂交样品。用于 检测mRNA或基因组DNA的探针的非限制性例子是能够与本文描述 的mRNA或基因组DNA序列杂交的标记的核酸探针。核酸探针可以 是例如全长的核酸分子或其一部分,例如长度为至少15、 30、 50、 100、 250或500个核苷酸、在严紧条件下足以与适当的mRNA或基因组DNA 特异性杂交的寡核苷酸。核苷酸探针的长度可以多达IOOO个或以上的 核苷酸,包括多达500个核苷酸、400个核苷酸、300个核苷酸、200 个核苷酸或100个核苷酸。某些实施方案包含了长度为15到1000个核苷酸的核苷酸探针。其它的实施方案涉及长度为15到500个核苷酸、
或长度为15到400个核苷酸、或长度为20到400个核苷酸的核苷酸 探针的使用。本发明的核苷酸探针的其它大小范围也被考虑到了,正 如专业技术人员所熟知的。在一个实施方案中,核酸探针可以包含本 文描述的LD区块C04的核苷酸序列的全部或一部分,可选地含有本 文描述的标记物的至少一个等位基因,或本文描述的至少一个单倍型, 或者探针可以是与这样的序列互补的序列。在特定的实施方案中,核 酸探针是本文描述的SEQ ID NO: 50中显示的LD区块C04的核苷酸序 列的一部分,可选地含有本文描述的标记物的至少一个等位基因,或 一个多态性标记物的至少一个等位基因或包含本文描述的至少一个多 态性标记物的单倍型,或者探针可以是这样的序列的互补序列。其它 适合用于本发明的诊断分析的探针在本文中进行了描述。杂交可以通 过本技术领域的专业人员熟知的方法来进行(参见例如《分子生物学 现代方法》(Current Protocols in Molecular Biology) , Ausubel, F.等主 编,John Wiley & Sons,包括所有附录)。在一个实施方案中,杂交是 指特异性杂交,即没有错配的杂交(精确杂交)。在一个实施方案中, 特异性杂交的杂交条件是高度严紧的。
特异性杂交、如果存在的话,使用标准方法来检测。如果在核酸 探针与测试样品的核酸之间发生了特异性杂交,那么样品含有与核酸 探针中存在的核苷酸互补的等位基因。对于本发明的任何标记物、或 构成本发明的单倍型的标记物可以重复这个过程,或者可以同时使用 多个探针在同一时间检测一个以上的标记物等位基因。设计含有一个 以上特定单倍型的标记物等位基因的单个探针(例如探针含有与构成 特定单倍型的2、 3、 4、 5个或所有标记物互补的等位基因),也是可 能的。样品中单倍型的特定标记物的检测表明样品源具有特定单倍型 (例如单倍型),因此对心律不齐(例如心房纤颤或心房扑动)禾P/或中 风易感。
在另一种杂交方法中,Northern分析(参见《分子生物学现代方
68法》 (Current Protocols in Molecular Biology) , Ausubel, F.等主编,John Wiley & Sons,同上)被用于鉴定与心律不齐(例如心房纤颤或心房扑动) 和/或中风相关的多态性的存在。对于Northern分析来说,RNA测试样 品通过适合的方法从对象获得。如本文所述,核酸探针与来自对象的 RNA的特异性杂交表明了特定等位基因与探针互补。关于核酸探针的 使用的代表性的例子,参见例如美国专利Nos. 5,288,611和4,851,330。
此外或可选地,在本文描述的杂交方法中,可以在核酸探针以外 或代替核酸探针而使用肽核酸(PNA)探针。PNA是DNA模拟物,具 有类似肽的无机骨架例如N-(2-氨基乙基)甘氨酸单位,以及通过亚甲基 羰基键连接到甘氨酸的氮上的有机碱基(A、 G、 C、 T或U)(参见例 如Nielsen, P.等,S/oco")wg, C&m. 5:3-7 (1994)) 。 PNA探针可以被设 计成与怀疑含有一个或多个与心律不齐(例如心房纤颤或心房扑动) 和/或中风相关的标记物等位基因或单倍型的样品中的分子特异性杂 交。因此,PNA探针的杂交可用于诊断心律不齐(例如心房纤颤或心 房扑动)和/或中风或对心律不齐(例如心房纤颤或心房扑动)和/或中 风的易感性。
在本发明的一个实施方案中,收集从对象获得含有基因组DNA的 测试样品,并可以使用聚合酶链反应(PCR)扩增含有一个或多个本发 明的标记物或单倍型的片段。如本文所述,与心律不齐(例如心房纤 颤或心房扑动)和/或中风相关的特定标记物等位基因或单倍型的鉴定, 可以使用各种不同的方法来进行(例如序列分析、限制性消化分析、 特异性杂交、单链构象多态性分析(SSCP)、电泳分析等)。在另一个 实施方案中,诊断通过使用定量PCR (动力学热循环)进行表达分析 来实现。该技术可以使用例如商业化的技术,例如TaqMan (Applied Biosystems, Foster City, CA)。该技术可以评估由与心律不齐(例如心房 纤颤或心房扑动)和/或中风相关的核酸编码的多肽或剪接变体的表达 或组成中的变化的存在。此外,变体的表达可以作为物理上或功能上 的差异进行定量。在本发明的另一个方法中,通过限制性消化进行的分析可用于检 测特定的等位基因,如果等位基因导致相对于参比序列来说产生或消 除了限制性位点的话。可以进行限制性片段长度多态性(RFLP)分析,
例如按照《分子生物学现代方法》(Current Protocols in Molecular Biology,局匸上)中的描述来进行。相关DNA片段的消化图谱表明了样 品中特定等位基因的存在或不存在。
序列分析也可用于检测与心律不齐(例如心房纤颤或心房扑动) 和/或中风相关的特定等位基因或单倍型(例如表5 (表5A和5B)、表 9和/或表19的多态性标记物)。因此,在一个实施方案中,特定标记 物等位基因或单倍型的存在或不存在的确定,包括了从对象或个体获 得的DNA或RNA的测试样品的序列分析。可以使用PCR或其它适合 的方法扩增与心律不齐(例如心房纤颤或心房扑动)和/或中风相关的 核酸的一部分,然后可以通过对样品中基因组DNA的多态性位点(或 单倍型中的多个多态性位点)进行测序,来直接检测特定等位基因的 存在。
通过使用扩增的寡核苷酸与等位基因特异性寡核苷酸(ASO)探 针的斑点印迹杂交(参见例如Saiki, R.等,A^ w", 324:163-166 (1986)), 等位基因特异性寡核苷酸也可用于检测与心律不齐(例如心房纤颤或 心房扑动)和/或中风相关的核酸中特定等位基因的存在(例如表5 (表 5A和5B)、表9和/或表19的多态性标记物)。"等位基因特异性寡核 苷酸"(在本文中也称为"等位基因特异性寡核苷酸探针")是大约 10-500个碱基对、大约15-400个碱基对、大约15-200个碱基对、大约 15-100个碱基对、大约15-50个碱基对、或大约15-30个碱基对的寡核 苷酸,与心律不齐(例如心房纤颤或心房扑动)和/或中风相关的核酸 特异性杂交,并在多态性位点上含有特定等位基因(例如本文描述的 标记物或单倍型)。特异性针对一个或多个特定的与心律不齐(例如心 房纤颤或心房扑动)和/或中风相关的核酸的等位基因特异性寡核苷酸探针,可以使用标准的方法来制备(参见例如《分子生物学现代方法》,
(Current Protocols in Molecular Biology), /^J:)。可以使用PCR来扩 增所需区域。含有扩增的区域的DNA可以使用标准方法进行斑点印迹
(参见例如《分子生物学现代方法》,(Current Protocols in Molecular Biology),厨J:),并将印迹与寡核苷酸探针相接触。然后可以检测探 针与扩增区域的特异性杂交的存在。等位基因特异性寡核苷酸探针与 来自对象的DNA的特异性杂交,是与心律不齐(例如心房纤颤或心房 扑动)和/或中风相关的多态性位点上特定等位基因的指示(参见例如 Gibbs, R.等,iVwc/e/c^c/^si 仏,〃:2437-2448 (1989)和WO 93/22456)。
通过加入类似物例如锁核酸(LNAs),引物和探针的大小可以被 减小到8个碱基。LNAs是一类新的双环状DNA类似物,其中呋喃糖 环中的2'和4'位置通过O-亚甲基(氧-LNA)、 S-亚甲基(硫-LNA)或 氨基亚甲基(氨基-LNA)基团相连接。所有这些LNA变体的共同之处 是与互补核酸的亲和性,到目前为止在DNA类似物中是被报道的最高 的。例如特别是所有的氧-LNA九聚体当与互补的DNA或RNA复合时, 熔点温度(Tm)分别为64。C和74。C,相反,对应的DNA九聚体与DNA 和RNA的熔点温度均为28°C。当LNA单体与标准的DNA或RNA的 单体组合使用时,也可以获得Tm的显著增加。对于引物和探针来说, 取决于含有LNA单体的位置(例如在3'末端、5'末端、或在中间),Tm 可以得到相当大的提高。
在另一个实施方案中,与来自对象的靶核酸序列区段互补的寡核 苷酸探针的阵列,可用于在与心律不齐(例如心房纤颤或心房扑动) 和/或中风相关的核酸(例如表5A和5B的多态性标记物以及与其连锁 不平衡的标记物)中鉴定多态性。例如,可以使用寡核苷酸阵列。寡 核苷酸阵列典型地包含多个连接到基质表面上不同已知位置上的不同 的寡核苷酸探针。这些寡核苷酸阵列、也被称为"基因芯片" (Genechips ),在本技术领域中已经广泛描述过了 (参见例如美国专 利No. 5,143,854、 PCT专利公开Nos. WO 90/15070和92/10092)。 一般来说,这些阵列可以使用机械合成方法或组合了光蚀刻方法和固相 寡核苷酸合成方法的光指导的合成方法,或通过本技术领域的专业人
员已知的其它方法来生产(参见例如Fodor, S.等,S"'e"ce, Z5/:767-773 (1991); Pirrung等,美国专利No.5,143,854 (也参见已出版的PCT申 请No. WO 90/15070);和Fodor. S.等,已出版的PCT申请No. WO 92/10092和美国专利No. 5,424,186,每个文件的全部教导在此引为参 考)。使用机械合成方法合成这些阵列的技术描述在例如美国专利No. 5,384,261中,其全部教导在此引为参考。在另一个实施方案中,可以 使用线性阵列。关于使用寡核苷酸阵列检测多态性的其它描述可以在 例如美国专利Nos. 5,858,659和5,837,832中发现,这两个专利的全部 教导在此以其全文引为参考。
本技术领域的专业人员可以获得的其它核酸分析方法可用于检测 与心房纤颤和/或中风相关的多态性位点中的特定等位基因(例如表5 (表5A和5B)、表9和/或表19的多态性标记物)。代表性的方法包括 例如直接手动测序(Church和Gilbert,尸rac.胸/.爿c^/.园'W: 1991-1995 (1988); Sanger, F.等,iVoc.胸/.」cad "&4' 7¥:5463-5467
(1977) ; Beavis等,美国专利No. 5,288,644);自动化荧光测序;单链 构象多态性分析(SSCP);均一变性凝胶电泳(CDGE);变性梯度凝 胶电泳(DGGE) ( Sheffield, V.等,/Voc. A^". Jcad Sc/. S6:232-236 (1989));迁移率变动分析(Orita, M.等,Prac. Zc"d Sc/. 敝2766-2770 (1989));限制性酶分析(Flavell, R.等,Ce〃, 15:25-41
(1978) ; Geever, R.等;iVoc, A^/.爿cac/. Sc/, L^i 7&5081-5085 (1981)); 异源双链分析;化学错配裂解(CMC) (Cotton, R.等,尸亂淑"cad
园,S5:4397-4401 (1985)); RNase保护分析(Myers, R.等,5W眞e, 230:1242-1246 (1985));使用识别核苷酸错配的多肽例如大肠杆菌mutS 蛋白;以及等位基因特异性PCR。
在本发明的另一个实施方案中,对心律不齐(例如心房纤颤或心 房扑动)和/或中风或对心律不齐(例如心房纤颤或心房扑动)和/或中风的易感性的诊断,在本发明的遗传标记物或单倍型导致了多肽的组 成或表达发生改变的情况下,可以通过检査与心律不齐(例如心房纤 颤或心房扑动)和/或中风相关的核酸编码的多肽的表达和/或组成来进 行。因此,对心律不齐(例如心房纤颤或心房扑动)和/或中风易感性 的诊断,在本发明的遗传标记物或单倍型导致了多肽的组成或表达发 生改变的情况下,可以通过检测这些多肽中的一个、或与心律不齐(例 如心房纤颤或心房扑动)和/或中风相关的核酸编码的另一个多肽的表 达和/或组成来进行。本发明的显示出与心律不齐(例如心房纤颤或心 房扑动)和/或中风的关联性的单倍型和标记物,可能通过它们对这些 邻近基因中的一个或多个(例如尸/7X2基因)的影响来发挥作用。影
响这些基因的可能机制包括例如影响转录、影响RNA剪接、改变mRNA 可选剪接形式的相对量、影响RNA稳定性、影响从细胞核向细胞质的 运输、以及影响翻译的效率和精确性。
因此,在另一个实施方案中,本发明的显示出与心律不齐(例如 心房纤颤或心房扑动)和/或中风的相关性的变体(标记物或单倍型), 影响了邻近基因的表达。众所周知,影响基因表达的调控元件可以位 于与基因的启动子区域相距几十或几百kb的位置。因此,通过分析本 发明的至少一个多态性标记物的至少一个等位基因的存在或不存在, 评估这样的邻近基因的表达水平是可能的。因此设想,本发明的标记 物或单倍型的检测,可用于评估与心律不齐(例如心房纤颤或心房扑 动)和/或中风有关联的一个或多个基因的表达。
各种不同的方法可用于检测蛋白表达水平,包括酶联免疫吸附分 析(ELISA)、 Western印迹、免疫沉淀和免疫荧光。评估了来自对象的 测试样品中由与心律不齐(例如心房纤颤或心房扑动)和/或中风相关 的核酸编码的多肽在表达中的变化和/或组成中的变化的存在。由与心 律不齐(例如心房纤颤或心房扑动)和/或中风相关的核酸编码的多肽 在表达中的变化可以是例如定量的多肽表达(即产生的多肽的量)的 变化。由与心律不齐(例如心房纤颤或心房扑动)和/或中风相关的核酸编码的多肽的组成的变化是定性的多肽表达(例如突变体多肽的表 达或不同剪接变体的表达)的变化。在一个实施方案中,对心律不齐 (例如心房纤颤或心房扑动)和/或中风易感性的诊断,通过检测由与 心律不齐(例如心房纤颤或心房扑动)和/或中风相关的核酸编码的特
定剪接变体或剪接变体的特定图谱来进行。
也可以同时存在这两种变化(定量的和定性的)。本文中使用的多 肽表达或组成中的"变化",是指测试样品中多肽的表达或组成、与对 照样品中多肽的表达或组成相比的变化。对照样品是与测试样品相应 的样品(例如来自于同样类型的细胞),来自于没有感染心律不齐(例 如心房纤颤或心房扑动)和/或中风、和/或不具有对心律不齐(例如心 房纤颤或心房扑动)和/或中风易感性的对象。在一个实施方案中,对 照样品来自于不具有本文描述的标记物等位基因或单倍型的对象。同 样地,与对照样品相比,测试样品中一个或多个不同剪接变体的存在, 或测试样品中明显不同量的不同剪接变体的存在,可以表明对心律不 齐(例如心房纤颤或心房扑动)和/或中风的易感性。在等位基因相对 于对照样品中的参比改变了剪接位点的情况下,与对照样品相比,测 试样品中多肽的表达或组成的变化可以指示特定的等位基因。用于检 测核酸编码的多肽的表达和组成的各种不同的方法对于本技术领域的 专业人员来说是已知的,并且都可以使用,包括光谱法、比色法、电
泳、等电聚焦和免疫分析(例如David等,美国专利No. 4,376,110)例 如免疫印迹(参见例如《分子生物学现代方法》,(Current Protocols in Molecular Biology),特别是第10章,y^J:)。
例如,在一个实施方案中,可以使用能够与心律不齐(例如心房 纤颤或心房扑动)和/或中风相关的核酸编码的多肽结合的抗体(例如 具有可检测标记的抗体)。抗体可以是多克隆的,也可以是单克隆的。 可以使用完整的抗体,也可以使用其片段(例如Fv、Fab、Fab'、F(ab')2)。 对于探针或抗体来说,术语"标记的"意指包含了通过将可检测物质 连接(即物理连接)到探针或抗体上以对探针或抗体直接标记,以及
74通过与被直接标记的另一种试剂进行反应而对探针或抗体的间接标 记。间接标记的例子包括使用标记的第二抗体(例如荧光标记的第二 抗体)检测第一抗体,以及用生物素对DNA探针进行末端标记,以便 可以使用荧光标记的链亲和素来检测它。
在这种方法的一个实施方案中,将测试样品中与心律不齐(例如 心房纤颤或心房扑动)和/或中风相关的核酸编码的多肽的水平或量, 与对照样品中多肽的水平或量进行比较。测试样品中多肽的水平或量 高于或低于对照样品中多肽的水平或量,使得差异在统计学上显著, 表明了核酸编码的多肽的表达发生了变化,并且诊断了负责引起表达 差异的特定等位基因或单倍型。可选地,将测试样品中多肽的组成与 对照样品中多肽的组成进行比较。在另一个实施方案中,可以对测试 样品和对照样品中的多肽的水平或量以及组成二者都进行评估。
在另一个实施方案中,对心律不齐(例如心房纤颤或心房扑动) 和/或中风的易感性的诊断,通过检测至少一个本发明的标记物或单倍
型(例如与表5A和5B中列出的标记物以及与其连锁不平衡的标记物 相关的等位基因),以及与其它基于蛋白的、基于RNA的或基于DNA 的分析方法相结合来进行。本发明的方法也可以与对象的家族史和风 险因子(例如环境风险因子、生活方式风险因子)的分析组合起来使 用。
试微
用于本发明的方法和步骤的试剂盒包含可用于本文描述的任何方 法的组分,包括例如杂交探针,限制性酶(例如用于RFLP分析),等 位基因特异性寡核苷酸,与本文描述的本发明的核酸(例如含有至少 一个本发明的多态性标记物和/或单倍型的基因组区段)编码的改变的 多肽、或本文描述的本发明的核酸编码的未改变的(天然)多肽结合 的抗体,用于扩增与心律不齐(例如心房纤颤或心房扑动)和/或中风 有关的核酸的手段,用于分析与心律不齐(例如心房纤颤或心房扑动)和/或中风有关的核酸的核酸序列的手段,用于分析与心律不齐(例如 心房纤颤或心房扑动)和/或中风有关的核酸编码的多肽的氨基酸序列 的手段,等。试剂盒可以包含例如必需的缓冲液、用于扩增本发明的 核酸(例如本文描述的一个或多个多态性标记物)的核酸引物、以及 使用这些引物对扩增的片段进行等位基因特异性检测的试剂和必需的 酶(例如DNA聚合酶)。此外,试剂盒可以提供与本发明的方法组合 使用的分析方法的试剂,例如用于心律不齐(例如心房纤颤或心房扑 动)和/或中风的诊断分析方法的试剂。
在一个实施方案中,本发明是用于分析从对象获得的样品、以在 对象中检测心律不齐(例如心房纤颤或心房扑动)和/或中风的存在、 或对心律不齐(例如心房纤颤或心房扑动)和/或中风的易感性,其中 试剂盒含有在个体的基因组中选择性检测本发明的至少一个多态性的 至少一个等位基因所需的试剂。在特定的实施方案中,试剂含有与个 体的基因组中含有至少一个本发明的多态性的片段杂交的至少一个连 续的寡核苷酸。在另一个实施方案中,试剂含有至少一对与从对象获 得的基因组区段的相反链杂交的寡核苷酸,其中每个寡核苷酸引物对 被设计成选择性扩增个体的基因组中含有至少一个多态性的片段,其
中多态性选自表5A和5B中列出的多态性,以及与其连锁不平衡的多 态性标记物。在另一个实施方案中,片段的大小为至少20个碱基对。 这样的寡核苷酸或核酸(例如寡核苷酸引物)可以使用表明了心律不 齐(例如心房纤颤或心房扑动)和/或中风的多态性(例如SNPs或微 卫星)两侧的核酸序列的部分来设计。在另一个实施方案中,试剂盒 含有一个或多个标记的核酸,能够对与心律不齐(例如心房纤颤或心 房扑动)和/或中风有关的一个或多个特定多态性标记物或单倍型进行 等位基因特异性检测,以及用于检测标记的试剂。适合的标记包括例 如放射性同位素、荧光标记、酶标记、酶辅助因子标记、磁性标记、 自旋标记、表位标记。
在特定实施方案中,通过试剂盒的试剂检测的多态性标记物或单倍型包含一个或一个以上标记物、两个或两个以上标记物、三个或三 个以上标记物、四个或四个以上标记物或五个或五个以上标记物,标
记物选自表5A和5B中显示的标记物。在另一个实施方案中,被检测 的标记物或单倍型包含表5A和5B中显示的标记物。在另一个实施方 案中,被检测的标记物或单倍型包括表4和9中列出的标记物。在另 一个实施方案中,被检测的标记物或单倍型包括与含有表5A和5B中 列出的标记物的组中的至少一个标记物强烈连锁不平衡的标记物组中 的至少一个标记物,其中强烈连锁不平衡由1"2的值大于0.2所定义。在 另一个实施方案中,被检测的标记物或单倍型包括与含有表4和9中 列出的标记物的组中的至少一个标记物强烈连锁不平衡的标记物组中 的至少一个标记物,其中强烈连锁不平衡由一的值大于0.2所定义。在 另一个实施方案中,被检测的标记物或单倍型含有标记物rs2220427 (SEQ ID NO: 1)或标记物rsl033464 (SEQ ID NO:41),或与其连锁 不平衡的标记物。在另一个实施方案中,被检测的标记物或单倍型含 有表19中显示的至少一个标记物。在另一个实施方案中,被检测的标 记物或单倍型含有标记物D4S406 (SEQ IDNO:45)、 rs2634073 (SEQ IDNO:33)、 rs2200733 (SEQ ID NO:28)、 rs2220427 (SEQ ID NO: 1)、 rsl0033464 (SEQIDNO:41)和rsl3143308 (SEQ ID NO:51 ),以及与 其连锁不平衡的标记物。在另一个实施方案中,标记物或单倍型含有 标记物D4S406的等位基因-2、 -4和/或-8、标记物rs2634073的等位基 因A、标记物rs2200733的等位基因T、标记物rs2220427的等位基因 T、标记物rsl0033464的等位基因T、和/或标记物rsl3143308的等位 基因G。在一个这样的实施方案中,连锁不平衡由—的值大于0.1所定 义。在另一个这样的实施方案中,连锁不平衡由—的值大于0.2所定义。
在一个优选实施方案中,用于检测本发明的标记物的试剂盒含有 与含有被检测的SNP多态性的模板DNA区段杂交的检测寡核苷酸探 针,增强子寡核苷酸探针和内切核酸酶。正如前面解释的,检测寡核 苷酸探针在其3'末端含有荧光部分或基团,在其5'末端含有淬灭剂, 增强子寡核苷酸按照Kutyavin等(M/c/e/c34:el28 (2006))的描述使用。荧光部分可以是Gig Harbor绿或Yakima黄,或其它适合的 荧光基团。检测探针被设计成与含有被检测的SNP多态性的短核苷酸 序列杂交。优选情况下,SNP位于从末端残基到离检测探针的3'末端 -6个残基之间的任何位置。增强剂是在检测探针3'方向上与DNA模板 杂交的短的寡核苷酸探针。探针被设计成当两个探针都与模板结合时, 在检测探针和增强子核苷酸探针之间存在单个核苷酸缺口。缺口产生 了合成的脱碱基位点,可以被内切核酸酶例如内切核酸酶IV识别。酶 将染料从完全互补的检测探针上切下,但是不能裂解含有错配的检测 探针。因此,通过测量释放出的荧光部分的荧光,可以对由检测探针 的核苷酸序列定义的特定等位基因的存在进行评估。
检测探针可以具有任何适合的大小,尽管优选情况下探针相对较 短。在一个实施方案中,探针的长度为5-100个核苷酸。在另一个实施 方案中,探针长度为10-50个核苷酸,在另一个实施方案中,探针长度 为12-30个核苷酸。其它长度的探针也是可能的,并在本技术领域的专 业人员的普通技能的范围内。
在优选实施方案中,含有SNP多态性的DNA模板在检测前通过 聚合酶链反应(PCR)进行扩增,用于这种扩增的引物被包含在试剂盒 中。在这样的实施方案中,被扩增的DNA被用作检测探针和增强子探 针的模板。
在检测探针、增强子探针和/或用于通过PCR扩增模板的引物的某 些实施方案中,包括了使用修饰的碱基,包括修饰的A和修饰的G。 使用修饰的碱基可用于调整核苷酸分子(探针和/或引物)与模板DNA 的熔点温度,例如在含有低百分率G或C碱基的区域中增加熔点温度, 其中可以使用具有与其互补的T形成三个氢键的能力的修饰的A,或 者用于在含有高百分率G或C碱基的区域中降低熔点温度,例如使用 在双链DNA分子中与其互补的C碱基只能形成两个氢键的修饰的G 碱基。在优选实施方案中,修饰的碱基被用于设计检测核苷酸探针。
78在这些方法中可以选择任何专业技术人员已知的修饰碱基,根据本文 的教导对适合的碱基进行选择也在专业人员的能力范围内,已知的碱 基可以从专业人员已知的商业来源获得。
在一个这样的实施方案中,标记物或单倍型的存在是对心房纤颤 和/或中风的易感性(增加的易感性或降低的易感性)的指示。在另一 个实施方案中,标记物或单倍型的存在是对心房纤颤和/或中风治疗试 剂的反应的指示。在另一个实施方案中,标记物或单倍型的存在是对 心房纤颤和/或中风预后的指示。在另一个实施方案中,标记物或单倍 型的存在是对心房纤颤和/或中风治疗的进展的指示。这样的治疗可以 包括外科干预、药物治疗或通过其它手段(例如生活方式改变)。
治疗药剂
本发明的变体(例如本发明的标记物和/或单倍型,例如表5A和 5B和/或表19中列出的标记物)可用于鉴定新的心律不齐(例如心房 纤颤或心房扑动)和/或中风的治疗性靶。例如,含有与心律不齐(例 如心房纤颤或心房扑动)和/或中风相关的变体(标记物和/或单倍型) 的基因或与其连锁不平衡的基因或它们的产物,以及被这些变体基因 或它们的产物直接或间接调控或与它们相互作用的基因或它们的产 物,可以成为开发治疗性药剂的靶,以治疗心律不齐(例如心房纤颤 或心房扑动)和/或中风、或阻止或延迟与心律不齐(例如心房纤颤或 心房扑动)和/或中风有关的症状的出现。治疗性药剂可以含有一种或
多种例如小的非蛋白和非核酸分子、蛋白、肽、蛋白片段、核酸(DNA、 RNA)、 PNA (肽核酸),或它们的可以调节靶基因或它们的基因产物 的功能和/或水平的衍生物或模拟物。
本发明的核酸和/或变体、或含有它们的互补序列的核酸,可用作 反义构建物以控制细胞、组织或器官中的基因表达。与反义技术有关 的方法对于专业技术人员来说是众所周知的,被描述和综述在《反义 药物技术原理,策略与应用》(J"^e""Z>Mg 7fec/mo/ogy:/V/"c^/m, flfeg/es, 0""; /7//( 加.0叫Crooke主编,Marcel Dekker Inc., New York
(2001) )中。 一般来说,反义核酸分子被设计成与基因表达的mRNA 的区域互补,使得反义分子与mRNA杂交,从而阻断mRNA翻译成蛋 白。对于本技术领域的专业人员来说,已知有几类反义寡核苷酸,包 括裂解物和阻断物。前者与靶RNA位点结合,激活细胞内核酸酶(例 如RnaseH或Rnase L),其裂解耙RNA。阻断物与耙RNA结合,通过 对核糖体进行空间位阻来抑制蛋白的翻译。阻断物的例子包括核酸、 吗啉代化合物、锁核酸和甲基膦酸酯(Thompson, i>wgZXscoveo; 7bda_y, 7:912-917 (2002))。反义寡核苷酸可直接用作治疗性药剂,也可用于确 定和证实基因的功能,例如通过基因敲除或基因击落实验。反义技术 被进一步描述在Lavery等,Cwr, O/ /". i>wg D&cov. £>eve/. 6:561-569 (2003), Stephens等,Cwr. C^". Mo/. rAer. 5:118-122 (2003), Kurreck,
/■ S/oc/ 謹.270:1628-44 (2003), Dias等,Mo/. C騰er 7^ 1:347-55
(2002) , Chen, M"/zoA Mo/. 75:621-636 (2003), W肌g等,C群. Cawcer Z>wg 1:177-96 (2001)禾口 Bennett, ^w〃se"se jVwc/e/c」c/(/ Z>"g.Dev. 12:215-24 (2002)中。
本文描述的变体可用于选择和设计特异性针对特定变体的反义试 剂。使用关于本文描述的变体的信息,可以设计出特异性靶向含有本 发明的一个或多个变体的mRNA分子的反义寡核苷酸或其它反义分 子。通过这种方式,含有一个或多个本发明的变体(标记物和/或单倍 型)的mRNA分子的表达可以被抑制或阻断。在一个实施方案中,反 义分子被设计成与耙核酸的特定等位基因形式(即一个或几个变体(等 位基因和/或单倍型))特异性结合,从而抑制源自于该特定等位基因 或单倍型的产物的翻译,但是不与靶核酸分子在特定多态性位点上的 其它或可选的变体结合。
由于反义分子可用于失活mRNA以便抑制基因表达,从而抑制蛋 白表达,因此分子可用于治疗疾病或紊乱,例如心律不齐(例如心房 纤颤或心房扑动)和/或中风。方法可以包括用含有与mRNA中的一个或多个区域互补的核苷酸序列的核酶进行裂解,以减弱mRNA被翻译 的能力。这样的mRNA区域包括例如蛋白编码区,特别是对应于蛋白 的催化活性、底物和/或配体结合位点或其它功能性结构域的蛋白编码 区。
自从最初在线虫(C. e/ega似)中发现以来(Fire等,A^Zww 391:806-11 (1998)),在最近的十年中,对RNA干扰(RNAi)现象的 研究非常活跃,在近年中,也在积极推行它在治疗人类疾病中的潜在 应用(综述在Kim & Rossi, jVa&re i ev. 8:173-204 (2007)中)。
RNA干扰(RNAi),也被称为基因沉默,其基础是使用双链RNA分子
(dsRNA)关闭特定的基因。在细胞中,细胞质双链RNA分子(dsRNA) 被细胞复合物加工成小干扰RNA (siRNA)。 siRNA指导蛋白-RNA复 合物耙向耙mRNA上的特定位点,导致mRNA的裂解(Thompson, Z>wg Z)/"ove^7b^^, 7:912-917 (2002))。典型情况下,siRNA分子长度为大 约20、 21、 22或23个核苷酸。因此,本发明的一个方面涉及分离的 核酸分子,以及将那些分子用于RNA干扰,即作为小干扰RNA分子
(siRNA)。在一个实施方案中,分离的核酸分子的长度为18-26个核 苷酸,优选长度为19-25个核苷酸,更优选长度为20-24个核苷酸,更 优选长度为21、 22或23个核苷酸。
RNAi介导的基因沉默的另一个途径源自于内源性编码的原始微 型RNA (pri-miRNA)转录本,它在细胞中被加工以产生前体miRNA (pre-miRNA)。这些miRNA分子从细胞核输出到细胞质中,在这里 经历加工以产生成熟的miRNA分子(miRNA),它们通过识别mRNAs 的3'非翻译区中的耙位点,然后通过加工性P-体降解mRNA,来直接 抑制翻译(综述在Kim & Rossi,i ev. 8:173-204 (2007)中)。
RNAi的临床应用包括掺入合成的siRNA双链体,它们优选大小 为20-23个核苷酸,并优选具有2个核苷酸的3'重叠。基因表达的低是通过耙mRNA的序列特异性设计建立起来的。几个用于这种分子
的最适设计和合成的商业化位点对于本技术领域的专业人员来说是已 知的。
其它的应用提供了较长的siRNA分子(典型长度为25-30个核苷 酸,优选为大约27个核苷酸),以及小的发夹RNAs (shRNAs;典型 长度为大约29个核苷酸)。后者是天然表达的,描述在Amarzguioui 等579:5974-81 (2005))中。化学合成的siRNAs和shRNAs 是体内加工的底物,在某些情况下提供了比较短的设计更强有力的基 因沉默(Kim等,A^w"历o&c/mo/. 23:222-226 (2005); Siolas等,M^w" S/o/ec/mo/. 23:227-231 (2005))。 一般来说,siRNAs提供暂时的基因表 达沉默,因为它们的细胞内浓度被随后的细胞分裂稀释了。相反,表 达的shRNAs介导长期的、稳定的靶转录本的降低,只要shRNA的转 录发生就行(Marques等,7VWwre历Wec/7"o/. 23:559-565 (2006); Bmmmelkamp等,296: 550-553 (2002))。
因为RNAi分子、包括siRNA、 miRNA和shRNA、以序列依赖性 的方式起作用,因此本发明的变体(例如与LD区块C04相关的标记 物和单倍型,例如表5A和5B中列出的标记物)可用于设计RNAi试 剂,它们识别含有特定等位基因和/或单倍型(例如本发明的等位基因 和/或单倍型)的特定核酸分子,同时不识别含有其它等位基因或单倍 型的核酸分子。因此,这些RNAi试剂可以识别并破坏靶核酸分子。与 反义试剂相同,RNAi试剂可用作治疗性药剂(即用于关闭与疾病相关 的基因或与疾病相关的基因的变体),但是也可以用于对基因功能进 行表征和证实(例如通过基因敲除或基因击落实验)。
RNAi的递送可以通过本技术领域的专业人员已知的各种方法来 进行。使用非病毒递送的方法包括胆固醇、稳定的核酸-脂类颗粒 (SNALP)、重链抗体片段(Fab)、适体和纳米颗粒。病毒递送的方 法包括使用慢病毒、腺病毒和腺相关病毒。在某些实施方案中,siRNA分子被化学修饰以增加它们的稳定性。这可以包括在核糖的2'位置的
修饰,包括2'-0-甲基嘌呤和2'-氟代嘧啶,它们提供了对Rnase活性的 抗性。其它的化学修饰也是可能的,并为本技术领域的专业人员所知。
下面的参考文献为RNAi以及使用RNAi靶向特定基因的可能性提 供了进一步的概述Kim & Rossi, 7W^. i ev. 8:173-184 (2007),
Chen & Rajewsky,淑.Wev. 8: 93-103 (2007), Reynolds等,淑.
S/o化c/mo/. 22:326-330 (2004), Chi等,/Voc. 」cad 100:6343-6346 (2003), Vickers等,5/o/. C/zem. 278:7108-7118 (2003), Agami, C匿. C/zem. B/o/. 6:829-834 (2002), Lavery等,C脏 ZV"gD&cov. £)eve/. 6:561-569 (2003), Shi, 7>e"^y 19:9-12 (2003),
Shuey等,D,Z)/腳v. 7b勿7:1040-46 (2002), McManus等,淑.i ev. G匿A 3:737-747 (2002), Xia等,淑飾^c/mo/, 20:1006-10 (2002), Plasterk等,cwr. Ge"e/. Dev.10:562-7 (2000), Bosher等,A^A
Ce〃肠/. 2:E31-6 (2000)和Hunter, C群.飾/. 9:R440-442 (1999)。
导致发生疾病包括心律不齐(例如心房纤颤或心房扑动)和/或中 风的增加的倾向性或风险的遗传缺陷、或引起疾病的缺陷,可以通过 给带有缺陷的对象施用含有修复序列的核酸片段,在遗传缺陷的位点 处提供正常的/野生型核苷酸,来永久地校正。这样的位点特异性修复 序列可以包含被操作以促进对象的基因组DNA的内源修复的 RNA/DNA寡核苷酸。修复序列的施用可以通过适当的载体来进行,例 如与聚乙烯亚胺复合、包裹在阴离子脂质体中、病毒载体例如腺病毒 载体、或其它适合于促进施用的核酸的细胞内摄入的药物组合物。然 后可以克服遗传缺陷,因为嵌合的寡核苷酸诱导正常的序列整合到对 象的基因组中,导致正常的/野生型基因产物的表达。替换是可繁殖的, 因此提供了永久性的修复和与疾病或病症有关的症状的缓解。
本发明提供了鉴定可用于治疗心律不齐、例如心房纤颤或心房扑 动、和/或中风的化合物或药剂的方法。因此,本发明的变体可用作鉴
83定和/或开发治疗性药剂的靶。这样的方法可以包括分析药剂或化合物 调节含有至少一个本发明的变体(标记物和/或单倍型)的核酸或核酸 编码的产物的活性和/或表达的能力。这反过来可用于鉴定抑制或改变 编码的核酸产物的不需要的活性或表达的药剂或化合物。用于执行这 样的实验的分析方法可以在专业技术人员巳知的基于细胞的系统或无 细胞系统中进行。基于细胞的系统包括天然表达目标核酸分子的细胞, 或已经被遗传修饰以表达某些所需核酸分子的重组细胞。
在患者中变体的基因表达可以通过含有变体的核酸序列的表达 (例如含有本发明的至少一个变体的基因,它可以被转录成含有至少
一个变体的RNA,并进一步翻译成蛋白)、或通过由于变体影响了正常
转录本的表达水平或图谱、例如在基因的调节或控制区域中的变体而 导致的正常/野生型核酸序列的改变的表达,来进行评估。用于基因表
达的分析方法包括直接的核酸分析(mRNA)、表达的蛋白水平的分析、 或参与途径例如信号途径的并行化合物的分析。此外,对于信号途径 作出响应而被上调或下调的基因的表达,也可以被分析。 一个实施方 案包括了将报告基因例如荧光素酶与目标基因的调控区可操作连接。
在一个实施方案中,将细胞与候选化合物或药剂相接触,并测定 mRNA的表达,可以鉴定基因表达的调节剂。将存在候选化合物或药 剂的情况下mRNA的表达水平与不存在化合物或药剂的情况下的表达 水平进行比较。根据这种比较,用于治疗疾病例如心房纤颤、心房扑 动和中风的候选化合物或药剂可以被鉴定为调节变体基因的基因表达 的化合物或药剂。当在存在候选化合物或药剂的情况下与不存在它的 情况下相比,mRNA或编码的蛋白的表达统计学显著地增加时,候选 化合物或药剂被鉴定为核酸表达的刺激剂或上调物。当在存在候选化 合物或药剂的情况下与不存在它的情况下相比,核酸的表达或蛋白水 平统计学显著地降低时,候选化合物被鉴定为核酸表达的抑制剂或下 调物。本发明还提供了使用通过药物(化合物和/或药剂)筛选鉴定到的 化合物作为基因调节剂(即基因表达的刺激剂和/或抑制剂)来进行治 疗的方法。
本发明的另一方面,提供了药物包(试剂盒),药物包包含治疗性 药剂,以及一套本文公开的给人类施用治疗性药剂以诊断性测试本发 明的一种或多种变体的说明书。治疗性药剂可以是小分子药物、抗体、 肽、反义或RNAi分子,或其它治疗性分子。在一个实施方案中,被鉴 定为本发明的至少一种变体的携带者的个体被要求服用处方剂量的治 疗性药剂。在一个这样的实施方案中,被鉴定为本发明的至少一个变 体的纯合的携带者的个体被要求服用处方剂量的治疗性药剂。在另一 个实施方案中,被鉴定为本发明的至少一个变体的非携带者的个体被 要求服用处方剂量的治疗性药剂。
伊仿对潜^性药淑贿应游^虔丝效方法、盧M治^^遂展游方法
正如本技术领域已知的,个体对具体的疗法(例如治疗性药剂或 治疗方法)可能有不同的响应。药物基因组学致力于由于药物特性的 改变和/或药物作用的异常或变化,遗传变异(例如本发明的变体(标 记物和/或单倍型))是如何影响药物响应的问题。因此,响应差异的基 础可以部分通过遗传学方法来确定。由于遗传变异影响药物响应而产 生的临床结果,在某些个体中(例如本发明的遗传变体的携带者或非 携带者)可能导致药物的毒性或药物的治疗失败。因此,本发明的变 体可以确定治疗性药剂和/或方法作用于身体的方式,或者身体代谢治 疗性药剂的方式。
因此,在一个实施方案中,多态性位点上特定等位基因或单倍型 的存在是对特定治疗方式的不同、例如不同响应率的指示。这意味着 被诊断患有心律不齐(例如心房纤颤或心房扑动)和/或中风的患者, 以及携带有本发明的多态性的某些等位基因或单倍型(例如本发明的有风险和保护性等位基因和/或单倍型)的患者,将对特定的治疗、药 物和/或用于治疗疾病的其它疗法具有较好的、或较糟的响应。因此, 标记物等位基因或单倍型的存在或不存在,可以帮助确定对患者应该 使用什么疗法。例如,对于新诊断的患者来说,可以评估本发明的标 记物或单倍型的存在(例如如本文描述的通过测试源自于血液样品的 DNA)。如果患者对标记物等位基因或单倍型阳性(也就是说存在标记 物的至少一个特定等位基因或单倍型),那么医生可以推荐一种特定的 疗法,而如果患者对标记物的至少一个等位基因或单倍型阴性,那么 可以推荐不同的疗法过程(可以包括推荐进行除了连续监测疾病的进 展之外,不进行即时的疗法)。因此,患者的携带者状态可用于帮助确 定是否应该进行特定的治疗方式。价值在于能够在早期阶段诊断疾病、 以选择最适合的疗法的可能性,并给临床医生提供关于疾病的预后/攻 击性的信息,以便能够使用最适合的疗法。
心房纤颤和心房扑动的治疗一般针对两个主要目标(i)预防中 风和(ii)治疗症状。
W相層像
在心房纤颤中,抗血凝是用于预防中风的选择疗法,并被表明适 合于绝大多数患有这种心律不齐的患者。唯一不强烈推荐使用抗血凝 的患者是年龄小于65岁的被认为是低风险的患者,即它们不具有器质 性心脏病,没有高血压、没有以前的中风或暂时性缺血性发作史、没 有糖尿病。该组总体来说对中风具有较低的风险,推荐使用阿司匹林 进行中风预防。对于所有其它患者来说,不论心房纤颤是永久性的、 复发突发性的还是复发永久性的,都建议使用抗血凝疗法。不能归纳 出出现首次突发性心房纤颤的发作的患者应该被如何治疗,而是需要 根据每个患者的个人情况来决定。即使当感觉到患有心房纤颤的患者 在使用抗心律不齐疗法(控制节律)后维持了窦性心律时,也建议使 用抗血凝疗法,因为这种类型的抗心律不齐疗法不能影响中风的风险。^"逾/凝^/。正如上面详细描述的,在心房纤颤中,推荐使用抗血 凝来预防心源性脑栓塞和中风。研究得最广泛的口服抗血凝剂是华法 林,这种药物被普遍推荐用于心房纤颤中的长期口服抗血凝治疗。华 法林除了出血之外几乎没有副作用,但是在疗法过程中需要定期仔细 地监测血液值(以测量抗血凝的效果)。口服抗血凝剂显示出在患有心 房纤颤的患者中预防中风的前途,并且具有不需要象华法林那样定期
监测的优点。但是,已经发现ximdagatran引起了无法解释的肝损伤, 并在2006年从市场上撤回。几种药剂可用于静脉内和/或皮下疗法,包 括肝素和低分子量肝素(例如依诺肝素、达肝素、亭扎肝素、阿地肝 素、那屈肝素和瑞肝素)。当需要快速起始抗血凝作用,或者如果在高 风险患者中口服抗血凝疗法必需被中断、或者例如由于一系列步骤使 得在其它患者中口服抗血凝疗法长于一周时,推荐使用这些药物治疗。 其它的肠胃外抗血凝剂也是可用的,但是不特别推荐用在心房纤颤的 疗法中;例如因子Xa抑制剂磺达肝素和艾卓肝素、凝血酶抑制剂 lepimdin、比伐芦定和阿加曲班以及达那肝素。
"y #拔控^。用于控制心房纤颤的症状的医药和外科疗法按照 患者个体量身定做,包括使用药物进行心率和/或节律控制、射频切除 和/或外科手术。
/力心淳不一齐药激。 一般来说,抗心律不齐药剂被用于抑制心脏心 律不齐、包括心房纤颤和心房扑动特征性的心脏异常节律。抗心律不 齐药剂的一种分类方法是Vaughan Williams分类,其中定义了五种主要 的抗心律不齐药剂。I类药剂是快速钠通道阻断剂,并基于阻断的动力 学和强度以及他们对复极化的影响进行亚分类。Ia类型包括丙吡胺、 莫雷西嗪、普鲁卡因胺和奎尼丁。 Ib类型的药剂是利多卡因、美西律、 妥卡尼和苯妥英。Ic类型的药剂是恩卡胺、氟卡胺、普罗帕酮、阿马 灵、西苯唑啉和地他铵。n类型的药剂是(3阻断剂,它们阻断儿茶酚胺 对p-肾上腺素能受体的效应。(3阻断剂的例子是艾司洛尔、普萘洛尔、 美托洛尔、阿普洛尔、阿替洛尔、卡维地洛、比索洛尔、醋丁洛尔、纳多洛尔、心得静、拉贝洛尔、氧烯洛尔、喷布洛尔、噻吗洛尔、倍 他洛尔、卡替洛尔、索他洛尔和左旋布诺洛尔。III类型的药剂具有混 合的性质,但是总的来说是钾通道阻断剂,并延长复极化。该类型中 的药物是胺碘酮、阿齐利特、溴苄铵、多非利特、替地沙米、伊布利 特、司美利特、索他洛尔、N-乙酰普鲁卡因胺、盐酸尼非卡兰、维那 卡兰和氨巴利特。IV类型的药剂是钙通道阻断剂,包括维拉帕米、米 贝拉地尔和地尔硫卓。最后,V类型含有混杂的抗心律不齐药物,包 括地高辛和腺苷。
心率挖虔y。心率控制的维持的药理学测量包括P阻断剂、钙通道
阻断剂和地高辛。所有这些药物减缓了通过房室结的电传导,并减缓 了心室速率对快速心房纤颤的反应。某些主要用于节律控制的抗心律
不齐药物(参见下文)也减缓房室结传导速度,因此也减缓了心室的 心率反应。这些包括某些III类型的和Ic类型的药物,例如胺碘酮、索 他洛尔和氟卡胺。
心i 复律。从心房纤颤或心房扑动的心律复律到窦性心律,可以 使用同步直流电心脏复律来电学实现,或使用药物例如伊布利特、胺 碘酮、普鲁卡因胺、普罗帕酮和氟卡胺来完成。
心靴^
用于维持窦性心律、即心律控制的药物,主要包括来自III、 Ia和 Ic类型的抗心律不齐药物例子是来自III类型的索他洛尔、胺碘酮和多 非利特,来自Ia类型的丙吡胺、普鲁卡因胺和奎尼丁,以及来自Ic类 型的氟卡胺和普罗帕酮。使用这些抗心律不齐药物的治疗是复杂的, 可能是危险的,应该在特别训练过使用这些药物的医生的指导下进行。 许多抗心律不齐的药物具有严重的副作用,只应该在特定人群中使用。 例如,Ic类型的药物不应该用于患有冠状动脉疾病的患者,即使它们 可以抑制心房纤颤,它们实际上可以在心房扑动中促进快速心室反应。 Ia类型的药物在没有结构性心脏病的患者中应该用作最后的手段。索
88他洛尔(与大部分ni类型的抗心律不齐药物一样),可以导致QT间期
的显著延长、特别是在患有肾衰的患者中,并促进了严重的心室性心 律不齐。索他洛尔和多非利特以及Ia类型的药物都需要在住院患者的 基础上开始,以监测QT间期。尽管胺碘酮通常具有好的耐受性并被广
泛使用,但在长期疗法中,胺碘酮具有许多严重的副作用。
遗传#/试_勿/ ^以直接嚴贿洽#游选^
当个体出现第一次(被诊断的)突发性心房纤颤的发作,并且或
者自发转变成窦性心律、或者在发作后48小时内经历了电复律或化学 复律时,开始或者不开始抗血凝疗法的决定,根据所讨论患者的风险 情况和管理医生的偏好性而各不相同。这可能是难以作出的选择,因 为对患者进行抗血凝疗法对于患者的生活来说有巨大的影响。通常在 这样的情况下选择不进行抗血凝疗法,这可能对患者没有显著的结果。 另一方面,患者后来可能发生中风,对其进行预防的机会因此可能错 过了。在这样的情况下,了解到患者是风险变体的携带者可能是极其 重要的,支持了抗血凝疗法的开始。
在65岁以下被诊断患有心房纤颤并被认为具有低的中风风险、即 没有器质性心脏病、没有高血压、没有糖尿病并且以前没有中风史的 个体, 一般仅仅用阿司匹林治疗来预防中风,而不使用抗血凝疗法。 如果这样的患者被发现是本文描述的风险变体的携带者,这可以被认 为是支持了比推荐的更早开始抗血凝疗法。这将是合理的考虑,因为 从心房纤颤导致的中风的结果可能是毁灭性的。
缺血性中风根据被怀疑的病因一般被分类成5种亚类;大动脉动 脉粥样硬化、小动脉阻塞、心源性栓塞(大部分由于心房纤颤)、其它 已确定病因的中风和未确定病因(没有发现病因或存在一种以上似乎 合理的病因)的中风。重要的是,由于心源性栓塞引起的中风具有最 高的复发率,最容易使人丧失行动能力,并与最低的存活率相关。因 此,必须不能忽视作为中风的主要病因的心房纤颤,特别是因为治疗措施根据亚类而变化。因此,如果个体被诊断患有中风或暂时性缺血 性发作,并且尽管标准逐步建立,但合理的病因还没有被鉴定出来, 那么了解到患者是风险变体的携带者可能是极有价值的,并且支持了 或者开始进行抗血凝治疗,或者开始更具攻击性的诊断测试,以试图 诊断心房纤颤。
此外,本发明的标记物可用于增加临床试验的能力和有效性。因 此,是本发明的至少一个风险变体的携带者的个体、即是赋予发生心 律不齐(例如心房纤颤或心房扑动)和/或中风的增加的风险的至少一 个多态性标记物的至少一个等位基因的携带者的个体,可能更可能对 特定的治疗方式、例如上面描述的治疗方式做出响应。在一个实施方 案中,携带有特定的治疗(例如小分子药物)所靶向的途径和/或代谢 网络中的基因的风险变体的个体,更可能是治疗的响应者。在另一个 实施方案中,携带有其表达和/或功能被风险变体改变的基因的个体, 更可能是靶向该基因、其表达或其基因产物的治疗方式的响应者。本 应用可以提高临床试验的安全性,但是也可以增加临床试验证明出统 计学显著的效能的机会,否则这种效能仅限于群体的某些亚组。因此, 这种试验的一个可能的结果是,某些遗传变体例如本发明的标记物和 单倍型的携带者,统计学显著地可能显示出对治疗性药剂的阳性响应, 即当按照处方服用治疗性药剂或药物时,经历了与心律不齐(例如心 房纤颤或心房扑动)和/或中风有关的症状的缓解。
另一方面,本发明的标记物和单倍型可用于指导对特定个体的药 物试剂的选择。利用本发明的风险变体,可以实现治疗方式的个性化 选择、生活方式的改变或二者的组合。因此,关于本发明的特定标记 物的个体状态的信息,在靶基因或基因产物受到本发明的风险变体影 响的情况下,可用于选择治疗选项。变体的某些组合可能适合于治疗 选项的一种选择,而其它基因变体组合可以靶向其它治疗选项。根据 需要,这样的变体组合可以包括一种变体、两种变体、三种变体或四 种或四种以上的变体,以临床可靠的精确性确定治疗模式的选择。
90##"教沩^游/^賴
本发明还涉及本文描述的与心律不齐(例如心房纤颤和心房扑动) 和中风有关联的多态性标记物和单倍型的计算机执行的应用。这样的 应用可以用于储存、操作或分析在本发明的方法中有用的基因型数据。 一个例子涉及在可读介质上储存来自于个体的基因型信息,以便能够 给第三方(例如个体)提供基因型信息,或用于从基因型数据衍生信 息,例如通过将基因型数据与关于对心律不齐(例如心房纤颤和心房 扑动)和中风的增加的易感性有贡献的遗传风险因子的信息进行比较, 并在这些比较的基础上报告结果。
一种这样的情况涉及计算机可读介质。 一般来说,这样的介质有 能力储存(i)至少一个多态性标记物或单倍型的识别信息;(ii)在患
有心律不齐(例如心房纤颤和心房扑动)禾n/或中风的个体中该至少一
个标记物的至少一个等位基因的频率、或单倍型的频率的指示符;以 及在参比群体中该至少一个标记物的至少一个等位基因的频率、或单 倍型的频率的指示符。参比群体可以是无疾病的个体的群体。可选地, 参比群体是来自总群体的随机样品,因此充分地代表了群体。频率指 示符可以是计算出的频率、等位基因和/或单倍型拷贝的计数、或实际 频率的归一化的或操作过的值,它们适合用于特定的介质。
其它关于个体的信息也可以储存在介质上,例如血统信息、性别 信息、身体属性或特征(包括身高和体重)、生物化学测量值(例如血 压、血脂水平、空腹葡萄糖水平、胰岛素反应测量值)、生物标记物结 果、或其它希望与特定个体的基因型状态一起储存或操作的有用信息。
本发明还涉及适合用于测定或操作遗传数据的装置,这些遗传数 据可用于确定人类个体中对心律不齐(例如心房纤颤和心房扑动)和 中风的易感性。这样的装置可以包含计算机可读存储器,以及储存在 计算机可读存储器中的用于操作数据的例行程序,以及用于产生含有遗传数据的测量值的输出的例行程序。这样的测量值可以包括例如等 位基因或单倍型频率、基因型计数、性别、年龄、表现型信息的值,
比值比(OR)或相对风险(RR)、群体可归因风险(PAR)的值,或
其它作为原始基因型数据的直接统计数据或基于遗传数据的计算值的 有用信息。
上述的应用都可以使用本发明的标记物和单倍型来进行实践,这 些标记物和单倍型已经在评估对心律不齐(例如心房纤颤和心房扑动) 和中风的易感性的方法中进行了更详细的描述。因此, 一般来说,这
些应用可以被减少到使用表5、表4、表9和表19中列出的标记物、 以及与其连锁不平衡的标记物,来进行实施。在一个实施方案中,标 记物或单倍型出现在其序列显示在SEQ ID NO: 50中的基因组区段中。 在另一个实施方案中,标记物和单倍型包括选自表19所示的标记物的 至少一个标记物。在另一个实施方案中,标记物和单倍型包括至少一 个选自D4S406(SEQ ID NO:45 )、rs2634073( SEQ ID NO:33)、rs2200733 (SEQ IDNO:28)、 rs2220427 (SEQIDNO: 1)、 rsl0033464 (SEQID NO:41)禾B rsl3143308 (SEQIDNO:51)的至少一种标记物,任选地包 括与其连锁不平衡的标记物。在一个这样的实施方案中,连锁不平衡 由r2的数值大于0.1来定义。在另一个这样的实施方案中,连锁不平 衡由r2的数值大于0.2来定义。在另一个实施方案中,标记物或单倍 型含有选自标记物D4S406中的等位基因-2、 -4和/或-8、标记物 rs2634073的等位基因A、标记物rs2200733的等位基因T、标记物 rs2220427的等位基因T、标记物rsl0033464的等位基因T、和/或标记 物rsl3143308的等位基因G的至少一个等位基因。
拔虔浙猪
本文描述的核酸和多肽可用于上面描述的本发明的方法和试剂盒中。
本文使用的"分离"的核酸分子,是与正常情况下位于基因或核苷酸序列两侧(例如在基因组序列中)的核酸分开的,和/或已经从其 它转录的序列中(例如在RNA文库中)完全或部分纯化出的核酸分子。 例如,本发明的分离的核酸,相对于它自然发生的复杂的细胞环境、 或通过重组技术生产时的培养基、或化学合成时的化学前体或其它化 学物质来说,可以是基本上分离的。在某些情况下,分离的物质将形 成组合物(例如含有其它物质的粗提液)、缓冲系统或试剂混合物的 一部分。在其它情况下,物质可以被纯化到例如通过聚丙烯酰胺凝胶
电泳(PAGE)或柱层析(例如HPLC)测定时基本上均一。本发明的 分离的核酸分子可以占所有存在的大分子物质的至少大约50%、至少 大约80。/。或至少大约90%(摩尔数的基础上)。对于基因组DNA来说, 术语"分离的"也可以指从与基因组DNA天然关联的染色体分离出的 核酸分子。例如,分离的核酸分子可以含有少于大约250 kb、 200 kb、 150 kb、 100 kb、 75 kb、 50 kb、 25 kb、 10 kb、 5 kb、 4 kb、 3 kb、 2 kb、 1 kb、 0.5 kb或O.l kb的、在核酸分子所源自的细胞的基因组DNA中 位于核酸分子两侧的核苷酸。
核酸分子可以与其它编码或调节序列融合,并仍被当作是分离的。 因此,载体中包含的重组DNA包含在本文使用的"分离的"的定义内。 分离的核酸分子也包含异源宿主细胞或异源生物体中的重组DNA分 子,以及溶液中的部分纯化的或基本上纯化的DNA分子。"分离的" 核酸分子也包括本发明的DNA分子的体内和体外RNA转录本。分离 的核酸分子或核苷酸序列可以包括化学合成的或通过重组方法产生的 核酸分子或核苷酸序列。这样的分离的核苷酸序列可用于例如编码的 多肽的制造、作为探针用于分离同源序列(例如从其它哺乳动物物种)、 用于基因作图(例如通过与染色体原位杂交)、或用于检测组织(例 如人类组织)中基因的表达,例如通过Northern印迹分析或其它杂交 技术。
本发明还涉及了在高度严紧杂交条件下、例如用于选择性杂交的 条件下,与本文描述的核苷酸序列杂交的核酸分子(例如与含有本文描述的标记物或单倍型相关的多态性位点的核苷酸序列特异性杂交的 核酸分子)。在一个实施方案中,本发明包含了在在高度严紧杂交和清
洗条件(例如用于选择性杂交的条件)下,与含有LD区块C04 (SEQ ID NO: 50)的核苷酸序列的核苷酸序列杂交的变体。这样的核酸分子 可以通过等位基因特异性或序列特异性杂交(例如在高度严紧条件下) 来检测和/或分离。用于核酸杂交的严紧条件和方法对于专业技术人员 来说是众所周知的(参见例如《分子生物学现代方法》(a^7TW iVo/oco/s Mo/ecw/ar BZo/ogyJ, Ausubel, F.等,John Wiley & Sons, (1998),以及Kraus, M.和Aaronson, S., M"/w^五wzy/no/., 200:546-556 (1991),在此以其全文引为参考)。
两个核苷酸或氨基酸序列的百分同一性可以通过出于最适比较的 目的将序列进行比对(例如可以在第一个序列的序列中引入缺口)来 确定。然后比较相应位置上的核苷酸或氨基酸,两个序列之间的百分 同一性是序列共有的同样的位置的数量的函数(即%同一性=同一的 位置的数量/总的位置的数量x100)。在某些实施方案中,出于比较目 的进行比对的序列的长度是参比序列的长度的至少30%、至少40%、 至少50%、至少60%、至少70%、至少80%、至少90%或至少95%。 两个序列的实际比较可以通过众所周知的方法来进行,例如使用数学 算法。这样的数学算法的非限制性的例子描述在Karlin, S.和Altschul, S.,AAa" ^cac/. Sc/. 7&4,卯:5873-5877 (1993)中。这样的算法被整 合在NBLAST和XBLAST程序(2.0版)中,描述在Altschul, S.等, 7V"c/e〖c 25:3389-3402 (1997)中。在使用BLAST和带缺口
BLAST程序时,可以使用相应程序(例如NBLAST)的缺省参数。参 见万维网ncbi.nlm.nih.gov网点。在一个实施方案中,用于序列比较的 参数可以被设置为分值=100,字长=12,或可以是不同的(例如W=5 或W=20)。
其它的例子包括了 Myers和Miller, CABIOS (1989)的算法,在 Torellis, A.和Robotti, C., Com;n^ ^ / /. B/os"',川:3-5 (1994)中描述的ADVANCE和ADAM算法;以及在Pearson, W.和Lipman, D.,Wa". 」cfld t/&4, S5:2444-48 (1988)中描述的FASTA。在另一个实施方 案中,两个氨基酸序列之间的百分同一性可以使用GCG软件包 (Accelrys, Cambridge, UK)中的GAP程序来完成。
本发明还提供了分离的核酸分子,它们含有的片段或一部分在高 度严紧条件下,与含有或包含LD区块C04 (SEQIDNO:50)的核苷 酸序列、或含有或包含LD区块C04 (SEQIDNO:50)的核苷酸序列 的互补序列的核苷酸序列的核酸杂交,其中核苷酸序列含有本文描述 的标记物和单倍型中包含的至少一个多态性等位基因。本发明的核酸 片段的长度为至少大约15、至少大约18、 20、 23或25个核苷酸,可 以是30、 40、 50、 100、 200、 500、 1000、 10,000个或以上的核苷酸长。
本发明的核酸片段在例如本文描述的分析方法中被用作探针或引 物。"探针"或"引物"是以碱基特异性的方式与核酸分子的互补链杂 交的寡核苷酸。除了DNA和RNA之外,这样的探针和引物包括多肽 核酸(PNA),它描述在Nielsen, P.等,Sc/e"ce 2^:1497-1500 (1991)中。 探针或引物含有与核酸分子的至少大约15个、典型为大约20-25个、 在某些实施方案中大约40、 50或75个连续的核苷酸杂交的核苷酸序 列区域。在一个实施方案中,探针或引物含有本文描述的至少一个多 态性标记物的至少一个等位基因或至少一个单倍型,或其互补序列。 在特定实施方案中,探针或引物可以含有100个或以下的核苷酸;例 如,在某些实施方案中从6到50个核苷酸,或例如从12到30个核苷 酸。在其它实施方案中,探针或引物与连续的核苷酸序列或连续的核 苷酸序列的互补序列至少70%同一、至少80%同一、至少85%同一、 至少90%同一或至少95%同一。在另一个实施方案中,探针或引物能 够与连续的核苷酸序列或连续的核苷酸序列的互补序列选择性杂交。 通常情况下,探针或引物还含有标记,例如放射性同位素、荧光标记、 酶标记、酶辅助因子标记、磁性标记、自旋标记和表位标记。本发明的核酸分子、例如本文描述的那些,可以使用专业技术人 员熟知的标准分子生物学技术来鉴定和分离。可以将扩增的DNA标记
(例如放射性标记)并用作探针,筛选来自人类细胞的cDNA文库。 cDNA可以源自于mRNA并包含在适合的载体中。可以分离到相应的 克隆,在体内切除后可以获得DNA,然后可以通过本技术领域现有的 方法在任一或两个方向上对克隆的插入片段进行测序,以鉴定编码具 有适合分子量的多肽的正确的阅读框架。使用这些以及类似的方法, 可以对多肽和编码多肽的DNA进行分离、测序和进一步的表征。
一般来说,本发明的分离的核酸序列在Southern凝胶中可以用作 分子量标准品,并作为被标记的染色体标记物以对相关基因位置进行 作图。核酸序列也可用于与患者中的内源DNA序列进行比较,以鉴定 心律不齐(心房纤颤或心房扑动)和/或中风、或对心律不齐(心房纤 颤或心房扑动)禾P/或中风的易感性,以及例如作为探针用于杂交和发 现相关的DNA序列或从样品中扣除已知的序列(例如扣除杂交)。核 酸序列还可以用于产生引物用于遗传指纹法、使用免疫技术产生抗多 肽抗体、和/或作为抗原产生抗DNA抗体或引发免疫应答。
拔伴
还提供了特异性结合一种形式的基因产物但是不结合另一种形式 的基因产物的多克隆抗体和/或单克隆抗体。还提供了与含有多态性位 点或多个位点的变体或参比基因产物的一部分结合的抗体。本文使用 的术语"抗体"是指免疫球蛋白分子和免疫球蛋白的免疫活性部分, 即含有与抗原特异性结合的抗原结合位点的分子。与本发明的多肽特 异性结合的分子,是与该多肽或其片段结合、但是与样品、例如天然 含有多肽的生物学样品中的其它分子基本上不结合的分子。免疫球蛋 白分子的免疫活性部分的例子包括F(ab)和F(ab')2片段,可以通过用 酶例如胃蛋白酶处理抗体来产生。本发明提供了与本发明的多肽结合 的多克隆和单克隆抗体。本文使用的术语"单克隆抗体"或"单克隆 抗体组合物"是指一群抗体分子,只含有一种能够与本发明的多肽的
96特定表位发生免疫反应的抗原结合位点。因此,单克隆抗体组合物典 型地表现出对与其发生免疫反应的本发明的特定多肽的单一结合亲和 性。
多克隆抗体可以按照以前的描述通过用所需的免疫原例如本发明 的多肽或其片段免疫适当的对象来制备。可以通过标准的技术随时间 监测被免疫的对象中的抗体滴度,例如使用固定化的多肽的酶联免疫 吸附分析(ELISA)。如果需要,可以从哺乳动物(例如从血液)中分 离针对多肽的抗体分子,并通过众所周知的技术例如蛋白A层析进一
步纯化以获得IgG级份。在免疫后适当的时间,例如当抗体滴度最高
时,可以从对象获得生产抗体的细胞,用于通过标准技术制备单克隆
抗体,例如最初由Kohler和Milstein, A^w" 256:495-497 (1975)描述的 杂交瘤技术、人类B细胞杂交瘤技术(Kozbor等,/mmtmo/. 7bd">;4: 72 (1983)) 、 EBV杂交瘤技术(Cole等,《单克隆抗体与癌症疗法》
(Mowoc/(9"a/ ^W6o(i/ej1 Cawcer 77zera"y) , Alan R. Liss,1985, Inc., 卯.77-96)或trioma技术。用于生产杂交瘤的技术是众所周知的(一 般来说,参见《免疫学现代方法》(C"we"//VWoco/"w/mww"o/ogy ) (1994) Coligan等主编,John Wiley & Sons, Inc., New York, NY)。简 单来说,将永生的细胞系(典型为骨髓瘤)与用来自上述的免疫原免 疫的哺乳动物的淋巴细胞(典型为脾细胞)融合,并筛选获得的杂交 瘤细胞的培养上清液,以鉴定产生与本发明的多肽结合的单克隆抗体 的杂交瘤。
多种众所周知的用于融合淋巴细胞和永生细胞系的方案中的任何 一种都可用于产生针对本发明的多肽的单克隆抗体(参见例如《免疫 学现代方法》(Cwrewf尸raZoco/s /w扁wo/ogy^ , 同上;Galfre等, A^we 266:55052 (1977); R.H. Kenneth,《单克隆抗体生物学分析中 的新次兀》(Mo"oc/owa/ y4""6oWes.' j脸w D/wews/o" /" 勘a/戸W , Plenum Publishing Corp., New York, New York (1980); 以及 Lerner, Fa/e SZo/. MW. 54:387-402 (1981))。此外,普通技术人员将会认识到,这种方法的许多变化形式也将可以使用。
或者,为了制备分泌单克隆抗体的杂交瘤,可以通过用多肽筛选 重组组合免疫球蛋白文库(例如抗体噬菌体展示文库),从而分离与 多肽结合的免疫球蛋白文库成员,来鉴定和分离针对本发明的多肽的 单克隆抗体。用于产生和筛选噬菌体展示文库的试剂盒是可商购的(例
如Pharmacia的重组噬菌体抗体系统,目录号No. 27-9400-01;以及 StratageneSw^/ZAPTM噬菌体展示试剂盒,目录号No. 240612)。此外, 特别适合用于产生和筛选抗体展示文库的方法和试剂的例子可以在下 列文献中发现,例如美国专利No. 5,223,409,PCT
发明者丹尼尔·古德布雅尔特森, 安娜·海尔格多蒂尔 申请人:解码遗传学私营有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1