与多囊卵巢综合征相关的snp、包含snp的芯片及其应用的制作方法

文档序号:393386阅读:285来源:国知局
专利名称:与多囊卵巢综合征相关的snp、包含snp的芯片及其应用的制作方法
技术领域
本发明涉及与多囊卵巢综合征相关的SNP、包含SNP的芯片及其应用。
背景技术
多囊卵巢综合征是一种临床症状,表现为存在以下两种或多种特征长期的排卵过少或停止排卵、雄性激素过量和多囊卵巢^作为无排卵性不孕症的最主要原因,PCOS影响了 6-8%的育龄女性2_3。此外,PCOS与重要的内分泌代谢紊乱和广泛范围的不利后遗症(包括血脂障碍、动脉硬化症、胰岛素抗性和2型糖尿病4_6)有关。患有PCOS的女性中,大约50%存在胰岛素抗性7。在患有葡萄糖耐量降低(IGT)和糖尿病的女性中,大约20%承认在年轻时患有PCOS8,。 目前还没有完全弄清楚PCOS的发病机理。遗传倾向早已被认为是机理之一,但是在遗传因素和环境因素之间存在复杂的相互作用。已经对至少70种候选基因进行了关联性研究,这些基因主要涉及生殖激素、胰岛素抗性和慢性炎症,如卵泡刺激素受体(FSHR)、细胞色素P450家族IlA (CYP11A)、胰岛素受体(INSR)和白细胞介素6 (IL-6) n_15 ;但是,没有任何基因与PCOS相关联16。基于阵列的全基因组单核苷酸多态性(SNP)关联性分析可以替代地提供一种全面的、无偏差的方法以大范围地筛查患者、检测该疾病的易感基因。本文进行了一项全基因组病例-对照相关性研究以鉴定中国汉族人群中PCOS的遗传标记。

发明内容
发明人已经确定了中国汉族人群PCOS的三个易感基因座2pl6. 3、2p21和9q33. 3。在本次大规模GWA研究中,在额外的独立重复中进一步验证了与PCOS最显著相关的遗传变异体。在29种变异体中,28种在中国北部汉族人群PCOS个体中完全重复,20种在中国中部和南部汉族人群中重复。尽管中国北部和南部汉族人群之间存在遗传差异17,但是这些风险等位基因在中国PCOS女性中相当普遍。所有PCOS相关的变异体分别定位于以下三种基因之一 LHCGR(rsl3405728)、THADA (rs12468394)和 DENND1A (rsl0986105)。LHCGR 编码与促黄体激素(LH)和绒毛膜促性腺素(HCG)有关的G蛋白偶联受体。在卵巢中,LHCGR在排卵前卵泡的后期的粒层细胞中表达。重要地,在粒层细胞分化过程中的LHCGR的诱导使得排卵前卵泡对中期LH峰有响应,导致排卵和释放成熟卵母细胞22。在女性中,LHCGR的失活(或功能丧失)突变与增加的LH、扩大的卵巢、经量异常、对LH或HCG的抗性和不育有关23'24,尽管受影响的女性中的活性突变产生雄激素过多症,但对生殖异常没有其它影响25。THADA首先在由于染色体重组形成的甲状腺腺瘤中得以鉴定,所述基因重组导致THADA断裂并与过氧化物酶体增殖激活受体Y (PPARG)的一个内含子融合26。最近,在大型欧洲GWA研究中,THADA(rs7578597)被鉴定为T2D的易感基因27 ;但是,随后在中国患者28、芬兰患者29和印度患者3°的T2D研究中,该结果没有得到重复。在德国人中,THADA中rs7578597和T2D有一定的关联倾向(p=0. 055)31。在中国人中,THADA与T2D没有关系,但是在葡萄糖耐性测试中发现,THADA与2小时胰岛素水平有关系28。具有风险等位基因的PCOS患者具有更大的发展胰岛素抗性的可能性,因此应当监视他们的T2D。THADA的功能还没有充分表征,但是一些证据暗示它可能涉及死亡受体途径和细胞凋亡32。THADA在所有组织中广泛表达,特别是在淋巴细胞、自然杀伤细胞和单核细胞中高表达。这暗示了 THADA在免疫反应中的作用。在固有性和/或适应性免疫反应中,THADA可能作为引起系统性疾病如PCOS的炎症信号途径中的细胞因子参与反应。DENND1A,是另一个相关联的9q33. 3基因,编码DENN域(在正常和赘生性细胞中差异表达),所述DENN域可以与I型肿瘤坏死因子受体(TNFRl)杂交,作为死亡域-死亡域交互作用的负调控因子33。之前已经报导,血清TNFRl升高与肥胖的PCOS个体相关;但是,在相同的PCOS病例群体中,TNF- α没有同时增加34,表明在所述TNF系统中,其它细胞因子激活TNF受体或负调控因子丧失抑制功能。发明人推断,在具有成因性DENND1A风险等位基因的PCOS患者中,DENND1A不能正常抑制,导致升高的TNFRl进一步诱导细胞凋亡和激活炎症途径。总体上,THADA和DENND1A似乎都是通过慢性炎症发病机理在PCOS中起作用。最 近的研究已经显示,一些炎症介体,如C-反应性蛋白(CRP) ,TNF- α和纤溶酶原激活物抑制物-I (PAI-I)在PCOS女性中增加35’36。同样已知肥胖(在50-70%的PCOS中存在37)与慢性系统性炎症和增加的炎症细胞因子有关38。此外,已经证明了胰岛素抗性和炎症之间的相关性39。如所说明的,肥胖和胰岛素抗性是与PCOS最相关的两个特征。发明人推断,已经鉴定的易感基因,THADA和DENNDIA可能作为改变卵巢功能和导致PCOS的促炎细胞因子。将来自基因型2型糖尿病个体的数据(同时分析的)与本研究融合以确定发明人已鉴定的PCOS相关因素是否也与T2D相关。确实,在患有PCOS的女性中,胰岛素敏感性减少35%-40%,减少量在数量上与T2D中的减少量相似4°。但是,在中国汉族人群中的研究没有发现在T2D中的这些相关因素。因此,即使共有相同的特征,如肥胖、代谢异常、胰岛素抗性和心血管疾病的高风险性,PCOS和T2D被假定具有对于它们发病机理而言独立的易感因子。综上所述,该大型GWA研究显示,在中国汉族人群中,LHCGR、THADA和DENNDIA中的遗传变异体与多囊卵巢综合征密切相关,但是与2型糖尿病不相关。基于上面的描述,本发明提供具有SNP的THADA、LHCGR和DENNDIA基因,其中THADA 基因具有一个或多个来自 NCBI 数据库的 SNP :rsl 1891936 (A/G)、rsl7030684 (T/C)、rs4340576(G/A)、rsl2468394(A/C)、rs7567607(A/G)、rsl3429458(C/A)、rs7568365 (T/C)、rs7582497 (G/A)、rsl0176241 (G/A)、rs6744642 (T/C)、rsl2478601 (T/C)、rsl038822 (C/T)、rs7559891(A/G)、rsl873555(G/A)、rs7596052(A/G)、rsl0165527(A/G)、rs6726014(T/A)、rs2374551 (G/C)、rs6731009 (C/T)、rsl0179648 (A/G)和 rs7558302 (T/C) ;LHCGR 基因具有来自NCBI数据库的SNP rsl3405728 (G/A) ;DENND1A基因具有来自NCBI数据库的一个或多个 SNP rsl0818854 (A/G)、rs7857605 (C/T)、rs2479106 (G/A)、rsl778890 (C/T)、rsl627536(A/T)和 rsl0986105(C/A)。如在本文中所使用的,(M/N)表示SNP中的次要等位基因/主要等位基因。本发明进一步提供具有上述SNP的探针,用于筛选、预测或诊断PC0S,其中所述探针的核苷酸序列在表5中列出或为Seq ID. No. 1_56。本发明进一步提供包括一个或多个上述探针的芯片。
本发明进一步提供一种包括上述芯片的试剂盒,所述试剂盒用于筛选、预测或诊HtPCOS0本发明进一步提供一种筛选、预测或诊断PCOS的方法,其中,所述方法使用本文所述的芯片和/或试剂盒,其中,该方法主要包括以下步骤提取患者的外周血DNA并用所述PCOS芯片杂交;筛选并分析相关的SNP等位基因信息的结果以预测PCOS的风险。


图I :PC0S的全基因组相关性筛选。显示了用于SNP的负IogltlP,通过的 质量控制5X10_8 (上面的线)是全球显著水平,而10_6是本研究中使用的阈值。图2 2pl6. 3、2p21 和 9q33. 3 上的 PCOS 相关信号。基因座2ρ16·3(图2·Α)、2ρ21(图2.B)和9q33.3(图2.C)的详细情况示出了全基因组显著相关性。上面的部分示出了来自GWAS (圆形和三角形)和meta分析(方形)的单一标记物相关性统计(作为-IogltlP ;左边Y轴)。在HapMap中的每个域交叉的重组率以淡蓝色示出(右边I轴)。每个域的基因组内容在下面部分表示。
具体实施方式
个体通过多家医院的协作,本研究中的所有中国汉族样本获取于24家生殖和妇科诊所。第一阶段的样品(744个PCOS病例和895个对照)主要来自于中国北方的山东省;更多的重复样品(系列I和2)收集自贯穿中国大陆北部、中部和南部的21个省(3338个病例和5792个对照)17。额外收集了 204组PCOS家庭三人以进行传递不平衡检测。病例和对照的临床特征在表I中示出。为进一步说明中国汉族人群中PCOS相关因素是否与2型糖尿病相关,在由1326个2型糖尿病病例和1159个对照(包括772个女性病例和821个女性对照)组成的未公开的T2D GffAS中检查所有显著变异体。根据2003修订的关于与多囊卵巢综合征相关的诊断标准和长期健康风险的共识,即以下三种标准中的任何两种少排卵或停止排卵,雄激素过多症的临床和/或生物化学迹象以及多囊卵巢形态学对所有被定义为PCOS病例的受影响的个体进行诊断。排除了具有月经稀发或雄激素过多症的其它原因的患者。通过由内科医生做全面临床检查从病例中收集临床信息。通过结构调查问卷从病例和对照收集其它的人口统计学信息。所有参与者提供书面知情同意书。该研究得到各家医院的制度上的伦理委员会许可并根据赫尔辛基宣言原则操作。基因型分析使用昂飞全基因组人类SNP阵列6. O进行全基因组基因型分析。如下所述进行GffAS数据的质量控制过滤对照QC是O. 4或更大的阵列被遗弃,不进行进一步数据分析。使用鸟铒运算法则产生基因型数据。对于样品过滤,排除产生的基因型少于95%的基因座的阵列。对于SNP过滤(在样品过滤之后),移除在病例样本或对照样本中呼叫率〈95%的SNP。排除MAF (次要等位基因频率)<1%的SNP,或者在对照中明显偏离哈迪-温伯格平衡(HWE1P^ O. 001)的SNP。一共649,264个SNP通过质量标准并用于后续分析。
下面的标准用于选择SNP以进行确认判断来自GWAS的特别显著SNP (基于等位基因?值< 10-6)。具有模糊的基因型分散图块的那些从后续阶段中排除。统计分析为鉴定可能的人口分层,发明人使用PLINK软件包进行了多维标定(MDS)分析18。同时使用PLINK在单一标记物水平进行全基因组相关性分析以及在病例-对照样本中进行HWE分析。对于重复研究,使用SHEsis进行等位基因相关性分析19’2°。Haploview用于全基因组P值图(图I)21。使用R qq. plot函数产生Q-Q图。使用meta分析整合GWAS和重复数据。使用R ‘meta’包进行meta分析。使用Q-统计P-值评估三个阶段的不均一性。Mantel-Haenszel方法用于计算固定的效果评估。实施例I :全基因组相关性研究为鉴定中国汉族人群中的PCOS遗传易感性基因座,发明人进行了 GWA研究,在昂飞SNP6. O上对744个受影响个体(病例)和895个对照中的906,600个SNP进行基因型分 析。在QC过滤后,一共保留了 649,264个SNP并进行统计学分析。基因组膨胀因子(λ =I. 097)表明由于人群分层的GWAS结果造成非常轻微的膨胀,而MDS分析证明没有明显的人群基础。初始分析揭示3个不同的基因座(2ρ16. 3、2ρ21和9q33. 3,包括15个SNP)显示全基因组显著相关性(P〈5X10_8)。这些基因座中的最显著SNP是基因LHCGR(2pl6. 3)中的rsl3405728(等位基因P值=1. 29XlCT8 ;让步比,O. 61)、基因THADA(2p21)中的rsl2468394(等位基因 P 值=3. 99Χ1(Γ10 ;让步比,O. 60)和基因 DENNDIA(9q33. 3)中的rsl0986105(等位基因 P 值=9. 78X IiTici ;让步比,2. 08)(图 1、2)。实施例2 :重复研究为确认GWAS的发现,发明人对来自两个重复集的个体中的28个SNP (在GWAS中显示出最强相关性(p〈10_6)的那些)进行基因型分析(表2):系列I包括来自中国北部汉族的2840个PCOS病例和5012个对照的独立样本集;系列2包括来自中国中部汉族和南部汉族的其它498个PCOS病例和780个对照。在系列I重复中,29个SNP中的28个得以确认。在GWAS中发现的这些易感基因座中的所有被选择的SNP (基因LHCGR的I个SNP,基因THADA的21个SNP和基因DENND1A的6个SNP)均被确认,p值范围从I. 18X10-7至
5.55X 10_16。此外,20个SNP在系列2重复研究中呈阳性,最显著的SNP是基因LHCGR中的rsl3405728(p 值=7·93Χ1(Γ7)(表 2)。实施例3 :组合分析除了每个重复集的相关性测试外,发明人还使用mata分析对GWAS数据进行了组合分析。所述Mantel-Haenszel方法用于评估作为固定效果模型的所有分层的集中让步t匕。在结合GWAS和重复数据之后,在以下SNP处观察到最显著相关性rsl3429458(2p21,Pmeta = 1.73X10-23,让步比=0. 67,95%CI:0. 62-0. 72)、rsl3405728(2pl6. 3,Pnieta =
7.55 X 1(Γ21,让步比=0. 71,95%CI: O. 67-0. 77)和 rs2479106 (9q33. 3,Pmeta=8. 12 X 1(T19,让步比=1.34,95%(1:1.26-1.43)(表2,图2)。在这三个易感基因座中的所有选择的SNP显示出显著相关性(P值范围从2. 36X 10_13至I. 73X 10_23)。所述结合分析的结果强烈地支持基因LHCGR、THADA、DENND1A中的变异体与PCOS的易感性相关。实施例4:逻辑回归为降低年龄和身体质量指标(BMI)对结果的潜在影响,发明人使用年龄和BMI作为变量进行了疾病特性的逻辑回归分析。发明人使用模型YzbfbiXADD+hX年龄+b3.BMI+e以适应所述数据,其中Y表示显型(I表示疾病,O表示正常),ADD表示等位基因剂量(次要等位基因)的相加效果。所有初始相关的SNP在所述发现和重复I系列中仍然显著。在重复系列2中,由于样本数量少,调整后仍有3个SNP显著。但是,2pl6. 3、2p21和9q33. 3处的相关性没有被年龄和BMI的效果覆盖。实施例5 =PCOS家庭三人中的传递不平衡检测在204组家庭三人中,发明人对在PCOS GffAS中鉴定的全部28个SNP进行了传递不平衡检测(TDT)。尽管由于三人的数量少,发明人已经限定了统计效力,发明人仍然检测到6个显著的SNP (表3),全部位于发明人之前检测到的相同域内。这些结果进一步支持了发明人的显著发现。实施例6 :检测T2D中的PCOS相关因素为说明那些相关因素是否与T2D相关,发明人额外地研究了在中国汉族人群中收·集的未公开的T2D GffAS数据集(1326个2型糖尿病病例和1159个对照;772个女性病例·和821个女性对照)。但是,发明人在PCOS中鉴定的SNP都没有在T2D GWAS中显示出名义上的显著性(P=O. 05)。当发明人查看T2D GWAS数据中的女性样本时,仅9q33. 2的2个SNP (rsl778890、rsl0986105)显示边际显著性,其无法通过多个测试校正(表4)。明显地,2pl6. 3、2p21和9q33. 3与PCOS的相关性不应当是PCOS和T2D之间密切关系的副产物。实施例7 :通过SNP芯片预测PCOS使用微阵列打印机将SNP序列的等位基因特异寡核苷酸印刷在环氧包被的玻璃显微镜载片上。每个集一式两份印刷,以使得对于每一个SNP有四个主要和次要等位基因寡核苷酸点。在每一个载片上印刷12个这样的寡核苷酸块,以使得每一载片检测来自12个人的DNA。提取患者的外周血DNA并与PCOS芯片杂交。筛选并分析与SNP等位基因信息相关的结果以预测PCOS风险。表I :PC0S病例/对照个体的特征特征
权利要求
1.具有来自NCBI 数据库的一个或多个 SNP rsl 1891936 (A/G)、rsl7030684(T/C)、rs4340576(G/A)、rsl2468394(A/C)、rs7567607(A/G)、rsl3429458(C/A)、rs7568365 (T/C)、rs7582497(G/A)、rsl0176241(G/A)、rs6744642(T/C)、rsl2478601(T/C)、rsl038822(C/T)、rs7559891(A/G)、rsl873555(G/A)、rs7596052(A/G)、rsl0165527(A/G)、rs6726014(T/A)、rs2374551 (G/C)、rs6731009 (C/T)、rsl0179648 (A/G)和 rs7558302 (T/C)的 THADA 基因;具有来自NCBI数据库的SNP rsl3405728(G/A)的LHCGR基因;具有来自NCBI数据库的一个或多个 SNP rsl0818854 (A/G)、rs7857605 (C/T)、rs2479106 (G/A)、rsl778890 (C/T)、rsl627536(A/T)和 rsl0986105 (C/A)的 DENND1A 基因。
2.具有权利要求I的SNP、用于筛选、预测或诊断PCOS的探针,其特征在于,所述探针的核苷酸序列如Seq ID. No. 1-56所不。
3.包括一个或多个如权利要求2所述的探针的芯片。
4.权利要求3的芯片在筛选、预测或诊断PCOS中的应用。
5.包括权利要求3的芯片的试剂盒。
6.权利要求5的试剂盒在筛选、预测或诊断PCOS中的应用。
7.一种筛选、预测或诊断PCOS的方法,其特征在于,所述方法使用权利要求3的芯片或权利要求5的试剂盒。
8.根据权利要求7所述的方法,其特征在于,所述方法主要包括以下步骤提取患者的外周血DNA并用PCOS芯片杂交;筛选并分析相关的SNP等位基因信息的结果以预测PCOS的风险。
全文摘要
本发明提供了与多囊卵巢综合征(PCOS)相关的SNP,这些SNP在数以千计的中国PCOS病例中被发现。本发明还提供了具有所述SNP的探针和包括一个或多个这些探针的芯片。所述探针和芯片可以用于筛选、预测或诊断PCOS。
文档编号C12Q1/68GK102918158SQ201080067164
公开日2013年2月6日 申请日期2010年5月31日 优先权日2010年5月31日
发明者陈子江, 贺林, 师咏勇, 马金龙, 赵跃然, 赵涵, 石玉华, 耿玲, 游力 申请人:山东大学, 山东山大附属生殖医院有限公司, 上海交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1