一种多基因疾病遗传风险综合评估方法

文档序号:563950阅读:794来源:国知局

专利名称::一种多基因疾病遗传风险综合评估方法
技术领域
:本发明涉及一种多基因疾病遗传风险综合评估方法,可用于2个及2个以上遗传风险因素,每个遗传因素可包含2个及两个以上基因型的遗传风险综合评估方法,属于分子生物学
技术领域

背景技术
:随着人类基因组工程对人类全基因组测序的完成,科学家对人类基因的总数、功能以及多态性位点有了进一步的认识。目前发现的基因多态类型主要为DNA上的SNP(单核苷酸多态性)、碱基的插入缺失、小卫星片段的重复多态等。这些基因位点的多态性被认为可以用于疾病相关位点的初筛和疾病发生风险的评估。多基因病是由多个基因与环境因子共同作用所引起的遗传性疾病。多基因病包括的范围很广,遗传规律不服从孟德尔式遗传。多基因病包括两种情况由一个主基因和其他基因加上环境因子共同作用所引起;由相当多的微效基因共同参与加上环境因子引起。人类常见的重大疾病基本上都可以归纳到多基因病中,如严重危害人类健康的心脑血管疾病、糖尿病、癌症等均属于多基因病。近年来,利用先进的全基因组关联分析研究确定普通的遗传因素对健康和疾病的影响为个体多基因疾病的遗传风险的评估提供了大量可靠的科学依据。全基因组相关遗传信息结合临床以及其它显型数据为更好的理解基本生物学过程对人类健康的影响提供了可能;同时,推动了疾病发生的预报和疾病治疗手段的进步,并将在根本上实现真正的个性化医疗。另外,不同类型人类基因多态性的认识加深以及成熟的高通量、低成本基因分型技术和设备的飞速发展为研究基因多态性与健康和疾病的相关性做出了巨大贡献。越来越多的基因多态现象现在被确定与心脏疾病、乳腺癌、青光眼、多发性硬化、风湿性关节炎等多基因疾病有显著相关性。然而,这些研究成果被真正运用到个体多基因疾病遗传风险评估时却遇到两个问题一是基于群体的分子流行病学研究成果如何转化为个体评估结果;二是如何对个体携带的多个遗传风险因素进行综合评估并确定在人群中相应的风险等级。本发明将介绍一种可以解决以上两个问题的,把近年来大量的群体分子流行病学研究成果转化为个体多基因疾病遗传风险评估的方法。
发明内容本发明的目的是提供一种多基因疾病遗传风险综合评估方法。为实现以上目的,本发明的技术方案是提供一种多基因疾病遗传风险综合评估方法,其特征在于,其方法为-步骤l,进行特定多基因疾病在特定人群中遗传风险因素的筛选利用病例-对照关联分析方法,采用卡方检验或Fisher精确概率法,可信区间(]1取95%,显著性差异取p〈0.05,对与特定多基因疾病在特定人群中遗传风险因素的筛选;步骤2,确定各遗传风险因素对于特定多基因疾病的风险度采用大样本分子流行病学研究成果中的数据,利用网上SPSS统计学软件计算相对危险度OR,CI取95%,p)作为各风险因素的风险度;步骤3,确定各多态性基因型位点的基因型在特定人群众的频率利用NCBI、HapMap数据库资源,确定以上选定的遗传风险因素,相关多态性位点的基因型,在特定人群中的参考分布频率;其特征在于步骤四,建立评估模型,从遗传角度评估个体多基因疾病的风险等级;根据以上步骤,将筛选出的基因多态性位点,每个基因多态性位点所包含的基因型,以及每个基因型在特定人群中的频率以及针对该基因型疾病的风险度信息编制下表,总位点数N>=2,每个位点的亚型数M〉=2基因多态性位点基因型参考频率风险度(OR)位点1(a)亚型1亚型2亚型M位点2(b)亚型l亚型2亚型M位点N(c)亚型l风险度1风险度2风险度M风险度1风险度2风险度M风险度1频率1频率2M12频率M频率1亚型2频率2风险度2亚型M频率M风险度M基因多态性位点是通过步骤一确定的与某一多基因疾病有显著相关性的基因位点,挑选了N个位点,表中以位点l、位点2、位点N表示;基因型是这些位点在人群中出现的M种亚型,表中以亚型l、亚型2、亚型M代替;参考频率是根据步骤三确定的这些亚型在中国人群中各自所占的比例;风险度是根据步骤二确定的不同基因型对于该多基因疾病的相对风险度;每个位点分别有M种亚型,根据排列组合这N个位点把人群分为C种,这C种的理论频率用表中的频率相乘获得,即携带位点1亚型1+位点2亚型1+位点N亚型1,下表中以alblcl表示的单倍型,其估计频率则为位点1的参考频率*位点2的参考频率*……位点N的参考频率,将各位点作为独立的因素,携带不同位点不同亚型的总风险度采用相乘的方法,即携带位点1亚型1+位点2亚型1+位点N亚型1的总风险度为位点1的风险度*位点2的风险度*……位点N风险度,用这个计算方法,采用PHP2.0编制程序,运行在计算机中,将以上表格导入计算机,计算出一个C项的数组;然后将风险度乘积从大到小排列,合并风险度乘积相等数组的频率,再按照风险度乘积排列顺序将估计频率逐项累加,得出综合风险评估系数,最终得到的单倍型、风险度乘积与风险评估系数对应表。所述的特定多基因疾病为高血压、糖尿病、心脏病、肝炎、肝癌、胃癌、肺癌等。所述的特定人群为中国人、美国人、日本人和加拿大人等。本发明对一个个体经过三个基因多态性位点的检测,确定其属于某种单倍型如a3b2cl,根据上表,其对应的风险评估系数则为0.0931,意义为属于特定人群中,如中国人群,特定多基因疾病,如高血压遗传综合风险较高的9.31%的人群。由于该方法基于将各位点作为独立因素进行加权处理,其基本意义在于风险度乘积越大风险评估系数越小,综合评估风险越大;同时,在加权的同时利用频率作为一种校正或衡量因子,风险评估系数的理论范围在O-l之间,上述方法不考虑位点所在的基因、致病通路以及其权重关系,用上述方法计算评估得出的某个多基因疾病遗传高风险个体可表述为其自身引发该疾病遗传风险因素较多或结果确定性较强。另外,与特定多基因疾病相关的环境因素在流行病学研究数据充分的情况下,也可以作为独立因素利用上述方法与遗传因素一起进行综合风险评估。本发明的优点是全面客观、易操作。图l为计算程序流程图。具体实施例方式以下结合附图和实施例对本发明作进一歩说明。实施例1中国人群原发性高血压个体遗传风险评估1.根据中国人群中大规模的原发性高血压分子流行病学研究成果,筛选出以下3个基因多态性位点作为遗传风险因素。_<table>tableseeoriginaldocumentpage7</column></row><table>部分筛选依据沈丹、哈黛文《不同性别血管紧张素转化酶基因型与原发性高血压相关性研究》沈丹等人在中国武汉的116例原发性高血压对91例正常对照的研究中发现,ACE的I/D多态中DD基因型对男性的原发性高血压的发病和血压升高有显著的影响(P<0.05)。王成山等《血管紧张素II型受体基因多态性等多个因素与高血压左室重构的Logistic回归分析》王成山等为探讨血管紧张素II1型受体基因A1166C多态性与不同血清总胆固醇水平高血压病及其左心室重构的关系,测定148名高血压病患者和164名正常血压对照者的血压、身高、体重、空腹血糖、总胆固醇、甘油三酯浓度;测定高血压患者的左心室重量指数。结果发现,高血压组血管紧张素IIl型受体基因AC/CC基因型频率高于对照组(O.203比0.0104,P<0.05,OR为1.998,95。/。CI为1.0733.581),1166C等位基因频率显著高于对照组(0.Ill比0.055,P〈0.05)。谭建聪等《G蛋白P3亚单位基因C825T多态性与高血压发病的关系》谭建聪等对EH患者112例,对照组112例进行研究发现EH患者GNB3C825T基因型分布(基因型频率CC=0.34,CT=0.53,TT=0.13)与对照组有显著性差异(基因型频率CC:0.59,CT=0.36,TT=0.05X2=6.9,P〈0.05);825T等位基因携带者与CC纯合子比较有较高的患EH的危险(0R3.2,95%CI1.1_4.6)。2.确定以上各遗传风险因素对于原发性高血压的风险度根据大规模中国人群中的分子流行病学相关研究成果査阅,确定以上因素的风险度如下表所示<table>tableseeoriginaldocumentpage8</column></row><table>3.确定以上各遗传风险因素(基因型)在中国人群中的分布频率根据NCBI、H即map等数据库查询,确定以上各遗传风险因素(基因型)在中国人群中的分布参考频率如下<table>tableseeoriginaldocumentpage8</column></row><table>中国人群原发性高血压遗传易感性评估模型的建立以及个体运用将以上两表进行汇总,得到下表:<table>tableseeoriginaldocumentpage9</column></row><table>a3blc30.1853161.11518alb3cl0,2041080.890235a2b3cl0.2041080.890235a2b2cl0.2041080.890235alb2cl0.2041080.890235a2blc20.73320.59422a2blc30,73320.59422alblc20.73320.59422alblc30.73320.59422a3blcl0.7838920.228105a2blcl10.121545alblcl10.121545中国人群中的个体进行了以上三个位点的基因检测,确定了所属单倍型以后,可以根据上表,获得相应的风险评估系数。一个个体若经过了以上三个基因多态性位点的检测,确定其属于某种单倍型如a2b2c2,根据上表,其对应的风险评估系数则为0.0568,意义为属于中国人群中原发性高血压遗传综合风险较高的人群(遗传综合风险不高于5.68%的人群)。实施实例.2:中国人群老年性痴呆症个体遗传风险评估根据步骤一、二、三,挑选了4个多态性位点,其中3个位点为三种基因型,l个位点为六种基因型,确定各基因型频率和风险度后,形成下表。基因多态性位点基因型参考频率风险度(OR)10.250.5a20.500.530.252b10.930.33b20.063b30.013c10.810.45c20.180.45c30.012.210.770.25s20.10.25s30.1440.010.25s50.01460.018将上表导入将上表导入图1的计算程序中,可计算得出该疾病遗传风险系数评估对应表如下:<table>tableseeoriginaldocumentpage11</column></row><table>a2b3cle60.002961755.4a2b3c2e60.002961755.4a3b3c3el0.003115753.3a3b3c3e20.003115753.3a3b2c3e40.003115753.3a3b3c3e40.003115753.3a3b2c3e20.003115753.3a3b2c3el0.003115753,3a2blc3e60.00318552.904alblc3e60.00318552.904a2b3c2e50.008902752.7alb3cle30.008902752.7alb3cle50.008902752.7a2b2cle30.008902752.7a2b2cle50.008902752.7alb2cle50.008902752.7a2b2c2e30.008902752.7a2b2c2e50.008902752.7alb3c2e30.008902752.7alb3c2e50.008902752.7alb2cle30.008902752.7alb2c2e30.008902752,7a2b3cle30.008902752.7a2b3cle50.008902752.7alb2c2e50.008902752.7a2b3c2e30.008902752.7a3blc2e60.01120452.376a3blcle60.01120452.376alblc3e50.011971751.452alblc3e30.011971751.452a2blc3e30.011971751.452a2blc3e50.011971751.452a3blcle50.0372911.188a3blcle30.0372911.188a3blc2e30.0372911.188a3blc2e50,0372911.188a2b3c3e40.0377530.825alb2c3e20.0377530.825alb2c3el0.0377530.825alb3c3el0.0377530.825alb3c3e20.0377530.825<table>tableseeoriginaldocumentpage13</column></row><table><table>tableseeoriginaldocumentpage14</column></row><table>个体进行了以上四个位点的基因检测,确定了所属单倍型以后,可以根据上表,获得相应的风险评估系数。如其检测结果的单倍型为alblclel,根据上表,其对应的风险评估系数则为l,意义为属于中国人群中老年性痴呆症遗传综合风险最低的人群(综合风险不高于100%的人群)。实施例3:中国人群肺癌个体遗传风险评估根据步骤一、二、三,挑选了5个多态性位点,其中3个位点为三种基因型,2个位点为2种基因型,确定各基因型频率和风险度后,形成下表。<table>tableseeoriginaldocumentpage15</column></row><table>alb2c3e2fl0.0064075523.366a2b2c3e2fl0,0064075523.366alb3c3e2fl0.0064075523.366a2b3c3e2fl0.0064075523.366a3b3c3elfl0.0065578883.267a3b2c3elfl0,0065578883.267a3b3cle2fl0.0128330242.673a3b2c2e2fl0.0128330242.673a3b3c2e2fl0.0128330242.673a3b2cle2fl0.0128330242.673a2b3c3elf20.013177762.342175a2b2c3elf20.013177762.342175alb2c3elf20.013177762.342175alb3c3elf20.013177762.342175a3blc3e2fl0.0143303362.09088alb2cle2f20.0287198721.916325a2b3cle2f20.0287198721.916325a2b3c2e2f20.0287198721.916325alb3cle2f20.0287198721.916325a2b2cle2f20.0287198721.916325a2b2c2e2f20.0287198721.916325alb3c2e2f20.0287198721.916325alb2c2e2f20.0287198721.916325a3b2c2elf20.0340542081.8599625a3b3c2elf20.0340542081.8599625a3b3clelf20.0340542081.8599625a3b2clelf20.0340542081.8599625alblc3e2f20.0366971841.498992a2blc3e2f20.0366971841.498992a3blc3elf20.037676961.454904a3blc2e2f20.0785735361.190376a3blcle2f20.0785735361.190376a2b2c3elfl0.07904960.8415alb2c3elfl0.07904960.8415alb3c3elfl0.07904960.8415a2b3c3elfl0.07904960.8415a2b2c2e2fl0.0989208640.6885a2b3c2e2fl0.0989208640.6885alb3c2e2fl0.0989208640.6885alb2cle2fl0.0989208640.6885alb3cle2fl0.0989208640.6885a2b2cle2fl0.0989208640.6885alb2c2e2fl0.0989208640.6885a2b3cle2fl0.0989208640,6885a3b3c2elfl0.1062873280,66825a3b2c2elfl0.1062873280.66825a3b2clelfl0.1062873280.66825a3b3clelfl0.1062873280.66825alblc3e2fl0.1099371520.53856a2blc3e2fl0,1099371520.53856a3blc3elfl0.1112卯1760.52272a2b3clelf20.128182240.47908125alb2c2elf20.128182240.47908125alb3c2elf20.128182240.47908125a2b3c2elf20.128182240.47908125a2b2clelf20.128182240.47908125alb3clelf20.128182240.47908125alb2clelf20.128182240.47908125a2b2c2elf20.128182240.47908125a3blc2e2fl0.1846584640.42768a3blcle2fl0.1846584640.42768alblc3elf20.1877610880.374748a2blc3elf20.1877610880.374748a2blc2e2f20.3172669120.306612alblc2e2f20.3172669120.306612alblcle2f20.3172669120.306612a2blcle2f20.3172669120.306612a3blclelf20.3652759360.297594a3blc2elf20.3652759360.297594a2b2c2elfl0.3886030720.172125alb3c2elfl0.3886030720.172125a2b3clelfl0.3886030720.172125a2b2clelfl0.3886030720.172125alb2c2elfl0.3886030720.172125alb2clelfl0.3886030720,172125a2b3c2elfl0.3886030720,172125alb3clelfl0.3886030720.172125a2blc3elfl0.3928876480.13464alblc3elfl0.3928876480.13464a2blc2e2fl0.5717290240.11016alblcle2fl0.5717290240.11016a2blcle2fl0.5717290240.11016<table>tableseeoriginaldocumentpage18</column></row><table>个体进行了以上五个位点的基因检测,确定了所属单倍型以后,可以根据上表,获得相应的风险评估系数。如其检测结果的单倍型为a2blc2e2fl,根据上表,其对应的风险评估系数则为0.571729024,意义为属于中国人群中肺癌遗传综合风险中等的人群(综合风险不高于57.17%左右的人群)。权利要求1.一种多基因疾病遗传风险综合评估方法,其特征在于,其方法为步骤1,进行特定多基因疾病在特定人群中遗传风险因素的筛选利用病例-对照关联分析方法,采用卡方检验或Fisher精确概率法,可信区间CI取95%,显著性差异取p<0.05,对与特定多基因疾病在特定人群中遗传风险因素的筛选;步骤2,确定各遗传风险因素对于特定多基因疾病的风险度采用大样本分子流行病学研究成果中的数据,利用网上SPSS统计学软件计算相对危险度OR,CI取95%,p)作为各风险因素的风险度;步骤3,确定各多态性基因型位点的基因型在特定人群众的频率利用NCBI、HapMap数据库资源,确定以上选定的遗传风险因素,相关多态性位点的基因型在特定人群中的参考分布频率;其特征在于步骤四,建立评估模型,从遗传角度评估个体多基因疾病的风险等级;根据以上步骤,将筛选出的基因多态性位点,每个基因多态性位点所包含的基因型,以及每个基因型在特定人群中的频率以及针对该基因型疾病的风险度信息编制下表,总位点数N>=2,每个位点的亚型数M>=2<tablesid="tabl0001"num="0001"></tables>基因多态性位点是通过步骤一确定的与某一多基因疾病有显著相关性的基因位点,挑选了N个位点,表中以位点1、位点2、位点N表示;基因型是这些位点在人群中出现的M种亚型,表中以亚型1、亚型2、亚型M代替;参考频率是根据步骤三确定的这些亚型在中国人群中各自所占的比例;风险度是根据步骤二确定的不同基因型对于该多基因疾病的相对风险度;每个位点分别有M种亚型,根据排列组合这N个位点把人群分为CNM种,这CNM种的理论频率用表中的频率相乘获得,即携带位点1亚型1+位点2亚型1+位点N亚型1,下表中以a1b1c1表示的单倍型,其估计频率则为位点1的参考频率*位点2的参考频率*……位点N的参考频率,将各位点作为独立的因素,携带不同位点不同亚型的总风险度采用相乘的方法,即携带位点1亚型1+位点2亚型1+位点N亚型1的总风险度为位点1的风险度*位点2的风险度*……位点N风险度,用这个计算方法,采用PHP2.0编制程序,运行在计算机中,将以上表格导入计算机,计算出一个CNM项的数组;然后将风险度乘积从大到小排列,合并风险度乘积相等数组的频率,再按照风险度乘积排列顺序将估计频率逐项累加,得出综合风险评估系数,最终得到的单倍型、风险度乘积与风险评估系数对应表。2.根据权利要求1所述的一种多基因疾病遗传风险综合评估方法,其特征在于,所述的特定多基因疾病为肺病、糖尿病、心脏病、肝炎、肝癌、胃癌、肺癌等。3.根据权利要求1所述的一种多基因疾病遗传风险综合评估方法,其特征在于,所述的特定人群为中国人、高加索人、日本人和印度人等。全文摘要本发明涉及一种对个体进行多基因疾病遗传风险综合评估的方法,该方法包括以下步骤进行特定多基因疾病在特定人群中遗传风险因素的筛选;确定各风险因素对于特定多基因疾病的风险度;利用NCBI、HapMap数据库等资源确定各多态性基因型位点的基因型在特定人群众的频率;其特征在于,建立评估模型,从遗传角度评估个体多基因疾病的风险等级,本发明是一种全面客观、易操作、智能化的风险评估方法。文档编号C12Q1/68GK101302563SQ200810040319公开日2008年11月12日申请日期2008年7月8日优先权日2008年7月8日发明者傅咏南,校王,邵敏华申请人:上海中优医药高科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1