一组左眼柱镜数量性状相关的SNP标志物及其应用的制作方法

文档序号:30383994发布日期:2022-06-11 05:54阅读:132来源:国知局
一组左眼柱镜数量性状相关的SNP标志物及其应用的制作方法
一组左眼柱镜数量性状相关的snp标志物及其应用
技术领域
1.本发明属于生物医药领域,涉及一组左眼柱镜数量性状相关的snp标志物及其应用。


背景技术:

2.眼科疾病是指发生在眼部区域的疾病,常见眼科疾病有近视、散光、白内障、青光眼、中心浆液性视网膜病变、干眼症、交感性眼炎、夜盲症、弱视、沙眼、糖尿病视网膜病变、结膜炎、老花眼、色盲、视网膜色素变性、视网膜中央动脉阻塞、视网膜脱落、远视、针眼、雪盲症、霰粒肿、飞蚊症等。在调节放松的状态下,平行光线经眼球屈光系统后聚焦在视网膜之前,称为近视。
3.屈光度是指屈光不正状态下所产生的度数大小,当屈光度发生时,一般多代表近视、散光、远视或是弱视等临床表现,近视、远视通常为球镜(s),散光为柱镜(c),目前采用等效球镜度数(spherical equivalent refraction,se)评价屈光度,等效球镜度数=球镜度数+散光度数*1/2。屈光度≤-0.50d可作为近视诊断的循证共识阈值。更具体地,近视的定义是当调节放松时,眼睛的等效球镜屈光不正≤-0.5d的情况。高度近视的定义是当调节放松时,眼睛的等效球镜屈光不正≤-6.00d的情况。低度近视的定义是当调节放松时,眼睛的等效球镜屈光不正≤-0.5且》-6.00d的情况。
4.近视作为一种全球高发性疾病近年来受到国内外越来越多的关注,预计到2050年,近视将影响到全球近50%的人口,同时高度近视也将影响到全球近10%的人口。
5.同时,近视也是目前影响我国青少年人群视觉健康的主要眼病,其中高度近视是引起我国眼病患者眼盲和低视力的主要原因之一,将给患者及其家庭带来严重的经济负担。对于孩子视力问题,预防很重要,而早发现、早干预、早治疗,是防止近视度数加深的关键。少年儿童时期的眼病对视力发育危害极大,及早发现和诊断影响视力的非屈光不正性眼病非常重要,许多的眼病如果不能得到及时的发现和治疗,将造成眼睛的终生残疾。虽然通过药物、光学治疗和行为矫正可以部分减缓其加深速度,但我们距离能够逆转过去几十年的趋势还有很长的路要走。这使得近视及其相关并发症成为了研究的重中之重。高度近视的发生涉及多因素复杂过程,发病机制仍不清楚,当下的各种光学矫正手段以及手术治疗方法,如屈光手术和巩膜加固手术,不能从根本上阻止及延缓高度近视眼底病变的发展,可以说目前缺乏行之有效的高度近视的治疗措施。由此可见,寻找更有效的方法对高度近视患者和高危人群进行早期检测、风险预测和早期干预具有重要的临床意义。
6.单核苷酸多态性(single nucleotide polymorphisms,snp)是指在基因组水平上单个碱基的转换、颠换或由碱基的插入、缺失引起核苷酸变异导致的dna序列多态性,是人类可遗传的变异中最常见的一种,占所有已知多态性的80%以上,人群中变异频率高于1%,这也是区别于点突变的一个重要因素。在遗传学分析中,snps具有高频、稳定和易分析等特点。研究发现,snps与近视的发生发展具有较强的关联性。snps检测主要方法有时间飞行质谱(maldi-tofms)技术、荧光定量pcr技术、基因芯片技术、变形高效液相色谱等。
7.随着高通量snp检测技术方法的出现,作为数量最多且易于批量检测的多态标记,snp在连锁分析与基因定位,包括复杂疾病的基因定位、关联分析、个体和群体对环境致病因子与药物的研究中将发挥愈来愈重要的作用。随着技术的发展,snp检测费用也越来越经济,snp标志物将成为新一代分子标记。


技术实现要素:

8.本发明人经过广泛而深入的研究,首次开发了一种近视风险预测模型和装置。本发明采用多个相关snp联合利用人工智能方法构建风险预测模型。本发明可辅助临床进行近视的提前预测,早期诊断。在此基础上完成了本发明。
9.根据本发明的一个方面,本发明提供了一种用于诊断近视的生物标志物,所述生物标志物与左眼柱镜相关。
10.进一步,所述生物标志物包括以下任一组:
11.1)rs26173、rs26098、rs26107、rs26086、rs143580489、rs10484690、rs117984746;
12.2)rs2296474、rs2765015、rs3766165、rs145378993、rs13306137、rs147707514、rs112218972、rs3796381、rs26173、rs26098、rs26107、rs26086、rs987106、rs75126858、rs61734326、rs2278226、rs6928630、rs143580489、rs1204114、rs10484690、rs74699763、rs11574345、rs4925828、rs304494、rs304439、rs304448、rs4763975、rs377238277、rs144650014、rs12438118、rs41303763、rs9797618、rs10420552、rs4802029、rs28512414、rs1975937、rs2075284、rs3095726、rs34785154、rs60704260、rs6084431、rs147911723、rs41279352、rs2427624、rs117984746;
13.3)rs2296474、rs307377、rs2765015、rs3766165、rs145378993、rs61746709、rs114369626、rs4147830、rs540468026、rs80105432、rs45445497、rs13306137、rs191506876、rs147707514、rs4149520、rs4988956、rs4988957、rs10192036、rs10204137、rs4988958、rs10192157、rs10206753、rs3755276、rs112218972、rs3749022、rs76999397、rs35220123、rs80341144、rs3796381、rs117486807、rs147434354、rs76469954、rs26173、rs26098、rs26107、rs26086、rs987106、rs75126858、rs61734326、rs2278226、rs144289000、chr5-140568680、rs7701410、rs117600221、rs150856424、rs3188、rs6928630、rs143580489、rs1204114、rs10484690、rs775410128、rs13225910、rs61733329、rs189212243、rs74699763、rs11574345、rs8178175、rs10092164、rs11539113、rs68008113、rs7462883、rs66881636、rs61747644、rs2721167、rs2620644、rs2250891、rs2250657、rs2721176、rs4925828、rs117569740、rs142643091、rs140966742、rs3758464、rs16935560、rs144762118、rs7899453、rs3740252、rs304494、rs304439、rs304448、rs148238084、rs622082、rs546382、rs189385634、rs4763975、rs2232566、rs7132546、rs5742612、rs35767、rs2861550、rs377238277、rs144650014、rs35405829、rs11569599、rs10130914、rs140879339、rs12438118、rs182015467、rs41303763、rs142805492、rs8055740、rs75743672、rs75277269、rs76896732、rs2164449、rs2230601、rs9303742、rs79577494、rs9797618、rs10420552、rs4802029、rs28512414、rs1975937、rs958305、rs2075284、rs3095726、rs34785154、rs60704260、rs2034891、rs117753855、rs78472358、rs8099961、rs58634535、rs6084431、rs147911723、rs41279352、rs2427624、rs117984746、rs470101、
rs2267163;
14.4)rs6690013、rs609805、rs621668、rs2274264、rs2274263、rs2296474、rs10907179、rs307349、rs307355、rs35744813、rs307377、rs307371、rs2296471、rs2765015、rs34091023、rs1171、rs3766165、rs145378993、rs115226069、rs61746709、rs2274329、rs2274330、rs3765967、rs148750290、rs114369626、rs35533335、rs74622002、rs145619910、rs141216171、rs146227933、rs145717494、rs4147830、rs3215952、rs2229783、rs17127203、rs1676486、rs1763347、rs368345074、rs7556386、rs540468026、rs374309842、rs942963、rs77181873、rs80105432、rs33941127、rs45445497、rs12026637、rs144649977、rs78780269、rs3813972、rs60555365、rs335524、rs4149230、rs2292559、rs2292561、rs41310561、rs147519768、rs13306137、rs1800672、rs2296801、rs77082151、rs76255469、rs12135078、rs112212885、rs62121538、rs191506876、rs147707514、rs74867758、rs4665385、rs3792253、rs1126497、rs4149520、rs3771175、rs4988956、rs4988957、rs10192036、rs10204137、rs4988958、rs10192157、rs10206753、rs3755276、rs112218972、rs116177854、rs2123465、rs2116664、rs1469651、rs1469650、rs1053394、rs77698806、rs1434087、rs3749022、rs145346406、rs6734083、rs11676792、rs53576、rs76999397、rs2075310、rs35993975、rs33917318、rs17032276、rs17032278、rs17032283、rs35220123、rs9879080、rs7649243、rs34608006、rs6805869、rs9811771、rs2272125、rs2272124、rs7626117、rs7647987、rs6796538、rs35229877、rs11919713、rs1969154、rs1985428、rs3732675、rs80341144、rs181735010、rs3796381、rs76407344、rs11719458、rs2292661、rs79845192、rs74682201、rs77220512、rs35070271、rs79144888、rs76371354、rs78233713、rs117486807、rs147434354、rs6815254、rs3756247、rs1457976435、rs191674075、rs3749584、rs10517195、rs78205702、rs76469954、rs26173、rs26098、rs26107、rs26086、rs987106、rs62387135、rs79420400、rs75126858、rs61734326、rs2278226、rs2228112、rs42688、rs32210、rs6886922、rs118179072、rs144289000、chr5-140568680、rs182889312、rs7701410、rs117600221、rs142883877、rs150856424、rs3734391、rs140750807、rs138075877、rs2274347、rs3188、rs62622418、rs74609186、rs9396251、rs6928630、rs143580489、rs1204114、rs10484690、rs370140172、rs1048886、rs78873069、rs73333875、rs200555224、rs80190153、rs201920957、rs150559408、rs775410128、rs189382707、rs79848686、rs17171113、rs7791608、rs17173702、rs17173703、rs13225910、rs61733329、rs189212243、rs74699763、rs11550509、rs10866818、rs11574345、rs8178175、rs10092164、rs11539113、rs34596274、rs68008113、rs7462883、rs66881636、rs7812496、rs3739287、rs61747644、rs7840439、rs2721167、rs2620644、rs2250891、rs2250657、rs2721176、rs4925828、rs2721190、rs2721189、rs2721172、rs2281747、rs10961672、rs140349388、rs7023474、rs80235406、rs4879781、rs112858544、rs1164863576、rs6560142、rs879369、rs117569740、rs4838184、rs371047734、rs522328、rs515182、rs482712、rs199901947、rs12684476、rs7043416、rs113809617、rs7079747、rs142643091、rs74704054、rs140966742、rs3758464、rs16935560、rs144762118、rs7899453、rs3740252、rs2762528、rs304494、rs304439、rs304448、rs2254619、rs11017735、rs2298192、rs193087745、rs756924、rs2074022、
rs739502、rs12577654、rs148238084、rs111885243、rs57477011、rs2074233、rs2067477、rs77749149、rs145270731、rs622082、rs546382、rs189385634、rs2852365、rs1057992、rs642573、rs3018301、rs12272086、rs5103、rs5069、rs377232839、rs201872688、rs4763975、rs150028933、rs2232566、rs7132546、rs2304821、rs148804891、rs5742612、rs35767、rs10778292、rs11112201、rs10847164、rs117739120、rs185257411、rs145509540、rs2861550、rs2282407、rs377238277、rs144650014、rs35405829、rs145005726、rs45585336、rs186889719、rs11569599、rs11570779、rs76846944、rs698028、rs10130914、rs1808975、rs140879339、rs9919918、rs11853872、rs25397、rs3075142、rs12904657、rs12438118、rs7170185、rs17273206、rs3815003、rs2227933、rs74839044、rs34855511、rs577645079、rs76468382、rs117474153、rs367960426、rs182015467、rs41303763、rs187940556、rs13337155、rs138428580、rs1055708、rs62054627、rs1048149、rs62052673、rs142805492、rs8049480、rs758803114、rs8055740、rs138169571、rs7222126、rs11657498、rs200205820、rs4796407、rs2302763、rs138625739、rs201373267、rs2302160、rs34747500、rs56135703、rs28691051、rs200996148、rs75743672、rs729782、rs117696751、rs75277269、rs76896732、rs2164449、rs2230601、rs9303742、rs35114461、rs17223038、rs148965154、rs79577494、rs79579962、rs1054533、rs9797618、rs10420552、rs4802029、rs28512414、rs1975937、rs958305、rs2075284、rs3095726、rs34785154、rs60704260、rs112805435、rs188724242、rs2034891、rs117753855、rs112910446、rs8100225、rs1657535、rs78472358、rs8099961、rs142900000、rs8958、rs58634535、rs6084431、rs2280091、rs2280092、rs3746642、rs235768、rs235769、rs221984、rs2424943、rs2424944、rs73264111、rs41305787、rs45585744、rs2295096、rs2071971、rs117358971、rs112959405、rs1124178、rs3746619、rs3827103、rs35295928、rs150212573、rs147911723、rs41279352、rs2427624、rs139729932、rs117984746、rs2276254、rs141212516、rs7283989、rs11701124、rs8131313、rs35796750、rs143527452、rs45604134、rs1052756、rs1052773、rs2240111、rs165815、rs2073747、rs5762430、rs470101、rs2267163、rs5997714、rs117291362、rs11553143。
15.根据本发明的另一个方面,本发明提供了一种检测试剂,所述检测试剂是检测前面所述的生物标志物的基因型的试剂。
16.进一步,所述试剂包括扩增snp位点的试剂。
17.进一步,所述扩增snp位点的试剂包括扩增包括所述snp位点的多核苷酸的引物或特异结合的探针。
18.引物可以通过化学合成来制备,通过使用本领域技术人员知道的方法参考已知信息来适当地设计,并通过化学合成来制备。
19.探针可以通过化学合成来制备,通过使用本领域技术人员知道的方法参考已知信息来恰当设计,并通过化学合成来制备,或者可以通过从生物材料制备含有期望核酸序列的基因,并使用设计用于扩增期望核酸序列的引物扩增它来制备。
20.根据本发明的另一个方面,本发明提供了一种试剂盒,所述试剂盒包含前面所述的检测试剂。
21.进一步,所述试剂盒还可包括使用说明书或标签,其中,使用说明书或标签中记载使用试剂盒中的试剂的用途和用法。
22.进一步,本发明的试剂盒中还可包括用于提取核酸的试剂,用于pcr的试剂,用于染色或显色的试剂等。例如,这些试剂包括但不限于:抽提液、扩增液、杂交液、显色液、洗液等。
23.本发明所述的试剂盒可包含适于实用(如针对于不同的检测方法)的多种不同的试剂,并不限于目前所列举的试剂。
24.根据本发明的另一个方面,本发明提供了一种近视诊断模型的构建方法,所述构建方法包括:1)检测受试者样本中前面所述的生物标志物的基因型;2)利用数据挖掘方法对结果分析从而获得所述近视诊断模型。
25.本文所用“样本”是指包含来自或衍生自人类患者的核酸(特别是dna)的任何样品,例如来自患者的体液(血液、唾液、尿液等)、活体组织切片、组织和/或废物。因此,组织活体组织切片、粪便、痰液、唾液、血液、淋巴液等可以容易地筛选snp,基本上任何含有适当核酸的目标组织都可以如此。在一个实施方案中,样本是口腔上皮细胞。这些样本通常由患者在知情同意之后通过标准医学实验室方法获取。样品可以为从患者直接取得的形式,或者可以至少部分地加工(纯化)以除去至少一些非核酸材料。
26.进一步,所述数据挖掘方法包括线性回归、逻辑回归、神经网络分析、决策树、决策规则、规则拟合、支持向量机;优选地,所述数据挖掘方法是逻辑回归。
27.根据本发明的另一个方面,本发明提供了一种诊断系统,所述诊断系统包括诊断单元,所述诊断单元基于前面所述的构建方法获得的近视诊断模型对待评估对象进行近视情况的诊断。
28.进一步,所述诊断系统还包括数据收集单元:对待评估对象进行数据收集,所述数据包括snp数据。
29.进一步,所述诊断系统还包括模型创建单元:按照前面所述的构建方法创建近视诊断模型。
30.更进一步,所述诊断系统还包括模型优化单元:对所述近视诊断模型进行优化。
31.根据本发明的另一个方面,本发明提供了一种诊断装置,所述诊断装置包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时运行利用前面所述的构建方法获得的近视诊断模型。
32.根据本发明的另一个方面,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在装置执行前面所述的构建方法获得的近视诊断模型。
33.根据本发明的另一个方面,本发明提供了一种诊断近视的方法,所述方法包括:1)获得受试者样本中的前面所述的生物标志物信息;
34.2)利用前面所述的近视诊断模型,前面所述的诊断系统,前面所述的诊断装置对受试者的近视情况进行判断。
35.本发明的上述诊断近视的方法,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或
者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstate disk(ssd))等。
36.根据本发明的另一个方面,本发明提供了一种应用,所述应用包括以下任一项:
37.1)前面所述的生物标志物在制备诊断近视或预测左眼柱镜进展风险的产品中的应用;优选地,所述产品包括检测试剂、检测试剂盒;
38.2)前面所述的生物标志物在制备诊断近视或预测左眼柱镜进展风险的诊断模型中的应用;
39.3)利用前面所述的构建方法获得的近视诊断模型在制备诊断近视或预测左眼柱镜进展风险的产品中的应用;优选地,所述产品包括诊断系统或诊断装置。
40.本发明的单核苷酸多态性(single nucleotide polymorphism,snp)主要是指在基因组水平上由单个核苷酸的变异所引起的dna序列多态性。snp在人类基因组中广泛存在,平均每个碱基对中就有1个,估计其总数可达300万个甚至更多。snp是一种二态的标记,由单个碱基的转换或颠换所引起,也可由碱基的插入或缺失所致。snp既可能在基因序列内,也可能在基因以外的非编码序列上。
[0041]“生物标志物”是指当鉴定基因座或连锁基因座时用作参照点的核苷酸序列或其编码产物(例如,蛋白质)。标志物可以衍生自基因组核苷酸序列或来自表达的核苷酸序列(例如,来自rna、nrna、mrna、cdna等)或编码的多肽。该术语还指与标志物序列互补或侧接的核酸序列,例如用作能够扩增标志物序列的探针或引物对的核酸。检测标志物的“探针”是可用于鉴定标志物基因座的存在的核酸序列或分子,例如,与标志物基因座序列互补的核酸探针。当核酸在溶液中特异性杂交时,例如根据watson-crick碱基配对规则,核酸是“互补的”。可以通过本领域公认的方法检测与群体成员之间的遗传多态性相对应的标志物。这些包括例如基于pcr的序列特异性扩增方法、限制性片段长度多态性(rflp)检测、同功酶标志物检测、等位基因特异性杂交检测(ash)、单核苷酸扩增检测、基因组的扩增可变序列检测、自我维持序列复制的检测、简单序列重复检测(ssr)、单核苷酸多态性(snp)检测、扩增片段长度多态性(aflp)检测。
[0042]
在核酸扩增的背景下,术语“扩增”是产生所选核酸(或其转录形式)的额外拷贝的任何方法。典型的扩增方法包括各种基于聚合酶的复制方法,包括聚合酶链反应(pcr)、连接酶介导的方法例如连接酶链反应(lcr)和基于rna聚合酶的扩增(例如,通过转录)方法。
[0043]“基因型”是一个或多个遗传基因座处个体(或个体组)的遗传构成。基因型由个体的一个或多个已知基因座的等位基因定义,通常是从其亲本遗传的等位基因的编译。
[0044]
术语“等位基因”是指在特定基因座发生或编码的两个或更多个不同的核苷酸序列或由该基因座编码的两个或更多个不同多肽序列之一。例如,第一等位基因可以发生在一个染色体上,而第二等位基因发生在第二同源染色体上,例如发生在杂合个体的不同染色体上,或者在群体中不同的纯合或杂合个体之间。当等位基因与性状相关联时,并且当等
位基因的存在是性状或性状形式将在包含等位基因的个体中发生的指示时,等位基因与性状“正”相关。当等位基因与性状相关联时,并且等位基因的存在是性状或性状形式将不在包含等位基因的个体中发生的指示时,等位基因与性状“负”相关。
附图说明
[0045]
图1显示诊断效能图。
具体实施方式
[0046]
下面结合实施例对本发明做进一步的说明,以下所述,仅是对本发明的较佳实施例而已,并非对本发明做其他形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更为同等变化的等效实施例。凡是未脱离本发明方案内容,依据本发明的技术实质对以下实施例所做的任何简单修改或等同变化,均落在本发明的保护范围内。
[0047]
实施例1样本的收集、测序及数据分析
[0048]
样本的纳入标准:
[0049]
1)最差眼的等效球镜小于等于-6.00d;
[0050]
2)年龄6岁-18岁;
[0051]
3)无其他眼部疾病、先天性遗传病、其他全身性疾病和身体异常;
[0052]
4)没有眼部手术史;
[0053]
5)中国人;
[0054]
6)自愿参加且签署知情同意书。
[0055]
本发明是对2019年-2020年与温州医科大学附属眼视光医院与温州市政府合作开展的温州市全市中小学生近视筛查和干预项目的样本信息进行了整理,召集了符合上述纳入标准的10348(9852
‑‑
8961)样本进行全外显子组的测序,记录他们左眼柱镜(lcyl)。同时,对这10348例高度近视患者进行全外显子组测序,获取全外显子组的snp,通过全外显子组关联分析获取性状相关的snp。
[0056]
具体实验步骤如下:
[0057]
实施例以标准操作程序(sop)采集符合标准的口腔黏膜样本,系统收集并随访符合纳入标准的病人,使用illumina novaseq6000测序系统,对全外显子进行测序,检测全外显子范围的snp,挖掘与高度近视人群左眼柱镜(lcyl)相关的snp标志物及其组合,并构建预测左眼柱镜(lcyl)进展风险的模型。
[0058]
1、采集口腔黏膜拭子:样本采集前半小时停止进食和饮水,以保证样本不受污染。采集后的口腔黏膜拭子放入灭菌的1.5ml ep管中,填好送检登记表常温运输到公司交于专业人员进行口腔黏膜拭子基因组dna提取。
[0059]
2、dna提取:使用tianamp swab dna kit从口腔黏膜拭子当中提取得到基因组dna,具体步骤如下:
[0060]
(1)将口腔黏膜拭子转置于2ml离心管中,用剪刀将棉签部分从其杆上剪下,加入400μl缓冲液ga。
[0061]
(2)加入20μl proteinase k溶液,涡旋10秒混匀,56℃放置60分钟,其间每15分钟涡旋混匀数次。
[0062]
(3)加入400μl缓冲液gb,充分颠倒混匀,70℃放置10分钟。此时溶液应变清亮,简短离心以去除管盖内壁的液滴,然后挤压去除拭子,将尽可能多的裂解液转移至新的离心管中。
[0063]
(4)加入200μl无水乙醇,充分颠倒混匀,简短离心以去除管盖内壁的液滴
[0064]
(5)将上一步所得溶液和絮状沉淀都加入一个吸附柱cr2中(吸附柱cr2放入收集管中),12,000rpm(~13,400
×
g)离心30秒,倒掉收集管中的废液,将吸附柱cr2放回收集管中。
[0065]
(6)向吸附柱cr2中加入500μl缓冲液gb(使用前请先确认是否已加入无水乙醇),12,000rpm(~13,400
×
g)离心30秒,倒掉收集管中的废液,将吸附柱cr2放回收集管中。
[0066]
(7)向吸附柱cr2中加入700μl漂洗液pw(使用前请先确认是否已加入无水乙醇),12,000rpm(~13,400
×
g)离心30秒,倒掉收集管中的废液,将吸附柱cr2放回收集管中。
[0067]
(8)重复操作步骤7。
[0068]
(9)12,000rpm(~13,400
×
g)离心2分钟,倒掉废液,将吸附柱cr2室温放置数分钟,以彻底晾干吸附材料中残余的漂洗液。
[0069]
(10)将吸附柱cr2转入一个干净的离心管中,向吸附膜中间位置悬空滴加20-50μl洗脱缓冲液tb,室温放置2-5分钟,12,000rpm(~13,400
×
g)离心2分钟。
[0070]
(11)使用琼脂糖凝胶电泳和紫外分光光度计检测dna片段的浓度与纯度。dna在od260处有显著吸收峰,od260值为1相当于50μg/ml双链dna、40μg/ml单链dna。纯度(od 260/280)在1.7-1.9。单个样本通常可以得到0.5-3.5μg的dna。
[0071]
3、构建预文库:使用酶学方法将50ng基因组dna打断为200bp左右的小片段,之后进行末端修复和3’端加a操作,随后dna片段连接含barcode序列的测序接头,选择回收约320bp的片段,经过pcr扩增后获得预文库。
[0072]
4、液相杂交捕获操作:参照idt的xgen exome research panel v1.0(integrated dna technologies,san diego,usa)的标准流程,对预文库进行液相杂交捕获操作。
[0073]
5、获得外显子文库:捕获产物洗脱回收后,进行pcr扩增和纯化即获得外显子文库。文库用qpcr方法进行定量,并使用agilent 2100对条带大小做检测。
[0074]
6、illumina novaseq6000测序:使用illumina novaseq6000测序系统,对外显子文库进行150pe测序,原始图像使用casava v1.82软件进行碱基识别,生产原始测序数据。
[0075]
7、比对人类参考基因组:使用burrows-wheeler aligner(bwa)工具将测序片段比对到人类参考基因组(ucsc hg19),使用picard v1.57去除pcr重复序列。采用软件gatk进行变异检测,并对测序深度、覆盖深度及均一性等进行统计。
[0076]
8、数据质量控制
[0077]
对于样本:删除口腔拭子取样量不足,检出率小于90%,平均覆盖度小于10,平均基因型存在概率小于65%,基因型杂合率平均值偏离
±
4标准差(sd),染色体异常、性别异常,具有亲缘关系和非东亚人群的样本。对于snp:将未通过vqsr质量控制的全外显子组检测结果,基因型检出率小于90%,哈代温伯格p值小于1e-06,变异allele数目(ac)为0的snp。
[0078]
9、统计分析方法
[0079]
通过snptest中的贝叶斯检验(bayesian tests)开展高度近视全外显子组数量性
状研究,鉴定潜在的与高度近视临床状态显著相关的snp和基因。数量性状的bayesian tests是通过使用期望基因型(-method expected)的线性模型的共轭先验公式进行的。对于加性模型,公式为:
[0080]
yi=βgi+ei,ei~n(0,σ2)。
[0081]
其中yi是第i个个体的残差表型。残差表型是通过减去一个基线项和估计任何指定的协变量来计算的。gi为第i个个体的预期基因型的加性编码,野生纯合型=“0”,杂合型=“1”,突变纯合型=“2”。
[0082]
σ2是模型的误差方差。并且σ2~ig(a,β),β~n(m
β
,v
β
σ2),默认的a=3,β=2,m
β
=0,v
β
=0.02。将年龄和性别作为协变量进行校正。
[0083]
实验结果
[0084]
1、snps选择:
[0085]
利用snptest获取了8961个高度近视样本中共89095个常见变异与数量性状左眼柱镜(lcyl)的全基因组关联关系。
[0086]
通过4种阈值分别筛选snps进行建模:log10(bf)》3;log10(bf)》2;log10(bf)》1.5;log10(bf)》1。
[0087]
2、原始snps基因型谱获取:
[0088]
利用python提取vcf中对应所需snps,选择加性模型(未突变设置为0,突变一个等位为1,突变两个等位为2),获取原始的snp基因型谱。
[0089]
3、snps基因型谱补缺失:
[0090]
计算原始snps基因型谱中每个样本中snps的缺失数目,如果缺失》5%(n_缺失/n_allsamples),去除对应的样本。对于缺失情况《5%的样本,利用人工神经网络进行补缺失。
[0091]
人工神经网络共三层,包括输入层,隐藏层以及输出层:输入层节点数为len(label_data),也就是完全没有缺失的snp;隐藏层设置20个节点;输出层设置3个节点;设置学习率为0.003,训练迭代次数设置为20次。
[0092]
4、分类模型:logistic regression
[0093]
1)根据数量性状左眼柱镜(lcyl),取不同阈值,分别建立模型,并考察auc值,取auc最大的模型的阈值作为最终分类模型的阈值。
[0094]
规则如下:
[0095]

遍历左眼柱镜(lcyl)的所有值,分别作为阈值将样本分为两组;
[0096]

每组样本数量不得少于100。
[0097]
2)利用逻辑回归对样本进行分类,参数如下:
[0098]
logisticregression(c=100,class_weight='balanced',dual=false,fit_intercept=true,intercept_scaling=1,max_iter=10,multi_class='ovr',n_jobs=1,penalty='l1',random_state=0,solver='liblinear',tol=0.0001,verbose=0,warm_start=false)
[0099]
尽管它的名字是逻辑回归,但它是一种用于分类而不是回归的线性模型。
[0100]
逻辑回归默认情况下会应用正则化。这才机器学习中很常见,其一个优点就是提高了数值的稳定性,没有正则化相当于把c设置为非常高的值。
[0101]
作为一个优化问题,二进制类l2惩罚逻辑回归最小化以下成本函数:
[0102][0103]
相似的,l1正则化逻辑回归解决以下优化问题:
[0104][0105]
利用sklearn.model_selection函数,选择0到100中的10个随机数字作为随机种子,分别将样本划分为10组训练集和验证集,进行10倍交叉验证,取10次结果的平均数作为模型结果,以保证模型的客观性,各模型的cutoff值及其auc值如表1所示。诊断效能评价曲线见图1所示。
[0106]
表1各模型的cutoff值及其auc值
[0107][0108][0109]
以上表格中,所述model 1(logbf》3)所对应的snp组合为:
[0110]
rs26173、rs26098、rs26107、rs26086、rs143580489、rs10484690、rs117984746;
[0111]
以上表格中,所述model 2(logbf》2)所对应的snp组合为:
[0112]
rs2296474、rs2765015、rs3766165、rs145378993、rs13306137、rs147707514、rs112218972、rs3796381、rs26173、rs26098、rs26107、rs26086、rs987106、rs75126858、rs61734326、rs2278226、rs6928630、rs143580489、rs1204114、rs10484690、rs74699763、rs11574345、rs4925828、rs304494、rs304439、rs304448、rs4763975、rs377238277、rs144650014、rs12438118、rs41303763、rs9797618、rs10420552、rs4802029、rs28512414、
rs1975937、rs2075284、rs3095726、rs34785154、rs60704260、rs6084431、rs147911723、rs41279352、rs2427624、rs117984746;
[0113]
以上表格中,所述model 3(logbf》1.5)所对应的snp组合为:
[0114]
rs2296474、rs307377、rs2765015、rs3766165、rs145378993、rs61746709、rs114369626、rs4147830、rs540468026、rs80105432、rs45445497、rs13306137、rs191506876、rs147707514、rs4149520、rs4988956、rs4988957、rs10192036、rs10204137、rs4988958、rs10192157、rs10206753、rs3755276、rs112218972、rs3749022、rs76999397、rs35220123、rs80341144、rs3796381、rs117486807、rs147434354、rs76469954、rs26173、rs26098、rs26107、rs26086、rs987106、rs75126858、rs61734326、rs2278226、rs144289000、chr5-140568680、rs7701410、rs117600221、rs150856424、rs3188、rs6928630、rs143580489、rs1204114、rs10484690、rs775410128、rs13225910、rs61733329、rs189212243、rs74699763、rs11574345、rs8178175、rs10092164、rs11539113、rs68008113、rs7462883、rs66881636、rs61747644、rs2721167、rs2620644、rs2250891、rs2250657、rs2721176、rs4925828、rs117569740、rs142643091、rs140966742、rs3758464、rs16935560、rs144762118、rs7899453、rs3740252、rs304494、rs304439、rs304448、rs148238084、rs622082、rs546382、rs189385634、rs4763975、rs2232566、rs7132546、rs5742612、rs35767、rs2861550、rs377238277、rs144650014、rs35405829、rs11569599、rs10130914、rs140879339、rs12438118、rs182015467、rs41303763、rs142805492、rs8055740、rs75743672、rs75277269、rs76896732、rs2164449、rs2230601、rs9303742、rs79577494、rs9797618、rs10420552、rs4802029、rs28512414、rs1975937、rs958305、rs2075284、rs3095726、rs34785154、rs60704260、rs2034891、rs117753855、rs78472358、rs8099961、rs58634535、rs6084431、rs147911723、rs41279352、rs2427624、rs117984746、rs470101、rs2267163;
[0115]
以上表格中,所述model 4(logbf》1)所对应的snp组合为:
[0116]
rs6690013、rs609805、rs621668、rs2274264、rs2274263、rs2296474、rs10907179、rs307349、rs307355、rs35744813、rs307377、rs307371、rs2296471、rs2765015、rs34091023(同rs371194568)、rs1171、rs3766165、rs145378993、rs115226069、rs61746709、rs2274329、rs2274330、rs3765967、rs148750290、rs114369626、rs35533335、rs74622002、rs145619910、rs141216171、rs146227933、rs145717494、rs4147830、rs3215952、rs2229783、rs17127203、rs1676486、rs1763347、rs368345074、rs7556386、rs540468026、rs374309842、rs942963、rs77181873、rs80105432、rs33941127、rs45445497、rs12026637、rs144649977、rs78780269、rs3813972、rs60555365、rs335524、rs4149230、rs2292559、rs2292561、rs41310561、rs147519768、rs13306137、rs1800672、rs2296801、rs77082151、rs76255469、rs12135078、rs112212885、rs62121538、rs191506876、rs147707514、rs74867758、rs4665385、rs3792253、rs1126497、rs4149520、rs3771175、rs4988956、rs4988957、rs10192036、rs10204137、rs4988958、rs10192157、rs10206753、rs3755276、rs112218972、rs116177854、rs2123465、rs2116664、rs1469651、rs1469650、rs1053394、rs77698806、rs1434087、rs3749022、rs145346406、rs6734083、rs11676792、rs53576、rs76999397、rs2075310、rs35993975、rs33917318、rs17032276、rs17032278、rs17032283、
rs35220123、rs9879080、rs7649243、rs34608006、rs6805869、rs9811771、rs2272125、rs2272124、rs7626117、rs7647987、rs6796538、rs35229877、rs11919713、rs1969154、rs1985428、rs3732675、rs80341144、rs181735010、rs3796381、rs76407344、rs11719458、rs2292661、rs79845192、rs74682201、rs77220512、rs35070271、rs79144888、rs76371354、rs78233713、rs117486807、rs147434354、rs6815254、rs3756247、rs1457976435、rs191674075、rs3749584、rs10517195、rs78205702、rs76469954、rs26173、rs26098、rs26107、rs26086、rs987106、rs62387135、rs79420400、rs75126858、rs61734326、rs2278226、rs2228112、rs42688、rs32210、rs6886922、rs118179072、rs144289000、chr5-140568680、rs182889312、rs7701410、rs117600221、rs142883877、rs150856424、rs3734391、rs140750807、rs138075877、rs2274347、rs3188、rs62622418、rs74609186、rs9396251、rs6928630、rs143580489、rs1204114、rs10484690、rs370140172、rs1048886、rs78873069、rs73333875、rs200555224、rs80190153、rs201920957、rs150559408、rs775410128、rs189382707、rs79848686、rs17171113、rs7791608、rs17173702、rs17173703、rs13225910、rs61733329、rs189212243、rs74699763、rs11550509、rs10866818、rs11574345、rs8178175、rs10092164、rs11539113、rs34596274、rs68008113、rs7462883、rs66881636、rs7812496、rs3739287、rs61747644、rs7840439、rs2721167、rs2620644、rs2250891、rs2250657、rs2721176、rs4925828、rs2721190、rs2721189、rs2721172、rs2281747、rs10961672、rs140349388_rs3833713、rs7023474、rs80235406、rs4879781、rs112858544、rs1164863576、rs6560142、rs879369、rs117569740、rs4838184、rs371047734、rs522328、rs515182、rs482712、rs199901947、rs12684476、rs7043416、rs113809617、rs7079747、rs142643091、rs74704054、rs140966742、rs3758464、rs16935560、rs144762118、rs7899453、rs3740252、rs2762528、rs304494、rs304439、rs304448、rs2254619、rs11017735、rs2298192、rs193087745、rs756924、rs2074022、rs739502、rs12577654、rs148238084、rs111885243、rs57477011、rs2074233、rs2067477、rs77749149、rs145270731、rs622082、rs546382、rs189385634、rs2852365、rs1057992、rs642573、rs3018301、rs12272086、rs5103、rs5069、rs377232839、rs201872688、rs4763975、rs150028933、rs2232566、rs7132546、rs2304821、rs148804891、rs5742612、rs35767、rs10778292、rs11112201、rs10847164、rs117739120、rs185257411、rs145509540、rs2861550、rs2282407、rs377238277、rs144650014、rs35405829、rs145005726、rs45585336、rs186889719、rs11569599、rs11570779、rs76846944、rs698028、rs10130914、rs1808975、rs140879339、rs9919918、rs11853872、rs25397、rs3075142_rs397774483、rs12904657、rs12438118、rs7170185、rs17273206、rs3815003、rs2227933、rs74839044、rs34855511、rs577645079、rs76468382、rs117474153、rs367960426、rs182015467、rs41303763、rs187940556、rs13337155、rs138428580、rs1055708、rs62054627、rs1048149、rs62052673、rs142805492、rs8049480、rs758803114、rs8055740、rs138169571、rs7222126、rs11657498、rs200205820、rs4796407、rs2302763、rs138625739、rs201373267、rs2302160、rs34747500、rs56135703、rs28691051、rs200996148、rs75743672、rs729782、rs117696751、rs75277269、rs76896732、rs2164449、rs2230601、rs9303742、rs35114461、rs17223038、rs148965154、rs79577494、rs79579962、rs1054533、rs9797618、rs10420552、rs4802029、
rs28512414、rs1975937、rs958305、rs2075284、rs3095726、rs34785154、rs60704260、rs112805435、rs188724242、rs2034891、rs117753855、rs112910446、rs8100225、rs1657535、rs78472358、rs8099961、rs142900000、rs8958、rs58634535、rs6084431、rs2280091、rs2280092、rs3746642、rs235768、rs235769、rs221984、rs2424943、rs2424944、rs73264111、rs41305787、rs45585744、rs2295096、rs2071971、rs117358971、rs112959405、rs1124178、rs3746619、rs3827103、rs35295928_rs886056870、rs150212573、rs147911723、rs41279352、rs2427624、rs139729932、rs117984746、rs2276254、rs141212516(同rs377432980或rs386365935或rs386394882)、rs7283989、rs11701124、rs8131313、rs35796750、rs143527452、rs45604134、rs1052756、rs1052773、rs2240111、rs165815、rs2073747、rs5762430、rs470101、rs2267163、rs5997714、rs117291362、rs11553143。
[0117]
再将以上模型进行优化,筛选最佳阈值(cutoff)及比绘制roc曲线(如表2、图1所示)。
[0118]
表2、各模型最佳阈值及其auc值
[0119][0120]
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1