用于预测训练反应的生物标志物的制作方法

文档序号:15089475发布日期:2018-08-04 13:05阅读:162来源:国知局

本发明涉及作为生物标志物用于预测有氧训练反应的单核苷酸多态性(snp)标志物;用于使用所述标志物提供预测有氧训练反应的信息的方法;用于预测有氧训练反应的组合物,其包含用于标志物的探针或引物;和用于预测有氧训练反应的试剂盒,其包含用于标志物的探针或引物。

本发明还涉及作为生物标志物用于预测无氧训练反应的单核苷酸多态性(snp)标志物;用于使用所述标志物提供预测无氧训练反应的信息的方法;用于预测无氧训练反应的组合物,其包含用于所述标志物的探针或引物;和用于预测无氧训练反应的试剂盒,其包含用于标志物的探针或引物。



背景技术:

由于科学的发展和计算机的普遍使用,现代人的体育活动减少并因此缺乏锻炼。已知缺乏锻炼不仅导致体力下降,而且降低免疫力,并且已知其在所有成人疾病,包括高血压、糖尿病、肥胖症、心脏病和高脂血症中,是关键的风险因素。因此,为了保持和促进健康,锻炼的重要性开始得到强调,并且事实上,许多人感觉需要锻炼以改善体力。除了促进健康外,运动对于身体健美也很重要。事实上,越来越多的人通过锻炼减肥。

由于可以通过在一定时间段内定期锻炼来获得训练效果,现代人花费了大量时间和金钱锻炼。

另一方面,即使花费相同的时间和精力,训练效果也可能根据锻炼者的体质特征而变化。因此,为了获得实际有效的训练效果,需要根据锻炼者的体质特征来预测训练反应。

在国际专利公开号wo/2010/028256中,公开了用于通过最大氧摄取评估预测训练反应的生物标志物。



技术实现要素:

技术问题

本发明的目的是提供能够有效预测有氧/无氧训练反应的单核苷酸多态性(snp)标志物。

技术方案

本发明人基于这样的假设进行研究,即如果能够根据个体遗传特征预测训练效果,则将能够建议定制训练计划以实现具有时间和金钱的效率的优异训练效果,因此,通过发现单核苷酸多态性(snp)标志物与有氧/无氧训练反应有显著的关系,完成了本发明。

因此,本发明提供了能够预测有氧/无氧训练反应的snp标志物的用途。

本发明提供一种用于预测训练反应的标志物,其包括选自能够预测有氧/无氧训练反应的一种或多种snp标志物;使用该标志物预测训练反应的方法;使用该标志物提供用于预测训练反应的信息的方法;用于预测有氧/无氧训练反应的组合物,其包含用于标志物的探针或引物;和用于预测有氧/无氧训练反应的试剂盒,其包含用于标志物的探针或引物。

i.用于预测有氧训练反应的方法

具体而言,本发明提供了一种提供用于预测受试者的有氧训练反应的信息的方法,其包括识别一种或多种选自本发明的snp标志物在多态性位点处的核苷酸。

本发明还提供了一种提供用于预测受试者的无氧训练反应的信息的方法,其包括从分离自受试者的核酸样品中识别一种或多种选自本发明的snp标志物在多态性位点处的核苷酸。

除非另有定义,本申请使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同含义。

术语“多态性”是指核酸中的一种或多种不同形式的共存,包括外显子和内含子或其部分。“单核苷酸多态性”或“snp”,是指在特定基因位点存在两个或更多个单核苷酸。大多数snp具有两个等位基因。对于多态性等位基因之一,当snp具有两个相同的等位基因时,该等位基因与另一个等位基因是纯合的(在snp位点处具有相同核苷酸),而当snp具有两个不同的等位基因时,该等位基因与另一个等位基因是杂合的(在snp位点处具有不同核苷酸)。优选的snp在选择组中具有两个或更多个出现频率为1%或以上的等位基因,更优选为10%或20%或以上。在本发明中,snp以rsid命名。rsid是指由国家生物技术信息中心(nationalcenterforbiotechnologicalinformation,ncbi)给予每个独特的snp的参考snp(rs)id。

术语“等位基因”是指包括内含子、外显子、内含子/外显子连接以及与基因或其部分相关的3'和/或5'非翻译区在内的基因替代形式。通常,等位基因是指存在于同源染色体的相同基因座上的各类基因。特定基因的等位基因可以具有相同或几种不同的核苷酸,并且包括核苷酸的取代、缺失或插入。

术语“标志物”、“多态性标志物”或“snp标志物”,是指基因组多态性位点。每个多态性标志物在多态性位点中的特定等位基因处具有两个或更多个特征性序列变异。

在本说明书中,根据韩国知识产权局通知no.2013-01[核酸序列或氨基酸序列列表标准]制备了序列表。在核酸序列中,符号r表示鸟嘌呤(g)或腺嘌呤(a),符号y表示胸腺嘧啶(t)/尿嘧啶(u)或胞嘧啶(c)。符号m表示a或c,符号k表示g或t/u。符号s表示g或c,符号w表示a或t/u。

在本说明书中,术语“有氧训练”是指以相对低的强度持续运动以保持向肌肉供应氧气的训练。有氧训练的实例包括步行、慢跑、健美操、跳绳、游泳、骑自行车和登山。术语“无氧训练”是指以足以触发不足或无氧条件下的乳酸产生的强度下进行的运动。无氧训练的实例包括俯卧撑、举重和下蹲。

术语“训练反应”是指身体反应于训练的能力(例如身体对训练的反应,即训练灵敏度)。例如,在低训练反应的情况下,反应于训练的身体变化水平(例如最大氧摄取或肌肉力量增量)增加,而相比之下,在低训练反应的情况下,反应训练的身体变化水平降低。术语“有氧训练反应”是对有氧训练的训练反应,并且可以表示为有氧能力和/或最大氧摄取,但是本发明不限于此。术语“无氧训练反应”是对无氧训练的训练反应,并且可以表示为无氧能力和/或肌肉力量增量,但是本发明不限于此。

术语“有氧能力”是指在能量转化过程的有氧过程中的能量转化能力,其与氧递送能力(例如呼吸、循环或血液)或组织中的氧使用相关联,并且与总的身体耐力密切相关。有氧能力的降低可能导致疲劳、缺血性心脏病等。有氧能力可以通过有氧训练来提高,并且通常可以通过最大氧摄取来评估。术语“最大氧摄取(vo2max)”是指在训练期间测量的单位时间内最大氧消耗。最大氧摄取可用作确定有氧能力或心血管耐力的指数。另外,术语“最大氧摄取增量”是指与训练前相比,在训练预定时段后增加的最大氧摄取的变化率(%)。

术语“无氧能力”是与有氧能力相对的概念,是指无氧(即没有氧气)过程的能量转化能力。无氧能力可以通过无氧运动来提高,并且可以通过肌肉力量增量来评估。术语“肌肉力量增量”是指可以由肌肉收缩产生的肌肉力(肌肉力量)的增加,并且表示为峰值扭矩。转矩是旋转力,术语“峰值转矩”是指最大转矩值。此外,“峰值转矩增量”是指与训练前相比,在训练预定时段之后增加的峰值转矩的变化率(%)。

术语“受试者”是参与预测有氧/无氧训练反应的受试者,术语“核酸样品”是指包含从受试者获得的核酸(dna或rna)的样品。核酸样品可以从包括核酸在内的任何来源获得,例如血液、尿液、毛发、羊水、脑脊液;或取自受试者的皮肤、肌肉、口腔粘膜或结膜粘膜;或从胎盘、胃肠道或其他器官获得的组织样品。从受试者获得核酸样品的方法是本领域普通技术人员已知的,并且可以不受限制地使用已知的方法。

通过扩增snp标志物的多态性位点或者通过与能够检测snp标志物的探针杂交,可以从分离自受试者的核酸样品中识别多态性位点的核苷酸。

例如,可以使用pcr、连接酶链式反应(lcr)、转录扩增、自我维持序列复制或基于核酸序列的扩增(nasba)来扩增多态性位点。

用于识别多态性位点处核苷酸的方法可以是但不限于:测序分析、使用微阵列的杂交、等位基因特异性pcr、动态等位基因特异性杂交(dash)、pcr延伸分析、sscp、pcr-rflp分析、taqman方法、snplex平台(appliedbiosystems)、质谱(例如由sequenom制造的massarray系统)、微测序方法、bio-plex系统(biorad)、ceq和snpstream系统(beckman)、分子反转探针阵列技术(例如affymetrixgenechip)或beadchip(由illumina制造的humanomni2.5-8)。例如,可以使用snp芯片来识别多态性位点处的核苷酸。snp芯片是指用于同时识别数万个snp的单核苷酸的dna微阵列。

taqman法包括(1)设计和构建可以扩增所需dna片段的引物和taqman探针;(2)用fam染料和vic染料(appliedbiosystems)标记不同等位基因的探针;(3)使用dna(作为模板)和所述引物和探针进行pcr;(4)pcr完成后,使用核酸分析仪分析和确认taqman分析板;和(5)根据分析结果确定步骤(1)中的多核苷酸的基因型。

测序分析可以使用测定核苷酸序列的常规方法,并且可以使用自动测序仪进行。此外,等位基因特异性pcr是指使用一组引物扩增具有snp的dna片段的pcr方法,所述一组引物包括设计为将所述snp所在处的核苷酸置于其3'端的引物。等位基因特异性pcr所依据的设计原则是,例如,当特异性核苷酸a被g取代时,通过设计在3'末端包含a的引物和能够扩增适当大小的dna片段的反向引物来进行pcr,如果snp位置上的核苷酸是a,则由于扩增正常进行而在期望位置观察到条带,而如果核苷酸被g取代,则引物可以与模板dna互补地组合,但不是与3'末端互补结合,导致不适当的扩增。可以通过常规方法进行dash,优选使用由prince等人提出的方法。

pcr延伸分析首先使用一对引物扩增包含存在snp的核苷酸的dna片段,通过去磷酸化使参与反应的所有核苷酸失活,并通过添加snp特异性延伸引物、dntp混合物、双脱氧核苷酸、反应缓冲液和dna聚合酶来进行引物延伸反应。在此,延伸引物具有在5'方向上直接邻接于存在snp的核苷酸的核苷酸,确定其为3'端,dntp混合物不包含具有与脱氧核苷酸相同的核苷酸的核酸,且脱氧核苷酸选自显示snp的核苷酸类型之一。例如,在用g取代a的情况下,当dgtp、dctp和ttp的混合物和ddatp参与反应时,通过dna聚合酶从发生取代的核苷酸进行引物延伸,并且在经过几个核苷酸后,在核苷酸a首次出现的位置,通过ddatp终止引物延伸反应。如果不发生取代,则延伸反应在该位置终止,因此可以通过比较延伸后引物的长度来确定显示snp的核苷酸类型。

在此,作为检测方法,当延伸引物或脱氧核苷酸被荧光标记时,可以使用用于确定核苷酸序列的常用测序仪(例如,abi制造的model3700)检测荧光,来检测snp,且当使用未标记延伸引物和脱氧核苷酸时,可以通过使用基质辅助激光解吸电离飞行时间(maldi-tof)技术来测量分子量,从而检测snp。

表1中所列的snp标志物是在有氧训练方面的标志物,其可将受试者区分为有氧训练反应者和无反应者,并且有氧训练反应者可根据强度分类为正常有氧训练反应者和高有氧训练反应者的反应。

表1

chr.no:染色体编号;位置:snp的染色体位置;基因:基因符号;基因定位:snp在相关基因上的功能位置;部分r2:半部分相关系数的平方;累积r2:半部分相关系数的平方的累积和;p值:每个snp的回归系数的p值。

具体而言,能够确定有氧训练反应的snp标志物可以选自:人染色体no.12的rs11051548、

人染色体no.18的rs2542729、人染色体no.2的rs1451462、人染色体no.2的rs11096663、

人染色体no.6的rs6570913、人染色体no.3的rs13060995、人染色体no.2的rs12613181、

人染色体no.6的rs1626492、人染色体no.12的rs2417760、人染色体no.5的rs10072122

和人染色体no.2的rs1056233,

在此,当:所述人染色体no.12的rs11051548是a;

所述人染色体no.18的rs2542729是c;

所述人染色体no.2的rs1451462是c;

所述人染色体no.2的rs11096663是g;

所述人染色体no.6的rs6570913是g;

所述人染色体no.3的rs13060995是g;

所述人染色体no.2的rs12613181是c;

所述人染色体no.6的rs1626492是g;

所述人染色体no.12的rs2417760是a;

所述人染色体no.5的rs10072122是g;或

所述人染色体no.2的rs1056233是c时,相对于当等位基因上为不同核苷酸的情形,所述核苷酸表示高有氧训练反应。

如上所述,所述有氧训练反应可以由最大氧摄取表示。

在一个示例实施例中,本发明提供一种提供用于预测受试者的有氧训练反应的信息的方法,包括:

从分离自受试者的核酸样品中,识别选自人染色体no.12的rs11051548、人染色体no.18的rs2542729、人染色体no.2的rs1451462、人染色体no.2的rs11096663、人染色体no.6的rs6570913、人染色体no.3的rs13060995和人染色体no.2的rs12613181的一种或多种snp标志物的多态性位点处的核苷酸,并且另外识别选自人染色体no.6的rs1626492、人染色体no.12的rs2417760、人染色体no.5的rs10072122和人染色体no.2的rs1056233的一种或多种snp标志物的多态性位点的核苷酸,

其中,

当:所述人染色体no.12的rs11051548是a;

所述人染色体no.18的rs2542729是c;

所述人染色体no.2的rs1451462是c;

所述人染色体no.2的rs11096663是g;

所述人染色体no.6的rs6570913是g;

所述人染色体no.3的rs13060995是g;

所述人染色体no.2的rs12613181是c;

所述人染色体no.6的rs1626492是g;

所述人染色体no.12的rs2417760是a;

所述人染色体no.5的rs10072122是g;或

所述人染色体no.2的rs1056233是c时,所述snp标志物显示高有氧训练反应,和其中所述有氧训练反应由最大氧摄取表示。

可以使用一种snp标志物,或一种或多种snp标志物的组合,或所有snp标志物的组合。随着组合中的标志物数量增加,可以提高对预测训练反应的辨别度。

在一个示例性实施例中,可以将2种、3种、4种、5种、6种、7种、8种、9种、10种或更多种或全部11种snp标志物的组合,用于预测有氧训练反应。

例如,在有氧训练反应的实验中,在能够区别无反应者、中度反应者和高度反应者的11个多态性标志物中,个体标志物的识别率最大为53%,但是使用全部11个标志物时,得到约91%的识别率。即使在无氧训练反应的实验中,结果也类似于有氧训练的结果。在用于无氧训练反应的实验中,在能够区分无反应者、中度反应者和高度反应者的8个多态性标志物中,每个标志物的识别率最大为54%,但是当使用所有8个标志物时,得到约82%的识别率。

在本发明的一个示例性实施例中,关于对有氧训练的反应,受试者可以被分类为有氧训练的无反应者,中度反应者或高度反应者。

如以下实施例中所述,用于提供预测受试者的有氧训练反应的信息的方法,基于选择能够根据通过临床试验获得的有氧训练反应预测模型来预测有氧训练反应的snp标志物。

术语“有氧训练反应预测模型”是指用于根据在个体中观察到的snps差异来预测最大氧摄取水平增加的数学模型。

根据主要snp过滤处理构建“有氧训练反应预测模型”,以构成如图1所示的预测模型,其将在实施例中完整描述。

使用先前构建的有氧训练反应预测模型来预测受试者的有氧训练反应的方法,首先对有氧训练反应的预测标志物所确定的各个snps的基因型评分。

每个snp的基因型由两个等位基因的组合组成,因此每个snp具有三种基因型。通过“有氧训练反应预测模型”,将表现出低有氧训练反应的等位基因设置为a,将表现出高有氧训练反应的等位基因设置为b,例如,表现出低有氧训练反应(aa基因型)的纯合等位基因可以编码为0,杂合等位基因(ab基因型)可以编码为1,表现出高有氧训练反应(bb基因型)的纯合等位基因可以编码为2。

如果snps对有氧训练反应的影响相同,则可以根据数学公式1获得个体受试者的总基因型评分(x)。

[数学公式1]

如果各个snps对有氧训练反应的影响不同,则可以通过数学公式2计算每个受试者的总基因型评分(x)。

[数学公式2]

在数学公式1和2中,

x是对每个受试者计算所得的所述总基因型评分,其中0≤x≤2n或0≤x≤2,

gj是在受试者的第j个snp中观察到的基因型评分,其中gj∈{0,1,2},

wj是第j个snp的权重,和

n是构成该预测模型的snps的数量,

wj是基于使用通过多重线性回归计算的每个snp的半r2,并且如果所有snps的权重相同,则wj为1。

基于通过数学公式1或数学公式2获得的每个受试者的总基因型评分(x)属于根据有氧训练反应预测模型预先设定的哪个临界值范围,可以确定受试者分类为对有氧运动的无反应者、中度反应者或高度反应者。

例如,当c0表示用于区分有氧训练反应者和有氧训练无反应者的预定临界值,c1表示用于区分有氧训练的中度反应者和有氧训练的高度反应者的预定临界值,两者均使用有氧训练反应预测模型预先设定,可以确定,在x≤c0的情况下,将受试者分类为有氧训练的无反应者,在c0<x<c1的情况下,将受试者分类为有氧训练的中度反应者,并且在x≥c1的情况下,将受试者分类为有氧训练的高度反应者。

用于将受试者识别为有氧训练的无反应者或有氧训练的反应者(例如中度反应者和有氧训练的高度反应者)的另一种方法,可以是通过数学公式1或数学公式2计算受试者的总基因型评分(x),通过数学公式3或数学公式4计算最大氧摄取增量(y)的估计速率,并且在y≤q0的情况下,将受试者分类为有氧训练的无反应者,在q0<y<q1的情况下,将受试者分类为有氧训练的中度反应者,并且在y≥q1的情况下,将受试者分类为有氧训练的高度反应者。

[数学公式3]

y=a+bx

[数学公式4]

在数学公式3中,

x是从受试者获得的所述总基因型评分,其中0≤x≤2n或0≤x≤2,

y是估计的最大氧摄取增量(y),和

a和b是使用预测模型获得的线性回归的截距和斜率,其中a表示回归常数,b表示x对y的影响,

在数学公式4中,

gj是在受试者的第j个snp中观察到的基因型评分,其中gj∈{0,1,2},

c和dj是使用预测模型获得的多重线性回归的截距和斜率,其中c是回归常数,dj是gj对y的影响。

从数学公式3和数学公式4获得的截距和斜率,可以用于通过多元线性回归估计基因组评分和最大氧摄取的增量之间的关系。

q0和q1是使用上述有氧训练反应预测模型在先获得的临界值,其中q0是将受试者辨别为对有氧训练无反应者或有氧训练反应者的预定临界值,q1是将受试者识别为有氧训练中度反应者和有氧训练高度反应者的预定临界值。

将基于个体受试者的总基因型评分(x)的估计有氧训练反应与基于最大氧摄取增量(y)的估计速率的受试者估计有氧训练反应进行组合,能够更可靠地估计有氧训练反应。

本发明还提供一种用于预测受试者的有氧训练反应的组合物,其包含能够检测选自以下的一种或多种snp标志物的探针:

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.12的rs11051548或与其互补的多核苷酸(例如,多核苷酸seqidno:1:tgtgaatgcagtagccctgcracaatagctctgataaccaa);

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.18的rs2542729或与其互补的多核苷酸(例如,多核苷酸seqidno:2:atggctcagtcagttgatgtyagccggccctggtcattggc);

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.2的rs1451462或与其互补的多核苷酸(例如,多核苷酸seqidno:3:tggagactccagatctttcayagggcatttcatcctcagaa);

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.2的rs11096663或与其互补的多核苷酸(例如,多核苷酸seqidno:4:cctagaaatctccaaggcctrtgttaaaaccatcccttacc);

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.6的rs6570913或与其互补的多核苷酸(例如,多核苷酸seqidno:5:tcccgaatgaatcaattcacratgattattcgcattttgaa);

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.3的rs13060995或与其互补的多核苷酸(例如,多核苷酸seqidno:6:cacagccatggaaccaaagcdaggcatctacaagccaaggc);和

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.2的rs12613181或与其互补的多核苷酸,或能够扩增所述snp标志物的引物(例如,多核苷酸seqidno:7:aatcgaaagcatatagagaayatgaggaagcatgaaaagtc),和

进一步包含能够检测选自以下的一种或多种snp标志物的探针:

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.6的rs1626492或与其互补的多核苷酸(例如,多核苷酸seqidno:8:tcatgaactacttctgagttrtttactactgatttgtgggg);

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.12的rs2417760或与其互补的多核苷酸(例如,多核苷酸seqidno:9:aatctcagctctacttgtaamtcactgtgatgccttaggtg);

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.5的rs10072122或与其互补的多核苷酸(例如,多核苷酸seqidno:10:gggtcaaacacagtaaatgartgatttctgtaagtattaga);和

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.2的rs1056233或与其互补的多核苷酸(例如,多核苷酸seqidno:11:atgaaaatcaaccatgttttmtctcaccctctctcttttgt),或能够扩增所述snp标志物的引物。

而且,本发明提供了一种用于预测受试者的有氧训练反应的试剂盒,其包含能够检测选自以下的一种或多种snp标志物的探针:

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.12的rs11051548或与其互补的多核苷酸;

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.18的rs2542729或与其互补的多核苷酸;

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.2的rs1451462或与其互补的多核苷酸;

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.2的rs11096663或与其互补的多核苷酸;

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.6的rs6570913或与其互补的多核苷酸;

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.3的rs13060995或与其互补的多核苷酸;和

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.2的rs12613181或与其互补的多核苷酸,或能够扩增所述snp标志物的引物,且

进一步包含能够检测选自以下的一种或多种snp标志物的探针:

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.6的rs1626492或与其互补的多核苷酸;

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.12的rs2417760或与其互补的多核苷酸;

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.5的rs10072122或与其互补的多核苷酸;和

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.2的rs1056233或与其互补的多核苷酸,或能够扩增所述snp标志物的引物。

本申请中使用的术语“探针”是指可以通过与基因的多态性位点特异性杂交来预测有氧/无氧训练的敏感性材料,且用于上述遗传分析的方法的特性没有特别限制,其可以是本领域已知所有遗传检测方法中的任一种。

本申请使用的术语“引物”是能够特异性扩增snp标志物多核苷酸的材料,其可以是具有短游离3'羟基的短核苷酸序列,以形成互补模板和碱基对,从而用作复制模板链的起始来源。该引物可以在合适缓冲液和合适温度的聚合试剂(即dna聚合酶或逆转录酶)和四种不同的三磷酸核苷的存在下启动dna合成。可以根据通过pcr扩增产生所需产物来估计培养反应。pcr条件及正义和反义引物的长度可以基于本领域常识而变化。引物的合适长度可以根据使用目的而改变,并且可以是例如15至30个核苷酸。引物序列不必与模板完全互补,但是互补度必须足以可能与模板杂交。

探针或引物可以通过亚磷酰胺固体支架法或任何其他广为人知的方法化学合成。这样的核酸序列也可以使用本领域已知的多种手段修饰。这种修饰的非限制性实例包括甲基化、加帽、用天然核苷酸的一个或多个同源物取代,以及核苷酸之间的修饰,例如对不带电衔接子(例如:甲基膦酸酯,磷酸三酯,氨基磷酸酯或碳酸酯)或带电连接体(例如:硫代磷酸酯或二硫代磷酸酯)的修饰。

在本发明中,试剂盒可以是能够检测或确认snp标志物的任何试剂盒,没有限制。例如,该试剂盒可以是dna芯片试剂盒或实时聚合酶链反应(rt-pcr)试剂盒。rt-pcr试剂盒可以包括试管或不同的合适容器,反应缓冲液(各种ph和镁浓度),脱氧核苷酸(dntp),酶如taq-聚合酶和逆转录酶,dnase和rnase抑制剂,depc-水,和灭菌水,以及snp标志物基因的特异性引物对。此外,rt-pcr试剂盒可以包括用作定量对照的基因特异性引物对。由于使用了rt-pcr试剂盒评价snp标志物的mrna表达水平,因此可以确认snp标志物。dna芯片试剂盒是通常附着于平坦固体支架的网格阵列核酸点,通常是小于显微镜载玻片的玻璃表面,也是用于通过dna芯片表面规则排列的核算和芯片表面上处理的溶液中包含的互补核酸之间的多重杂交进行大规模平行分析的工具。

本发明的试剂盒还包括微阵列。微阵列可以包括dna或rna多核苷酸。微阵列可以是常规微阵列,但在探针多核苷酸中包括本发明的snp标志物多核苷酸。

通过将探针多核苷酸固定在基底上来制造微阵列的方法是本领域公知的。探针多核苷酸是指可杂交的多核苷酸,其是能够与核酸的互补链以序列特异性结合的寡核苷酸。本发明的探针是等位基因特异性探针,其与来源于一种成分的dna片段杂交,但是当来源于同一类型的两种成分的核酸片段中存在多态性位点时,其不与来自另一种成分的片段杂交。在这种情况下,杂交条件在等位基因的杂交强度上具有显著差异,因此需要足够严格以与仅一个等位基因杂交。因此,可以在不同类型的等位基因之间诱导显著的杂交差异。

微阵列可以使用已知的微阵列而没有限制,并且用于制造微阵列的方法是本领域公知的。此外,核酸在微阵列上的杂交和杂交结果的检测也是本领域熟知的。例如,核酸样品可以用能够产生可检测信号的标记材料(如荧光材料)进行标记,并在微阵列上杂交,并且可以检测从标记材料产生的信号,从而检测杂交结果。

ii.预测无氧训练反应的方法

表2中列出的snp标志物是在无氧训练方面的标志物,其可将受试者区分为无氧训练反应者和无反应者,并且根据反应强度,无氧训练反应者可以分为无氧训练的中度反应者和无氧训练的高度反应者。

表2

chr.no:染色体编号;位置:snp的染色体位置;基因:基因符号;基因定位:snp在相关基因上的功能位置;部分r2:半部分相关系数的平方;累积r2:半部分相关系数的平方的累积和;p值:每个snp的回归系数的p值。

具体地,能够确定无氧训练反应的snp标志物可以选自:人染色体no.5的rs10072841、人染色体no.16的rs6564267、人染色体no.2的rs17044554、人染色体no.13的rs1341439、人染色体no.9的rs10756546、人染色体no.15的rs4522375、人染色体no.5的rs10045249和人染色体no.14的rs7154161,

其中,

当:所述人染色体no.5的rs10072841是c;

所述人染色体no.16的rs6564267是g;

所述人染色体no.2的rs17044554是t;

所述人染色体no.13的rs1341439是a;

所述人染色体no.9的rs10756546是c;

所述人染色体no.15的rs4522375是t;

所述人染色体no.5的rs10045249是a;或

所述人染色体no.14的rs7154161是t时,与当等位基因上为不同核苷酸时相比,所述核苷酸显示高无氧训练反应。

如上所述,无氧运动反应可以由峰值扭矩表示。

相应地,本发明提供了一种提供用于预测受试者的无氧训练反应的信息的方法,包括:

从分离自受试者的核酸样品中,识别选自人染色体no.5的rs10072841、人染色体no.16的rs6564267、人染色体no.2的rs17044554、人染色体no.13的rs1341439、人染色体no.15的rs4522375和人染色体no.14的rs7154161的一种或多种snp标志物的多态性位点处的核苷酸,并且另外识别选自人染色体no.9的rs10756546和人染色体no.5的rs10045249的一种或多种snp标志物的多态性位点的核苷酸,

其中,

当:所述人染色体no.5的rs10072841是c;

所述人染色体no.16的rs6564267是g;

所述人染色体no.2的rs17044554是t;

所述人染色体no.13的rs1341439是a;

所述人染色体no.9的rs10756546是c;

所述人染色体no.15的rs4522375是t;

所述人染色体no.5的rs10045249是a;或

所述人染色体no.14的rs7154161是t时,所述snp标志物显示高无氧训练反应,且所述无氧训练反应由峰值扭矩表示。

可以使用一种snp标志物,一种或多种snp标志物的组合或所有标志物的组合。随着组合中的标志物数量增加,可以提高对训练反应的预测的区分度。

在一个示例性实施例中,可以使用2、3、4、5、6、7个或更多个,或所有8个snp标志物的组合来预测无氧训练反应。

在本发明的一个示例性实施例中,受试者的无氧训练反应可以被区分为对无氧训练的无反应者、对无氧训练的中度反应者或对无氧训练的高度反应者。

如以下实施例中所述,一种用于提供信息以预测受试者的无氧训练反应的方法,其以选择能够基于通过临床试验获得的无氧训练反应预测模型来预测无氧训练反应的snp标志物为基础。

术语“无氧训练反应预测模型”是指用于预测肌肉力量增加速率的数学模型,例如,其可以根据在个体中观察到的snps的差异,由峰值扭矩增量表示。

根据构成如图2所示的预测模型的主snps的过滤处理,构建“无氧训练反应预测模型”,所述模型将在示例中完全描述。

使用先前构建的无氧训练反应预测模型预测受试者无氧训练反应的方法,从对使用无氧训练反应预测标志物确定的单个snps的基因型进行评分开始。

每个snp的基因型由两个等位基因的组合组成,因此每个snp具有三种基因型。通过“无氧训练反应预测模型”,将表现出低无氧训练反应的等位基因设为a,将表现出高无氧训练反应的等位基因设为b,然后,例如,显示低无氧训练反应的纯合等位基因(aa基因型)可以编码为0,杂合等位基因(ab基因型)可以编码为1,显示高无氧训练反应(bb基因型)的纯合等位基因可以编码为2。

这里,由于snps对无氧训练反应的影响可能不同,因此可以根据数学公式2获得各个受试者的总基因型评分(x)。

如果snps对无氧训练反应的影响相同,则可以根据数学公式1获得各个受试者的总基因型评分(x)。

[数学公式1]

如果各个snps对无氧训练反应的影响不同,则可以通过数学公式2计算每个受试者的总基因型评分(x)。

[数学公式2]

在数学公式1和2中,

x是对每个受试者计算所得的所述总基因型评分,其中0≤x≤2n或0≤x≤2,

gj是在受试者的第j个snp中观察到的基因型评分,其中gj∈{0,1,2},

wj是第j个snp的权重,和

n是构成该预测模型的snps的数量,

wj是基于使用通过多重线性回归计算得到的每个snp的半r2,并且如果所有snps的权重相同,则wj为1。

根据基于无氧训练反应预测模型而预先设定的临界范围,通过数学公式2获得的每个受试者的总基因型评分(x),属于,可以确定将受试者分类为对无氧训练的无反应者,无氧训练的中度反应者或无氧训练的高度反应者。

例如,当r0表示将受试者区分为无氧训练反应者和无反应者的预定临界值,且r1表示将受试者区分为无氧训练的中度反应者和无氧训练的高度反应者的预定临界值时,两者均使用无氧训练反应预测模型预先设置,可以确定,在x≤r0的情况下,将受试者分类为无无氧训练的无反应者。

当r0<x<r1时,将受试者分类为无氧训练的中度反应者,当x≥r1时,将受试者分类为无氧训练的高度反应者。

用于将受试者区分为无氧训练反应者(例如无氧训练的无反应者、中度反应者和高度反应者)的另一种方法,可以是通过[数学公式1]或[数学公式2]确定受试者总基因型评分的计算值,通过[数学公式5]或[数学公式6]计算峰值扭矩(z)的增量的估计速率,并且在z≤s0的情况下,将受试者分类为无氧训练的无反应者,在s0<z<s1的情况下,将受试者分类为对无氧训练的中度反应者,并且在z≥s1的情况下,将受试者分类为无氧训练的高度反应者。

[数学公式5]

z=e+fx

[数学公式6]

在数学公式5中,x是从受试者获得的总基因型评分,其为0≤x≤2n或0≤x≤2,e和f表示使用预测模型获得的线性回归的截距和斜率,其中e表示回归常数,f表示x对z的影响。

在数学公式6中,gj是在受试者的第j个snp中观察到的基因型评分,其中gj∈{0,1,2},g和hj是使用预测模型获得的多重线性回归的截距和斜率,其中g是回归常数,hj是gj对z的影响。

从数学公式5和数学公式6获得的截距和斜率,可以用于通过线性回归估计基因评分和峰值扭矩增量之间的关系。

s0和s1是使用上述有氧训练反应预测模型预先获得的临界值,其中s0是将受试者区分为无氧训练无反应者和无氧训练反应者的临界值,s1是将受试者区分为对无氧训练的中度反应者和对无氧训练的高度反应者的临界值。

当将基于各个受试者的总基因型评分(x)的受试者估计无氧训练反应与基于峰值扭矩(z)的受试者估计无氧训练反应进行结合时,更可能可靠地估计有氧训练反应。

本发明还提供了一种用于预测受试者的无氧训练反应的组合物,其包含能够检测选自以下

的一种或多种snp标志物的探针:

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.5的rs10072841或与其互补的多核苷酸(例如,多核苷酸seqidno:12:ctagtaatacaactgtttagyacctggcttatactattaac);

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.16的rs6564267或与其互补的多核苷酸(例如,多核苷酸seqidno:13:cttttgcccaggctgtcagckctttggccccagttaatgac);

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.2的rs17044554或与其互补的多核苷酸(例如,多核苷酸seqidno:14:gaggacaccacagaggagctkagagcttgtcagctaccacc);

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.13的rs1341439或与其互补的多核苷酸(例如,多核苷酸seqidno:15:aatagttgtttctatttcrtagaggtgttgtgaagagta);

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.15的rs4522375或与其互补的多核苷酸(例如,多核苷酸seqidno:17:aaattatctttggggatacayatgcaggttcattacttagg);和

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.14的rs7154161或与其互补的多核苷酸(例如,多核苷酸seqidno:19:gctgcatcctcctcgctgtgygaaagagaccgtagatttta),或能够扩增所述snp标志物的引物,和

进一步包含能够检测选自以下的一种或多种snp标志物的探针:

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.9的rs10756546或与其互补的多核苷酸(例如,多核苷酸seqidno:16:ttacagcatcagaatgtttayatctgcacaattctttgatt);和

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.5的rs10045249或与其互补的多核苷酸(例如,多核苷酸seqidno:18:ctggcaagtccaaaatcagcrgggtaggctagtaggctgga),或能够扩增所述snp标志物的引物。

本发明还提供了一种用于预测受试者的有氧训练反应的试剂盒,其包含能够检测选自以下的一种或多种snp标志物的探针:

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.5的rs10072841或与其互补的多核苷酸;

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.16的rs6564267或与其互补的多核苷酸;

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.2的rs17044554或与其互补的多核苷酸;

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.13的rs1341439或与其互补的多核苷酸;

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.15的rs4522375或与其互补的多核苷酸(例如,多核苷酸seqidno:17:aaattatctttggggatacayatgcaggttcattacttagg);和

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.14的rs7154161或与其互补的多核苷酸,或能够扩增所述snp标志物的引物,和

进一步包含能够检测选自以下的一种或多种snp标志物的探针:

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.9的rs10756546或与其互补的多核苷酸;和

由5至100个连续核酸的序列组成的多核苷酸,其包含人染色体no.5的rs10045249或与其互补的多核苷酸,或能够扩增所述snp标志物的引物。

此外,上述用于提供信息以预测无氧训练反应的方法,用于预测受试者的无氧训练反应的组合物,以及用于预测受试者无氧训练反应的试剂盒的描述,可以适用前述预测有氧训练反应的方法的描述。在本发明中,预测训练反应的相关信息可以由计算机程序提供。例如,通过计算机可读程序,打印出目标受试者的snp标志物的多态性位点的确认结果,并且由此可以向呈现高有氧训练反应的受试者展示合适的有氧训练程序,并可以向呈现出呈现高无氧训练反应的受试者展示合适的无氧训练程序。因此,根据每个受试者的遗传特征,展示个性化训练程序,由此可以最大化训练效果。

有益效果

根据本发明所述,研究了显著影响有氧/无氧训练反应的主要评价变量(即最大o2摄取(v′o2max)和膝峰值扭矩)的snp。由于可以使用snp预测受试者的有氧/无氧训练反应,因此可以在训练之前或训练期间,根据个体受试者的特征而提出合适的训练计划。

附图说明

图1和图2分别显示了构建有氧训练反应和无氧训练反应预测模型的主要snp过滤过程。

图3显示了9周hit项目后v′o2的变化百分比(%)和膝峰值扭矩的变化百分比(%)的样本分布。

图4显示了常染色体上22个显著snps(p值<0.01)的manhattan分布图。x轴代表染色体,y轴代表-log10转化的p值。图4a的snp在线性回归分析中相对于v′o2max的变化百分比(%)是显著的,并且图4b中的snp在线性回归分析中相对于膝峰值扭矩的变化百分比(%)是显著的。

图5显示了11种snps基因型的v′o2max的变化百分比(%)的平均值和上95%置信区间。

图6显示了8种snp基因型的膝峰值扭矩的变化百分比(%)的平均值和上95%置信区间。

图7显示了训练反应(y轴)和上95%置信区间的变化百分比(%)的平均值。x轴代表由总基因型评分的临界值确定的三个不同范围。每个评分范围内的受试者的数量在表格中表示为n。

具体实施方式

本发明的优点和特征以及展现这些优点和特征的方法,将在下面详细描述的实施例中清楚可见。然而,应当清楚地理解,本发明不限于此,还可以其他方式实施和实践。显然,以下实施例将完成本发明的公开,并且向本领域技术人员完整地表明本发明的范围,并且本发明将仅由权利要求的范围限定。

[实施例]

79名健康志愿者参加了hit计划。进行了基于2391739个snps的全基因组关联研究(gwas),以识别在hit项目9周后与v′o2和膝峰值扭矩的增加显著相关的snps。为了预测2个训练反应,使用线性回归和迭代二元逻辑回归分析确定2个独立的snps集合。执行错误发现率分析和置换测试以避免假阳性结果。

本研究的实验方案由韩国首尔kyunghee大学医院的机构审查委员会批准。本研究的方法和程序符合“良好临床实践指南(goodclinicalpracticeguidelines)”和“赫尔辛基宣言”。

<训练反应预测模型的构建方法>

研究参与者和hit计划

招募了总共123名均为30-60岁的韩国男性和女性参加这项研究。所有参与者在前3个月没有经常运动的经验,并且体重指数(bmi)在16-32kg/m2的范围内。所有参与者在参加本研究之前签署了知情同意书。在招募这些参与者之前,我们必须确认他们是健康的受试者,通过身体检查评估。我们还记录了他们的疾病史,生命体征测量(收缩压、舒张压和脉搏率),12导联心电图(ecg);并进行常规实验室检查(血液学、临床化学和尿分析)。

使用测力自行车(aerobike75xl-ii,combi,japan)进行9周hit项目。根据基线测试中测量的hr和v′o2max,为每个受试者定制训练强度。受试者在与其基线v′o2max的60-84%相对应的hr下运动,每次持续3分钟和40秒,持续9周。1个训练期包括40秒的预热,20秒的hit,40秒的休息时间,20秒的hit,40秒的休息时间,20秒的hit,和40秒的最终冷却。所有参与者必须每周进行3次训练项目(仅1次/天,3次/周),并且在训练完成后立即在锻炼日志上记录他们的表现。受试者可以随时自愿退出研究。少于21次锻炼的参与者不计入本研究。在基线测试、6周测试和最终9周测试时,受试者访问全国健身中心(nfc,韩国),并且测量了与他们的训练反应相关的以下变量:v′o2max、无氧阈值、潮气量、氧摄取(v′o2)、二氧化碳输出(v′co2),及其呼吸交换比。作为肌肉强度试验的一部分,另外在膝盖处测量屈肌和伸肌的峰值扭矩,以及主动肌/对抗肌比例。使用biodexsystem3(biodexmedicalsystems,usa),以60°/秒测量每个受试者膝关节的屈肌和伸肌的峰值扭矩;测量从膝盖的左侧和右侧进行,并取平均值。训练反应的主要评价变量选择为v′o2max(单位:ml/min/kg)和膝屈肌扭矩(单位:n.m/kg)。参与者在执行hit计划之前接受过专业训练师的指导。

定义训练反应的实际亚组

训练反应的量化定义为从基线到hit项目的9周,在v′o2max(v′o2max的变化百分比(%))中获得的体积百分比以及膝屈肌峰值扭矩的增加百分比(膝扭峰值扭矩的变化百分比(%))。使用聚类分析定义代表3种不同训练反应的3个亚组:无反应者、中度反应者和高度反应者。无反应者亚组包括训练反应变化百分比(%)(v′o2max或膝峰值扭矩)为±0%的受试者。剩余的受试者使用2-平均值聚类算法分为中度反应者或高度反应者分组:2个亚组的初始中心是训练反应的变化百分比(%)的最小值(s1)和最大值(s2)。因此,受试者围绕s1和s2聚集,由此分别被定义为中度反应者和高度反应者。

gwas的snp基因分型和数据预处理

根据制造商说明书,使用高纯度pcr模板制备试剂盒(rochediagnostics,mannheim,germany)制备来自全血样品的模板dna。使用结合缓冲液和蛋白酶k裂解全血细胞,并使用异丙醇和抑制剂去除缓冲液来提取基因组dna。用40ul洗脱缓冲液洗脱总dna,然后储存在70℃下直至snp基因分型。使用humanomni2.5-8beadchips(illumina,inc.,usa)对gwassnp进行基因分型。使用genomestudio软件(illumina,inc.,usa)进行基因型调用,并在检查其logr比和波动度之后选择调用率>0.99的基因型。过滤掉在总的2391739个snp中占41.8%的单形snp。7270(0.3%)个snp具有≥10%的缺失基因型,其与次要等位基因频率(maf)<5%的225440个snp(9.4%)一起被滤出。对剩余的snp进行hardy-weinberg平衡(hwe)测试,并滤出p值为<0.001(1.1%)的26588个snp。在进行数据预处理后,剩余1131703个snp(47.3%),并且将其用于进行gwas研究。这些snp的注释信息,例如它们的染色体位置和基因信息,取自人类基因组版本19,并使用了用于注释、可视化和整合发现的数据库(david)进行相关基因的功能注释(huangetal.2009a;huangetal.2009b)。

snp基因型编码到定量评分

进行等位基因和训练反应之间的关联分析;由有利于训练反应的等位基因组成的纯合基因型编码为2,由对训练反应有害的等位基因组成的纯合基因型编码为0。杂合基因型编码为1。使用这些编码值,我们分析了snp的加性遗传效应训练反应。

统计分析

测量的基线特征用平均值±标准偏差(sd)和n(%)表示,分别表示连续和分类变量。进行二样本t检验或wilcoxon符号秩检验,以测试初始基线测量值和hit项目9周后的测量值之间的差异。图1和图2展示了从数据预处理到选择用于构建有氧和无氧训练反应预测模型中的遗传标记的整个分析程序。我们对gwassnps连续使用了线性回归和逻辑回归分析,以识别与连续和分类训练反应显著相关的snps。将v′o2max的变化百分比(%)和膝峰值扭矩的变化百分比(%)用作连续训练反应,并将3个亚组,即无反应者,中等反应者和高度反应者用作分类训练反应。所有分析通过性别、年龄和v′o2max和膝峰值扭矩的基线量进行调整。我们使用线性回归分析来评估snp基因型对训练反应的定量增益的影响。此外,我们使用逻辑回归分析来评估snp基因型用于将受试者区分为具有不同训练反应亚组的作用。应用二元逻辑回归进行了两次分析:一次针对反应者对无反应者,另一次针对高度反应者对中等反应者。对于线性回归和逻辑回归分析,p值的显著性水平取为0.01。将fdr分析的q值临界值和置换测试的p值临界值(n=2000)分别设定为0.1和0.01,以使假阳性最小化。为了识别候选标记物中最符合回归模型的snp,基于akaike信息准则(akaikeinformationcriterion,aic),依序应用反向和正向逐步过程。此外,通过将从反向和正向选择中去除的snp逐个添加到回归模型中,还发现了最大化分类准确度的snp。因此,我们选择这些snps作为最终遗传标记,用于将受试者分成不同训练反应的3个亚组。

将所有标志物snp的编码基因型评分加起来以计算总基因型评分,然后将其用于预测受试者的训练反应者。在迭代过程期间确定了区分3个不同亚组的总基因型评分临界值,使由实际反应者和预测反应者组成的3乘3列联表中的分类误差最小化。(见表3和分类准确度表达式)。将可从最小基因型评分和最大基因型评分计算值获得的两个评分组合用作基因型评分的候选临界值。例如,如果设定临界值分别为c1和c2,则预测最小基因评分显示为~c1的的受试者是无反应者,预测最小基因评分显示为c1~c2的受试者是中度反应者,预测最大基因分数显示为c2~的为高度反应者,并且从预测反应者的三个亚组与实际反应者的三个亚组的比较,计算分类准确度,即区分度(也表示为识别准确度或估计准确度)。在计算了所有临界值组合的分类准确度之后,最终将其中能够达到最高分类准确度的临界值用于预测训练反应。

表3

通过留一交叉验证(loocv)程序,自举(n=1000)和随机化测试(n=1000)来估计预测结果的可靠性。所有的统计分析使用r语言ver3.1.1(rfoundationforstatisticalcomputing,vienna,austria)进行。

<训练反应预测模型的构建方法的结果>

hit项目测量的基线特性

最终分析数据集包括完成了超过21次的临床试验的受试者;来自总共123名受试者的79名(51名男性和28名女性)满足该标准。表4总结了这79个受试者的基线特征。

[表4]

变量的基线特征

hit程序9周后的若干测量(例如v′o2max,膝峰值扭矩,收缩压(sbp),舒张压(dbp)和β细胞功能的稳态模型评估(homa))显著不同于基线(p值<0.05,表5)。

[表5]

在基线处和hit项目9周后测量的选定变量差异

单snp分析

图3示出了在完成9周的hit项目之后,v′o2max的变化百分比(%)和膝峰值扭矩的变化百分比(%)的样本分布。约24%(n=19)和15%(n=12)的受试者分别显示出v′o2max和膝峰值扭矩的零变化或负变化。另一方面,约29%(n=23)受试者分别在v′o2max和膝峰值扭矩方面获得超过18%和24%的变化。v′o2max和膝峰值扭矩的平均变化百分比(%)分别为9.5%和15.2%(数据未显示)。

通过调整年龄、性别和v′o2max或膝峰值扭矩的基线测量,对每个gwassnp应用线性回归分析。从数据预处理程序后剩余的总共1131703个snp中,我们发现有11773个snps和11258个snps分别与v′o2max的变化百分比(%)和膝峰值扭矩的变化百分比(%)显著相关(p值<0.01)。分析结果的分布如图1中的manhattan图所示。使用这些snps进行二元逻辑回归分析,并结合fdr分析。与v′o2max的变化百分比(%)线性相关的11773个snp中,当因变量是反应者对无反应者,高度反应者对中等反应者时,有568个snps和687个snps分别与二元反应显著相关。同时,与膝峰值扭矩的变化百分比(%)线性相关的11258个snps中,当因变量是反应者对无反应者,以及高度反应者对中度反应者时,分别有295个snps和650个snps与二元反应显著相关(p值<0.01,q值<0.1)。我们已经在表1和表2中提供了关于所选snp的完整信息。

训练反应预测模型的多个snp分析和遗传标志物

对单snp分析中选择的snp进行置换测试,以进一步降低假阳性(n=2000和p值<0.01),并且将过滤后的snps用于多变量逻辑回归分析。在依序应用正向和反向逐步程序后,最终选择11个snps作为预测标志物组,以确定v′o2max的变化百分比(%)。在这种情况下,选择了6个snp用于区分反应者与无反应者,而选择了其他5个snps用于区分高度反应者对中等反应者。表1提供了关于这些snp的详细信息。

选择用于预测v′o2max的变化百分比(%)的11个snps,占观察到的总方差的20.3%:每个单snp的贡献在0.6%到5.2%之间变动(该贡献是表1的部分r2值的100倍)。图5和表6显示了每种基因型的v′o2max的变化百分比(%)的平均值和95%置信区间;根据基因型,对于所有snp(α=0.05),v′o2max的变化百分比(%)显著不同。

表6

与v′o2max的变化百分比(%)最强相关的snp是rs11051548。该snp位于有丝分裂出口网络1同源物(amn1)拮抗物基因的内含子中。rs2542729包括18号染色体的第305684序列的上游和下游的20个核苷酸的序列。rs1451462位于loc105369165基因位点。rs13060995位于两个基因的基因间区:slit-roborhogtpase激活蛋白3(srgap3)和loc100288831。rs6570913位于糖醛基-2-磺基转移酶(ust)基因的内含子。rs11096663位于loc105373465基因位点。rs12613181位于电压门控性钾通道eag相关亚家族h成员7(kcnh7)基因的内含子。

如表2所示,用于预测膝峰值扭矩的变化百分比(%)的所选8个snps,占观察到的总方差的21.8%。每个单snp的贡献在1.1%到7.9%之间变化(贡献是表2的部分r2值的100倍)。每种基因型的膝峰值扭矩的变化百分比(%)的平均值和95%置信区间显示在图6和表7中。

表7

所有8个snps均显示出膝峰值扭矩的变化百分比(%)基于基因型的显著差异(α=0.05)。rs10072841与膝峰值扭矩的变化百分比(%)最相关;这个snp位于fat非典型钙粘着蛋白2(fat2)基因的基因间区域。其他强相关的snps包括如下。rs6564267位于gaba(a)受体相关蛋白2(gabarapl2)基因的内含子中;rs17044554包括染色体no.2的第22995383号核苷酸序列上游和下游的含20个核苷酸的序列。rs1341439包括染色体no.13的第103706322号核苷酸序列上游和下游的含20个核苷酸的序列。rs4522375包括染色体no.15的第23957540号核苷酸序列上游和下游的含20个核苷酸的序列。rs7154161包括染色体no.314的第51387550号核苷酸序列上游和下游的含20个核苷酸的序列。

构建snp基因型评分系统以预测训练反应亚组

构建了2种类型的snp基因型评分系统,分别用于v′o2max的变化百分比(%)和膝峰值扭矩的变化百分比(%)。如表1和2所示,使用选择的snp来作为将受试者分类为三个亚组的预测标记。为了反映基因型对训练反应的量化贡献,根据方法部分中所述的步骤,将每个snp的个体基因型编码为0、1或2。此后,使用基因型评分的总和(即总基因型评分)来对受试者进行训练反应者预测。用于确定v′o2max的变化百分比(%)或膝峰值扭矩的变化百分比(%)的基因型评分系统,将受试者的训练反应者分类为无反应者、中度反应者或高度反应者。

如在方法部分中解释的,确定总基因型评分的临界值以区分三个亚组。受试者的训练反应的变化百分比(%)的分布示于图7中,其中对于总基因型评分的每个子范围,v′o2max的变化百分比(%)的平均值分别为-4.2%、8.0%和28.0%。对于总基因型评分的每个子范围,膝峰值扭矩的变化百分比(%)的平均值分别为-2.7%、15.7%和42.7%。

预测模型的准确度估计和内部验证

[表8]

有氧训练反应预测模型的准确度估计

[表9]

无氧训练反应预测模型的准确度估计

表8和9示出了估计预测准确度的总体结果和内部验证。对于v′o2max的变化百分比(%)和膝峰值扭矩的变化百分比(%),预测准确度分别估计为91.1%和82.3%。

使用loocv分析获得相同的结果。自举分析(n=1000)显示,v′o2max的变化百分比(95%可信区间为84.8-97.4%)的平均预测准确率为91.0%,膝峰值扭矩变化百分比(%)的平均预测准确率为82.3%(95%置信区间为75.6%-91.3%)。同时,使用n=1000组随机置换的受试者的随机化测试显示出接近50%的预测准确度。这表明构建的预测模型具有可靠的估计准确度。

<预测有氧训练反应的实施例>

使用上述构建的预测模型,预测临床试验受试者之一对有氧训练的训练反应。

首先,受试者的基因型的评分如下(在该实施例中使用的公式不考虑加权的snp)。

表10

总基因型评分为12,因此使用基因型评分预测训练反应的结果显示,受试者预测为中度反应者(根据先前构建的预测模型,对无反应者预测的评分为:10或以下;对于中度反应者预测的评分为:11至14;对高度反应者预测的评分为:15或更高)。

另外,根据使用线性回归的预测结果,在上述预测模型中,当y=a+bx,a=-34.667和b=3.632,且受试者(x)的总基因型评分为12时,得到y=8.917。根据使用预测模型设置的临界值,针对无反应者预测的值为:y为0或更小,对于中等反应者预测的值为:0<y<18,对于高度反应者预测的值为:y为18或更高,因此预测受试者是中度反应者。

结合两种方法获得的结果,预测受试者是中度反应者。

<预测无氧训练反应的实施例>

使用上述构建的预测模型估计临床试验受试者个体对无氧训练的训练反应。

首先,受试者的基因型的评分如下(在该实施例中使用的公式不考虑加权的snp)。

[表11]

总基因型评分为6,因此使用基因型评分预测训练反应的结果显示,预测受试者是无反应者(根据先前构建的预测模型,对无反应者预测的评分为:7或更低,对于中度反应者预测的评分为:8~12,对高度反应者预测的评分为:13或更高)。

另外,根据使用线性回归的预测结果,在上述预测模型中,当z=e+fx,e=-46.994和f=5.823,且受试者(x)的总基因型评分为6时,得到y=8.917。根据使用预测模型设置的临界值,针对无反应者预测的值为:z为0或更小,针对中度反应者预测的值为:0<z<24,针对高度反应者预测的值为:z为24或更高,因此预测受试者是无反应者。

结合两种方法获得的结果,预测受试者是无反应者。

序列表

<110>株式会社大熊制药

株式会社bioage

<120>用于预测训练反应的生物标志物

<130>g16c24c0543cn

<160>19

<170>patentinversion3.2

<210>1

<211>41

<212>dna

<213>homosapiens

<400>1

tgtgaatgcagtagccctgcracaatagctctgataaccaa41

<210>2

<211>41

<212>dna

<213>homosapiens

<400>2

atggctcagtcagttgatgtyagccggccctggtcattggc41

<210>3

<211>41

<212>dna

<213>homosapiens

<400>3

tggagactccagatctttcayagggcatttcatcctcagaa41

<210>4

<211>41

<212>dna

<213>homosapiens

<400>4

cctagaaatctccaaggcctrtgttaaaaccatcccttacc41

<210>5

<211>41

<212>dna

<213>homosapiens

<400>5

tcccgaatgaatcaattcacratgattattcgcattttgaa41

<210>6

<211>41

<212>dna

<213>homosapiens

<400>6

cacagccatggaaccaaagcdaggcatctacaagccaaggc41

<210>7

<211>41

<212>dna

<213>homosapiens

<400>7

aatcgaaagcatatagagaayatgaggaagcatgaaaagtc41

<210>8

<211>41

<212>dna

<213>homosapiens

<400>8

tcatgaactacttctgagttrtttactactgatttgtgggg41

<210>9

<211>41

<212>dna

<213>homosapiens

<400>9

aatctcagctctacttgtaamtcactgtgatgccttaggtg41

<210>10

<211>41

<212>dna

<213>homosapiens

<400>10

gggtcaaacacagtaaatgartgatttctgtaagtattaga41

<210>11

<211>41

<212>dna

<213>homosapiens

<400>11

atgaaaatcaaccatgttttmtctcaccctctctcttttgt41

<210>12

<211>41

<212>dna

<213>homosapiens

<400>12

ctagtaatacaactgtttagyacctggcttatactattaac41

<210>13

<211>41

<212>dna

<213>homosapiens

<400>13

cttttgcccaggctgtcagckctttggccccagttaatgac41

<210>14

<211>41

<212>dna

<213>homosapiens

<400>14

gaggacaccacagaggagctkagagcttgtcagctaccacc41

<210>15

<211>39

<212>dna

<213>homosapiens

<400>15

aatagttgtttctatttcrtagaggtgttgtgaagagta39

<210>16

<211>41

<212>dna

<213>homosapiens

<400>16

ttacagcatcagaatgtttayatctgcacaattctttgatt41

<210>17

<211>41

<212>dna

<213>homosapiens

<400>17

aaattatctttggggatacayatgcaggttcattacttagg41

<210>18

<211>41

<212>dna

<213>homosapiens

<400>18

ctggcaagtccaaaatcagcrgggtaggctagtaggctgga41

<210>19

<211>41

<212>dna

<213>homosapiens

<400>19

gctgcatcctcctcgctgtgygaaagagaccgtagatttta41

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1