系统性红斑狼疮3’端非翻译区长度差异基因及分析方法和应用

文档序号:10622521阅读:476来源:国知局
系统性红斑狼疮3’端非翻译区长度差异基因及分析方法和应用
【专利摘要】本发明涉及一种系统性红斑狼疮3’端非翻译区长度差异基因及分析方法和应用。通过对系统性红斑狼疮患者与健康对照组的外周血单个核细胞中3’端非编码区基因长度多态性进行研究,并检测系统性红斑狼疮患者mRNA差异表达水平,对研究系统性红斑狼疮的发病机理以及临床诊断和治疗系统性红斑狼疮具有重要的意义。上述分析方法以及得到的3’端非翻译区长度差异基因可作为诊断系统性红斑狼疮疾病的中间结果,有利于探明3’端非编码区长度差异基因mRNA的表达水平与系统性红斑狼疮疾病活动度及不同临床病症之间的关系,验证各种诊断标记物及药物靶点,并有助于开发新型系统性红斑狼疮靶向治疗药物。
【专利说明】
系统性红斑狼疮3'端非翻译区长度差异基因及分析方法 和应用
技术领域
[0001] 本发明涉及疾病病理研究领域,尤其是涉及一种系统性红斑狼疮3'端非翻译区长 度差异基因及分析方法和应用。
【背景技术】
[0002] 系统性红斑狼疮(SLE)是一种自身免疫性疾病。患者免疫耐受丧失、免疫复合物 沉积,因而自身抗体产生,导致细胞因子失衡,炎症反应失控造成体内多种器官和组织损 伤。系统性红斑狼疮是一种涉及多基因遗传的复杂疾病,单个基因的异常对系统性红斑狼 疮遗传发病风险起到的作用较小。目前一般认为系统性红斑狼疮受遗传、环境因素、性激素 紊乱等多方面影响。因此,研究系统性红斑狼疮的发病机理尤其是基因表达差异具有重要 的意义。

【发明内容】

[0003] 基于此,有必要提供一种可用于系统性红斑狼疮发病机理研究的系统性红斑狼疮 3'端非翻译区长度差异基因及分析方法和应用。
[0004] 一种系统性红斑狼疮3'端非翻译区长度差异基因的分析方法,包括如下步骤:
[0005] 对系统性红斑狼疮患者和健康对照组分别提取外周血单个核细胞的总RNA,得到 两组测序样本;
[0006] 对两组测序样本的总RNA分别进行质检,若提取的总RNA无污染、完整且无明显降 解,则进行后续步骤;
[0007] 利用mRNA的3'端单端特异性对两组总RAN进行测序,构建mRNAs的3'端非翻译 区文库;
[0008] 使用FastQC软件对构建的3'端非翻译区文库中碱基的有效reads数进行质量评 估;
[0009] 对于有两个或多个串联的polyA位点而且在两个样本中都表达的基因,使用线性 趋势检测的方法进行APA位点转化事件检验,获得加长的3'端非翻译区基因与缩短的3' 端非翻译区基因的多态性散点数据;
[0010] 使用在线DAVID工具进行差异基因富集的G0功能分析,选取P值小于0. 1的G0 和KEGG pathway的为功能富集结果,得到系统性红斑狼疮患者与健康对照组的3'端非翻 译区长度差异基因。
[0011] 在其中一个实施例中,所述外周血单个核细胞采集自外周静脉血,所述提取外周 血单个核细胞的总RNA是先使用Ficoll密度梯度离心法从所述外周静脉血分离出所述外 周血单个核细胞,然后使用Trizol法从所述外周血单个核细胞中提取所述总RNA。
[0012] 在其中一个实施例中,所述对两组测序样本的总RNA分别进行质检是:当使用琼 脂糖凝胶电泳检测总RNA样品的完整度,当观察到到28S和18S两条清晰的条带时,表明所 述提取的总RNA完整且无明显降解;当使用紫外分光光度计测得0D260/0D280在1. 8~2. 2 之间,说明无 DNA或蛋白质污染。
[0013] 在其中一个实施例中,所述分析方法还包括在构建得到mRNAs的3'端非翻译区文 库之后,使用安捷伦2100生物分析仪检测文库片段主峰,并检测是否存在杂吸收峰,以检 测构建的文库质量的步骤。
[0014] 在其中一个实施例中,所述使用FastQC软件对构建的3'端非翻译区文库中碱基 的有效reads数进行质量评估是检测单个样品单端测序有效reads数是否大于10M,若大于 10M,则满足质量要求。
[0015] 在其中一个实施例中,所述分析方法还包括从得到的所述3 '端非翻译区长度差异 基因中选取部分或全部基因,使用RTQ-PCR技术验证系统性红斑狼疮患者与健康对照组的 3'端非翻译区长度差异情况的步骤。
[0016] 在其中一个实施例中,选取的3'端非翻译区长度差异基因为Jun、UBE2J2及 CALM3〇
[0017] -种系统性红斑狼疮3'端非翻译区长度差异基因,通过使用上述任一项所述的系 统性红斑狼疮3'端非翻译区长度差异基因的分析方法分析得到。
[0018] 在其中一个实施例中,所述3'端非翻译区长度差异基因为Jun、UBE2J2及CALM3。
[0019] 上述分析得到的系统性红斑狼疮3'端非翻译区长度差异基因可应用在制备诊断 系统性红斑狼疮检测试剂或检测装置中。
[0020] 本发明通过对系统性红斑狼疮患者与健康对照组的外周血单个核细胞中3'端非 编码区基因长度多态性进行研究,并检测系统性红斑狼疮患者mRNA差异表达水平,对研究 系统性红斑狼疮的发病机理以及临床诊断和治疗系统性红斑狼疮具有重要的意义。但由于 系统性红斑狼疮是一种复杂的综合病征,诊断时需要考虑多方面的因素,上述分析方法以 及得到的3'端非翻译区长度差异基因只作为诊断系统性红斑狼疮疾病的中间结果,然而虽 为中间结果,却有利于探明3'端非编码区长度差异基因 mRNA的表达水平与系统性红斑狼 疮疾病活动度及不同临床病症之间的关系,验证各种诊断标记物及药物靶点,并有助于开 发新型系统性红斑狼疮靶向治疗药物。
【附图说明】
[0021] 图1为样品总RNA的琼脂糖凝|父电泳图;
[0022] 图2为健康对照组的文库片段分布图,横坐标表示核酸片段的长度,纵坐标表示 荧光值;
[0023] 图3为SLE组的文库片段分布图,横坐标表示核酸片段的长度,纵坐标表示荧光 值;
[0024] 图4为reads测序质量分布图,其中,横轴表示reads上的碱基位置,纵轴表示测 序质量分数,测序质量分数越高表明测序的错误率越小(错误率=10-测序质量分数/10), 图中,红色、黄色、绿色区域分别表示质量分数为20以下,20~28, 28~40 ;黑色曲线表示 质量分数的平均数,红色短横线表示中位数,黄色方框的上下端分别表示所有reads在该 位置上碱基质量排名前25%和75%的质量分数,方框外部的上下两条黑色短横线则分别 表示前10 %和90 %的质量分数;
[0025] 图5为对照组与SLE组的3'UTR长度多态性散点图,该散点图是将tandem APA位 点switch指数(TSI)对应SLE样品和健康对照样品表达水平比值的对数作图,其中,横轴 代表TSI,正的TSI值表明SLE组样品中倾向使用较长的3'UTR,具有明显的tandem 3'UTR 长度变化的基因(FDR〈0. 01)用不同颜色标出:使用较长3'UTR的基因标记为蓝色,使用较 短3' UTR的基因标记为红色,Y轴代表SLE样品和健康对照组样品表达水平比值的对数。
【具体实施方式】
[0026] 下面主要结合附图及具体实施例对系统性红斑狼疮3'端非编码区长度差异基因 及其分析方法和应用做进一步详细的说明。
[0027] 材料与方法
[0028] 1.系统性红斑狼疮患者及健康对照组的选取
[0029] 2013年9月~10月期间在桂林市第181医院SLE患者9人,均为女性,年龄25~ 58岁,平均年龄44. 8+9. 40岁,诊断标准符合美国风湿病协会(ARA) 1997年修订的SLE诊断 标准。健康对照组9人,年龄24~48岁,平均年龄40. 2+7. 19岁,健康对照组本人及其直 系亲属无自身免疫性疾病史,且采血前一周无身体不适症状,未服用激素或其他药物。本研 究通过本单位医学伦理会审查,所有被采血者知情且同意。
[0030] 2.样品提取
[0031] 使用EDTA抗凝管采集9例健康对照组和9例SLE患者(皮肤和肾脏受累型) 的外周静脉血,每人3ml,Ficoll密度梯度离心法分离出外周血单个核细胞(PBMC), Trizol (Cat. no. 15596-026,Invitrogen公司)法提取各样品总RNA,每组的9例样品均勾 混合成一个样品池,因而,共得到两组样品。
[0032] 可理解,在其他实施例中,该外周静脉血样品也可以直接取自医院或相关研究结 构的血库。
[0033] 3.RNA 质检
[0034] 总RNA主要包括2~3 %的信使RNA (mRNA)、15~20 %的转运RNA和80~85 % 的核糖体RNA。总RNA真核:28s+18s,当28sRNA为18sRNA量的1~2倍时,表明RNA较完 整,否则表示RNA已发生降解。使用微量紫外分光光度计(NanoDrop ND-1000,Nanodrop公 司)检测样品RNA总量>3 yg(其中lyg用于样品质检,0.5 yg用于3'端非编码区(以 下简称为3' UTR)文库的制备,0. 5 μ g用于实验备份,1 μ g用于实验验证),0D260/280值 在1. 8~2. 2之间,说明样品无 DNA或蛋白质污染。使用琼脂糖凝胶电泳检测总RNA样品 完整度,结果如图1所示,可见28S、18S和5S3个条带,且28S和18S条带清晰,表明所抽提 的总RNA较完整无明显降解,可用于进一步逆转录使用。
[0035] 4.文库制备与质检
[0036] 利用mRNA的3'端单端特异性对两组总RAN进行测序,构建mRNAs的3'端非翻译 区文库。
[0037] 构建文库后,使用安捷伦2100生物分析仪(Agilent Bioanalyzer 2100,Agilent 公司)检测文库片段主峰,并检测是否存在杂吸收峰,杂峰会影响测序有效数据量。使用 StepOne? Real-Time PCR System(Applied Biosystems⑧)检测文库浓度 >lng/μ L。图 2和图3显示两组文库片段大小都分布在350bp左右(180-680bp),同下表1检测数据一起 说明制备的文库质量合格。
[0038] 表1 3'UTR文库质检数据
[0039]
[0040] 5.测序数据统计结果与质量评估
[0041] 使用软件FastQC (Version 0. 9)对碱基质量分别进行评估。图4所示的reads测 序质量分布结果表明测序数据满足单个样品单端测序有效reads数大于10M的质量要求。
[0042] 5. ISLE患者3' UTR长度差异情况及功能分析
[0043] 测序大部分的reads均定位到人类参考基因组上,其中大多数reads唯一定位到 核基因组上。对于有两个或多个串联polyA位点而且在两个样品里都表达的基因,使用线 性趋势检验的方法进行APA位点转化(switch)事件检验,获得加长的3'UTR基因与缩短的 3' UTR基因之间的多态性散点图,如图5所示。
[0044] 差异基因富集的G0功能采用在线(web)工具DAVID (http: //david. abcc. ncifcrf. gov)实现;选取P值小于0· 1的GO和KEGG通路(KEGG pathway)的为功能富集 结果。样品配对中3' UTR长度差异基因共有904个,富集的GO和KEGG pathway的功能富 集的统计结果如表2所示。
[0045] 表2对照组与SLE组配对中差异3'UTR基因富集的G0功能和KEGG pathway的数 目统计
[0046]
[0047] 上述分析得到的3' UTR长度差异基因(如Jun、UBE2J2、CALM3等)可以用于制备 诊断系统性红斑狼疮检测试剂或检测装置,以为诊断系统性红斑狼疮提供中间结果支持, 结合其他数据或检测结果,最终判断为是否是患有系统性红斑狼疮。
[0048] 5. 2差异基因表达量及其G0和KEGG pathway富集分析
[0049] 由于所用测序方法只对mRNAs的3'末端进行测序,因此,在基因表达量进行估计 时,定位到基因上的reads数目即代表该基因在该样品中的表达量。将表达的基因按照3 倍差异分为上调表达和下调表达的两组。筛选出FDR〈0. 01的差异表达基因共1597个。样 品配对中差异表达基因富集的GO和KEGG pathway的统计结果见表3。
[0050] 表3对照组与SLE组样品配对中差异表达基因富集的G0功能和KEGG pathway的 数目统计
[0051]
[0052] 6.验证
[0053] 采用RTQ-PCR技术,选取其中3个3'UTR长度差异基因:Jun、UBE2J2、CALM3jiE SLE患者组和健康对照组的PBMC中mRNA的3'UTR长度变化情况。结果显示这3个基因均 有良好的扩增曲线和溶解曲线,表明反应体系稳定,扩增产物单一,引物是特异的,无杂带、 无杂信号,验证结果与测序结果相符,即Jun、CALM3倾向有缩短的3' UTR,UBE2J2倾向有变 长的3' UTR。
[0054] 本实施例以外周血单核细胞(PBMC)用于SLE的研究对象,不仅易于获取,并且较 少受到医学伦理限制,更重要的是PBMC是SLE发病的主要效应组分,比人为制作的疾病动 物模型更直接地反应疾病发生发展,而且更客观地判断某种检测手段临床应用的可行性。
[0055] SLE患者T淋巴细胞及B淋巴细胞高度活化,并且自发凋亡的淋巴细胞比例显著增 高,有可能超过巨噬细胞的清除能力。另一方面,吞噬功能障碍,也会使得凋亡细胞不能及 时被清除以致大量自身抗原释放,诱发自身免疫。SLE临床表现多样,包括红斑、光敏感、关 节炎和中枢神经系统损害、血管损害、肾脏损害等。本实施例方法中KEGG信号通路(KEGG pathway)分析显示:SLE组样品中表达上调基因涉及细胞周期、吞噬作用、造血细胞系、肌 动蛋白细胞骨架的调控、霍乱弧菌感染、抗原加工和呈递、溶酶体、孕激素介导的卵母细胞 成熟、系统性红斑狼疮(白细胞介素10、组蛋白酶G(cath印sin G)、肿瘤坏死因子等12个相 关基因)、粘着连接等16条KEGG通路;下调的基因涉及致心律失常性右室心肌病、肥厚型 心肌病、造血细胞系、扩张型心肌病等6条KEGG通路。与健康对照组相比,SLE组中3' UTR 长度差异基因富集的KEGG信号通路分析显示:倾向使用较长3' UTR的基因涉及泛素介导 的蛋白水解、蛋白出口 2条KEGG通路;倾向使用较短3 ' UTR的基因涉及细胞内吞、Notch信 号传导途径、趋化因子、神经营养因子信号通路、B细胞受体信号传导途径、粘着连接等24 条KEGG通路。这些信号通路都与SLE患者临床症状以及并发症密切相关。对于SLE这种 复杂疾病,研究3' UTR长度多态性可能是探究发病机制的一个新视点。
[0056] SLE多发于育龄期女性,男女患病率之比约为1 : 9,此病具有高度的遗传倾向性 及家族聚集性,同胞的患病风险是正常人的8倍以上,同卵双生子的发病一致率为40%,异 卵双生子为4%,中国汉族人群的遗传度为43. 6%,但并不呈孟德尔模式遗传。SLE的免疫 异常与多条免疫信号通路(如NF- κ B信号通路、Toll-like受体信号通路、JAK/STAT信号 通路等)紊乱密切相关。通过3'单端特异测序,实验结果获得大量可能与SLE发病机制有 关的基因,以下是对验证实验所挑选的3个基因的介绍。
[0057] Jun是一种转录因子,识别并结合七聚体基序5' -TGA[CG]TCA-3'。磷酸化能增强 其转录活性,属于bZIP类家庭,与HIVEP3、SMAD3/SMAD4、TCF20、C0PS5等反应,能间接导致 DSIPI磷酸化,抑制API与其靶DNA的结合。c-Jun调节血管平滑肌细胞的生长和动脉损伤 后新内膜的形成。Jun蛋白能与雌激素受体协同作用,调节生理过程,在细胞吞噬,细胞增 殖、分化、凋亡和肿瘤发生中发挥重要作用。例如,c-Jun的下调促进细胞凋亡。Jun涉及 人皮肤成纤维细胞的感应UV照射的Smad7的基因表达,也与红斑狼疮转录调控有关。激活 c-jun途径可能是他克莫司治疗风湿性关节炎的效应靶点。
[0058] UBE2J2催化泛素与其他蛋白质共价结合,参与蛋白质修饰、蛋白质泛素化,属于泛 素结合酶家族。其在选择性降解内质网中错误折叠的膜蛋白等方面起作用。
[0059] CALM3属于钙调蛋白家族,在整个间期细胞分布,有丝分裂过程中会集中在纺锤体 微管。其与CEP97、CEP110、TTN/肌联蛋白和SRY等相互作用,与细胞凋亡、血小板聚集、雌 激素效应、脑损伤有关,可能是SLE易感性的危险因素。
[0060] SLE是一种复杂的多基因疾病,并非所有携带易感基因的人都会发病。除遗传因素 外,表观遗传机制在SLE的发病机制中也起着重要作用。miRNA通过与靶mRNA的3'端不 翻译区(3'UTR)不完全互补结合,阻遏转录后的翻译过程,从而抑制蛋白质的合成,调控基 因表达。根据测序结果中差异基因数目统计,推测3'UTR长度的缩短,可能导致一些miRNA 结合位点的缺失,miRNA的负调控作用减弱,从而使一些基因表达上调。除了 3'UTR长度多 态性在SLE易感基因变异方面的影响,3' UTR可能也通过miRNA以及DNA的甲基化等表观 遗传学调控网络参与SLE发病。
[0061] 本发明通过对系统性红斑狼疮患者与健康对照组的外周血单个核细胞中3'端非 编码区基因长度多态性进行研究,并检测系统性红斑狼疮患者mRNA差异表达水平,对研究 系统性红斑狼疮的发病机理以及临床诊断和治疗系统性红斑狼疮具有重要的意义。但由于 系统性红斑狼疮是一种复杂的综合病征,诊断时需要考虑多方面的因素,上述分析方法以 及得到的3'端非翻译区长度差异基因只作为诊断系统性红斑狼疮疾病的中间结果,然而虽 为中间结果,却有利于探明3'端非编码区长度差异基因 mRNA的表达水平与系统性红斑狼 疮疾病活动度及不同临床病症之间的关系,验证各种诊断标记物及药物靶点,并有助于开 发新型系统性红斑狼疮靶向治疗药物。
[0062] 以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并 不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员 来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保 护范围。因此,本发明专利的保护范围应以所附权利要求为准。
【主权项】
1. 一种系统性红斑狼疮3'端非翻译区长度差异基因的分析方法,其特征在于,包括如 下步骤: 对系统性红斑狼疮患者和健康对照组分别提取外周血单个核细胞的总RNA,得到两组 测序样本; 对两组测序样本的总RNA分别进行质检,若提取的总RNA无污染、完整且无明显降解, 则进行后续步骤; 利用mRNA的3'端单端特异性对两组总RAN进行测序,构建mRNAs的3'端非翻译区文 库; 使用FastQC软件对构建的3'端非翻译区文库中碱基的有效reads数进行质量评估; 对于有两个或多个串联的polyA位点而且在两个样本中都表达的基因,使用线性趋势 检测的方法进行APA位点转化事件检验,获得加长的3'端非翻译区基因与缩短的3'端非 翻译区基因的多态性散点数据; 使用在线DAVID工具进行差异基因富集的GO功能分析,选取P值小于0. 1的GO和KEGG pathway的为功能富集结果,得到系统性红斑狼疮患者与健康对照组的3'端非翻译区长度 差异基因。2. 如权利要求1所述的系统性红斑狼疮3'端非翻译区长度差异基因的分析方法,其 特征在于,所述外周血单个核细胞采集自外周静脉血,所述提取外周血单个核细胞的总RNA 是先使用Ficoll密度梯度离心法从所述外周静脉血分离出所述外周血单个核细胞,然后 使用Trizol法从所述外周血单个核细胞中提取所述总RNA。3. 如权利要求2所述的系统性红斑狼疮3'端非翻译区长度差异基因的分析方法,其特 征在于,所述对两组测序样本的总RNA分别进行质检是:当使用琼脂糖凝胶电泳检测总RNA 样品的完整度,当观察到到28S和18S两条清晰的条带时,表明所述提取的总RNA完整且无 明显降解;当使用紫外分光光度计测得0D260/0D280在1. 8~2. 2之间,说明无 DNA或蛋白 质污染。4. 如权利要求3所述的系统性红斑狼疮3'端非翻译区长度差异基因的分析方法,其特 征在于,还包括在构建得到mRNAs的3'端非翻译区文库之后,使用安捷伦2100生物分析仪 检测文库片段主峰,并检测是否存在杂吸收峰,以检测构建的文库质量的步骤。5. 如权利要求4所述的系统性红斑狼疮3'端非翻译区长度差异基因的分析方法,其特 征在于,所述使用FastQC软件对构建的3'端非翻译区文库中碱基的有效reads数进行质 量评估是检测单个样品单端测序有效reads数是否大于10M,若大于10M,则满足质量要求。6. 如权利要求5所述的系统性红斑狼疮3'端非翻译区长度差异基因的分析方法,其 特征在于,还包括从得到的所述3'端非翻译区长度差异基因中选取部分或全部基因,使用 RTQ-PCR技术验证系统性红斑狼疮患者与健康对照组的3'端非翻译区长度差异情况的步 骤。7. 如权利要求6所述的系统性红斑狼疮3'端非翻译区长度差异基因的分析方法,其特 征在于,选取的3'端非翻译区长度差异基因为Jun、UBE2J2及CALM3。8. -种系统性红斑狼疮3'端非翻译区长度差异基因,其特征在于,通过使用如权利要 求1~7中任一项所述的系统性红斑狼疮3'端非翻译区长度差异基因的分析方法分析得 到。9. 如权利要求8所述的系统性红斑狼疮3'端非翻译区长度差异基因,其特征在于,所 述3'端非翻译区长度差异基因为Jun、UBE2J2及CALM3。10. 如权利要求8或9所述的系统性红斑狼疮3'端非翻译区长度差异基因在制备诊断 系统性红斑狼疮检测试剂或检测装置中的应用。
【文档编号】C12N15/11GK105986014SQ201510057183
【公开日】2016年10月5日
【申请日】2015年2月2日
【发明人】眭维国, 戴勇, 郑燦
【申请人】眭维国, 戴勇
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1