一种谱筛查十一种疾病的基因标志物组合、试剂盒以及疾病风险预测模型的制作方法

文档序号:9466932阅读:484来源:国知局
一种谱筛查十一种疾病的基因标志物组合、试剂盒以及疾病风险预测模型的制作方法
【技术领域】
[0001] 本发明属于分子生物学技术领域,具体设及一种利用外周血基因表达谱筛查十一 种疾病的基因标志物组合W及疾病风险预测模型,根据外周血中肺癌、胃癌、肝癌、鼻咽癌、 前列腺癌、乳腺癌、宫颈癌、大肠癌、溃瘍性结肠炎、克罗恩氏症和骨关节炎十一种疾病的特 征性基因表达信号,构建疾病发生的风险预测模型,可同时用于多种疾病的早期诊断、预后 W及监测。
【背景技术】
[0002] 血液不间断地循环流动和与周围组织细胞持续地相互作用,运个动态系统可W接 收、传输和响应众多的生物信号。它参与了几乎所有细胞、组织和器官的调控、监测、代谢W 及免疫功能的维持等。血液细胞向组织细胞输送营养物质、氧气和生物分子,并带走二氧化 碳W及其它的的代谢产物,组织细胞间的微环境的生物分子、理化分子的组成、浓度W至酸 碱度都保持在一个恒定的水平。血液所有运些行为或功能,都可Wi全释为维系机体的动态 平衡,保证机体的正常功能。同时密切对整个机体进行免疫监测,损伤、炎症和疾病等机体 的异常情况,造成内环境的局部失衡。与血液细胞的信息交流及相互作用,激活机体的免疫 机制,免疫因子和愈合介质等成份通过血液运送到损伤、感染或疾病的部位。
[0003] 在周而复始、循环流动的血液与机体组织细胞相互作用W及机体维持内环境稳态 的机制作用下,因为疾病、炎症及损伤所导致的内环境的改变,通过血液细胞感知并传递信 息,激活机体的免疫及/或修复机制。血液细胞也受感应产生相对应的变化,通过对其基因 表达的转录子的定量检测,可W识别和验证与疾病或机体状况紧密相关联的特征基因。不 同组织、不同部位的异常变化都反应在同一流动中的血液系统中,而且每一种疾病对外周 血基因表达产生的影响也各不相同,因此可W通过对外周血基因表达谱的分析,筛选出疾 病特征性的基因表达信号。运种监测、检测血液细胞转录子的方法有很大的潜力,使我们能 够从一个单一的血液样本,同时监测机体内不同组织、器官W及不同部位的多种疾病或健 康状态的异常。而且运种疾病诱导的外周血基因表达变化远早于机体产生明显的体征变 化,通过紧密监测白细胞基因的表达谱,可W敏感地捕捉到体内肿瘤等恶性疾病发生的微 信息,为疾病早期检测、监测提供可靠证据。
[0004] 因此,通过对外周血基因表达谱的分析,筛选出疾病特征性的基因表达座号,对疾 病,尤其是早期疾病有很好的预测作用。该方法可W作为非侵入性的取样和检测方式,部分 替代体内组织进行活检,了解体内疾病特征性基因的表达水平。而且运种基于外周血基因 表达谱的疾病检测技术,允许获得更大的样本量,建立更好的标准化技术规程,非常适合大 规模的人群疾病筛查和早期诊断。
[0005] 专利号为201010502553. 9,公开了一种用于鼻咽癌早期诊断的外周血7个基因标 志物的检测试剂盒,对鼻咽癌病人和正常人的外周血总RNA样品进行人类全基因表达谱忍 片检测,从差异基因中筛选出特征基因,经过验证后建立鼻咽癌诊断模型。该方法利用支持 向量机(SuppodVectorMachine,简称SVM)统计算法筛选外周血中的鼻咽癌特征基因和 构建判别模型。但是该模型对鼻咽癌的判别准确性仅为80%左右,主要诊断指标ROCAUC 值为0.82。由于模型构建时仅对鼻咽癌病人和正常人进行检测,没有将其它疾病患者的 疾病特征性基因纳入模型构建,因此该检测试剂盒无法将鼻咽癌与其他疾病进行较好的甄 别。

【发明内容】
本发明采用独创的"化eAgainstAll"和逻辑回归分析方法筛选疾病外周血基因标 志物和构建疾病预测模型,通过基因与目标疾病、健康对照W及目标疾病W外的其它疾病 对照(diseasecontrol)的相关性分析筛选出疾病侯选基因,然后再对运些侯选基因进 行随机组合,形成若干侯选基因组合(genepanel),最后采用随机抽样法和逻辑回归分析 (logisticregression)方法评估运些侯选基因组合对疾病的诊断作用,从中筛选出对疾 病、健康对照W及疾病对照有最佳甄别作用的特征基因组合并构建疾病的风险预测模型, 可W同时检测十一种疾病发生的风险程度,而非仅仅检测单一一种疾病。利用本发明所述 方法筛选出的疾病特征基因和风险预测模型对疾病有更好的甄别作用,其判读核屯、指标 ROCAUC(Receive;rOperatingQiaracteristic,AreaUnderQirve)达到0.9左右,对疾病 的筛查指标显著优于现有技术。
[0007] 本发明具体技术方案如下: 一种利用外周血基因表达谱筛查十一种疾病的基因标志物组合,由肺癌、胃癌、肝癌、 鼻咽癌、前列腺癌、乳腺癌、宫颈癌、大肠癌、溃瘍性结肠炎、克罗恩氏症和骨关节炎十一种 疾病的特征性基因库组成: 肺癌特征性基因库:QKKCieodSO、PUM2、MLL3、ClodSS; 胃癌特征性基因库:SLC6A6、KPNB1、抑FT1、服PD1、MLL3、ATP50 ; 肝癌特征性基因库:THRAP2、C14o计 119、CYFIP2、CUGBP2、ZMYM6 ; 鼻咽癌特征性基因库:S0D1、USP7、TMEM183A/B、LIMSl、KMT2C、NUFIP2 ;前列腺癌特征性基因库:84228、?504、了]\^]\1204、1抑〇)0152/7/10(:541471、?齡口'尺2; 乳腺癌特征性基因库:邸TBD2、TUBGCP3、ZBTB7A、ZNF182、LYPLAl、OGT; 宫颈癌特征性基因库:USP7、R0PN1L、ERGIC1、ZFP62; 大肠癌特征基因库:MYCBP2、CACYBP、AP化、CYFIP2、MTDH、REEP5;溃瘍性结肠炎特征性基因库:4服畑13、4〔40¥1^、]\^028;0臟1814、1]\^]\143; 克罗恩氏症特征性基因库:NFAT5、SIPAlLl、C6orflll、HISTlHlC、RBM7、GALNT7;骨关节炎症特征性基因库:G0LGA7、PTEN、ZBTB7A、NKTR、VDACl。
[0008] 核巧酸序列如下所示: 肺癌特征性基因库:QKI基因序列如SEQIDNO. 1所示;C16orf30基因序列如SEQ IDNO. 2所示;PUM2基因序列如沈QIDNO. 3所示;MLL3基因序列如沈QIDNO. 4所示; Clo计58基因序列如沈QIDNO. 5所示; 胃癌特征性基因库:SLC6A6基因序列如SEQIDNO. 6所示;KPNBl基因序列如SEQID NO. 7所示抑FTl基因序列如沈QIDNO. 8所示;服PDl基因序列如沈QIDNO. 9所示;MLL3 基因序列如沈QIDNO. 4所示;ATP50基因序列如沈QIDNO. 10所示; 肝癌特征性基因库:THRAP2基因序列如SEQIDNO. 11所示;CHorfl19基因序列如SEQ IDNO. 12所示;CYFIP2基因序列如沈QIDNO. 13所示;CUGBP2基因序列如沈QIDNO. 14 所示;ZMYM6基因序列如沈QIDNO. 15所示; 鼻咽癌特征性基因库:S0D1基因序列如SEQIDNO. 16所示;USP7基因序列如SEQID NO. 17所示;TMEM183A///TMEM183B基因序列如沈QIDNO. 18所示;LIMSl基因序列如沈Q IDNO. 19所示;KMT2C基因序列如沈QIDNO. 20所示;NUFIP2基因序列如沈QIDNO. 21 所示; 前列腺癌特征性基因库:BAZ2B基因序列如SEQIDNO. 22所示;PSD4基因序列如SEQ IDNO. 23 所示;TMEM204 基因序列如沈QIDNO. 24 所示;LINC00152///L0C541471 基因序 列如沈QIDNO. 25所示;PHACTR2基因序列如沈QIDNO. 26所示; 乳腺癌特征性基因库:邸TBD2基因序列如SEQIDNO. 27所示;TUBGCP3基因序列如SEQ IDNO. 28所示;ZBTB7A基因序列如沈QIDNO. 29所示;ZNF182基因序列如沈QIDNO. 30 所示;LYPLAl基因序列如SEQIDNO. 31所示;OGT基因序列如SEQIDNO. 32所示; 宫颈癌特征性基因库:USP7基因序列如SEQIDNO. 17所示;ROPNlL基因序列如SEQ IDNO. 33所示;ERGICl基因序列如沈QIDNO. 34所示;ZFP62基因序列如沈QIDNO. 35 所示; 大肠癌特征基因库:MYCBP2基因序列如SEQIDNO. 36所示;CACYBP基因序列如SEQID NO. 37所示;AP化基因序列如沈QIDNO. 38所示;CYFIP2基因序列如沈QIDNO. 13所示; MTDH基因序列如沈QIDNO. 39所示;REEP5基因序列如沈QIDNO. 40所示; 溃瘍性结肠炎特征性基因库:ANK畑13基因序列如SEQIDNO. 41所示;ACAD化基因序 列如沈QIDNO. 42所示;MED28基因序列如沈QIDNO. 43所示;TMEM43基因序列如沈QID NO. 44所示;DNAJB14基因序列如沈QIDNO. 45所示; 克罗恩氏症特征性基因库:NFA巧基因序列如SEQIDNO. 46所示;SIPA1L1基因序列如 沈QIDNO. 47所示;C6orflll基因序列如沈QIDNO. 48所示;HIST1H1C基因序列如沈Q IDNO. 49所示;RBM7基因序列如沈QIDNO. 50所示;GALNT7基因序列如沈QIDNO. 51所 示; 骨关节炎症特征性基因库:G0LGA7基因序列如SEQIDNO. 52所示;PTEN基因序列如SEQIDNO. 53所示;ZBTB7A基因序列如沈QIDNO. 29所示;NKTR基因序列如SEQIDNO. 54 所示;VDACl基因序列如沈QIDNO. 55所示。
[0009] 临床对患者针对上述^^一种疾病中的一项或几项进行诊断时,选择上述组合物中 的目标疾病的特征性基因库中的所有基因作为检测目标基因,通过检测基因表达水平,将 所述基因的表达水平代入相应的风险预测模型,得出受检者患上述十一种疾病中的一种或 几种疾病的风险程度。
[0010] 本发明还提供了上述基因标志物组合在制备十一种疾病的诊断试剂中的应用,所 述十一种疾病为肺癌、胃癌、肝癌、鼻咽癌、前列腺癌、乳腺癌、宫颈癌、大肠癌、溃瘍性结肠 炎、克罗恩氏症和骨关节炎。
[0011] 本发明还公开了一种利用外周血基因表达谱筛选疾病特征基因的方法,采用如下 步骤: (1)选择若干种疾病纳入筛选库,对每种疾病采集一定数量样本W及一定数量健康 人群样本,优选每种疾病至少包含8例目标疾病样本。使用人类全基因组表达谱忍片检 测所有样本的外周血总RNA样品,所述忍片可使用商业化的人类
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1