一种基于泛癌表达谱筛选出的新型微肽及其应用

文档序号:26757984发布日期:2021-09-25 04:48阅读:378来源:国知局
一种基于泛癌表达谱筛选出的新型微肽及其应用

1.本发明涉及生物医药技术领域,具体是一种基于泛癌表达谱筛选出的新型微肽、筛选方法及其在抑制肝癌药物中的应用。


背景技术:

2.癌症研究的科学进展是以患者为中心的[salamonejm,lucasw,brundagesb,hollowayjn,stahlsm,carbinene,londonm,greenwoodn,goyesr,chisholmdc.promotingscientist

advocatecollaborationsincancerresearch:whyandhow.cancerresearch2018,78(20):5723

5728.]。在过去的十年,全基因组泛癌分析呈增长趋势。越来越多的科学家致力于研究癌症的机制,希望通过更新诊断和治疗方法来延长癌症患者的生存期。
[0003]
泛癌研究日益被认为是全球范围内严重的公共卫生问题。癌症是由基因变化驱动的,大规模并行测序已在整个基因组范围内系统地记录了这种变异[paczkowskam,barenboimj,sintupisutn,foxns,zhuh,abd

rabbod,meemw,boutrospc,reimandj.integrativepathwayenrichmentanalysisofmultivariateomicsdata.naturecommunications2020,11(1):1

16.]。
[0004]
谷光甘肽基因集还可能对多种癌症形式的治疗耐药性相关。尽管对谷光甘肽家族在癌症中的研究非常广泛,但很难解释其在肿瘤中的双重功能。现有研究缺乏对泛癌中谷光甘肽基因集的系统研究,也缺乏对谷光甘肽基因集作为治疗潜在生物标志物的敏感性的研究。
[0005]
微肽(micropeptide)是小的开放阅读框编码的小多肽[vitorinor,guedess,amadof,santosm,akimitsun.theroleofmicropeptidesinbiology.cellularandmolecularlifesciences2021:1

14.],长度小于100

150个氨基酸(aminoacids,aa),也被称为微蛋白(microproteins)或小开放阅读框编码肽(shortopenreadingframes,sorf

encodedpeptides),也可用其基因组位置命名,其被证实可作用于维持细胞稳态[sousame,farkasmh.micropeptide.plosgenetics2018,14(12):e1007764.]。非编码rna(circrna、lncrna和pri

mirna)具有潜在的短开放阅读框,可以编码微肽,非编码rna编码的短肽与肿瘤密切相关,可作为肿瘤的潜在预后标志物和治疗靶点。
[0006]
基因集是指具有遗传特性的基因编码的集合,gsh是指谷胱甘肽的简称,lncrna是长链非编码rna的简称;cerna机制是指一种rna间相互作用的新机制;gls是谷光甘肽代谢基因的简称,谷光甘肽代谢基因gls在肝癌中相对高表达会导致高风险;lihc是肝癌的简称;gepia2是一个在线tcga基因表达和生存分析的工具;smorfunction是一款预测小型开放阅读框架和微蛋白质功能的工具。mipepid是一种通过机器学习的方法预测微肽的工具(mipepid:micropeptideidentificationtoolusingmachinelearning。)


技术实现要素:

[0007]
发明目的:本发明提供一种基于泛癌表达谱筛选出的新型微肽、筛选方法及其在抑制肝癌药物中的应用,
[0008]
技术方案:
[0009]
一种基于泛癌表达谱筛选出的新型微肽,所述微肽由lncrna ac078846编码得到的 ac078846

aa。
[0010]
一种基于泛癌表达谱筛选出的微肽ac078846

aa在抑制肝癌药物中的应用。
[0011]
一种微肽ac078846

aa的筛选方法,包括如下筛选步骤:
[0012]
s1、使用生物信息学数据库对谷光甘肽基因集的筛选;
[0013]
s2、对s1中筛选出的谷光甘肽基因集在泛癌中的显著差异表达及生存分析,筛选出在肝癌中既显著高表达又高风险预后不良的gls;
[0014]
s3、肝癌中gls的验证及cerna预测,筛选得到lncrna ac078846并进行验证,验证多数据库中lihc与正常组织对比的显著差异表达情况;
[0015]
s4、对lncrna ac078846编码得到微肽ac078846

aa进行鉴定及功能分析。
[0016]
进一步的,所述s1包括如下步骤:
[0017]
步骤1、结合msigdb和wikigene数据库对人源谷光甘肽基因集进行筛选;
[0018]
步骤2、搜索pubmed数据库,收集谷光甘肽基因集在肿瘤及胶质瘤中的研究进展;
[0019]
步骤3、使用string在线平台对谷光甘肽基因集进行ppi网络构建,获取蛋白互作信息,且结合功能富集分析。
[0020]
进一步的,所述步骤3中功能富集分析采用kegg/reactome pathway和go注释。
[0021]
进一步的,所述s2包括如下步骤:
[0022]
步骤a、下载tcga数据库中泛癌的表达与临床数据,geo数据库与gtex数据库中正常组织的表达谱数据,分别提取每种肿瘤与正常组织的数据,处理并去除批次效应,计算每种肿瘤的显著差异表达基因,并提取谷光甘肽基因集在泛癌中的显著差异表达情况;
[0023]
步骤b、用tcga泛癌表达谱数据计算谷光甘肽基因集相关的患者总生存期;
[0024]
步骤c、绘制sankey图展示谷光甘肽基因集在泛癌中的显著差异与生存情况,并着重展示谷光甘肽基因集在肿瘤中高表达且预后不良的gls;
[0025]
步骤d、筛选出在肝癌中既显著高表达又高风险预后不良的gls。
[0026]
进一步的,所述步骤a中计算每种肿瘤的显著差异表达基因中设置的计算条件为 |logfc|>1,adjustedp

value<0.05;
[0027]
所述步骤b中用tcga泛癌表达谱数据计算谷光甘肽基因集相关的患者总生存期采用cox算法。
[0028]
进一步的,所述s3包括如下步骤:
[0029]
步骤a、联合lncevar分析器和multimir数据库进行gls相关cerna的预测,筛选出关键lncrna,所述关键lncrna包括lncrna ac078846;
[0030]
步骤b、使用gepia2/embl

ebi/geo对gls和lncrna ac078846进行验证,验证多数据库中lihc与正常组织对比的显著差异表达情况。
[0031]
进一步的,所述s4包括如下步骤:
[0032]
步骤ⅰ、采用mipepid进行lncrna ac078846编码对微肽预测,得到微肽 ac078846

aa;
[0033]
步骤ⅱ、将预测的微肽ac078846

aa定位到人类染色体中,对与ac078846同染色体的微肽进行分析;
[0034]
步骤ⅲ、使用smorfunction对预测到的微肽ac078846

aa进行鉴定与功能富集分析。
[0035]
有益效果:
[0036]
1)本发明从泛癌角度鉴定谷光甘肽基因集在癌症中的作用,并为个性化癌症治疗提供新的靶点。
[0037]
2)本发明通过生物信息学结合数据库分析,筛选鉴定了lncrna编码的微肽 ac078846

aa靶向肝癌中的谷光甘肽代谢基因gls,阻断lncrna ac078846/ hsa

mir

23a

3p/gls的cerna机制,进而抑制肿瘤的发生发展,对肝癌具有临床药用价值。
附图说明
[0038]
图1a是肿瘤中部分谷光甘肽代谢相关基因的sankey图。
[0039]
图1b是验证的cerna展示图。
[0040]
图2是谷光甘肽代谢相关基因功能富集分析。
[0041]
图3是lncrnaac078846及其编码的微肽ac078846

aa和gls的染色体定位图。
具体实施方式
[0042]
下面通过附图对本发明技术方案进行详细说明,但是本发明的保护范围不局限于实施例。
[0043]
一种基于泛癌表达谱筛选出的新型微肽,所述微肽为由lncrnaac078846编码得到的ac078846

aa。
[0044]
一种基于泛癌表达谱筛选出的微肽ac078846

aa在抑制肝癌药物中的应用。
[0045]
一种微肽ac078846

aa的筛选方法,包括如下筛选步骤:
[0046]
s1、使用生物信息学数据库对谷光甘肽基因集的筛选;
[0047]
s2、对s1中筛选出的谷光甘肽基因集在泛癌中的显著差异表达及生存分析,筛选出在肝癌中既显著高表达又高风险预后不良的gls;
[0048]
s3、肝癌中gls的验证及cerna预测,筛选得到lncrna ac078846并进行验证,验证多数据库中lihc与正常组织对比的显著差异表达情况;
[0049]
s4、对lncrna ac078846编码得到微肽ac078846

aa进行鉴定及功能分析。
[0050]
所述s1包括如下步骤:
[0051]
步骤1、结合msigdb和wikigene数据库对人源谷光甘肽基因集进行筛选;
[0052]
步骤2、搜索pubmed数据库,收集谷光甘肽基因集在肿瘤及胶质瘤中的研究进展;
[0053]
步骤3、使用string在线平台对谷光甘肽基因集进行ppi网络构建,获取蛋白互作信息,且结合功能富集分析,所述步骤3中功能富集分析采用kegg/reactome pathway 和go注释。
[0054]
所述s2包括如下步骤:
[0055]
步骤a、下载tcga数据库中泛癌的表达与临床数据,geo数据库与gtex数据库中正
常组织的表达谱数据,分别提取每种肿瘤与正常组织的数据,处理并去除批次效应,计算每种肿瘤的显著差异表达基因,设置的计算条件为|logfc|>1,adjustedp

value <0.05;并提取谷光甘肽基因集在泛癌中的显著差异表达情况;
[0056]
步骤b、用tcga泛癌表达谱数据采用cox算法计算谷光甘肽基因集相关的患者总生存期;
[0057]
步骤c、绘制sankey图展示谷光甘肽基因集在泛癌中的显著差异与生存情况,并着重展示谷光甘肽基因集在肿瘤中高表达且预后不良的gls;
[0058]
步骤d、筛选出在肝癌中既显著高表达又高风险预后不良的gls。
[0059]
所述s3包括如下步骤:
[0060]
步骤a、联合lncevar分析器和multimir数据库进行gls相关cerna的预测,筛选出关键lncrna,所述关键lncrna包括lncrna ac078846;
[0061]
步骤b、使用gepia2/embl

ebi/geo对gls和lncrna ac078846进行验证,验证多数据库中lihc与正常组织对比的显著差异表达情况。
[0062]
所述s4包括如下步骤:
[0063]
步骤ⅰ、采用mipepid进行lncrna ac078846编码对微肽预测,预测准确率 probability>0.99,得到微肽ac078846

aa;
[0064]
步骤ⅱ、将预测的微肽ac078846

aa定位到人类染色体中,对与ac078846同染色体的微肽进行分析;
[0065]
步骤ⅲ、使用smorfunction对预测到的微肽ac078846

aa进行鉴定与功能富集分析。
[0066]
图1a是肿瘤中部分谷光甘肽代谢相关基因的sankey图,up&risky指显著上调且预后不良的谷光甘肽代谢基因,gls在肝癌中显著高表达且预后不良。
[0067]
图1b是验证的cerna展示图。图1b说明了经multimir包得到的已经实验验证过的cerna信息。lncrnaac078846.1/hsa

mir

23a

3p/gls的cerna机制如图所示。
[0068]
图2是谷光甘肽代谢相关基因功能富集分析。图2说明了谷光甘肽代谢基因主要与哪些功能、通路密切相关,其中最显著相关的是代谢。
[0069]
图3是lncrnaac078846及其编码的微肽ac078846

aa和gls的染色体定位图。图3中micropeptide ac078846.1是指微肽ac078846

aa。图3说明了lncrnaac078846和微肽ac078846

aa及其预测的功能微肽均位于人类第七号染色体。
[0070]
用tcga泛癌表达谱数据采用cox算法计算谷光甘肽基因集相关的患者总生存期;绘制sankey图展示谷光甘肽基因集在泛癌中的显著差异与生存情况,并着重展示谷光甘肽基因集在肿瘤中高表达且预后不良的gls;筛选出在肝癌中既显著高表达又高风险预后不良的gls,如图1a所示。联合lncevar分析器和multimir数据库进行gls 相关cerna的预测,筛选出关键lncrna,所述关键lncrna包括lncrna ac078846 如图1b所示。采用mipepid进行lncrna ac078846编码对微肽预测,预测准确率 probability>0.99,得到微肽ac078846

aa;将预测的微肽ac078846

aa定位到人类染色体中,对与ac078846同染色体的微肽进行分析;使用smorfunction对预测到的微肽ac078846

aa进行鉴定与功能富集分析如图3所示。体现了微肽ac078846

aa靶向肝癌中的谷光甘肽代谢基因gls,阻断lncrnaac078846/hsa

mir

23a

3p/gls的 cerna机制,进而抑制肿瘤的发生发展,说明了微肽ac078846

aa可以用
于治疗肝癌药物。
[0071]
如上所述,尽管参照特定的优选实施例已经表示和表述了本发明,但其不得解释为对本发明自身的限制。在不脱离所附权利要求定义的本发明的精神和范围前提下,可对其在形式上和细节上作出各种变化。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1