抗心肌纤维化药物的筛选方法与流程

文档序号:19379392发布日期:2019-12-11 00:12阅读:1000来源:国知局
抗心肌纤维化药物的筛选方法与流程

本发明属于生物医药技术领域,涉及一种抗心肌纤维化药物的筛选方法。



背景技术:

心肌纤维化是指在心肌的正常组织结构中胶原纤维过量积聚、心脏组织中胶原浓度显著升高或胶原成分发生改变。这些改变往往会严重影响心脏功能,导致多种心血管疾病的发生,并最终进展为心力衰竭。抗心肌纤维化是改善各种心血管疾病的关键治疗策略之一,但其药物研发以针对相关靶标的零散研究为主,缺乏系统性。

至今,已有很多心肌纤维化标志基因被发现,如骨膜蛋白(postn)、血小板源生长因子受体α(pdgfra)、盘状结构域受体2(ddr2)等。这些标志基因在正常心脏组织中没有或很少表达,但当发生心脏心肌纤维化时高度表达,和心肌纤维化的严重程度具有高度相关性。

传统方法主要定位于显著差异基因,这种只定位于差异基因的方法实际上会丢失很多有用信息,例如,差异基因显著性的标准选择不同,如p<0.01和p<0.05,结果选出的差异基因数目会大不相同。再比如,很多基因表达差异可能不是很大,但是作用很明显,就会被提前设定的差异倍数标准(如差异倍数>2等)筛除掉;难以大批量筛选,效率低、准确性差,极大程度上增加后期试验验证的成本。



技术实现要素:

为了解决上述问题,本发明提供一种抗心肌纤维化药物的筛选方法,以心肌纤维化标志基因和其它基因不同的相互作用为基础,构建组织特异性的心肌纤维化模块,通过计算机筛选抗心肌纤维化潜在药物,批量筛选,提高准确性,高效率、低成本,解决了现有技术中的问题。

本发明所采用的技术方案是,一种抗心肌纤维化药物的筛选方法,具体按照以下步骤进行:

s1,获取心肌纤维化的已知标志基因;

s2,利用已知标志基因在生物大数据中钓取与已知标志基因存在生物学关系的其它基因或蛋白质,并局限在心脏组织能够表达的基因上,构建特异性心肌纤维化病理基因模块;

s3,构建具有转录组学数据的药物数据集,获取药物转录谱数据;

s4,采用基因表达推演法根据药物的转录谱数据预测对应药物的抗心肌纤维化能力,根据药物的抗心肌纤维化能力筛选所需药物。

进一步的,所述s2中,特异性心肌纤维化病理基因模块包括共表达的病理基因模块、功能相关的病理基因模块和蛋白质相互作用的病理基因模块;所述共表达的病理基因模块,利用seek数据库,以心肌纤维化的已知标志基因为诱饵,提取和心肌纤维化的已知标志基因显著共表达的基因,利用hprd数据库基因组织特异性表达信息,保留在心脏组织中能够表达的基因;所述功能相关的病理基因模块,利用humanbase数据库提取和心肌纤维化的已知标志基因在功能上显著相关的心脏组织特异表达的基因;所述蛋白质相互作用的病理基因模块,利用蛋白质-蛋白质相互作用的数据,收集和心肌纤维化的已知标志基因具有蛋白质相互作用的其它基因,利用hprd数据库基因组织特异性表达信息,保留在心脏组织中能够表达的基因;特异性心肌纤维化病理基因模块为三种病理基因模块的并集、交集或单独的病理基因模块。

进一步的,所述s1中,心肌纤维化的已知标志基因包括骨膜蛋白、血小板源生长因子受体α、盘状结构域受体2。

进一步的,所述s3具体按照以下步骤进行:

s31,有机小分子类化合物:从pubchem分子数据库的ftp系统中获取所有化合物的名称和结构信息;利用mesh医学主题词系统,去除其中的无机化合物;找出包含化合物名称信息的gds数据,人工比对确认相应实验是针对药物进行的测序实验,下载相应的gds转录谱数据;

s32,中药复方和单味中药:首先在geo数据库中人工检索搜集中药转录谱数据;其次,从中药数据库中提取典型中药复方和单味中药的药物名称,在geo数据库中人工检索药物名称的拼音、英文、拉丁文获取典型中药复方和单味中药的组学数据;

s33,通过connectivitymap数据库获取有机小分子类化合物、中药复方和单味中药的药物诱导基因表达谱数据。

进一步的,所述s4具体按照以下步骤进行:

s41,计算药物作用下和正常状态下的转录谱数据差异,正值表示在药物诱导下基因表达量上调,负值表示在药物诱导下基因表达量下调,把药物诱导的差异基因谱按照差异从大到小排序,形成一个药物的基因表达序列;

s42,利用kolmogorov–smirnov检验统计方法计算心肌纤维化病理基因模块在药物转录谱数据中的富集程度:

es(s)=phit(s,i)-pmiss(s,i)(3)

其中,gj代表基因表达序列{g1,…,gn}的第j个基因,n代表整个药物转录谱基因总数目,i代表药物的基因表达序列,i={g1,…,gn},s代表特异性心肌纤维化病理基因模块,nr表示心肌纤维化病理模块基因数目;phit(s,i)表示特异性心肌纤维化病理基因模块在药物的基因表达序列中出现的比例,pmiss(s,i)表示特异性心肌纤维化病理基因模块在药物的基因表达序列中未出现的比例,es(s)表示特异性心肌纤维化病理基因模块在药物的基因表达序列中的富集程度;根据es(s)值的大小预测药物抗心肌纤维化能力。

本发明的有益效果是,本发明以心肌纤维化标志基因和其它基因不同的相互作用为基础,构建组织特异性的心肌纤维化模块,并应用到抗心肌纤维化药物的筛选上,通过计算机批量筛选抗心肌纤维化潜在药物,对药物的抗心肌纤维化能力进行排名,后续实验就不用盲目的筛选大量化合物,高效率、低成本。

采用基因表达推演法根据药物的转录谱数据预测对应药物的抗心肌纤维化能力,避免直接比较显著差异基因导致的信息丢失,克服了传统方法筛选准确性差的问题;文献和数据库中,已有大量药物转录组数据,本发明抗心肌纤维化药物的筛选方法充分利用已有药物转录组数据,预测对应药物的抗心肌纤维化能力,根据药物的抗心肌纤维化效果筛选所需药物;对于已有药物,有利于药物在疾病治疗上的重定位;对于其它化合物,为心肌纤维化治疗药物的开发提供前体药物;心肌纤维化是多种心脏疾病共有病理症状,抗心肌纤维化药物有可能也是潜在的治疗这些心脏病的药物,如心肌梗死,心衰等。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1是本发明筛选方法的流程图。

图2是本发明四组动物试验的心脏外观图。

图3是本发明四组动物试验的心脏重量指数对照图。

图4a是本发明空白对照组动物试验的苏木精-伊红染色结果图。

图4b是本发明模型组动物试验的苏木精-伊红染色结果图。

图4c是本发明1β-羟基土木香内酯给药组动物试验的苏木精-伊红染色结果图。

图4d是本发明福辛普利给药组动物试验的天狼星染色结果图。

图5a是本发明空白对照组动物试验的天狼星染色结果图。

图5b是本发明模型组动物试验的天狼星染色结果图。

图5c是本发明1β-羟基土木香内酯给药组动物试验的天狼星染色结果图。

图5d是本发明福辛普利给药组动物试验的天狼星染色结果图。

图6是利用image-proplus软件对天狼星染色结果中collagen-i胶原蛋白含量百分比测定结果。

图7是利用image-proplus软件对天狼星染色结果中collagen-iii胶原蛋白含量百分比测定结果。

具体实施方式

下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

在现代生物组学大发展的背景下,基因表达数据、功能数据以及基因之间相互关系数据极其丰富,以心肌纤维化标志基因为核心,从生物大数据中钓取心肌纤维化的功能相关基因,最终构成心肌纤维化的病理模块,并以该病理模块为基础,通过基因表达推演法,筛选能够显著下调该模块基因的药物,得到潜在抗心肌纤维化药物,最后通过实验进行证明。

本发明抗心肌纤维化药物的筛选方法,如图1所示,具体按照以下步骤进行:

s1,获取心肌纤维化的已知标志基因;通过医学文献获取心肌纤维化的已知标志基因,包括骨膜蛋白(postn)、血小板源生长因子受体α(pdgfra)、盘状结构域受体2(ddr2)等。

s2,利用已知标志基因在生物大数据中钓取与已知标志基因存在生物学关系的其它基因或蛋白质,并局限在心脏组织能够表达的基因上,构建特异性心肌纤维化病理基因模块;针对所要治疗的疾病(心肌纤维化),以心肌纤维化的已知标志基因为诱饵,充分利用现有的病理研究文献和组学研究大数据。

特异性心肌纤维化的病理基因模块是以某种生物学上的关系将不同的基因或蛋白质联系在一起形成;特异性心肌纤维化的病理基因模块包括共表达的病理基因模块、功能相关的病理基因模块和蛋白质相互作用的病理基因模块;特异性心肌纤维化的病理基因模块为三种病理基因模块的并集、交集或者单独的病理基因模块;交集说明在三种模块中均有这些基因,那么这些基因和心肌纤维化的关系必然更加密切,最终筛选出的药物也主要是影响这些交集基因的,相对而言,筛选所得药物类型比较单一。并集包括所有模块中的基因,筛选的药物可能影响更多类型的基因,筛选的药物类型更多、更杂。

共表达指该模块中的基因在病理过程中表达趋势一致;共表达的病理基因模块,如利用seek数据库(http://seek.princeton.edu/),以心肌纤维化的已知标志基因为诱饵,提取和心肌纤维化的已知标志基因显著共表达的基因,利用hprd数据库(http://www.hprd.org/)基因组织特异性表达信息,保留在心脏组织中能够表达的基因。

功能相关指模块中的基因之间存在功能上的相互联系;功能相关的病理基因模块,如利用humanbase数据库(https://hb.flatironinstitute.org/)提取和心肌纤维化的已知标志基因在功能上显著相关的心脏组织特异表达的基因。

蛋白质相互作用指不同蛋白质可以相互接触作用,蛋白质相互作用的病理基因模块,如利用蛋白质-蛋白质相互作用(ppi)数据,收集和心肌纤维化的已知标志基因具有蛋白质相互作用的其它基因,利用hprd数据库(http://www.hprd.org/)基因组织特异性表达信息,保留在心脏组织中能够表达的基因。

不同基因相互联系的方式不同就可以形成不同的基因模块,上述三种是代表性的,均是为了找出心肌纤维化的病理基因模块的一种手段,依靠这些联系,能够利用心肌纤维化已知标志基因钓取心肌纤维化病理过程相关基因。

s3,构建具有转录组学数据的药物数据集,获取药物转录谱数据;目的在于收集尽可能多的药物转录谱数据,为后续药物筛选提供基础筛选数据。

s31,有机小分子类化合物:包括中药成分、西药化合物和其它化合物,首先从最新版本pubchem分子数据库(https://pubchem.ncbi.nlm.nih.gov/)的ftp系统中获取所有化合物的名称和结构信息,当前pubchem数据库包含超过9000万个具有结构信息的化合物;由于pubchem数据库包含大量无机化合物信息,进一步利用mesh医学主题词系统,选择树状范畴表中“chemicalsanddrugs[d]”主分类下“inorganicchemicals[d01]”子分类的所有底层主题词作为无机化合物名称,和pubchem中收集的化合物进行比较,去除其中的无机化合物;利用r语言“geoquery包”下载geo数据库中所有包含pubmed文献信息的gds型数据的注释文件(seriesmatrixfile),gds注释文件和mesh主题词系统进行比较分析,找出包含化合物名称信息的gds数据,进一步人工比对确认相应实验是针对药物进行的测序实验,并利用“geoquery包”下载相应的gds转录谱数据。

化合物是否为中药成分的信息通过和已有中医药数据库收录的中药-成分关联信息比较确认,本发明主要用到的中医药数据库包括tcmid、symmap、yatcm、tcmsp、中国中医药数据库、tcmdatabase@taiwan等。化合物是否为西药的信息通过和drugbank数据库中的药物信息比较确认。

s32,中药复方和单味中药:首先以“tcm”(中医药缩写)、“traditionalchinesemedicine”(中医药)、“tcmformula”(中药复方)、“herbalformula”(中药复方)、“herbalmedicine”、(中药)“chinesemedicine”(中药)为中药关键词在geo数据库中人工检索搜集中药转录谱数据。其次,典型中药复方和单味中药的组学数据通过在geo数据库中人工检索它们的拼音、英文、拉丁文名称获取,药物名称从中药数据库中提取,如中华人民共和国药典和中药大辞典。

s33,数据库:connectivitymap(cmap)数据库(https://clue.io/)是一个药物诱导基因表达谱数据库,旧版本包含1309个药物分子。每种药物以不同浓度处理不同的人类细胞株,并处理不同的时长,最终的细胞样本利用affymetrix公司基因芯片hg-u133a进行转录谱测序;新版本在药物和细胞株数据上均大幅度增加,数据库包含20000多个小分子处理的细胞系,测序技术改用成本更低的l1000技术。

其中gds转录谱数据、中药转录谱数据和组学数据、药物诱导基因表达谱数据均为对应药物的转录谱数据。

s4,采用基因表达推演法根据药物的转录谱数据预测对应药物的抗心肌纤维化能力,根据药物的抗心肌纤维化能力筛选所需药物。

基因表达推演法的原理是,每个药物作用于细胞或动物组织模型后,会引起一系列基因表达谱的变化,如果这个药物能够显著下降心肌纤维化病理基因模块表达水平,意味着这个药物改善心肌纤维化;基于这个原理,计算心肌纤维化病理基因模块在药物转录谱数据中的富集程度。

s41,计算药物作用下和正常状态下的转录谱数据差异,正值代表药物作用下基因的表达量比正常情况高,也就是在药物诱导下基因表达量上调,负值表示药物作用下基因的表达量比正常情况低,也就是在药物诱导下基因表达量下调,把药物诱导的差异基因谱按照差异从大到小排序,形成一个药物的基因表达序列,越靠序列上游,显然药物诱导下表达量上调的基因更多,越靠下游,药物诱导下表达量下调的基因更多;

s42,利用kolmogorov–smirnov检验统计方法计算特异性心肌纤维化病理基因模块在药物转录谱数据中的富集程度:

es(s)=phit(s,i)-pmiss(s,i)(3)

其中,n代表整个药物转录谱基因总数目,i代表药物的基因表达序列,i={g1,…,gn},gj代表基因表达序列{g1,…,gn}的第j个基因,s代表特异性心肌纤维化病理基因模块,nr表示心肌纤维化病理模块基因数目;phit(s,i)表示特异性心肌纤维化病理基因模块在药物的基因表达序列中出现的比例,pmiss(s,i)表示特异性心肌纤维化病理基因模块在药物的基因表达序列中未出现的比例,es(s)表示特异性心肌纤维化病理基因模块在药物的基因表达序列中的富集程度;基因表达序列的构建,是为了后续进行富集分析做准备,基因表达序列按基因差异从大到小排列,富集分析结果心肌纤维化病理模块越处在表达序列上游,说明药物倾向上调心肌纤维化病理模块相关基因,富集分析结果心肌纤维化病理模块越处在表达序列下游,说明药物倾向下调心肌纤维化病理模块相关基因。es(s)越小,说明心肌纤维化病理基因模块中的基因出现在药物的基因表达序列下游的基因越多,那么,这个药物下调心肌纤维化病理基因模块的倾向性就越大,因为心肌纤维化病理基因模块中的基因在心肌纤维化中普遍上调;因此es(s)越小,说明该药物抗心肌纤维化的能力越强、效果越好,根据es(s)值的大小,对所选药物的抗心肌纤维化效果进行排序,根据药物的抗心肌纤维化效果排序进行筛选。

本发明通过计算机批量筛选抗心肌纤维化潜在药物,最终对所筛选药物的抗心肌纤维化能力的进行排名,后续实验就不用盲目的筛选大量化合物,高效率、低成本;比如同样100个候选药物,采用本发明的筛选方法之后,排名靠前,抗心肌纤维化能力却强,实验就可以先验证排名靠前的;而通过实验直接做的传统方法,就只能盲目在这个100个成分中寻找,周期长,成本高。

筛选效果验证:

1、动物模型验证本发明筛选的潜在抗心肌纤维化药物;

以筛选结果中排名靠前的1β-羟基土木香内酯为例说明:

40只清洁级雄性c57bl/6小鼠,年龄在4-5周之间,体重18-20g。随机分为空白对照组、异丙肾上腺素给药的模型组、异丙肾上腺素+1β-羟基土木香内酯给药组、异丙肾上腺素+福辛普利阳性药组。异丙肾上腺素给药的模型组:通过多天持续静脉注射异丙肾上腺素构建,注射天数14天,第一天注射异丙肾上腺素20mg/kg,第二天注射异丙肾上腺素10mg/kg,第3-14天,每天注射异丙肾上腺素5mg/kg。异丙肾上腺素+1β-羟基土木香内酯给药组:与异丙肾上腺素给药的模型组操作相同的基础上,每天灌胃1β-羟基土木香内酯3g/kg,持续14天。异丙肾上腺素+福辛普利阳性药组,与异丙肾上腺素给药的模型组操作相同的基础上,每天灌胃福辛普利0.165mg/kg,持续14天。空白对照组和模型组灌胃蒸馏水。

1.2两周之后,首先利用vivo小动物超声系统观察动物左心室功能,动物通过异氟烷麻醉,收缩期左室内径(lvids)、舒张期左室内径(lvidd)、左心室射血分数(ef)和缩短分数(fs)。测定数据收集完毕后进行统计分析。

1.3动物心脏快速收集,并拍照。称心脏重量,计算心脏重量指数(hwi=心脏重量/胫骨长)。通过常规步骤构建心脏组织石蜡切片。苏木精-伊红染色法观察心脏组织整体病理变化。天狼星染色法染色胶原蛋白collagen-i和collagen-iii,通过偏振光显微镜定量不同纤维含量,并利用image-proplus软件对collagen-i和collagen-iii胶原蛋白的含量百分比进行检测。

1.4统计学处理数据采用ssps10.0软件进行统计学分析,实验结果以x±se表示,采用anova单因素方差分析,以p=0.05为显著检验水准。

2、实验结果:

2.1小鼠超声检测结果显示,异丙肾上腺素+1β-羟基土木香内酯组小鼠心功能明显增强。小鼠给药2周后,取材前进行vivo超声检测,小鼠的心脏射血情况与其心肌状态相关,心肌纤维化会影响到小鼠左室射血,故检测其左室收缩期与舒张期容量,并测定左室射血分数,见表1:

表1小鼠左室心功能检测结果

表1中“##”代表和空白对照组相比,p<0.01;“*”代表和模型组相比,p<0.05;“**”代表和模型组相比,p<0.01;由表1心功能指数可知,与空白对照组相比,异丙肾上腺素给药的模型组ef和fs明显降低(p<0.01)。lvids和lvidd明显增高(p<0.01)。这些数据提示动物模型左心室结构发生病理改变,心功能恶化。异丙肾上腺素+1β-羟基土木香内酯给药组治疗动物模型2周后,与模型组相比,ef、fs明显升高(p<0.01),lvids明显降低(p<0.01)。这些数据表明,1β-羟基土木香内酯可以抑制心室扩张,延缓心脏重构,从而改善心功能。

2.2肉眼观察显示,模型组与空白对照组相比,心脏明显增大。异丙肾上腺素+1β-羟基土木香内酯给药组治疗后,心脏形态特征的改变较模型组得到改善(图2)。同时,如图3所示,模型组hwi较空白对照组显著升高(p<0.01),1β-羟基土木香内酯治疗抑制hwi升高(p<0.01);图3中,“##”代表和空白对照组相比,p<0.01;“**”代表和模型组相比,p<0.01。

2.3苏木精-伊红染色实验显示,空白对照组心肌正常,心肌细胞排列整齐。模型组心肌细胞出现紊乱、肥大、坏死、正常结构丧失、肌纤维溶解等病理表型。在异丙肾上腺素+1β-羟基土木香内酯给药组治疗后,这些病理表型大多被排列良好的心肌细胞所取代,见图4a-4d。在天狼星染色实验中,利用法红偏振光法,如图5a-5d所示,观察发现collagen-i胶原蛋白纤维排列较轻,双侧折射较强,纤维呈黄色、橙色、红色厚层。红色表示纤维厚度。collagen-iii胶原蛋白纤维呈分散网状排列,双侧折射较弱,呈绿色薄纤维。两周后,模型组胶原蛋白比空白对照组胶原蛋白更多、更厚、更亮、更紊乱。collagen-i型胶原蛋白和iii型胶原蛋白的比例明显高于空白对照组(p<0.01)。与模型组相比,异丙肾上腺素+1β-羟基土木香内酯给药组胶原蛋白更少、更薄、更暗、更有序。1β-羟基土木香内酯给药组collagen-i型胶原蛋白和iii型胶原蛋白比例明显低于模型组(p<0.01),见图6-7。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1