一种抗青光眼中药数据库的构建方法和应用与流程

文档序号:33696875发布日期:2023-03-31 16:28阅读:24来源:国知局
一种抗青光眼中药数据库的构建方法和应用与流程

1.本发明涉及医学数据库构建与应用领域,尤其涉及一种抗青光眼中药数据库的构建方法和应用。


背景技术:

2.青光眼是由多种因素引起的以进行性视功能损害为特征的致盲性眼病,以眼压升高、视神经萎缩和视野缺损为特征,一直以来因其不可逆性致盲而备受关注。据流行病学调查数据,青光眼是我国第二大常见眼科疾病,我国青光眼发病人数约占眼科疾病总数的15%,居致盲眼病的第4位。在我国40岁以上的原发性青光眼的发病率已高达3.8%,占全球青光眼患者的10%。随着人口老龄化的进展,青光眼发病率呈上升趋势,由于青光眼不像白内障那样可通过手术获得良好治疗效果,保守性药物治疗及术后用药需求很大。目前治疗青光眼的药物以拟胆碱能药物、拟肾上腺素、β受体拮抗剂、碳酸酐酶抑制剂、前列腺素等五个亚类为主,这些药物主要用于缓解症状和降低眼压,疗效和安全性都较低,尚缺乏从根本上治疗青光眼的新药。而在诊断上注重整体的和功能的动态变化,治疗上强调辨证论治,力求从整体水平上调控机体,从而治疗局部性病变和恢复整体功能平衡的传统中医药学显示出了良好的治疗效果。中医药治疗青光眼具有辨证论治、因人制宜的特点,以及疗效确切毒副作用小的优势,现有部分医院采用院内中药方剂缓解青光眼,但目前对于治疗青光眼的中药及中药组分研究尚处于摸索阶段,在应用中药方剂治疗青光眼的过程中,尚有很多问题存在,例如,基于中药的复杂性如何实现多组方多靶点的用药,对青光眼进行多层次多途径的治疗,乃至利用现有的医学及基础研究平台实现抗青光眼中药数据库的建立等亟待解决。


技术实现要素:

3.本发明的目的在于提供一种抗青光眼中药数据库的构建方法和应用,通过生物信息学手段自建抗青光眼中药数据库,并将数据库做成手机可查询的app,便于查询,可快速高效的开展抗青光眼中药及组方的筛选工作,节约研发成本与时间,加快抗青光眼药物上市进程,可为青光眼临床及基础研究提供有力的帮助。
4.为实现上述目的,本发明提供一种抗青光眼中药数据库的构建方法,包括:步骤一:通过geo数据库,获得数据集gse27276;步骤二:将数据集gse27276中的探针名转换为基因名,删除无基因名的基因,对于映射到同一基因名的不同探针,选取不同探针均值或最大值作为该同一基因名的表达值,对所述表达值进行log2转换;运行r语言limmar程序包对所述数据集gse27276中的青光眼样本和对照组样本数据进行检验得到校正后的p值,以log2转换后的值的绝对值>1.0和校正后的p<0.05为筛选标准,获得差异表达基因;步骤三:将所述差异表达基因中的表达上调差异基因和表达下调差异基因分别通过string数据库进行蛋白质-蛋白质相互作用分析,通过cytoscape软件对所述蛋白质-蛋白质相互作用分析的结果进行分析,以得到核心差异基因;步骤四:根据所述核心差异基因在tcmsp数据库内
抓取化合物,对抓取得到的化合物进行降重处理;步骤五:在tcmsp数据库内抓取与处理后的化合物对应的中药名,并对抓取的中药名进行降重处理,根据处理后的中药名构建抗青光眼中药数据库。
5.可选地,所述步骤二包括:通过gpl2507平台的注释文件将数据集gse27276中的探针名转换为基因名。
6.可选地,所述步骤二包括:运行r语言limmar程序包对所述数据集gse27276中的青光眼样本和对照组样本数据进行t检验和贝叶斯检验得到校正后的p值。
7.可选地,所述步骤三包括:通过cytoscape软件的cytohubba插件分析所述蛋白质-蛋白质相互作用分析的结果,再通过cytoscape软件的mcode插件分析所述cytohubba插件的结果,以得到核心差异基因。
8.可选地,所述步骤四包括:以所述核心差异基因作为关键字在tcmsp数据库内抓取化合物。
9.可选地,所述步骤四包括:利用python语言以所述核心差异基因作为关键字,在tcmsp数据库内抓取化合物。
10.可选地,所述步骤五包括:采用python语言在tcmsp数据库内抓取与处理后的化合物对应的中药名。
11.本发明还提供一种基于上述构建方法得到的抗青光眼中药数据库而设计的抗青光眼中药数据库查询系统,包括:抗青光眼中药数据库、页面生成模块、基因名称查询模块、uniprot名称查询模块、靶点名称查询模块、相关化合物名称查询模块及中药名称查询模块。
12.本发明的有益效果:本发明基于生物信息学技术,筛选出青光眼与正常人差异基因,通过青光眼差异基因构建出青光眼相关核心差异基因;再通过青光眼相关核心差异基因找出治疗青光眼的常见中药化学成分;最终找出可用于青光眼治疗的潜在中药,并构建抗青光眼中药数据库。基于该数据库设计出抗青光眼中药数据库查询系统,可便捷快速高效的开展抗青光眼中药及组方的筛选工作,节约药物研发成本与时间,加快青光眼治疗药物的上市进程。
附图说明
13.图1为本发明实施例的抗青光眼中药数据库的构建方法的流程图。
14.图2为体外细胞实验验证抗青光眼数据库筛选出中药有效性的实验结果图。
15.图3为本发明实施例的抗青光眼中药数据库查询系统的应用流程图。
具体实施方式
16.为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
17.具体地,本实施例提供一种抗青光眼中药数据库的构建方法及应用,包括构建抗青光眼中药数据库,基于该数据库设计了抗青光眼中药数据库查询系统。
18.在构建抗青光眼中药数据库的过程中,用到的网络数据库及分析软件如下:
19.geo数据库(https://www.ncbi.nlm.nih.gov/geo/)
20.r语言(https://www.r-project.org/)
21.r语言开发环境
22.rstudio(https://www.r-studio.com/zhcn/data-recovery-software/)
23.r语言limmar包http://metascape.org/gp/index.html-/main/step1
24.(http://bioconductor.org/packages/release/bioc/html/limma.html)
25.string数据库(https://string-db.org/)version11.0b
26.cytoscape 3.8.2(https://cytoscape.org/)
27.tcmsp数据库(http://lsp.nwu.edu.cn/tcmspsearch.php)
28.python语言(https://www.python.org/)
29.参照图1,本实施例提供一种抗青光眼中药数据库的构建方法,包括:
30.步骤一:通过geo数据库,获得数据集gse27276。
31.本实施例通过在美国国家生物信息技术中心(ncbi)基因表达综合数据库(geo)数据库中检索“glaucoma”,物种类型为智人,获得数据集gse27276,该数据集采用的芯片平台为gpl2507 sentrix human-6 expression beadchip,包含13例对照和15例青光眼患者在小梁网组织中的全基因组表达,其中6例对照和1例青光眼患者的表达均来自左眼和右眼,下载其原始数据,进行分析。
32.步骤二:将数据集gse27276中的探针名转换为基因名,删除无基因名的基因,对于映射到同一基因名的不同探针,选取不同探针均值或最大值作为该同一基因名的表达值,对所述表达值进行log2转换;运行r语言limmar程序包对所述数据集gse27276中的青光眼样本和对照组样本数据进行检验得到校正后的p值,以log2转换后的值的绝对值>1.0和校正后的p<0.05为筛选标准,获得差异表达基因。其中,负数代表下调差异基因,正数代表上调差异基因。
33.作为示例,运行r语言的ggplot2程序包及pheatmap程序包制作差异表达基因的火山图和热图。
34.优选地,通过gpl2507平台注释文件将探针名转换为基因名(symbol)。
35.步骤三:将所述差异表达基因中的表达上调差异基因和表达下调差异基因分别通过string数据库进行蛋白质-蛋白质相互作用(ppi)分析,物种类型选择“homo sapiens”,置信度选择“medium confidence=0.400”,得到ppi关系对文件;通过cytoscape软件对所述蛋白质-蛋白质相互作用分析的结果进行分析,以得到核心差异基因。
36.优选地,通过cytoscape软件的cytohubba插件对“蛋白质-蛋白质相互作用分析的结果”进行进一步分析,以发现复杂网络的关键目标和子网络,再通过cytoscape软件的mcode插件对“cytohubba插件分析的结果”进行模块分析以综合筛选核心差异基因。
37.步骤四:根据所述核心差异基因在tcmsp数据库内抓取化合物,对抓取得到的化合物进行降重处理。
38.优选地,依据筛选出的核心差异基因,利用python语言在tcmsp数据库内抓取化合物,并进行降重处理。
39.步骤五:在tcmsp数据库内抓取与处理后的化合物对应的中药名,并对抓取的中药名进行降重处理,根据处理后的中药名构建抗青光眼中药数据库。
40.优选地,采用python语言在tcmsp数据库内抓取与处理后的化合物对应的中药名,
并进行降重处理,并以此为依据逆向构建抗青光眼中药数据库平台。
41.本实施例的抗青光眼数据库在具体构建过程中的分析数据如下:对基因表达谱数据集gse27276的青光眼样本与对照组样本进行差异显著性分析,从44273条数据记录中,以log2的绝对值>1.0和调整的p<0.05为筛选标准获得差异表达基因,删除重复基因名及无基因名数据,共获得194个差异表达基因,其中表达下调基因为130个,表达上调基因为64个。
42.对130个下调基因和64个上调基因分别进行核心基因的筛选,通过string数据库进行ppt分析,物种类型选择“homo sapiens”,置信度选择“medium confidence=0.400”,隐藏孤立节点,可分别得到上调基因蛋白互作网络与下调基因蛋白互作网络。
43.通过cytoscape软件的cytohubba插件中degree算法进行分析,选择前十五个关键差异表达基因,通过cytoscape软件的mcode插件进行模块化分析,分析结果显示,上调的前十五差异表达基因有:hbd、hbb、tyrobp、fmod、hba1、hba2、hbg1、hbg2、cd74、hla、-dpa1、cdh2、lum、hla-dmb、lgals1、ctgf;下调的前十五差异表达基因有:krt5、lcn2、krt19、s100a8、krt14、lamb3、s100a9、cldn7、ceacam5、hp、dusp1、s100a14、s100a12、pkp3、col17a1。利用python语言,在中药系统药理学分析平台tcmsp数据库内共抓取了6048个/频次的化合物,经过对上述化合物进行降重后,最终获得了3485个化合物。其中频次出现最高的化合物为:quercetin(707次),(-)-epigallocatechin-3-gallate(580次),beta-caroten(104次),lauric acid(68次),tanshinone iia(11次)等。另有3000多个化合物作用于上述核心基因,但是由于频次太低,并未在此列出。结果见表1。
44.表1python抓取化合物频次表
45.46.以筛选出的3485个化合物为基础,利用python语言,在tcmsp内抓取了其对应的中药,经过降重处理,共获得了498个中药,可通过所含有的3485个化合物,对筛选出的中药进行分析,结果见表2。
47.表2python抓取中药频次表
[0048][0049][0050]
为验证抗青光眼中药数据库的准确性,本实施例选取数据库筛选出的两种中药进行体外细胞实验研究。观察两种中药提取物体外对h2o2诱导视网膜神经节细胞(rgc-5)凋亡的影响,如图2所示,实验结果显示:数据库筛出的两种中药对视网膜神经节细胞具有保护性,具有治疗青光眼作用。
[0051]
基于该数据库设计的抗青光眼中药数据库查询系统(手机app),该查询系统包括抗青光眼中药数据库、页面生成模块、基因名称查询模块、uniprot名称查询模块、靶点名称查询模块、相关化合物名称查询模块及中药名称查询模块。其应用流程如图3所示,该系统可实现以下功能:
[0052]
1、查询功能选择页面,提供五种信息检索方式,以钮组件实现该功能。点击按钮后,可打开对应功能的查询页面。
[0053]
2、gene search页面。该页面通过下拉框组件加载需要查询的gene名称,选择后会
通过列表显示框显示出符合该gene搜索条件的所有内容,包括对应的uniprot、靶点、相关化合物和中药内容。
[0054]
3、uniprot search页面。该页面通过文本输入框输入uniprot名称,点击查询按钮来完成目标信息搜索功能。通过搜索,会显示出查找uniprot对应的的基因、靶点、相关化合物和中药内容。
[0055]
4、target search页面。该页面通过文本输入框输入靶点名称,点击查询按钮即可查询到对应基因、uniprot、相关化合物级中药内容。
[0056]
5、related ingredients页面。该页面通过文本输入框输入相关化合物名称后,点击查询按钮查询符合查询内容对应的基因、uniprot、靶点和中药内容。
[0057]
6、herbs search页面。该页面通过文本输入框输入中药的名称,点击查询按钮后即可查询该中药名称对应的基因、uniprot、靶点及相关化合物内容。
[0058]
每一个页面添加一个返回按钮,点击该按钮可以返回到第一页面,方便用户选择其他搜索页面。
[0059]
7、素材列表:将实验结果存放到excel表格中,并另存为.csv格式。csv(comma-separated uvalues)格式又叫逗号分隔值或者字符分隔值。其文件以纯文本形式存储表格数据(数字和文本)。以便app可以通过该类型文件读取文档中的文本内容。
[0060]
逻辑设计界面主要操作流程:建立两个全局变量以列表的形式存放csv文件中两列数据值。
[0061]
8、screen初始化模块:用于执行跳转到该页面时需要完成的操作。
[0062]
文件管理器组件中调用文件管理器读取文件模块功能:读取文件路径。在内置模块中的文本抽屉中选取素材路径模块,输入csv文件所在位置,根据模块要求,素材列表中的文件路径为“//文件名.csv”。
[0063]
9、csv表文本转列表模块:该模块的功能是将csv文件中的纯文本内容转换为列表形式。csv列表中有几行数据,就会在转换时,生成对应数量的列表项。
[0064]
10、定义函数模块:运行该模块时,通过建立一个局部变量用来存放转换后的列表。
[0065]
11、从列表中取列表项逐项运行模块:该模块可实现从列表中循环读取列表项,由于本案例csv文件中共有2列数据,因此生成的列表项中,每个列表元素也由2项数据构成。以genesearch为例,第一列为gene值,第二列为gene所对应的搜索内容,即result值。在该模块中,可根据循环列表中每一项的操作,取出每一个列表项,并将每一个列表项中的第一个数据存放到gene列表中,第二个数据存放到result列表中。
[0066]
12、下拉框模块:该模块下拉框内容加载可以分为两种方式。第一种可以在组件设计界面的组件属性里,将所有下拉框的内容添加到元素字符串中,每个显示文本以逗号分隔。第二种是在逻辑设计界面,需要将要显示的内容以列表的形式添加到设置下拉框元素字符串模块中。
[0067]
13、当下拉框选择完成模块:创建一个局部变量“display”列表用来存放搜到的显示结果。当执行下拉框操作后,会选择一个元素,通过循环的形式遍历gene列表中所有的元素,如果列表元素与下拉框选择元素相同,记录列表元素在gene列表中的位置,然后到结果列表中的同一位置取出列表元素值,存放到局部变量“display”列表中。当gene列表被循环
结束后,即可找到所有搜索gene值多对应的结果并显示出来。
[0068]
14、除了genesearch之外,其他内容的搜索界面采用用户在文本输入框中输入文本的形式来完成查询过程。
[0069]
15、文本输入框模块:该模块用于让使用app的用户键入输入内容。并将用户输入的文本与列表中的元素进行比对。
[0070]
16、按钮模块:按钮的主要功能是通过触碰按钮来完成应用中的某些动作。该app中,通过点击按钮出发将文本输入框中的内容与元素进行比较的动作。
[0071]
17、信息对话框模块:该模块用于显示警告、消息以及临时性的通知。选取该模块中的显示消息对话框功能,当用户输入的文本不在元素列表中时,弹出一条消息及一个按钮,消息内容为“您所查询的内容不在列表内”,按钮上显示“再查一次”。当用户点击按钮时,消息对话框消失,用户可以继续查找的操作。
[0072]
以上对本发明所提供的抗青光眼中药数据库的构建方法和应用进行了详细介绍。本文中应用了具体个例对本发明的实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1