本发明涉及药物筛选,具体涉及一种基于知识图谱的抗寄生虫疾病药物筛选方法。
背景技术:
1、药物筛选是药物研发的关键步骤之一,通过药物筛选,可以发掘无副作用的新型药物,降低药物研发成本,确保药物研发的高效性。
2、寄生虫疾病会造成相当高的发病率和死亡率,例如,疟疾每年造成约50万人死亡;隐孢子虫病是造成儿童腹泻疾病的一个新病因,据估计仅在亚洲和非洲就造成20万2岁以下的儿童死亡。这些寄生虫疾病每年都会对数百万的家庭造成严重影响,因此抗寄生虫疾病的药物研发具有十分重大的社会意义。
3、近年来,深度学习的方法得到广泛应用,能够从大规模数据中提取重要的数据特征。知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(point)和边(edge)组成。在知识图谱中,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”,知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的异质信息(heterogeneous information)连接在一起而得到的一个关系网络。
4、现有的抗寄生虫疾病药物筛选方法得到的药物筛选结果不够准确,筛选效果较差,无法满足抗寄生虫疾病药物研发的需求。
技术实现思路
1、(一)解决的技术问题
2、针对现有技术所存在的上述缺点,本发明提供了一种基于知识图谱的抗寄生虫疾病药物筛选方法,能够有效克服现有技术所存在的药物筛选结果不够准确,筛选效果较差的缺陷。
3、(二)技术方案
4、为实现以上目的,本发明通过以下技术方案予以实现:
5、一种基于知识图谱的抗寄生虫疾病药物筛选方法,包括以下步骤:
6、s1、构建包含药物、基因、疾病三个节点的知识图谱;
7、s2、使用知识图谱嵌入模型kge学习知识图谱中实体和关系的低维表示;
8、s3、结合知识图谱嵌入模型kge提取出的异质信息,以及分子摩尔指纹和蛋白质描述符表示的结构信息,得到相应的药物筛选预测结果。
9、优选地,s1中构建包含药物、基因、疾病三个节点的知识图谱,包括:
10、s11、在kegg数据库中搜集与抗寄生虫疾病相关的药物;
11、s12、基于搜集到的药物,在drugbank数据库和ncbi数据库中找到对应的基因;
12、s13、基于找到的基因,在ncbi数据库中搜集药物对应的相关的寄生虫id。
13、优选地,s1中构建包含药物、基因、疾病三个节点的知识图谱,包括:
14、对于无法通过基因构建与药物之间关系的寄生虫疾病,通过基因的同源基因,在ncbi数据库中获取基因与寄生虫之间的关系。
15、优选地,s2中使用知识图谱嵌入模型kge学习知识图谱中实体和关系的低维表示,包括:
16、s21、将实体和关系在连续向量空间中表示,并初始化为随机值;
17、s22、利用评分函数计算两个实体相对于关系类型的距离;
18、s23、将输出损失传递给优化器,以更新初始嵌入。
19、优选地,s22中利用评分函数计算两个实体相对于关系类型的距离,包括:
20、评分函数fr(h,t)采用下式表示:
21、
22、其中,(h,r,t)为三元组,h表示头部实体,r表示关系,t表示尾部实体,mr为与关系r相联系的矩阵,i、j分别为矩阵的行、列数,d表示维度。
23、优选地,s3中结合知识图谱嵌入模型kge提取出的异质信息,以及分子摩尔指纹和蛋白质描述符表示的结构信息,得到相应的药物筛选预测结果,包括:
24、利用神经分解机nfm对知识图谱嵌入模型kge提取出的异质信息,以及分子摩尔指纹和蛋白质描述符表示的结构信息进行集成,使用双交互层进行组合优化,通过前馈神经网络输出药物筛选预测结果;
25、其中,知识图谱嵌入模型kge采用dismult模型。
26、(三)有益效果
27、与现有技术相比,本发明所提供的一种基于知识图谱的抗寄生虫疾病药物筛选方法,构建包含药物、基因、疾病三个节点的知识图谱,使用知识图谱嵌入模型kge学习知识图谱中实体和关系的低维表示,结合知识图谱嵌入模型kge提取出的异质信息,以及分子摩尔指纹和蛋白质描述符表示的结构信息,得到相应的药物筛选预测结果,基于知识图谱构建了一个抗寄生虫疾病药物的预测框架pd-kg,利用该预测框架pd-kg进行抗寄生虫疾病药物筛选,弥补了现有技术的空白,同时能够对抗寄生虫疾病药物进行准确筛选,筛选效果较好。
1.一种基于知识图谱的抗寄生虫疾病药物筛选方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的基于知识图谱的抗寄生虫疾病药物筛选方法,其特征在于:s1中构建包含药物、基因、疾病三个节点的知识图谱,包括:
3.根据权利要求2所述的基于知识图谱的抗寄生虫疾病药物筛选方法,其特征在于:s1中构建包含药物、基因、疾病三个节点的知识图谱,包括:
4.根据权利要求2所述的基于知识图谱的抗寄生虫疾病药物筛选方法,其特征在于:s2中使用知识图谱嵌入模型kge学习知识图谱中实体和关系的低维表示,包括:
5.根据权利要求4所述的基于知识图谱的抗寄生虫疾病药物筛选方法,其特征在于:s22中利用评分函数计算两个实体相对于关系类型的距离,包括:
6.根据权利要求4所述的基于知识图谱的抗寄生虫疾病药物筛选方法,其特征在于:s3中结合知识图谱嵌入模型kge提取出的异质信息,以及分子摩尔指纹和蛋白质描述符表示的结构信息,得到相应的药物筛选预测结果,包括: