基于人工智能的药品知识图谱聚类构建方法与流程

文档序号：37053191发布日期：2024-02-20 20:54阅读：13来源：国知局

本技术涉及知识图谱聚类构建，具体涉及基于人工智能的药品知识图谱聚类构建方法。

背景技术：

1、药品知识图谱是一种以药品为核心，通过建立药品之间的关联关系，整合药品相关信息的图像化表示。本发明针对中药熬制成的汤药中成药为例，后面简称中成药，不同的中成药可以针对相同的病症，但是其内在药物组成成分不同，存在中药理念差异和药物相互作用的关系，由此针对中成药构建知识图谱。通过对中成药知识图谱进行聚类有助于更好地理解药物之间作用、优化治疗方案以及发现新药物组合。虽然每个药品存在其固定的药物分类，有利于药品的查找和使用，但是这种分类知识根据其组成成分或治疗症状进行分类，如青霉素类或抗病毒药等，不利于发现药品之间的潜在关系。

2、由此需要结合知识图谱对药物进行聚类，在传统的聚类算法中，k-means算法需要预先指定聚类个数，而对于获取真实的药品知识图谱的聚类个数是不现实的，并且该算法容易受到异常值的影响，在算法达到稳定性和收敛性之间离群值对聚类质心的移动有较大的影响。而dbscan聚类算法不需要预先设定聚类个数，并且对离群值具有很好的鲁棒性，能够处理分布不均匀的簇。但是传统的dbscan聚类算法通常采用固定的邻域半径，但是鉴于不同药品之间的属性关系并不一样，因此采用恒定的邻域半径不能够达到最佳的聚类效果。针对上述问题，本发明提出了一种基于人工智能的药品知识图谱聚类构建方法，针对每个药品实体通过自适应调整dbscan聚类算法中的邻域半径，由此实现对药品知识图谱最优的聚类。

技术实现思路

1、为了解决上述技术问题，本发明提供基于人工智能的药品知识图谱聚类构建方法，以解决现有的问题。

2、本发明的基于人工智能的药品知识图谱聚类构建方法采用如下技术方案：

3、本发明一个实施例提供了基于人工智能的药品知识图谱聚类构建方法，该方法包括以下步骤：

4、结合各药品及对应的药方采用comet模型构建药品知识图谱；获取药品知识图谱中每个药品实体及对应属性的语义向量，其中，每个药品实体包括各功能属性、各成分属性；

5、根据药品实体及其各功能属性的语义向量构建药品实体中各功能属性的功能关联特性系数；根据任意两个药品实体在各属性的功能关联特征系数的差异得到任意两个药品实体的功能序列差异系数；根据功能序列差异系数、药品实体语义向量差异以及药品实体各属性的功能关联特征系数差异构建所述任意两个药品实体的图谱实体交叉互动系数；根据成分之间的作用关系设定成分之间的惩罚系数；根据任意两个药品实体中成分之间的剂量关系及惩罚系数构建所述任意两个药品实体之间的成分惩罚因子；根据任意两个药品实体对应属性语义向量之间的余弦相似度得到任意两个药品实体之间的功能验证系数；根据图谱实体交叉互动系数、功能验证系数以及成分惩罚因子结合预设实体依存距离构建任意两个药品实体之间的药品依存属性验证因子；根据药品知识图谱中药品实体与相连的各药品实体之间的药品依存属性验证因子构建药品实体的自适应邻域半径；

6、根据各药品实体的自适应邻域半径结合dbscan聚类算法对药品知识图谱中的药品实体进行聚类。

7、进一步地，所述获取药品知识图谱中每个药品实体及对应属性的语义向量，包括：

8、药品知识图谱中每个药品名称作为一个药品实体，通过word2vec算法获取各药品实体的语义向量、药品实体的各功能语义向量及成分语义向量。

9、进一步地，所述根据药品实体及其各功能属性的语义向量构建药品实体中各功能属性的功能关联特性系数，包括：

10、获取药品实体语义向量与药品实体各功能属性语义向量的余弦相似性，将所述余弦相似性作为以自然常数为底数的指数函数的指数，将各功能属性的语义向量的模长与对应所述指数函数的计算结果的乘积作为药品实体各功能属性的功能关联特征系数。

11、进一步地，所述任意两个药品实体的功能序列差异系数，包括：

12、计算任意两个药品实体的对应功能属性的功能关联特征系数的差值绝对值，将任意两个药品实体的所有属性的所述差值绝对值的均值作为任意两个药品实体的功能序列差异系数。

13、进一步地，所述构建所述任意两个药品实体的图谱实体交叉互动系数，包括：

14、将各药品实体的所有功能属性的功能关联特性系数按照从大到小排序组成各药品实体的功能关联特性序列，并计算任意两个药品实体的功能关联特征序列之间的dtw距离，第k个和第m个药品实体的图谱实体交叉互动系数表达式为：

15、

16、式中，和分别表示在药品清单中第k个和第m个药品实体的语义向量，代表模长，表示以2为底的对数函数，表示第k个和第m个药品实体的功能序列差异系数，和分别表示第k个和第m个药品实体的功能关联特性序列，表示 dtw距离。

17、进一步地，所述惩罚系数的表达式为：

18、

19、式中，表示第i个成分和第j个成分之间的惩罚系数。

20、进一步地，所述根据任意两个药品实体中成分之间的剂量关系及惩罚系数构建所述任意两个药品实体之间的成分惩罚因子，包括：

21、统计任意两个药品实体中相同成分的剂量差值绝对值，获取所有相同成分的所述剂量差值绝对值的和值，统计任意两个药品实体剔除相同成分后的任意两个成分的剂量之和，获取所述任意两个成分的剂量之和与惩罚系数的比值，计算所有所述任意两个成分得到的所述比值的和值，将两个和值相加的结果作为任意两个药品实体之间的成分惩罚因子。

22、进一步地，所述任意两个药品实体之间的功能验证系数为任意两个药品实体所有对应属性语义向量之间的余弦相似度的均值。

23、进一步地，所述任意两个药品实体之间的药品依存属性验证因子，包括：

24、对于任意两个药品实体，将功能验证系数作为以自然常数为底数的指数函数的指数，获取所述指数函数的计算结果与所述任意两个药品实体的图谱实体交叉互动系数的乘积；

25、若所述任意两个药品实体为相互作用关系，预设任意两个药品实体之间的实体依存距离为，若为交叉敏感关系，预设任意两个药品实体之间的实体依存距离为，其中，；

26、获取实体依存距离与成分惩罚因子相乘的结果，将所述乘积与所述结果的比值作为所述任意两个药品实体之间的药品依存属性验证因子。

27、进一步地，所述根据药品知识图谱中药品实体与相连的各药品实体之间的药品依存属性验证因子构建药品实体的自适应邻域半径，包括：

28、对于各药品实体，获取药品知识图谱中与其相连的药品实体的个数，将所述个数与1的和值作为以2为底数的对数函数的真数；计算药品实体与所有相连的药品实体之间的药品依存属性验证因子的均值；将所述对数函数的计算结果与所述均值的比值向上取整的结果作为药品实体的自适应邻域半径。

29、本发明至少具有如下有益效果：

30、本发明通过对中药熬制成的汤药中成药构建知识图谱，并对知识图谱中的中成药进行聚类。在传统中只根据药品对应症状进行聚类，但由于中药成分复杂且各个成分中间可能存在药理冲突，因此直接对其聚类效果不好，本发明根据每个药品构建成分惩罚因子，结合药物之间的作用关系得到药品依存属性验证因子，最终自适应调整dbscan聚类中的邻域半径，避免了将药理冲突的药物聚类到一起，能够更加准确地将同类型中药中成药进行聚类，有助于药物药理作用的研究和药方开发。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王英为,李彦亭
技术所有人：北京杏林康云信息科技股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。