基于知识图谱表征学习的医疗方案推荐系统及方法与流程

文档序号:23709578发布日期:2021-01-23 16:29阅读:80来源:国知局
基于知识图谱表征学习的医疗方案推荐系统及方法与流程

[0001]
本申请涉及人工智能技术领域,尤其涉及到一种基于知识图谱表征学习的医疗方案推荐系统及方法。


背景技术:

[0002]
随着现代信息技术的发展,为了构建与物联网、云计算、大数据、空间地理信息集成等新一代信息技术为基础的智慧城市,并且提高国民的数字化体验,各种智能系统应运而生。在医疗领域,通过配置医疗推荐系统,能够帮助病人和医生大大缩短就诊时间,节省人力物力。
[0003]
目前现有的医疗推荐系统往往采用固定的搜索方式,或单纯使用医生和病人的历史交互信息作为输入,从而进行相关医疗信息的推荐,然而不能很好地通过对个人信息的全面分析以更好地推荐医疗信息,导致推荐的医疗方案不够准确,容易存在潜在风险。


技术实现要素:

[0004]
有鉴于此,本申请提供了一种基于知识图谱表征学习的医疗方案推荐系统及方法,主要解决现有医疗推荐系统推荐的医疗信息不够精准,且容易存在潜在风险的问题。
[0005]
根据本申请的一个方面,提供了一种基于知识图谱表征学习的医疗方案推荐系统,该系统包括:
[0006]
提取模块,用于获取目标用户的患者数据,并提取所述患者数据中的目标实体;
[0007]
划分模块,用于根据所述目标实体从医疗知识图谱中划分知识图谱子图;
[0008]
第一确定模块,用于基于表征学习确定所述知识图谱子图对应的低维向量;
[0009]
获取模块,用于将所述低维向量输入到符合预设训练标准的推荐模型中,获取得到与所述患者数据匹配的医疗推荐结果。
[0010]
优选地,所述提取模块,具体包括:
[0011]
第一训练单元,用于训练用于抽取实体类的实体抽取模型;
[0012]
抽取单元,用于利用符合第一预设训练标准的所述实体抽取模型抽取患者数据中的目标实体。
[0013]
优选地,所述第一训练单元,具体用于:
[0014]
对训练集数据中所包含的实体类进行词性标注;
[0015]
将标注处理后的所述训练集数据输入至实体抽取模型中,训练所述实体抽取模型基于jieba自然语言处理库抽取实体类;
[0016]
若确定所述实体类的抽取误差小于预设阈值,则判定所述实体抽取模型通过训练;
[0017]
若确定所述实体类的抽取误差大于或等于所述预设阈值,则判定所述实体抽取模型未通过训练,利用预先标注好词性的训练集数据重复修正训练所述实体抽取模型,以使所述实体抽取模型满足第一预设训练标准。
[0018]
优选地,所述划分模块,具体包括:
[0019]
标记单元,用于在所述目标实体中标记核心对象实体和次要对象实体;
[0020]
遍历单元,用于以各个所述核心对象实体为遍历起点对医疗知识图谱进行遍历,并在遍历到所述次要对象实体时停止该方向的遍历;
[0021]
划分单元,用于依据各个所述核心对象实体的遍历结果划分知识图谱子图。
[0022]
优选地,所述第一确定模块,具体包括:
[0023]
提取单元,用于提取所述知识图谱子图中的各个三元组;
[0024]
配置单元,用于通过对所述三元组进行位置编码,为所述三元组中的实体向量配置位置向量;
[0025]
编码单元,用于基于关系型网络对添加所述位置向量后的三元组进行编码处理,得到编码向量;
[0026]
第二训练单元,用于利用解码器对所述编码向量进行分值评定,并利用自适应矩估计adam优化器进行迭代训练,进一步得到所述知识图谱子图对应的低维向量。
[0027]
优选地,所述系统还包括:标注模块、训练模块、第二确定模块;
[0028]
所述标注模块,用于确定样本患者数据,并为所述样本患者数据标注对应的预设医疗推荐方案;
[0029]
所述训练模块,用于利用所述样本患者数据对应的低维向量训练推荐模型;
[0030]
所述第二确定模块,用于若判定所述推荐模型输出的医疗推荐结果符合第二预设训练标准,则确定所述推荐模型通过训练;
[0031]
所述训练模块,还用于若判定所述推荐模型未通过训练,则利用所述所述样本患者数据重复训练所述推荐模型,以使所述推荐模型符合所述第二预设训练标准。
[0032]
优选地,所述获取模块,具体包括:
[0033]
输入单元,用于将所述低维向量输入到符合所述第二预设训练标准的推荐模型中,获取得到各个预设医疗推荐方案对应的推荐分值;
[0034]
确定单元,用于将所述推荐分值最高的预设医疗推荐方案确定为所述目标用户的医疗推荐结果。
[0035]
根据本申请的另一个方面,提供了一种基于知识图谱表征学习的医疗方案推荐方法,该方法包括:
[0036]
获取目标用户的患者数据,并提取所述患者数据中的目标实体;
[0037]
根据所述目标实体从医疗知识图谱中划分知识图谱子图;
[0038]
基于表征学习确定所述知识图谱子图对应的低维向量;
[0039]
将所述低维向量输入到符合预设训练标准的推荐模型中,获取得到与所述患者数据匹配的医疗推荐结果。
[0040]
优选地,所述提取所述患者数据中的目标实体,具体包括:
[0041]
训练用于抽取中实体类的实体抽取模型;
[0042]
利用符合第一预设训练标准的所述实体抽取模型抽取患者数据中的目标实体。
[0043]
优选地,所述训练用于抽取实体类的实体抽取模型,具体包括:
[0044]
对训练集数据中所包含的实体类进行词性标注;
[0045]
将标注处理后的所述训练集数据输入至实体抽取模型中,训练所述实体抽取模型
基于jieba自然语言处理库抽取实体类;
[0046]
若确定所述实体类的抽取误差小于预设阈值,则判定所述实体抽取模型通过训练;
[0047]
若确定所述实体类的抽取误差大于或等于所述预设阈值,则判定所述实体抽取模型未通过训练,利用预先标注好词性的训练集数据重复修正训练所述实体抽取模型,以使所述实体抽取模型满足第一预设训练标准。
[0048]
优选地,所述根据所述目标实体从医疗知识图谱中划分知识图谱子图,具体包括:
[0049]
在所述目标实体中标记核心对象实体和次要对象实体;
[0050]
以各个所述核心对象实体为遍历起点对医疗知识图谱进行遍历,并在遍历到所述次要对象实体时停止该方向的遍历;
[0051]
依据各个所述核心对象实体的遍历结果划分知识图谱子图。
[0052]
优选地,所述基于表征学习确定所述知识图谱子图对应的低维向量,具体包括:
[0053]
提取所述知识图谱子图中的各个三元组;
[0054]
通过对所述三元组进行位置编码,为所述三元组中的实体向量配置位置向量;
[0055]
基于关系型网络对添加所述位置向量后的三元组进行编码处理,得到编码向量;
[0056]
利用解码器对所述编码向量进行分值评定,并利用自适应矩估计adam优化器进行迭代训练,进一步得到所述知识图谱子图对应的低维向量。
[0057]
优选地,在将所述低维向量输入到符合预设训练标准的推荐模型中,获取得到与所述患者数据匹配的医疗推荐结果之前,具体还包括:
[0058]
确定样本患者数据,并为所述样本患者数据标注对应的预设医疗推荐方案;
[0059]
利用所述样本患者数据对应的低维向量训练推荐模型;
[0060]
若判定所述推荐模型输出的医疗推荐结果符合第二预设训练标准,则确定所述推荐模型通过训练;
[0061]
若判定所述推荐模型未通过训练,则利用所述所述样本患者数据重复训练所述推荐模型,以使所述推荐模型符合所述第二预设训练标准。
[0062]
优选地,所述将所述低维向量输入到符合预设训练标准的推荐模型中,获取得到与所述患者数据匹配的医疗推荐结果,具体包括:
[0063]
将所述低维向量输入到符合所述第二预设训练标准的推荐模型中,获取得到各个预设医疗推荐方案对应的推荐分值;
[0064]
将所述推荐分值最高的预设医疗推荐方案确定为所述目标用户的医疗推荐结果。
[0065]
根据本申请的另一个方面,提供了一种非易失性可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述基于知识图谱表征学习的医疗信息推荐方法。
[0066]
根据本申请的再一个方面,提供了一种计算机设备,包括非易失性可读存储介质、处理器及存储在非易失性可读存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述基于知识图谱表征学习的医疗信息推荐方法。
[0067]
借由上述技术方案,本申请提供的一种基于知识图谱表征学习的医疗方案推荐系统及方法,与目前医疗推荐系统相比,本申请可首先利用提取模块提取出患者数据中的实体,并利用划分模块,基于实体从知识图谱中抽取子图。之后通过知识图谱表征学习,采用三元组嵌入的方法,将每个实体(医生,病人)和关系(就诊,专业领域,处方,开药等)嵌入得
到低维向量,并且保持医疗关系图谱中的语义信息。之后,将嵌入得到的低维向量,输入到推荐算法对应的推荐模型中去,推荐模型即可根据患者的低维向量,进行推荐分类,进一步输出医疗推荐结果,以供患者参考。在本申请中,通过表征学习获取低维向量,能够提高推荐系统所输出推荐结果的准确性,为之后的个性化推荐提供更高的支持。
附图说明
[0068]
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本地申请的不当限定。在附图中:
[0069]
图1示出了本申请实施例提供的一种基于知识图谱表征学习的医疗方案推荐系统的结构示意图;
[0070]
图2示出了本申请实施例提供的另一种基于知识图谱表征学习的医疗方案推荐系统的结构示意图;
[0071]
图3示出了本申请实施例提供的一种知识图谱表征学习的原理结构示意图;
[0072]
图4示出了本申请实施例提供的一种基于知识图谱表征学习的医疗方案推荐方法的流程示意图。
具体实施方式
[0073]
下文将参考附图并结合实施例来详细说明本申请。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合。
[0074]
针对现有医疗推荐系统推荐的医疗信息不够精准,且容易存在潜在风险的问题,本申请实施例提供了一种基于知识图谱表征学习的医疗方案推荐系统,如图1所示,该系统包括:提取模块31、划分模块32、第一确定模块33、获取模块34;
[0075]
在具体的应用场景中,提取模块31,可用于获取目标用户的患者数据,并提取患者数据中的目标实体。其中,患者数据可为目标用户在推荐系统中手动上传的病例咨询信息,或基于医疗平台提取出的关于目标用户的病例信息,具体可包括文本、图像等多种数据形式,在获取到患者信息后,首先需要基于现有的文本转换技术(如ocr识别技术等),将各个数据形式的患者数据统一转换为文本形式,以便后续进行目标实体的提取。目标实体是指具有可描述意义的单词或短语,通常可以是人名、地名、组织机构名、产品名称,或者在某个领域内具有一定含义的内容,比如医学领域内疾病、药物、生物体名称等。对于本实施例,需要首先从患者数据的结构化和非结构化信息中提取目标实体,以便通过将目标实体与医疗知识图谱的实体进行匹配,进一步抽取出与患者数据对应的知识图谱子图。
[0076]
相应的,由于基于子图划分的知识图谱降维表达方法对实体的编码相比传统方法更为合理,以子图为基础的降维表达能充分考虑知识图谱的局部特征,得到的实体编码向量能更好地反映实体的本质特征。故在本申请中需要进行知识图谱子图的划分,并且越大的子图通常会学习到越好的特征,故可根据所需要的运行时长预先设定子图的抽取范围,以保证医疗方案推荐结果的精准度。故系统中还包括划分模块32,用于根据目标实体从医疗知识图谱中划分知识图谱子图。
[0077]
在具体的应用场景中,第一确定模块33,可用于基于表征学习确定知识图谱子图对应的低维向量。对于本实施例,在进行表征学习时,可在传统trans方法的基础上,采用新
的方法来编码三元组,即通过引入位置编码和关系性记忆网络来挖掘三元组的潜在依赖关系,进一步得到目标实体的低维向量。此一过程应用位置编码和关系型记忆网络编码就诊三元组,能够在一定程度上解决trans方法无法描述知识图谱三元组潜在依赖关系的问题,进而能够提高三元组嵌入向量的准确性,为之后的个性化推荐提供更高的支持。
[0078]
相应的,获取模块34,可用于将第一确定模块33确定出的低维向量输入到符合预设训练标准的推荐模型中,获取得到与患者数据匹配的医疗推荐结果。对于本实施例,为了确定出与目标用户对应匹配的医疗推荐方案,具体的,可在推荐系统中预先基于预设分类规则训练推荐模型,使推荐模型能够根据患者对应的实体低维向量,确定出对应的医疗推荐结果。其中,医疗推荐结果可包括用药组合、采取的治疗方案、以及对应的主治医生人选等。
[0079]
借由本实施例中基于知识图谱表征学习的医疗方案推荐系统,可首先提取患者数据中的实体,并基于实体从知识图谱中抽取子图。之后通过知识图谱表征学习,采用三元组嵌入的方法,将每个实体(医生,病人)和关系(就诊,专业领域,处方,开药等)嵌入得到低维向量,并且保持医疗关系图谱中的语义信息。之后,将嵌入得到的低维向量,输入到推荐算法对应的推荐模型中去,推荐模型即可根据患者的低维向量,进行推荐分类,进一步输出医疗推荐结果,以供患者参考。在本申请中,通过表征学习获取低维向量,能够提高推荐系统推荐结果的准确性,为之后的个性化推荐提供更高的支持。
[0080]
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例中的具体实施过程,如图2所示,提供了另一种基于知识图谱表征学习的医疗方案推荐系统,在该医疗方案推荐系统中,提取模块31可进一步包括:第一训练单元311、抽取单元312。
[0081]
在具体的应用场景中,第一训练单元311可用于训练用于抽取实体类的实体抽取模型,其中,在训练用于提取患者数据中实体类的实体抽取模型时,第一训练单元311具体可以用于:对训练集数据中所包含的实体类进行词性标注;将标注处理后的训练集数据输入至实体抽取模型中,训练实体抽取模型基于jieba自然语言处理库抽取实体类;若确定实体类的抽取误差小于预设阈值,则判定实体抽取模型通过训练;若确定实体类的抽取误差大于或等于预设阈值,则判定实体抽取模型未通过训练,利用预先标注好词性的训练集数据重复修正训练实体抽取模型,以使实体抽取模型满足第一预设训练标准。
[0082]
对于本实施例,在对训练集数据中的实体类进行词性标注时,可基于ictclas汉语词性标注集来进行词性标注,进而确定出分词后每个实体类的词性。在具体训练过程中,可通过jibba自然语言处理库对数据进行词性分析,划分出所有实体类。其中,jibba自然语言处理库中包含了超大规模的语料数据,包含349,046条词语,每一行对应一个词语,包含词语、词数、词性三部分。预设阈值应为0到1的数值,表示实体抽取模型通过训练时的最大抽取误差,具体数值的设定大小可根据实际应用需求进行设定,预设阈值越小,表示实体抽取模型的训练精度越高。
[0083]
在具体的应用场景中,抽取单元312可用于利用符合第一预设训练标准的实体抽取模型抽取患者数据中的目标实体。其中,在依据实体抽取模型提取患者数据中的目标实体时,具体实现过程可为:加载词典文件,识别患者数据中各个词段;基于各个词段构建有向无环图;根据有向无环图计算每个节点到语句结束位置的最大路径概率,并确定概率最大时节点对应词段的最优结束位置;在最优结束位置处切分患者数据,以便获取得到各个
目标实体。
[0084]
例如,输入的患者数据为“有一些发烧”,在利用实体抽取模型抽取目标实体时,首先会构建短语的有向无环图dag。查词典进行字符串匹配的过程中,可能会出现好几种可能的切分方式,将这些组合构成有向无环图,如可构成四条路径:1)、

有一

/些

/发烧;2)、

有一

/些发

/烧;3)、



/一些

/发烧;4)、



/一些发

/烧,根据四条路径对应的有向无环图可确定出各个词的开始位置和可能的结束位置。之后计算对应同一个词的不同结束位置的概率,将概率最大的结束位置确定为最优结束位置。其中,每个词的概率=字典中该词的词数/字典总词数。若确定待抽取文本中词段的开始位置为

,可识别到对应的结束位置有两个,分别为:



,则可计算两处结束位置对应的概率,若“有”对应的概率大于“有一”,则可确定

位置对应为

位置的最优结束位置,之后基于同样的方法确定出其他开始位置对应的最优结束位置,对于词段的开始位置

,可识别到对应的结束位置有两个,分别为:



,如确定

位置对应为

位置的最优结束位置,之后可在最优结束位置



处切分待抽取文本,获取得到目标实体为“有”、“一些”、“发烧”。
[0085]
在具体的应用场景中,为了划分得到知识图谱子图,如图2所示,在该医疗方案推荐系统中,划分模块32,具体可包括:标记单元321、遍历单元322、划分单元323;其中,标记单元321,可用于在目标实体中标记核心对象实体和次要对象实体;遍历单元322,可用于以各个核心对象实体为遍历起点对医疗知识图谱进行遍历,并在遍历到次要对象实体时停止该方向的遍历;划分单元323,可用于依据各个核心对象实体的遍历结果划分知识图谱子图。
[0086]
其中,实体标记是依据该类实体在知识图谱中的重要性和枢纽性,将其标记为核心对象或次要对象。由于不同领域的知识图谱具有不同的实体类别和关联关系,所以核心对象和次要对象的标记任务可由人工完成。在进行子图遍历时,可根据输入的核心对象实体,采用广度优先遍历规则进行子图遍历,当遍历到核心对象实体时选择将实体保留,作为后续遍历的起点;当遍历到次要对象实体时则在该方向上停止遍历。该步骤得到的实体其实是与起点实体直接相连的周边实体。重复遍历步骤,直到某一次遍历得到的实体,除了已经在知识图谱子图中的,剩下的都是次要对象实体。
[0087]
相应的,为了得到知识图谱子图对应的低维向量,如图2所示,在该医疗方案推荐系统中,第一确定模块33,具体可包括:提取单元331、配置单元332、编码单元333、第二训练单元334;提取单元331,可用于提取知识图谱子图中的各个三元组;配置单元332,可用于通过对三元组进行位置编码,为三元组中的实体向量配置位置向量;编码单元333,可用于基于关系型网络对添加位置向量后的三元组进行编码处理,得到编码向量;第二训练单元334,可用于利用解码器对编码向量进行分值评定,并利用自适应矩估计(adam)优化器进行迭代训练,进一步得到知识图谱子图对应的低维向量。
[0088]
对于本实施例,知识图谱表征学习的原理可参见图3所示的医疗三元组嵌入式编码结构,具体的,在通过表征学习得到低维向量时,首先可将医疗三元组存为(实体,关系,实体)的形式,例如(患者,是否疾病史,疾病),(医生,级别,专业)等形式进行三元组的构建。之后可将位置关系嵌入到三元组对应的实体向量中,即通过对三元组进行位置编码,以实现在嵌入训练中为实体向量配置位置向量。接着可以利用关系型记忆网络对三元组进行编码,具体编码过程可以基于多头自注意力机制来实现。此外,为了避免实体编码的初始化
过程中,得出的实体向量不够精准,故可基于解码器进行打分,并利用adam优化器等进行迭代,通过正向和负向的网络训练过程,进一步对实体向量进行优化调整,使最终得到的低维向量符合预设的精度要求。以便最后在得到医疗实体的低维向量后,将其输入推荐模型中去,完成依次学习的框架。
[0089]
在具体的应用场景中,如图2所示,在该医疗方案推荐系统中,具体还可包括:标注模块35、训练模块36、第二确定模块37;标注模块35,可用于确定样本患者数据,并为样本患者数据标注对应的预设医疗推荐方案;训练模块36,可用于利用样本患者数据对应的低维向量训练推荐模型;第二确定模块37,可用于若判定推荐模型输出的医疗推荐结果符合第二预设训练标准,则确定推荐模型通过训练;训练模块36,还可用于若判定推荐模型未通过训练,则利用样本患者数据重复训练推荐模型,以使推荐模型符合第二预设训练标准。
[0090]
对于本实施例,可预先根据不同类型的样本患者数据标注对应的医疗推荐方案,如可为癌症这一类型的患者数据标注针对癌症这一领域的权威主治医生,此外还可标注对应的治疗方案、用药组合等。进而利用标注对应医疗推荐方案的样本患者数据对推荐模型进行针对性的训练,可进一步强化推荐模型的分类识别能力,以使推荐模型输出的结果与标注结果匹配。
[0091]
相应的,如图2所示,在该医疗方案推荐系统中,获取模块34,具体可包括:输入单元341、确定单元342。
[0092]
在具体的应用场景中,输入单元341可用于将低维向量输入到符合第二预设训练标准的推荐模型中,获取得到各个预设医疗推荐方案对应的推荐分值。对于本实施例,在获取得到目标患者对应的低维向量后,可将低维向量输入到符合第二预设训练标准的推荐模型中,推荐模型会输出各个预设推荐方案对应的推荐分值,推荐分值越高,代表参考价值越高。
[0093]
相应的,确定单元342可用于将推荐分值最高的预设医疗推荐方案确定为目标用户的医疗推荐结果。对于本实施例,可将推荐分值最高的预设医疗推荐方案确定为与目标用户匹配的医疗推荐结果,进而输出推荐系统,展示给目标用户,以便为目标用户起到参考作用。
[0094]
通过上述基于知识图谱表征学习的医疗方案推荐系统,可首先提取患者数据中的实体,并基于实体从知识图谱中抽取子图。之后通过知识图谱表征学习,采用三元组嵌入的方法,将每个实体(医生,病人)和关系(就诊,专业领域,处方,开药等)嵌入得到低维向量,并且保持医疗关系图谱中的语义信息。之后,将嵌入得到的低维向量,输入到推荐算法对应的推荐模型中去,推荐模型即可根据患者的低维向量,进行推荐分类,进一步输出医疗推荐结果,以供患者参考。在本申请中,通过表征学习获取低维向量,能够提高推荐系统推荐结果的准确性,为之后的个性化推荐提供更高的支持。此外,对于表征学习,本申请在传统方法的基础上,还额外引入位置编码和关系性记忆网络来挖掘三元组的潜在依赖关系,进一步得到目标实体的低维向量。此一过程应用位置编码和关系型记忆网络编码就诊三元组,能够在一定程度上解决现有方法无法描述知识图谱三元组潜在依赖关系的问题,能够提高三元组嵌入向量的准确性,为之后的个性化推荐提供更高的支持。
[0095]
进一步的,作为图1和图2所示方法的具体体现,本申请实施例提供了一种基于知识图谱表征学习的医疗方案推荐方法,如图4所示,该方法包括:101、获取目标用户的患者
数据,并提取患者数据中的目标实体;102、根据目标实体从医疗知识图谱中划分知识图谱子图;103、基于表征学习确定知识图谱子图对应的低维向量;104、将低维向量输入到符合预设训练标准的推荐模型中,获取得到与患者数据匹配的医疗推荐结果。
[0096]
在具体的应用场景中,在提取患者数据中的目标实体时,具体可以包括:训练用于抽取中实体类的实体抽取模型;利用符合第一预设训练标准的实体抽取模型抽取患者数据中的目标实体。其中,训练用于抽取实体类的实体抽取模型的具体方法可为:对训练集数据中所包含的实体类进行词性标注;将标注处理后的训练集数据输入至实体抽取模型中,训练实体抽取模型基于jieba自然语言处理库抽取实体类;若确定实体类的抽取误差小于预设阈值,则判定实体抽取模型通过训练;若确定实体类的抽取误差大于或等于预设阈值,则判定实体抽取模型未通过训练,利用预先标注好词性的训练集数据重复修正训练实体抽取模型,以使实体抽取模型满足第一预设训练标准。
[0097]
在具体的应用场景中,在根据目标实体从医疗知识图谱中划分知识图谱子图时,具体可以包括:在目标实体中标记核心对象实体和次要对象实体;以各个核心对象实体为遍历起点对医疗知识图谱进行遍历,并在遍历到次要对象实体时停止该方向的遍历;依据各个核心对象实体的遍历结果划分知识图谱子图。
[0098]
相应的,在基于表征学习确定知识图谱子图对应的低维向量时,具体可以包括:提取知识图谱子图中的各个三元组;通过对三元组进行位置编码,为三元组中的实体向量配置位置向量;基于关系型网络对添加位置向量后的三元组进行编码处理,得到编码向量;利用解码器对编码向量进行分值评定,并利用自适应矩估计(adam)优化器进行迭代训练,进一步得到知识图谱子图对应的低维向量。
[0099]
在具体的应用场景中,在将低维向量输入到符合预设训练标准的推荐模型中,获取得到与患者数据匹配的医疗推荐结果之前,具体还包括:确定样本患者数据,并为样本患者数据标注对应的预设医疗推荐方案;利用样本患者数据对应的低维向量训练推荐模型;若判定推荐模型输出的医疗推荐结果符合第二预设训练标准,则确定推荐模型通过训练;若判定推荐模型未通过训练,则利用样本患者数据重复训练推荐模型,以使推荐模型符合第二预设训练标准。
[0100]
相应的,将低维向量输入到符合预设训练标准的推荐模型中,获取得到与患者数据匹配的医疗推荐结果,具体可包括:将低维向量输入到符合第二预设训练标准的推荐模型中,获取得到各个预设医疗推荐方案对应的推荐分值;将推荐分值最高的预设医疗推荐方案确定为目标用户的医疗推荐结果。
[0101]
需要说明的是,本实施例提供的一种基于知识图谱表征学习的医疗方案推荐方法的其它相应描述,可以参考图1至图2中的对应描述,在此不再赘述。
[0102]
基于上述如图4所示方法,相应的,本申请实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图4所示的基于知识图谱表征学习的医疗方案推荐方法。
[0103]
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景的方法。
[0104]
基于上述如图1、图2所示的系统,以及图4所示的方法实施例,为了实现上述目的,本申请实施例还提供了一种计算机设备,具体可以为个人计算机、服务器、网络设备等,该实体设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图4所示的基于知识图谱表征学习的医疗方案推荐方法。
[0105]
可选地,该计算机设备还可以包括用户接口、网络接口、摄像头、射频(radio frequency,rf)电路,传感器、音频电路、wi-fi模块等等。用户接口可以包括显示屏(display)、输入单元比如键盘(keyboard)等,可选用户接口还可以包括usb接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如蓝牙接口、wi-fi接口)等。
[0106]
本领域技术人员可以理解,本实施例提供的计算机设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0107]
非易失性可读存储介质中还可以包括操作系统、网络通信模块。操作系统是基于知识图谱的数据处理实体设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现非易失性可读存储介质内部各组件之间的通信,以及与该实体设备中其它硬件和软件之间通信。
[0108]
通过以上的实施方式的描述,本领域的技术人员可首先提取患者数据中的实体,并基于实体从知识图谱中抽取子图。之后通过知识图谱表征学习,采用三元组嵌入的方法,将每个实体(医生,病人)和关系(就诊,专业领域,处方,开药等)嵌入得到低维向量,并且保持医疗关系图谱中的语义信息。之后,将嵌入得到的低维向量,输入到推荐算法对应的推荐模型中去,推荐模型即可根据患者的低维向量,进行推荐分类,进一步输出医疗推荐结果,以供患者参考。在本申请中,通过表征学习获取低维向量,能够提高推荐系统推荐结果的准确性,为之后的个性化推荐提供更高的支持。此外,对于表征学习,本申请在传统方法的基础上,还额外引入位置编码和关系性记忆网络来挖掘三元组的潜在依赖关系,进一步得到目标实体的低维向量。此一过程应用位置编码和关系型记忆网络编码就诊三元组,能够在一定程度上解决现有方法无法描述知识图谱三元组潜在依赖关系的问题,能够提高三元组嵌入向量的准确性,为之后的个性化推荐提供更高的支持。
[0109]
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
[0110]
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1