基于医疗知识图谱的辅助参考信息的确定方法及系统与流程

文档序号:29364067发布日期:2022-03-23 03:10阅读:130来源:国知局
基于医疗知识图谱的辅助参考信息的确定方法及系统与流程

1.本发明实施例涉及医疗技术领域,尤其涉及一种基于医疗知识图谱的辅助参考信息的确定方法及系统。


背景技术:

2.医生根据各种临床资料对咨询对象的情况进行分析,以为咨询对象提供诊断服务为当前十分常见的辅助方式。现有技术中,医生在为当前咨询对象提供服务时,需要通过搜索相同词的方式在预先建立的医疗知识图谱中确定出与当前对象信息的相似的相似对象信息,基于相似对象信息的服务信息,为当前咨询对象提供服务。
3.但是,搜索相同词的方式仅仅是通过文本信息的字面意义来确定相似对象信息,无法真正凸显具有诊疗意义的医学关键信息,导致易出现确定出的相似对象信息在医学角度上与当前对象信息的相似程度低的情况,无法利用相似对象信息有效、准确地为当前咨询对象提供咨询服务。


技术实现要素:

4.本发明实施例提供了一种基于医疗知识图谱的辅助参考信息的确定方法及系统,以实现在确定目标对象的待推荐参考信息时,不仅考虑到文本相似度,还综合考虑了能够真正凸显医学关键信息的实体相似度,提高了确定相似授权信息的准确率,能够更有效、准确地为目标对象提供服务。
5.第一方面,本发明实施例提供了一种基于医疗知识图谱的辅助参考信息的确定方法,包括:
6.获取目标对象的目标授权信息,确定所述目标授权信息与预先存储的历史医疗信息中各历史授权信息之间的文本相似度;
7.基于各所述历史授权信息及预先建立的医疗知识图谱,确定所述目标授权信息与各所述历史授权信息之间的实体相似度;
8.基于所述文本相似度和所述实体相似度,在各所述历史授权信息中确定出满足预设条件的与所述目标授权信息对应的相似授权信息;
9.将所述相似授权信息作为辅助参考信息进行推荐操作。
10.第二方面,本发明实施例还提供了一种基于医疗知识图谱的辅助参考信息的确定系统,该系统包括:
11.确定文本相似度模块,用于获取目标对象的目标授权信息,确定所述目标授权信息与预先存储的历史医疗信息中各历史授权信息之间的文本相似度;
12.确定实体相似度模块,用于基于各所述历史授权信息及预先建立的医疗知识图谱,确定所述目标授权信息与各所述历史授权信息之间的实体相似度;
13.确定相似授权信息模块,用于基于所述文本相似度和所述实体相似度,在各所述历史授权信息中确定出满足预设条件的与所述目标授权信息对应的相似授权信息;
14.确定待推荐参考信息模块,用于基于所述相似授权信息,确定所述目标对象对应的待推荐参考信息。
15.本发明实施例所提供的一种基于医疗知识图谱的辅助参考信息的确定方法,确定了目标授权信息与各历史授权信息之间的文本相似度,基于预先建立的医疗知识图谱确定了目标授权信息与各历史授权信息之间的实体相似度,综合考虑文本相似度和实体相似度的情况下,在各历史授权信息中确定出满足预设条件的相似授权信息,并基于相似授权信息,确定目标对象对应的待推荐参考信息,以使医生基于待推荐参考信息进行辅助诊断。由此可见,本发明实施例在确定目标对象的待推荐参考信息时,不仅考虑到文本相似度,还综合考虑了能够真正凸显医学关键信息的实体相似度,从而提高了确定相似授权信息的准确率,能够更有效、准确地为目标对象提供服务。
16.此外,本发明所提供的一种基于医疗知识图谱的辅助参考信息的确定系统与上述方法对应,具有同样的有益效果。
附图说明
17.为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
18.图1为本发明实施例提供的一种基于医疗知识图谱的辅助参考信息的确定方法的流程图;
19.图2为本发明实施例提供的一种确定相似授权信息的示意图;
20.图3为本发明实施例提供的一种医疗知识图谱的示意图;
21.图4为本发明实施例提供的另一种基于医疗知识图谱的辅助参考信息的确定方法的流程图;
22.图5为本发明实施例提供的相同知识点展示示意图;
23.图6为本发明实施例提供的一种基于医疗知识图谱的辅助参考信息的确定系统的结构图;
24.图7为本发明实施例提供的一种电子设备的结构图。
具体实施方式
25.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
26.另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
27.为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式
对本发明作进一步的详细说明。
28.实施例一
29.图1为本发明实施例提供的一种基于医疗知识图谱的辅助参考信息的确定方法的流程图。该方法可以由基于医疗知识图谱的辅助参考信息的确定系统来执行,该系统可以通过软件和/或硬件来实现,可配置于终端和/或服务器中来实现本发明实施例中的基于医疗知识图谱的辅助参考信息的确定方法。
30.如图1所示,本实施例的方法具体可包括:
31.s101、获取目标对象的目标授权信息,确定目标授权信息与预先存储的历史医疗信息中各历史授权信息之间的文本相似度。
32.在具体实施中,可获取目标对象的目标授权信息,目标授权信息可理解为被授权的目标对象的医疗信息,包括目标对象的个人信息、目标对象的电子病历中记载的就诊记录、用药记录、历史治疗方案、随访报告等。目标对象可为当前需要就诊的用户。进一步的,可将各历史就诊用户的信息进行存储,生成历史授权信息。历史授权信息可理解为被授权的各历史对象的医疗信息,包括各历史对象的个人信息、历史对象的电子病历中记载的就诊记录、用药记录、历史治疗方案、随访报告等。
33.示例性的,本实施例中,目标授权信息采用就诊用户的电子病例,电子病历中的描述可为“【主诉】:左侧耳面部肿痛1天。【现病史】:患者1天前无明显诱因,出现左侧耳面部疼痛伴局部肿胀,张口时疼痛加重,耳屏及耳屏前软组织压痛明显,无畏寒、发热,无听力受损,无张口受限,无喉部异物感及吞咽梗阻感,无口角歪斜,无闭眼不对称,无烦躁、心慌,无咳嗽、咳痰。于外院口服阿奇霉素1次,症状无缓解。患者为求进一步治疗,遂来我院,急诊以“左急性化脓性腮腺炎;左急性外耳道炎”收入我科。自发病以来,精神、睡眠欠佳,饮食差,糖尿病病史10年,否认高血压,否认肝炎、结核病史,无药物过敏及食物过敏史,无手术、外伤、中毒、输血史,预防接种史不详,系统回顾无特殊。【个人史】:出生原籍,否认疫区及长期外地居住史,无吸烟及其他不良嗜好。【婚育史】:未婚。【家族史】:家族中否认遗传病及类似病史。【体格检查】心率96次/分,血压:113/72毫米汞柱”。
34.进一步的,可预先存储包含有各历史对象的历史授权信息组成的历史医疗信息,历史医疗信息可存储于预先建立的临床数据库中,确定目标授权信息与各历史授权信息之间的文本相似度。需要说明的是,文本相似度可理解为目标授权信息与历史授权信息的字面相似度。
35.可选的,确定目标授权信息与预先存储的历史医疗信息中各历史授权信息的文本相似度,包括:通过分词器对目标授权信息和各历史授权信息进行分词处理,生成目标分词及各历史分词;基于杰卡德算法计算目标分词与各历史分词之间的分词相似度,将分词相似度确定为目标授权信息与各历史授权信息之间的文本相似度。
36.图2为本发明实施例提供的一种确定相似授权信息的示意图,如图2所示可基于医疗领域文书词典,通过spacy分词器,对目标授权信息和各历史授权信息进行分词处理。进一步的,还可基于spacy分词器对目标授权信息和各历史授权信息进行词性标注、词干化、命名实体识别、名词短语提取等操作。
37.进一步的,对于分词处理后的得到的目标授权信息对应的目标分词和与历史授权信息对应的历史分词,可基于杰卡德算法计算目标分词与各历史分词之间的分词相似度,
将各分词相似度确定为目标授权信息与各历史授权信息之间的文本相似度。
38.s102、基于各历史授权信息及预先建立的医疗知识图谱,确定目标授权信息与各历史授权信息之间的实体相似度。
39.在具体实施中,可基于临床数据库中存储的历史医疗信息,预先建立医疗知识图谱。示例性的,历史对象可为各就诊过的患者,可对各就诊过的患者提供的被授权的历史医疗信息中的入院病历、病程记录、手术单和诊断文书等内容,进行数据预处理;将处理后的各历史对象的特征数据及基于关联规则挖掘算法分别进行事实和推理的知识抽取,并采用三元组形式表示,存入至知识图谱中,从而完成患者知识图谱的建立。按照上述患者知识图谱的构建方式对每个患者都预先构建独有的患者知识图谱,基于各患者的患者知识图谱构建医疗知识图谱。
40.可选的,基于各历史授权信息及预先建立的医疗知识图谱,确定目标授权信息与各历史授权信息之间的实体相似度,包括:基于实体识别算法,识别目标授权信息中的关键实体信息;在预先建立的医疗知识图谱中,确定出与关键实体信息对应的附加实体信息;基于关键实体信息和附加实体信息,确定目标授权信息与各历史授权信息之间的实体相似度。
41.如图2所示,可基于实体识别算法,识别目标授权信息中的关键实体信息。示例性的,实体类别包括疾病、症状、体征、检验、手术、药品、化疗、既往疾病、吸烟饮酒和症状部位等。例如,对其中4种实体类别“症状”、“药品”和“诊断疾病”以及“体征”进行识别,则基于目标授权信息可识别出关键实体信息为“症状:左侧耳面部肿痛,药品:阿奇霉素,诊断疾病:左急性化脓性腮腺炎,左急性外耳道炎,2型糖尿病体征:精神、睡眠欠佳,饮食差。”42.进一步的,为了更加全面、完善的体现出目标授权信息,还可在预先建立的医疗知识图谱中,确定出与关键实体信息对应的附加实体信息。图3为本发明实施例提供的一种医疗知识图谱的示意图。具体的,可基于确定出的关键实体信息,在图3所示的医疗知识图谱中确定出与关键实体信息关联的附加实体,并基于预先建立的医疗实体描述信息,确定出附加实体对应的附加实体信息。
43.示例性的,可通过医学领域资料预先建立各医疗实体的医疗实体描述信息。例如,当医疗实体为糖尿病时,医疗实体描述信息可包括“概述、病因学、生理状态、临床表现、辅助检查、护理、治疗、预防和来源”等类别,护理类别对应的描述可为“糖尿病并发症众多,可分为急性并发症和慢性并发症”,概述类别对应的描述可为“2型糖尿病是糖尿病中最常见的类型,多见于30岁以上的成人和老年人”。基于各类别的医疗实体描述信息,可确定出附加实体对应的附加实体信息。
44.可选的,在基于实体识别算法,识别目标授权信息中的关键实体信息之前,还包括:对目标授权信息进行文本向量训练,生成与目标授权信息对应的目标文本向量。具体的,可对目标授权信息通过doc2vec训练方式,进行文本向量训练,生成与目标授权信息对应的目标文本向量。
45.可选的,在基于关键实体信息和附加实体信息,确定目标授权信息与各历史授权信息之间的实体相似度之前,还包括:对目标授权信息及历史授权信息进行训练词向量处理,生成医疗词向量。
46.如图2所示,可基于word2vec训练方式,对目标授权信息及历史授权信息进行词向
量训练,生成包含目标授权信息和历史授权信息的医疗词向量。示例性的,可通过gensim主题模型完成word2vec训练,gensim主题模型用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。
47.可选的,基于关键实体信息和附加实体信息,确定目标授权信息与各历史授权信息之间的实体相似度,包括:基于关键实体信息和医疗词向量,确定出目标授权信息对应的目标关键实体向量;基于附加实体信息和医疗词向量,确定出目标授权信息对应的目标附加实体向量;基于各历史授权信息,确定各历史授权信息对应的历史文本向量、历史关键实体向量和历史附加实体向量;基于目标文本向量、目标关键实体向量、目标附加实体向量、历史文本向量、历史关键实体向量和历史附加实体向量,确定目标授权信息与各历史授权信息之间的实体相似度。
48.具体的,医疗词向量可体现出目标授权信息和各历史授权信息。在医疗词向量中,确定出与目标授权信息中的关键实体信息对应的医疗词向量,将与关键实体信息对应的医疗词向量确定为目标关键实体向量;确定出与附加实体信息对应的医疗词向量,将与附加实体信息对应的医疗词向量确定为目标附加实体向量。
49.进一步的,可基于各历史授权信息,确定出历史授权信息中的关键实体信息和附加实体信息,并基于医疗词向量,分别确定出历史关键实体向量和历史附加实体向量。
50.进一步的,可对历史授权信息进行文本向量训练,生成与历史授权信息对应的历史文本向量。具体的,可对历史授权信息通过doc2vec训练方式,进行文本向量训练。
51.可选的,基于目标文本向量、目标关键实体向量、目标附加实体向量、历史文本向量、历史关键实体向量和历史附加实体向量,确定目标授权信息与各历史授权信息之间的实体相似度,包括:分别确定目标文本向量与各历史文本向量之间的各第一相似度、目标关键实体向量和各历史关键实体向量之间的各第二相似度及目标附加实体向量与各历史附加实体向量之间的各第三相似度;根据预先设定的各权值,分别对目标授权信息与各历史授权信息之间的第一相似度、第二相似度和第三相似度进行加权求平均计算,将计算结果确定为目标授权信息与各历史授权信息之间的实体相似度。
52.需要说明的是,可从文本向量、关键实体向量和附加实体向量三个角度,确定目标授权信息和各历史授权信息之间的实体相似度,更全面的确定出可用于为医生提供参考的待推荐参考信息。
53.在具体实施中,可分别确定目标文本向量和各历史文本向量之间的第一相似度、目标关键实体向量和各历史关键实体向量之间的各第二相似度及目标附加实体向量与各历史附加实体向量之间的各第三相似度。
54.示例性的,可通过余弦夹角cosine的方式分别计算第一相似度、第二相似度和第三相似度,计算公式如下:
55.s=cos(v1,v2)
56.其中,s表示向量v1和向量v2之间的相似度。当计算第一相似度时,v1可为目标文本向量,v2为历史文本向量;当计算第二相似度时,v1可为目标关键实体向量,v2为历史关键实体向量;当计算第三相似度时,v1可为目标附加实体向量,v2为历史附加实体向量。
57.进一步的,根据文本向量、关键实体向量和附加实体向量对确定相似度的重要程度不同,可预先设定第一相似度、第二相似度和第三相似度的权值分别为(0.3,0.4,0.3),
由于文本关键医疗实体向量是确定患者症状治疗等是否有相似性的证据,所以权重占掉大头,而附加实体向量待变关键医疗实体向量的扩展信息,文本向量代表了文本整体在语义上是否相似,对第一相似度、第二相似度和第三相似度进行加权求平均计算,从而确定出目标授权信息与各历史授权信息之间的实体相似度。需要说明的是,实体相似度的数值越大,反映出目标授权信息和历史授权信息之间的相似程度越高。
58.s103、基于文本相似度(0.35)和实体相似度(0.65)加权求平均得到最终的相似度,在各历史授权信息中确定出满足预设条件的与目标授权信息对应的相似授权信息。
59.在具体实施中,可综合考虑目标授权信息和历史授权信息之间的文本相似度和实体相似度两方面因素,确定出满足预设条件可用于进行辅助诊断的相似授权信息。
60.具体的,可设定预设条件为将文本相似度和实体相似度均大于第一预设阈值的历史授权信息确定为相似授权信息;还可设定预设条件为基于文本相似度和实体相似度确定目标授权信息和各历史授权信息之间的综合相似度,将综合相似度大于第二预设阈值的历史授权信息确定为相似授权信息;还可按照综合相似度从大到小的顺序对各历史授权信息进行排序,将排名前100的历史授权信息确定为相似授权信息。本领域技术人员可根据实际应用情况,设定预设条件的具体内容,对此本发明实施例不作限定。
61.s104、将相似授权信息作为辅助参考信息进行推荐操作。
62.具体的,可将确定出的相似授权信息作为对目标对象进行辅助诊断的辅助参考信息,将相似授权信息推送至医生终端,以使医生更高效、准确地为目标对象进行诊断。
63.进一步的,在推送相似授权信息时,可按照与目标授权信息的相似程度由高到低的顺序,依次进行推送;也可按照各相似授权信息的存储时间顺序,推送至医生终端,对此本发明实施例不作限定。
64.本发明实施例所提供的一种基于医疗知识图谱的辅助参考信息的确定方法,确定了目标授权信息与各历史授权信息之间的文本相似度,基于预先建立的医疗知识图谱确定了目标授权信息与各历史授权信息之间的实体相似度,综合考虑文本相似度和实体相似度的情况下,在各历史授权信息中确定出满足预设条件的相似授权信息,并将相似授权信息作为辅助参考信息进行推荐操作,以使医生基于辅助参考信息进行辅助诊断。由此可见,本发明实施例在确定目标对象的辅助参考信息时,不仅考虑到文本相似度,还综合考虑了能够真正凸显医学关键信息的实体相似度,从而提高了确定相似授权信息的准确率,能够更有效、准确地为目标对象提供服务。
65.实施例二
66.图4为本发明实施例提供的另一种基于医疗知识图谱的辅助参考信息的确定方法的流程图。本实施例以上述各技术方案为基础进行优化。可选的,基于文本相似度和实体相似度,在各历史授权信息中确定出满足预设条件的与目标授权信息对应的相似授权信息,包括:对文本相似度和实体相似度进行求平均计算,得到目标授权信息和各历史授权信息之间的第一平均相似度;将各第一平均相似度按照由大到小的顺序进行排序,将排名小于预设阈值的各第一平均相似度对应的各历史授权信息,确定为目标授权信息对应的相似授权信息。其中,与上述各实施例相同或相应的术语的解释在此不再赘述。
67.如图4所示,本实施例的方法具体可包括:
68.s201、获取目标对象的目标授权信息,确定目标授权信息与预先存储的历史医疗
信息中各历史授权信息之间的文本相似度。
69.在具体实施中,对于推荐过辅助参考信息的已推荐对象,可存储该已推荐对象的辅助参考信息,当已推荐对象需要再次推荐辅助参考信息时,无需计算可直接将预先存储的辅助参考信息进行再次推荐。
70.示例性的,获取目标对象的目标授权信息后,可基于目标授权信息确定目标对象是否为新增对象,如果是,则确定目标授权信息与预先存储的历史医疗信息中各历史授权信息之间的文本相似度。如果否,则可直接获取预先存储的与目标对象的目标授权信息对应的相似授权信息,并将相似授权信息作为辅助参考信息进行推荐操作。
71.进一步的,对于推荐过辅助参考信息的已推荐对象,可定期基于新添加的添加授权信息,更新存储的该已推荐对象的辅助参考信息,以提高辅助参考信息的精确度。
72.s202、基于各历史授权信息及预先建立的医疗知识图谱,确定目标授权信息与各历史授权信息之间的实体相似度。
73.s203、对文本相似度和实体相似度进行求平均计算,得到目标授权信息和各历史授权信息之间的第一平均相似度。
74.具体的,对文本相似度和实体相似度进行求平均计算后,得到的第一平均相似度既可以反映出目标授权信息和历史授权信息之间的字面相似程度,同时也可反映出二者之间的语义相似程度。
75.s204、将各第一平均相似度按照由大到小的顺序进行排序,将排名小于预设阈值的各第一平均相似度对应的各历史授权信息,确定为目标授权信息对应的相似授权信息。
76.具体的,预设阈值可设为100,本领域技术人员也可根据实际应用情况确定预设阈值的取值,本发明实施例对此不作限定。进一步的,可对各第一平均相似度进行最大池化操作(max-pooling),可确定出第一平均相似度最大的预设数量的历史授权信息,将其确定为相似授权信息。
77.可选的,本发明实施例还包括:当接收到新增授权信息时,确定新增授权信息与目标授权信息之间的第二平均相似度;确定排名小于预设阈值的各第一平均相似度中的最小相似度;确定第二平均相似度是否大于最小相似度;如果是,则将新增授权信息确定为新增的相似授权信息。
78.具体的,当有新增对象时,可将新增对象的新增授权信息存储至临床数据库中,分别确定新增授权信息和目标授权信息之间的实体相似度和文本相似度,对实体相似度和文本相似度求取平均值,以确定出新增授权信息和目标授权信息之间的第二平均相似度。
79.进一步的,为对目标对象提供准确的辅助参考信息,可确定排名小于预设阈值的各第一平均相似度中的最小相似度,并将最小相似度与第二平均相似度进行比较,当第二平均相似度小于最小相似度时,可仍将各排名小于预设阈值的第一平均相似度对应的历史授权信息确定为相似授权信息;当第二平均相似度大于或等于最小相似度时,则在原定的相似授权信息中删除掉最小相似度对应的历史授权信息,并将新增授权信息确定为相似授权信息。
80.s205、将相似授权信息作为辅助参考信息进行推荐操作。
81.本发明实施例提供的基于医疗知识图谱的辅助参考信息的确定方法,确定出相似度排名小于预设阈值的各第一平均相似度对应的各历史授权信息作为相似授权信息,有利
于提高确定辅助参考信息的准确性;并且在存在新增授权信息时,基于新增授权信息的第二平均相似度,更新已确定的相似授权信息,提高了推荐内容的灵活性。
82.实施例三
83.上文中对于基于医疗知识图谱的辅助参考信息的确定方法对应的实施例进行了详细描述,为了使本领域技术人员进一步清楚本方法的技术方案,下文中给出具体的应用场景。通过该应用场景进行说明:当医生针对某一目标对象进行诊断时,需要查询历史相似电子病例来进行辅助参考。
84.本发明实施例中,临床数据库中存储有n位对象的医疗信息,可设为p1对象至pn对象,可预先对各对象构建对象知识图谱,基于预先构建的各对象的各个维度的信息,形成医疗知识图谱,并对该医疗知识图谱进行存储。根据所构建的对象知识图谱,在展示界面点击某个对象,即可显示与该对象相关的各个维度信息,例如异常检验名,检验值,患者病历中症状,既往史中的既往疾病,以及既往使用过得药物,或者既往做过得手术,做过得检查检验等信息。
85.图5为本发明实施例提供的相同知识点展示示意图;如图5所示,可同时在展示界面中同时选中至少两个对象,显示至少两个对象的对象知识图谱,并展示出各对象之间的相同知识点。
86.具体的,可分别将临床数据库中存储的各对象作为目标对象,分别计算目标对象的目标授权信息与各存量对象的存量授权信息之间的文本相似度和实体相似度,基于文本相似度和实体相似度计算出目标授权信息和存量授权信息之间的相似度总分,确定出各对象的相似度总分最大的前100个存量对象的存量授权信息,将该100各存量授权信息确定为辅助参考信息进行存储,以便于在需要对目标对象进行辅助参考信息推荐时,可及时响应。表1是p1对象与各存量对象之间的相似度总分排名表。
87.表1
[0088][0089]
如表1所示,按照相似度总分由大到小的顺序,对各存量对象进行排序。
[0090]
表2是与p1对象相似度总分最大的前100个存量对象的排名表,如表2所示。
[0091]
表2
[0092]
[0093]
当临时数据库中最新存储了新增对象pp的新增授权信息时,分别确定新增授权信息和目标授权信息之间的实体相似度和文本相似度,对实体相似度和文本相似度求取平均值,计算出新增对象与各目标对象的相似度总分。
[0094]
可判断新增对象对应的相似度总分是否小于表2中的相似度总分最小值,如果否,则将新增对象及相似度总分添加至表2中,删除表2中第100名的存量对象的信息,将更新后的表2中的各对象的对象授权信息作为目标对象p1的辅助参考信息。
[0095]
如果是,则保持表2中的内容不变,仍将表2中记录的各存量对象的授权信息作为目标对象p1的辅助参考信息。
[0096]
表3为对表2更新后的排名表,如表3所示。
[0097]
表3
[0098][0099][0100]
考虑了每一位存量对象和新增对象,确定出各对象的相似度总分最大的前100个存量对象的存量授权信息,将该100各存量授权信息确定为辅助参考信息进行存储,以便于在需要对目标对象进行辅助参考信息推荐时,可及时响应。
[0101]
可对各目标对象的辅助参考信息进行可视化展示,通过在展示界面进行点击目标对象图标操作或在搜索框输入目标对象,可推荐与目标对象相似的辅助参考信息,实现搜索目标对象,实时展示目标对象的辅助参考信息。
[0102]
本发明实施例提供的基于医疗知识图谱的辅助参考信息的确定方法,在存在新增授权信息时,基于新增授权信息的第二平均相似度,更新已确定的相似授权信息,提高了推荐内容的灵活性。还综合考虑了能够真正凸显医学关键信息的实体相似度,从而提高了确定相似授权信息的准确率,能够更有效、准确的目标对象提供服务。
[0103]
实施例四
[0104]
图6为本发明实施例提供的一种基于医疗知识图谱的辅助参考信息的确定系统的结构图,该系统用于执行上述任意实施例所提供的基于医疗知识图谱的辅助参考信息的确定方法。该系统与上述各实施例的基于医疗知识图谱的辅助参考信息的确定方法属于同一个发明构思,在基于医疗知识图谱的辅助参考信息的确定系统的实施例中未详尽描述的细节内容,可以参考上述基于医疗知识图谱的辅助参考信息的确定方法的实施例。该系统具体可包括:
[0105]
确定文本相似度模块10,用于获取目标对象的目标授权信息,确定目标授权信息与预先存储的历史医疗信息中各历史授权信息之间的文本相似度;
[0106]
确定实体相似度模块11,用于基于各历史授权信息及预先建立的医疗知识图谱,确定目标授权信息与各历史授权信息之间的实体相似度;
[0107]
确定相似授权信息模块12,用于基于文本相似度和实体相似度,在各历史授权信息中确定出满足预设条件的与目标授权信息对应的相似授权信息;
[0108]
推荐辅助参考信息模块13,用于将相似授权信息作为辅助参考信息进行推荐操作。
[0109]
在本发明实施例中任一可选技术方案的基础上,可选的,所述确定实体相似度模块11包括:
[0110]
识别关键实体信息单元,用于基于实体识别算法,识别目标授权信息中的关键实体信息;在预先建立的医疗知识图谱中,确定出与关键实体信息对应的附加实体信息;基于关键实体信息和附加实体信息,确定目标授权信息与各历史授权信息之间的实体相似度。
[0111]
在本发明实施例中任一可选技术方案的基础上,可选的,还包括:
[0112]
文本向量训练模块,用于在基于实体识别算法,识别目标授权信息中的关键实体信息之前对目标授权信息进行文本向量训练,生成与目标授权信息对应的目标文本向量。
[0113]
在本发明实施例中任一可选技术方案的基础上,可选的,还包括:
[0114]
生成医疗词向量模块,用于在基于关键实体信息和附加实体信息,确定目标授权信息与各历史授权信息之间的实体相似度之前,对目标授权信息及历史授权信息进行训练词向量处理,生成医疗词向量。
[0115]
在本发明实施例中任一可选技术方案的基础上,可选的,所述确定实体相似度模块包括:
[0116]
确定实体相似度单元,用于基于关键实体信息和医疗词向量,确定出目标授权信息对应的目标关键实体向量;基于附加实体信息和医疗词向量,确定出目标授权信息对应的目标附加实体向量;基于各历史授权信息,确定各历史授权信息对应的历史文本向量、历史关键实体向量和历史附加实体向量;基于目标文本向量、目标关键实体向量、目标附加实体向量、历史文本向量、历史关键实体向量和历史附加实体向量,确定目标授权信息与各历史授权信息之间的实体相似度。
[0117]
在本发明实施例中任一可选技术方案的基础上,可选的,所述确定确定实体相似度单元包括:
[0118]
计算加权平均单元,用于分别确定目标文本向量与各历史文本向量之间的各第一相似度、目标关键实体向量和各历史关键实体向量之间的各第二相似度及目标附加实体向量与各历史附加实体向量之间的各第三相似度;根据预先设定的各权值,分别对目标授权信息与各历史授权信息之间的第一相似度、第二相似度和第三相似度进行加权求平均计算,将计算结果确定为目标授权信息与各历史授权信息之间的实体相似度。
[0119]
在本发明实施例中任一可选技术方案的基础上,可选的,所述确定相似授权信息模块包括:
[0120]
确定相似授权信息单元,用于对文本相似度和实体相似度进行求平均计算,得到目标授权信息和各历史授权信息之间的第一平均相似度;将各第一平均相似度按照由大到小的顺序进行排序,将排名小于预设阈值的各第一平均相似度对应的各历史授权信息,确定为目标授权信息对应的相似授权信息。
[0121]
在本发明实施例中任一可选技术方案的基础上,可选的,还包括:
[0122]
确定第二平均相似度模块,用于当接收到新增授权信息时,确定新增授权信息与
目标授权信息之间的第二平均相似度;确定排名小于预设阈值的各第一平均相似度中的最小相似度;确定第二平均相似度是否大于最小相似度;如果是,则将新增授权信息确定为新增的相似授权信息。
[0123]
在本发明实施例中任一可选技术方案的基础上,可选的,确定文本相似度模块包括:
[0124]
分词处理单元,用于通过分词器对目标授权信息和各历史授权信息进行分词处理,生成目标分词及各历史分词;基于杰卡德算法计算目标分词与各历史分词之间的分词相似度,将分词相似度确定为目标授权信息与各历史授权信息之间的文本相似度。
[0125]
本发明实施例所提供的基于医疗知识图谱的辅助参考信息的确定系统可执行本发明任意实施例所提供的基于医疗知识图谱的辅助参考信息的确定方法,具备执行方法相应的功能模块和有益效果。
[0126]
值得注意的是,上述基于医疗知识图谱的辅助参考信息的确定系统的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
[0127]
实施例五
[0128]
图7为本发明实施例提供的一种电子设备的结构示意图。图7示出了适于用来实现本发明实施例实施方式的示例性电子设备20的框图。显示的电子设备20仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
[0129]
如图7所示,电子设备20以通用计算设备的形式表现。电子设备20的组件可以包括但不限于:一个或者多个处理器或者处理单元201,系统存储器202,连接不同系统组件(包括系统存储器202和处理单元201)的总线203。
[0130]
总线203表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)总线,增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。
[0131]
电子设备20典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备20访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
[0132]
系统存储器202可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(ram)204和/或高速缓存存储器205。电子设备20可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统206可以用于读写不可移动的、非易失性磁介质。可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线203相连。存储器202可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
[0133]
具有一组(至少一个)程序模块207的程序/实用工具208,可以存储在例如存储器202中,这样的程序模块207包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块207
通常执行本发明所描述的实施例中的功能和/或方法。
[0134]
电子设备20也可以与一个或多个外部设备209(例如键盘、指向设备、显示器210等)通信,还可与一个或者多个使得用户能与该电子设备20交互的设备通信,和/或与使得该电子设备20能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口211进行。并且,电子设备20还可以通过网络适配器212与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器212通过总线203与电子设备20的其它模块通信。应当明白,可以结合电子设备20使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。
[0135]
处理单元201通过运行存储在系统存储器202中的程序,从而执行各种功能应用以及数据处理。
[0136]
本发明所提供的一种电子设备,能够实现如下方法:获取目标对象的目标授权信息,确定目标授权信息与预先存储的历史医疗信息中各历史授权信息之间的文本相似度;基于各历史授权信息及预先建立的医疗知识图谱,确定目标授权信息与各历史授权信息之间的实体相似度;基于文本相似度和实体相似度,在各历史授权信息中确定出满足预设条件的与目标授权信息对应的相似授权信息;将相似授权信息作为辅助参考信息进行推荐操作。
[0137]
本发明实施例在确定目标对象的待推荐参考信息时,不仅考虑到文本相似度,还综合考虑了能够真正凸显医学关键信息的实体相似度,从而提高了确定相似授权信息的准确率,能够更有效、准确地为目标对象提供服务。
[0138]
实施例六
[0139]
本发明实施例提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种基于医疗知识图谱的辅助参考信息的确定方法,该方法包括:
[0140]
获取目标对象的目标授权信息,确定目标授权信息与预先存储的历史医疗信息中各历史授权信息之间的文本相似度;基于各历史授权信息及预先建立的医疗知识图谱,确定目标授权信息与各历史授权信息之间的实体相似度;基于文本相似度和实体相似度,在各历史授权信息中确定出满足预设条件的与目标授权信息对应的相似授权信息;将相似授权信息作为辅助参考信息进行推荐操作。
[0141]
本发明实施例在确定目标对象的待推荐参考信息时,不仅考虑到文本相似度,还综合考虑了能够真正凸显医学关键信息的实体相似度,从而提高了确定相似授权信息的准确率,能够更有效、准确地为目标对象提供服务。
[0142]
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的基于医疗知识图谱的辅助参考信息的确定方法中的相关操作。
[0143]
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或
多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0144]
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0145]
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0146]
可以以一种或多种程序设计语言或其组合来编写用于执行本发明实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言——诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0147]
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1