基于知识图谱的交互方法、装置、终端和存储介质与流程

文档序号:26139866发布日期:2021-08-03 14:23阅读:87来源:国知局
基于知识图谱的交互方法、装置、终端和存储介质与流程

本申请涉及数据分析技术领域,尤其涉及一种基于知识图谱的交互方法、装置、终端和存储介质。



背景技术:

现有的基于知识图谱的疾病澄清的多轮交互中,通常先根据疾病取到图谱中的知识,并按照原有设定好的对应疾病的多轮运行方式对图谱中的知识进行分析并展现给用户。

然而上述方式存在以下问题:1.程序中的框架无法和图谱中存储的知识结构进行紧耦合匹配,造成多轮逻辑复杂而且容易出错。2.当图谱中的疾病对应的知识需要更新或者添加时,现有的多轮的知识存储方法会使得对应疾病的多轮流程也需要进行变更,需要程序同步发版才能解决,制约了知识的及时更新和增加了系统的复杂度。即当前针对图谱的调用程序逻辑复杂,且更新过程复杂,图谱更新后调用程序也无法得到及时更新,使得基于图谱进行问答的效率较低。



技术实现要素:

本申请实施例提供了一种基于知识图谱的交互方法、装置、终端和存储介质,可以基于图谱自动生成脚本,并基于脚本调用相应问题与用户进行交互,提升与用户的交互效率。

一方面,本申请实施例提供了一种基于知识图谱的交互方法,所述方法包括:

获取目标用户输入的病历文本,并从所述病历文本中提取出目标疾病实体;

从知识图谱中确定出所述目标疾病实体对应的知识集合,所述知识集合中包括在所述知识图谱中与所述目标疾病实体关联的多个问答组合;

确定所述知识集合中各个问答组合对应的知识架构,并基于所述知识架构生成针对所述知识集合中各个问答组合的调用脚本,所述知识架构为所述知识集合中各个问答组合的关联结构;

基于所述调用脚本调用所述各个问答组合,以与所述目标用户进行交互,得到交互结果。

一方面,本申请实施例提供了一种基于知识图谱的交互装置,所述装置包括:

获取模块,用于获取目标用户输入的病历文本;

提取模块,用于从所述病历文本中提取出目标疾病实体;

确定模块,用于从知识图谱中确定出所述目标疾病实体对应的知识集合,所述知识集合中包括在所述知识图谱中与所述目标疾病实体关联的多个问答组合;

所述确定模块,还用于确定所述知识集合中各个问答组合对应的知识架构;

生成模块,用于基于所述知识架构生成针对所述知识集合中各个问答组合的调用脚本,所述知识架构为所述知识集合中各个问答组合的关联结构;

调用模块,用于基于所述调用脚本调用所述各个问答组合,以与所述目标用户进行交互,得到交互结果。

一方面,本申请实施例提供了一种终端,包括处理器和存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,其特征在于,所述处理器被配置用于调用所述程序指令,执行所述基于知识图谱的交互方法。

一方面,本申请实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行基于知识图谱的交互方法。

本申请实施例中,终端获取目标用户输入的病历文本,并从病历文本中提取出目标疾病实体;从知识图谱中确定出目标疾病实体对应的知识集合,确定知识集合中各个问答组合对应的知识架构,并基于知识架构生成针对知识集合中各个问答组合的调用脚本,基于调用脚本调用各个问答组合,以与目标用户进行交互,得到交互结果。通过上述方法,基于知识图谱自动生成脚本对问答组合进行调用,在图谱更新后,图谱对应的调用脚本也会自动得到修改,并在后续问答过程中基于修改后的图谱进行交互。上述方式中,因交互方式由知识图谱确定,则在知识图谱发生变更之后,与用户的交互方式也会发生相应变更,而无需修改程序代码,提升了基于知识图谱的交互效率

附图说明

为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种基于知识图谱的交互方法的流程示意图;

图2是本申请实施例提供的一种构建完成的知识树的结构示意图;

图3是本申请实施例提供的一种知识集合的关系架构示意图;

图4是本申请实施例提供的一种基于知识图谱的交互流程示意图;

图5是本申请实施例提供的另一种基于知识图谱的交互方法的流程示意图;

图6是本申请实施例提供的一种基于知识图谱的交互装置的结构示意图;

图7是本申请实施例提供的一种终端的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本申请实施例提供的基于知识图谱的交互方法实现于终端,所述终端包括智能手机、平板电脑、数字音视频播放器、电子阅读器、手持游戏机或车载电子设备等电子设备。

图1是本申请实施例中一种基于知识图谱的交互方法的流程示意图,如图1所示,本实施例中的基于知识图谱的交互方法的流程可以包括:

s101、获取目标用户输入的病历文本,并从病历文本中提取出目标疾病实体。

本申请实施例中,病历文本可以由多个字符组成,具体可以为目标用户输入病历单、患病情况说明、针对某种疾病的详情询问等,如在医保领域,用户需要输入自身的历史患病情况说明后,可以得知自身可购买的医保的种类、每类医保的详细信息等,通常情况下,病历文本中都包括一种或多种疾病,终端可以接收目标用户输入的病历文本,并从病历文本中提取出目标疾病实体。

在一种实现方式中,终端提取出目标疾病实体的具体方式可以为,预先定义多个词组作为疾病词组,并将其存储于数据库中,在接收到疾病文本后,对疾病文本进行分词处理,得到至少一个词组,当检测到至少一个词组中存在与数据库中词组匹配的目标词组时,将目标词组作为疾病文本中的目标疾病实体。或者,用户可以按照预设模板输入病历文本,该预设模板的指定位置处用于接收疾病实体,则终端可以直接从病历文本中的指定位置处提取得到目标疾病实体,如模板中存在“所患疾病”项,则终端可以将“所患疾病”项中用户输入的字符确定为目标疾病实体。

在一种实现方式中,终端可以基于识别模型对病历文本进行处理,得到病历文本中的目标疾病实体。其中,识别模型用于自动识别出病历文本中的疾病实体,识别模型的具体训练方式可以为,终端获取n个样本集合,每个样本集合中包括样本文本和样本实体;通过n个样本集合对初始识别模型进行预训练,得到基础识别模型;进一步的,终端获取k个疾病样本集合,疾病样本集合中包括疾病样本文本和疾病样本实体;通过k个疾病样本集合对基础识别模型进行训练,得到训练完成的识别模型。其中,n和k为正整数,预训练过程中包括,基于初始识别模型对样本文本进行处理得到的样本预测实体与样本实体之间的匹配度,对初始识别模型中的参数进行更新;训练过程中包括,基于基础识别模型对疾病样本文本进行处理得到的疾病样本预测实体与疾病样本实体之间的匹配度,对基础识别模型中的参数进行更新。即通过样本集合对模型进行预训练,使得模型学习到针对实体进行识别的能力,在通过疾病样本对模型进行再次训练,使得模型具备识别疾病实体的能力,通过上述方式,即可实现基于少量疾病实体样本完成模型的训练,并使得训练完成的识别模型具有较好的泛化以及迁移能力,如后续可以基于较少的其他类实体样本对模型进行再次训练,使得模型具备较好的识别其他类实体的能力。

其中,终端通过n个样本集合对初始识别模型进行预训练,得到基础识别模型的方式具体可以为,对n个样本集合进行向量化处理,得到n个样本向量集合,每个样本向量集合中包括样本文本向量和样本实体向量,调用初始识别模型对样本文本向量进行处理,得到预测实体向量,基于预测实体向量与样本实体向量之间的距离对初始识别模型中的参数进行更新,若参数更新后的初始识别模型满足第一预设条件,则将参数更新后的初始识别模型确定为基础识别模型,其中,第一预设条件可以为对各个样本集合中样本文本的识别成功率高与预设准确率,当预测实体向量对应的实体与样本实体相匹配时,确定识别成功。同理,终端通过k个疾病样本集合对基础识别模型进行训练的具体方式为,对k个疾病样本集合进行向量化处理,得到k个疾病样本向量集合,每个疾病样本向量集合中包括疾病样本文本向量和疾病样本实体向量,调用基础识别模型对疾病样本文本向量进行处理,得到预测疾病实体向量,基于预测疾病实体向量与疾病样本实体向量之间的距离对基础识别模型中的参数进行更新,若参数更新后的基础识别模型满足第二预设条件,则将参数更新后的基础识别模型确定为训练完成的识别模型,其中,第二预设条件可以为对各个样本集合中疾病样本文本的识别成功率高与预设准确率,当预测疾病实体向量对应的疾病实体与疾病样本实体相匹配时,确定识别成功。

在一种实现方式中,终端从病历文本中提取出目标疾病实体的具体方式还可以为,终端对病历文本进行分词处理,得到至少一个词组;若至少一个词组与数据库中的参考词组匹配,则将匹配的目标词组确定为目标疾病实体,若至少一个词组与数据库中参考词组不匹配,则调用识别模型对病历文本进行处理,得到病历文本中的目标疾病实体。其中,数据库中存储了至少一个参考词组,每个参考词组对应一个疾病实体;当上述至少一个词组与数据库中各个参考词组均不相同时,确定至少一个词组与数据库中的参考词组不匹配,当至少一个词组中存在与参考词组相同的词组时,将该相同的词组作为目标词组。识别模型的具体训练方式为,获取n个样本集合,每个样本集合中包括样本文本和样本实体;通过n个样本集合对初始识别模型进行预训练,得到基础识别模型;获取k个疾病样本集合,疾病样本集合中包括疾病样本文本和疾病样本实体;通过k个疾病样本集合对基础识别模型进行训练,得到训练完成的识别模型。需要说明的是,通过识别模型识别得到病历文本中的目标疾病实体之后,可以发出提示信息,以提示目标疾病实体为一种数据库中未存储的实体,在接收到针对目标疾病实体的存储指令之后,将目标疾病实体存储至数据库,或者,终端直接将模型识别出的目标疾病实体存储至数据库中。通过上述方式,可以结合数据库和模型对疾病实体进行提取,提升疾病实体的识别准确率,并实现对数据库的自动更新。

s102、从知识图谱中确定出目标疾病实体对应的知识集合。

本申请实施例中,终端提取出疾病文本中目标疾病实体之后,可以从知识图谱中确定出目标疾病实体对应的知识集合,知识集合中包括在知识图谱中与目标疾病实体关联的多个问答组合,一个问答组合包括一个问题和对应的答案,如问题为“是否患过甲亢”,答案为“是”或“否”,答案具体用于与用户输入的回答进行匹配,并执行相应的跳转。其中,可以预先构建知识图谱,知识图谱中存储了多个疾病实体以及每个疾病实体对应的关联对象,关联对象和疾病实体之间在知识图谱中可以通过边建立连接,在任意一个疾病实体与关联对象之间的边中,还包括了疾病实体的子图谱,子图谱中具体包括了疾病实体和关联对象之间的知识集合,知识集合可以为多个问题与多个答案的集合,关联结构具体为知识集合中各个问答组合的关联结构,具体指示了各个问答组合间的关系,如并列关系、包含关系等。在一个实施例中,知识图谱则可以为疾病对应的保险图谱,则知识图谱中包括的内容为各种疾病和各种保险,以及每种疾病与保险的对应关系。其中,针对每种疾病,知识图谱中采用一条边建立疾病与保险之间的连接,若知识图谱中疾病与保险建立了连接,则说明在一些情景下疾病患者可以购买该类保险,并且,在每条边中,还存在一个子图谱,该子图谱中存储了疾病对应的问答数据集合,用于与用户进行交互,并在交互满足条件时,输出与疾病对应的保险的相关内容。

具体的,知识图谱的具体构建方式可以为获取多个疾病实体以及每个疾病实体对应的关联对象;通过边将每个疾病实体以及对应的关联对象建立连接;在各个疾病实体和对应的关联对象之间的边中添加参考知识集合,得到知识图谱,参考知识集合中包括与各个疾病实体关联的多个问答组合。例如,疾病实体为“甲亢”,对应的关联对象为“医保”,则在“甲亢”和“医保”之间添加与“甲亢”关联的问答组合“如问题为是否有过甲亢病史”,答案为“是”或“否”,针对用户输入的回答与答案进行匹配后,可以输出下一个问答组合,以与用户进行交互。

终端构建出知识图谱之后,可以从知识图谱中确定出目标疾病实体对应的知识集合,具体的,终端可以从知识图谱中确定出疾病实体所在的槽位,并将疾病实体与槽位进行实体对齐后,获取到与该槽位相连接的边,并获取到边中存储的知识集合,作为目标疾病实体对应的知识集合。

s103、确定知识集合中各个问答组合对应的知识架构,并基于知识架构生成针对知识集合中各个问答组合的调用脚本。

本申请实施例中,终端获取到目标疾病实体对应的知识集合之后,将确定知识集合中各个问答组合对应的知识架构,具体的,终端确定知识架构的具体方式可以为,终端获取知识集合中各个问答组合之间的关联关系,并基于关联关系从知识集合中确定出目标问答组合,目标问答组合作为根节点与各个问答组合建立连接,以目标问答组合为初始点,对各个问答组合进行遍历,构建出知识集合中各个问答组合对应的知识树;将知识树的结构确定为知识集合中各个问答组合对应的知识架构。其中,关联关系包括包含关系和并列关系,如终端可以将包含关系中没有被包含的问答组合确定为目标问答组合,并将只被目标问答组合包含的问答组合确定为目标问答组合的子组合,与目标问答组合建立连接,通过上述方式,完成各个问答组合之间的连接。终端构建出知识集合中各个问答组合对应的知识树,即将各个问答组合以树结构的形式进行表示,以体现各个问答组合之间的关系,如图2所示,为本申请提供的一种构建完成的知识树的结构示意图,图2中,目标疾病实体为“肝脏囊肿”,目标问答组合为“是否已经手术、是、否”,其中,答案“是”包含的子问答组合为“是否为良性、是、否”,否对应的问答组合为“是否为单发、是、否”,进一步的,针对每一种答案,还可以与相应的对象建立连接,如与寿险、重疾险、医疗险等建立连接。通过上述方式,即确定出了疾病实体“肝脏囊肿”下的知识树,即知识集合中各个问答组合对应的知识树。

进一步的,终端确定知识集合中各个问答组合对应的知识架构之后,将基于知识架构生成针对知识集合中各个问答组合的调用脚本。具体的,终端获取知识集合中每个问答组合对应的代码模块;基于知识架构确定各个代码模块对应的组合逻辑,并基于组合逻辑对各个代码模块进行组合,得到组合代码模块;基于预设方式对组合代码模块进行封装,得到可运行类;基于预置调用函数对可运行类进行调用,生成调用脚本。其中,针对每个问答组合,都预先配置了相应的代码模块,用于对各个问答组合进行调用,不同的组合逻辑中各个代码模块的调用顺序可以不同,通过知识架构对应的组合逻辑对各个代码模块进行组合,则得到的组合代码模块中各个代码模块的调用逻辑与知识架构一致。进一步的,终端基于预设方式对组合代码模块进行封装的方式可以为,在组合代码模块中添加预设函数字段,以实现后续对组合代码的调用,通过封装,可将组合代码模块转换为一个可运行类,该可运行类即调用脚本,后续可通过调用函数对该调用脚本进行调用。

s104、基于调用脚本调用各个问答组合,以与目标用户进行交互,得到交互结果。

本申请实施例中,终端得到针对各个问答组合的调用脚本之后,将基于调用脚本调用各个问答组合,以与目标用户进行交互,得到交互结果。终端基于调用脚本调用各个问答组合与目标用户进行交互的具体方式可以为,启动线程对调用脚本进行执行,得到问答组合调用指令,进一步的,采用调用指令对各个问答组合进行处理,实现对各个问答组合的调用。其中,调用方式可以为以文字形式输出问答组合或者以语义形式输出问答组合,与用户交互的过程具体为输出问答组合中的问题,并接收目标用户返回的回答,从问答组合中找到与回答匹配的答案,并跳转输出下一个问答组合,与目标用户进行交互。

如图3所示,针对目标疾病实体“肝囊肿”,疾病实体对应的知识集合的关系架构具体可以如图3所示,此数据存储在知识图谱中疾病和对应产品的关系的边上,图3中为3级架构,由多个问答组合构成,包括问题ques以及答案answer。则基于调用指令调用各个问答组合与目标用户进行交互的过程可以为,通过调用指令取ques对应的语料,如果没有,那么ques为空,那么返回通用回复,如果有则发送给用户,形成第一轮的交互。接收用户的是、否的输入后,查看answer0或者answer1(分别对应是或者否),如果答案为空,那么找到对应于ques0或者ques1的知识,返回给用户,完成第二轮的交互。当用户再次点击输入是、否后,查看对应于answer00、answer01,answer10,answer11的输入,其中前两个对应于ques0,后两个对应于ques1,如果为空,那么找到对应于ques00、ques01、ques10、ques11的答案,完成第三轮的交互,如果答案不为空,那么完成本次交互,并输出对应的答案。以此类推,本申请的轮数的多少由图谱中的知识决定,不受程序本身结构的影响。具体交互过程可以如图4所示。

进一步的,可以接收用户输入的反馈信息,并基于反馈信息对知识图谱进行更新,如用户疾病实体对应的关联对象有误,则经确认后,可以由图谱开发人员对图谱中的知识进行修改,在图谱修改后,图谱对应的调用程序也会自动得到修改,并在后续问答过程中基于修改后的图谱进行交互。上述方式中,因交互方式由知识图谱确定,则在知识图谱发生变更之后,与用户的交互方式也会发生相应变更,而无需修改程序代码,提升了基于知识图谱的交互效率。

本申请实施例中,终端获取目标用户输入的病历文本,并从病历文本中提取出目标疾病实体;从知识图谱中确定出目标疾病实体对应的知识集合,确定知识集合中各个问答组合对应的知识架构,并基于知识架构生成针对知识集合中各个问答组合的调用脚本,基于调用脚本调用各个问答组合,以与目标用户进行交互,得到交互结果。通过上述方法,可以基于图谱自动生成脚本,并基于脚本调用相应问题与用户进行交互,提升与用户的交互效率。

图5是本申请实施例中另一种基于知识图谱的交互方法的流程示意图,如图5所示,本实施例中的基于知识图谱的交互方法的流程可以包括:

s501、获取多个疾病实体以及每个疾病实体对应的关联对象。

本申请实施例中,疾病实体可以为一种疾病,如“甲亢、肝囊肿”等,每个疾病实体可以对应有一种或多种关联的对象,具体可以患有该疾病的人员可购买的相关保险,如疾病实体“甲亢”,可购买的保险包括“寿险”和“医疗险”。其中,每个疾病实体可以对应多个关联对象,每个关联对象也可以关联对个实体。

s502、通过边将每个疾病实体以及对应的关联对象建立连接。

本申请实施例中,终端获取到各个疾病实体和关联对象之后,可以通过边将疾病实体和关联对象对应连接,以建立各个疾病实体和关联对象之间的联系。

s503、在各个疾病实体和对应的关联对象之间的边中添加参考知识集合,得到知识图谱,参考知识集合中包括与各个疾病实体关联的多个问答组合。

本申请实施例中,终端将每个疾病实体以及对应的关联对象建立连接之后,将在各个疾病实体和对应的关联对象之间的边中添加参考知识集合,参考知识集合具体存储了与疾病实体和关联对象之间的多个问答组合,问答组合用于与用户进行交互,引导用户得到输入的疾病实体对应的对象。终端基于各个疾病实体、关联对象和参考知识集合构建出知识图谱。

s504、获取目标用户输入的病历文本,并从病历文本中提取出目标疾病实体。

本申请实施例中,病历文本可以由多个字符组成,具体可以为目标用户输入病历单、患病情况说明、针对某种疾病的详情询问等,如在医保领域,用户需要输入自身的历史患病情况说明后,可以得知自身可购买的医保的种类、每类医保的详细信息等,通常情况下,病历文本中都包括一种或多种疾病,终端可以接收目标用户输入的病历文本,并从病历文本中提取出目标疾病实体。

s505、从知识图谱中确定出目标疾病实体对应的知识集合。

本申请实施例中,终端提取出疾病文本中目标疾病实体之后,可以从知识图谱中确定出目标疾病实体对应的知识集合,知识集合中包括在知识图谱中与目标疾病实体关联的多个问答组合,一个问答组合包括一个问题和对应的答案。

s506、确定知识集合中各个问答组合对应的知识架构,并基于知识架构生成针对知识集合中各个问答组合的调用脚本。

本申请实施例中,知识架构具体指示知识集合中各个问答组合的关联关系,调用脚本由多个代码模块构成,每个代码模块用于相应调用一个问答组合。

s507、基于调用脚本调用各个问答组合,以与目标用户进行交互,得到交互结果。

本申请实施例中,终端得到针对各个问答组合的调用脚本之后,将基于调用脚本调用各个问答组合,以与目标用户进行交互,得到交互结果。终端基于调用脚本调用各个问答组合与目标用户进行交互的具体方式可以为,启动线程对调用脚本进行执行,得到问答组合调用指令,进一步的,采用调用指令对各个问答组合进行处理,实现对各个问答组合的调用。

s508、获取针对交互结果的反馈评分。

本申请实施例中,终端基于所述调用脚本调用所述各个问答组合,以与所述目标用户进行交互,得到交互结果之后,还可以获取针对交互结果输入的反馈评分。其中,反馈评分可以由目标用户输入,或者,由评分装置基于目标用户对于交互过程中针对知识集合的浏览信息确定,浏览信息包括浏览时长、浏览频次、浏览满意度等综合确定,如浏览时长越长、浏览频次越高以及浏览满意度越高,则反馈评分越高。

在一个实施例中,若反馈评分低于预设评分,则终端确定知识集合中的问答组合存在缺陷,需及时对问答组合进行更新,终端可以发出提示信息,以提示对问答组合进行更新;若反馈评分高于预设评分,则执行步骤s509。

s509、若反馈评分高于预设评分,则将目标疾病实体和知识集合在区块链中进行广播,以使得区块链中的各个节点对目标疾病实体和知识集合进行共识校验。

本申请实施例中,终端确定反馈评分大于预设评分后,确定用户对于交互过程是满意的,则终端可以将目标疾病实体和知识集合在区块链网络中进行广播,以使得区块链网络中的各个节点对目标疾病实体和知识集合进行共识校验。其中,可以预先设置共识数量,当共识校验通过的节点的数量大于该共识数量时,确定共识校验通过。或者,可以预先设置共识权重,且每个节点可以有不同的权重,当共识校验的结果的权重大于预先设置的共识权重时,确定校验通过。

s510、若接收到的共识校验结果指示校验通过,则将目标疾病实体和知识集合打包成区块,并将区块上传至所述区块链中。

本申请实施例中,终端确定共识校验结果指示校验通过,则判定此次与用户交互的过程是成功的,终端可以将上述目标疾病实体和知识集合存储至区块链中,实现对目标疾病实体和知识集合的存储,后续在接收到针对相同目标疾病实体的询问时,也可直接从区块链中获取到对应的知识集合,与用户进行交互。

本申请实施例中,终端获取目标用户输入的病历文本,并从病历文本中提取出目标疾病实体;从知识图谱中确定出目标疾病实体对应的知识集合,确定知识集合中各个问答组合对应的知识架构,并基于知识架构生成针对知识集合中各个问答组合的调用脚本,基于调用脚本调用各个问答组合,以与目标用户进行交互,得到交互结果。通过上述方法,可以基于图谱自动生成脚本,并基于脚本调用相应问题与用户进行交互,提升与用户的交互效率。

下面将结合附图6对本申请实施例提供的基于知识图谱的交互装置进行详细介绍。需要说明的是,附图6所示的基于知识图谱的交互装置,用于执行本申请图1和图5所示实施例的方法,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,经参照本申请图1和图5所示的实施例。

请参见图6,为本申请提供的一种基于知识图谱的交互装置的结构示意图,该基于知识图谱的交互装置60可包括:获取模块601、提取模块602、确定模块603、生成模块604、调用模块605。

获取模块601,用于获取目标用户输入的病历文本;

提取模块602,用于从所述病历文本中提取出目标疾病实体;

确定模块603,用于从知识图谱中确定出所述目标疾病实体对应的知识集合,所述知识集合中包括在所述知识图谱中与所述目标疾病实体关联的多个问答组合;

所述确定模块603,还用于确定所述知识集合中各个问答组合对应的知识架构;

生成模块604,用于基于所述知识架构生成针对所述知识集合中各个问答组合的调用脚本,所述知识架构为所述知识集合中各个问答组合的关联结构;

调用模块605,用于基于所述调用脚本调用所述各个问答组合,以与所述目标用户进行交互,得到交互结果。

在一种实现方式中,提取模块602,具体用于:

对所述病历文本进行分词处理,得到至少一个词组;

若所述至少一个词组与数据库中的参考词组匹配,则将匹配的目标词组确定为目标疾病实体,所述数据库中存储了至少一个参考词组,每个参考词组对应一个疾病实体;

若至少一个词组与数据库中参考词组不匹配,则调用识别模型对所述病历文本进行处理,得到所述病历文本中的目标疾病实体。

在一种实现方式中,提取模块602,具体用于:

获取n个样本集合,每个样本集合中包括样本文本和样本实体;

通过所述n个样本集合对初始识别模型进行预训练,得到基础识别模型,所述预训练过程中包括,基于所述初始识别模型对所述样本文本进行处理得到的样本预测实体与所述样本实体之间的匹配度,对所述初始识别模型中的参数进行更新;

获取k个疾病样本集合,所述疾病样本集合中包括疾病样本文本和疾病样本实体;

通过k个疾病样本集合对基础识别模型进行训练,得到训练完成的识别模型,所述预训练过程中包括,基于所述基础识别模型对所述疾病样本文本进行处理得到的疾病样本预测实体与所述疾病样本实体之间的匹配度,对所述基础识别模型中的参数进行更新。

在一种实现方式中,提取模块602,具体用于:

获取多个疾病实体以及每个疾病实体对应的关联对象;

通过边将每个疾病实体以及对应的关联对象建立连接;

在各个疾病实体和对应的关联对象之间的边中添加参考知识集合,得到知识图谱,所述参考知识集合中包括与各个疾病实体关联的多个问答组合。

在一种实现方式中,确定模块603,具体用于:

获取所述知识集合中各个问答组合之间的关联关系,并基于所述关联关系从所述知识集合中确定出目标问答组合,所述目标问答组合作为根节点与各个问答组合建立连接;

以所述目标问答组合为初始点,对所述各个问答组合进行遍历,构建出所述知识集合中各个问答组合对应的知识树;

将所述知识树的结构确定为所述知识集合中各个问答组合对应的知识架构。

在一种实现方式中,生成模块604,具体用于:

获取所述知识集合中每个问答组合对应的代码模块;

基于所述知识架构确定各个代码模块对应的组合逻辑,并基于所述组合逻辑对所述各个代码模块进行组合,得到组合代码模块;

基于预设方式对所述组合代码模块进行封装,得到调用脚本。

在一种实现方式中,调用模块605,还用于:

获取针对所述交互结果的反馈评分;

若所述反馈评分高于预设评分,则将所述目标疾病实体和所述知识集合在区块链中进行广播,以使得所述区块链中的各个节点对所述目标疾病实体和所述知识集合进行共识校验;

若接收到的共识校验结果指示校验通过,则将所述目标疾病实体和所述知识集合打包成区块,并将所述区块上传至所述区块链中。

本申请实施例中,获取模块601获取目标用户输入的病历文本,提取模块602从病历文本中提取出目标疾病实体;确定模块603从知识图谱中确定出目标疾病实体对应的知识集合,并确定知识集合中各个问答组合对应的知识架构,生成模块604基于知识架构生成针对知识集合中各个问答组合的调用脚本,调用模块605基于调用脚本调用各个问答组合,以与目标用户进行交互,得到交互结果。通过上述方法,可以基于图谱自动生成脚本,并基于脚本调用相应问题与用户进行交互,提升与用户的交互效率。

请参见图7,为本申请实施例提供了一种终端的结构示意图。如图7所示,该终端包括:至少一个处理器701,输入设备703,输出设备704,存储器705,至少一个通信总线702。其中,通信总线702用于实现这些组件之间的连接通信。其中,输入设备703可以是控制面板或者麦克风等,输出设备704可以是显示屏等。其中,存储器705可以是高速ram存储器,也可以是非不稳定的存储器(non-voiatiiememory),例如至少一个磁盘存储器。存储器705可选的还可以是至少一个位于远离前述处理器701的存储装置。其中处理器701可以结合图6所描述的装置,存储器705中存储一组程序代码,且处理器701,输入设备703,输出设备704调用存储器705中存储的程序代码,用于执行以下操作:

处理器701,用于获取目标用户输入的病历文本,并从所述病历文本中提取出目标疾病实体;

处理器701,用于从知识图谱中确定出所述目标疾病实体对应的知识集合,所述知识集合中包括在所述知识图谱中与所述目标疾病实体关联的多个问答组合;

处理器701,用于确定所述知识集合中各个问答组合对应的知识架构,并基于所述知识架构生成针对所述知识集合中各个问答组合的调用脚本,所述知识架构为所述知识集合中各个问答组合的关联结构;

处理器701,用于基于所述调用脚本调用所述各个问答组合,以与所述目标用户进行交互,得到交互结果。

在一种实现方式中,处理器701,具体用于:

对所述病历文本进行分词处理,得到至少一个词组;

若所述至少一个词组与数据库中的参考词组匹配,则将匹配的目标词组确定为目标疾病实体,所述数据库中存储了至少一个参考词组,每个参考词组对应一个疾病实体;

若至少一个词组与数据库中参考词组不匹配,则调用识别模型对所述病历文本进行处理,得到所述病历文本中的目标疾病实体。

在一种实现方式中,处理器701,具体用于:

获取n个样本集合,每个样本集合中包括样本文本和样本实体;

通过所述n个样本集合对初始识别模型进行预训练,得到基础识别模型,所述预训练过程中包括,基于所述初始识别模型对所述样本文本进行处理得到的样本预测实体与所述样本实体之间的匹配度,对所述初始识别模型中的参数进行更新;

获取k个疾病样本集合,所述疾病样本集合中包括疾病样本文本和疾病样本实体;

通过k个疾病样本集合对基础识别模型进行训练,得到训练完成的识别模型,所述训练过程中包括,基于所述基础识别模型对所述疾病样本文本进行处理得到的疾病样本预测实体与所述疾病样本实体之间的匹配度,对所述基础识别模型中的参数进行更新。

在一种实现方式中,处理器701,具体用于:

获取多个疾病实体以及每个疾病实体对应的关联对象;

通过边将每个疾病实体以及对应的关联对象建立连接;

在各个疾病实体和对应的关联对象之间的边中添加参考知识集合,得到知识图谱,所述参考知识集合中包括与各个疾病实体关联的多个问答组合。

在一种实现方式中,处理器701,具体用于:

获取所述知识集合中各个问答组合之间的关联关系,并基于所述关联关系从所述知识集合中确定出目标问答组合,所述目标问答组合作为根节点与各个问答组合建立连接;

以所述目标问答组合为初始点,对所述各个问答组合进行遍历,构建出所述知识集合中各个问答组合对应的知识树;

将所述知识树的结构确定为所述知识集合中各个问答组合对应的知识架构。

在一种实现方式中,处理器701,具体用于:

获取所述知识集合中每个问答组合对应的代码模块;

基于所述知识架构确定各个代码模块对应的组合逻辑,并基于所述组合逻辑对所述各个代码模块进行组合,得到组合代码模块;

基于预设方式对所述组合代码模块进行封装,得到调用脚本。

在一种实现方式中,处理器701,具体用于:

获取针对所述交互结果的反馈评分;

若所述反馈评分高于预设评分,则将所述目标疾病实体和所述知识集合在区块链中进行广播,以使得所述区块链中的各个节点对所述目标疾病实体和所述知识集合进行共识校验;

若接收到的共识校验结果指示校验通过,则将所述目标疾病实体和所述知识集合打包成区块,并将所述区块上传至所述区块链中。

本申请实施例中,处理器701获取目标用户输入的病历文本,从病历文本中提取出目标疾病实体;从知识图谱中确定出目标疾病实体对应的知识集合,并确定知识集合中各个问答组合对应的知识架构,基于知识架构生成针对知识集合中各个问答组合的调用脚本,基于调用脚本调用各个问答组合,以与目标用户进行交互,得到交互结果。通过上述方法,可以基于图谱自动生成脚本,并基于脚本调用相应问题与用户进行交互,提升与用户的交互效率。

本申请实施例中所述模块,可以通过通用集成电路,例如cpu(centraiprocessingunit,中央处理器),或通过asic(appiicationspecificintegratedcircuit,专用集成电路)来实现。

应当理解,在本申请实施例中,所称处理器701可以是中央处理模块(centraiprocessingunit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digitaisignaiprocessor,dsp)、专用集成电路(appiicationspecificintegratedcircuit,asic)、现成可编程门阵列(fieid-programmabiegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

总线702可以是工业标准体系结构(industrystandardarchitecture,isa)总线、外部设备互联(peripheraicomponent,pci)总线或扩展工业标准体系结构(eitendedindustrystandardarchitecture,eisa)总线等,该总线702可以分为地址总线、数据总线、控制总线等,为便于表示,图7仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的计算机存储介质可为磁碟、光盘、只读存储记忆体(read-oniymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。

以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1