一种医疗大脑系统的制作方法

文档序号:14122291阅读:804来源:国知局

技术领域:

本发明涉及一种医疗大脑系统。



背景技术:

随着科学技术与经济的发展,人们对医疗的需求量及要求也越来越高,在电脑硬件及机器学习技术发展取得了很大成就的同时,医疗类软件的发展也引起了人们的广泛重视。一些发达国家近年来出现了很多这方面的研究理论成果和软件产品,我国在这方面的研究也具备了一定的规模。但是现有的产品多是停留在理论阶段,与现实使用存在一定的差距,对于各种算法和模板的使用并没有有效的组合来有效的解决直接利用计算机来实现疾病判断,现在多以计算机作为媒介或者辅助设备来使用,这带来了很多的不便。现有技术对此并没有解决之策。



技术实现要素:

本发明的目的就是针对现有技术存在的上述缺点,提供了一种医疗大脑系统,直接作为终端使用,无需人实时的介入,诊断效率高,解决了现有技术中存在的问题。

本发明为解决上述技术问题所采用的技术方案是:

一种医疗大脑系统,包括对话引擎模块,医疗知识库模块,诊断模块;

所述对话引擎模块用于询问问题、获取外界症状描述输入,并进行分析,得到医疗实体;

所述医疗知识库模块用于向对话引擎模块、诊断模块提供疾病信息;

所述诊断模块用于将医疗实体与医疗知识库模块提供的医疗信息进行对比,得到各种疾病的权重,判断权重之和和所设定阈值的关系,所述权重之和为第一位疾病的权重或者前几位的权重之和,若权重之和等于或者超过所设定的阈值,则输出所引用权重对应的疾病;若权重之和小于所设定的阈值,则继续调用对话引擎模块。

优选的,所述对话引擎模块包括症状获取模块,医疗实体分词模块,医疗实体取代模块,医疗实体相似性获取模块;

所述症状获取模块用于询问问题、获得症状描述,并调用医疗知识库模块,获得初始医疗实体,所述医疗实体包括部位实体和症状实体;

所述医疗实体分词模块用于将初始医疗实体分离为部位实体和/或症状实体;

所述医疗实体取代模块调用医疗知识库模块,扩充部位实体的同义词或者近义词,扩充症状实体的同义词或者近义词,并且最终得到符合医疗知识库模块比对要求的部位实体和/或症状实体;

所述医疗实体相似性获取模块将扩充后的部位实体和症状实体进行交叉组合,调用医疗知识库模块对比后,得到最终的医疗实体。

优选的,所述医疗实体分体模块采用bilstm+crf算法。

优选的,所述医疗实体取代模块采用word2vec模型得到医疗实体的整体向量。

优选的,所述医疗实体相似性获取模块采用aiml模板,调用医疗知识库模块,判断所获得医疗实体的完整性。

优选的,所述诊断模块用tf-idf算法评价医疗实体,得到各种症状的权重。

优选的,所述对话引擎模块获取语音输入信息或文档输入信息。

优选的,所述诊断模块将所引用权重对应的症状进行语音输出。

优选的,所述知识库模块采用树状结构数据库,疾病分为如下字段描述:症状、检查方式、既往史、并发症、病因、诱因、流行病学。

优选的,所述知识库模块还包括一判别疾病存在的关键问题的问题字段。

与现有技术相比,本发明的优点是:通过设置对话引擎模块实现症状输入的全面性,通过与诊断模块的配合,实现识别疾病的准确性;医疗实体的具体化能够提升在识别时的查全率,防止因为人为认知的问题导致症状识别不准确的风险;本身能够采用语音对话的方式进行,方便使用者使用,提高用户体验。

附图说明:

图1为本发明的流程示意图。

具体实施方式:

为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。

如图1所示,一种医疗大脑系统,其特征在于:包括对话引擎模块,医疗知识库模块,诊断模块;

所述对话引擎模块用于询问问题、获取外界症状描述输入,并进行分析,得到医疗实体;

所述医疗知识库模块用于向对话引擎模块、诊断模块提供疾病信息;

所述诊断模块用于将医疗实体与医疗知识库模块提供的医疗信息进行对比,得到各种疾病的权重,判断权重之和和所设定阈值的关系,所述权重之和为第一位疾病的权重或者前几位的权重之和,若权重之和等于或者超过所设定的阈值,则输出所引用权重对应的疾病;若权重之和小于所设定的阈值,则继续调用对话引擎模块。

所述对话引擎模块包括症状获取模块,医疗实体分词模块,医疗实体取代模块,医疗实体相似性获取模块;

所述症状获取模块用于询问问题、获得症状描述,并调用医疗知识库模块,获得初始医疗实体,所述医疗实体包括部位实体和症状实体;例如:腹部疼痛,腹部是部位实体,疼痛是症状实体,然后通过组合,组合的方式邻近的方式来进行组合,即部位和哪个症状在句子中的举例比较近,就进行组合。但是部分词,例如头痛本身就是一个词,不需要组合,直接通过字典比对的方式得出该词不用组合。

所述医疗实体分词模块用于将初始医疗实体分离为部位实体和/或症状实体;

所述医疗实体取代模块调用医疗知识库模块,扩充部位实体的同义词或者近义词,扩充症状实体的同义词或者近义词,并且最终得到符合医疗知识库模块比对要求的部位实体和/或症状实体;

所述医疗实体相似性获取模块将扩充后的部位实体和症状实体进行交叉组合,然后调用医疗知识库模块对比后,得到最终的医疗实体。

所述医疗实体分体模块采用bilstm+crf算法。因为bilstm能够考虑上下文的情况,而crf可以样本统计出转移概率,二者结合来完成实体的识别标注预测。

所述医疗实体取代模块采用word2vec模型得到医疗实体的整体向量。此处采用word2vec来完成,但是由于部分词短语不在word2vec语料里,因为该算法是依靠分词,所以此时需要对短语应用分词在进行分词,例如:“头一阵一阵痛”分成三个词:头,一阵一阵,痛,然后分别利用word2vec模型进行找向量,然后进行相加得到短语的整体向量,然后与医疗知识库模块里的短语向量进行比对(医疗知识库模块里的向量获取方式与常规的方式一样)。

所述医疗实体相似性获取模块采用aiml模板,调用医疗知识库模块,判断所获得医疗实体的完整性。

所述诊断模块用tf-idf算法评价医疗实体,得到各种疾病的权重。关于权重初始设定由经验丰富的医生的进行设定,以保证准确率。

所述对话引擎模块获取语音输入信息或文档输入信息。前端可采用ui模块等设计。提高使用效率和用户体验。

所述诊断模块将所引用权重对应的症状进行语音输出。进行使用效率和用户体验。

所述知识库模块采用树状结构数据库,疾病分为如下字段描述:症状、检查方式、既往史、并发症、病因及诱因、流行病学。

所述知识库模块还包括一判别疾病是否存在的关键问题的问题字段。比如怀孕通过b超就可以确诊,所以针对这个病如果病人来问的话说了些症状,如果初步判断成妊娠,可以通过b超反问确诊。

s1:用户语句分词,采用crf进行标注进行训练。

s2:识别医疗实体,分为两类,一个是部位实体,一个是症状实体,采用bilstm+crf来完成,因为bilstm能够考虑上下文的情况,而crf可以样本统计出转移概率,二者结合来完成实体的识别标注预测。

s3:医疗实体进行取代,该取代是为了组合出具有完整意思的症状,例如:腹部疼痛,腹部是部位实体,疼痛是症状实体,然后通过组合,组合的方式邻近的方式来进行组合,即部位和哪个症状在句子中的举例比较近,就进行组合。但是部分词,例如头痛本身就是一个词,不需要组合,直接通过字典比对的方式得出该词不用组合。

s4:医疗实体相似性获取,该目的是为了把词症状标准化,可以与医疗库进行比对,此处采用word2vec来完成,但是由于部分词短语不在word2vec语料里,因为该算法是依靠分词,所以此时需要对短语应用分词再进行分词,例如:“头一阵一阵痛”分成三个词:头,一阵一阵,痛,然后分别利用word2vec模型进行找向量,然后进行相加得到短语的整体向量,然后与医疗知识库模块里的短语向量进行比对(医疗知识库模块里的向量获取方式与常规的方式一样)。

多轮对话引擎模块通过上述的分词以及症状来分析是否需要与用户进行多轮的对话才增加诊断模块的可信性,所以通过aiml模板的方式以及医疗知识库数据抽取达到所需要的完备症状信息。

根据多轮对话引擎提供的信息以及医疗知识库作比对,利用tf-idf算法算出症状词的权重,以此来算出各个可能疾病的权重,其中最大一个或者几个即为本次的最有可能的诊断结果。然后利用模板的形式进行语句合成输出。

本实施例提出的医疗大脑系统,通过对用户语句的分析进行分词及实体识别,为多轮对话提供基础数据支持,多轮引擎通过aiml及模板的形式完成多轮对话增加判断疾病的完备信息,以此信息为诊断引擎提供支持,诊断引擎通过计算各个症状的权重以及概率算出当前症状信息最有可能符合的疾病以此完成诊断。

应用例:以下对话中,s表示病人,d表示本发明:

s:语音输入(包含自己目前的症状)

假设识别后的语句:我这两天发现我儿子老是咳嗽,不愿意吃奶,时常还会出现呕吐,请问是什么病?

处理这个语句的流程:

意图识别:发现目前问的是关于诊断的意图;

提取医疗实体:咳嗽,不愿意吃奶,呕吐;

医疗实体相似替换:咳嗽,拒乳,呕吐(无部位实体)。

可疑病症的抓取:通过上面三个实体词,与医疗数据库做比对,发现小儿食管异物的临床表现中包含了这三个,小儿支原体肺炎包含了两个,所以可以认为这两个病就为可疑性最高的病。

d:您儿子是否还具有进食困难的症状?(出现这样的反问,是因为知识库模块目前认为小儿食管异物是最高的可能性病,所以把该病的其他症状挑出进行反问。)

s:有。(此时该症状也加入了医疗实体,同时该病的概率进一步的提高,通过这样的反问,直到反问后算出目前该疾病大于等于某一个设定的阈值就基本可以诊断目前患者所患的病。)

诊断完成之后,病症通过语音合成的方式播放出来,整个流程诊断的过程,同时进入数据库进行存储,以便加入新的样本迭代本发明,让其一步步的变得更准确。

本发明未详述之处,均为本技术领域技术人员的公知技术。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1