本发明涉及数据处理,具体涉及基于问诊意向的智能助诊系统。
背景技术:
1、随着问诊排队时间较长,患者普遍都出现焦躁不耐烦的情绪。因此现在有提出通过语音问诊系统,通过有声问诊得出患者的意向诊断后,从而筛选出若干检查和若干治疗,并可提示检查及治疗的相关事项建议。而常规实现是通过对有声问诊中提供的病史等相关信息通过例如文本分析等方式提取其中的病状相关信息,并根据该信息与医院的档案管理系统中储存的历史病例数据进行聚类,从而找到相似度最高的病例数据,并将该病例数据对应的诊断结果输出给当前用户用以进行初步的筛查以及治疗。但是现有的对于上述病例之间判断相似性或用于病例之间进行聚类时的数据特征,仅仅是根据病症描述中的文本内容进行词汇的余弦相似度的计算,并通过余弦相似度的累加作为病例之间的距离度量特征判断语句相似度,但是并没有考虑其中存在的修饰词对于提到的病症的程度的修饰,其并没有考虑到其中每一个病人其实际的多个病症之间存在的优先考虑的情况,因此会导致聚类结果对该场景下往往并不准确。
技术实现思路
1、本发明提供基于问诊意向的智能助诊系统,以解决现有的问题。
2、本发明的基于问诊意向的智能助诊系统采用如下技术方案:
3、本发明一个实施例提供了基于问诊意向的智能助诊系统,该系统包括:
4、记录采集模块,用于采集患者的待分类病症记录以及历史病症记录;
5、数据处理模块,用于获取待分类病症记录中每个句子的组成结构,根据组成结构获得每个句子中每个主语的描述量以及每个句子的病症特征值,获得每个句子中病症优先关注度,根据病症优先关注度得到待分类病症记录的聚类权重值;
6、聚类诊断模块,根据待分类病症记录的聚类权重值得到患者所属的历史病症记录,将所属的历史病症记录作为患者的参考。
7、优选的,所述获取待分类病症记录中每个句子的组成结构,根据组成结构获得每个句子中每个主语的描述量以及每个句子的病症特征值,获得每个句子中病症优先关注度,根据病症优先关注度得到待分类病症记录的聚类权重值,包括的具体步骤如下:
8、首先,获取待分类病症记录中的每个句子的组成结构,每个句子的组成结构中具有若干主语和若干整体形容词,每个主语具有若干名词性形容词,每个名词性形容词具有若干形容词性形容词;
9、其次,基于每个句子的组成结构,根据组成结构中修饰词的词性数量以及同一名词性形容词下的不同形容词性形容词之间的相似度得到每个句子中每个主语的描述量;
10、然后,根据组成结构中同一个句子中不同整体形容词之间的相似性得到每个句子的病症特征值,根据每个句子中每个主语的描述量和每个句子的病症特征值得到每个句子的病症优先关注度;
11、最后,根据每个句子的病症优先关注度得到待分类病症记录的聚类权重值。
12、优选的,所述根据组成结构中修饰词的词性数量以及同一名词性形容词下的不同形容词性形容词之间的相似度得到每个句子中每个主语的描述量,包括的具体步骤如下:
13、首先,计算每个句子中的主体成分起到修饰作用的每个名词性形容词的描述度大小,计算公式如下:
14、
15、其中,表示第个句子中第个主语中第个名词性形容词的描述度大小,表示第个句子中第个主语中第个名词性形容词具有的所有形容词性形容词中的词性数量,表示第个句子中第个主语中第个名词性形容词的第个形容词性形容词,表示第个句子中第个主语中第个名词性形容词中除了第个形容词性形容词之外剩余的个形容词性形容词中的第个形容词性形容词,表示第个句子中第个主语中第个名词性形容词中第个形容词性形容词与第个其余形容词性形容词之间的词性的余弦相似度差异;
16、最后,累加第个句子中第个主语的所有个名词性形容词的描述度大小,得到第个句子中第个主语的描述量,记为每个句子中每个主语的描述量。
17、优选的,所述根据每个句子中每个主语的描述量和每个句子的病症特征值得到每个句子的病症优先关注度,包括的具体步骤如下:
18、首先,计算第个句子的病症特征值,具体公式如下:
19、
20、其中,表示第个句子的病症特征值,表示句子中的整体形容词的数量,表示第个句子中第个整体形容词,表示第个句子中除第个整体形容词之外的个整体形容词中的第个整体形容词,表示第个句子中第个整体形容词和第个整体形容词的余弦相似度,表示对括号里的值进行数值归一化;
21、其次,对于第个句子中的所有主语的描述量进行累加得到第个句子的描述程度;
22、最后将第个句子的描述程度和第个句子的病症特征值相乘得到第个句子的病症优先关注度,记为每个句子中病症优先关注度。
23、优选的,所述根据每个句子的病症优先关注度得到待分类病症记录的聚类权重值,包括的具体步骤如下:
24、在历史症状描述记录中,根据得到的每个句子的病症优先关注度,与所有句子的病症优先关注度进行数值归一化,将所有句子的归一化的值记为待分类病症记录的聚类权重值。
25、本发明的技术方案的有益效果是:针对仅通过余弦相似度对问诊意向进行划分时聚类结果不准确的问题,本发明通过对每一句中存在的修饰词与对应的主语的组成进行分析,从而得到该主语对于病症的描述量,再结合句子中的整体修饰词得到每一个句子中对于病症的实际描述的优先关注度,并根据该优先关注度调整每一个句子在参与聚类时的权重值,从而使得聚类结果更加准确,从而使得患者的问诊意向更为精准。
1.基于问诊意向的智能助诊系统,其特征在于,该系统包括:
2.根据权利要求1所述基于问诊意向的智能助诊系统,其特征在于,所述获取待分类病症记录中每个句子的组成结构,根据组成结构获得每个句子中每个主语的描述量以及每个句子的病症特征值,获得每个句子中病症优先关注度,根据病症优先关注度得到待分类病症记录的聚类权重值,包括的具体步骤如下:
3.根据权利要求2所述基于问诊意向的智能助诊系统,其特征在于,所述根据组成结构中修饰词的词性数量以及同一名词性形容词下的不同形容词性形容词之间的相似度得到每个句子中每个主语的描述量,包括的具体步骤如下:
4.根据权利要求2所述基于问诊意向的智能助诊系统,其特征在于,所述根据每个句子中每个主语的描述量和每个句子的病症特征值得到每个句子的病症优先关注度,包括的具体步骤如下:
5.根据权利要求2所述基于问诊意向的智能助诊系统,其特征在于,所述根据每个句子的病症优先关注度得到待分类病症记录的聚类权重值,包括的具体步骤如下: