本发明涉及人工智能,尤其涉及一种改善累计误差的智能问诊方法、装置、设备及计算机可读存储介质。
背景技术:
1、随着人工智能的发展,机器学习在医疗分析领域的应用场景越来越多,比如,远程医疗、智能诊断、机器人问诊等。其中,医疗分析领域的智能分析手段大多是多轮交互的,确保获取更多的患者数据,得到更精确的诊断结果。
2、然而,多轮交互存在误差累积的问题,例如,在某一轮的某个阶段中,处理出现误差,则后续阶段会汇聚此误差,使后续阶段处理信息会被干扰,逐渐偏离目标方向,造成医疗分析准确性降低。
技术实现思路
1、本发明提供一种改善累计误差的智能问诊方法、装置、设备及存储介质,其主要目的在于通过改善累计误差,提高多轮交互场景下的智能识别准确率。
2、为实现上述目的,本发明提供的一种改善累计误差的智能问诊方法,包括:
3、获取患者的问答话语信息,并根据预设的预处理策略,对所述问答话语信息进行病症实体识别、意图识别及患者画像识别,得到实体集合、患者意图及患者画像;
4、利用预训练的误差纠正疾病识别模型中的浅层网络,对所述实体集合、所述患者意图及所述患者画像进行第一量化操作,得到第一量化结果,并将第一量化结果进行全连接操作,得到第一特征向量;
5、利用所述误差纠正疾病识别模型中的深层网络,对所述问答话语信息进行问答顺序拼接操作,得到患者症状文本,并对所述患者症状文本进行第二量化操作,得到第二特征向量;
6、根据预设的特征融合策略,将所述第一特征向量及所述第二特征向量进行特征融合,得到融合向量;
7、利用所述误差纠正疾病识别模型的疾病识别网络,对所述融合向量进行疾病多分类判断,得到疾病识别结果。
8、可选的,所述对所述实体集合、所述患者意图及所述患者画像进行第一量化操作,得到第一量化结果,并将第一量化结果进行全连接操作,得到第一特征向量,包括:
9、对所述患者画像中的各个画像标签进行量化操作,得到标签向量集合,根据预设的标签库数量及预设的第一嵌入维度,对所述标签向量集合进行加权平均计算,得到画像特征矩阵;
10、对所述患者意图进行量化操作,得到意图向量集合,根据预设的意图库数量及所述第一嵌入维度,对所述意图向量集合进行加权平均计算,得到意图特征矩阵;
11、对所述实体集合中的各个实体进行量化操作,得到实体向量集合,根据预设的实体库数量及所述第一嵌入维度,对所述实体向量集合进行加权平均计算,得到实体特征矩阵;
12、对所述画像特征矩阵、所述意图特征矩阵及所述实体特征矩阵进行全连接操作,得到第一特征向量。
13、可选的,所述对所述患者症状文本进行第二量化操作,得到第二特征向量,包括:
14、根据预设的词典大小及预设的第二嵌入维度对所述患者症状本文进行分词及量化操作,得到各个语句量化结果;
15、对各个所述语句量化结果分别进行加权平均计算,得到各个语句特征矩阵,并利用预构建的分隔符,根据所述患者症状文本中的问答顺序,依次将各个所述语句特征矩阵进行连接,得到第二特征向量。
16、可选的,所述根据预设的特征融合策略,将所述第一特征向量及所述第二特征向量进行特征融合,得到融合向量,包括:
17、根据预设的特征融合策略,对所述第一特征向量及所述第二特征向量进行矩阵对位相乘操作,得到乘积矩阵;
18、对所述第一特征向量及所述第二特征向量进行矩阵对位相加操作,得到加和矩阵;
19、依次对所述第一特征矩阵、所述第二特征矩阵、所述加和矩阵及所述乘积矩阵进行拼接操作,得到融合向量。
20、可选的,所述利用所述误差纠正疾病识别模型的疾病识别网络,对所述融合向量进行疾病多分类判断,得到疾病识别结果之前,所述方法还包括:
21、获取预构建的历史患者数据,并根据预设的样本格式对所述历史患者数据进行格式化,得到训练样本集;
22、获取初始化模型参数集合,并利用所述初始化模型参数集合,构建初始化误差纠正疾病识别模型;
23、从所述训练样本集中依次提取一个训练样本,并利用所述初始化误差纠正疾病识别模型对所述训练样本进行正向识别判断,得到疾病预测结果;
24、利用交叉熵算法,计算所述疾病预测结果与所述训练样本对应的真实疾病结果的损失值;
25、最小化所述损失值,得到损失值最小时的模型参数,并利用所述模型参数更新所述初始化模型参数集合,得到更新误差纠正疾病识别模型;
26、判断所述损失值是否小于预设的合格阈值;
27、当所述损失值未小于所述合格阈值时,返回上述从所述训练样本集中依次提取一个训练样本的步骤,对所述更新误差纠正疾病识别模型进行迭代更新;
28、当所述损失值小于所述合格阈值时,将最终更新的更新误差纠正疾病识别模型作为训练完成的误差纠正疾病识别模型。
29、可选的,所述利用所述误差纠正疾病识别模型的疾病识别网络,对所述融合向量进行疾病多分类判断,得到疾病识别结果,包括:
30、利用所述误差纠正疾病识别模型的疾病识别网络,对所述融合向量进行全连接操作,得到各个全连接特征,并对所述各个全连接特征进行分类判断,得到所述各个全连接特征符合预设的疾病类型的概率;
31、将各个所述概率进行归一化操作,得到归一化结果;
32、将归一化结果最大的疾病类型进行输出,得到疾病识别结果。
33、可选的,所述根据预设的预处理策略,对所述问答话语信息进行病症实体识别、意图识别及患者画像识别,得到实体集合、患者意图及患者画像,包括:
34、根据预设的预处理策略,对所述问答话语信息进行分词操作,得到词语集合;
35、对所述词语集合进行停用词及特殊字符清洗操作,得到简化词语集合;
36、对所述简化词语集合进行量化操作,得到简化词向量集合;
37、分别利用预构建的实体提取模型、意图识别模型及画像构建模型对所述化简词向量进行处理,得到实体集合、患者意图及患者画像。
38、为了解决上述问题,本发明还提供一种改善累计误差的智能问诊装置,所述装置包括:
39、数据预处理模块,用于获取患者的问答话语信息,并根据预设的预处理策略,对所述问答话语信息进行病症实体识别、意图识别及患者画像识别,得到实体集合、患者意图及患者画像;
40、浅层特征提取模块,用于利用预训练的误差纠正疾病识别模型中的浅层网络,对所述实体集合、所述患者意图及所述患者画像进行第一量化操作,得到第一量化结果,并将第一量化结果进行全连接操作,得到第一特征向量;
41、深层特征提取模块,用于利用所述误差纠正疾病识别模型中的深层网络,对所述问答话语信息进行问答顺序拼接操作,得到患者症状文本,并对所述患者症状文本进行第二量化操作,得到第二特征向量;
42、特征融合模块,用于根据预设的特征融合策略,将所述第一特征向量及所述第二特征向量进行特征融合,得到融合向量;
43、疾病识别模块,用于利用所述误差纠正疾病识别模型的疾病识别网络,对所述融合向量进行疾病多分类判断,得到疾病识别结果。
44、为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
45、至少一个处理器;以及,
46、与所述至少一个处理器通信连接的存储器;其中,
47、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的改善累计误差的智能问诊方法。
48、为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的改善累计误差的智能问诊方法。
49、本发明实施例先通过预设的预处理策略,获取患者的问答话语信息及对应的实体集合、患者意图及患者画像,然后分别对所述问答话语信息进行量化,对所述所述实体集合、所述患者意图及所述患者画像进行量化,分别得到第二特征向量及第一特征向量,其中,所述第一特征向量采用浅层网络,而所述第二特征向量采用的是深层网络,其中,深层网络可以获取更多的数据信息,而浅层网络可以保留最准确、明显的原始数据信息,然后通过特征融合,将第一特征向量与所述第二特征向量进行融合,避免深层网络由于误差造成识别方向的偏移。因此,本发明实施例提供的一种改善累计误差的智能问诊方法、装置、设备及存储介质,能够在于通过改善累计误差,提高多轮交互场景下的智能识别准确率。