本发明涉及数据处理,具体涉及一种基于医护对讲设备的查房报告自动生成方法。
背景技术:
1、传统的医生查房需要医生在床旁询问患者的病情,了解患者的身体状况,然后手工记录在病历本或电子病历系统中。这种方式需要医生亲自到病房进行询问,操作繁琐,效率低下,容易出现记录不完整或错误等问题。此外,随着医疗科技的进步,电子病历系统的广泛使用虽然在一定程度上改善了信息的记录和管理,但传统的查房方式仍然存在信息流程不畅、即时性差等问题;同时,电子病历系统的数据输入也需要医生进行手动操作,仍然无法从根本上解决查房过程中的效率问题。
技术实现思路
1、本发明的目的在于提供一种基于医护对讲设备的查房报告自动生成方法用于解决上述问题。
2、为实现上述目的,本发明采用以下技术方案:
3、一种基于医护对讲设备的查房报告自动生成方法,其特征在于,该方法基于自然语言处理模块、对讲设备及服务端实现,具体包括以下步骤:
4、s1、获取医生查房记录数据,并进行数据预处理,然后发送至自然语言处理模块;
5、s2、通过transformer模型结构构建gpt模型,将预处理好的查房数据划分为训练集、验证集和测试集,分别对gpt模型进行模型训练、模型验证与调优、模型测试与评估;
6、s3、自然语言处理模块将训练好且测试通过的gpt模型部署到服务端;
7、s4、对讲设备对医患交流过程进行录音,并将录音转化成文本数据发送给服务端;
8、s5、服务端基于gpt模型对文本数据进行文本数据进行语义分析,提取关键信息并进行整理,生成格式化的查房报告并上传至电子病例系统。
9、优选地,所述查房记录数据包括病人的姓名、年龄、性别、住院号/门诊号、入院/门诊日期、主诉、现病史、既往史、体格检查结果、实验室检查结果、诊断、治疗计划及注意事项。
10、优选地,步骤s1中所述数据预处理的过程具体包括:
11、a1、数据清洗:检查查房记录数据是否存在缺失值或异常值,并进行处理,填充缺失值或删除异常值;
12、a2、数据去噪:离群值检测与处理,使用机器学习的k-means聚类方法检测离群值,提取需要用于聚类的特征列,并将其转换为数值型数据;
13、然后使用k-means聚类方法进行聚类,接着,计算每个数据点到其所属聚类中心的距离,并求出平均距离;
14、根据平均距离的阈值来确定哪些数据点被标记为离群值,根据需求删除、替换或修正部分数据点显著不同的异常值;
15、a3、文本分词:将每个查房记录数据中的文本内容进行分词操作,将句子或段落切分成单个词语或短语;
16、a4、停用词处理:去除对于整体语义不具有重要性的停用词;
17、a5、词性标注:对分词后的词语进行词性标注,标注每个词语的词性类别;
18、a6、实体识别:通过实体识别算法,将查房记录数据中的实体信息提取出来,并进行标记;
19、a7、特征提取:根据任务需求从标记好的查房记录数据中提取出需要的特征。
20、优选地,步骤s2中所述gpt模型的构建方法具体包括:
21、b1、构建transformer模型的编码器部分,所述编码器通过多个transformerblock组成,每个所述transformer block包含多头自注意力机制、残差连接及前馈神经网络层;
22、b2、在transformer模型的最后一个输出层之上添加一个线性输出层,将transformer的隐藏表示映射到词汇表大小的向量;
23、b3、使用深度学习框架pytorch,定义gpt模型的架构,根据数据集和任务需求,选择合适的超参数,初始设置,嵌入维度设置为512、注意力头数设置为4、前馈网络维度设置为2048、transformerblock的数量设置为6,后续超参数依据数据集大小和计算资源等因素进行调整和优化。
24、优选地,步骤s2中所述查房数据的划分具体包括:
25、c1、将所述查房数据随机地分成三组数据集,具体为70%作为训练集,20%作为验证集,10%作为测试集;
26、c2、将数据集划分为特征矩阵x和目标变量y,其中特征矩阵x包含除了唯一标识信息之外的其他特征;
27、c3、引入随机性来实现随机划分,在每颗决策树的构建过程中,对训练样本进行有放回的随机抽样,形成新的训练集。
28、c4、设置决策树的超参数,通过交叉验证技术调整这些超参数,以获得最佳性能,使用训练集训练随机森林模型,并使用验证集进行模型选择和调优。
29、c5、使用测试集评估模型的性能,并根据需要进行进一步的优化和改进。
30、优选地,步骤s2中模型训练中采用mini-batchsgd优化算法来更新模型参数,以使损失函数的值最小化。
31、优选地,步骤s2中模型训练中采用正则化防止过拟合。
32、优选地,步骤s2中模型验证与调优中根据验证集的性能评估指标对模型进行调优。
33、优选地,步骤s2中模型验证与调优中通过调整模型的超参数和修改模型结构提高模型性能。
34、优选地,对讲设备和服务端通过api进行数据传输。
35、采用上述技术方案后,本发明与背景技术相比,具有如下有益效果:
36、本发明提供一种基于医护对讲设备的查房报告自动生成方法,实现自动化的查房报告生成,提高了医护人员的工作效率和准确性,减少了人为因素对记录的影响。同时,可以更加准确和全面地提取患者的关键信息,生成更加完整和规范的查房报告,提供更好的医疗服务。
1.一种基于医护对讲设备的查房报告自动生成方法,其特征在于,该方法基于自然语言处理模块、对讲设备及服务端实现,具体包括以下步骤:
2.如权利要求1所述的一种基于医护对讲设备的查房报告自动生成方法,其特征在于:所述查房记录数据包括病人的姓名、年龄、性别、住院号/门诊号、入院/门诊日期、主诉、现病史、既往史、体格检查结果、实验室检查结果、诊断、治疗计划及注意事项。
3.如权利要求1所述的一种基于医护对讲设备的查房报告自动生成方法,其特征在于:步骤s1中所述数据预处理的过程具体包括:
4.如权利要求1所述的一种基于医护对讲设备的查房报告自动生成方法,其特征在于:步骤s2中所述gpt模型的构建方法具体包括:
5.如权利要求4所述的一种基于医护对讲设备的查房报告自动生成方法,其特征在于:步骤s2中所述查房数据的划分具体包括:
6.如权利要求1所述的一种基于医护对讲设备的查房报告自动生成方法,其特征在于:步骤s2中模型训练中采用mini-batchsgd优化算法来更新模型参数,以使损失函数的值最小化。
7.如权利要求1所述的一种基于医护对讲设备的查房报告自动生成方法,其特征在于:步骤s2中模型训练中采用正则化防止过拟合。
8.如权利要求1所述的一种基于医护对讲设备的查房报告自动生成方法,其特征在于:步骤s2中模型验证与调优中根据验证集的性能评估指标对模型进行调优。
9.如权利要求1所述的一种基于医护对讲设备的查房报告自动生成方法,其特征在于:步骤s2中模型验证与调优中通过调整模型的超参数和修改模型结构提高模型性能。
10.如权利要求1所述的一种基于医护对讲设备的查房报告自动生成方法,其特征在于:对讲设备和服务端通过api进行数据传输。