一种医学检查申请单检查依据数据质量识别方法与流程

文档序号:37186279发布日期:2024-03-01 12:50阅读:14来源:国知局
一种医学检查申请单检查依据数据质量识别方法与流程

本发明涉及医疗数据分析,具体而言,本技术涉及一种医学检查申请单检查依据数据质量识别方法。


背景技术:

1、医学检查申请单是非常重要的医疗数据,申请单的检查依据不仅用于监管检查开单的合理性,同时也是影像科医师阅片诊断的重要依据。若一份医学检查申请单的检查依据撰写不规范、意思表达不清晰,甚至缺乏检查依据,势必导致检查合理性审计存在困难;也无法辅助影像科医师阅片诊断。在医疗数据分析领域,缺乏检查依据的医学检查申请单数据被视为坏数据,无法用于作为数据分析的基础数据,从而浪费了宝贵的数据资源。因此,为了全面提升医疗智能化程度,势必需要对各级医疗机构的医学检查申请单的开单检查依据进行监督、规范和及时反馈,以提升收集到的医疗数据质量,为提升影像云数据质量及规范医学检查等提供数据支撑。

2、但是,申请人发现:当前部分医疗机构医师由于不规范操作填写检查申请单,比如,检查申请单中的主诉、临床诊断、检查目的、病史等关键信息不填写或者填写不完整、不规范或出现无效字符等情况,从而导致病人就诊的主要原因、过往疾病史、是否有过敏史等影响后续检查效果及疾病诊断的检查依据的关键信息缺失的现象异常严重。而由于数据形态的多样性,目前无有效的方法对各个医疗机构的检查申请检查依据等关键信息是否存在质量问题进行高效准确的判断。


技术实现思路

1、有鉴于此,本技术各实施例提出了一种医学检查申请单检查依据数据质量识别方法,构建检查依据数据质量识别规则库,利用规则判断以及ai智能判断医学检查申请单的检查依据是否存在数据质量问题,以快速分流存在数据质量问题的坏数据,从而避免坏数据流转到后段数据分析中,影响数据分析结果的准确性。技术方案如下:

2、根据本技术实施例的一个方面,提供了一种医学检查申请单检查依据数据质量识别方法,包括:获取目标医学检查申请单数据;基于预加载的检查依据数据质量识别规则,判断该目标医学检查申请单数据是否存在检查依据数据质量问题;该检查依据数据质量识别规则基于医学检查申请单的检查依据撰写规范生成;若存在检查依据数据质量问题,则基于识别出的数据质量问题类型,对该目标医学检查申请单数据打标签,并将该目标医学检查申请单数据存入检查依据质量问题数据库;若不存在,则将该目标医学检查申请单数据存入影像云数据库。

3、在一示例性实施方式中,还包括:对该检查依据质量问题数据库进行标签统计,以获得各质量问题的统计结果。

4、在一示例性实施方式中,该预加载的检查依据数据质量识别规则包括无检查依据识别规则、无效检查依据识别规则以及模糊检查依据识别规则;该基于预加载的检查依据数据质量识别规则,判断该目标医学检查申请单数据是否存在检查依据数据质量问题的具体步骤包括:基于该无检查依据识别规则,判断该目标医学检查申请单数据的检查依据是否为空值;若是,则判断为无检查依据;以及,基于该无效检查依据识别规则,判断该目标医学检查申请单数据的检查依据是否包含无效字符;若是,则判断为无效检查依据;以及,基于该模糊检查依据识别规则,判断该目标医学检查申请单数据的检查依据的困惑度是否高于预设阈值,若是,则判断为检查依据不明确。

5、在一示例性实施方式中,该无检查依据识别规则和无效检查依据识别规则通过正则匹配方式对该目标医学检查申请单数据进行判断。

6、在一示例性实施方式中,该模糊检查依据识别规则基于bert-wwm模型,计算该目标医学检查申请单数据的检查依据困惑度,将计算出的该困惑度与预先设置的困惑度阈值进行比较,以判断该目标医学检查申请单数据是否存在检查依据表达模糊的情况。

7、在一示例性实施方式中,还包括:定期获取未被识别检查依据数据质量问题识别规则,添加至检查依据数据质量问题识别规则库,并基于配置更新至系统内存。

8、在一示例性实施方式中,该未被识别检查依据数据质量问题识别规则的生成方法,具体包括:采集医疗机构检查申请单数据,其中,该医疗机构检查申请单数据为未经该检查依据数据质量识别方法识别的数据;将该医疗机构检查申请单数据经过数据处理后作为检查依据数据质量智能分析模型的训练数据;选用bert-wwm模型作为该检查依据数据质量智能分析模型的基础模型,采用该训练数据对该基础模型进行微调和验证,以获取该检查依据数据质量智能分析模型;采集该影像云数据库的医学检查申请单数据,对该影像云数据库的医学检查申请单数据进行数据处理后输入该检查依据数据质量智能分析模型,以生成该未被识别检查依据数据质量问题识别规则。

9、在一示例性实施方式中,该医学检查申请单数据的检查依据包括:主诉、临床诊断、检查目的、病史中的一种或多种。

10、在一示例性实施方式中,将该医学检查申请单检查依据质量识别方法部署在消息队列的消费端;当该消息队列的消费端拉取该目标医学检查申请单数据后,基于该医学检查申请单检查依据数据质量识别规则,对该目标医学检查申请单数据进行检查依据数据质量识别。

11、根据本技术实施例的另一个方面,提供了一种电子设备,包括至少一个处理器,以及存储器,所述存储器存储有可在所述处理器上运行的计算机程序,所述处理器执行所述程序时执行如上所述的一种医学检查申请单检查依据数据质量识别方法的步骤。

12、根据本技术实施例的另一个方面,提供一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行如上所述的医学检查申请单检查依据数据质量识别方法的步骤。

13、本技术提供的技术方案带来的有益效果是:

14、1.通过预加载的检查依据数据质量识别规则,对医学检查申请单的检查依据进行数据质量识别,并将有质量问题的坏数据依据识别结果打标签,并分流存储到检查依据质量问题数据库,从而确保存储到影像云数据库的数据质量,以免坏数据影响对医学检查申请单的数据分析结果。

15、2.基于对检查依据质量问题数据库进行标签统计,从而获得检查依据质量问题的分析结果,以便于向数据源端(医疗机构)及时反馈数据质量的问题现象,以改善后续的数据质量。

16、3.基于对检查依据质量问题的统计分析和及时反馈,为地区医疗监管提供数据支撑,以及时纠正部分医疗机构的不规范行为,且为影像科医生阅片提供可靠的诊断依据。

17、4.提供多种数据质量识别规则,以应对不同数据质量问题的识别,并且基于bert-wwm模型发现即行识别规则尚未识别出的新的质量问题,并更新到检查依据数据质量问题识别规则库中,以提高数据质量识别的准确度和完整度。

18、5.采用bert-wwm模型作为新的质量问题预测模型的基础模型,由于bert-wwm是预训练模型,仅需要做微调(fine-tunning)即可实现领域迁移,可以减少训练样本的需求量,即可获得较好的模型。

19、6.将该方法部署在消息中间件的消费端,利用消息中间件提高传输效率的同时,能够确保数据在云端落盘前做好坏数据分流管理,部署位置更合理,数据分流更及时,同时在一定程度上降低无效数据向下传递对存储和计算资源的消耗。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1