病历信息分类方法、病历信息分类装置、设备及存储介质与流程

文档序号:37069683发布日期:2024-02-20 21:22阅读:18来源:国知局
病历信息分类方法、病历信息分类装置、设备及存储介质与流程

本技术涉及金融科技,尤其涉及一种病历信息分类方法、病历信息分类装置、设备及存储介质。


背景技术:

1、病历信息是病人在医院就诊及治疗过程中所产生的重要记录数据,包含病历文本、医学图表、医学检查影像等多种类型数据。病历信息分类是指通过综合多份病历文本中的数据,以推理分析出病人在特定检查部位的病历类型的过程。例如,在金融科技的保险理赔场景中,通过对目标对象在投保前上传的病历文档数据进行病历信息分类,将分类出的疾病类型和进行理赔的疾病类型进行匹配,从而能够确定两个疾病之间的疾病关系。该疾病关系的判断可以帮助保险公司判断投保前的疾病与理赔造成的疾病之间的关系。

2、目前,相关技术的病历信息分类方法是先筛选所有满足要求的检查报告,将筛选的报告按检查时间排序后,取最近一次的检查报告。然后,通过抽取检查报告中所有的实体和实体之间的关系,将所有的实体分组。之后,按照人为编写的规则代码对实体分组进行逻辑计算,确定疾病信息的类别。然而,当实体的抽取错误,会直接导致后续的关系抽取失败。并且,人工编写的推理逻辑代码,在不同的场景下需要耗费大量的时间和人力,难以维护,从而导致对病历信息分类的准确性较低。因此,如何提高对病历信息分类的准确性,成为了亟待解决的技术问题。


技术实现思路

1、本技术实施例的主要目的在于提出一种病历信息分类方法、病历信息分类装置、设备及存储介质,旨在提高对病历信息分类的准确性。

2、为实现上述目的,本技术实施例的第一方面提出了一种病历信息分类方法,所述方法包括:

3、获取目标病历数据和用于引导对所述目标病历数据进行分类的分类指示信息;

4、对所述目标病历数据进行文本提取,得到目标病历文本;

5、对所述分类指示信息进行分类信息提取,得到初步疾病类别、用于对所述初步疾病类别进行描述的类别描述信息和用于引导对所述目标病历数据进行筛选的病历筛选信息;

6、对所述目标病历文本进行病历特征编码,得到初始病历特征;

7、对所述类别描述信息进行类别特征编码,得到类别描述特征;

8、对所述病历筛选信息进行筛选特征编码,得到病历筛选特征;

9、基于所述病历筛选特征对所述初始病历特征进行特征提取,得到目标病历特征;

10、基于所述类别描述特征和所述目标病历特征对所述目标病历数据进行病历分类。

11、在一些实施例中,所述基于所述病历筛选特征对所述初始病历特征进行特征提取,得到目标病历特征,包括:

12、对所述病历筛选特征进行关键特征提取,得到目标筛选病历特征和目标筛选条件特征;

13、基于所述目标筛选病历特征从所述初始病历特征中筛选出候选病历特征;

14、基于所述目标筛选条件特征从所述候选病历特征中筛选出所述目标病历特征。

15、在一些实施例中,所述基于所述类别描述特征和所述目标病历特征对所述目标病历数据进行病历分类,包括:

16、基于所述类别描述特征对所述目标病历特征进行类别特征选择,得到目标类别特征;

17、基于所述目标类别特征进行类别预测,得到预测概率数据;

18、基于所述预测概率数据对所述目标病历数据进行病历分类。

19、在一些实施例中,所述对所述目标病历文本进行病历特征编码,得到初始病历特征,包括:

20、对所述目标病历文本进行病历注意力计算,得到病历注意力权重特征;

21、对所述目标病历文本进行病历文本编码,得到中间病历文本特征;

22、基于所述病历注意力权重特征对所述中间病历文本特征进行加权计算,得到所述初始病历特征。

23、在一些实施例中,所述对所述目标病历文本进行病历注意力计算,得到病历注意力权重特征,包括:

24、对所述目标病历文本进行文本片段划分,得到目标病历片段文本和所述目标病历片段文本的目标片段标记;

25、基于所述目标片段标记获取初始上下文特征;

26、基于所述初始上下文特征对所述目标病历片段文本进行片段文本注意力计算,得到病历片段注意力特征;

27、对所述目标片段标记和所述病历片段注意力特征进行特征拼接,得到所述病历注意力权重特征。

28、在一些实施例中,所述基于所述目标片段标记获取初始上下文特征,包括:

29、基于所述目标片段标记获取候选病历片段文本;其中,所述候选病历片段文本为所述目标病历片段文本的前一个片段文本,所述候选病历片段文本包括候选片段标记;

30、基于所述候选片段标记获取候选上下文特征;

31、对所述候选病历片段文本进行片段文本特征提取,得到候选片段文本特征;

32、基于所述候选片段文本特征和所述候选上下文特征进行候选病历注意力计算,得到所述初始上下文特征。

33、在一些实施例中,所述目标病历数据包括病历子数据,所述对所述目标病历数据进行文本提取,得到目标病历文本,包括:

34、对所述病历子数据进行数据预处理,得到目标子数据;

35、对所述目标子数据进行文本提取,得到病历子文本;

36、对所述病历子文本进行文本拼接,得到所述目标病历文本。

37、为实现上述目的,本技术实施例的第二方面提出了一种病历信息分类装置,所述装置包括:

38、获取模块,用于获取目标病历数据和用于引导对所述目标病历数据进行分类的分类指示信息;

39、文本提取模块,用于对所述目标病历数据进行文本提取,得到目标病历文本;

40、信息提取模块,用于对所述分类指示信息进行分类信息提取,得到初步疾病类别、用于对所述初步疾病类别进行描述的类别描述信息和用于引导对所述目标病历数据进行筛选的病历筛选信息;

41、病历编码模块,用于对所述目标病历文本进行病历特征编码,得到初始病历特征;

42、类别编码模块,用于对所述类别描述信息进行类别特征编码,得到类别描述特征;

43、信息编码模块,用于对所述病历筛选信息进行筛选特征编码,得到病历筛选特征;

44、特征提取模块,用于基于所述病历筛选特征对所述初始病历特征进行特征提取,得到目标病历特征;

45、分类模块,用于基于所述类别描述特征和所述目标病历特征对所述目标病历数据进行病历分类。

46、为实现上述目的,本技术实施例的第三方面提出了一种电子设备,包括:

47、至少一个存储器;

48、至少一个处理器;

49、至少一个计算机程序;

50、所述至少一个计算机程序被存储在所述至少一个存储器中,所述至少一个处理器执行所述至少一个计算机程序以实现:

51、如上述第一方面所述的方法。

52、为实现上述目的,本技术实施例的第四方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,所述计算机程序用于使计算机执行如上述第一方面所述的方法。

53、本技术提出的一种病历信息分类方法、病历信息分类装置、设备及存储介质,获取目标病历数据和用于引导对目标病历数据进行分类的分类指示信息。对目标病历数据进行文本提取,得到目标病历文本。对分类指示信息进行分类信息提取,得到初步疾病类别、用于对初步疾病类别进行描述的类别描述信息和用于引导对目标病历数据进行筛选的病历筛选信息。对目标病历文本进行病历特征编码,得到初始病历特征;对类别描述信息进行类别特征编码,得到类别描述特征;对病历筛选信息进行筛选特征编码,得到病历筛选特征。基于病历筛选特征对初始病历特征进行特征提取,得到目标病历特征;基于类别描述特征和目标病历特征对所述目标病历数据进行病历分类。本技术基于分类指示信息对目标病历数据进行分类,根据分类指示信息中的初步疾病类别、用于对初步疾病类别进行描述的类别描述信息和用于引导对目标病历数据进行筛选的病历筛选信息进行病历分类,能够避免抽取检查报告中所有的实体和实体之间的关系,并避免对实体抽取错误时,导致后续的关系抽取全部错误,因此,本技术能够提高对病历信息分类的准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1