一种组织病理报告的结构化处理方法及装置与流程

文档序号:35496079发布日期:2023-09-19 22:51阅读:45来源:国知局
一种组织病理报告的结构化处理方法及装置与流程

本发明涉及组织病理报告结构化,尤其涉及一种组织病理报告的结构化处理方法、装置、电子设备及计算机可读存储介质。


背景技术:

1、组织病理报告是病理科医生撰写的医学报告,用于描述组织标本的病理学特征。可以包括标本来源、组织学特征、病理学特征、病理分级以及病理学评估等内容,组织病理报告对于病理诊断、治疗以及预后判断具有重要的意义。

2、组织病理报告的发布过程通常包括:样本收集、样本预处理、制片、阅片以及组织病理报告发布等过程。当前组织病理报告主要是医护工作人员根据组织病理的检查结果在病理系统中输入病理诊断报告,但病理诊断报告的表达形式通常比较杂乱,且一些流程步骤仍然存在纸质化的记录方式,因此当前组织病理报告的填写存在结构化程度低,展示效果不佳的问题。


技术实现思路

1、本发明提供一种组织病理报告的结构化处理方法、装置及计算机可读存储介质,其主要目的在于解决当前组织病理报告的填写存在结构化程度低,展示效果不佳的问题。

2、为实现上述目的,本发明提供的一种组织病理报告的结构化处理方法,包括:

3、获取病理类目集及所述病理类目集中每一个病理类目对应的病理类目题库,接收所述病理类目对应的病理名称集;

4、在所述病理名称集中依次提取病理名称,接收用户根据所述病理名称在所述病理类目题库中提取的病理题目集;

5、接收用户在所述病理题目集中标识的标签题目集,根据所述标签题目集构建第一病理模板,根据所述病理题目集及标签题目集构建第二病理模板;

6、根据所述第一病理模板及第二病理模板构建每个病理名称对应的病理组合模板,得到每个病理类目对应的病理组合模板集;

7、获取初始病理诊断文本,对所述初始病理诊断文本进行分词处理,得到病理诊断词语集;

8、获取所述初始病理诊断文本所属的病理类目,提取所述初始病理诊断文本所属的病理类目对应的病理组合模板集;

9、利用预构建的逆文档频率计算公式依次获取所述病理组合模板集中每个病理组合模板的关键词频序列;

10、根据所述关键词频序列计算所述病理组合模板集中每个病理组合模板与所述初始病理诊断文本的相似度,得到相似模板序列;

11、接收用户根据所述相似模板序列在所述病理组合模板集中提取的目标病理组合模板;

12、接收用户根据所述初始病理诊断文本,在所述目标病理组合模板中输入的病理文本信息,得到目标病理报告文本。

13、可选地,所述利用预构建的逆文档频率计算公式依次获取所述病理组合模板集中每个病理组合模板的关键词频序列,包括:

14、在所述病理组合模板集中依次提取病理组合模板,在所述病理组合模版中依次提取模板词语;

15、识别所述模板词语在所述病理组合模板中的出现次数及所述病理组合模板中的总模板词语数;

16、根据所述模板词语在所述病理组合模板中的出现次数及总模板词语数计算所述模板词语在所述病理组合模板中的词频;

17、获取所述病理组合模板集中的病理组合模板数;

18、在所述病理组合模板集中识别包含所述模板词语的相关病理组合模板,统计所述相关病理组合模板的数量;

19、根据所述病理组合模板集中的病理组合模板数及所述相关病理组合模板的数量计算所述模板词语的逆文档频率;

20、根据所述模板词语在所述病理组合模板中的词频及所述逆文档频率,利用预构建的逆文档频率计算公式计算所述模板词语在所述病理组合模板中的关键指数;

21、根据所述病理组合模板中每个模板词语的关键指数对所述模板词语进行排序,得到所述关键词频序列。

22、可选地,所述逆文档频率计算公式,如下所示:

23、

24、其中,fi表示所述病理组合模板中第i个模板词语的关键指数,m表示所述病理组合模板中的模板词语总数,mi表示所述病理组合模板中第i个模板词语在所述病理组合模板中出现的次数,ni表示相关病理组合模板的数量,n表示病理组合模板集中的病理组合模板数,表示所述模板词语在所述病理组合模板中的词频,表示所述模板词语的逆文档频率。

25、可选地,所述根据所述关键词频序列计算所述病理组合模板集中每个病理组合模板与所述初始病理诊断文本的相似度,得到相似模板序列,包括:

26、在所述病理组合模板集中依次提取病理组合模板,提取所述病理组合模板的关键词频序列;

27、识别所述病理诊断词语集与所述关键词频序列中的相同词语,得到相同词语集;

28、识别所述相同词语集中每个相同词语在所述初始病理诊断文本中的出现次数;

29、根据所述相同词语在所述初始病理诊断文本中的出现次数及所述相同词语的在所述关键词频序列中的关键指数,利用预构建的相似度计算公式计算所述病理组合模板集中每个病理组合模板与所述初始病理诊断文本的相似度;

30、根据所述病理组合模板与所述初始病理诊断文本的相似度对所述病理组合模板集中每个病理组合模板进行排序,得到所述相似模板序列。

31、可选地,所述相似度计算公式,如下所示:

32、

33、其中,l表示病理组合模板与所述初始病理诊断文本的相似度,j表示相同词语在相同词语集中的序数,j表示相同词语集中相同词语的总数,fj表示相同词语集中第j个相同词语在关键词频序列中的关键指数,xj表示相同词语集中第j个相同词语在所述初始病理诊断文本中的出现次数,k表示调节因子。

34、可选地,所述接收用户根据所述初始病理诊断文本在所述目标病理组合模板中输入的病理文本信息,得到目标病理报告文本之后,所述方法还包括:

35、接收用户输入的检索关键词,在所述目标病理报告文本中提取第二病理模板中的模板词语集;

36、将所述检索关键词与模板词语集中的模板词语进行逐一匹配,得到匹配结果;

37、判断所述匹配结果是否为空;

38、若所述匹配结果不为空,则将所述匹配结果返回至预构建的用户界面;

39、若所述匹配结果为空,则在所述目标病理报告文本中提取第一病理模板中的模板词语集,并将所述检索关键词与模板词语集中的模板词语进行逐一匹配,得到匹配结果;

40、判断所述匹配结果是否为空;

41、若所述匹配结果为空,则提示用户所述检索关键词不存在;

42、若所述匹配结果不为空,则将所述匹配结果返回至所述用户界面。

43、可选地,所述根据所述病理题目集及标签题目集构建第二病理模板,包括:

44、在所述标签题目集中依次提取标签题目;

45、在所述病理题目集中去除所述标签题目,直至所述病理题目集中不存在所述标签题目,得到第二病理题目集;

46、根据所述第二病理题目集构建所述第二病理模板。

47、可选地,所述获取所述初始病理诊断文本所属的病理类目,包括:

48、在所述用户界面展示病理类目选项集;

49、接收用户在所述病理类目选项集中确定的病理类目,得到所述初始病理诊断文本所属的病理类目。

50、可选地,所述获取初始病理诊断文本,包括:

51、接收用户输入的病理诊断结果文本;

52、识别所述病理诊断结果文本中的标点集,利用所述标点集对所述病理诊断结果文本进行拆分,得到病理诊断结果语段;

53、去除所述病理诊断结果语段中的诊断数据,得到所述初始病理诊断文本。

54、为了解决上述问题,本发明还提供一种组织病理报告的结构化处理装置,所述装置包括:

55、病理题目集提取模块,用于获取病理类目集及所述病理类目集中每一个病理类目对应的病理类目题库,接收所述病理类目对应的病理名称集;在所述病理名称集中依次提取病理名称,接收用户根据所述病理名称在所述病理类目题库中提取的病理题目集;

56、病理组合模板构建模块,用于接收用户在所述病理题目集中标识的标签题目集,根据所述标签题目集构建第一病理模板,根据所述病理题目集及标签题目集构建第二病理模板;根据所述第一病理模板及第二病理模板构建每个病理名称对应的病理组合模板,得到每个病理类目对应的病理组合模板集;

57、病理诊断词语集获取模块,用于获取初始病理诊断文本,对所述初始病理诊断文本进行分词处理,得到病理诊断词语集;

58、目标病理组合模板获取模块,用于获取所述初始病理诊断文本所属的病理类目,提取所述初始病理诊断文本所属的病理类目对应的病理组合模板集;利用预构建的逆文档频率计算公式依次获取所述病理组合模板集中每个病理组合模板的关键词频序列;根据所述关键词频序列计算所述病理组合模板集中每个病理组合模板与所述初始病理诊断文本的相似度,得到相似模板序列;接收用户根据所述相似模板序列,在所述病理组合模板集中提取的目标病理组合模板;

59、病理文本信息输入模块,用于接收用户根据所述初始病理诊断文本,在所述目标病理组合模板中输入的病理文本信息,得到目标病理报告文本。

60、为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:

61、至少一个处理器;以及,

62、与所述至少一个处理器通信连接的存储器;其中,

63、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以实现上述所述的组织病理报告的结构化处理方法。

64、为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的组织病理报告的结构化处理方法。

65、相比于背景技术所述:当前组织病理报告的填写存在结构化程度低,展示效果不佳的现象,本发明实施例在进行组织病理报告的填写过程中需要先构建各个病理类目的病理组合模板集,在构建所述病理组合模板集的过程中需要先获取病理类目集及所述病理类目集中每一个病理类目对应的病理类目题库,然后接收用户根据所述病理名称在所述病理类目题库中提取的病理题目集,当得到所述病理名称与所述病理题目集的对应关系后,先接收用户在所述病理题目集中标识的标签题目集,再根据所述标签题目集构建第一病理模板,然后根据所述病理题目集及标签题目集构建第二病理模板,最后根据所述第一病理模板及第二病理模板构建每个病理名称对应的病理组合模板,从而得到到每个病理类目对应的病理组合模板集,此时就可以获取初始病理诊断文本,再计算所述初始病理诊断文本与所述病理组合模板的相似度,具体通过对所述初始病理诊断文本进行分词处理,得到病理诊断词语集,再取所述初始病理诊断文本所属的病理类目对应的病理组合模板集,然后利用预构建的逆文档频率计算公式依次获取所述病理组合模板集中每个病理组合模板的关键词频序列,根据所述关键词频序列计算所述病理组合模板集中每个病理组合模板与所述初始病理诊断文本的相似度,得到相似模板序列,最后接收用户在所述相似模板序列中提取的目标病理组合模板,此时就可以接收用户根据所述初始病理诊断文本,在所述目标病理组合模板中输入的病理文本信息,得到目标病理报告文本。因此本发明提出的组织病理报告的结构化处理方法、装置、电子设备及计算机可读存储介质,可以解决当前组织病理报告的填写存在结构化程度低,展示效果不佳的问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1