一种基于体检报告文本信息的智能结构化解析方法及系统与流程

文档序号:34183540发布日期:2023-05-17 10:28阅读:187来源:国知局
一种基于体检报告文本信息的智能结构化解析方法及系统与流程

本发明涉及一种基于体检报告文本信息的智能结构化解析方法,属于人工智能医疗信息化领域。


背景技术:

1、随着人们健康意识的提高,越来越多的人开始定期进行健康体检。由于体检客户缺少医学知识背景,面对密密麻麻的文本信息,许多人一头雾水,很难理解其中的关键信息,只能寻求不同科室医生进行检查结果的解读。这样不仅耗费了大量时间,而且也占用了医院的医疗资源。因此,迫切需要一种针对体检报告文本信息的智能结构化解析方法或工具,能够快速对体检报告文本信息进行智能解析,以结构化的形式将关键信息呈现给体检客户。这样不仅可以帮助体检客户快速掌握体检情况,而且节省人力物力缓解医疗资源的占用。

2、现有体检报告信息结构化方法或工具主要采用图像识别技术,对体检报告中表格、影像、文本信息进行提取,后续没有对提取的文本信息进行结构化解析,体检客户面对的依然是一堆密密麻麻的文本信息。例如公开号为cn112257613a的中国发明专利申请提出了一种体检报告信息结构化提取方法,采用图像识别技术将体检报告以图像的形式进行识别对应文本,通过语义分析定位获取识别文本中目标字段,对于具体的文本信息缺少解析功能,文本的关键信息无法结构化呈现,达不到对文本信息智能解析的目的。

3、现有体检报告信息结构化方法或工具还很少,对体检报告结构化信息提取的关注点在于体检报告的结构化解析,很少关注体检报告中文本信息的更深层含义及结构化呈现,缺少对体检报告中文本信息的智能解析。解决体检报告文本信息的智能解析的痛点是当下迫切的需求。


技术实现思路

1、本发明要解决的技术问题是:现有的体检报告信息结构化方法或工具主要针对电子体检报告进行结构化解析,并没有对体检报告中的文本信息进行更深层次的解析。

2、为了解决上述问题,本发明的一个技术方案是提供了一种基于体检报告文本信息的智能结构化解析系统,其特征在于,包括:

3、电子提交报告获取模块,用于获取体检客户上传的pdf、png、jpg等格式的电子体检报告;

4、体检报告文字识别模块,用于利用ocr技术将电子提交报告获取模块获得的电子体检报告识别为体检报告文本信息;

5、文本信息来源分析模块,用于对体检报告文字识别模块获得的体检报告文本信息进行分析,判断检查类别,若分析结论为该体检报告文本信息为非体检信息,则退出本系统,若分析结论为该体检报告文本信息为体检信息,则进一步调用检查描述与小结信息分类模块;

6、检查描述与小结信息分类模块,用于识别并区分体检报告文本信息中的检查描述文本信息以及检查结论文本信息;

7、检查描述实体识别模块:对于检查描述与小结信息分类模块识别到的检查描述文本信息,调用检查描述实体识别模块对其进行处理,对检查描述文本信息进行实体识别,抽取关键信息;

8、检查小结实体识别模块:对于检查描述与小结信息分类模块识别到的检查小结文本信息,调用检查小结实体识别模块对其进行处理,对检查描述文本信息进行实体识别,抽取关键信息;

9、实体词标准化转换模块,用于计算检查描述实体识别模块以及检查小结实体识别模块识别得到的实体词与标准医学术语知识库中标准医学术语的语义相似度,返回最相似的标准医学术语作为实体对应的标准术语;

10、结构化展示模块,基于实体词标准化转换模块反馈的标准术语,检查判断其中的检查异常信息,通过定义好的结构化格式将检查异常信息展示给体检客户。

11、优选地,体检用户上传的电子体检报告的格式包括pdf、png或jpg。

12、优选地,所述文本信息来源分析模块利用自然语言文本分类技术对文本信息做过滤并判断检查类别。

13、本发明的另一个技术方案是提供了一种基于体检报告文本信息的智能结构化解析方法,其特征在于,包括以下步骤:

14、步骤1、获取体检客户上传的电子体检报告。

15、步骤2、利用ocr技术将电子体检报告进行文字识别,获得体检报告文本信息。

16、步骤3、利用文本分类技术对体检报告文本信息进行分析,判断检查类别:若分析结论为该体检报告文本信息为非体检信息,则退出本方法;若分析结论为该体检报告文本信息为体检信息,则进入步骤4;

17、步骤4、利用文本分类技术对体检报告文本信息进行处理,识别并区分体检报告文本信息中的检查描述文本信息与检查小结文本信息;

18、步骤5、分别利用实体识别技术对检查描述文本信息与检查小结文本信息进行实体识别,分别获取检查描述文本信息与检查小结文本信息中的实体词,抽取关键信息;

19、步骤6、计算通过检查描述文本信息抽取的实体词以及通过检查小结文本信息抽取的实体词与标准医学术语知识库中标准医学术语的语义相似度,返回最相似的标准医学术语作为实体对应的标准术语;

20、步骤7、基于步骤6获得的所有标准术语,检查判断其中的检查异常信息,通过定义好的结构化格式将检查异常信息展示给体检客户。

21、本发明可以对体检报告中文本信息进行更深层次的解析,并以结构化的形式展示给体检客户,让体检客户一目了然的了解自己的身体状况,为体检客户呈现结构化的体检信息,不仅能让体检客户快速了解体检状况,而且节省人力物力及医疗资源。



技术特征:

1.一种基于体检报告文本信息的智能结构化解析系统,其特征在于,包括:

2.如权利要求1所述的一种基于体检报告文本信息的智能结构化解析系统,其特征在于,体检用户上传的电子体检报告的格式包括pdf、png或jpg。

3.如权利要求1所述的一种基于体检报告文本信息的智能结构化解析系统,其特征在于,所述文本信息来源分析模块利用自然语言文本分类技术对文本信息做过滤并判断检查类别。

4.一种基于体检报告文本信息的智能结构化解析方法,其特征在于,包括以下步骤:


技术总结
本发明的一个技术方案是提供了一种基于体检报告文本信息的智能结构化解析系统,其特征在于,包括电子提交报告获取模块;体检报告文字识别模块;文本信息来源分析模块;检查描述与小结信息分类模块;检查描述实体识别模块;检查小结实体识别模块;实体词标准化转换模块;结构化展示模块。本发明的另一个技术方案是提供了一种基于体检报告文本信息的智能结构化解析方法。本发明可以对体检报告中文本信息进行更深层次的解析,并以结构化的形式展示给体检客户,让体检客户一目了然的了解自己的身体状况,为体检客户呈现结构化的体检信息,不仅能让体检客户快速了解体检状况,而且节省人力物力及医疗资源。

技术研发人员:王杰,吕传峰,楼文杰,佘盼,张敬谊
受保护的技术使用者:万达信息股份有限公司
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1