一种针对icd起搏器的结构化数据提取方法

文档序号:10553197阅读:350来源:国知局
一种针对icd起搏器的结构化数据提取方法
【专利摘要】本发明公开一种针对ICD起搏器的结构化数据提取方法,包括以下步骤:1)从ICD起搏器中导出PDF格式的报告文件;2)根据报告文件设置CRT参数抽取规则库;3)读取文件内容;4)扫描报告文件,并提取文本内容;5)调用CRT参数抽取规则库,编程抽取符合抽取规则的数据;6)将数据写入数据库;该针对ICD起搏器的结构化数据提取方法能节省人力资源。
【专利说明】
一种针对I CD起搏器的结构化数据提取方法
技术领域
[0001 ]本发明涉及一种针对I⑶起搏器的结构化数据提取方法。
【背景技术】
[0002]充血性心力衰竭是有较高死亡率的严重疾患,每年有成千上万的患者死于心力衰竭。在过去的10余年中,在患者体内植入CRT设备已经成为治疗该级别最显著的非药物治疗方法。
[0003]患者植入CRT设备后,需要定期回医院进行随访,以便心血管专科医生对CRT近期的工作进行评价,并结合CRT的诊断功能,优化设备参数、调整治疗方案。CRT设备植入患者回医院进行随访时,心血管专科医生工作流程如下一一通过CRT厂家提供的程控仪,读取患者体内的CRT程控数据从CRT程仪器中的患者数据导出为PDF格式的随访报告,人工查阅报告中的各项参数指标,做出医学判断。将本次导出的报告进行存档,以便患者下次随访时进行对比。
[0004]目前国内外CRT厂家仅允许将程控数据导出为TOF文件,不允许导出为excel、csv、xml等文件格式。由于PDF文件是典型的非结构化数据格式,国内临床科研工作者进行心血管领域的大数据研究时,只能通过人工抄录的方式从上述TOF文件中提取各项参数指标。由于患者数量多、程控参数复杂,人工抄录劳动强度大。

【发明内容】

[0005]本发明要解决的技术问题是提供一种能节省人力资源的针对ICD起搏器的结构化数据提取方法。
[0006]为解决上述问题,本发明采用如下技术方案:
一种针对ICD起搏器的结构化数据提取方法,包括以下步骤:
1)从I⑶起搏器中导出I3DF格式的报告文件;
2)根据报告文件设置CRT参数抽取规则库;
3)读取文件内容;
4)扫描报告文件,并提取文本内容;
5)调用CRT参数抽取规则库,编程抽取符合抽取规则的数据;
6)将数据写入数据库。
[0007]作为优选,所述CRT参数抽取规则库的每条规则均对应着报告文件中的一个指标或参数。
[0008]作为优选,所述步骤3)的具体实现方式为:
3.1)采用JAVA程序打开报告文件;
3.2)编程读取报告文件。
[0009]作为优选,所述步骤4)的具体实现方式为:
4.1)逐行扫描报告文件的内容; 4.2)将每行的内容提取出来。
[0010]作为优选,所述步骤5)的具体实现方式为:
5.1)使用JAVA程序调用CRT参数抽取规则库;
5.2)在CRT参数抽取规则库找到每行内容的抽取规则;
5.3)根据抽取规则将报告文件中整行匹配的数据抽取出来;
作为优选,所述步骤6 )的具体实现方式为:
6.6)编程将抽取出来的数据进行汇总;
6.6)将汇总后的数据写入数据库。
[0011]作为优选,所述数据库为SQL数据库,功能强大、简单易学、使用方便。
[0012]作为优选,所述编程均为JAVA编程,具有简单性、面向对象、分布式、健壮性、安全性、平台独立与可移植性、多线程、动态性等特点,功能强大和简单易用。
[0013]本发明的有益效果为:采用计算机编程读取PDF格式的CRT程控文件中的文本内容,将文本内容抽取出来并保存到数据库,并可导出成Excel和cvs等数据格式进行统计分析,数据抽取效率和数据抽取准确率高,彻底解决了人工抄录模式难以管控质量的难题,能节省人力资源,方便医务人员工作,以便心血管专科医生对CRT近期的工作进行评价,以便患者下次随访时进行对比。
【附图说明】
[0014]为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0015]图1为实施例2中的步骤5)的数据抽取流程图。
【具体实施方式】
[0016]实施例1
一种针对ICD起搏器的结构化数据提取方法,包括以下步骤:
1)从I⑶起搏器中导出I3DF格式的报告文件;
2)根据报告文件设置CRT参数抽取规则库;
3)读取文件内容;
4)扫描报告文件,并提取文本内容;
5)调用CRT参数抽取规则库,编程抽取符合抽取规则的数据,如图1所示;
6)将数据写入数据库。
[0017]本实施例的有益效果为:采用计算机编程读取TOF格式的CRT程控文件中的文本内容,将文本内容抽取出来并保存到数据库,并可导出成Excel和cvs等数据格式进行统计分析,数据抽取效率和数据抽取准确率高,彻底解决了人工抄录模式难以管控质量的难题,能节省人力资源,方便医务人员工作,以便心血管专科医生对CRT近期的工作进行评价,以便患者下次随访时进行对比。
[0018]实施例2 一种针对ICD起搏器的结构化数据提取方法,包括以下步骤:
1)从I⑶起搏器中导出I3DF格式的报告文件;
2)根据报告文件设置CRT参数抽取规则库;
3)采用JAVA编程打开报告文件,JAVA编程读取报告文件;
4)逐行扫描报告文件的内容,将每行的内容提取出来;
5)使用JAVA编程调用CRT参数抽取规则库,在CRT参数抽取规则库中找到每行内容的抽取规则;根据抽取规则将报告文件中整行匹配的数据抽取出来,如图1所示;
6)使用JAVA编程将抽取出来的数据进行汇总;将汇总后的数据写入SQL数据库。
[0019]所述CRT参数抽取规则库的每条规则均对应着报告文件中的一个指标或参数,如设置了规则“体重=$ {体重} (kg)”后,当输入文本为“王强,体重=89 (kg)”时,JAVA程序则通过规则抽取数字“89”,并返回一下结果“体重=89”。
[0020]本实施例的有益效果为:采用JAVA编程读取PDF格式的CRT程控文件中的文本内容,将文本内容抽取出来并保存到SQL数据库,并可导出成Excel和cvs等数据格式进行统计分析,数据抽取效率和数据抽取准确率高,彻底解决了人工抄录模式难以管控质量的难题,能节省人力资源,方便医务人员工作,以便心血管专科医生对CRT近期的工作进行评价,以便患者下次随访时进行对比。
[0021]以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何不经过创造性劳动想到的变化或替换,都应涵盖在本发明的保护范围之内。
【主权项】
1.一种针对ICD起搏器的结构化数据提取方法,其特征在于:包括以下步骤:。2.1)从I⑶起搏器中导出PDF格式的报告文件; 2)根据报告文件设置CRT参数抽取规则库; 3)读取文件内容; 4)扫描报告文件,并提取文本内容; 5)调用CRT参数抽取规则库,编程抽取符合抽取规则的数据; 6)将数据写入数据库。3.根据权利要求1所述的针对ICD起搏器的结构化数据提取方法,其特征在于:所述CRT参数抽取规则库的每条规则均对应着报告文件中的一个指标或参数。4.根据权利要求2所述的针对ICD起搏器的结构化数据提取方法,其特征在于:所述步骤3)的具体实现方式为: 3.1)编程打开报告文件; 3.2)读取报告文件。5.根据权利要求3所述的针对ICD起搏器的结构化数据提取方法,其特征在于:所述步骤4)的具体实现方式为: 4.1)逐行扫描报告文件的内容; 4.2)将每行的内容提取出来。6.根据权利要求4所述的针对ICD起搏器的结构化数据提取方法,其特征在于:所述步骤5)的具体实现方式为: 5.1)使用JAVA程序调用CRT参数抽取规则库; 5.2)在CRT参数抽取规则库找到每行内容的抽取规则; 5.3)根据抽取规则将报告文件中整行匹配的数据抽取出来; 根据权利要求5所述的针对ICD起搏器的结构化数据提取方法,其特征在于:所述步骤6)的具体实现方式为: 6.6)编程将抽取出来的数据进行汇总; 6.6)将汇总后的数据写入数据库。7.根据权利要求6所述的针对ICD起搏器的结构化数据提取方法,其特征在于:所述数据库为SQL数据库。8.根据权利要求7所述的针对ICD起搏器的结构化数据提取方法,其特征在于:所述编程均为JAVA编程。
【文档编号】G06F17/30GK105912883SQ201610494115
【公开日】2016年8月31日
【申请日】2016年6月30日
【发明人】陈样新, 毛涌泉, 罗超
【申请人】广州市皓轩软件科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1