一种医学单据智能识别方法与智能识别系统与流程

文档序号:16432244发布日期:2018-12-28 20:14阅读:344来源:国知局
一种医学单据智能识别方法与智能识别系统与流程

本发明涉及图像处理领域,具体涉及一种医学单据智能识别方法与智能识别系统。

背景技术

现有医疗环境中会产生大量的医学单据,电子版医学单据可以直接在信息系统中完成诊疗数据交换,而在诊疗过程的各环节生成、签注和流转的印刷版医学单据需要在诊疗告一段落时进行信息识别形成可交换的诊疗数据。现有通用光学文本识别(opticalcharacterrecognition,ocr)技术对文本图案的识别是基于标准文本的图像特征数据,印刷版医学单据中的人工签注和人工记录内容往往涉及不同的文字、符号等图案,由于笔记潦草、图形混杂和意外污迹折痕使得真实图案的图像特征存在采集误差,无法与标准文本的图像特征数据合理匹配,造成识别率低误识率高,需要人工识别的频繁介入。。



技术实现要素:

本发明实施例提供一种医学单据智能识别方法与智能识别系统,解决现有的光学字符识别过程中识别率偏低的技术问题。

本发明实施例的医学单据智能识别方法,通过软磁性油墨标定原始医学单据中的信息承载范围,向所述信息承载范围内的光学文本识别过程提供优先特征数据。

本发明实施例的医学单据智能识别系统包括:

存储器,用于存储上述的医学单据智能识别方法中对应处理步骤的程序代码;

运算器,用于运行所述程序代码。

本发明实施例的医学单据智能识别系统,用于通过软磁性油墨标定原始医学单据中的信息承载范围,向所述信息承载范围内的光学文本识别过程提供优先特征数据。

本发明实施例的医学单据智能识别方法与智能识别系统用于优化复杂定制表格中复杂形式信息内容的光学文本识别过程。利用快速消磁的磁介质标记复杂定制表格,并根据复杂定制表格的坐标标记确定复杂形式信息的具体坐标范围。通过提供该坐标范围内的复杂形式信息的应有信息记载形式,提高光学文本识别过程中对图像特征数据的匹配效率和识别准确度。避免了通用光学文本识别技术中非关键信息对关键信息的识别准确率造成干扰,克服了对非关键信息(如复杂定制表格)与关键信息的识别浪费大量计算资源的技术缺陷。

附图说明

图1所示为本发明实施例医学单据智能识别方法的流程图。

图2所示为本发明实施例医学单据智能识别系统的架构示意图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚、明白,以下结合附图及具体实施方式对本发明作进一步说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例的医学单据智能识别方法包括:

通过软磁性油墨标定原始医学单据中的信息承载范围,向信息承载范围内的光学文本识别过程提供优先特征数据。

本发明实施例的医学单据智能识别方法用于优化复杂定制表格中复杂形式信息内容的光学文本识别过程。利用快速消磁的磁介质标记复杂定制表格,并根据复杂定制表格的坐标标记确定复杂形式信息的具体坐标范围。通过提供该坐标范围内的复杂形式信息的应有信息记载形式,提高光学文本识别过程中对图像特征数据的匹配效率和识别准确度。避免了通用光学文本识别技术中非关键信息对关键信息的识别准确率造成干扰,克服了对非关键信息(如复杂定制表格)与关键信息的识别浪费大量计算资源的技术缺陷。

本发明一实施例的医学单据智能识别方法的流程图如图1所示。如图1所示,医学单据智能识别方法包括:

步骤100:在油墨材料中添加铁磁粉末形成软磁性的磁性油墨;

采用具有低矫顽力和高磁导率的铁磁粉末磁性材料,例如铁硅合金粉末或以fe2o3为主成分的亚铁磁性氧化物。

步骤110:通过磁性油墨进行图案印刷形成原始医疗单据;

根据诊疗用途形成一系列具有固定图案的原始医疗单据。固定图案包括针对一确定诊疗阶段的化验单、体检单、诊断单、报销单、药房单据等单据的组成图案和表格。

步骤120:原始医疗单据随疗程在医患双方间流转形成流转单据。

流转单据包括在不同医疗过程或诊疗过程中动态添加的医患信息,医患信息通常根据医疗过程或诊疗过程添加在单据固定的位置。

本发明实施例的医学单据智能识别方法通过磁介质建立了医学单据各部分非关键信息(如复杂定制表格)与关键信息块存在页面上的基本坐标关系,保证了非关键信息的准确定位,为非关键信息与关键信息的区分提供了必要识别基础。

在上述实施例的基础上,本发明另一实施例的医学单据智能识别方法包括:

步骤200:根据原始医疗单据上的原始完整图案形成全局矢量描述数据;

利用postscript编程语言建立页面矢量描述模型,对原始医疗单据上的原始完整图案进行矢量元素的矢量描述。本领域技术人员可以理解相同矢量元素的矢量描述具有一致性,相同图形的不同矢量元素组合间具有可转换性。同一图案的矢量元素可以具有多样性组合。完整图案的矢量元素的不同组合形成的不同矢量描述数据在整体表达趋势相同,即图形表现一致。局部图案的矢量元素的不同组合形成的不同矢量描述数据在局部表达趋势相似,即图形表现高相关性。

步骤210:根据全局矢量描述数据形成原始医疗单据上各标题图案的图案矢量描述数据;

提取全局矢量描述数据中与原始完整图案中各标题图案相关的矢量描述数据形成原始医疗单据中图案的矢量描述数据。图案可以是表格线条、表格中项目的文字或图案等。

步骤220:根据全局矢量描述数据形成原始医疗单据上各承载图案的位置矢量描述数据;

提取在医患双方间流转时记载、记录或包含附加医患信息的原始完整图案中的承载图案。承载图案包括选项框、与标题图案的项目对应的空白表格范围等。

步骤230:根据标题图案的信息类型为承载图案设定承载信息描述数据;

承载图案与标题图案对应,具有相应的信息类型,信息类型和形式可以定义或限定。承载信息描述数据通常为信息表达的优先类型、信息表达的文字特征、信息表达的编码集形式、信息表达的图形集合、信息表达的符号集形式等。

步骤240:根据原始医疗单据的矢量描述数据和承载信息描述数据形成原始医疗单据的辅助识别数据。

本发明实施例的医学单据智能识别方法使得每一种原始医疗单据的相关各矢量描述数据和承载信息描述数据与对应原始医疗单据关联,使得原始医疗单据的全局图案、局部图案和局部图案的信息特征形成映射。

在上述实施例的基础上,本发明另一实施例的医学单据智能识别方法包括:

步骤300:建立恒定磁场;

恒定磁场为定极向、定强度和定位置的磁场。

步骤310:流转单据通过恒定磁场磁化形成磁性单据;

将包含了流转过程中各诊疗节点附加的医患信息的医疗单据形成磁性单据。

步骤320:对磁性单据进行逐行光学扫描和逐行磁感应扫描,形成每一像素的光学信号和磁性信号;

步骤330:根据磁性信号形成磁性单据的第一磁性识别图像,根据磁性信号利用相应像素的光学信号形成第二光学识别图像;

第一磁性识别图像仅包括对应的原始医疗单据中的原始图案,但由于磁性单据在流转时的损坏,第一磁性识别图像与原始医疗单据的原始图案存在差异,整体上具有相似性。

第二光学识别图像与第一磁性识别图像的图形表达一致。

步骤340:根据第一磁性识别图像形成磁性单据的矢量表述比对数据;

矢量表述比对数据采用与全局矢量描述数据一致的页面矢量描述模型。

步骤360:根据矢量表述比对数据与原始医疗单据的辅助识别数据比对,根据矢量拟合度确定磁性单据的原始医疗单据种类,确定磁性单据的标题位置范围和附加信息位置范围;

通过局部和整体的矢量描述数据的比对可以获得原始医疗单据的类型,原始医疗单据中标题位置范围和在流转过程中附加信息的预设位置范围。

步骤380:根据原始医疗单据的承载信息描述数据确定各附加信息位置范围内的优选识别字符集和/或图案集;

进而获得预设位置范围内附加信息的应有形式和应有数据格式。例如应该是希腊字符集为主,数字字符为辅,中文字符集为辅。

步骤350:根据每一像素的光学信号形成第一光学识别图像;

步骤370:消除第一光学识别图像中的第二光学识别图像形成第三光学识别图像;

第三光学识别图像中准确排除了原始医疗单据的原始图案,降低了第三光学识别图像中与待识别信息无关的干扰信息。

在本发明一实施例中,仅消除不存在图案叠加的第二光学识别图像。当磁性单据流转过程中原始图案被记录的附加信息和污迹覆盖时,仅消除不存在图案叠加的第二光学识别图像可以保证第三光学识别图像中图案不会被过度消除,避免被记录的附加信息受损。

步骤390:根据附加信息位置范围和优选识别字符集和/或图案集对第三光学识别图像进行ocr。

根据具体的附加信息位置范围和优选识别字符集和/或图案集可以有效提高ocr效率和准确性。

经ocr过程形成诊疗数据。

本发明实施例的医学单据智能识别系统包括:

存储器,用于存储上述实施例的医学单据智能识别方法中对应处理过程的程序代码;

运算器,用于运行上述实施例的医学单据智能识别方法中对应处理过程的程序代码。

本发明实施例的医学单据智能识别系统,用于通过软磁性油墨标定原始医学单据中的信息承载范围,向信息承载范围内的光学文本识别过程提供优先特征数据。

本发明实施例的医学单据智能识别系统包括:

油墨改良装置1100,用于在油墨材料中添加铁磁粉末形成软磁性的磁性油墨;

单据改良装置1110,用于通过磁性油墨进行图案印刷形成原始医疗单据;

单据收发装置1120,用于原始医疗单据随疗程在医患双方间流转形成流转单据。

本发明实施例的医学单据智能识别系统还包括:

全局矢量生成装置1200,用于根据原始医疗单据上的原始完整图案形成全局矢量描述数据;

局部图案矢量生成装置1210,用于根据全局矢量描述数据形成原始医疗单据上各标题图案的图案矢量描述数据;

局部位置矢量生成装置1220,用于根据全局矢量描述数据形成原始医疗单据上各承载图案的位置矢量描述数据;

识别策略预置装置1230,用于根据标题图案的信息类型为承载图案设定承载信息描述数据;

原始单据数据集成装置1240,用于根据原始医疗单据的矢量描述数据和承载信息描述数据形成原始医疗单据的辅助识别数据。

本发明实施例的医学单据智能识别系统还包括:

磁场设立装置1300,用于建立恒定磁场;

单据磁化装置1310,用于流转单据通过恒定磁场磁化形成磁性单据;

双路扫描装置1320,用于对磁性单据进行逐行光学扫描和逐行磁感应扫描,形成每一像素的光学信号和磁性信号;

双路成像装置1330,用于根据磁性信号形成磁性单据的第一磁性识别图像,根据磁性信号利用相应像素的光学信号形成第二光学识别图像;

比对矢量生成装置1340,用于根据第一磁性识别图像形成磁性单据的矢量表述比对数据;

矢量拟合装置1360,用于根据矢量表述比对数据与原始医疗单据的辅助识别数据比对,根据矢量拟合度确定磁性单据的原始医疗单据种类,确定磁性单据的标题位置范围和附加信息位置范围;

矢量附加信息装置1380,用于根据原始医疗单据的承载信息描述数据确定各附加信息位置范围内的优选识别字符集和/或图案集;

图像生成装置1350,用于根据每一像素的光学信号形成第一光学识别图像;

图像消隐装置1370,用于消除第一光学识别图像中的第二光学识别图像形成第三光学识别图像;

识别优化装置1390,用于根据附加信息位置范围和优选识别字符集和/或图案集对第三光学识别图像进行ocr。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1