医学影像中的文字信息识别方法及装置的制造方法

文档序号:9200682阅读:476来源:国知局
医学影像中的文字信息识别方法及装置的制造方法
【技术领域】
[0001]本发明涉及医学影像处理技术领域,具体涉及一种医学影像中的文字信息识别方法及装置。
【背景技术】
[0002]目前医院普遍使用医学影像存档与通信系统(PACS,Picture Archiving andCommunicat1n System)来存储和管理医护人员对患者进行影像学检查后得到的医学影像数据。医生需要审阅病人的影像,编写影像检查报告等。由于影像与报告属独立分发,医学影像对应的数字胶片中并没有以文字格式存储病人的相关信息,而是将这些信息以图像形式嵌入在医学影像对应的数字胶片中。因此,在将胶片和报告交给病人之前,需要将胶片中获取的病人信息与报告对应起来。目前的做法是人工进行胶片及报告的核对与匹配,以将相应的影像完全准确地分配至相应的病人,这给医护人员增加了非常大的工作量,不仅耽误了病人取片的时间,而且还有可能出错。

【发明内容】

[0003]本发明的主要目的在于,提供一种医学影像中的文字信息识别方法及装置。
[0004]根据本发明的第一方面,本发明提供一种医学影像中的文字信息识别方法,包括:定位步骤:接收操作者在医学影像上选取文字区域的输入,根据所述输入确定待进行文字信息识别的文字区域;预处理步骤:对所述文字区域进行图像预处理操作以去除非文字信息,得到干净的文字图像;识别步骤:对所述文字图像进行切割以拆分出文字,得到单个的字符图像,对得到的单个字符图像进行识别,得到初识别文字;修正步骤:对所述初识别文字进行修正;验证步骤:将修正后的识别文字根据预设验证条件进行验证,以去除不合理和不合法的识别文字,输出验证结果,所述验证结果包括通过验证的识别文字。
[0005]进一步地,所述方法还包括:学习步骤:接收操作者对所述通过验证的识别文字的反馈,所述反馈包括表征识别正确的正反馈和表征识别错误的负反馈,根据所述正反馈和所述负反馈对所述通过验证的识别文字进行训练,得到识别分类器;所述识别步骤还包括根据所述识别分类器对所述单个字符图像进行识别;和/或,所述验证结果还包括提示操作者识别出错的提示信息,所述方法还包括:接收步骤:接收操作者对所述提示信息的重新识别的反馈,提示操作者重新执行定位步骤。
[0006]进一步地,所述修正包括:去除非文字字符,结合由预设编码规则确定的待进行文字信息识别的文字范围,将所述初识别文字中与所述文字范围类似的字符修改为所述文字范围中对应的文字,所述预设编码规则包括所述医学影像对应的医院提供的包括挂号的编号规则。
[0007]进一步地,所述预设验证条件包括:所述医学影像对应的医院提供的包括挂号的业务处理情况以及判断识别内容的合法性。
[0008]进一步地,所述方法在所述修正步骤之前还包括:重识别步骤:接收操作者对所述初识别文字的识别情况的反馈,如果所述反馈低于预设最低识别阈值条件,则提示所述操作者重新执行定位步骤。
[0009]根据本发明的第二方面,本发明提供一种医学影像中的文字信息识别装置,包括:定位模块,用于接收操作者在医学影像上选取文字区域的输入,根据所述输入确定待进行文字信息识别的文字区域;预处理模块,用于对所述文字区域进行图像预处理操作以去除非文字信息,得到干净的文字图像;识别模块,用于对所述文字图像进行切割以拆分出文字,得到单个的字符图像,对得到的单个字符图像进行识别,得到初识别文字;修正模块,用于对所述初识别文字进行修正;验证模块,用于将修正后的识别文字根据预设验证条件进行验证,以去除不合理和不合法的识别文字,输出验证结果,所述验证结果包括通过验证的识别文字。
[0010]进一步地,所述装置还包括:学习模块,用于接收操作者对所述通过验证的识别文字的反馈,所述反馈包括表征识别正确的正反馈和表征识别错误的负反馈,根据所述正反馈和所述负反馈对所述通过验证的识别文字进行训练,得到识别分类器;所述识别模块还用于根据所述识别分类器对所述单个字符图像进行识别;和/或,所述验证结果还包括提示操作者识别出错的提示信息,所述装置还包括:接收模块:接收操作者对所述提示信息的重新识别的反馈,提示操作者重新执行定位模块。
[0011]进一步地,所述修正包括:去除非文字字符,结合由预设编码规则确定的待进行文字信息识别的文字范围,将所述初识别文字中与所述文字范围类似的字符修改为所述文字范围中对应的文字,所述预设编码规则包括所述医学影像对应的医院提供的包括挂号的编号规则。
[0012]进一步地,所述预设验证条件包括:所述医学影像对应的医院提供的包括挂号的业务处理情况以及判断识别内容的合法性。
[0013]进一步地,所述装置在所述修正模块之前还包括:重识别模块,用于接收操作者对所述初识别文字的识别情况的反馈,如果所述反馈低于预设最低识别阈值条件,则提示所述操作者重新执行定位模块。
[0014]本发明的有益效果是:通过根据接收到的操作者输入缩小识别范围,提高识别效率,还通过对预处理及识别后的初识别文字进行修正和验证,进一步提高识别的准确率。
【附图说明】
[0015]图1为本发明一种实施例的医学影像中的文字信息识别方法的流程示意图。
[0016]图2为本发明另一种实施例的医学影像中的文字信息识别方法的流程示意图。
[0017]图3为本发明又一种实施例的医学影像中的文字信息识别方法的流程示意图。
【具体实施方式】
[0018]目前对医学影像进行文字识别通常使用OCR (Optical Character Recognit1n,光学字符辨识)来实现。OCR主要采用了字形识别和模板识别这两种识别模式。对于字形识别,其基本原理是:由于图像上文字颜色和背景颜色往往有比较大的色差,通过采集图像上色差较大的点,即可勾勒出文字的边框,该边框上的点的集合即是该文字的特征,而特征点的提取实质上是一种矢量分析,所以在采集的特征点不会受字体大小变化的影响。当采集到足够的特征点,可以将其与预先设定或者预先采集的文字特征点进行匹配,并确定最为接近的特征值,从而可以得到图像对应的文字。对于模板识别,其设计初衷是考虑到在一个图像上,文字大小固定且文字的形状也不会变化,则可以进行模板匹配。模板匹配的基本原理是:预先采集含文字的图片,将含文字的图片进行二值化处理,二值化处理后即可得到对应的图像的数字信息,将这些数字信息保存为模板,然后在使用时,将采集的含文字的图片同样进行二值化处理,由于文字不会变化,所以可以将该采集的图片的数值信息与模板库中的数值信息进行匹配,得到对应的文字。
[0019]但是由于医学影像数字胶片本身既包括影像区域又包括文字区域,且部分影像区域和文字区域偶有重叠,因此在使用上述两种识别方法对医学影像数字胶片进行识别时,其识别效率和准确率均不够理想。
[0020]因此,本发明提出了一种医学影像中的文字信息识别方法及相应的装置。下面通过【具体实施方式】结合附图对本发明作进一步详细说明。
[0021]实施例一
如图1所示,为本实施例的医学影像中的文字信息识别方法的流程示意图,方法包括如下步骤110~140。
[0022]定位步骤110:接收操作者在医学影像上选取文字区域的输入,根据该输入确定待进行文字信息识别的文字区域。
[0023]在步骤110中,可以通过检测操作者在医学影像上选择的区域,然后将该检测到的区域作为待进行文字信息识别的文字区域,例如,给操作者提供框选工具如鼠标或触摸方式来进行区域的框选。又或者,通过提供示例输入文字来供操作者输入其观察到的医学影像的信息,结合该信息来确定待进行文字信息识别的文字区域,例如CT图像中右上角区域对应的信息是患者信息及操作信息,系统结合该信息以及操作者输入的相关信息自动确定该右上角区域为待进行文字信息识别的文字区域。
[0024]预处理步骤120:对步骤110得到的文字区域进行图像预处理操作以去除非文字信息,得到干净的文字图像。这里图像预处理操作包括对文字区域进行过滤、降噪、灰化和去除背景等,其具体算法可参考常用的数字图像处理的相关技术实现,在此不作赘述。从而,对于部分影像区域和文字区域偶有重叠的情况,通过这样的图像预处理操作去除该部分影像区域,得到比较干净的文字图像。
[0025]识别步骤130:对步骤120得到的文字图像进行切割以拆分出文字,得到单个的字符图像,对得到的单个字符图像进行识别,得到初识别文字。这里,对文字图像切割以拆分出文字的相关算法可以参考目前OCR识别中的相关技术实现,在此不作赘述。同时,对于拆分得到的单个字符图像,可以利用前述的OCR识别方法如字形识别和模板识别予以处理,得到初次识别出的文字,即初识别文字。
[0026]修正步骤140:对步骤130得到的初识别文字进行修正。
[0027]在步骤140中,修正包括去除非文字字符,例如如果初识别文字为冒号、空格等非字母或数字的文字字符,则去除该识别出的字符。修正还可以包括:结合由预设编码规则确定的待进行文字信息识别的文字范围,将初识别文字中与文字范围类似的字符修改为文字范围中对应的文字,这里预设编码规则包括医学影像对应的医院提供的包括挂号的编号规贝1J。例如医院提供的挂号编号规则为采用纯数字0-9,而如果某一初识别文字为字母I (或i)或L (或1),其与数字I类似,因此进行修正时将其修改为符合编号规则的数字I。当然这种修正规则也可以是预先设定在系统中的,一旦出现类似情况则自动从系统调用来进行修正。
[0028]验证步骤150:将修正后的识别文字根据预设
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1