用于医学图像中文本区域检测的方法及装置与流程

文档序号：12367148阅读：249来源：国知局

本发明涉及医学图像检测技术领域，具体涉及一种用于医学图像中文本区域检测的方法及装置。

背景技术：

医学影像图像是由一定数目由黑到白不同灰度的像素按矩阵排列所构成的图像。它反映了器官和组织在特定影像设备上的成像情况，可以很好的显示由软组织构成的器官，如脑、脊髓、纵膈、肺、肝、胆、胰以及盆部器官等，并在良好的解剖图像背景上显示出病变的影像，因此医学影像在医学诊断上具有非常重要的应用价值。原始的医学影像除了图像本身外，还会将患者信息等附加数据按照一定标准(如DICOM)以元数据形式保存。这些数据与图像是分别保存的。

经分析的医疗影像经过转换打印输出用于诊断与保存。与原始影像不同，这类用于输出的医学图像上除了器官的层面图像外，还会将附加信息以文字图样形式直接叠加到医学影像上。这些文字往往包含了患者姓名、检测时间以及检测指标等信息，为我们准确解读医学图像提供了重要的价值，因此检测这些医学图像中文字所在的位置，将其提取出来有着重要的意义。现有技术一般使用MSER、SWT等方法进行医学图像中文本区域检测，但是此种方法是依据纹理特征进行检测的，不容易将图像中字符纹理与其它纹理进行区分，造成检测精度较低。

技术实现要素：

针对现有技术存在的不足和缺陷，本发明提供一种用于医学图像中文本区域检测的方法及装置。

一方面，本发明实施例提出一种用于医学图像中文本区域检测的方法，包括：

S1、获取待检测的医学图像；

S2、对所述医学图像进行检测，得到一系列的连通区域，并且基于单样例图像得到所述医学图像中文本区域的二值模板；

S3、利用所述二值模板滤除掉所述连通区域中的非文本区域得到文本候选区域，并基于字符特征进一步滤除所述文本候选区域中的非文本区域；

S4、将得到的文本区域进行聚合，得到文本行。

另一方面，本发明实施例提出一种用于医学图像中文本区域检测的装置，包括：

获取单元，用于获取待检测的医学图像；

计算单元，用于对所述医学图像进行检测，得到一系列的连通区域，并且基于单样例图像得到所述医学图像中文本区域的二值模板；

滤除单元，用于利用所述二值模板滤除掉所述连通区域中的非文本区域得到文本候选区域，并基于字符特征进一步滤除所述文本候选区域中的非文本区域；

聚合单元，用于将得到的文本区域进行聚合，得到文本行。

本发明实施例提供的用于医学图像中文本区域检测的方法及装置，利用待检测的医学图像中文本区域的二值模板滤除掉连通区域中的非文本区域得到文本候选区域，基于字符特征进一步滤除所述文本候选区域中的非文本区域，并将得到的文本区域进行聚合，得到文本行，相较于现有技术，本发明实施例不需要区分纹理特征，能够提高文本区域的检测精度。

附图说明

图1为本发明用于医学图像中文本区域检测的方法一实施例的流程示意图；

图2为本发明用于医学图像中文本区域检测的装置一实施例的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参看图1，本实施例公开一种用于医学图像中文本区域检测的方法，包括：

S1、获取待检测的医学图像；

S2、对所述医学图像进行检测，得到一系列的连通区域，并且基于单样例图像得到所述医学图像中文本区域的二值模板；

需要说明的是，对所述医学图像进行检测可以采用MSER算法，此处不再赘述。

单样例图像是指包含文本对象的医学图像，能够充分体现医学图像中的文本特征。在具体应用中，所述基于单样例图像得到所述医学图像中文本区域的二值模板，可以包括：

计算所述单样例图像R的局部自适应回归核K_R，并且对于每一个连通区域T，计算该连通区域T的局部自适应回归核K_T；

对所述K_R进行归一化处理得到权值向量矩阵W_R，对所述K_T进行归一化处理得到权值向量矩阵W_T；

对所述W_R采用PCA算法(主成份分析法)进行处理，得到主成分，并保留所述主成分的前d项构成矩阵P_R，将所述W_R向所述P_R进行投影，得到所述单样例图像R的特征向量F_R，将所述W_T向所述P_R进行投影，得到所述连通区域T的特征向量F_T；

其中，所述d为整数，具体可以根据需要进行取值，比如可以取值4、5、6等，本发明实施例对此不作限定。将所述W_R向所述P_R进行投影的函数表达式为将所述W_T向所述P_R进行投影的函数表达式为

计算所述特征向量F_R与F_T之间的相似度，判断所述相似性度量是否大于第一数值，若大于所述第一数值，则将对应的连通区域的像素值置为1，得到文本区域，否则，则将对应的连通区域的像素值置为0，得到背景区域，将所述文本区域和背景区域作为所述二值模板。

在具体应用中，需要说明的是，计算相似度可以采用余弦相似度度量进行计算，此处不再赘述。按照医学图像中文本字体的不同第一数值可以有不同的取值，比如若医学图像中文本为宋体，则第一数值可以为70％，当然也可以根据需要进行左右调整，本实施例对此不作限定。

另外，可以理解的是，本实施例计算二值模板的过程其实质是计算单样例图像的特征向量和每一个连通区域之间的相似度，根据相似度的大小建立对应的连通区域大小的全黑或者全白的二值模板。

S3、利用所述二值模板滤除掉所述连通区域中的非文本区域得到文本候选区域，并基于字符特征进一步滤除所述文本候选区域中的非文本区域；

本实施例中，利用所述二值模板滤除掉所述连通区域中的非文本区域得到文本候选区域，具体是说将连通区域中的背景区域的像素值置为0，得到文本候选区域，其处理过程相应的数学表达式为I_can＝I_mask∩I_MSER，其中，I_can为文本候选区域，I_mask为二值模板，I_MSER为连通区域。

具体地，所述基于字符特征进一步滤除所述文本候选区域中的非文本区域，可以包括：

对于每一个文本候选区域，计算该文本候选区域的笔划宽度特征SW，并保留笔划宽度特征SW小于第二数值的文本候选区域，其中，所述笔划宽度特征SW的计算公式为

$<mrow> <mi>S</mi> <mi>W</mi> <mo>=</mo> <mfrac> <mrow> <mi>s</mi> <mi>t</mi> <mi>d</mi> </mrow> <mi>E</mi> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>$

式中，std和E分别是该文本候选区域的笔划宽度标准差和平均值；

一般情况下，因单个字符的笔划宽度大致保持一致，使得文本候选区域的笔划宽度标准差和平均值的比值较小，借助于这一特点可以将部分非文本区域滤除。需要说明的是，第二数值的取值与字符的笔画宽度有关，字符的笔画宽度越大，则该值取值相应增大，一般情况下取值可以为0.5-1,5。

计算得到的文本候选区域的非零像素的个数，滤除非零像素的个数大于第三数值和小于第四数值的文本候选区域；

在具体应用中，第三数值和第四数值的取值与文本候选区域的像素数目有关，一般情况下取值分别可以为文本候选区域的像素数目的0.9倍和0.5倍。

计算得到的文本候选区域的非零像素的个数与对应的文本候选区域的区域面积的比值，滤除比值大于第五数值和小于第六数值的文本候选区域；

在具体应用中，第五数值和第六数值的取值一般情况下可以分别为70％和10％。

计算得到的文本候选区域的的长宽比，滤除掉长宽比大于第七数值和小于第八数值的文本候选区域；

在具体应用中，第七数值和第八数值的取值一般情况下可以分别为1.2和0.5。

对于得到的每一个文本候选区域，利用投影法或者连通区域法对该文本候选区域进行切分，得到多个小块，并确定每一个小块是否是字符，计算是字符的小块所占的比值，滤除比值小于第九数值的文本候选区域。

需要说明的是，确定每一个小块是否是字符可以使用现有技术，此处不再赘述。第九数值一般情况可取值为2/3。

S4、将得到的文本区域进行聚合，得到文本行。

在具体应用中，所述S4，可以包括：

对于得到的文本区域中每一个未被聚合的文本区域A，选取其它未被聚合的文本区域中的一个未被聚合的文本区域B，判断该两个文本区域A和B是否能够聚合，若能够聚合，则将该两个文本区域A和B进行聚合，得到文本区域C，再从其它未被聚合的文本区域中选取一个未被聚合的文本区域D，判断所述文本区域C和D是否能够聚合，若能够聚合，则将该两个文本区域C和D进行聚合，重复上述选取文本区域、判断是否能够聚合以及聚合的步骤直至未被聚合的文本区域选取完毕。

需要说明的是，对得到的文本区域进行聚合的聚合的过程，其实质是将医学图像上在一块的文本聚合在一起。当然，因为医学图像上在一块的文本其实是有一定的距离关系的，比如对于前后相邻的文本，前边文本区域的最右边的像素的横坐标与后边文本区域的最左边的像素的横坐标的差值的绝对值是不大于1个像素的大小的，而前边文本区域与后边文本区域之间的垂直距离是不大于0.5个像素的大小的，再比如，对于上下相邻的文本，上边文本区域与下边文本区域之间的垂直距离是不大于1个像素的大小的，上边文本区域的最左边的像素的横坐标与下边文本区域的最左边的像素的横坐标的差值的绝对值是不大于0.5个像素的大小的。据此，可以构建两个文本区域是否能够聚合的判断过程，以文本区域A和B为例，判断过程如下：

S40、计算该两个文本区域A和B之间的垂直距离，判断所述垂直距离是否小于第十数值，若小于所述第十数值，则执行步骤S41，否则，执行步骤S42；

S41、计算所述两个文本区域A和B中像素的横坐标较大的文本区域包含的像素的最小横坐标与所述两个文本区域A和B中像素的横坐标较小的文本区域包含的像素的最大横坐标的差值的绝对值，判断所述绝对值是否小于第十一数值，若小于所述第十一数值，则将所述像素的横坐标较大的文本区域聚合在所述像素的横坐标较小的文本区域后面；

S42、判断所述垂直距离是否小于第十一数值，若小于所述第十一数值，则计算所述两个文本区域A和B中一个文本区域包含的像素的最小横坐标与另一个文本区域包含的像素的最小横坐标的差值的绝对值，判断所述绝对值是否小于第十数值，若小于所述第十数值，则将所述两个文本区域A和B中像素的纵坐标较小的文本区域聚合在所述两个文本区域中像素的纵坐标较大的文本区域下面。

此外，需要说明的是，本发明实施例中所涉及的坐标所在的坐标系的横轴是沿与字符的排布方向平行的。另外，需要说明的是，对于第十数值和第十一数值的取值，可以根据医学图像中文字的排版确定，对于一般的医学图像，第十数值可以取值为1个像素的大小，第十一数值可以取值为0.5个像素的大小。

本发明实施例提供的用于医学图像中文本区域检测的方法，利用待检测的医学图像中文本区域的二值模板滤除掉连通区域中的非文本区域得到文本候选区域，基于字符特征进一步滤除所述文本候选区域中的非文本区域，并将得到的文本区域进行聚合，得到文本行，相较于现有技术，本发明实施例不需要区分纹理特征，能够提高文本区域的检测精度。

参看图2，本实施例公开一种用于医学图像中文本区域检测的装置，包括：

获取单元1，用于获取待检测的医学图像；

计算单元2，用于对所述医学图像进行检测，得到一系列的连通区域，并且基于单样例图像得到所述医学图像中文本区域的二值模板；

需要说明的是，对所述医学图像进行检测可以采用MSER算法，此处不再赘述。

在具体应用中，所述计算单元，可以用于：

计算所述单样例图像R的局部自适应回归核K_R，并且对于每一个连通区域T，计算该连通区域T的局部自适应回归核K_T；

对所述K_R进行归一化处理得到权值向量矩阵W_R，对所述K_T进行归一化处理得到权值向量矩阵W_T；

对所述W_R采用PCA算法进行处理，得到主成分，并保留所述主成分的前d项构成矩阵P_R，将所述W_R向所述P_R进行投影，得到所述单样例图像R的特征向量F_R，将所述W_T向所述P_R进行投影，得到所述连通区域T的特征向量F_T，其中，所述d为整数；

需要说明的是，计算相似度可以采用余弦相似度度量进行计算，此处不再赘述。

滤除单元3，用于利用所述二值模板滤除掉所述连通区域中的非文本区域得到文本候选区域，并基于字符特征进一步滤除所述文本候选区域中的非文本区域；

在实际应用中，所述滤除单元，具体可以用于：

式中，std和E分别是该文本候选区域的笔划宽度标准差和平均值；

计算得到的文本候选区域的非零像素的个数，滤除非零像素的个数大于第三数值和小于第四数值的文本候选区域；

计算得到的文本候选区域的非零像素的个数与对应的文本候选区域的区域面积的比值，滤除比值大于第五数值和小于第六数值的文本候选区域；

计算得到的文本候选区域的的长宽比，滤除掉长宽比大于第七数值和小于第八数值的文本候选区域；

聚合单元4，用于将得到的文本区域进行聚合，得到文本行。

本实施例中，所述聚合单元，具体可以用于对于得到的文本区域中每一个未被聚合的文本区域A，选取其它未被聚合的文本区域中的一个未被聚合的文本区域B，判断该两个文本区域A和B是否能够聚合，若能够聚合，则将该两个文本区域A和B进行聚合，得到文本区域C，再从其它未被聚合的文本区域中选取一个未被聚合的文本区域D，判断所述文本区域C和D是否能够聚合，若能够聚合，则将该两个文本区域C和D进行聚合，重复上述选取文本区域、判断是否能够聚合以及聚合的步骤直至未被聚合的文本区域选取完毕。

在具体应用中，所述聚合单元，具体可以用于：

计算该两个文本区域A和B之间的垂直距离，判断所述垂直距离是否小于第十数值，若小于所述第十数值，则计算所述两个文本区域A和B中像素的横坐标较大的文本区域包含的像素的最小横坐标与所述两个文本区域A和B中像素的横坐标较小的文本区域包含的像素的最大横坐标的差值的绝对值，判断所述绝对值是否小于第十一数值，若小于所述第十一数值，则将所述像素的横坐标较大的文本区域聚合在所述像素的横坐标较小的文本区域后面；或者

若不小于所述第十数值，则判断所述垂直距离是否小于第十一数值，若小于所述第十一数值，则计算所述两个文本区域A和B中一个文本区域包含的像素的最小横坐标与另一个文本区域包含的像素的最小横坐标的差值的绝对值，判断所述绝对值是否小于第十数值，若小于所述第十数值，则将所述两个文本区域A和B中像素的纵坐标较小的文本区域聚合在所述两个文本区域中像素的纵坐标较大的文本区域下面。

本发明实施例提供的用于医学图像中文本区域检测的装置，利用待检测的医学图像中文本区域的二值模板滤除掉连通区域中的非文本区域得到文本候选区域，基于字符特征进一步滤除所述文本候选区域中的非文本区域，并将得到的文本区域进行聚合，得到文本行，相较于现有技术，本发明实施例不需要区分纹理特征，能够提高文本区域的检测精度。

本实施例的用于医学图像中文本区域检测的装置，可以用于执行前述图1所示方法实施例的技术方案，其实现原理和技术效果类似，此处不再赘述。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

本发明的说明书中，说明了大量具体细节。然而能够理解的是，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。类似地，应当理解，为了精简本发明公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释呈反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。本发明并不局限于任何单一的方面，也不局限于任何单一的实施例，也不局限于这些方面和/或实施例的任意组合和/或置换。而且，可以单独使用本发明的每个方面和/或实施例或者与一个或更多其他方面和/或其实施例结合使用。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围，其均应涵盖在本发明的权利要求和说明书的范围当中。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘立;杜一帆;
技术所有人：北京好运到信息科技有限公司;
我是此专利的发明人

上一篇：一种虚拟屏幕墙的生成方法及终端与流程
上一篇：一种塑料管切割口打磨装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。