用于医学图像中文本区域检测的方法及装置与流程

文档序号：12367148阅读：来源：国知局

技术特征：

1.一种用于医学图像中文本区域检测的方法，其特征在于，包括：

S1、获取待检测的医学图像；

S2、对所述医学图像进行检测，得到一系列的连通区域，并且基于单样例图像得到所述医学图像中文本区域的二值模板；

S3、利用所述二值模板滤除掉所述连通区域中的非文本区域得到文本候选区域，并基于字符特征进一步滤除所述文本候选区域中的非文本区域；

S4、将得到的文本区域进行聚合，得到文本行。

2.根据权利要求1所述的方法，其特征在于，所述基于单样例图像得到所述医学图像中文本区域的二值模板，包括：

计算所述单样例图像_R的局部自适应回归核K_R，并且对于每一个连通区域T，计算该连通区域T的局部自适应回归核K_T；

对所述K_R进行归一化处理得到权值向量矩阵W_R，对所述K_T进行归一化处理得到权值向量矩阵W_T；

对所述W_R采用PCA算法进行处理，得到主成分，并保留所述主成分的前d项构成矩阵P_R，将所述W_R向所述P_R进行投影，得到所述单样例图像R的特征向量F_R，将所述W_T向所述P_R进行投影，得到所述连通区域T的特征向量F_T，其中，所述d为整数；

计算所述特征向量F_R与F_T之间的相似度，判断所述相似性度量是否大于第一数值，若大于所述第一数值，则将对应的连通区域的像素值置为1，得到文本区域，否则，则将对应的连通区域的像素值置为0，得到背景区域，将所述文本区域和背景区域作为所述二值模板。

3.根据权利要求1或2所述的方法，其特征在于，所述基于字符特征进一步滤除所述文本候选区域中的非文本区域，包括：

对于每一个文本候选区域，计算该文本候选区域的笔划宽度特征SW，并保留笔划宽度特征SW小于第二数值的文本候选区域，其中，所述笔划宽度特征SW的计算公式为

$<mrow> <mi>S</mi> <mi>W</mi> <mo>=</mo> <mfrac> <mrow> <mi>s</mi> <mi>t</mi> <mi>d</mi> </mrow> <mi>E</mi> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>$

式中，std和E分别是该文本候选区域的笔划宽度标准差和平均值；

计算得到的文本候选区域的非零像素的个数，滤除非零像素的个数大于第三数值和小于第四数值的文本候选区域；

计算得到的文本候选区域的非零像素的个数与对应的文本候选区域的区域面积的比值，滤除比值大于第五数值和小于第六数值的文本候选区域；

计算得到的文本候选区域的的长宽比，滤除掉长宽比大于第七数值和小于第八数值的文本候选区域；

对于得到的每一个文本候选区域，利用投影法或者连通区域法对该文本候选区域进行切分，得到多个小块，并确定每一个小块是否是字符，计算是字符的小块所占的比值，滤除比值小于第九数值的文本候选区域。

4.根据权利要求1所述的方法，其特征在于，所述S4，包括：

对于得到的文本区域中每一个未被聚合的文本区域A，选取其它未被聚合的文本区域中的一个未被聚合的文本区域B，判断该两个文本区域A和B是否能够聚合，若能够聚合，则将该两个文本区域A和B进行聚合，得到文本区域C，再从其它未被聚合的文本区域中选取一个未被聚合的文本区域D，判断所述文本区域C和D是否能够聚合，若能够聚合，则将该两个文本区域C和D进行聚合，重复上述选取文本区域、判断是否能够聚合以及聚合的步骤直至未被聚合的文本区域选取完毕。

5.根据权利要求4所述的方法，其特征在于，所述判断该两个文本区域A和B是否能够聚合，包括：

S40、计算该两个文本区域A和B之间的垂直距离，判断所述垂直距离是否小于第十数值，若小于所述第十数值，则执行步骤S41，否则，执行步骤S42；

S41、计算所述两个文本区域A和B中像素的横坐标较大的文本区域包含的像素的最小横坐标与所述两个文本区域A和B中像素的横坐标较小的文本区域包含的像素的最大横坐标的差值的绝对值，判断所述绝对值是否小于第十一数值，若小于所述第十一数值，则将所述像素的横坐标较大的文本区域聚合在所述像素的横坐标较小的文本区域后面；

S42、判断所述垂直距离是否小于第十一数值，若小于所述第十一数值，则计算所述两个文本区域A和B中一个文本区域包含的像素的最小横坐标与另一个文本区域包含的像素的最小横坐标的差值的绝对值，判断所述绝对值是否小于第十数值，若小于所述第十数值，则将所述两个文本区域A和B中像素的纵坐标较小的文本区域聚合在所述两个文本区域中像素的纵坐标较大的文本区域下面。

6.一种用于医学图像中文本区域检测的装置，其特征在于，包括：

获取单元，用于获取待检测的医学图像；

计算单元，用于对所述医学图像进行检测，得到一系列的连通区域，并且基于单样例图像得到所述医学图像中文本区域的二值模板；

滤除单元，用于利用所述二值模板滤除掉所述连通区域中的非文本区域得到文本候选区域，并基于字符特征进一步滤除所述文本候选区域中的非文本区域；

聚合单元，用于将得到的文本区域进行聚合，得到文本行。

7.根据权利要求6所述的装置，其特征在于，所述计算单元，具体用于：

计算所述单样例图像R的局部自适应回归核K_R，并且对于每一个连通区域T，计算该连通区域T的局部自适应回归核K_T；

对所述K_R进行归一化处理得到权值向量矩阵W_R，对所述K_T进行归一化处理得到权值向量矩阵W_T；

8.根据权利要求6或7所述的装置，其特征在于，所述滤除单元，具体用于：

式中，std和E分别是该文本候选区域的笔划宽度标准差和平均值；

计算得到的文本候选区域的非零像素的个数，滤除非零像素的个数大于第三数值和小于第四数值的文本候选区域；

计算得到的文本候选区域的非零像素的个数与对应的文本候选区域的区域面积的比值，滤除比值大于第五数值和小于第六数值的文本候选区域；

计算得到的文本候选区域的的长宽比，滤除掉长宽比大于第七数值和小于第八数值的文本候选区域；

9.根据权利要求6所述的装置，其特征在于，所述聚合单元，具体用于对于得到的文本区域中每一个未被聚合的文本区域A，选取其它未被聚合的文本区域中的一个未被聚合的文本区域B，判断该两个文本区域A和B是否能够聚合，若能够聚合，则将该两个文本区域A和B进行聚合，得到文本区域C，再从其它未被聚合的文本区域中选取一个未被聚合的文本区域D，判断所述文本区域C和D是否能够聚合，若能够聚合，则将该两个文本区域C和D进行聚合，重复上述选取文本区域、判断是否能够聚合以及聚合的步骤直至未被聚合的文本区域选取完毕。

10.根据权利要求9所述的装置，其特征在于，所述聚合单元，具体用于：

计算该两个文本区域A和B之间的垂直距离，判断所述垂直距离是否小于第十数值，若小于所述第十数值，则计算所述两个文本区域A和B中像素的横坐标较大的文本区域包含的像素的最小横坐标与所述两个文本区域A和B中像素的横坐标较小的文本区域包含的像素的最大横坐标的差值的绝对值，判断所述绝对值是否小于第十一数值，若小于所述第十一数值，则将所述像素的横坐标较大的文本区域聚合在所述像素的横坐标较小的文本区域后面；或者

若不小于所述第十数值，则判断所述垂直距离是否小于第十一数值，若小于所述第十一数值，则计算所述两个文本区域A和B中一个文本区域包含的像素的最小横坐标与另一个文本区域包含的像素的最小横坐标的差值的绝对值，判断所述绝对值是否小于第十数值，若小于所述第十数值，则将所述两个文本区域A和B中像素的纵坐标较小的文本区域聚合在所述两个文本区域中像素的纵坐标较大的文本区域下面。

完整全部详细技术资料下载

当前第2页1 2 3