自适应文本图像的分割方法

文档序号:8544348阅读:366来源:国知局
自适应文本图像的分割方法
【技术领域】
[0001] 本发明设及图像处理技术,特别是设及一种自适应文本图像的分割方法。
【背景技术】
[0002] 图像增强是指增强图像中的有用信息,从而改善图像的视觉效果。在相似性度量 中,常用的有欧氏距离计算、均方误差评价、相关系数法和频谱分析等方法。相似性度量对 于聚类、分类等常用机器学习算法都有很重要的意义。
[0003] 图像分割在目标检测中有重要应用。常用的分割算法在系统的处理过程中不能进 行人工调节阔值。并且图像分割算法需要设置参数,并根据不同的图像设置不同的参数,才 能得到比较好的结果。但对于数据系统而言,在成千上万的文本图片,不可能针对不同的图 像设置不同的参数。

【发明内容】

[0004] 本发明提供的自适应文本图像的分割方法,可W有效地提高二值分割的准确性。
[0005] 根据本发明的一方面,提供一种自适应文本图像的分割方法,包括;通过己氏距离 滤波器的第一滤波窗宽对图像的灰度矩阵进行滤波得到己氏距离矩阵;将所述己氏距离矩 阵通过最大滴分割算法进行二值分割得到第一二值矩阵;所述第一二值矩阵通过邻域信息 进行纠错得到第二二值矩阵;所述第二二值矩阵通过游程直方图进行统计得到字符宽度; 根据所述字符宽度确定第二滤波窗宽;如果所述第二滤波窗宽与所述第一滤波窗宽相同, 则所述第二二值矩阵作为系统的输出结果。
[0006] 本发明实施例提供的自适应文本图像的分割方法,通过己氏距离滤波器的第一滤 波窗宽对图像的灰度矩阵进行滤波得到己氏距离矩阵,将己氏距离矩阵通过最大滴分割算 法进行二值分割得到第一二值矩阵,第一二值矩阵通过邻域信息进行纠错得到第二二值矩 阵,第二二值矩阵通过游程直方图进行统计得到字符宽度,根据字符宽度确定第二滤波窗 宽,如果第二滤波窗宽与第一滤波窗宽相同,则第二二值矩阵作为系统的输出结果,从而可 W有效地提高二值分割的准确性。
【附图说明】
[0007] 图1为本发明实施例提供的自适应文本图像的分割方法流程图;
[000引图2为本发明实施例提供的另一自适应文本图像的分割方法流程图。
【具体实施方式】
[0009] 下面结合附图对本发明实施例提供的自适应文本图像的分割方法进行详细描述。
[0010] 图1为本发明实施例提供的自适应文本图像的分割方法流程图。
[0011] 参照图1,在步骤S101,通过己氏距离滤波器的第一滤波窗宽对图像的灰度矩阵 进行滤波得到己氏距离矩阵。
[0012] 在步骤S102,将所述己氏距离矩阵通过最大滴分割算法进行二值分割得到第一二 值矩阵。
[0013] 在步骤S103,所述第一二值矩阵通过邻域信息进行纠错得到第二二值矩阵。
[0014] 在步骤S104,所述第二二值矩阵通过游程直方图进行统计得到字符宽度。
[0015] 在步骤S105,根据所述字符宽度确定第二滤波窗宽。
[0016] 在步骤S106,如果所述第二滤波窗宽与所述第一滤波窗宽相同,则所述第二二值 矩阵作为系统的输出结果。
[0017] 该里,通过所述扫描宽度直方图对所述第二二值矩阵在0°、45°、90°和135° 四个方向下分别进行统计得到四个方向的结果,将该四个方向的结果进行加和得到一个最 终的统计结果,选取统计结果中选取出现比例最高的字符宽度作为系统认定的字符宽度。
[0018] 进一步地,所述方法还包括:
[0019] 如果所述第二滤波窗宽与所述第一滤波窗宽不相同,则己氏距离滤波器的第二滤 波窗宽对图像的灰度矩阵进行滤波。
[0020] 进一步地,所述通过己氏距离滤波器的第一滤波窗宽对图像的灰度矩阵进行滤波 得到己氏距离矩阵包括:
[0021] 遍历所述图像的灰度矩阵的每个像素点;
[0022] 所述每个像素点通过常数模板、高斯核利用所述己氏距离滤波器得到所述每个像 素点的己氏距离;
[0023] 所述每个像素点的己氏距离构成己氏距离矩阵。
[0024] 该里,己氏距离矩阵由公式(1)可知:
[0025]
【主权项】
1. 一种自适应文本图像的分割方法,其特征在于,所述方法包括: 通过巴氏距离滤波器的第一滤波窗宽对图像的灰度矩阵进行滤波得到巴氏距离矩 阵; 将所述巴氏距离矩阵通过最大熵分割算法进行二值分割得到第一二值矩阵; 所述第一二值矩阵通过邻域信息进行纠错得到第二二值矩阵; 所述第二二值矩阵通过游程直方图进行统计得到字符宽度; 根据所述字符宽度确定第二滤波窗宽; 如果所述第二滤波窗宽与所述第一滤波窗宽相同,则所述第二二值矩阵作为系统的输 出结果。
2. 根据权利要求1所述的方法,其特征在于,所述方法还包括: 如果所述第二滤波窗宽与所述第一滤波窗宽不相同,则巴氏距离滤波器的第二滤波窗 宽对图像的灰度矩阵进行滤波。
3. 根据权利要求1所述的方法,其特征在于,所述通过巴氏距离滤波器的第一滤波窗 宽对图像的灰度矩阵进行滤波得到巴氏距离矩阵包括: 遍历所述图像的灰度矩阵的每个像素点; 所述每个像素点通过常数模板、高斯核利用所述巴氏距离滤波器得到所述每个像素点 的巴氏距离; 所述每个像素点的巴氏距离构成巴氏距离矩阵。
4. 根据权利要求1所述的方法,其特征在于,所述将所述巴氏距离矩阵通过最大熵分 割算法进行二值分割得到第一二值矩阵包括: 通过所述巴氏距离矩阵选取多个备选阈值点; 通过最大熵分割方法分别对所述多个备选阈值点进行评价得到多个评价值; 从所述多个评价值中选取最大的评价值; 将所述最大的评价值对应的备选阈值点作为输出的阈值。
5. 根据权利要求4的方法,其特征在于,所述通过所述巴氏距离矩阵选取多个备选阈 值点包括: 获取所述巴氏距离矩阵中的最大值和最小值; 通过搜索精度对所述最大值和所述最小值之间的值进行等分得到多个备选阈值点。
6. 根据权利要求4所述的方法,其特征在于,所述通过最大熵分割方法分别对所述多 个备选阈值点进行评价得到多个评价值包括,重复执行以下处理,直至所述多个备选阈值 点全部都被评价: 根据所述备选阈值点的阈值将元素分为第一类和第二类; 分别统计所述第一类的概率分布直方图和所述第二类的概率分布直方图得到第一类 直方图熵和第二类直方图熵; 将所述第一类直方图熵和所述第二类直方图熵进行运算得到所述评价值。
7. 根据权利要求1所述的方法,其特征在于,所述分别统计所述第一类的概率分布直 方图和所述第二类的概率分布直方图得到第一类直方图熵和第二类直方图熵包括: 根据下式计算所述第一类直方图熵和第二类直方图熵:
其中,H(p| Qi)为所述第一类直方图熵或所述第二类直方图熵,p(x| Oi)为所述第一 类巴氏系数的概率分布直方图或所述第二类的概率分布直方图。
8. 根据权利要求4所述的方法,其特征在于,所述从所述多个评价值中选取最大的评 价值包括: 根据下式计算所述最大的评价值: k = arg max {//(/? | ω\) + Π(ρ \ ω2)) 其中,所述最大的评价值,Η(ρ| ω?)为所述第一类巴氏系数分布的熵,Η(ρ| ω2) 为所述第二类巴氏系数分布的熵。
9. 根据权利要求1所述的方法,其特征在于,所述第一二值矩阵通过邻域信息进行纠 错得到第二二值矩阵包括: 根据所述字符宽度确定像素点的邻域边长、第一纠错阈值和第二纠错阈值; 如果第一像素点的周围的像素点的字符点个数大于所述第一阈值,则将所述第一像素 点纠正为所述字符点; 如果所述第一像素点的周围的像素点的字符点个数小于所述第二阈值,则将所述第一 像素点纠正为所述背景点。
10. 根据权利要求1所述的方法,其特征在于,所述根据所述字符宽度确定第二滤波窗 宽包括: 根据下式计算所述第二滤波窗宽: W1= 2*L0-1 其中,W1S所述第二滤波窗宽,L ^为所述字符宽度。
【专利摘要】本发明提供的自适应文本图像的分割方法,包括:通过巴氏距离滤波器的第一滤波窗宽对图像的灰度矩阵进行滤波得到巴氏距离矩阵;将所述巴氏距离矩阵通过最大熵分割算法进行二值分割得到第一二值矩阵;所述第一二值矩阵通过邻域信息进行纠错得到第二二值矩阵;所述第二二值矩阵通过游程直方图进行统计得到字符宽度;根据所述字符宽度确定第二滤波窗宽;如果所述第二滤波窗宽与所述第一滤波窗宽相同,则所述第二二值矩阵作为系统的输出结果。本发明可以有效地提高二值分割的准确性。
【IPC分类】G06T7-00
【公开号】CN104867152
【申请号】CN201510275544
【发明人】陈李江, 刘宁
【申请人】北京云江科技有限公司
【公开日】2015年8月26日
【申请日】2015年5月26日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1