一种文字图像浓淡调整的方法

文档序号：6438432阅读：359来源：国知局

专利名称：一种文字图像浓淡调整的方法
技术领域：
本发明涉及文字图像处理领域，具体涉及一种文字图像浓淡调整的方法。
背景技术：
在文字图像处理时，由于扫描条件的不同，扫描出的文档图像灰度分布也不同。对于实际的版面数字化生产中，不同的OCR (Optical Character Recognition,光学字符识别)引擎对于不同“浓淡”程度的文字图像准确率也不同。有些对于“淡”一些的文字识别率较高，有些对于“浓” 一些的文字识别率较高。当灰度图作为输出保存时，则需要将文字调整到人眼阅读舒适的程度。在图像处理领域已有很多的图像灰度调整技术，如直方图均衡等。但是这些通用的灰度调整技术并非专门针对文字扫描图像所设计的，也无法给出“浓淡”度量。而在生产中还在使用工人利用图像处理软件手工调整的方式，如灰阶、拉曲线等方式。由于每一页都需要调整，对于大规模的图书加工，效率低、成本高，无法满足要求。此外由于对于“浓淡”的判断主观性很强，不同人的认知可能不同，因此，需要利用图像处理技术设计一种自动调整的方法，。在现有技术中，申请号为CN201010568385.3、名称为“一种调整版面浓淡的方法与系统”的专利申请公开了一种调整版面浓淡的方法与系统。此篇专利中的调整方法利用的是二值图中的黑白像素比例，但是无法得到灰度图，其本质是调整二值图中文字比划的粗细。现有技术存在的问题是仅仅利用二值图黑白像素数量比例，只能输出二值图，反应了笔画的粗细，但无法反映文字灰度的深浅。

发明内容
针对现有技术中存在的缺陷，本发明的目的在于提供一种文字图像浓淡调整的方法，通过该方法实现对文字图像的自动处理方法，不仅能够反映笔画的粗细，还能够反映笔画灰度的深浅，同时保持文字边界处的灰阶变化。为实现上述目的，本发明采用的技术方案如下:一种文字图像浓淡调整的方法，包括以下步骤:(I)获得文字图像的灰度直方图以及文字图像的初始黑场值和初始白场值，并对文字图像进行二值化处理得到文字图像的二值图像；(2)将二值图像进行连通域标记，并计算每个连通域的最小外接矩形和细化骨架区域；(3)分别计算每个连通域的最小外接矩形区域内所有像素点的黑度和值，和每个连通域的细化骨架区域内所有像素点的黑度和值，并计算每个连通域的最小外接矩形内所有像素点的黑度和值与该连通域的细化骨架区域内所有像素点的黑度和值的比值，记为黑度和值比；其中，黑度和值为所有像素点的黑度值之和，黑度值Dark(x，y) = l_f(x，y)，f(x,y)表示像素点坐标为(x，y)的像素值归一化后的像素值；
(4)计算文字图像的浓淡值dense，浓淡值是指所有连通域的黑度和值比的和与连通域的个数的比值；(5)查看浓淡值dense与设定浓淡值的误差绝对值是否小于设定值，若是则结束对文字图像的调整；若否则调整文字图像的黑场值或/和白场值并返回步骤(2);所述设定浓淡值是用户根据实际文字图像调整需要而设定的文字图像的目标浓淡值。进一步，如上所述的一种文字图像浓淡调整的方法，步骤(5)中，若调整文字图像的黑场值或/和白场值后，若重新计算浓淡值dense的次数达到设定的计算次数的边界条件，则结束对文字图像的调整。进一步，如上所述的一种文字图像浓淡调整的方法，步骤(5)中，所述设定值的范围为 0.001 0.01。进一步，如上所述的一种文字图像浓淡调整的方法，所述设定值的优选值为
0.001。进一步，如上所述的一种文字图像浓淡调整的方法，在对文字图像的浓淡进行调整前，将文字图像的像素值归一化到
。进一步，如上所述的一种文字图像浓淡调整的方法，步骤(2)中，计算每个连通域的最小外接矩形后，还包括对所述连通域进行合并，合并的具体方式如下:确定文字语言种类，若是中文为主，则合并连通域最小外接矩形处于相交、包含位置关系的连通域；若是英文为主，则合并连通域最小外接矩形之间间隙小于设定值的相邻连通域。
`
进一步，如上所述的一种文字图像浓淡调整的方法，步骤(2)中，对连通域进行合并后，还包括对连通域的筛选，筛选的具体方式如下:确定文字语言种类，若是中文为主，则筛选M个合并后最小外接矩形为正方形的合并连通域；若是英文为主，则筛选N个合并后满足设定的字符长度的合并连通域，其中，10 ^ M ^ 40,10 ^ N ^ 40。再进一步，如上所述的一种文字图像浓淡调整的方法，所述设定的字符长度为4 12个字符长度。更进一步，如上所述的一种文字图像浓淡调整的方法，步骤(I)中，若文字图像的灰度直方图集中在中部，根据设定的分布概率对灰度直方图两端进行裁切。本发明的效果在于:本发明所述的方法，给出了一种图像浓淡值的计算方法，通过该浓淡值能够客观的描述图像“浓淡”，通过该方法，不仅能够体现文字图像中文字笔画的粗细，还能体现笔画灰度的深浅，通过计算的图像浓淡值与用户设定浓淡值的对比，确定图像最终的浓淡值，达到用户所需的文字图像的浓淡要求，得到不同视觉效果的灰度图。

图1为本发明一种文字图像浓淡调整方法的流程图；图2为实施方式中浓淡值调整的具体流程图；图3为实施例中调整前的文字图像的原始图像；图4为实施例中对原始图像进行二值化处理后的图像；图5为实施例中对二值图像进行初始连通域标记后的图像；
图6为实施例中对初始连通域进行连通域合并后的图像；图7为实施例中对合并后的连通域进行细化后的细化骨架区域图像；图8为实施例中对合并后的连通域进行筛选的结果图；图9为实施例中设定浓淡值为0.8时调整结果；图10为实施例中设定浓淡值为0.4的调整结果。
具体实施例方式为了便于对发明更好的理解，首先对本发明所涉及到的相关知识进行简单的介绍:RGB色彩模式是工业界的一种颜色标准，使用RGB模型为图像中每一个像素的RGB分量分配一个O 255范围内的强度值。每种RGB成分都可使用从O到255的值。当所有成分的值均为255时，结果是纯白色，当该值为O时，结果是纯黑色。黑场与白场最早是印刷行业的概念，黑场通常指图像中最暗的一部分像素，白场指图像中最亮的一部分像素。在图像处理时，通过调整黑场值或白场值，使图像中的其它色阶在O到255之间重新分布，增强图像的整体对比度。例如，将黑场值设置为5，将白场值设置为243，则图像中等于或低于5的所有像素都会映射到色阶0，等于或高于242的所有像素都会映射到色阶255，这种映射将会影响每个通道中最亮和最暗的像素，其它通道中的相应形式会按比例调整以避免改变色彩平衡。字符图像的二值图宽度反映了笔画的粗细，而在灰度图中骨架线的位置是笔画最黑的位置。通过调整黑场值和/或白场值进行灰度拉伸，黑色/白色必将从笔画的最中心开始向外扩张，最终整个字符变为全黑/全白。根据不同的黑场值、白场值对应不同的灰度图，得到不同的视觉效果。下面结合说明书附图与具体实施方式
对本发明做进一步的详细说明。图1示出了本发明一种文字图像浓淡调整方法的流程图，由图中可以看出该方法主要包括以下5个步骤:步骤Sll:获得文字图像的灰度直方图和二值图像；获得文字图像的灰度直方图以及文字图像的黑场值，并对文字图像进行二值化处理得到文字图像的二值图像。灰度直方图用于表示图象中具有每种灰度级的像素的个数，反映图象中每种灰度出现的频率。获得文字图像的直方图后，得到文字图像的最初黑场值。在对文字图像进行调整前，将文字图像的像素值归一化到
，使图像像素的处理转化成一种无量纲的处理，简化图像的处理过程。如果得到的文字图像的灰度直方图主要集中在中部，可以按照设定的分布概率对灰度直方图两端进行裁切，即把两端像素较少的归为O或255，使得灰度直方图更窄，更不能体现浓淡变化。裁切时切割线以是一端像素占总体像素一定比例的位置，比如1%。步骤S12:确定文字图像的连通域，并计算连通域的最小外接矩形区域和细化骨架区域；将二值图像进行连通域标记，并计算每个连通域的最小外接矩形和细化骨架区域。得到每个连通域的最小外接矩形后，对连通域进行合并与筛选，具体方式如下:首先确定文字语言种类，若是中文为主，则合并连通域最小外接矩形处于相交、包含位置关系的连通域，筛选M个合并后最小外接矩形为正方形的合并连通域；若是英文为主，则合并连通域最小外接矩形之间间隙小于设定值的相邻连通域，并筛选N个合并后满足设定的字符长度的合并连通域，其中，10 SMS 40，10 < NS 40。设定的字符长度由用户根据需要进行设定，一般为4 12个字符长度。步骤S13:计算连通域的最小外接矩形区域和细化骨架区域的黑度和值；分别计算每个连通域的最小外接矩形区域内所有像素点的黑度和值，和每个连通域的细化骨架区域内所有像素点的黑度和值，并计算每个连通域的最小外接矩形内所有像素点的黑度和值与该连通域的细化骨架区域内所有像素点的黑度和值的比值，记为黑度和值比；其中，黑度和值为所有像素点的黑度值之和，黑度值Dark(x，y) = 1-f (x, y), f (x, y)表示像素点坐标为(x，y)的像素值归一化后的像素值。步骤S14:得到文字图像的浓淡值dense ；计算文字图像的浓淡值，即所有连通域的黑度和值比的和与连通域的个数的比值，计算公式如下:
权利要求
1.一种文字图像浓淡调整的方法，包括以下步骤: (1)获得文字图像的灰度直方图以及文字图像的初始黑场值和初始白场值，并对文字图像进行二值化处理得到文字图像的二值图像； (2)将二值图像进行连通域标记，并计算每个连通域的最小外接矩形和细化骨架区域； (3)分别计算每个连通域的最小外接矩形区域内所有像素点的黑度和值，和每个连通域的细化骨架区域内所有像素点的黑度和值，并计算每个连通域的最小外接矩形内所有像素点的黑度和值与该连通域的细化骨架区域内所有像素点的黑度和值的比值，记为黑度和值比；其中，黑度和值为所有像素点的黑度值之和，黑度值Dark(x，y) = 1-f (x, y), f (x, y)表示像素点坐标为(x，y)的像素值归一化后的像素值； (4)计算文字图像的浓淡值dense，浓淡值是指所有连通域的黑度和值比的和与连通域的个数的比值； (5)查看浓淡值dense与设定浓淡值的误差绝对值是否小于设定值，若是则结束对文字图像的调整；若否则调整文字图像的黑场值或/和白场值并返回步骤(2);所述设定浓淡值是用户根据实际文字图像调整需要而设定的文字图像的目标浓淡值。
2.如权利要求1所述的一种文字图像浓淡调整方法，其特征在于:步骤(5)中，若调整文字图像的黑场值或/和白场值后，若重新计算浓淡值dense的次数达到设定的计算次数的边界条件，则结束对文字图像的调整。
3.如权利要求1或2所述的一种文字图像浓淡调整方法，其特征在于:步骤(5)中，所述设定值的范围为0.0Ol 0.01。
4.如权利要求3所述的一种文字图像浓淡调整方法，其特征在于:所述设定值的优选值为0.001。
5.如权利要求1或2所述的一种文字图像浓淡调整的方法，其特征在于:在对文字图像的浓淡进行调整前，将文字图像的像素值归一化到
。
6.如权利要求1或2所述的一种文字图像浓淡调整方法，其特征在于:步骤(2)中，计算每个连通域的最小外接矩形后，还包括对所述连通域进行合并，合并的具体方式如下: 确定文字语言种类，若是中文为主，则合并连通域最小外接矩形处于相交、包含位置关系的连通域；若是英文为主，则合并连通域最小外接矩形之间间隙小于设定值的相邻连通域。
7.如权利要求6所述的一种文字图像浓淡调整方法，其特征在于:步骤(2)中，对连通域进行合并后，还包括对连通域的筛选，筛选的具体方式如下: 确定文字语言种类，若是中文为主，则筛选M个合并后最小外接矩形为正方形的合并连通域；若是英文为主，则筛选N个合并后满足设定的字符长度的合并连通域，其中，10 ^ M ^ 40,10 ^ N ^ 40。
8.如权利要求7所述的一种文字图像浓淡调整方法，其特征在于:所述设定的字符长度为4 12个字符长度。
9.如权利要求1所述的一种文字图像浓淡调整的方法，其特征在于:步骤(I)中，若文字图像的灰度直方图集中在中部，根据设定的分布概率对灰度直方图两端进行裁切。
全文摘要
本发明公开了一种文字图像浓淡调整的方法，涉及文字图像处理领域。该方法通过对二值图像进行连通域的标记，根据连通域的最小外接矩形区域和细化骨架区域内的像素值进行相应的计算，给出了图像“浓淡”的度量浓淡值dense。该方法首先计算文字图像的浓淡值dense，并将该计算所得浓淡值dense与用户的设定浓淡值相比较，通过对文字图像的黑场值和/或白场值进行调整，最终使计算所得浓淡值dense达到用户所设定的浓淡要求，完成对文字图像浓淡的调整。通过该方法对文字图像进行调整，不仅能够体现字符的笔画粗细，还能够体现笔画粗细的深浅，得到不同视觉效果的灰度图，为图像的自动处理提供参考标准，有利于提高效率降低成本。
文档编号G06T11/00GK103106673SQ20111036181
公开日2013年5月15日申请日期2011年11月15日优先权日2011年11月15日
发明者胡希驰, 李平立, 史培培申请人:北京大学, 方正国际软件(北京)有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡希驰;李平立;史培培;
技术所有人：北京大学; 方正国际软件（北京）有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。