一种基于颜色解混的文字图章分离技术的制作方法

文档序号：18034426发布日期：2019-06-28 23:06阅读：1295来源：国知局

本发明涉及基于颜色解混的文字图章分离技术，其属于图像处理技术领域。

背景技术：

企事业单位的各种文书，结尾处有当时参加签字的人员的名字及日期等，再加盖本单位的红色印章，表示文书正式有效。有些文书会造成印章对签字或者日期的覆盖，当我们需要确认被印章覆盖的信息时，就要把印章和印章下面的文字分离开来，并分别送入识别器，从而还原出被印章覆盖的具体信息。一般，每个单位的章的大小、形状、以及印泥的颜色都会有些区别，盖章的力度以及当时的光照条件等都可能有些不同，最终呈现在一起的文字印章效果的相关图像信息都会不同。将红色印章图像提取出来的技术，目前业界已有研究，主要有这么几类：一是使用颜色模型基于颜色通道分离的方法，采用rgb和hsv颜色模型对印章图像进行提取，或者使用彩色模型中rgb或ycbcr通道间差值、二维投影方法提取印章图像；二是，通过一些图像处理的办法，检测图片中红色印章的区域，根据区域把印章分离出来，比如用hough变换检测印章的圆形区域来提取印章；三是基于机器学习的方法，使用k-means聚类、svm分类来标记出文字区域和印章区域，或者使用bp网络结合印章的纹理特征进行印章识别；四是基于卷积神经网络的方法，利用fast-rcnn模型训练，检测印章图像，或者用卷积神经网络识别印章中的数字编号等。第一类方法主要是利用印章颜色与其背景色的差别来提取印章，对于印章信息完整、色彩鲜艳的图片可以达到好的效果；第二类方法，需要印章的轮廓比较清晰和规范，则能达到比较好的效果；第三类方法需要印章的颜色和图片中其他物体的颜色差异比较大，才有好的聚类效果，或者是对印章相关特征的提取并结合bp网络的训练来进行，这也需要印章的特征比较明显才能有好的效果；第四类方法需要训练大量同一版式印章的不同盖印特征的样本，这需要前期收集和制作大量的样本。我们的目的，不但要把红色的印章提取出来，而且还要保持印章下面的文字比较清晰的呈现出来，这样便于后期对于印章和下面的文字分别进行识别。为此，需要设计相应的技术方案给予解决。

技术实现要素：

本发明提供了一种基于颜色解混的文字图章分离技术，以解决目前存在的不能区分相近色文本和背景的干扰，及印章形状清晰程度的影响和需要进行模型学习和收集大量印章样本弊端进行改进，满足实际使用要求。

为解决上述问题，本发明所采取的技术方案如下：

一种基于颜色解混的文字图章分离技术，其核心点在于将彩色图像中的每个像素看成是两种颜色(印章的红色和字的黑色)的混合而成，把红色的印章和黑色的字完全分离开，各成一张图像，该方法包括以下步骤：

步骤110：获取图像；

步骤120：图像预处理，背景变成白色；

步骤130：自动获取红色印章的r、g、b三个基本颜色分量值，并进行反射；

步骤140：自动获取黑色字的r、g、b三个基本颜色分量值，并进行反射；

步骤150：将红色印章和黑色字反射后的三个基本颜色分量值组成基本颜色矩阵；

步骤160：利用基本颜色矩阵和反射后的图像矩阵，求解得到图像中各个像素值点分解成红色印章和黑色字混合的两个颜色系数；

步骤170：将每个像素点的印章的颜色系数作为灰度图像的像素值显示出来，就得到印章；

步骤180：将每个像素点的黑色字的颜色系数作为灰度图像的像素值显示出来，就得到黑色字；

步骤190：结束。

作为上述技术方案的改进，其中，步骤130的红色章三个基本颜色分量自动取值步骤如下：

步骤310：分离出r、g、b分量图像；

步骤311：得到三个分量图像的差图像r-(g+b)/2；

步骤312：将差图像的所有像素值降序排列；

步骤313：获取前一步所得差值排前三大的像素值在差图像中的位置；

步骤314：将前一步得到的位置对应到r、g、b分量图像中的位置找出来；

步骤315：将上一步中找到位置r、g、b的像素值分别求平均值；

步骤316：将上面的平均值进行反射，所得结果代表红色印章的三个基本颜色值。

作为上述技术方案的改进，其中，步骤140的黑色字三个颜色值自动取值步骤如下：

步骤410：将r、g、b三个分量图像相加，得到和图像r+g+b；

步骤411：将和图像的所有像素值按升序排列；

步骤412：找到前一步所得排序中、排前三小的像素值在和图像中的位置；

步骤413：将前一步得到的位置对应在r、g、b三个分量图像中位置找出来；

步骤414：将上一步中找到位置的r、g、b的像素值分别求平均值；

步骤415：将上面的平均值进行反射，所得结果代表黑色字的三个颜色值。

作为上述技术方案的改进，其中，步骤160求得颜色解混系数的步骤如下：

步骤610：求出基本颜色矩阵a的广义逆矩阵；

步骤611：将r、g、b分量图像的各个像素值进行反射、并将所得结果做成三个列向量放入一个矩阵中；

步骤612：将基本颜色矩阵的广义逆矩阵和上一步得到的矩阵相乘，得到图像的每个像素点由章的红色和字的黑色混合的系数值。

本发明与现有技术相比较，本发明的实施效果如下：

(1)与传统的利用经验阈值分离红色印章区域的方法相比，传统方法会受到背景颜色的影响,某些图片的背景颜色至黑色字体的颜色也会在红色分量上的值比较大，从而给阈值选取造成困难，尤其是亮暗程度不同的图片用同一个阈值得到效果会受到很大的影响，而本发明就在同一张图片里选取红色印章基本颜色值和黑色字体基本颜色值组合出该图片中其他像素点的颜色值，而不受不同图片的影响，不受图片整体亮暗程度的影响，因为在同一张图片里，基本颜色值和其他像素点的颜色值变化都会比较一致；同时，不但用到红色分量，蓝色和绿色分量也被使用来作为基本颜色值；再者，用基本颜色值去组成其他像素点的颜色值，而不受阈值“一刀切”的影响；本发明的通用性强，通过精确的计算，找出了每个像素点的颜色混合系数，反过来，把系数还原成图片，系数值大的像素点就更亮，从而分别得到印章和文字的分离图片。

(2)与传统的区域检测去找印章的办法相比，传统区域检测，比如当章的外形在照片里呈现的形状不够圆、或者边缘断裂的比较厉害时，一些利用图像变换的办法对于圆的检测会失败；而我们的方法直接用颜色合成的思想，不用对特殊形状进行检测，通用性更好。

(3)与机器学习中使用颜色聚类、找印章的方法相比，颜色值对于红色印章和黑色文字在某些像素点上很接近、会导致聚到同一类，从而效果不好；本发明减少了相近色文本和背景、以及和红色章之间干扰。

(4)与使用bp神经网络和卷积神经网络方法相比，本发明不用进行模型学习，不用收集大量印章样本，在线分离各类红色印章，并且也得到印章下面的文字信息，为后续的印章识别和印章下的文字识别做好准备。

附图说明

图1为本发明的流程图；

图2为本发明获取红色章的基本颜色值的流程图；

图3为本发明获取黑色字的基本颜色值的流程图；

图4为本发明颜色解混的基本原理图；

图5为本发明样本图片及其分离效果图。

具体实施方式

下面将结合具体的实施例来说明本发明的内容。

如图1所示；为本发明所述的基于基于颜色解混的文字图章分离技术，所述方法包括如下步骤：

步骤110：获取图像数据；获取图像数据的方法(从法院的审判文书的扫描文件里截图文字图章部分以获取图)；

步骤120：图像预处理，即用otsu方法进行分割，得到的背景区域对应原图中的背景区域赋值成白色，其他区域还是原图中的颜色；

步骤130：自动获取红色章的r、g、b三个基本颜色值，如图2所示：主要包括如下步骤：

步骤310：分离出r、g、b分量图像；

步骤311：得到三个分量图像的差图像r-(g+b)/2；

步骤312：将差图像的所有像素值降序排列；

步骤313：获取前一步所得差值排前三大的像素值在差图像中的位置；

步骤314：将前一步得到的位置对应到r、g、b分量图像中的位置找出来；

步骤315：将上一步中找到位置r、g、b像素值分别求平均值；

步骤316：用255减去上面三个平均值(即反射)、所得结果代表红色章的三个基本颜色值。

步骤140：自动获取黑色字的r、g、b三个基本颜色值；如图3所示：步骤130具体包括如下步骤：

步骤410：将r、g、b三个分量图像相加，得到和图像r+g+b；

步骤411：将和图像的所有像素值按升序排列；

步骤412：获取前一步所得和图像排前三小的像素值在和图像中的位置；

步骤413：将前一步得到的位置对应到r、g、b三个分量图像中位置找出来；

步骤414：将上一步中找到位置的r、g、b的像素值分别求平均值；

步骤415：用255减去上面三个平均值(即反射)、所得结果代表黑色字的三个基本颜色值；

【步骤150】将红色印章和黑色字的各三个颜色值组成基本颜色矩阵

步骤610：求出基本颜色矩阵a的广义逆矩阵a_g_inv＝(a*a^t)^-1*a^t；

步骤611：将r、g、b分量图像进行反射、并将所得结果做成三个列向量放入一个矩阵中image，即image＝[255-r(:),255-g(:),255-b(:)]；

步骤612：将基本颜色矩阵的广义逆矩阵a_g_inv和上一步得到的矩阵image相乘，得到图像的每个像素点由印章的红色和字的黑色混合的系数值，即unmixing_parameter＝a_g_inv*image'；

步骤170：将每个像素点的红色印章的颜色系数作为灰度图像的像素值显示出来，就得到红色印章；即，将unmixing_parameter的第一列数值，还原成和原图像的宽度和高度一样的灰度图像，并显示出来，就得到印章图像；

步骤180：将每个像素点的黑色字的颜色系数作为灰度图像的像素值显示出来，就得到黑色字；即，将unmixing_parameter的第二列数值，还原成和原图像的宽度和高度一样的灰度图像，并显示出来，就得到黑色字的图像；

步骤190：结束。

以上内容是结合具体的实施例对本发明所作的详细说明，不能认定本发明具体实施仅限于这些说明。对于本发明所属技术领域的技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明保护的范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李裕梅;冯宇旭;李坤;曹显兵;王鑫
技术所有人：北京暴雷科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。