融入fft的综合评价法的碎纸片纵横切拼接复原算法

文档序号:6514213阅读:162来源:国知局
融入fft的综合评价法的碎纸片纵横切拼接复原算法
【专利摘要】本发明公开了一种融入FFT的综合评价的碎纸片纵横切拼接复原算法。首先通过对图像碎片进行编码,将其转化为灰度矩阵并对其进行二值化处理。利用FFT快速傅立叶变化,进行频域转化,进行频域分析。之后分成两种情况,对于中文,行的划分依据是汉字的中心纵坐标;对于英文,行的划分依据是字母的下端基线。然后,利用行匹配将所有的碎片行分类。利用FFT处理后边缘矩阵的互相关系数大小和直接匹配法的匹配成功率进行综合评价,用每个碎片的左右两个边分别与左右边缘的两边进行匹配,选取其中匹配度最高的完成匹配,重复直至完成行匹配。对其结果进行人工干预。之后进行间排序,此处依旧利用上述的综合评价法实现,之后对结果再进行一次人工检查与干预,完成碎片的复原。
【专利说明】融入FFT的综合评价法的碎纸片纵横切拼接复原算法
【技术领域】
[0001]本发明主要运用于中英文图像拼接(文字拼接)领域,设计了一种融入FFT的综合评价的碎纸片纵横切拼接复原算法。
【背景技术】
[0002]快速傅里叶变换,是离散傅氏变换的快速算法,它是根据离散傅氏变换的奇、偶、虚、实等特性,对离散傅里叶变换的算法进行改进获得的。它对傅氏变换的理论并没有新的
发现,但是对于在计算机系统或者说数字系统中应用离散傅立叶变换,可以说是进了一大步。快速傅氏变换算法可以运用到图像拼接的领域。

【发明内容】

[0003]单面印刷文字文件横纵切碎片的复原
为了探寻两个相邻碎片间的关系,本算法将各个碎片编码后矩阵的边缘列进行FFT快速傅里叶变换,因为最终图片的最左边全为白色,所以首先可以得到原图最左边一列,再将该碎片的最右列和其他碎片的最左列逐一进行互相关系数的计算,得出一族互相关系数,选取其中结果最大的一列的碎片进行匹配,得到最终结果。
[0004]傅里叶原理表明:任何连续测量的时序或信号,都可以表示为不同频率的正弦波信号的无限叠加。而根据该原理创立的傅里叶变换算法利用直接测量到的原始信号,以累加方式来计算该信号中不同正弦波信号的频率、振幅和相位。
[0005]对于信号的分析,很多情况下仅依靠时域是远远不够的,很多时域上不好分析的信号转入频域的分析中,立即变得便于分析。本算法依据分析的需要,分别将每个灰度矩阵的左上角和右上角看作起点,将0-1 二值矩阵一列的取值看作y轴,将离散的点看作t轴,对其进行FFT处理。得到每个矩阵的边缘列的频谱。对它的特征进行提取,并分别计算它与其它碎纸片边缘的互相关系数,进行匹配。笔者认为,频谱特征接近,即互相关系数接近的两个碎纸片处在相邻的位置。
[0006]单面印刷文字横纵切片的复原难度比仅有纵向切片文件的复原大很多,一方面在于碎纸片变多使得编程变得困难和程序运行速度变慢,另一方面在于纸片变小导致的信息变少从而使得匹配更易于发生错误。本算法阐述了研究过程中方案的探索和最终使用的方案的改进。本算法分别对中文和英文的处理方法进行了分析。
[0007]本算法对于这种方案进行了分步处理。最后进行了一次人工干预,得到正确的结果。
[0008]本算法在此对中英文两种情况进行分别讨论,不同特征。
[0009]一、中文文件的复原
本算法对于中文文件的复原主要经过行分类、综合评价体系的建立以及人工干预组成。其算法流程图如图1所示:
(1)行分类①分类方案的选取
首先,笔者经过观察发现,不是所有的标点都是全角的,所以不同行上面的字位置并不处在完全一样的列上。所以对于碎片的处理不能通过列分类而实现。之后,笔者经过观察发现,除去空行后,所有的碎片只有11种行的分布位置,所以可以先对它们进行行分类,之后再对于每一行类别的碎片进行相对位置的排序,即可恢复原文。
[0010]观察事例图片,本算法发现文字的汉字大小几乎一致,对所有碎片中汉字的纵向高度进行统计,本算法发现汉字的纵向高度为38-41个像素,但是汉字的上下却往往并不对齐,所以本算法对于所有汉字纵向的中心点纵坐标进行了记录,根据这些纵坐标的位置,并设定一个像素的阈值,对所有碎纸片进行行分类。
[0011]观察到事例图片中的行间距一致,而且大多数正规文件的行间距几乎一样宽,所以本算法首先假定图片中汉字的行间距一致,但是英文的行间距却并不完全一致,因此,本算法改变思路,转而去分析汉字高度。
[0012]因为每个汉字的高度有一定的出入,而且汉字的底也不太相同,再加上部分形如“一”的文字存在,所以本算法的分析思路基于汉字的中心点。为了证明这种想法的合理性,本算法对所有汉字纵向坐标进行分析,发现同一行的汉字中心纵坐标处在阈值为1的区间内,所以用这种方法对汉字进行行分类可以得到较好的结果。
[0013]②灰度矩阵的预处理
每个汉字的大小不完全一样,一方面为了便于观察,另一方面为了减少部分形如“翁”之类的汉字中间空白部分的干扰。本算法首先对灰度矩阵进行预处理。因为本体首先,将灰度矩阵以RGB值128作为阈值,转化为0-1 二值矩阵。
[0014]之后,对生成的矩阵进行扫描,从上到下并且横向进行,一旦在某一行中遇到有一个像素为黑色,便将整行变成黑色,直到结束为止。为了防止形如“翁”的字干扰后续检验。此时,再对矩阵进行检验,将宽度小于20像素的白线全部变成黑色。
[0015]因为图片中的文本碎片均不含有噪音,所以噪音中黑点与白点的影响可以忽略不计。
[0016]为了显示上述方法的处理效果,本算法选取一张原图与一张处理后的图片进行对t匕,为了使这种事例具有普遍性,本算法选取两个典型图进行师范,如图2、图3所示,其处理结果分别如图4,图5所示。
[0017]经过对上述效果的观察,本预处理的效果十分明显,结果也很成功。
[0018]③行分类的实施与结果
本算法先确定两个边缘列的碎片项。之后,本算法对于预处理后的矩阵进行分析,统计出所有黑色部分的中心纵坐标大小,对其进行记录,并设定阈值为1,对其进行分类。
[0019]对于结果分析可得,该分类与其差别较小,可以对其进行人工干预,将每行之间的先后顺序进行排列,本部分的任务完成。
[0020](2)基于FFT信号处理的互相关系数模型
一种普遍的方法为:利用(1)中的图片编码方式,得出二值矩阵,首先利用碎片左侧的边缘找出最左边的一个碎片,之后将灰度矩阵它最右边一列分别与其他碎片最左边一列进行分别逻辑异或运算,并将所有结果进行求和,选取结果最大的一个碎片与其相连,但是这种方法的匹配成功率较低,所以本文采取了其他的方法。[0021]为了探寻两个相邻碎片间的关系,本算法将各个碎片编码后矩阵的边缘列进行FFT快速傅里叶变换,因为最终图片的最左边全为白色,所以首先可以得到原图最左边一列,再将该碎片的最右列和其他碎片的最左列逐一进行互相关系数的计算,得出一族互相关系数,选取其中结果最大的一列的碎片进行匹配,得到最终结果。
[0022]傅里叶原理表明:任何连续测量的时序或信号,都可以表示为不同频率的正弦波信号的无限叠加。而根据该原理创立的傅里叶变换算法利用直接测量到的原始信号,以累加方式来计算该信号中不同正弦波信号的频率、振幅和相位。
[0023]对于信号的分析,很多情况下仅依靠时域是远远不够的,很多时域上不好分析的信号转入频域的分析中,立即变得便于分析。本算法依据分析的需要,分别将每个灰度矩阵的左上角和右上角看作起点,将0-1 二值矩阵一列的取值看作y轴,将离散的点看作t轴,对其进行FFT处理。得到每个矩阵的边缘列的频谱。对它的特征进行提取,并分别计算它与其它碎纸片边缘的互相关系数,进行匹配。笔者认为,频谱特征接近,即互相关系数接近的两个碎纸片处在相邻的位置。
[0024](1)图片编码矩阵的FFT处理:
①FFT快速傅里叶变换与DFT离散傅里叶变换算法的比较:
对于任一离散序列χ(--)的父点,其DFT计算公式如下所示:
【权利要求】
1.一种融入FFT的综合评价的碎纸片纵横切拼接复原算法。
2.其特征在于能够进行中英文单面横纵切片的恢复。
3.如权利要求1一种融入FFT的综合评价的碎纸片纵横切拼接复原算法。
4.其特征在于它可以进行中文和英文文件的复原。
5.如权利要求2—种融入FFT的综合评价的碎纸片纵横切拼接复原算法。
6.其特征在于,本算法对于中英文文件的复原主要经过行分类、综合评价匹配法、行排序和人工干预组成。
7.中文的行分类依靠行中心线,英文依靠行基线。
8.如权利要求2—种融入FFT的综合评价的碎纸片纵横切拼接复原算法。
9.其特征在于,每个汉字的大小不完全一样,一方面为了便于观察,另一方面为了减少部分形如“翁”之类的汉字中间空白部分的干扰。
10.本算法首先对灰度矩阵进行预处理。
11.如权利要求2—种融入FFT的综合评价的碎纸片纵横切拼接复原算法。
12.其特征在于,本算法将各个碎片编码后矩阵的边缘列进行FFT快速傅里叶变换,因为最终图片的最左边全为白色,所以首先可以得到原图最左边一列,再将该碎片的最右列和其他碎片的最左列逐一进行互相关系数和综合评价值的计算,得出一族互相关系数,选取其中结果最大的一列的碎片进行匹配,得到最终结果。
13.如权利要求2—种融入FFT的综合评价的碎纸片纵横切拼接复原算法。
14.其特征在于,本发明认为两个相邻的矩阵如果综合评价值越高,则两图片的匹配度越好,选取匹配度最高的图片进行匹配。
15.因为互协方差函数不能进行归一化处理,从而用量化的指标来清楚地反映出两个信号的相关系数,所以本算法采用了基于信号处理从归一化互相关系数模型去对两个信号的相关系数进行定量的衡量。
16.行匹配与列排序的方法一致,均靠综合评价值去进行匹配。
17.如权利要求2—种融入FFT的综合评价的碎纸片纵横切拼接复原算法。
18.其特征在于,英文文件的行分类要更难。
19.一方面每个英文字母的纵向高度不同,而且有的整体位置较高,有的整体位置较低,所以难以定位其每一行的位置,对字母进行筛选;另一方面,因为英文字母很多都有弧度,而且信息较少,所以英文文件经过纵横切片后更加难以复原。
20.其算法流程图如图6所示。
21.本算法中文文件和英文文件的区别主要在于数据的预处理和行分类上面。
【文档编号】G06T3/40GK103679671SQ201310458541
【公开日】2014年3月26日 申请日期:2014年1月12日 优先权日:2014年1月12日
【发明者】王浩, 郑智隆, 曹丹, 邹孟霖, 于思奇, 孙翰斐, 李子祺, 张旭, 余冬琪 申请人:王浩
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1