一种文书档案图像压缩方法

文档序号:7866956阅读:417来源:国知局
专利名称:一种文书档案图像压缩方法
技术领域
本发明属于文档图像处理领域,特别涉及一种文书档案图像压缩方法。
背景技术
为了适应信息化建设的需求,大量的纸质文书档案经过扫描以电子形式进行存储。一方面可以避免由于存放不当造成的污损;另一方面,利用现有的信息技术可以方便地对电子档案进行管理及查找,从而大大节省了人力物力。通常,经过扫描的纸质档案以彩色图像格式存储在计算机中,如何对图像进行压缩以节省存储空间是急需解决的问题。近年来,许多学者对图像压缩问题进行研究,提出了各种不同的压缩编码方法。主要分为无损压缩编码和有损压缩编码。其中,无损压缩编码是指对压缩编码后的数据进行 还原,可以获得与原来完全相同的数据。一些常用的无损压缩编码算法有霍夫曼(Huffman)算法和LZWaenpel-Ziv&Welch)算法。有损压缩编码是指经过压缩、解压的数据与原始数据不同但是非常接近的压缩方法,例如被广泛应用的JPEG压缩编码方法。JPEG压缩基于离散余弦变换(DCT),它首先将图像分为一些互不重叠的区域,对每个区域进行离散余弦变换。将变换后的系数根据量化表进行量化,量化后的系数按照折线扫描重新组织,然后进行游程编码、算术编码或者霍夫曼编码。文书档案一般用于提供重要历史信息,具有法律意义。该特性决定了在选择编码方式时应采用无损压缩方法。

发明内容
本发明克服了现有技术中图像存储空间较大且有损压缩使图像失真等缺陷,提出了一种文书档案图像压缩方法。本发明提出了一种文书档案图像压缩方法,包括以下步骤预处理,所述预处理对原始图像进行处理,以去除扫描过程中的噪声干扰;三值化处理,所述三值化处理对经过所述预处理后的图像进行处理,以利用三种色彩信息对经过所述预处理后的所述图像进行表示;和LL压缩编码处理,所述LL压缩编码用于对经过所述三值化处理的所述图像进行压缩编码。其中,所述预处理步骤包括以下分步骤 步骤Al :将RGB颜色模型转换为HSI颜色模型;步骤A2 :在HSI模型中用灰度图增强方法增强其中的I分量;步骤A3 :将处理结果转换为RGB模型。其中,所述三值化处理步骤中,所述三种色彩信息分别为红色信息、白色信息和黑色信息。其中,所述三值化处理步骤中依次扫描所述图像中的每个像素(i,j),假设其RGB值为(Rij, Gij, Bij),则
若当Rij < TE, Gij < TG, Bij < Tb时,表示当前像素为黑色,令Iij = O ;若当/ ,,> ZtPij > >弋时,表示当前像素为白色,令Iij = I ;否则,表示当前像素为红色,令Iij = 2 ;其中(TK,TG, Tb)及( , , )为经验阈值,Iij为三值化后每个像素的颜色标志,共有三种取值{0,I,2}。其中,所述经验阈值分别为(TK,Te,Tb) = (20,15,30),并且(ΓΛ,Γσ,ΓΒ) = (210,225,220) o其中,在所述LL压缩编码处理步骤中,利用游程描述所述图像,所述游程为所述 图像中的一行中连续的相同颜色的像素。其中,在所述LL压缩编码处理步骤中生成LL压缩文件,所述LL压缩文件包括LL文件头、图像数据开始标志、行压缩数据、和图像数据结束标志。本发明的技术方案是根据三值化图像中像素之间的相关性,提出一种基于游程的图像LL无损压缩编码方法。本发明对图像实施无损压缩编码,保留了图像中的所有有用信息,避免了图像还原后因失真而丢失需要的 目息。本发明针对文书档案图像主要具有三种颜色的特点,通过对扫描图像实施三值化处理,使处理后的图像内容更符合文书档案的规格。本发明采用基于游程的无损压缩编码方法,消除了冗余度,使压缩后的图像具有更高的压缩比,减小了占用的存储空间,有利于文书档案图像的保存。


图1表示文书档案图像压缩流程;图2表示预处理前后的文书档案图像;图3表不二值化如后的文书档案图像;图4表示游程的压缩结构CS ;图5表示控制结构BS ;图6表示文书档案图像行压缩结果。
具体实施例方式结合以下具体实施例和附图,对本发明作进一步的详细说明。实施本发明的过程、条件、实验方法等,除以下专门提及的内容之外,均为本领域的普遍知识和公知常识,本发明没有特别限制内容。本发明文书档案图像压缩方法包括预处理、三值化处理与LL压缩编码处理,如图1所示。预处理的目的是对原始图像进行处理,通过增强图片中的对比度,滤除其中由于扫描产生的噪声干扰,使图片更为清晰。三值化处理用于对预处理后的图像进行类型转换。由于文书档案图像的颜色大多以红、白、黑三色,所以将图像中的其它颜色通过三值化处理归为三色中的一种,使图像转为以红、白、黑二色表不。LL压缩编码处理用于对经过三值化处理的图像进行游程编码压缩,游程编码压缩为无损压缩,保留了图像中的所有信息。并且游程编码消除了冗余度,具有很高的压缩比,减小了图像文件的存储空间。实施例文书档案在扫描过程中经常会受到噪声的干扰从而影响后续处理,故需要对图像进行预处理。优选地,本发明采用彩色图像增强的方法来改善图像的视觉效果。对彩色图像进行处理,首先需要选择合适的颜色模型。常用的颜色模型有RGB,YUV及HSI等。其中最常用的RGB颜色模型与显示系统相关,计算机显示器使用RGB来显示颜色。它是一种混合型颜色模型,由三种基色红色(R)、绿色(G)和蓝色(B)按照一定比例混合得到。RGB模型基于笛卡尔坐标系统,三个轴分别为R、G和B。HSI颜色模型用色调H、饱和度S、亮度I来描述颜色,其中色调和饱和度主要用于描述色彩信息,而亮度表示光的强度。该模型有两个特点⑴I分量与图像的彩色信息无关(2)H和S分量与人感受颜色的方式紧密相连,符合人的视觉特性。本实施例中对HSI颜色模型进行预处理。RGB模型与HSI模型之间的转换关系如下(I) RGB 转换到 HSI
权利要求
1.一种文书档案图像压缩方法,其特征在于,包括以下步骤 预处理,所述预处理对原始图像进行处理,以去除扫描过程中的噪声干扰; 三值化处理,所述三值化处理对经过所述预处理后的图像进行处理,以利用三种色彩信息对经过所述预处理后的所述图像进行表示;和 LL压缩编码处理,所述LL压缩编码处理用于对经过所述三值化处理的所述图像进行无损压缩编码。
2.如权利要求1所述的文书档案图像压缩方法,其特征在于,所述预处理步骤包括以下分步骤 步骤Al :将RGB颜色模型转换为HSI颜色模型; 步骤A2 :在HSI模型中用灰度图增强方法增强其中的I分量; 步骤A3 :将处理结果转换为RGB模型。
3.如权利要求1所述的文书档案图像压缩方法,其特征在于,所述三值化处理步骤中,所述三种色彩信息分别为红色信息、白色信息和黑色信息。
4.如权利要求1所述的文书档案图像压缩方法,其特征在于,所述三值化处理步骤中 依次扫描所述图像中的每个像素(i,j),假设其RGB值为(Rij, Gij, Bij),则 若当Rij < TE, Gij < TG, Bij < Tb时,表示当前像素为黑色,令Iij = O ; 若当R11 > TrJGu > fGMl > &时,表示当前像素为白色,令Iij = I ; 否则,表示当前像素为红色,令Iij = 2 ; 其中(TK,Te,TB)及为经验阈值,Iij为三值化后每个像素的颜色标志,共有三种取值{O,I,2}。
5.如权利要求4所述的文书档案图像压缩方法,其特征在于,所述经验阈值分别为(te, Tg, Tb) = (20,15,30),并且(夂,f'G, Τβ) = (210,225,220)
6.如权利要求1所述的文书档案图像压缩方法,其特征在于,在所述LL压缩编码处理步骤中,利用游程描述所述图像,所述游程为所述图像中的一行中连续的相同颜色的像素。
7.如权利要求6所述的文书档案图像压缩方法,其特征在于,在所述LL压缩编码处理步骤中生成LL压缩文件,所述LL压缩文件包括LL文件头、图像数据开始标志、行压缩数据、和图像数据结束标志。
全文摘要
本发明公开一种文书档案图像压缩方法。包括预处理,所述预处理对原始图像进行处理,以去除扫描过程中的噪声干扰;三值化处理,所述三值化处理对经过所述预处理后的图像进行处理,以利用三种色彩信息对经过所述预处理后的所述图像进行表示;LL压缩编码处理,所述LL压缩编码处理用于对经过所述三值化处理的所述图像进行无损压缩编码。本发明不但保留了文档图像中所有有用信息,同时消除了冗余,获得较高的压缩比。
文档编号H04N7/26GK103024246SQ20121049694
公开日2013年4月3日 申请日期2012年11月29日 优先权日2012年11月29日
发明者吕岳, 刘丽 申请人:华东师范大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1