四方图像编码系统的制作方法

文档序号:6458636阅读:454来源:国知局
专利名称:四方图像编码系统的制作方法
技术领域
本发明适用于与通过计算机处理来实现自动图像检索、图像编码、图像匹配、 汉字编码、汉字信息加解密等相关的领域。
背景技术
过去几十年来,以计算机为依托的数据库技术为管理部门提供了非常方便又 强大的技术支持。如今各个管理部门都依赖于这些技术来管理和传递信息。但是 图像数据库中的图片内容目前还不能十分有效地用计算机直接索引和检索,成为 这方面发展的瓶颈。现有的汉字自动识别系统至少大多都是通过提取汉字的笔划 这个思路来设计的。但是由于汉字本身所具有的复杂性,这些算法都非常复杂, 运算效率不高。
发明者开发设计了一个关于图像编码的新系统。该系统能够通过计算机对图 像直接进行自动统一的编码,对于提高图像数据库管理的自动化、图像的自动识 别、武器自动寻的的效率都会有所帮助,同时发明者尝试通过图像编码的方法来 实现汉字的自动识别,这种方法能够对非常复杂的汉字,例如"赢"、"赢"、"羸"、 "赢",进行自动区分和识别。通过适当的改造,这个系统会实现汉字信息的加 密解密,而且加密方法具有高安全性、密码个性化的特点。

发明内容
具体的图像编码方法是,把目标图片分成四个相等的小块,对图片中四个小 块的所有像素的灰度值进行平均,得到一个该区域的平均灰度值;对四个小块的 平均灰度值按照从大到小的顺序排序;按照这个灰度值排列式样在图2中的式样 中比对检索,得到该图片所对应的灰度特征编码(参见图l)。
理论上讲,对于四个数字的排列只有4X3X2X1^4排列组合(图2)。考虑到 现实中会出现某两小块、三小块甚至四小块具有相等的灰度平均值的情况,实际 上这个组合和排列的情况可达75种(图2和图2续)。通过对一幅图片的四个小块灰
度平均值之间关系进行编号,我们可以把握住这个图像的大致特征。
显然仅仅有这75种灰度特征编码来划分和标记整个图像世界是远远不够的。 为了克服这个弊端,需要通过组合来增加编码的描述能力。至少有两种组合可满 足这个要求。当然不能排除其他的组合可能性,下面仅介绍两种常用的方法。
1) 全图编码法先把整个图像按照图1的方法进行编码,再把图片分成四 个小块,其中每一小块当作一个图片来对待,按照上述方法(图l)对其进行编 码(图3)。这种方法适用于图片的各个部分的信息都同样重要的情况,例如汉 字的自动识别等应用。
2) 中心编码法先把整个图像按照图1的方法进行编码,再把图片中心四 分之一当作一个次一级的图片来对待,按照上述方法(图l)对其进行编码;只 要图片的分辨率允许,这种编码可以进行多级以期达到足够的编码描述能力(图 4)。这种方法适用于图片的中心部分拥有图片的重要信息,例如摄影中人们常常 把人物放在靠近中央的位置。
把通过上述两个方法得到的多个灰度特征编码串接起来,即形成了对于该图像的最终编码。
在全图编码法中, 一个图像的最终编码包括一个一级灰度特征编码和四个二 级灰度特征编码,其中每个编码各有75个可取值,因此一个全图编码,理论上 讲,可以对755=2,373,946,875个图片进行不重复的编码。


图l 图像的编码过程。从左到右分别是图域分割、四小块的平均灰度、四 小块的灰度的排序及最终的灰度特征编码。。
图2*灰度特征编码表。表中共计有75种编码,每一个编码中编码的编号在 其左侧,紧接着是灰度平均值排列结果,最后是相应的灰度排列式样。
图3*全图编码法。从左到右的五列分别是整幅图、左上幅、右上幅、左下 幅、右下幅的编码过程。每一列中,自上而下分别是图域分割、灰度平均值、灰 度平均值排列结果、灰度特征编码,以及最终的二进制编码。
图4'中心编码法。从左到右的五列分别是整幅图、四分之一幅、十六分之 一幅、六十四分之一幅、二百五十六分之一幅(上排)。每一幅图都经过图l中的 过程,得到相应的灰度特征编码(中排),以及最终的二进制编码(下排)。
图5 图像数据库及其运转机制。图像经过数字化设备可以存在硬盘上,而 其索引由于非常小,可以始终保持在内存中以增加检索效率。
图6 在图像中寻找目标区域。由于目标和图像中某个区域的灰度特征编码 是一致的,通过对图片中的区域进行扫描,可以锁定所寻找的目标。
图7*汉字的编码。上半幅中,对一个方块汉字划分为16个大小相等的小块 (各个小块的标号如下半幅中最右侧的方块所示),统计各个小块中灰度值,按 照下半幅图中所示分别确定区码0-5的值(如区码0是基于小方块0、 1、 4、 5的灰 度值;区码4是基于左上、右上、左下、右下四个方块组(每组包括四个小块) 的灰度值),最后把所有的编码按照特定顺序连接起来即是所要的最终汉字编码。
图8 部分汉字及其对应的编码示例。每一个汉字对应于一个由六个数字组 成的编码。
图9 利用图片加密汉字信息。首先计算出图片中各种大小的方块的灰度特 征编码,然后根据被加密的汉字编码中需要编码在图片中己有的灰度特征编码中 找到相应的方块,通过指定这个方块的方式来传达该编码。如图7所示,每一个 汉字需要区码0-5来加密,因此每一个汉字可以通过指定六个与区码0-5项对应的 方块来确定。
应用实例l:图像数据库管理及检索
要想对这些图像进行有效的管理,办法之一就是建立能进行有效检索和存取 的图像数据库系统。如同建立所有的其他数据库一样,建立一个图像数据库的关 键是怎样设计这个数据库的索引。灰度特征编码方法所提供的是一个能够快速自 动生成的、基于图像内容的、索引简短、结构统一、检索快捷的设计方法。图像 由于数据量巨大,通常必须存在硬盘上,但是数据库索引由于非常小,可以始终
保持在内存中以增加检索效率(如图5)。
4应用实例2:目标寻找。
通过在某一图像中寻找与目标图像相匹配的区域可以定位目标。如果知道的是某一目标的图像,需要确定其在大范围中的位置,在大范围图像中进行搜索是唯一的办法。若目标的编码与图像中的某个区域的编码值相等,即可以认为该区域为目标区域。这一功能具有某种程度上的军事用途,例如自动寻找打击目标(如
图6)。
应用实例3:汉字的编码。
下面以"赢"字为例描述一下汉字的编码过程。任何一个汉字都可以看成一个方块形的图像。如图7中,我们首先对这个方块进行4X4的网格化,对其中每一个小方块进行编号。然后,在每一个的小方块中,把所有像素的灰度值累加起来(前面的理论中所说的灰度平均值在这里不一定非得计算出来,因为每个方块中的像素数都是相等的,所以灰度累加值的相对大小就是灰度平均值的相对大小,而后者就是我们唯一需要知道的信息)。然后从这十六个小方块中,按照图7中的方法取出不同的小方块进行组合来计算不同的区码,例如区码0描述的是汉字左上角的信息,它描述的是第0、 1、 4和5号小方块之间的关系。根据这四个小方块灰度累加值之间的相对关系,在图2中找到对应的灰度特征编码21。这个数值可以存储为一个七比特长的二进制数字0010101。按照同样的方法,我们可以得到区码l、 2、 3和5,它们分别描述汉字不同(右上、左下、右下和底部)部分的特征。区码4是用来描述整个汉字的特征的,因此它所用来计算的灰度值分别是来自整个汉字左上、右上、左下和右下四个分区的,其中每一个分区的灰度值是对应的四个小方块灰度值之和,其最后的灰度特征编码是0,即0000000。最后区码0-5串起来即构成了一个汉字的完整编码。
部分汉字的编码结果见图8。
应用实例4:汉字的自动输入。
上一例描述的汉字编码方法中,对汉字的编码是可以用计算机自动完成的。如果我们对各个字体所有的汉字按照这个统一的方式进行编码、建立字库的话,当一个新的汉字以图像的方式输入到计算机中的时候,我们对它进行同样的编码,如果它的编码与数据库中的某一个汉字的编码相等的话,计算机即可以判定输入的就是这个字,从而实现汉字的自动识别和输入。
应当注意的是,由于每一个汉字由六个灰度特征编码组成,理论上讲,这种
编码能够描述756=177, 978, 515, 625个不同的汉字。因此完全有能力对所有汉字的所有字体(甚至包括手写体)进行识别和编码。保守地讲,这种编码至少应该能够胜任印刷体的识别和编码。
应用实例5:文件的加密解密。
下面以图9为例来说明如何用图像信息来加密文字信息。如前所述, 一个汉字可以用六个灰度特征编码来组成。如果能够确定这六个编码,那么我们就可以确定一个汉字。只要我们能够通过图像准确地加密传递其中每一个编码,就可以用图像以加密的方式传递整个汉字的信息。我们先来分析一下,其中一个灰度特征编码是怎样用图像信息来表示的,剩下的只是在进行五次简单的重复操作了。如图9中, 一个灰度特征编码由两个字节组成。第一个字节的表示所用图像方块的级别,第二个字节表示这个级别的图像方块中该方块的具体位置。图像方块级
别分成0-3级,共四个级别0级有四个方块,每个占整个图像面积的四分之一;l级有十六个方块,每个占整个图像面积的十六分之一;2级有六十四个方块,每个占整个图像面积的六十四分之一;3级有二百五十六个方块,每个占整个图像面积的二百五十六分之一。图像方块具体位置是用数字来编号的,编号的顺序
是从左上角到右下角,先进行横向的编号。由于3级网格化会产生256个小方块,因此小方块的位置需要八个比特来表示。图9中显示的是当汉字的区码5用第10块1级图像方块来表示时的情形。通过方块的级别和顺序信息,计算机会在图像中确定的该方块并对其中像素的灰度信息按照图1中的方法进行计算,然后在图2查找对应的灰度特征编号,得出最终的汉字区码5。上面描述的只是六个区码之一是如何产生的,通过同样的方法,我们可以得到其他的汉字区码,把它们连接起来就是一个完整的汉字编码,通过它可以确定所要传递的汉字信息。
实际的加密操作过程很可能是拿到一个图像后,计算机首先对于0-3级的各个方块的灰度特征进行计算,所有具有相同灰度特征编码值的方块会形成一个列表。当加密某一个汉字需要某一个编码值的时候,计算机会从具有该编码值的待选方块列表中随机或按照某种顺序挑选一个,知道了这个方块的信息和原图像就知道了这个汉字区码。六个汉字区码共同确定一个字,多个汉字共同组成一个密件。
通过上述的描述我们了解到通过图片加密汉字信息的过程,要想进行解密需要进行相反的过程。解密员接收到的是一套密件,密件由很多关于某一个图像中某些方块的信息组成的,解密员只需把这些信息对应到特定的图像中特定方块,这个方块即可产生相应的汉字区码,六个汉字区码就可以确定一个汉字,多个汉字形成人可以阅读的汉字文件。
由此可见这个预先约定的图像是信息加密、解密的关键。没有这个图像任何人即使截获了密件也无法解读被加密的文件。这种加密方法有以下几个优点一、密码的个性化。每一个接收文件的人员可以自己挑选有自己特色的图片来作为加密用的图像,只要加密和解密双方事先达成约定即可。这样就可以实现密码的个性化。二、更高的安全性。由于每一个接收人员拥有的是自己的密码,无法知道同事或上下级的密码。即使出现叛徒,造成的损失也是有限的。三、密码的有效期可以随时掌握。为了防止敌方破译密码,可以经常改变加密用的图片,使得敌方无法发现任何规律。四、灵活的密码原则。加密过程中所用的方块的级别大小、位置,会因各个汉字甚至它的区码而变化,会造成敌方迷惑不解。五、同字不同密码。破译密码中的一个重要技巧是发现其中一个常用字的编码作为突破口,然后逐渐扩大战果达到破译整个密件的目的。但是,如前所述,在加密同一个汉字的时候,同一个区域的灰度特征值的列表中会有多个方块的信息备选,如果同一汉字的六个区码都是这样产生的话,几乎可以保证同一个汉字会有"不同面值"的编码。有时候为了增强这种效果,我们甚至可以有意加长某些常用字所需要的方块列表,使得这些汉字"同一面值"的密码的出现频率看起来甚至低于不常用字。六、密码的隐秘性。由于由于信息时代电子图片是一种常见的日常用品,用它来加密文件当然具有很高的隐秘性。
权利要求
1. 一个关于图像编码的新系统,其特征是通过统计目标图像四个区域灰度平均值并对之进行排序的方法来描述图像。
2. 利用权力要求1中的方法对图像的不同部分进行编码,通过所得编码的组合达到描述、 区分大量复杂的图像的目的。
3. 通过权力要求2中所得的编码来实现图像的检索、自动匹配和识别。
4. 通过权力要求2中所得的编码把汉字作为图像来检索、处理,并实现汉字的自动匹配和 识别。
5. 利用普通图片中的信息实现汉字信息的加密、解密,实现密码的个性化和安全性。
全文摘要
一个关于图像编码的新系统。该系统能够对图像直接进行统一的编码,算法简单,运算成本低、速度快。对于提高图像数据库管理的自动化、图像识别、武器自动寻的、汉字编码和识别、信息的加密解密都会有所帮助。其中的加密方法具有高安全性、密码个性化的特点,对于保密和军事用途具有一定的参考价值。
文档编号G06K19/06GK101488194SQ20081001929
公开日2009年7月22日 申请日期2008年1月18日 优先权日2008年1月18日
发明者鑫 王 申请人:鑫 王
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1