图像编码装置、图像译码装置、文字核对装置和数据存储媒体的制作方法

文档序号:7586343阅读:272来源:国知局
专利名称:图像编码装置、图像译码装置、文字核对装置和数据存储媒体的制作方法
技术领域
本发明涉及图像编码装置、图像译码装置和数据存储媒体,特别是将利用扫描器等把文书图像数据即文书图像(包含文字的图像)电子化而得到的2值的图像数据有效地编码并传输或存储的编码处理和与其对应的译码处理以及存储使计算机进行这些处理的程序的数据存储媒体。
另外,本发明涉及文字核对装置和数据存储媒体,特别是将作为检索对象的文字图像(表示文字的图像)不对与其对应的编码数据(文字图像代码)进行译码而与输入的检索数据进行核对的核对处理和存储使计算机进行该核对处理的程序的数据存储媒体。
迄今,已有了将包含文字及照片等的文书图像的信息电子化而作为文书图像数据进行登录的文书文卷装置,但是,近年来,由于登录到这样的文书文卷装置中的文书图像数据的增大,在登录文书图像时,输入或更新用于检索文书图像的关键字或分类代码的工作量大增。
因此,为了减轻在进行这样的文书图像的登录时的检索用数据的输入或更新的工作量,在最近的文书文卷装置中,存储文书图像数据的文书图像存储单元采用将利用扫描器等将文书图像电子化而得到的文书图像数据与将文书图像进行文字识别后得到的文字数据组合而进行存储的结构(参见特许公报第2560656号(特开平8-87528号))。
图39是用于说明先有的文书文卷装置的一例的框图。
先有的文书文卷装置3900具有使用MH(Modified Huffman)或MR(Modified Read)等方法、将从外部输入的把文书图像电子化而得到的2值图像数据(文书图像数据)Di编码、并输出与上述文书图像对应的编码数据De的图像编码单元3902,和对上述文书图像数据Di进行文字识别处理、并对包含在上述文书图像中的各文字将多个候补文字的文字代码Dco作为文字数据而输出的文字识别单元3901。在该文字识别单元3901的文字识别处理中,使用OCR(Optical Character Reader)的图形识别等方法。
另外,上述文书文卷装置3900还具有使与各个文书图像对应的编码数据De和文字代码(即与该文书图像关联的多个候补文字的文字代码)Dco相关联而进行存储的文书图像存储单元3903。
此外,上述文书文卷装置3900还具有根据从外部作为检索数据Da而输入的文字代码、读出上述文书图像存储单元3903存储的与指定的文书图像对应的编码数据De的数据读出单元3904,和将读出的编码数据De进行译码而复原为与指定的文书图像对应的文书图像数据Di的图像译码单元3905。这里,上述数据读出单元3904将作为上述检索数据Da的文字代码(检索文字代码)与文书图像存储单元3903存储的文字代码(存储文字代码)进行核对,输出与和该检索文字代码一致的存储文字代码对应的文书图像的编码数据De。
在该文书文卷装置3900中,将上述文字识别单元3901采用作为通过对各文字的文字识别处理而得到的文字数据而输出多个候补文字的文字代码Dco的结构,这样,来减轻检索中的文字识别错误的影响。
在这样的结构的文书文卷装置3900中,在输入文书图像数据Di时,由图像编码单元3902进行该文书图像数据Di的编码处理,输出编码数据De,由文字识别单元3901根据该文书图像数据Di从文书图像中抽出包含在其中的文字图像,输出与该文字图像对应的多个候补文字的文字代码Dco。
并且,使与1个文书图像对应的编码数据De与多个文字代码Dco相关联而存储到文书图像存储单元3903中。
另外,在从外部输入检索数据Da时,由数据读出单元3904根据作为该检索数据Da的文字代码读出上述文书图像存储单元3903存储的与指定的文书图像对应的编码数据De,由图像译码单元3905对该编码数据De进行译码处理后复原为文书图像数据Di。
然而,在上述结构的先有的文书文卷装置3900中,由图像编码单元3902进行的文书图像数据Di的编码处理与包含在文书图像中的文字的种类无关,或者与包含在该文书图像中的文字、图、照片等文书图像的构成要素的种类无关,都一样地进行,所以,存在随情况不同而编码效率变坏的问题。
另外,在先有的文书文卷装置3900的文字识别单元3901中,通过对包含在文书图像中的各文字的文字识别处理,对包含在文书图像中的各文字输出多个候补文字的文字代码,但是,通常在根据对1个文字的文字识别的结构而得到的多个候补文字中存在包含与文字形状非常相似的文字对应的文字的倾向。换言之,如果知道了1个候补文字(通常为第1候补文字),则其他的候补文字便可类推,所以,如上所述,通过对各文字的文字识别,将导出多个候补文字代码,从而通过文字识别而得到的文字数据将变得非常冗长,数据量大增。
本发明就是为了解决上述问题而提案,目的旨在提供不影响对包含在文书图像中的文字图像的检索的容易性而可以实现对包含文字的文书图像的数据有效地进行编码的编码处理的图像编码装置、可以良好地进行与该编码处理对应的译码处理的图像译码装置和存储用于使计算机进行上述编码处理和译码处理的程序的数据存储媒体。
本发明的目的还在于提供对将与文字图像(文书图像的文字部分)对应的图像数据进行编码而得到的文字图像代码不进行译码而可以与输入的文字数据比较进行核对的核对处理的文书核对装置和存储用于使计算机进行上述核对处理的程序的数据存储媒体。
本发明(权利要求1)的图像编码装置是将与作为编码处理的对象的对象图像对应的图像数据根据与和该对象图像类似的预测图像对应的图像数据进行编码的装置,其特征在于具有根据表示构成上述对象图像的多个部分图像的特征的图像特征数据生成与和上述多个部分图像类似的部分预测图像对应的图像数据的预测图像生成单元、根据与上述多个部分预测图像对应的图像数据和表示对象图像的部分图像的位置和大小的辅助数据合成上述多个部分预测图像从而生成与上述预测图像对应的图像数据的图像合成单元和利用上述对象图像与预测图像间的像素值相关对与上述对象图像对应的图像数据进行熵编码处理并作为与上述对象图像对应的图像编码数据而输出熵代码的熵编码单元,与该熵代码一起输出上述图像特征数据和辅助数据。
在这种结构的权利要求1所述的图像编码装置中,根据表示对象图像的特征的图像特征数据生成与对象图像对应的预测图像数据,对与上述对象图像对应的图像数据进行参照上述预测图像数据的熵编码处理,所以,可以提高对上述对象图像的图像数据的熵编码处理的编码效率。另外,不会损失利用图像特征数据对对象图像的检索的容易性。
本发明(权利要求2)在权利要求1所述的图像编码装置中,具有根据与上述对象图像对应的图像数据生成表示构成上述对象图像的各部分图像的特征的图像特征数据和表示上述对象图像的各部分图像的位置和大小的辅助数据的图像特征抽出单元。
在这种结构的权利要求2所述的图像编码装置中,除了上述权利要求1所述的图像编码装置的结构外,还具有从与上述对象图像对应的图像数据中抽出上述图像特征数据的图像特征抽出单元,所以,除了权利要求1所述的可以不损失利用图像特征数据对对象图像的检索的容易性而提高编码效率的效果外,可以自动地从对象图像的图像数据中抽出图像特征数据,从而可以得到作为传真装置等的图像编码单元而有用的图像编码装置。
本发明(权利要求3)在权利要求2所述的图像编码装置中,上述熵编码单元具有与构成预测图像的指定尺寸的预测块对应地分割上述预测图像的图像数据并输出与各预测块对应的图像数据的第1图像块化单元、与构成对象图像的指定尺寸的对象块对应地份上述对象图像的图像数据并输出与各对象块对应的图像数据的第2图像块化单元,和根据各预测块和对象块间的像素值相关对与上述各对象块对应的图像数据进行熵编码的块预测编码单元,上述块预测编码单元在上述对象块与预测块的差别在一定的基准值以上时,对与对象块对应的图像数据进行熵编码,与对应的图像编码数据一起输出编码标志,在上述对象块与预测块的椎小于一定的基准值时,就不对对象块进行熵编码处理,而输出非编码标志。
在这种结构的权利要求3所述的图像编码装置中,根据与对象图像对应的预测图像数据将该预测图像分割为指定尺寸的预测块,同时将上述对象图像分割为指定尺寸的对象块,将与各对象块对应的图像数据参照与对应的预测块对应的图像数据进行熵编码,这时,仅对与预测块间的像素值的差分大于指定值的对象块发送对应的编码数据,所以,可以不计在块单位的比较中小的差别,对视听者不会有画质劣化的印象,可以大大提高编码效率。
本发明(权利要求4)在权利要求2所述的图像编码装置中,具有对上述预测图像的图像数据进行省略该预测图像的细部的滤波处理并输出预测图像的滤波处理数据的图像滤波处理单元,在上述熵编码单元中,根据上述滤波处理数据对对象图像的图像数据进行熵编码处理。
在这种结构的权利要求4所述的图像编码装置中,对根据与对象图像对应的图像数据而得到的预测图像数据进行滤波处理,参照进行了该滤波处理的预测图像数据对上述对象图像的图像数据进行熵编码处理,所以,通过上述滤波处理可以减小对对象图像的预测图像的预测误差,从而可以进一步提高对上述对象图像的图像数据进行熵编码处理的编码效率。
本发明(权利要求5)的图像译码装置是将对与作为编码处理的对象的对象图像对应的图像数据利用该对象图像和与其类似的预测图像间的像素值相关进行熵编码处理而得到的与对象图像对应的图像编码数据进行译码的装置,其特征在于具有根据表示构成上述对象图像的多个部分图像的特征的图像特征数据生成与和上述多个部分图像类似的部分预测图像对应的图像数据的预测图像生成单元、根据与上述多个部分预测图像对应的图像数据和表示上述对象图像的部分图像的位置和大小的辅助数据、合成上述多个部分预测图像、从而生成与上述预测图像对应的图像数据的图像合成单元,和根据与上述预测图像对应的图像数据、利用上述对象图像与预测图像间的像素值相关、对与上述对象图像对应的图像编码数据进行熵译码处理、从而生成与上述对象图像对应的图像数据的熵译码单元。
在这种结构的权利要求5所述的图像译码装置中,根据对象图像的图像特征生成与对象图像对应的预测图像数据,参照上述预测图像数据对与对象图像对应的编码数据进行熵译码,所以,可以实现与使用预测图像数据的效率高的对象图像数据的熵编码处理对应的译码处理。
本发明(权利要求6)的图像译码装置是接收从权利要求3所述的图像编码装置输出的图像编码数据、编码标志或非编码标志、图像特征数据和辅助数据而生成与对象图像对应的图像编码数据的图像译码装置,其特征在于具有根据表示构成上述对象图像的多个部分图像的特征的图像特征数据生成与和上述多个部分图像类似的部分预测图像对应的图像数据的预测图像生成单元、根据与上述多个部分预测图像对应的图像数据和表示上述对象图像的部分图像的位置和大小的辅助数据合成上述多个部分预测图像从而生成与上述预测图像对应的图像数据的图像合成单元、与构成预测图像的指定尺寸的预测块对应地分割上述预测图像的图像数据并输出与各预测块对应的图像数据的图像块化单元、根据与各预测块对应的图像数据流上述对象块与预测块间的像素值相关对与上述对象块对应的图像编码数据进行熵译码处理从而生成与上述对象块对应的图像数据的块预测译码单元,和接收与上述预测块对应的图像数据和与对象块对应的图像数据并根据上述编码标志和非编码标志使用对象块和预测块组装上述对象图像从而复原与该对象图像对应的图像数据的块组装单元。
在这种结构的权利要求6所述的图像译码装置中,根据从对象图像中抽出的图像特征预先作成预测图像,将该预测图像分割为指定尺寸的预测文书块,生成与预测图像块对应的图像数据,参照预测图像块的图像数据对与分割对象图像而得到的指定尺寸的图像块对应的编码数据进行熵译码,这时,对未进行编码处理的预测误差小的对象图像的块输出对应的预测图像的块的图像数据,所以,可以实现与使用预测图像数据的按指定尺寸的块单位效率高的对象图像的图像数据的编码处理对应的译码处理。
本发明(权利要求7)在权利要求5所述的图像译码装置中,具有对上述预测图像的图像数据进行省略该预测图像的细部的滤波处理并输出预测图像的滤波处理数据的图像滤波处理单元,在上述熵译码单元中,根据上述滤波处理数据对对象图像的图像编码数据进行熵译码处理。
在这种结构的权利要求7所述的图像译码装置中,根据对象图像的图像特征预先生成与预测图像对应的图像数据,对预测图像数据进行省略该预测图像的细部的滤波处理,参照进行了滤波处理的预测图像数据对与对象图像对应的编码数据进行熵译码,所以,可以实现与使用进行了滤波处理的预测图像数据的效率高的对象图像数据的编码处理对应的译码处理。
本发明(权利要求8)的图像编码装置是对与作为编码处理的对象的对象图像对应的图像数据根据与和对象图像类似的预测图像对应的图像数据进行编码的装置,其特征在于具有根据表示上述对象图像的特征的图像特征数据生成与和上述对象图像类似的预测图像对应的图像数据的预测图像生成单元和利用上述对象图像与预测图像间的像素值相关对与上述对象图像对应的图像数据进行熵编码处理并作为与上述对象图像对应的图像编码数据而输出熵代码的熵编码单元,对上述对象图像输出熵代码和图像特征数据。
在这种结构的权利要求8所述的图像编码装置中,根据与作为编码处理的对象的对象图像对应的图像特征数据生成与上述对象图像对应的预测图像数据并根据该预测图像数据对对象图像数据进行熵编码处理,所以,可以提高熵编码处理的编码效率。
另外,和与上述对象图像数据对应的熵代码(编码数据)一起输出与对象图像对应的图像特征数据,所以,也可以根据图像特征数据检索与对象图像对应的编码数据。
本发明(权利要求9)在权利要求8所述的图像编码装置中,具有根据与上述对象图像对应的图像数据从上述对象图像中抽出其图像特征并将图像特征数据向上述预测图像生成单元输出的图像特征抽出单元。
在这种结构的权利要求9所述的图像编码装置中,具有从对象图像数据中抽出与对象图像对应的图像特征数据的图像特征抽出单元,所以,除了权利要求8的效果外,可以由图像编码装置从对象图像数据中抽出图像特征数据,从而可以得到适合于作为文书编档装置或传真装置中的图像编码单元的图像编码装置。
本发明(权利要求10)在权利要求9所述的图像编码装置中,上述图像特征抽出单元由与分割对象图像的指定尺寸的多个块对应地分割与上述对象图像对应的图像数据从而生成与各块对应的图像数据的块化单元、和将与上述各块对应的图像数据转换为在各块内的各像素的像素值中出现频度最高的最频像素值并作为与上述对象图像对应的图像特征数据而输出与由和上述各块对应的最频像素值组成的缩小图像对应的图像数据的块平滑化单元构成,上述预测图像生成单元生成与对上述指定尺寸的块将上述缩小图像的各像素放大而成的应构成各块的像素成为与上述对象块对应的最频像素值的预测图像对应的图像数据。
在这种结构的权利要求10所述的图像编码装置中,与分割对象图像的指定尺寸的多个块对应地分割与上述对象图像对应的图像数据,将与上述各块对应的图像数据转换为在各块内的各像素的像素值中出现频度最高的最频像素值,作为与上述对象图像对应的图像特征数据,输出与由和上述各块对应的最频像素值组成的缩小图像对应的图像数据,所以,可以简单地作成表示对象图像的特征的图像特征数据。
本发明(权利要求11)在权利要求9所述的图像编码装置中,上述图像特征抽出单元由根据与上述对象图像对应的图像数据输出表示与该对象图像类似的类似图像的特征的特征矢量的特征量抽出单元、和将对通过对上述特征矢量的量化处理而划分定义了多个学习矢量的矢量空间的多个区域中的包含上述特征矢量的区域设定的标识符作为与上述对象图像对应的图像特征数据而输出的矢量量化单元构成,上述预测图像生成单元根据与设定了上述标识符的矢量空间的区域对应的代表特征矢量和最近的学习矢量生成与上述对象图像对应的预测图像的图像数据。
在这种结构的权利要求11所述的图像编码装置中,具有作为对象图像的图像特征抽出与和对象图像类似的类似图像对应的标识符的图像特征抽出单元,根据上述标识符作为对象图像的预测图像,求上述类似图像,参照该类似图像对对象图像数据进行熵编码处理,所以,可以提高熵编码处理的编码效率,而且也可以使用上述标识符检索对对象图像的编码数据。
另外,将与包含在对象图像(文书图像)中的各个文字图像对应的特征矢量进行量化处理,根据与其对应的代表特征矢量生成与上述文字图像对应的预测图像数据,所以,作为上述文书图像的各文字图像的图像特征数据,输出1个代表特征矢量,可以避免与文书图像对应的图像特征数据变得冗长,而且可以减轻在利用图像特征数据进行文书图像的检索时文字识别的错误(特征抽出的偏差)的影响。
本发明(权利要求12)的图像译码装置是将对与作为编码处理的对象的对象图像对应的图像数据利用该对象图像与和其类似的预测图像间的像素值相关进行熵编码处理而得到的与对象图像对应的图像编码数据进行译码的装置,其特征在于具有根据表示上述对象图像的图像特征的图像特征数据生成与和该对象图像对应的预测图像对应的图像数据的预测图像生成单元、和根据与上述预测图像对应的图像数据利用上述对象图像与预测图像间的像素值相关对与上述对象图像对应的图像编码数据进行熵译码处理从而生成与上述对象图像对应的图像数据的熵译码单元。
在这种结构的权利要求12所述的图像译码装置中,具有根据与对象图像对应的图像特征数据生成与对象图像对应的预测图像数据的预测图像生成单元,参照预测图像数据对该编码数据进行算术译码处理,所以,可以实现将利用对象图像与预测图像的相关通过编码效率高的算术编码处理而得到的熵代码正确地进行译码的图像译码装置。
本发明(权利要求13)在权利要求1、权利要求2、权利要求8和权利要求9中的任一权项所述的图像编码装置中,上述图像特征数据是与分割上述对象图像的指定尺寸的块对应地分割对象图像的图像数据并将与各块对应的图像数据置换为各块内的像素的像素值中出现频度最高的最频像素值而得到的与缩小图像对应的图像数据,上述预测图像生成单元生成与将上述缩小图像的各像素对上述指定尺寸的块放大而成的应构成各块的像素成为与上述对象块对应的最频像素值的预测图像对应的图像数据。
在这种结构的权利要求13所述的图像编码装置中,和上述权利要求10一样,作为与上述对象图像对应的图像特征数据,输出由与上述各块对应的最频像素值构成的与缩小图像对应的图像数据,所以,可以简单地作成表示对象图像的特征的图像特征数据。
本发明(权利要求14)在权利要求5或权利要求12所述的图像译码装置中,上述图像特征数据是与分割上述对象图像的指定尺寸的块对应地分割对象图像的图像数据并将与各块对应的图像数据置换为各块内的像素的像素值中出现频度最高的最频像素值而得到的与缩小图像对应的图像数据,上述预测图像生成单元生成与将上述缩小图像的各像素对上述指定尺寸的块放大而成的应构成各块的像素成为与上述对象块对应的最频像素值的预测图像对应的图像数据。
在这种结构的权利要求14所述的图像译码装置中,将把与分割对象图像的指定尺寸的块对应的图像数据置换为各块内的像素的像素值中出现频度最高的最频像素值而得到的与缩小图像对应的图像数据作为特征图像数据接收,生成与将上述缩小图像的各像素对上述指定尺寸的块放大而成的应构成各块的像素成为与上述对象块对应的最频像素值的预测图像对应的图像数据,所以,可以实现与权利要求13所述的图像编码装置对应的图像译码装置。
本发明(权利要求15)在权利要求1、权利要求2、权利要求8、权利要求9中的任一权项所述的图像编码装置中,上述图像特征数据是与从使用表示与该对象图像类似的类似图像的特征的特征矢量预先在矢量空间中定义的多个已存矢量中选择的选择矢量对应的标识符,上述预测图像生成单元将由与上述标识符对应的选择矢量所特定的图像数据作为对上述对象图像的预测图像的图像数据而输出。
在这种结构的权利要求15所述的图像编码装置中,作为对象图像的图像特征,使用与和对象图像类似的类似图像对应的标识符,根据上述标识符,作为对象图像的预测图像,求上述类似图像,参照该类似图像对对象图像数据进行熵编码处理,所以,可以提高熵编码处理的编码效率,而且也可以使用上述标识符检索对对象图像的编码数据。
本发明(权利要求16)在权利要求5或权利要求12所述的图像译码装置中,上述图像特征数据是与从使用表示与该对象图像类似的类似图像的特征的特征矢量预先在矢量空间中定义的多个已存矢量中选择的选择矢量对应的标识符,上述预测图像生成单元将由与上述标识符对应的选择矢量所特定的图像数据作为对上述对象图像的预测图像的图像数据而输出。
在这种结构的权利要求16所述的图像译码装置中,作为图像特征数据使用与和对象图像类似的类似图像对应的标识符,根据上述标识符作为对上述对象图像的预测图像数据而输出,所以,可以实现利用与对象图像的类似图像对应的标识符和对象图像与预测图像的像素值相关通过编码效率高的熵编码处理而得到的熵代码正确地进行译码的图像译码装置。
本发明(权利要求17)的图像编码装置是将与作为编码处理的对象的对象图像对应的图像数据根据与和上述对象图像类似的预测图像对应的图像数据进行编码的装置,其特征在于具有接收从外部输入的与上述预测图像对应的图像数据,并根据与上述预测图像对应的图像数据,利用上述对象图像与预测图像间的像素值相关,对与上述对象图像对应的图像数据进行熵编码处理,从而作为与上述对象图像对应的图像编码数据而输出熵代码的熵编码单元,与对上述对象图像的熵代码一起输出与上述预测图像对应的图像数据。
在这种结构的权利要求17所述的图像编码装置中,具有将对象图像数据参照与其对应的预测图像数据进行熵编码处理的熵代码单元,所以,在进行对象图像数据的编码处理时,通过指定与该对象图像类似的类似图像的数据并将该数据作为与对象图像对应预测图像数据而输入,便可提高熵编码处理的编码效率。
本发明(权利要求18)在权利要求17所述的图像编码装置中,具有根据与上述对象图像对应的图像数据将与和该对象图像类似的预测图像对应的图像数据向上述熵编码单元输出的图像预测单元。
在这种结构的权利要求18所述的图像编码装置中,根据对象图像数据生成与其对应的预测图像数据,参照预测图像数据将上述对象图像数据进行熵编码,所以,可以提高熵编码处理的编码效率,而且也可以使用上述标识符检索对对象图像的编码数据。
本发明(权利要求19)在权利要求18所述的图像编码装置中,上述图像预测单元由根据与上述对象图像对应的图像数据输出表示与该对象图像类似的类似图像的图像特征的特征矢量的特征量抽出单元、通过对上述特征矢量的量化处理将在划分定义了多个学习矢量的矢量空间的多个区域中的上述特征矢量的区域中设定的标识符作为对上述对象图像的图像特征数据而输出的矢量量化单元,和根据与设定上述标识符的矢量空间中的区域对应的代表特征矢量和最近的学习矢量生成与上述对象图像对应的预测图像的数据的预测图像生成单元构成。
在这种结构的权利要求19所述的图像编码装置中,具有根据对象图像数据生成与其对应的预测图像数据的预测图像生成单元,将上述对象图像数据参照预测图像数据进行熵编码,所以,和上述权利要求18一样,可以提高熵编码处理的编码效率,而且也可以使用上述标识符检索对对象图像的编码数据。
本发明(权利要求20)的图像译码装置是将对与作为编码处理的对象的对象图像对应的图像数据利用该对象图像和与其类似的预测图像间的像素值相关进行熵编码处理而得到的与对象图像对应的图像编码数据进行译码的装置,其特征在于具有根据与和上述对象图像对应的图像编码数据独立地输入的与预测图像对应的图像数据利用上述对象图像与预测图像间的像素值相关对与上述对象图像对应的图像编码数据进行熵译码处理从而生成与上述对象图像对应的图像数据的熵译码单元。
在这种结构的权利要求20所述的图像译码装置中,参照与对象图像对应的预测图像数据对与对象图像对应的编码数据进行熵译码处理,所以,可以实现将通过利用对象图像与预测图像的相关的编码效率高的熵编码处理而得到的熵代码正确地进行译码的图像译码装置。
本发明(权利要求21)的图像编码装置是将与作为编码处理的对象的对象图像对应的图像数据根据与该对象图像的预测图像对应的图像数据进行编码的装置,其特征在于具有根据与上述对象图像对应的图像数据从上述对象图像中抽出其图像特征并输出与对象图像对应的图像特征数据的图像特征抽出单元、根据与上述对象图像对应的图像特征数据生成与和上述对象图像类似的类似图像对应的图像数据的预测图像生成单元、使与编码处理结束的对象图像对应的图像数据和图像特征数据相关联作为与处理过的图像对应的图像数据和图像特征数据而存储的预测图像存储单元、通过比较与对象图像对应的图像特征数据和预测图像存储单元存储的与处理过的图像对应的图像特征数据、而将上述类似图像或指定的处理过的图像作为预测图像而选择的预测图像选择单元,和利用上述对象图像与预测图像间的像素值相关、对与上述对象图像对应的图像数据进行熵编码处理、并作为与上述对象图像对应的图像编码数据而输出熵代码的熵编码单元,上述预测图像选择单元作为上述预测图像在输出表示选择上述类似图像和指定的处理过的图像中的哪一个的标志的同时输出与上述对象图像对应的图像特征数据。
在这种结构的权利要求21所述的图像编码装置中,具有通过比较与对象图像对应的图像特征数据和预测图像存储单元存储的与处理过的图像对应的图像特征数据选择与该对象图像对应的类似图像和指定的处理过的图像的一方的预测图像选择单元,由对与上述对象图像对应的图像数据进行熵编码的熵编码单元在输出表示选择上述类似图像和指定的处理过的图像中的哪一个的标志的同时输出与上述对象图像对应的图像特征数据,所以,不仅可以提高熵编码处理的编码效率,而且在例如作为编码处理的对象的文字图像是和已进行了编码处理的文字图像相同时可以省略生成对对象图像的预测图像数据的处理,从而可以减轻使用预测图像的编码处理的运算负载。
本发明(权利要求22)在权利要求21所述的图像编码装置中,上述图像特征抽出单元由根据与上述对象图像对应的图像数据作为与对象图像对应的图像特征数据生成第1特征矢量的特征量抽出单元和根据上述第1特征矢量进行对上述对象图像的文字识别并生成与对象图像对应的文字代码的文字识别单元构成,上述预测图像生成单元根据与上述对象图像对应的文字代码作为第1预测图像数据而生成与该对象图像的类似图像对应的图像数据,上述预测图像存储单元将与结束了上述编码处理的对象图像对应的图像数据、文字代码和第1特征矢量相关联地进行存储,上述预测图像选择单元将和与对象图像对应的文字代码一致的文字代码相关联的图像数据和特征矢量作为第2预测图像数据和第2特征矢量而读出,根据上述第1和第2特征矢量的比较结果输出上述第1和第2预测图像数据中的一方。
在这种结构的权利要求22所述的图像编码装置中,由上述预测图像选择单元通过比较与类似图像对应的特征矢量和与处理过的图像对应的特征矢量将上述类似图像或处理过的图像选择为预测图像,所以,可以通过对应的特征矢量的比较这样简单的处理进行类似图像或处理过的图像的选择。
本发明(权利要求23)的图像译码装置是将对与作为编码处理的对象的对象图像对应的图像数据利用该对象图像和与其对应的预测图像间的像素值相关进行熵编码处理而得到的与对象图像对应的图像编码数据进行译码的装置,其特征在于具有根据表示上述对象图像的图像特征的图像特征数据生成与和该对象图像类似的类似图像对应的图像数据的预测图像生成单元、将与译码处理结束的对象图像对应的图像数据和图像特征数据相关联作为与处理过的图像对应的图像数据和图像特征数据而存储的预测图像存储单元、作为在编码处理时与对象图像对应的预测图像根据表示使用从对象图像的图像特征得到的类似图像和编码处理过的图像中的哪一个的标志信息将上述类似图像或指定的处理过的图像选择为预测图像的预测图像选择单元,和根据与上述预测图像对应的图像数据利用上述对象图像与预测图像间的像素值相关对与上述对象图像对应的图像编码数据进行熵译码处理从而生成与上述对象图像对应的图像数据的熵译码单元。
在这种结构的权利要求23所述的图像译码装置中,在从对象图像的文字代码得到的字体图像(第1预测图像)和过去进行了译码处理的文字图像(第2预测图像)中根据对象图像选择类似的作为预测图像,参照所选择的预测图像数据对与对象图像对应的熵代码进行译码处理,所以,在熵编码处理的编码效率高而且作为编码处理的对象的文字图像和已进行了编码处理的文字图像相同时可以实现能够省略对对象图像的预测图像数据的生成处理从而可以降低运算负载的与熵编码处理对应的译码处理。
本发明(权利要求24)在权利要求23所述的图像译码装置中,上述预测图像生成单元根据作为与对象图像对应的图像特征数据的文字代码生成与上述对象图像对应的第1预测图像数据,上述预测图像存储单元使与译码处理结束的对象图像对应的图像数据和文字代码相关联作为与处理过的图像对应的图像数据和文字代码进行存储,上述预测图像选择单元将与和对象图像对应的文字代码一致的文字代码相关联的图像数据作为第2预测图像数据从上述预测图像存储单元中读出,并根据上述标志信息输出上述第1和第2预测图像数据中的一方的数据。
在这种结构的权利要求24所述的图像译码装置中,根据上述标志信息,在根据对象图像的文字代码得到的字体图像(第1预测图像)和过去进行了译码处理的文字图像(第2预测图像)中根据对象图像选择类似的作为预测图像,所以,可以简单地进行在译码侧的预测图像的选择处理。
本发明(权利要求25)的图像编码装置是将与作为编码处理的对象的对象图像对应的图像数据根据与该对象图像的预测图像对应的图像数据进行编码的装置,其特征在于具有根据与上述对象图像对应的图像数据从上述对象图像中抽出其图像特征并输出与对象图像对应的图像特征数据的图像特征抽出单元、根据与上述对象图像对应的图像特征数据生成与和上述对象图像类似的类似图像对应的图像数据的预测图像生成单元、将与编码处理结束的对象图像对应的图像特征数据作为与处理过的图像对应的图像特征数据进行存储的预测图像存储单元、通过比较与对象图像对应的图像特征数据和与预测图像存储单元存储的处理过的图像对应的图像特征数据进行输出与上述类似图像对应的图像数据、与对象图像对应的图像特征数据和表示进行编码处理的编码标志的第1数据输出处理和输出与对象图像对应的图像特征数据和表示不进行编码处理的非编码标志的第2数据输出处理中的一方的数据输出处理的数据输出控制单元,和利用上述对象图像和类似图像间的像素值相关对与上述对象图像对应的图像数据进行熵编码处理并作为与上述对象图像对应的图像编码数据而输出熵代码的熵编码单元,该熵编码单元接收到上述编码标志时就进行上述熵编码处理,在接收到上述非编码标志时就不进行上述熵编码处理,从而不输出熵代码。
在这种结构的权利要求25所述的图像编码装置中,通过比较与对象图像对应的图像特征数据和与预测图像存储单元存储的处理过的图像对应的图像特征数据,进行输出与上述类似图像对应的图像数据、与对象图像对应的图像特征数据和表示进行编码处理的编码标志的第1数据输出处理和输出与对象图像对应的图像特征数据和表示不进行编码处理的非编码标志的第2数据输出处理中的一方的数据输出处理,所以,不仅可以提高熵编码处理的编码效率,而且在例如作为编码处理的对象的文字图像与已进行了编码处理的文字图像相同时可以省略生成对对象图像的预测图像数据的处理和对对象图像数据的熵编码处理,从而可以减轻使用预测图像的运算编码处理的运算负载。
本发明(权利要求26)在权利要求25所述的图像编码装置中,上述图像特征抽出单元由根据与上述对象图像对应的图像数据作为与对象图像对应的图像特征数据而生成第1特征矢量的特征量抽出单元、和根据上述第1特征矢量对上述对象图像晒文字识别并生成与对象图像对应的文字代码的文字识别单元构成,上述预测图像生成单元根据与上述对象图像对应的文字代码作为预测图像数据生成与其类似图像对应的图像数据,上述预测图像存储单元使与上述编码处理结束的对象图像对应的文字代码与第1特征矢量相关联而进行存储,上述数据输出控制单元将与和对象图像对应的文字代码一致的文字代码相关联的特征矢量作为与预测图像对应的第2特征矢量而读出,进行输出与上述类似图像对应的图像数据、与对象图像对应的图像特征数据和表示进行编码处理的编码标志的第1数据输出处理和输出与对象图像对应的图像特征数据和表示不进行编码处理的非编码标志的第2数据输出处理中的一方的数据输出处理。
在这种结构的权利要求26所述的图像编码装置中,上述第1和第2数据处理都输出作为编码处理的对象的文字图像的文字代码,所以,可以使用上述文字代码检索对对象图像的编码数据。
本发明(权利要求27)的图像译码装置是将对与作为编码处理的对象的对象图像对应的图像数据、利用该对象图像和与其对应的预测图像间的像素值相关、进行熵编码处理而得到的与对象图像对应的图像编码数据进行译码的装置,其特征在于具有根据表示上述对象图像的图像特征的图像特征数据生成与该对象图像对应的第1预测图像数据的预测图像生成单元、与译码处理结束的对象图像对应的图像数据和图像特征数据相关联而作为与处理过的图像对应的图像数据和图像特征数据进行存储的预测图像存储单元、接收到表示进行了编码处理的编码标志时就进行输出上述第1预测图像数据和该编码标志的第1数据输出处理而在接收到表示未进行编码处理的非编码标志时就从上述预测图像存储单元这作为第2预测图像数据读出与译码处理过的图像对应的图像数据并进行输出第2预测图像数据和该非编码标志的第2数据输出处理的数据输出控制单元、和在接收到上述编码标志时根据第1预测图像数据利用上述对象图像和预测图像间的像素值相关对与该对象图像对应的图像编码数据进行熵译码处理并生成与上述对象图像对应的译码数据而在接收到上述非编码标志时就将上述第2预测图像数据作为与上述对象图像对应的译码数据而输出的熵译码单元。
在这种结构的权利要求27所述的图像译码装置中,在接收编码标志时根据与对象图像对应的预测图像数据利用上述对象图像和预测图像间的像素值相关对与上述对象图像对应的图像编码数据进行熵译码处理,生成与上述对象图像对应的译码数据,而在接收到上述非编码标志时,将与译码处理过的图像对应的图像数据作为与上述对象图像对应的译码数据而输出,所以,不仅可以提高算术编码器的编码效率,而且在例如作为编码处理的对象的文字图像和已进行了编码处理的文字图像相同时可以省略生成对对象图像的预测图像数据的处理和对对象图像数据的算术编码处理,从而可以实现可以降低运算负载的与算术编码处理对应的算术译码处理。
本发明(权利要求28)在权利要求27所述的图像译码装置中,上述预测图像生成单元根据作为与对象图像对应的图像特征数据的文字代码生成与上述对象图像对应的第1预测图像数据,上述预测图像存储单元将与译码处理结束的对象图像对应的图像数据和文字代码相关联而作为与处理过的图像对应的图像数据和文字代码进行存储,上述数据输出控制单元将与和对象图像对应的文字代码一致的文字代码相关联的图像数据作为第2预测图像数据读出,并根据上述标志信息输出上述第1和第2预测图像数据的中的一方的数据。
在这种结构的权利要求28所述的图像译码装置中,根据上述标志信息,在根据对象图像的文字代码而得到的字体图像(第1预测图像)和过去已进行了译码处理的文字图像(第2预测图像)中根据对象图像选择类似的作为预测图像,所以,可以简单地进行译码侧的预测图像的选择处理。
本发明(权利要求29)在权利要求1、权利要求2、权利要求8、权利要求9、权利要求17、权利要求18、权利要求21、和权利要求25中的任一权项所述的图像编码装置中,上述熵代码是对与上述对象图像对应的图像数据进行切换构成对象图像的各像素的像素值的发生概率的算术编码处理而得到的算术代码,上述熵编码单元根据与和上述对象图像类似的预测图像对应的图像数据和与上述对象图像的编码过的部分对应的图像数据切换各像素的像素值的发生概率。
在这种结构的权利要求29算术的图像编码装置中,根据与和上述对象图像类似的预测图像对应的图像数据和与上述对象图像的编码过的部分对应的图像数据以更高的编码效率进行对对象图像数据的算术编码处理。
本发明(权利要求30)在权利要求5、权利要求12、权利要求20、权利要求23、和权利要求27中的任一权项算术的图像译码装置中,上述熵代码是对与上述对象图像对应的图像数据进行切换构成对象图像的各像素的像素值的发生概率的算术编码处理而得到的算术代码,上述熵译码单元根据与和上述对象图像类似的预测图像对应的图像数据和与上述对象图像的译码过的部分对应的图像数据对与上述对象图像对应的算术代码进行切换各像素的像素值的发生概率的算术译码处理,再生与上述对象图像对应的图像数据。
在这种结构的权利要求30所述的图像译码装置中,根据与和上述对象图像类似的预测图像对应的图像数据和与上述对象图像的编码过的部分对应的图像数据以更高的编码效率进行对与对象图像对应的编码数据的算术译码处理。
本发明(权利要求31)在权利要求1、权利要求2、权利要求8、权利要求9、权利要求17、权利要求18、权利要求21、和权利要求25中的任一权项所述的图像编码装置中,上述熵代码是对与上述对象图像对应的图像数据进行切换构成对象图像的各像素的霍夫曼编码表的编码处理而得到的霍夫曼代码,上述熵编码单元根据与和上述对象图像类似的预测图像对应的图像数据和与上述对象图像的编码过的部分对应的图像数据切换各像素的霍夫曼编码表。
在这种结构的权利要求31所述的图像编码装置中,根据与和上述对象图像类似的预测图像对应的图像数据和与上述对象图像的编码过的部分对应的图像数据以更高的编码效率进行对对象图像的霍夫曼编码处理。
本发明(权利要求32)在权利要求5、权利要求12、权利要求20、权利要求23、和权利要求27中的任一权项算术的图像译码装置中,上述熵代码是对与上述对象图像对应的图像数据进行对构成对象图像的各像素切换霍夫曼编码表的编码处理而得到的霍夫曼代码,上述熵译码单元根据与和上述对象图像类似的预测图像对应的图像数据和与上述对象图像的译码过的部分对应的图像数据对与上述对象图像对应的图像编码数据进行对各像素切换霍夫曼编码处理的译码处理,再生与上述对象图像对应的图像数据。
在这种结构的权利要求32所述的图像译码装置中,根据与和上述对象图像类似的预测图像对应的图像数据和与上述对象图像的译码过的部分对应的图像数据可以以更高的编码效率对与对象图像对应的编码数据进行霍夫曼译码处理。
本发明(权利要求33)在权利要求1、权利要求2、权利要求8、权利要求9、权利要求17、权利要求18、权利要求21、和权利要求25中的任一权项所述的图像编码装置中,具有接收与上述对象图像关联的属性信息并将上述属性信息附加到与上述对象图像对应的图像编码数据上而输出的属性信息附加单元。
在这种结构的权利要求33所述的图像编码装置中,将关于对象图像的属性信息附加到与对象图像对应的图像编码数据上而输出,所以,不将例如作为图像编码数据的文字图像代码进行译码就可以知道文字图像的属性。
另外,在使用图像特征数据进行文字图像的检索时,可以参照文字图像的属性信息进行快速检索。
本发明(权利要求34)的图像编码装置是将与作为编码处理的对象的包含文字图像的对象图像对应的图像数据进行编码的装置,其特征在于具有接收与上述对象图像对应的图像数据对与包含在上述对象图像中的文字图像对应的图像数据进行编码并输出文字图像代码的文字图像编码单元、将构成上述对象图像中的上述文字图像的配置部分的像素的像素值利用位于上述对象图像中的上述文字图像的配置部分的周边的像素的像素值进行置换,生成与消去上述对象图像的文字图像的非文字图像对应的图像数据的文字图像消去单元和将与上述非文字图像对应的图像数据进行编码并输出非文字图像代码的非文字图像编码单元,作为对上述对象图像的编码数据,输出上述文字图像代码和非文字图像代码。
在这种结构的权利要求34所述的图像编码装置中,将文书图像的数据分为文字图像和非文字图像进行编码,所以,可以将文字图像和非文字图像用适用于它们的编码效率高的编码方法进行编码。另外,可以利用与文字图像对应的编码数据(文字图像代码)进行文书检索。
本发明(权利要求35)的图像译码装置是接收将与包含在对象图像中的文字图像对应的图像数据编码而得到的文字图像代码和将构成上述对象图像中的上述文字图像的配置部分的像素利用位于上述对象图像中的上述文字图像的配置部分的周边的像素进行置换而得到的与非文字图像对应的图像数据并再生与包含上述文字图像的对象图像对应的图像数据的图像译码装置,其特征在于具有将上述非文字图像代码进行译码并输出与非文字图像对应的图像数据的非文字图像译码单元,和将上述文字图像代码进行译码并输出与文字图像对应的图像数据的文字图像译码单元,和根据与上述文字图像对应的图像数据和与非文字图像对应的图像数据将文字图像与非文字图像合成并输出与包含上述文字图像的对象图像对应的图像数据的图像再构成单元。
在这种结构的权利要求35所述的图像译码装置中,作为与文书图像对应的编码数据,分别接收文书图像中的文字图像的编码数据和消去了文书图像中的文字图像的非文字图像的编码数据,将各编码数据分别进行译码而生成文字图像数据和非文字图像数据,根据这些数据进行文书图像的再构成从而生成文书图像数据,所以,可以实现正确将分别利用适合于文字图像和非文字图像的有效的编码方法进行编码的编码数据进行译码的图像译码装置。
另外,可以利用与文字图像对应的编码数据(文字图像代码)进行文书图像的检索。
本发明(权利要求36)的文字核对装置是将表示用于检索文字图像的检索条件的检索数据与将和文字图像对应的图像数据进行编码而得到的文字图像代码进行核对的装置,其特征在于具有将上述文字图像代码附加和与其对应的文字图像关联的属性信息并根据附加到上述文字图像代码上的属性信息是否满足由上述检索数据所示的检索条件而进行上述检索数据与文字图像代码的核对的文字属性核对单元。
在这种结构的权利要求36所述的文字核对装置中,具有通过附加到文字图像代码上的属性信息与检索条件的核对来判断属性信息是否满足检索条件的文字核对单元,所以,即使在文字图像数据已进行了编码的状态,也可以只抽出包含在文书图像中的标题行中的大的文字或纵写的文字串。
本发明(权利要求37)的文字核对装置是将特定应检索的文字图像的文字代码与将和文字图像对应的图像数据进行编码而得到的附加了表示该文字图像的图像特征的图像特征数据的文字图像代码进行核对的装置,其特征在于具有从由上述文字代码所特定的文字图像中抽出表示该文字图像的图像特征的图像特征并输出图像特征数据的图像特征抽出单元,和通过附加到上述文字图像代码上的图像特征数据与根据上述文字代码得到的图像特征数据的核对而进行上述文字图像代码与文字代码是否一致的判断的核对判断单元。
在这种结构的权利要求37所述的文字核对装置中,具有根据从外部输入的文字代码抽出由该文字代码所特定的文字图像的图像特征并输出图像特征数据Vc的图像特征抽出单元,所以,可以将包含在文字图像代码中的特征图像数据和与文字代码对应的文字图像的图像特征数据进行比较。因此,在由文字代码所特定的文字图像与和文字图像代码对应的文字图像一致时,即使不将文字图像译码也可以知道与文字图像代码对应的文字图像,从而可以进行与文字图像代码D20对应的文字图像与其他的文字图像间的形状比较。
本发明(权利要求38)在权利要求37所述的文字核对装置中,上述附加到上述文字图像代码上的图像特征数据是表示与文字图像代码对应的文字图像的图像特征的特征矢量,上述图像特征抽出单元由根据上述文字代码生成与由该文字代码所特定的文字图像对应的图像数据的文字图像生成单元和根据与上述文字图像对应的图像数据抽出该文字图像的图像特征并输出表示上述图像特征的特征矢量的特征量抽出单元构成,上述核对单元具有计算附加到文字图像代码上的特征矢量与根据上述文字代码得到的特征矢量的距离的距离计算单元,根据该距离是否大于指定的阈值来进行上述文字图像代码与文字代码的一致判断。
在这种结构的权利要求38所述的文字核对装置中,根据附加到文字图像代码上的特征矢量与根据上述文字代码得到的特征矢量的距离是否大于指定的阈值进行上述文字图像代码与文字代码的一致判断,所以,可以简单地进行文字图像代码与文字代码的核对。
本发明(权利要求39)的文字核对装置是将特定应检索的文字图像的文字代码与将和文字图像对应的图像数据进行编码而得到的附加了与和该文字图像类似的预测文字图像对应的图像数据的文字图像代码进行核对的装置,其特征在于具有接收上述文字图像代码并根据与附加到该文字图像代码上的预测文字图像对应的图像数据从该预测文字图像中抽出其图像特征从而输出第1图像特征数据的第1图像特征抽出单元、接收上述文字代码并抽出由该文字代码所特定的文字图像的图像特征从而输出第2图像特征数据的第2图像特征抽出单元,和通过上述第1图像特征数据与第2图像特征数据的核对而进行上述文字图像代码与文字代码是否一致的判断的核对判断单元。
在这种结构的权利要求39所述的文字核对装置中,具有根据附加到文字图像代码上的预测文字图像数据输出与预测文字图像对应的第1图像特征数据的第1特征量抽出单元和根据从外部输入的文字代码抽出由该文字代码所特定的文字图像的图像特征并输出第2图像特征数据的第2图像特征抽出单元,所以,可以将与文字代码对应的文字图像的图像特征数据与包含在文字图像代码中的预测文字图像的特征图像数据进行比较。因此,在判定由文字代码特定的文字图像与和文字图像代码对应的预测文字图像一致时,即使不将文字图像代码进行译码也可以知道与文字图像代码对应的文字图像,从而可以进行与文字图像代码对应的文字图像与其他的文字图像间的形状比较。
本发明(权利要求40)在权利要求39所述的文字核对装置中,上述第1图像特征抽出单元作为上述第1图像特征数据输出第1特征矢量,上述第2图像特征抽出单元由根据上述文字代码生成与由该文字代码所特定的文字图像对应的图像数据的文字图像生成单元和根据与上述文字图像对应的图像数据抽出该文字图像的图像特征并输出表示上述图像特征的第2特征矢量的特征量抽出单元构成,上述核对判断单元具有计算上述第1特征矢量与第2特征矢量的距离的距离计算单元,根据该距离是否大于指定的阈值进行上述文字图像代码与文字代码的一致判断。
在这种结构的权利要求40所述的文字核对装置中,根据附加到文字图像代码熵的特征矢量与根据上述文字代码得到的特征矢量的距离是否大于指定的阈值来进行上述文字图像代码与文字代码的一致判断,所以,可以简单地进行文字图像代码与文字代码的核对。
本发明(权利要求41)的文字核对装置是将特定应检索的文字图像的文字代码与将和文字图像对应的图像数据进行编码而得到的附加了表示与该文字图像类似的预测文字图像的标识符的文字图像代码进行核对的装置,其特征在于具有存储表示上述预测文字图像的标识符和上述文字代码与将它们作为变量而计算的距离信息的对应关系的文字间距离表的表存储部、接收上述文字图像代码和文字代码并参照上述文字间距离表求以附加到上述文字图像代码熵的预测文字图像标示符和上述文字代码为变量的距离信息的距离计算单元和根据上述距离信息判断上述文字图像代码与上述文字代码是否一致的核对判断单元。
在这种结构的权利要求41所述的文字核对装置中,具有存储表示附加到文字图像代码上的预测文字图像标示符和文字代码与以它们为变量定义的距离信息的对应关系的文字间距离表的表存储部,上述预测文字图像标识符是识别与和上述文字图像代码对应的文字图像类似的预测文字图像的符号,上述距离信息是根据上述文字代码得到的特征矢量与根据预测文字图像标识符得到的代表特征矢量间的欧几里得距离,所以,可以进行与文字代码对应的特征矢量和与包含在文字图像代码中的预测文字图像标识符对应的特征矢量进行比较。因此,在判定由文字代码特定的文字图像与和文字图像代码对应的预测文字图像一致时,即使不将文字图像代码进行译码,根据输入的文字代码也可以知道与文字图像代码对应的文字图像,从而可以进行与文字图像代码对应的文字图像与其他的文字图像进行的形状比较。
本发明(权利要求42)的文字核对装置是将特定应检索的文字图像的文字代码与将和文字图像对应的图像数据进行编码而得到的附加了表示与该文字图像类似的预测文字图像的标识符的文字图像代码进行核对的装置,其特征在于具有接收上述文字图像代码并根据附加到该文字图像代码上的表示预测文字图像的标识符从预测文字图像中抽出其图像特征而输出第1图像特征数据的第1图像特征抽出单元、接收上述文字代码并抽出由该文字代码特定的文字图像的图像特征而输出第2图像特征数据的第2图像特征抽出单元和通过上述第1图像特征数据与第2图像特征数据的核对而进行上述文字图像代码与文字代码是否一致的判断的核对判断单元。
在这种结构的权利要求42所述的文字核对装置中,具有接收文字图像代码并根据附加到其上的预测文字图像标识符输出与预测文字图像对应的第1图像特征数据的第1特征量抽出单元和根据从外部输入的文字代码抽出由该文字代码特定的文字图像的图像特征而输出第2图像特征数据的第2图像特征抽出单元,所以,可以将与文字代码对应的文字图像的图像特征数据与包含在文字图像代码中的预测文字图像标识符对应的特征图像数据进行比较。因此,在判定由文字代码特定的文字图像与和文字图像代码对应的预测文字图像一致时,即使不将文字图像代码进行译码,根据输入的文字代码也可以知道与文字图像代码对应的文字图像,从而可以进行与文字图像代码对应的文字图像与其他的文字图像进行的形状比较。
本发明(权利要求43)的文字核对装置在权利要求42所述的文字核对装置中,上述第1图像特征抽出单元作为上述第1图像特征数据输出第1特征矢量,上述第2图像特征抽出单元由根据上述文字代码生成与由该文字代码所特定的文字图像对应的图像数据的文字图像生成单元和根据与上述文字图像对应的图像数据抽出该文字图像的图像特征并输出表示上述图像特征的第2特征矢量的特征量抽出单元构成,上述核对判断单元具有计算上述第1特征矢量与第2特征矢量的距离的距离计算单元,根据该距离是否大于指定的阈值进行上述文字图像代码与文字代码的一致判断。
在这种结构的权利要求43所述的文字核对装置中,根据附加到文字图像代码熵的特征矢量与根据上述文字代码得到的特征矢量的距离是否大于指定的阈值来进行上述文字图像代码与文字代码的一致判断,所以,可以简单地进行文字图像代码与文字代码的核对。
本发明(权利要求44)的数据存储媒体是存储用于利用计算机进行图像数据的处理的图象处理程序的数据存储媒体,其特征在于作为上述图象处理程序,存储用于利用计算机进行权利要求1~权利要求43中的任一权项所述的装置的图象处理的程序或利用计算机实现构成上述权利要求1~权利要求43中的任一权项所述的装置的至少1个单元的功能的程序。
在这种结构的数据存储媒体中,通过将上述程序安装到计算机中,可以利用软件实现权利要求1~权利要求43中的任一权项所述的装置。
本发明(权利要求45)的传真装置具有将作为发信对象的对象图像变换为电子数据而输出对象图像数据的扫描器、进行对象图像数据的编码处理并与编码数据一起输出表示对象图像的特征的图像特征数据的图像编码装置、给与上述对象图像对应的编码数据附加上与其对应的图像特征数据并通过通信线路收发包含编码数据和图像特征数据的复合数据的收发装置、接收包含在上述收发装置接收的复合数据中的编码数据和图像特征数据并根据图像特征数据将该编码数据进行译码从而输出对象图像数据的图像译码装置,和根据上述对象图像数据进行对象图像的显示或打印输出的图像输出装置,上述图像编码装置采用和上述权利要求2、权利要求8、权利要求9、权利要求14、权利要求17、权利要求18和权利要求33中的任一权项所述的图像编码装置相同的结构。
在这种结构的权利要求45所述的传真装置中,在进行对象图像数据的编码处理的图像编码装置中进行和上述权利要求2、权利要求8、权利要求9、权利要求14、权利要求17、权利要求18和权利要求33中的任一权项所述的图像编码装置相同的编码处理,可以提高对对象图像数据的编码处理的编码效率。
本发明(权利要求46)的传真装置具有将作为发信对象的对象图像变换为电子数据而输出对象图像数据的扫描器、进行对象图像数据的编码处理并与和对象图像对应编码数据一起输出表示对象图像的特征的图像特征数据的图像编码装置、给上述编码数据附加上与其关联的图像特征数据并通过通信线路收发包含编码数据和图像特征数据的复合数据的收发装置、接收包含在上述收发装置接收的复合数据中的编码数据和图像特征数据并根据图像特征数据将该编码数据进行译码从而输出对象图像数据的图像译码装置,和根据上述对象图像数据进行对象图像的显示或打印输出的图像输出装置,上述图像译码装置采用和上述权利要求5、权利要求12、和权利要求20的任一权项所述的图像译码装置相同的结构。
在这种结构的权利要求46所述的传真装置中,在进行对象图像数据的编码处理的图像编码装置中进行和上述权利要求5、权利要求12、权利要求16、和权利要求20中的任一权项所述的图像译码装置相同的译码处理,可以实现与对对象图像数据的效率高的编码处理对应的译码处理。
本发明(权利要求47)的文书文卷编排装置具有将作为传真的对象的对象图像变换为电子数据而输出对象图像数据的扫描器、进行对象图像数据的编码处理并与和上述对象图像对应的编码数据一起输出表示对象图像的特征的图像特征数据的图像编码装置、使上述编码数据和与其对应的图像特征数据相关联而进行存储的图像存储单元、将上述图像存储单元存储的与指定的图像对应的编码数据与和其对应的图像特征数据一起读出的数据读出单元、使用上述图像特征数据将该读出的编码数据进行译码而复原与指定的图像对应的图像数据的图像译码单元和根据上述图像数据进行上述指定的图像的显示或打印输出的图像输出装置,上述编码装置采用和上述权利要求2、权利要求8、权利要求9、权利要求14、权利要求17、权利要求18、和权利要求33中的任一权项所述的图像编码装置相同的结构。
在这种结构的权利要求47所述的传真装置中,进行对象图像数据的编码处理的图像编码装置中,进行和上述权利要求2、权利要求8、权利要求9、权利要求14、权利要求17、权利要求18、和权利要求33中的任一权项所述的图像编码装置相同的编码处理,可以提高对对象图像数据的编码处理的编码效率。
本发明(权利要求48)的文书文卷编排装置具有将作为传真的对象的对象图像变换为电子数据而输出对象图像数据的扫描器、进行对象图像数据的编码处理并与和上述对象图像对应的编码数据一起输出表示对象图像的特征的图像特征数据的图像编码装置、使上述编码数据和与其对应的图像特征数据相关联而进行存储的图像存储单元、将上述图像存储单元存储的与指定的图像对应的编码数据与和其对应的图像特征数据一起读出的数据读出单元、使用上述图像特征数据将该读出的编码数据进行译码而复原与指定的图像对应的图像数据的图像译码单元和根据上述图像数据进行上述指定的图像的显示或打印输出的图像输出装置,上述编码装置采用和上述权利要求5、权利要求12、权利要求16、和权利要求20中的任一权项所述的图像编码装置相同的结构。
在这种结构的权利要求48所述的传真装置中,在进行对象图像数据的编码处理的图像编码装置中进行和上述权利要求5、权利要求12、权利要求16、和权利要求20中的任一权项所述的图像译码装置相同的译码处理,可以实现与对对象图像数据的效率高的编码处理对应的译码处理。
本发明(权利要求49)的文书文卷编排装置具有将作为传真的对象的对象图像变换为电子数据而输出对象图像数据的扫描器、进行对象图像数据的编码处理并与和上述对象图像对应的编码数据一起输出表示对象图像的特征的图像特征数据的图像编码装置、使上述编码数据和与其对应的图像特征数据相关联而进行存储的图像存储单元、将上述图像存储单元存储的与指定的图像对应的编码数据与和其对应的图像特征数据一起读出的数据读出单元、使用上述图像特征数据将该读出的编码数据进行译码而复原与指定的图像对应的图像数据的图像译码单元和根据上述图像数据进行上述指定的图像的显示或打印输出的图像输出装置,上述数据读出单元采用包含上述权利要求36~权利要求43中的任一权项所述的文字核对装置的结构。
在这种结构的权利要求49所述的传真装置中,根据作为检索数据从外部输入的文字代码将与上述图像存储单元存储的与指定的图像对应的编码数据和与其对应的图像特征数据一起读出的数据读出单元采用包含上述权利要求36~权利要求43中的任一权项所述的文字核对装置的结构,所以,在判定由文字代码所特定的文字图像与和文字图像代码对应的附加信息一致时,即使不将文字图像代码进行译码,根据输入的文字代码也可以知道与文字图像代码对应的文字图像,从而可以进行与文字图像代码对应的文字图像与其他的文字图像间的形状比较。
图1是用于说明本发明实施例1的图像编码装置的框图。
图2是用于说明本发明实施例2的图像编码装置的框图。
图3是用于说明本发明实施例3的图像译码装置的框图。
图4是用于说明本发明实施例4的图像编码装置的框图。
图5是用于说明本发明实施例5的图像译码装置的框图。
图6是用于说明本发明实施例6的图像编码装置的框图。
图7是用于说明本发明实施例7的图像译码装置的框图。
图8是用于说明本发明实施例8的图像编码装置的框图。
图9是用于说明本发明实施例9的图像编码装置的框图。
图10是用于说明本发明实施例10的图像译码装置的框图。
图11是用于说明本发明实施例11的图像编码装置的框图。
图12是用于说明本发明实施例12的图像译码装置的框图。
图13是用于说明本发明实施例13的图像编码装置的框图。
图14是用于说明本发明实施例14的图像编码装置的框图。
图15是用于说明本发明实施例15的图像译码装置的框图。
图16是用于说明本发明实施例16的图像编码装置的框图。
图17是用于说明本发明实施例17的图像编码装置的框图。
图18是用于说明本发明实施例18的图像译码装置的框图。
图19是用于说明本发明实施例19的文字核对装置的框图。
图20是用于说明本发明实施例20的文字核对装置的框图。
图21是用于说明本发明实施例21的文字核对装置的框图。
图22是用于说明本发明实施例22的文字核对装置的框图。
图23是用于说明本发明实施例23的文字核对装置的框图。
图24(a)是表示与上述实施例1的文字图像对应的XY坐标的图,24(b)是表示与包含在该文书图像中的文字串对应的数据的结构的图。
图25(a)是表示在上述实施例1的图像编码装置的算术编码处理中使用的发生概率模型的图,图25(b)是用于说明使用上述发生概率模型的算术编码处理的模式图,图25(c)是表示通过上述算术编码处理而得到的2进制小数的图。
图26是用于说明上述实施例1的图像编码装置的算术编码处理的流程的图。
图27是用于说明上述实施例1的预测文书图像与文书图像的对应关系的图。
图28是用于说明上述实施例4的块预测编码单元的处理的流程的图。
图29是用于说明由上述实施例4的块预测编码单元进行编码的数据的模式图。
图30是用于说明上述实施例5的块预测译码单元的处理的流程的图。
图31是用于说明上述实施例6的形态滤波器的动作的图。
图32是用于说明上述实施例8的网格特征的抽出方法的图。
图33是用于说明根据上述实施例8的网格特征生成预测图像的图。
图34是用于说明上述实施例16的属性信息的图。
图35(a)是表示上述实施例16的属性信息的具体例的模式图,图35(b)是表示上述实施例19的检索条件的具体例的模式图。
图36是用于具体地说明由本发明实施例17的图像编码装置对文书图像进行编码的处理的一例的图。
图37是用于说明上述实施例22的文字间距离表的图。
图38是表示上述实施例2、4、6的图像特征抽出单元的其他的结构例的框图。
图39是用于说明先有的文书传真装置的框图。
图40(a)、图40(b)、图40(c)是用于说明存储利用软件进行本发明各实施例的编码处理、译码处理或核对处理的程序的数据存储媒体的图。
图41(a)是用于说明具有上述实施例2的图像编码装置和上述实施例3的图像译码装置的传真装置的框图,图41(b)是用于说明具有这些图像编码装置和图像译码装置的文书传真装置的框图。
图42是用于说明本发明实施例24的图像译码装置的框图。
图43是用于说明本发明实施例25的图像译码装置的框图。
图44是表示构成上述实施例24的图像编码装置的预测图像选择单元的动作流程的图。
图45是表示构成上述实施例25的图像译码装置的预测图像选择单元的动作流程的图。
图46是用于说明本发明实施例26的图像编码装置的框图。
图47是用于说明本发明实施例27的图像译码装置的框图。
图48是表示构成上述实施例26的图像编码装置的预测图像选择单元的动作流程的图。
图49是表示构成上述实施例27的图像译码装置的预测图像选择单元的动作流程的图。
下面,参照


本发明的实施例。
(实施例1)图1是表示本发明实施例1的图像编码装置的结构的框图。本实施例1与权利要求1的发明对应。
本实施例1的图像编码装置100是接收由扫描器等将包含黑体文字的文书图像101电子化而得到的文书图像数据Di,并将该文书图像数据Di进行编码的装置,例如,可以作为图39所示的文书文卷编排装置3900的图像编码单元3902使用。这里,在文书图像中,作为其部分图像,包含文字及记号、或由该文字及记号的一部分构成的文字图像,使文字数据与各文字图像对应。这里,之所以规定在上述文书图像中包含由文字及记号的一部分构成的文字图像,是因为有时1个文字或记号的各部分作为1个文字及记号来识别的。例如,在“仁”这个汉字文字中,其左偏旁部分和右偏旁部分有时分别被识别为片假名文字“亻”和汉字文字“二”。
本实施例1的图像编码装置100具有接收与上述文书图像101的各文字对应的文字代码和包含表示各文字的大小和文书图像的各文字的位置的辅助信息的文字数据Dc,并根据上述文字代码利用明朝体的字体信息预测文书图像的文字图像并输出预测文字图像数据PDc的预测图像生成单元103。
另外,上述图像编码装置100还具有根据表示包含在上述Dc中的文字的位置和大小的辅助信息合成上述预测文字图像数据PDc,从而生成与仅包含与上述文书图像对应的文字的预测文书图像105对应的预测文书图像数据PDi的图像合成单元104。
此外,上述图像编码装置100还具有对上述文书图像数据Di参照与其对应的预测文书图像数据PDi进行算术编码处理、并作为与文书图像对应的编码数据De而输出代码串107的熵编码单元106,与和上述文书图像对应的编码数据De一起输出与包含在文书图像中的文字对应的文字数据Dc。图1中表示出了包含在上述文字数据Dc中的与各文字代码对应的文字的串。
上述文字数据Dc由例如图39所示的先有的文书传真装置3900的文书识别单元3901从文书图像数据Di中抽出,在该文字数据Dc中,包含表示与包含在文书图像中的各文字对应的文字代码、该文书图像中的各文字的位置和各文字的大小的辅助信息。
图24(a)是表示与上述文书图像对应的XY坐标的图,图24(b)是用于说明输入上述预测图像生成单元103的文字数据Dc的数据结构的模式图。这里,在上述文书图像101中,包含由黑体的阿拉伯文字组成的“Panasonic Technical Reports”这样的文字串,在上述文字数据Dc中,包含表示与构成该文字串的各文字对应的文字代码、位置、大小的数据。
即,构成上述文字数据Dc的代码串2400包含分别与明朝体的阿拉伯文字“P”、“a”、…、“s”对应的代码串2410、2420、、2430。
具体而言,代码串2410由与表示在以文书图像的左上角为原点O的XY坐标中文字“P”的位置的X坐标、Y坐标对应的代码2411a及2411b、表示上述文字“P”的大小的代码2412和与上述文字“P”对应的文字代码2413构成。另外,代码串2420由与表示在上述XY坐标中文字“a”的位置的X坐标、Y坐标对应的代码2421a及2421b、表示上述文字“a”的大小的代码2422和与上述文字“a”对应的文字代码2423构成。代码串2430由与表示在上述XY坐标中文字“s”的位置的X坐标、Y坐标对应的代码2431a及2431b、表示上述文字“s”的大小的代码2432和与上述文字“s”对应的文字代码2433构成。
下面,说明其动作。
与包含在上述文书图像101中的文字图像对应的文字数据Dc与利用扫描器等将文书图像101电子化而得到的2值的图像数据(文书图像数据)Di一起输入本实施例1的图像编码装置100时,在预测图像生成单元103中,利用字体信息根据包含在上述文字数据Dc中的文字代码生成与包含在上述文书图像中的各文字对应的预测文字图像的数据(预测文字图像数据)PDc,并向图像合成单元104输出。
于是,在图像合成单元104中,根据表示包含在上述文字数据Dc中的各文字的位置和大小的辅助信息合成各预测文字图像,并向上述熵编码单元106输出与仅由上述预测文字图像构成的预测文书图像105对应的数据PDi。在该预测文书图像105中,各预测文字图像以指定的大小配置到根据上述辅助信息决定的指定的位置。
并且,在熵编码单元106中,参照预测文书图像数据PDi将文书图像数据Di进行算术编码,并作为与文书图像101对应的编码数据De输出代码串107。
下面,简单地说明算术编码处理。
关于算术编码的详细情况,在“多媒体编码国际标准”(第3章算术符号化,安田浩(丸善株式会社))中有详细的说明。
图25(a)、图25(b)、图25(c)是用于说明算术编码的原理的图。
例如,在算术编码原理中,对与由指定数的像素构成的像素串的各像素对应的像素值的组合,作为与由上述指定数的像素构成的被处理图像对应的编码数据求出1个2进制小数。
特别是在对2值的图像数据的算术编码处理中,如图25(a)所示,使用“0”、“1”、“EOF”的3个符号和表示这些符号的发生概率的发生概率模型2504。这里,符号“0”是表示与具有像素值“0”的白像素对应的符号,符号“1”是表示与具有像素值“1”的黑像素对应的符号,符号“EOF”是表示上述像素串的最后的符号。另外,这里,在发生概率模型2504中,符号“EOF”的发生概率为x、符号“0”的发生概率为y、符号“1”的发生概率为z。其中,x、y、z是大于0小于1的实数,满足x+y+z=1。
下面,使用图25(b)具体地说明对由2个白像素构成的被处理图像的算术编码处理。
这时,与实数像素串相当的符号串2505由符号“0”、“0”、“EOT”构成。
首先,向表示大于0小于1的范围的数直线2501上分配与由发生概率模型2504所示的各符号的发生概率对应的范围(概率范围)。这时,上述符号串2505的最初的符号为符号“0”,所以,上述数直线2501上的限定范围R1的发生概率y的部分可以作为限定范围R1而求出。
接着,向数直线上的限定范围R1分配与由发生概率模型2504所示的各符号的发生概率对应的概率范围。这时,上述符号串2505的第2个符号为符号“0”,所以上述数直线2501的限定范围R1的发生概率y的部分可以作为限定范围R2求出。
最后,向数直线上的限定范围R1分配与由发生概率模型2504所示的各符号的发生概率对应的概率范围。这时,上述符号串2505的第3个符号是符号“EOF”,所以,上述数直线2501上的限定范围R2的发生概率x的部分可以作为限定范围R3而求出。
并且,作为表示上述数直线2501的实数限定范围R3的范围的2进制小数2503,求出例如图25(c)所示的小数点以下10位的2进制小数“0.0010101011”,表示该值的数据作为与上述符号串2505对应的编码数据而输出。该2进制小数2503不论在其最后的位之后还多少位数,都成为不偏离上述数直线上的限定范围R3的更短位数的小数。
图26表示对2值图像数据的一般的算术编码处理的流程。
在开始进行算术编码时(步骤S2601),应用发生概率模型的数直线的应用范围R(k)(k为自然数)初始设定为0≤R(1)<1(步骤S2602)。并且,在输入构成上述符号串2505的各符号时(步骤S2603),就向数直线上的现在的应用范围R(k)分配与发生概率模型中的各符号的发生概率对应的概率范围,与上述现在的应用范围R(k)中输入的符号的发生概率对应的概率范围采用新的应用范围R(k+1)(步骤S2604)。
此外,在步骤S2605,进行输入符号是否为结束符号的判断,如果是结束符号,就用2进制小数表示由结束符号的前1个符号限定的应用范围,并输出2进制小数(步骤S2606),从而结束算术编码(步骤S2607)。
另一方面,在步骤S2605的判断结果为输入符号不是结束符号时,就输入符号串的后续符号(步骤S2603)。但是,如果符号串的符号的个数已决定了,则可省略结束符号“EOF”。
对与符号串对应的编码数据的算术译码,通过根据2进制小数决定符号串进行。
现在了解这样的算术编码处理具有符号串的符号的发生概率与由发生概率模型所示的各符号的发生概率的误差越小、另外符号串的符号的发生概率越有偏离则与符号串对应的编码数据的代码量越减少的性质。另外,在进行1个符号串的各符号的编码处理的期间,即使变更发生概率模型,如果知道其变更的方式,就知道也可以进行与符号串对应的编码数据的译码处理。
图27是用于说明参照预测文书图像105对表示文书图像101的图像数据Di进行算术编码处理的具体的方法的图。
这时,作为编码的对象的符号串由将对文书图像101的各像素的像素值从文书图像101的左侧向右侧的横向扫描从其上侧到下侧进行而得到的“0”或“1”的像素值构成。
并且,将由发生概率模型给定的各符号的发生概率的范围向数直线上分配的分配处理对上述符号串中的所有的符号进行,这样,表示与最终得到的数直线上的限定范围对应的2进制小数的数据可以作为与上述文书图像101对应的编码数据而求出。
但是,在本实施例1中,对作为上述符号串中的分配处理的对象的对象符号,根据与右侧文书图像中的对象符号对应的对应像素的像素值切换发生概率模型。
下面,具体地说明上述发生概率模型的切换。
例如,作为与上述预测文书图像中的对象符号对应的对应像素,使用3个像素,具体而言,就是在预测文书图像中使用与文书图像中对象图像的位置相对地处于相同位置的同位置像素、位于该同位置像素前后的前像素和后像素。
该前像素和后像素在对预测文书图像进行和对上述文书图像的扫描相同的扫描而得到的像素串中位于上述同位置像素的前后。
并且,上述3个像素的像素值的组合有以下的8个方式,对白像素、黑像素和EOF设定概率的发生概率模型与各方式对应。
(第1方式)前像素、同位置像素、后像素都是白像素。
在与第1方式对应的发生概率模型中,对EOF、白像素、黑像素的概率范围分别设定为例如[0,0.05)、[0.05,0.95)、[0.95,1.0)。
(第2方式)前像素为黑像素,同位置像素和后像素为白像素。
在与第2方式对应的发生概率模型中,对EOF、白像素、黑像素的概率范围分别设定为例如[0,0.05)、[0.05,0.75)、[0.75,1.0)。
(第3方式)前像素和同位置像素为白像素,后像素为黑像素。
在与第3方式对应的发生概率模型中,对EOF、白像素、黑像素的概率范围分别设定为例如[0,0.05)、[0.05,0.7)、[0.7,1.0)。
(第4方式)前像素和后像素为白像素,同位置像素为黑像素。
在与第4方式对应的发生概率模型中,对EOF、白像素、黑像素的概率范围分别设定为例如[0,0.05)、[0.05,0.65)、[0.65,1.0)。
(第5方式)前像素和后像素为黑像素,同位置像素为白像素。
在与第5方式对应的发生概率模型中,对EOF、白像素、黑像素的概率范围分别设定为例如[0,0.05)、[0.05,0.45)、[0.45,1.0)。
(第6方式)前像素和同位置像素为黑像素,后像素为白像素。
在与第6方式对应的发生概率模型中,对EOF、白像素、黑像素的概率范围分别设定为例如[0,0.05)、[0.05,0.4)、[0.4,1.0)。
(第7方式)前像素为白像素,同位置像素和后像素为黑像素。
在与第7方式对应的发生概率模型中,对EOF、白像素、黑像素的概率范围分别设定为例如[0,0.05)、[0.05,0.35)、[0.35,1.0)。
(第8方式)
前像素、同位置像素、后像素都为黑像素。
在与第8方式对应的发生概率模型中,对EOF、白像素、黑像素的概率范围分别设定为例如[0,0.05)、[0.05,0.15)、[0.15,1.0)。
例如,对于图27所示的文书图像101的对象图像2701,在向数直线上分配发生概率的范围的分配处理中,预测文书图像的同位置像素2702是白像素,其前像素为黑像素,其后像素为白像素,所以,作为发生概率模型,可以使用在上述第2方式中设定的发生概率模型。这时,对象像素为白像素,所以,由现在的数直线上的限定范围中的[0.05,0.75)所示的范围就成为新的限定范围。
这样,对文书图像的各像素,根据预测文书图像中对应的像素的像素值切换发生概率模型,通过从文书图像的开头像素到EOF进行限定数直线上的概率范围的处理,表示最终限定的概率范围的2进制小数就作为与上述文书图像对应的熵代码(编码数据)而输出。
这样,在本实施例1中,就根据从文书图像101的数据Di中抽出的文字数据Dc作成对应上述文书图像101的预测文书图像105,此外,对上述文书图像数据Di参照上述预测文书图像数据PDi进行切换发生概率模型的算术编码处理,所以,由发生概率模型所示的白像素、黑像素的发生概率就与文书图像中的白像素和黑像素的发生概率非常接近,从而具有可以提高算术编码器对上述文书图像数据的编码效率。
另外,在文字数据Dc中,对于文书图像的各文字,采用包含1个文字代码的结构,所以,可以避免由对文书图像的文字识别而得到的文字数据变得冗长。
(实施例2)图2是表示本发明实施例2的图像编码装置的结构的框图。本实施例2与权利要求2对应。
本实施例2的图像编码装置200可以作为进行图像信息的存储及收发的信息处理装置使用,例如可以作为图39所示的文书文卷编排装置3900及传真装置等具有扫描器的电子仪器的图像编码单元使用。
本实施例2的图像编码装置200具有接收文书图像数据(由扫描器等将文书图像201电子化而得到的2值图像数据)Di并从该文书图像数据Di中抽出由图24(b)所示的代码串2400构成的文字数据Dc的图像特征抽出单元202。该图像特征抽出单元202是利用在OCR等中使用的一般的方法进行文字识别的文字识别装置,上述文字数据Dc具有与文书图像的文字串203的各文字图像对应的文字代码(图像特征)和表示文书图像的文字的位置和大小的辅助信息。
另外,上述图像编码装置200和实施例1的图像编码装置100一样,还具有根据包含在上述文字数据Dc中的文字代码预测与上述文书图像中的各文字对应的文字图像并输出其数据(预测文字图像数据)PDc的预测图像生成单元204,和根据预测文字图像数据PDc以及表示上述文字数据中的文字的位置和大小的辅助信息、将与各文字对应的预测文字图像配置到指定的图像空间上、合成包含与上述各文字对应的预测文字图像的预测文书图像206、并输出其数据(预测文书图像数据)Pdi的图像合成单元205。
此外,上述图像编码装置200还具有利用上述预测文书图像206和文书图像201两者的相关、参照预测文书图像数据PDi对文书图像数据Di进行算术编码处理、而作为与文书图像对应的编码数据De输出代码串208的熵编码单元207,输出与上述文书图像数据对应的编码数据De和与包含在文书图像中的文字对应的文字数据Dc。
上述实施例2的图像编码装置200的预测图像生成单元204、图像合成单元205和熵编码单元207分别与实施例1的图像编码装置100的预测图像生成单元103、图像合成单元104和熵编码单元106的结构完全相同。
下面,说明其动作。
作为编码的对象的文书图像数据Di和实施例1一样是由扫描器等将文书图像201电子化而得到的2值的图像数据,在上述文书图像201中作为其部分图像包含由文字及符号或其一部分构成的文字图像。
在上述文书图像数据Di输入本实施例2的图像编码装置200时,由图像特征抽出单元202从文书图像数据Di中抽出与文书图像201内的各文字对应的文字代码和表示文书图像的位置和大小的辅助信息,并向上述预测图像生成单元204输出包含该文字代码和辅助信息的文字数据Dc。这里,上述文字数据Dc的结构和图24(b)所示的结构相同。另外,图像特征抽出单元202是文字识别装置,利用在OCR等中使用的一般的方法进行包含在文书图像中的文字的识别,这里,省略了具体的抽出方法。
由预测图像生成单元204根据包含在上述文字数据Dc中的文字代码利用字体信息生成与包含在上述文书图像中的各文字对应的预测文字图像的数据(预测文字图像数据)PDc,并向图像合成单元205输出。于是,由图像合成单元205根据包含在上述文字数据Dc中的辅助信息合成各预测文字图像,并向上述熵编码单元207输出与预测文书图像206对应的数据(预测文书图像数据)PDi。在上述预测文书图像206中,各预测文字图像以指定的大小配置到由上述辅助信息决定的指定的位置。
并且,在熵编码单元207中,和实施例1的熵编码单元106一样,参照预测文书图像数据PDi对文书图像201的电子数据即文书图像数据Di进行算术编码,并作为编码数据De输出对应的代码串208。
这样,在本实施例2中,除了上述实施例1的图像编码装置100的结构外,还具有从上述文书图像数据Di中抽出文字数据Dc的图像特征抽出单元202,所以,除了实施例1的不损失对文书图像的检索的容易性而可以提高编码效率的效果外,可以自动地从文字图像数据Di中进行文字数据Dc的抽出,从而可以得到作为传真装置等的图像编码单元而有用的图像编码装置。
另外,在图像特征抽出单元202中,对于文书图像的各文字,抽出1个文字代码作为文字数据Dc,所以,可以避免通过对文书图像的文字识别而得到的文字数据变得冗长。
(实施例3)图3是用于说明本发明实施例3的图像译码装置的框图。本实施例3与权利要求5对应。
本实施例3的图像译码装置300是与上述实施例1或2的图像编码装置100或200对应的译码装置,可以作为图39所示的文书文卷编排装置3900或传真装置中的图像译码单元使用。
即,该图像译码装置300接收从上述实施例1或2的图像编码装置100或200输出的编码数据De和文字数据Dc,根据文字数据Dc将该编码数据De进行译码,将与文书图像301对应的文书图像数据Di复原为与文书图像307对应的译码数据Dd。
下面,进行详细的说明。本实施例3的图像译码装置300具有接收与文字串302的各个文字对应的文字数据Dc、并根据包含在该文字数据Dc中的文字代码(图像特征)利用字体信息预测文书图像的文字图像、从而输出预测文字图像的数据(预测文字图像数据)PDc的预测图像生成单元303,和根据表示包含在上述文字数据Dc中的各文字的位置和大小的辅助信息合成上述预测文字图像数据PDc、从而生成与包含仅与上述文书图像对应的文字的预测文书图像305对应的预测文书图像数据Pdi的图像合成单元304。
另外,上述图像译码装置300还具有作为代码串301接收利用预测文书图像和文书图像的两者的相关通过算术编码处理而得到的编码数据De、并参照预测文书图像数据PDi将该编码数据De进行算术译码、从而输出与文书图像307对应的文书图像数据Dd的熵译码单元306。
下面,说明其动作。
在编码数据De和文字数据Dc输入本实施例3的图像译码装置300时,在预测图像生成单元303中,根据包含在上述文字数据Dc中的文字代码利用字体信息生成与包含在上述文书图像中的各文字对应的预测文字图像的数据(预测文字图像数据)PDc,并向图像合成单元304输出。于是,在图像合成单元304便根据包含在上述文字数据Dc中的辅助信息合成各预测文书图像,并向上述熵编码单元306输出与预测文书图像305对应的数据PDi。
并且,在熵译码单元306中,参照预测文书图像数据PDi进行编码数据De的算术译码处理,并输出与文书图像307对应的文书图像数据Dd。
在该熵译码单元306中,和实施例1或2的熵编码单元一样,进行发生概率模型的切换,来进行从熵编码器输出的编码数据的译码处理。
例如,在上述熵译码单元306中,在与对应像素对应的预测文书图像的3个对应像素的像素值的组合是在实施例1中说明的第2方式时,可以使用与EOF、白像素、黑像素对应的概率范围分别设定为[0,0.05)、[0.05,0.75)、[0.75,1.0)的发生概率模型。
这样,在本实施例3的图像译码装置300中,就根据与包含在指定的文书图像中的文字对应的文字数据Dc预测上述指定的文书图像,生成与预测文字图像对应的数据PDi,进而参照上述预测文书图像数据PDi将与上述指定的文书图像对应的编码数据De进行算术译码,所以,可以实现与使用预测文书图像数据PDi的效率高的文书图像数据Di的算术编码处理对应的译码处理。
另外,本实施例3的图像译码装置300可以和上述实施例2的图像编码装置200一起应用于传真装置或文书文卷编排装置。
下面,先简单地说明具有上述实施例2的图像编码装置和实施例3的图像译码装置的传真装置。
图41(a)是用于说明上述传真装置10的框图。
传真装置10具有读取文书图像201并输出电子数据(文书图像数据)Di的扫描器11、进行该文书图像数据Di的编码处理并与编码数据De一起输出与包含在文书图像中的文字对应的文字数据Dc的图像编码装置200a、和给上述编码数据De附加上与其关联的文字数据Dc并通过电话线路15收发包含编码数据De和文字数据Dc的复合数据Dm的收发装置12。这里,上述图像编码装置200a的结构和上述实施例2的图像编码装置200相同。
上述传真装置10具有接收包含在通过上述电话线路15由收发装置12所接收的复合数据Dm中的编码数据De和文字数据Dc、并根据文字数据Dc将该编码数据De进行译码、从而输出文书图像数据Dd的图像译码装置300a,和根据上述文书图像数据Dd进行文书图像的显示或打印输出的图像输出装置13。这里,上述图像译码装置300a的结构和上述实施例3的图像译码装置300相同。
在这种结构的传真装置10中,可以由上述图像编码装置200a使用与包含在文书图像中的文字对应的文字数据高效率地将文书图像201的电子数据(文书图像数据Di)Di变换为编码数据,而且可以将从该图像编码装置200a输出的编码数据De给其附加上文书图像的检索用数据Dc进行发信。
另外,在上述传真装置10中,在接收到包含使用文字数据Dc将文书图像数据Di进行编码而得到的编码数据De和文字数据Dc的复合数据时,可以使用文字数据Dc将上述编码数据De正确地进行译码。
下面,简单地说明具有上述实施例2的图像编码装置和实施例3的图像译码装置的文书文卷编排装置。
图41(b)是用于说明上述文书文卷编排装置20的框图。
文书文卷编排装置20具有读取文书图像201并输出电子数据(文书图像数据)Di的扫描器21、进行该文书图像数据Di的编码处理并与编码数据De一起输出与包含在文书图像中的文字对应的文字数据Dc的图像编码装置200a、和使上述编码数据De和与其对应的文字数据Dc关联地进行存储的文书图像存储单元22。这里,上述图像编码装置200a的结构和上述实施例2的图像编码装置200相同。
上述文书文卷编排装置20具有根据作为检索数据Da从外部输入的文字代码将与上述文书图像存储单元22存储的指定的文书图像对应的编码数据De和与其对应的文字数据Dc一起读出的数据读出单元23、使用上述文字数据Dc将该读出的编码数据De进行译码从而复原为与指定的文书图像对应的文书图像数据Di的图像译码单元300a、和根据上述文书图像数据Dd进行文书图像的显示或打印输出的图像输出装置13。这里,上述图像译码装置300a的结构和上述实施例3的图像译码装置300相同。
在这种结构的文书文卷编排装置20中,可以由上述图像编码装置200a使用与包含在文书图像中的文字对应的文字数据高效率地将文书图像201的电子数据(文书图像数据Di)Di变换为编码数据,而且可以将从该图像编码装置200a输出的编码数据De给其附加上文书图像的检索用数据Dc进行存储。
另外,在上述文书文卷编排装置20中,通过从外部输入的检索数据与文字数据Dc的核对而简单地从文书图像存储单元中读出使用文字数据Dc将文书图像数据Di进行编码而得到的编码数据De。
(实施例4)图4是表示本发明实施例4的图像编码装置的结构的框图。本实施例4与权利要求3对应。
本实施例4的图像编码装置400是进行图像信息的存储及收发的信息处理装置,可以作为例如图39所示的文书文卷编排装置3900、传真装置等具有扫描器的电子仪器中的图像编码单元使用。
本实施例4的图像编码装置400具有接收文书图像数据(由扫描器等将文书图像401电子化而得到的2值图像数据)Di并从该文书图像数据Di中抽出文字数据Dc的图像特征抽出单元402、根据包含在上述文字数据Dc中的文字代码输出预测文字图像数据PDc的预测图像单元404、和根据预测文字图像数据PDc和上述文字数据的辅助信息合成包含与上述各文字对应的预测文字图像的预测文书图像406并输出其数据(预测文书图像数据)PDi的图像合成单元405。
这里,上述图像特征抽出单元402、预测图像生成单元404和图像合成单元405的结构和上述实施例2的图像编码装置200中的对应的单元202、204、205完全相同。
并且,本实施例4的图像编码装置400具有将上述预测文书图像406分割为指定尺寸的图像空间(预测文书图像块)并输出与各块对应的图像数据(预测块数据)BPDi的第1图像块化单元408和将上述文书图像401分割为指定尺寸的图像空间(文书图像块)并输出与各块对应的图像数据(块数据)BDi的第2图像块化单元407。这里,上述文书图像块和预测文书图像块分别为由16×16像素构成的图像空间。
此外,本实施例4的图像编码装置400具有块预测编码单元409,该块预测编码单元409根据上述预测块数据BPDi和块数据BDi在上述预测文书图像块与文书图像块间进行各像素值的比较,如果像素值的比较误差大于指定值,就使用预测块数据BPDi对块数据BDi进行算术编码处理,并与编码数据BDe一起输出编码标志Fc1,在上述预测文书图像块与文书图像块间,如果各像素值的比较误差小于指定值,就不对上述块数据BDi进行算术编码处理,并输出非编码标志Fc0。
下面,说明其动作。
作为编码的对象的文书图像数据Di是由扫描器等将文书图像401电子化的2值图像数据,在上述文书图像401中,作为部分图像包含由文字及记号或前一部分构成的文字图像。
在上述文书图像数据Di输入本实施例4的图像编码装置400时,由图像特征抽出单元402从文书图像数据Di中抽出表示与文书图像401内的各文字对应的文字代码在文书图像中的位置和大小的辅助信息,并将包含该文字代码和辅助信息的文字数据Dc向上述预测图像生成单元404输出。
由该预测图像生成单元404根据包含在上述文字数据Dc中的文字代码生成预测文字图像数据PDc,并向图像合成单元405输出。于是,由图像合成单元405根据上述辅助信息合成各预测文字图像,并向第1图像块化单元408输出与预测文书图像406对应的数据(预测文书图像数据)PDi。
并且,由第1图像块化单元408根据预测文字图像数据PDc将预测文书图像分割为指定尺寸的块,并向块预测编码单元409输出与各块对应的预测块数据BPDi。
这时,上述文书图像数据Di向第2图像块化单元407输出,由第2图像块化单元407根据文字图像数据Dc将文书图像分割为指定尺寸的块,并向块预测编码单元409输出与各块对应的块数据PDi。
由上述各块化单元将预测文书图像和文书图像分割为分别由16×16像素构成的块。
并且,由上述块预测编码单元409根据上述预测块数据BPDi和块数据BDi使用预测块数据BPDi对块数据BDi进行算术编码处理。
图28是表示块预测编码单元409的编码处理的流程的图。
由上述块预测编码单元409读入从第2块化单元407输出的文书图像块的数据BDi(步骤S2802),并读入对应的预测文书图像块的数据BPDi(步骤S2803)。
其次,在读入的两块间求出对应的像素的像素值的差分,并计算该差分的绝对值的总和(步骤S2804)。并且,如果该差分的绝对值在阈值以上(这里,阈值为7),就判定上述预测误差大,如果小于阈值(这里,阈值为7),就判定上述预测误差小(步骤S2805)。
此外,上述判断的结果为预测误差在阈值以上时,就从上述块预测编码单元409输出具有值“1”的编码标志Fc1(步骤S2806),并使用预测文书图像块的图像数据将文书图像块的图像数据进行算术编码,并输出与文书图像块对应的编码数据De(步骤S2808)。
另一方面,在上述步骤S2805的判断结果判定上述预测误差小于上述阈值时,就从上述块预测编码单元409输出具有值“0”的非编码标志Fc0(步骤S2807)。
并且,进行作为块预测编码单元409的处理对象的对象块是否为上述文书图像的最后的文书图像块的判断(步骤S2809),在上述对象块是最后的文书图像块时,编码处理即告结束(步骤S2810),如果上述对象块不是最后的文书图像块,就对后续的块进行上述步骤S2802~步骤S2809的处理。
图29表示从上述块预测编码单元409输出的包含与各图像块对应的编码数据BDe和标志Fc1、Fc0的复合数据MDe。
该复合数据MDe包括与上述文书图像的第1、第2、第3、第4、第5、第n个各图像块对应的代码串B(1)、B(2)、B(3)、B(4)、B(5)、…、B(n)。
这里,代码串(1)、B(3)、B(4)、…、B(n)由值“0”的非编码标志Fc0构成,代码串B(2)和B(5)由值“1”的编码标志Fc1和与第2、第5个图像块的数据对应的算术代码BDe构成。
这样,在本实施例4中,根据与包含在文书图像中的文字对应的文字数据合成预测文书图像,并将该预测文书图像分割为指定尺寸的预测文书块,同时将上述文书图像分割为指定尺寸的文书块,参照与对应的预测文书块对应的图像数据将与各文书块对应的图像数据进行算术编码,这时,仅对与预测文书块间的像素值的差分大于指定值的文书块发信对应的编码数据,所以,不计块单位的比较中小的不同,从而可以大大提高编码效率而不会给视听者留下画质劣化的印象。
(实施例5)图5是表示本发明实施例5的图像译码装置的结构的框图。本实施例5与权利要求6对应。
本实施例5的图像译码装置500是与上述实施例4的图像编码装置400对应的译码装置,可以作为图39所示的文书文卷编排装置3900、传真装置等具有扫描器的电子仪器中的图像译码单元使用。
即,图像译码装置500接收从上述实施例4的图像编码装置400输出的复合数据MDe和文字数据Dc并根据文字数据Dc和包含在复合数据MDe中的标志Fc1、Fc0将包含在该复合数据MDe中的编码块数据BDe进行译码从而复原为与文书图像509对应的文书图像数据Di。
下面,进行详细的说明。本实施例5的图像译码装置500具有接收与文字串502中的各个文字对应的文字数据Dc、并根据包含在该文字数据Dc中的文字代码(图像特征)、利用字体信息、预测文书图像中的文字图像、从而输出用于表示预测文字图像的预测文字图像数据PDc的预测图像生成单元503,和根据包含在上述文字数据Dc中的表示各文字的位置和大小的辅助信息合成上述预测文字图像数据PDc、从而生成与包含仅与上述文书图像对应的文字的预测文书图像505对应的预测文书图像数据Pdi的图像合成单元504。
另外,本实施例5的图像编码装置500具有接收预测文书图像数据PDi并将上述预测文书图像505分割为指定尺寸的图像空间(预测文书图像块)从而输出与各块对应的图像数据(预测块数据)BPDi的图像块化单元506和将上述编码块数据BDe使用与其对应的预测文书块数据BPDi进行算术译码从而输出与复原文书块对应的译码块数据BDd的块预测译码单元507。
此外,上述图像译码装置500具有接收上述译码块数据BDd和预测块数据BPDi并根据标志Fc1、Fc0组装预测文书块和复原文书块从而输出与文书图像509对应的文书图像数据Dd的图像块组装单元508。
其中,上述文书块、预测文书块、复原文书块分别为由16×16像素构成的图像空间。
上述预测图像生成单元503和图像合成单元504的结构分别与实施例1的预测图像生成单元103和图像合成单元104相同,图像块化单元506的结构和实施例4的第1图像块化单元408相同。
下面,说明其动作。
在编码数据MDe和文字数据Dc输入本实施例5的图像译码装置500时,由预测图像生成单元503根据包含在上述文字数据Dc中的文字代码利用字体信息生成与包含在上述文书图像中的各文字对应的预测文字图像的数据(预测文字图像数据)PDc,并向图像合成单元504输出。于是,由图像合成单元504根据包含在上述文字数据Dc中的辅助信息合成各预测文字图像,并向图像块化单元506输出与预测文书图像505对应的数据PDi。
由该图像块化单元506根据预测文字图像数据PDc将预测文书图像分割为指定尺寸的块,并向块预测译码单元507输出与各块对应的预测块数据BPDi。
并且,由上述块预测译码单元507根据上述预测块数据BPDi和复合数据MDe使用预测块数据BPDi对包含在该复合数据中的块数据BDi进行算术译码处理,从而复原为对应的文书图像块的图像数据BDd。
此外,由图像块组装单元508输入上述图像数据BDd和与预测图像块对应的数据BPDi,根据与包含在上述复合数据MDe中的各块对应的标志Fc1、Fc0进行预测图像块和复原图像块的组装,从而复原为与文书图像509对应的图像数据Dd。
下面,详细说明上述块预测译码单元507的译码处理。
图30表示块预测译码单元507的译码处理的流程。
由上述块预测译码单元507读入与文书图像的各块对应的编码数据BDe(步骤S3002),此外,读入与从图像块化单元506输出的预测文书图像的各块对应的数据BPDi(步骤S3003)。
接着,判断包含在复合数据MDe中的标志是编码标志Fc1还是非编码标志Fc0(步骤S3004)。在该判断结果为上述标志是编码标志时,由上述译码单元507参照预测文书图像块的数据BPDi对上述编码标志之后的算术编码数据BDe进行译码处理(步骤S3005),并输出译码块的数据BDd(步骤S3006)。
另一方面,在上述步骤S3004的判断结果为上述标志是非编码标志时,就直接输出预测文书图像块的数据BPDi(步骤S3007)。
并且,进行作为块预测译码单元的处理对象的对象块是否为上述文书图像中的最后的图像块的判断(步骤S3008),在上述对象块是最后的图像块时,译码处理即告结束(步骤S3009),如果上述对象块不是最后的图像块,就对后续的块进行上述步骤S3002~步骤S3008的处理。
然后,如上所述,由图像块组装单元508将按图像块单位输入的图像块顺序排列到指定的图像空间上,从而复原为与文书图像509对应的图像数据Dd。
这样,在本实施例5中,根据从文书图像中抽出的文字信息预先作成预测文书图像,将该预测文书图像分割为指定尺寸的预测文书块,生成与预测图像块对应的数据BPDi,参照预测图像块的数据BPDi将与分割文书图像而得到的指定尺寸的图像块对应的编码数据BDe进行算术译码,这时,不进行编码处理,对于预测误差小的文书图像的块输出对应的预测文书图像的块的数据,所以,可以实现与使用预测文书图像数据PDi的按指定尺寸的块单位的效率高的文书图像数据Di的编码处理对应的译码处理。
另外,具有上述实施例4的图像编码装置400和实施例5的图像译码装置500的传真装置,可以通过将图41(a)的传真装置中的图像编码装置200a和图像译码装置300a分别置换为上述图像编码装置400和图像译码装置500而实现。
此外,具有上述实施例4的图像编码装置400和实施例5的图像译码装置500的文书文卷编排装置,可以通过将图41(b)的文书文卷编排装置中的图像编码装置200a和图像译码装置300a分别置换为上述图像编码装置400和图像译码装置500而实现。
(实施例6)图6是表示本发明实施例6的图像编码装置的结构的框图。本实施例6与权利要求4对应。
本实施例6的图像编码装置600是进行图像信息的存储及收发的信息处理装置,可以作为例如图39所示的文书文卷编排装置3900、传真装置等具有扫描器的电子仪器中的图像不单元使用。
本实施例6的图像编码装置600具有接收文书图像数据(由扫描器等将文书图像601电子化而得到的2值图像数据)Di并从该文书图像数据Di中抽出文字数据Dc的图像特征抽出单元602、根据包含在上述文字数据Dc中的文字代码输出预测文字图像数据PDc的预测图像单元604、和根据预测文字图像数据PDc和上述文字数据的辅助信息合成包含与上述各文字对应的预测文字图像的预测文书图像606并输出该数据(预测文书图像数据)PDi的图像合成单元605。
并且,本实施例6的图像编码装置600具有为了省略预测文书图像606的细部而对上述预测文书图像数据PDi进行形态滤波处理及平滑滤波处理的滤波处理并输出滤波处理数据FPDi的图像滤波处理单元607、和利用进行了滤波处理的预测文书图像606与文书图像601的两者的相关参照该滤波处理数据FPDi对文书图像数据Di进行算术编码处理从而作为编码数据De而输出代码串609的熵编码单元608。
这里,上述图像特征抽出单元602、预测图像生成单元604、图像合成单元605和熵编码单元608的结构和上述实施例2的图像编码装置200的对应的单元202、204、205、207完全相同。
下面,说明其动作。
作为编码的对象的文书图像数据Di是由扫描器等将文书图像601电子化的2值图像数据,在上述文书图像601中,作为部分图像包含由文字及符号或其一部分构成的文字图像。
在文书图像数据Di输入本实施例6的图像编码装置600时,由上述图像特征抽出单元602、预测图像生成单元604和图像合成单元605进行和实施例2的图像特征抽出单元202、预测图像生成单元204、图像合成单元205完全相同的处理,并向图像滤波处理单元607输出与从上述图像合成单元605输出的预测文书图像606对应的图像数据(预测文书图像数据)PDi。
于是,由上述图像滤波处理单元607对上述预测文书图像数据PDi使用形态滤波器进行滤波处理,用以省略预测文书图像606的细部。
图31是用于说明上述形态滤波器的处理的模式图。
由形态滤波器3102对构成预测文书图像的各个像素顺序在预测文书图像上设定以作为滤波处理的对象的对象像素3101a为中心的指定尺寸的区域(3×3像素的掩码)3102a,进行用掩码内像素的最大像素值置换对象像素3101a的像素值的滤波处理。3101b是在掩码内具有最大像素值的像素。
例如,设上述预测文书图像为黑白图像时,则上述滤波处理后的预测文书图像3103如图31所示的那样,与上述滤波处理之前的预测文书图像3101相比,省略了细部,黑色部分的区域扩张了。
并且,由熵编码单元608参照进行了上述滤波处理的预测文书图像数据FPDi对文书图像601的数据Di进行算术编码,并作为编码数据De输出对应的代码串609。
这样,在本实施例6中,根据从文书图像数据中抽出的文字数据对上述文书图像作成预测文书图像,对该预测文书图像的数据进行滤波处理,并参照进行了该滤波处理的预测文书图像数据对上述文书图像数据进行算术编码处理,所以,通过上述滤波处理,可以减小预测文书图像与文书图像的预测误差,从而可以进一步提高算术编码器对上述文书图像数据的编码效率。
(实施例7)图7是表示本发明实施例7的图像译码装置的结构的框图。本实施例7与权利要求7对应。
本实施例7的图像译码装置700是与上述实施例6的图像编码装置600对应的译码装置,可以作为图39所示的文书文卷编排装置3900及传真装置等具有扫描器的电子仪器中的图像译码单元使用。
即,图像译码装置700接收从上述实施例6的图像编码装置600输出的编码数据De和文字数据Dc,根据文字数据Dc将该编码数据De进行译码,从而将与文书图像701对应的文书图像数据Di复原为与文书图像708对应的译码数据Dd。
下面,进行详细的说明。本实施例7的图像译码装置700具有接收与文字串的各个文字对应的文字数据Dc并根据包含在该文字数据Dc中的文字代码(图像特征)利用字体信息预测文字图像从而输出用于表示预测文字图像的预测文字图像数据PDc的预测图像生成单元703、根据表示包含在上述文字数据Dc中的各文字的位置和大小的辅助信息合成上述预测文字图像数据PDc从而生成与包含仅与上述文书图像对应的文字的预测文书图像705对应的预测文书图像数据PDi的图像合成单元704。
另外,图像译码装置700具有为了省略预测文书图像705的细部而对上述预测文书图像数据PDi进行形态滤波处理及平滑滤波处理等滤波处理从而输出滤波处理数据FPDi的图像滤波处理单元706和接收利用预测文书图像与文书图像的两者的相关进行算术编码处理而得到的编码数据De使用进行了滤波处理的预测文书图像数据即滤波处理输出FPDi将该编码数据De进行算术译码从而输出与文书图像708对应的文书图像数据(译码数据)Dd的熵译码单元707。
其中,上述预测图像生成单元703、图像合成单元704和熵译码单元707的结构与上述实施例3的图像编码装置300的对应的单元303、304、306完全相同。
下面,说明其动作。
在编码数据De和文字数据Dc输入本实施例7的图像译码装置700时,在上述预测图像生成单元703和图像合成单元704中分别进行与实施例3的预测图像生成单元303和图像合成单元304完全相同的处理,从上述图像合成单元704输出的与预测文书图像705对应的图像数据(预测文书图像数据)Pdi输入图像滤波处理单元706。
于是,由图像滤波处理单元706对上述预测文书图像数据PDi进行和实施例6的图像编码装置600中的图像滤波处理单元607相同的滤波处理,并输出滤波处理数据(进行了滤波处理的预测文书图像数据)FPDi。
并且,由熵译码单元707参照进行了滤波处理的预测图像数据FPDi进行编码数据De的译码处理并输出与文书图像708对应的文书图像数据Dd。
在熵译码单元707中,除了不直接使用预测文书图像数据并参照在图像滤波处理单元706中进行了滤波处理的预测文书图像数据外进行和实施例3的熵译码单元306完全相同的处理。
这样,在本实施例7中,根据预先从文书图像中抽出的文字信息作成预测文书图像,为了省略该文书图像的细部对预测文书图像数据进行滤波处理,参照进行了滤波处理的预测文书图像数据FPDi将与文书图像对应的编码数据De进行算术译码,所以,可以实现与使用进行了滤波处理的预测文书图像数据FPDi的效率高的文书图像数据Di的编码处理对应的译码处理。
另外,具有上述实施例6的图像编码装置600和实施例7的图像译码装置700的传真装置,可以通过将图41(a)的传真装置中的图像编码装置200a和图像译码装置300a置换为上述图像编码装置600和图像译码装置700而实现。
此外,具有上述实施例6的图像编码装置600和实施例7的图像译码装置700的文书文卷编排装置,可以通过将图41(b)的文书文卷编排装置中的图像编码装置200a和图像译码装置300a置换为上述图像编码装置600和图像译码装置700而实现。
(实施例8)图8是表示本发明实施例8的图像编码装置的结构的框图。本实施例8与权利要求8对应。
本实施例8的图像编码装置800可以作为例如图39所示的文书文卷编排装置3900等具有扫描器的电子仪器中的图像编码单元使用。
下面,进行详细的说明。本实施例8的图像编码装置800具有接收表示作为编码的对象的对象图像的图像特征的数据(图像特征数据)Dic并根据该图像特征数据Dic生成与上述对象图像类似的预测图像的数据(预测图像数据)PDic的预测图像生成单元801、和接收上述对象图像的数据(对象图像数据)Dit和预测图像数据PDit并将对象图像数据Dit参照与其对应的预测图像数据PDit进行算术编码处理从而输出与上述对象图像对应的熵代码作为其编码数据Die的熵编码单元802。
图32是用于说明上述图像特征的模式图。
设输入的图像是由白像素和黑像素构成的2值图像。
图像特征使用可以再生与对象2值图像类似的2值图像的特征。例如,在对象2值图像为上述实施例的包含文字的文书图像时,作为图像特征,可以使用以下所述的网格特征等。此外,作为上述图像特征,也可以使用文字代码及文字识别中的所谓的特征矢量。
下面,说明这里所使用的图像特征。
上述图像特征按以下方式求出。
将对象2值图像3200分割为一定尺寸的区域(例如8×8像素的块)3201。将各块内像素的像素值置换为该块内像素的像素值中频度最高的像素值。在2值图像的情况时,就用上述块内的黑像素和白像素中在块内数量多的像素值置换。
结果,输入2值图像(例如64×64像素)的图像特征就成为8像素×8像素的缩小2值图像。以后,将该特征称为网格特征。
下面,说明其动作。
在对象图像数据Dit和图像特征数据Dic输入本实施例8的图像编码装置800时,由预测图像生成单元801根据表示上述缩小2值图像3202的图像特征数据生成与上述对象图像对应的预测图像并输出其数据(预测图像数据)Pdit。
这里,通过放大上述缩小2值图像而生成上述预测图像。
图33是用于说明上述缩小2值图像的放大方法的模式图。
例如,分别与缩小2值图像3301的多个像素3301a对应地生成各像素具有相同像素值的8像素×8像素的块。
例如,在上述放大处理中,缩小2值图像3301的左上角的像素3301al变换为预测图像3302的左上角的8×8像素的块3302al。
并且,由熵编码单元802参照上述预测图像数据PDit对对象图像数据Dit进行和实施例1的熵编码单元106相同的编码处理。
这样,在本实施例8中,根据从作为编码处理的对象的对象图像中抽出的表示图像特征的数据(图像特征数据)Dic生成与上述对象图像对应的预测图像的数据(预测图像数据)PDi,并根据该预测图像数据PDit对对象图像数据Dit进行所述编码处理,所以,可以提高熵编码器的编码效率。
另外,与和上述对象图像数据Dit对应的熵代码(编码数据)Die一起输出与对象图像对应的图像特征的数据,所以,也可以利用图像特征数据进行与对象图像对应的编码数据的检索。
(实施例9)图9是表示本发明实施例9的图像编码装置的结构的框图。本实施例9与权利要求9、权利要求10、权利要求13对应。
本实施例9的图像编码装置900可以作为例如图39所示的文书文卷编排装置3900、传真装置等具有扫描器的电子仪器中的图像编码单元使用。
本实施例9的图像编码装置900除了上述实施例8的图像编码装置800外,还具有从对象图像数据Dit中抽出图像特征数据Dic的图像特征抽出单元901,将上述对象图像数据Dit参照根据与其对应的图像特征数据Dic得到的预测图像数据PDit进行算术编码处理。即,构成上述图像编码装置900的预测图像生成单元904和熵编码单元905的结构分别与上述实施例8的图像编码装置800中的预测图像生成单元801和熵编码单元802完全相同。
这里,上述图像特征抽出单元901从作为编码的对象的对象图像中作为图像特征抽出网格特征,由将对象图像分割为块(这里为由8×8像素构成的图像空间)并输出与各块对应的块数据BDit的块化单元902和使块内像素(构成块的像素)的像素值平滑的块平滑单元903构成。由该块平滑单元903具体地将块内像素的像素值用块内出现频度最高的像素值进行置换。例如,在通过黑像素和白像素显示的2值图像中,出现频度最高的像素值是块内的黑像素和白像素中数量多的像素的像素值。
下面,说明其动作。
设输入本实施例9的图像编码装置900的对象图像数据是2值图像数据。
Dit输入上述图像编码装置900时,由图像特征抽出单元901从对象图像数据Dit中抽出图像特征数据Dic。
即,由图像特征抽出单元901的块化单元902将作为对象图像的2值图像分割为指定尺寸(8×8像素)的块,并输出与各块对应的图像数据BDit。其次,由块平滑单元903对上述块图像数据BDit进行将块内的各像素的像素值顺序置换为出现频度最高的像素值的平滑处理,并输出平滑处理后的块图像数据作为图像特征数据Dic。
这里,由于对象图像是2值图像,所以,通过上述平滑处理,块内像素的像素值就置换为黑像素和白像素中在块内数量多的像素值。
该平滑处理的结果,在上述对象2值图像是由64像素×64像素构成的图像时,作为对上述对象2值图像的图像特征,可以得到由8像素×8像素构成的缩小2值图像作为图像特征(网格特征)。
并且,由预测图像生成单元904根据上述图像特征数据Dic生成与对象图像对应的预测图像的数据PDit,由熵编码单元905对对象图像数据Dit参照上述预测图像数据PDit进行算术编码处理,作为与对象图像数据对应的编码数据Die输出熵代码。
这样,在本实施例9中,除了实施例8的结构外,具有从对象图像数据Dit中抽出表示对象图像的图像特征的数据Dic的图像特征抽出单元902,所以,除了实施例8的效果外,由图像编码装置从对象图像数据中抽出图像特征数据,可以得到作为文书文卷编排装置及传真装置中的图像编码单元而应用的图像编码装置。
另外,与分割对象图像的指定尺寸的多个块对应地分割与对象图像对应的图像数据,将与上述各块对应的图像数据置换为各块内的各像素的像素值中出现频度最高的最频像素值,作为对上述对象图像的图像特征数据,输出与和上述各块对应的最频像素值构成的缩小图像对应的图像数据,所以,可以简单地作成表示对象图像的特征的图像特征数据。
(实施例10)图10时表示本发明实施例10的图像译码装置的结构的框图。本实施例10与权利要求12、权利要求14对应。
本实施例10的图像译码装置1000是与上述实施例8或9的图像编码装置800或900对应的译码装置,可以作为图39所示的文书文卷编排装置3900、传真装置等具有扫描器的电子仪器中的图像译码单元使用。
即,图像译码装置1000接收从上述实施例8或9的图像编码装置800或900输出的熵代码(编码数据)Die和图像特征数据Dic,对该编码数据Die参照根据图像特征数据Dic生成的预测图像数据Pdit进行算术译码处理。
具体而言,上述图像译码装置1000具有根据图像特征数据Dic生成预测图像数据PDit的预测图像生成单元1001和参照上述预测图像数据PDit对该编码数据Die进行算术译码处理并输出与对象图像对应的译码图像数据Did的熵译码单元1002。
这里,图像特征是实施例8所示的缩小图像(网格特征),对象图像是2值图像。另外,输入的编码数据Die是通过利用实施例8或9的图像编码装置的对象图像与预测图像的相关的算术编码处理而得到的熵代码。
下面,说明其动作。
在编码数据Die和图像特征数据Dic输入本实施例10的图像译码装置1000时,由预测图像生成单元1001根据上述图像特征数据Dic生成对应上述对象图像的预测图像的数据Pdit。
并且,由熵译码单元1002对与对象图像对应的编码数据Die参照上述预测图像数据PDit进行算术译码处理,并输出与对象图像对应的译码图像数据Did。
这样,在本实施例10的图像译码装置1000中,具有根据与对象图像对应的图像特征数据Dic生成与对象图像对应的预测图像数据PDit的预测图像生成单元1001,参照预测图像数据PDit对该编码数据Die进行算术译码处理,所以,可以实现将通过利用对象图像与预测图像的相关的编码效率高的算术编码处理而得到的熵代码正确地进行译码的图像译码装置。
另外,具有上述实施例9的图像编码装置900和实施例10的图像译码装置1000的传真装置,可以通过将图41(a)的传真装置中的图像编码装置200a和图像译码装置300a分别置换为上述图像编码装置900和图像译码装置1000而实现。
此外,具有上述实施例9的图像编码装置900和实施例10的图像译码装置1000的文书文卷编排装置,可以通过将图41(b)的文书文卷编排装置中的图像编码装置200a和图像译码装置300a分别置换为上述图像编码装置900和图像译码装置1000而实现。
(实施例11)图11是表示本发明实施例11的图像编码装置的结构的框图。本实施例11与权利要求9、权利要求11、权利要求15对应。
本实施例11的图像编码装置1100可以作为例如图39所示的文书文卷编排装置3900、传真装置等具有扫描器的电子仪器中的图像编码单元使用。
本实施例11的图像编码装置1100除了上述实施例8的图像编码装置800的结构外,还具有从对象图像数据Dit中抽出与和对象图像类似的类似图像对应的标识符作为图像特征数据Dic的图像特征抽出单元1101,将上述对象图像数据Dit参照根据与其对应的图像特征数据Dic得到的预测图像数据PDit进行算术编码处理。即,构成上述图像编码装置1100的预测图像生成单元1104和熵编码单元1105的结构分别与上述实施例8的图像编码装置800的预测图像生成单元801和熵编码单元802完全相同。
这里,上述图像特征抽出单元1101具有从作为编码的对象的对象图像中抽出表示该图像的特征的特征矢量的特征量抽出单元1102和对与该对象图像对应的特征矢量进行矢量量化处理并输出类似图像的标识符的矢量量化单元1103。另外,上述特征矢量是在文字的图形识别等中使用的特征量的一种。该特征矢量只要是可以在文字识别等中利用的就行,不论是什么都可以,但是,特别是背景特征及轮廓方向特征等是有效的(参见“模式识别、电子情报通信学会、p.43”)。
例如,作为与表示平假名文字“あ”的2值图像对应的特征矢量,可以举出以将图32所示的文字图像“あ”3200的缩小图像3202的各像素按指定的顺序取白像素为“0”、黑像素为“1”进行扫描而得到的“0”和“1”的排列为要素的矢量。
另外,在矢量量化处理中,根据特征矢量使用VQ代码薄导出上述标识符。在上述VQ代码薄中,使代表特征矢量与标识符对应。上述代表特征矢量是将在矢量空间上定义的多个学习矢量设定在分为多个组时的各组中的矢量。
并且,在任意的矢量输入上述矢量量化单元1103时,在上述矢量空间上检索上述任意矢量与代表特征矢量间的距离成为最小的组,根据VQ代码薄输出与表示该组的代表特征矢量对应的标识符。VQ代码薄的作成方法记载在“Linde,Buzo,Gray;An Algorithm forVector Quantizer Design,IEEE Trans.Commun.,COM-28-1,pp.84-95,1980”中。
在本实施例中,作为矢量,考虑从图像得到的特征矢量。作为学习矢量,使用根据文字字体(2值文字图像)求出的特征矢量,矢量间的距离使用欧几里得距离。VQ代码薄的要素由组的代表特征矢量和标识符的组合构成。
另外,构成上述图像编码装置1100的预测图像生成单元1104和熵编码单元1105的结构分别与上述实施例8的图像编码装置800的预测图像生成单元801和熵编码单元802完全相同。
下面,说明其动作。
设输入本实施例11的图像编码装置1100的对象图像数据为2值图像的数据。
在上述对象图像数据Dit输入上述图像编码装置1100时,由图像特征抽出单元1101从对象图像数据Dit中抽出图像特征数据Dic。
即,由图像特征抽出单元1101的特征量抽出单元1102作为根据输入图像在文字识别等中利用的特征量输出特征矢量Vc。于是,由矢量量化单元1103探索与所得到的特征矢量Vc最接近的代表特征矢量,求出并输出与该代表特征矢量对应的标识符Dic。
并且,由预测图像生成单元1104根据从矢量量化单元1103输出的标识符(图像特征数据)Dic求出并输出预测图像数据PDit。这里,预测图像是代表与标识符对应的矢量空间内的组的图像,是具有与该组对应的代表特征矢量和距离最近的特征矢量的文字图像。预测图像除了上述图像以外,也可以采用将与属于上述矢量图像空间内的各组的多个特征矢量对应的文字图像平均化后的图像。
最后,由熵编码单元1105和上述实施例9一样,根据从预测图像生成单元1104输出的预测图像数据利用预测图像与对象图像的相关进行算术编码处理。
这样,在本实施例11的图像编码装置1100中,具有作为图像特征从对象图像中抽出与和对象图像类似的类似图像对应的标识符的图像特征抽出单元1101,根据上述标识符作为对象图像的预测图像求出上述类似图像,并参照该类似图像对对象图像的数据进行算术编码处理,所以,可以提高算术编码器的编码效率,而且可以使用上述标识符检索对象图像的编码数据De。
另外,将与包含在对象图像(文书图像)中的各个文字图像对应的特征矢量Vc进行量化处理,并根据与其对应的代表特征矢量生成与上述文字图像对应的预测图像,所以,作为上述文书图像的各文字的数据输出1个代表特征矢量,可以避免与文书图像对应的文字数据变得冗长,而且可以减轻进行文书图像的文字设计的检索时文字识别的错误(特征抽出的偏差)的影响。
(实施例12)图12是表示本发明实施例12的图像译码装置的结构的框图。本实施例12与权利要求16对应。
本实施例12的图像译码装置1200是与上述实施例11的图像编码装置1100对应的译码装置,可以作为图39所示的文书文卷编排装置3900、传真装置等具有扫描器的电子仪器中的图像译码单元使用。
即,图像译码装置1200接收从上述实施例11的图像编码装置1100输出的熵代码(编码数据)Die和图像特征数据(预测图像标识符)Dic并对该编码数据Die参照根据图像特征数据Dic生成的预测图像数据PDit进行算术译码处理。
具体而言,上述图像译码装置1200具有根据图像特征数据Dic生成预测图像数据PDit的预测图像生成单元1201和对该编码数据Die参照上述预测图像数据PDit进行算术译码处理并输出与对象图像对应的译码图像数据Did的熵译码单元1202。
这里,图像特征是表示实施例11中的类似图像的标识符,对象图像是2值图像。另外,输入的编码数据Die是通过实施例11的图像编码装置利用对象图像与预测图像(类似图像)的相关的算术编码处理而得到的熵代码。
这里,假定上述标识符是与通过对上述特征矢量的矢量量化处理而得到的代表特征矢量对应的标识符。
下面,说明其动作。
在编码数据Die和图像特征数据(预测图像标识符)Dic输入本实施例12的图像译码装置1200时,由预测图像生成单元1201根据上述预测图像标识符Dic生成对上述对象图像的类似图像的数据(预测图像数据)PDit。
并且,由熵译码单元1202对与对象图像对应的编码数据Die参照上述预测图像数据PDit进行算术译码处理,并输出与对象图像对应的译码图像数据Did。
这样,在本实施例12的图像译码装置1200中,具有根据与对象图像对应的图像特征数据(预测图像标识符)Dic生成与对象图像类似的类似图像的数据PDit的预测图像生成单元1201,参照预测图像数据PDit对该编码数据Die进行算术译码处理,所以,可以实现将通过利用对象图像与预测图像的相关的编码效率高的熵编码处理而得到的熵代码正确地进行译码的图像译码装置。
另外,具有上述实施例11的图像编码装置1100和实施例12的图像译码装置1200的传真装置,可以通过将图41(a)的传真装置中的图像编码装置200a和图像译码装置300a分别置换为上述图像编码装置1100和图像译码装置1200而实现。
此外,具有上述实施例11的图像编码装置1100和实施例12的图像译码装置1200的文书文卷编排装置,可以通过将图41(b)的文书文卷编排装置中的图像编码装置200a和图像译码装置300a分别置换为上述图像编码装置1100和图像译码装置1200而实现。
(实施例13)图13是表示本发明实施例13的图像编码装置的结构的框图。本实施例13与权利要求17对应。
本实施例13的图像编码装置1300可以作为例如图39所示的文书文卷编排装置3900的图像编码单元使用。
下面,进行详细的说明。本实施例13的图像编码装置1300具有接收作为编码的对象的对象图像的数据(对象图像数据)Dit和与该对象图像类似的预测图像的数据(预测图像数据)PDit、并将对象图像数据Dit参照与其对应的预测图像数据PDit进行算术编码处理、从而输出与上述对象图像对应的熵代码作为其编码数据Die的熵编码单元1301。
下面,说明其作用效果。
在预测图像数据PDit与对象图像数据Dit一起输入本实施例13的图像编码装置1300时,由熵编码单元1302参照上述预测图像数据PDit对对象图像数据Dit进行和实施例1的熵编码单元106相同的算术编码处理。
这样,在本实施例13的图像编码装置1300中,具有将对象图像数据Dit参照与其对应的预测图像数据PDit进行算术编码处理的熵编码单元1301,所以,在进行对象图像数据Dit的编码处理时,通过指定与该对象图像类似的类似图像的数据并将该数据PDit作为与对象图像对应的预测图像数据而输入,便可提高算术编码器的编码效率。
(实施例14)图14是表示本发明实施例14的图像编码装置的结构的框图。本实施例14与权利要求18、权利要求19对应。
本实施例14的图像编码装置1400可以作为例如图39所示的文书文卷编排装置3900、传真装置等具有扫描器的电子仪器中的图像编码单元使用。
本实施例14的图像编码装置1400具有根据对象图像数据Dit生成与其对应的预测图像数据PDit的图像预测单元1401而取代上述实施例11的图像编码装置11的图像特征抽出单元1101和预测图像生成单元1101,参照预测图像数据PDit将上述对象图像数据Dit进行算术编码处理。即,构成上述图像编码装置1400的熵编码单元1405的结构与上述实施例11的图像编码装置1100的熵编码单元1105完全相同。
这里,上述图像预测单元1401由从作为编码的对象的对象图像中抽出表示该图像的特征的特征矢量Vc的特征量抽出单元1402、对与该对象图像对应的特征矢量进行矢量量化处理并输出类似图像的标识符Dic的矢量量化单元1403、和根据上述标识符生成与对象图像对应的预测图像数据PDit的预测图像生成单元1404构成。
这里,作为预测图像数据的抽出处理的一例,利用矢量量化处理,上述特征量抽出单元1402、矢量量化单元1403和预测图像生成单元1404的结构分别与实施例11的特征矢量抽出单元1101、矢量量化单元1103和预测图像生成单元1104相同。
下面,说明其动作。
在上述对象图像数据Dit输入上述图像编码装置1400时,由图像预测单元1401根据对象图像数据Dit生成预测图像数据PDit。在上述图像预测单元1401中,由上述特征量抽出单元1402、矢量量化单元1403和预测图像生成单元1404分别进行和实施例11的对应的单元1101、1103、1104相同的处理,生成预测图像数据。
并且,由熵编码单元1405通过与实施例11的熵编码单元1105相同的处理,利用上述预测图像数据PDit与对象图像数据Dit的相关对对象图像数据Dit进行熵编码处理。
这样,在本实施例14的图像编码装置1400中,具有根据对象图像数据Dit生成与其对应的预测图像数据PDit的图像预测单元1401,参照预测图像数据PDit将上述对象图像数据Dit进行熵编码,所以,可以提高算术编码器的编码效率,而且可以利用上述预测图像数据PDit检索对对象图像的编码数据De。
(实施例15)图15是表示本发明实施例15的图像译码装置的结构的框图。本实施例15与权利要求20对应。
本实施例15的图像译码装置1500是与上述实施例14的图像编码装置1400对应的译码装置,可以作为图39所示的文书文卷编排装置3900、传真装置等具有扫描器的电子仪器中的图像译码单元使用。
即,图像译码装置1500接收从上述实施例14的图像编码装置1400输出的熵代码(编码数据)Die和预测图像数据PDit,对该编码数据Die参照预测图像数据PDit进行算术译码处理。
下面,说明其动作。
在编码数据Die输入本实施例15的图像译码装置1500时,由熵译码单元1501对与对象图像对应的编码数据Die参照上述预测图像数据PDit进行算术译码处理,输出与对象图像对应的译码图像数据Did。
这样在本实施例15的图像译码装置1500中,参照与对象图像对应的预测图像数据PDit将与对象图像对应的编码数据Die进行熵译码处理,所以,可以实现将通过利用对象图像与预测图像的相关的编码效率高的熵编码处理而得到的熵代码正确地进行译码的图像译码装置。
具有上述实施例13或14的图像编码装置1300或1400和实施例15的图像译码装置1500的传真装置,可以通过将图41(a)的传真装置中的图像编码装置200a和图像译码装置300a分别置换为上述图像编码装置1300或1400和图像译码装置1500而实现。
此外,具有上述实施例13或14的图像编码装置1300或1400和实施例15的图像译码装置1500的文书文卷编排装置,可以通过将图41(b)的文书文卷编排装置中的图像编码装置200a和图像译码装置300a分别置换为上述图像编码装置1300或1400和图像译码装置1500而实现。
(实施例16)图16是表示本发明实施例16的图像编码装置的结构的框图。本实施例16与权利要求33对应。
本实施例16的图像编码装置1600可以作为例如图39所示的文书文卷编排装置3900、传真装置等具有扫描器的电子仪器中的图像编码单元使用。
本实施例16的图像编码装置1600具有将对象图像数据Dit进行编码并输出编码数据Die的图像编码单元1601,和将关于对象图像的属性信息Dai与和上述对象图像对应的编码数据Die一起接收并将上述属性信息Dai附加到编码数据Die上从而输出属性附加编码数据Daie的属性信息附加单元1602。
这里,上述图像编码单元1601的结构和实施例9的图像编码装置900相同。上述图像编码装置1601不限于由实施例9的图像编码装置900构成,也可以由实施例8、11、13和14中的任意一个图像编码装置构成。另外,作为上述对象图像,有包含文字的文书图像或表示文字本身的文字图像等,这里假定上述对象图像为文字图像,属性信息表示关于文字图像的属性。因此,上述图像编码单元1601,作为编码数据Die输出与文字图像对应的文字图像代码。
图34是用于说明关于上述文字图像的属性信息的模式图。
在属性信息中,包含作为对象的文字图像配置在文书图像中的位置、文书图像中的文字图像区域的高度和宽度、相对于文书图像中的文字图像区域的纵写、横写的区别等多个属性项目。这里,文字图像在文书图像中的位置通过与文字图像外接的矩形(长方形)的左上顶点的坐标(外接矩形的左上坐标)来表示。另外,上述文字图像区域的高度是文字图像的纵方向的尺寸。
另外,如图34所示,上述属性信息的各属性项目通过用于识别属性项目的标识符(属性标识符)A(i)〔i=0,l,2,…,n〕和在数量上表示属性项目的属性值M(i)〔i=0,1,2,…,n〕的组(通常为矢量)来表述,代码串的1个属性信息的最终位置利用称为EOT(End Of Table)的特殊的属性标识符来表示。
例如,属性标识符A(0)表示作为属性项目的外接矩形的左上坐标,属性标识符A(0)具有值“0”,属性值M(0)是上述外接矩形的左上坐标的值。属性标识符A(1)表示作为属性项目的文字图像区域的高度,属性标识符A(1)具有值“1”,属性值M(1)是上述文字图像区域的高度的数值。属性标识符A(2)表示作为属性项目的文字图像区域的宽度,属性标识符A(2)具有值“2”,属性值M(2)是上述文字图像区域的宽度的数值。属性标识符A(3)表示作为属性项目的文字图像的纵写(0)/横写(1)的区别,属性标识符A(3)具有值“3”,属性值M(3)是表示上述纵写(0)/横写(1)的区别的数值“0”或数值“1”。另外,属性标识符A(i-1)表示第i个属性项目,属性标识符A(i-1)具有指定的值“i-1””,属性值M(i-1)是表示上述第i个属性项目的指定的数值。此外,属性标识符A(n)表示没有第n个属性项目之后的属性项目,属性标识符A(n)具有符号“EOT”。
图35(a)表示某一文字图像的属性信息具有外接矩形的坐标(104、23)、文字图像区域的宽度(53)、纵写(0)这样的3个属性项目时的属性附加编码数据Daie的代码串。
在该属性附加编码数据Daie中,在与文字图像对应的编码数据Die之前附加属性信息Dai,在与该属性信息Dai对应的代码串中,分别成对地包含具有值“0”的属性标识符A(0)和具有值(104,23)的属性值M(0)、具有值“2”的属性标识符A(2)和具有值(53)的属性值M(2)、具有值“3”的属性标识符A(3)和具有值(0)的属性值M(3),在属性值M(3)之后,配置具有符号“EOT”的属性标识符A(n)。
下面,说明其动作。
在对象图像(文字图像)的数据Dit输入本实施例16的图像编码装置1600时,由图像编码单元1601和实施例9的图像编码装置900一样将该对象图像数据Dit参照预测图像数据PDit进行熵编码处理,与图像特征数据Dic一起输出编码数据(文字图像编码数据)Die。
这时,在上述文字图像编码Die输入属性信息附加单元1602的同时,从外部输入对象图像(输入文字图像)的属性信息Dai。于是,由属性信息附加单元1602将其属性信息Dai附加到文字图像数据Die上,输出属性附加编码数据Daie。
这样,在本实施例16的图像编码装置1600中,作为将文字图像数据编码并输出编码数据(文字图像编码数据)Die的图像编码单元1601,具有和实施例9的图像编码装置900相同的结构,给从该图像编码单元1601输出的文字图像编码数据Die附加上其属性信息Dai而输出,所以,除了实施例9的效果外,不将文字图像编码数据进行译码就可以知道文字图像的属性。
另外,在使用图像特征数据进行文字图像的检索时,可以参照文字图像的属性信息进行快速检索。
(实施例17)图17是表示本发明实施例17的图像编码装置的结构的框图。本实施例17与权利要求34对应。
本实施例17的图像编码装置1700可以作为例如图39所示的文书文卷编排装置3900、传真装置等具有扫描器的电子仪器中的图像编码单元使用。
本实施例17的图像编码装置1700具有接收对象图像的数据Dit将与包含在对象图像中的文字图像对应的图像数据进行编码并与和该文字图像对应的编码数据(文字图像编码数据)De1一起输出表示上述对象图像中文字图像的位置的位置数据Dcp的文字图像编码单元1701、接收对象图像数据Dit和上述文字图像的位置数据Dcp并输出与从对象图像中消去文字图像而得到的非文字图像对应的数据Dcd的文字图像消去单元1702,和对非文字图像数据Dcd进行编码处理并输出与非文字图像对应的编码数据(非文字图像编码数据)De2的非文字图像编码单元1703。
这里,上述文书图像编码单元1701将根据文字图像数据及其属性信息进行文字图像数据的编码并输出包含文字图像的属性信息Dai和文字图像编码数据Die的属性附加编码数据Daie的实施例16的图像编码装置作为其一部分包含在其中。
下面,说明其动作。
在作为对象图像数据Dit,2值文书图像的数据输入本实施例17的图像编码装置1700时,由文字图像编码单元1701作为文字图像顺序抽出对象图像的文字部分的图像,对各文字图像的数据进行编码处理,作为与文字图像对应的编码数据输出文字图像编码数据De1。这时,与文书图像编码数据De1一起也输出文书图像的属性信息(图中未示出)。
其次,由文字图像消去单元1702从对象图像(文书图像)中消去文字部分(文字图像),然后,构成对象图像的消去部分的图像的像素值利用位于该消去部分周边的图像所像素值进行内插。在对象图像为2值图像时,消去部分由白像素所湮没。这样,就从上述文字图像消去单元1702输出非文字图像的数据即与构成对象图像的文字部分的像素的像素值用其周边的像素的像素值置换后的图像对应的数据Dcd。
最后,由非文字图像编码单元1703利用JBIG(Joint Bi-LevelImage Coding Experts Group)、MMR(Modified Modified Read)、JPEG(Joint Photographic Cording Experts Group)等压缩编码方法将非文字图像数据Dcd进行编码,作为非文字图像编码数据De2输出与非文字图像对应的编码数据。
下面,具体说明上述图像编码装置1700的编码处理。
图36是用于说明上述图像编码装置1700的处理的图。
例如,在作为使用表的文书的图像的2值文书图像3501与表示包含在该文书图像中的文字图像的位置和大小的属性信息一起输入上述图像编码装置1700时,由文字图像编码单元1701抽出上述文书图像的各文字图像3603的数据,对各文字图像将该数据编码。这样,与各文字图像对应的编码数据就作为文字图像编码数据De1从上述文字图像编码单元1701顺序输出。
另外,由文字图像消去单元1702根据表示包含在文书图像中的文字图像的位置和大小的属性信息进行用白像素将文书图像的各文字图像的部分湮没的像素置换处理,从而输出消去了文书图像的文字部分的非文字图像3602的数据Dcd。
并且,由非文字图像编码单元1703利用JBIG、MMR、JPEG等压缩编码方法将非文字图像3602的数据Dcd进行编码,作为非文字图像编码数据De2输出与非文字图像对应的编码数据。
这样,在本实施例17的图像编码装置1700中,具有接收与文书图像对应的数据Dit并抽出包含在该文书图像中的文字图像从而将该文字图像的数据进行编码的文字图像编码单元1701、和接收与文书图像对应的数据Dit并生成与消去包含在该文书图像中的文字部分的非文字图像对应的数据的文字图像消去单元1702,将文书图像的数据分为文字图像和非文字图像进行编码,所以,可以将文字图像和非文字图像分别利用适合于它们的编码效率高的编码方法进行编码。另外,可以利用与文字图像对应的编码数据(文字图像编码数据)进行文书检索。
(实施例18)图18是表示本发明实施例18的图像译码装置的结构的框图。本实施例18与权利要求35对应。
本实施例18的图像译码装置1800是与上述实施例17的图像编码装置1700对应的译码装置,可以作为例如图39所示的完善文卷编排装置3900、传真装置等具有扫描器的电子仪器中的图像译码单元使用。
该实施例18的图像译码装置1800具有接收顺序输入的文字图像编码数据De1并将该文字图像编码数据De1进行译码从而生成文字图像数据Dd1的文字图像译码单元1801、接收非文字图像编码数据De2并将非文字图像编码数据进行译码从而生成非文字图像数据Dd2的非文字图像译码单元1802和接收上述非文字图像数据和文字图像数据并根据文书图像的属性信息(图中未示出)进行将各文字图像配置到上述非文字图像上的指定位置的文书图像的再构成从而生成作为对象图像的文书图像的数据Dd的图像再构成单元1803。
下面,说明其动作。
在文字图像编码数据De1和非文字图像编码数据De2输入本实施例18的图像译码装置1800时,由文字图像译码单元1801对文字图像编码数据进行与在上述图像编码装置1700中的文字图像的编码处理对应的译码处理,生成文字图像数据Dd1。另外,这时,由非文字图像译码单元1802对非文字图像编码数据De2进行与在上述图像编码装置1700中的非文字图像的编码处理对应的译码处理,生成非文字图像数据Dd2。
并且,由图像再构成单元1803使用上述非文字图像数据和文字图像数据根据文书图像的属性信息(图中未示出)进行文书图像的再构成处理,生成各文字图像配置到上述非文字图像上的指定位置的文书图像的数据Dd。
这样,在本实施例18的图像译码装置1800中,作为与文书图像对应的编码数据,分别接收文书图像的文字图像的编码数据De1和消去了文书图像的文字图像的非文字图像的编码数据De2,分别将各编码数据进行译码生成文字图像数据Dd1和非文字图像数据Dd2,根据这些数据Dd1和Dd2进行文书图像的再构成,生成文书图像数据,所以,可以实现可以将利用分别符合于文字图像和非文字图像的有效的编码方法进行编码的编码数据De1和De2正确地进行译码的图像译码装置。
另外,可以利用与文字图像对应的编码数据(文字图像编码数据)进行文书图像的检索。
具有上述实施例16或17的图像编码装置1600或1700和实施例18的图像译码装置1800的传真装置,可以通过分别将图41(a)的传真装置中的图像编码装置200a和图像译码装置300a置换为上述图像编码装置1600或1700和图像译码装置1800而实现。
此外,具有上述实施例16或17的图像编码装置1600或1700和实施例18的图像译码装置1800的文书文卷编排装置,可以通过分别将图41(b)的文书文卷编排装置中的图像编码装置200a和图像译码装置300a置换为上述图像编码装置1600或1700和图像译码装置1800而实现。
(实施例19)图19是表示本发明实施例19的文字核对装置的结构的框图。本实施例19与权利要求36对应。
本实施例19的文字核对装置1900可以作为例如图39所示的文书文卷编排装置3900等电子仪器中的信息检索装置的一部分使用。
上述文字核对装置1900具有接收附加了属性信息Dai的文字图像编码数据D19根据从外部输入的检索条件的数据Sd输出表示上述文字图像编码数据D19是否满足检索条件的核对结果的数据Sr的文字属性核对单元1901。
这里,附加了属性信息Dai的文字图像编码数据D19的数据结构和从实施例16的图像编码装置1600输出的属性附加编码数据Daie相同。
如图34所示,该属性信息包含与各个属性对应的属性标识符A(i)和属性值M(i),由与各属性项目对应的属性标识符和属性值的组(通常为矢量)的集合构成。
另外,上述检索条件数据Sd包含多个属性区别条件,各属性区别条件由属性标识符和以其属性值为变量的条件式的组来表述。如果上述文字图像编码数据D19的特定属性的属性值满足上述检索条件中对应的属性区别条件的属性值的条件式,该属性区别条件即为真,如果上述特定属性的属性值不满足属性区别条件的属性值的条件式,检索条件的该属性区别条件就为伪。
并且,如果检索条件的所有的属性区别条件都是真,就判定作为检索的对象的文字图像编码数据满足检索条件。
例如,假定文字图像编码数据D19具有图35(a)的属性信息。即,表示属性标识符A(0)的属性(外接矩形的左上的坐标)的属性值M(0)为(104,23)、表示属性标识符A(2)的属性(区域的宽度)的属性值M(2)为53,表示属性标识符A(3)的属性(纵写和横写的区别)的属性值M(3)为0(纵写)。
另外,如图35(b)所示,检索条件包含2个属性区别条件3501和3502。上述属性区别条件3501包含属性标识符SA(2)和关于表示它的属性(区域的宽度)的属性值的条件式SM(2),该属性值的条件式SA(2)成为X>30,表示区域的宽度大于30。另外,上述属性区别条件3502包含属性标识符SA(3)和关于表示它的属性(纵写、横写的区别)的属性值SM(3),属性值SM(3)成为X=0,表示是纵写。
这时,具有图35(a)所示的属性信息Dai的文字图像编码数据D19满足上述检索条件3500的2个属性区别条件3601、3502,所以,文字图像编码数据D19满足检索条件3500。
下面,说明其动作。
在表示文字图像编码数据D19和表示检索条件3500的数据Sd输入上述实施例19的文字核对装置1900时,由文字属性核对单元1901对上述检索条件3500的各属性区别条件判断上述文字图像编码数据D19是否满足属性区别条件。
即,如图35(b)所示,检索条件3500包含由属性标识符SA(2)和属性值SM(2)构成的属性区别条件3501和由属性标识符SA(3)和属性值SM(3)构成的属性区别条件3502,所以,满足检索条件的文字图像为文字图像的区域的宽度大于30、而文字图像为纵写的文字图像。
与此相反,如图35(a)所示,文字图像编码数据D19具有包含属性标识符A(0)、A(2)、A(3)和属性值M(0)、M(2)、M(3)的属性信息,所以,可知该文字图像是其外接矩形的左上坐标为(104,23)、文字图像的区域的宽度为53、文字图像是纵写的文字图像。
因此,由上述文字属性核对单元1901判断与上述文字图像编码数据D10对应的文字图像满足上述检索条件3500的各属性区别条件3501和3502,从而从上述文字核对装置1900输出包含在文书图像的标题行中的大的文字和与纵写的文字串对应的文字图像编码数据(文字图像的编码数据)。
这样,在本实施例19的文字核对装置1900中,具有通过附加到文字图像编码数据上的属性信息与检索条件的核对来判断属性信息是否满足检索条件的文字核对单元1901,所以,文字图像数据已编码的状态也可以只抽出包含在文书图像的标题行中的大的文字及纵写的文字串。
(实施例20)图20是表示本发明实施例20的文字核对装置的结构的框图。本实施例20与权利要求37、权利要求38对应。
本实施例20的文字核对装置2000可以作为例如图39所示的文书文卷编排装置3900等电子仪器中的信息检索装置的一部分使用。
文字核对装置2000接收特定从外部输入的文字图像的文字代码Dco并将与附加了图像特征数据V20的文字图像编码数据D20对应的文字图像与由上述文字代码所特定的文字图像进行核对,输出表示核对结果的数据Sr。
即,文字核对装置200具有抽出包含在由上述文字代码所特定的文字图像中的图像特征的图像特征抽出单元2001,该图像特征抽出单元2001由根据文字代码Dco生成由该文字代码所特定的文字图像的数据Di的文字图像生成单元2002和接收上述文字图像数据Di并抽出包含在由文字代码所特定的文字图像中的图像特征从而输出图像特征数据Vc的特征量抽出单元2003构成。这里,上述图像特征数据V20和图像特征数据Vc利用和从实施例11的图像编码装置1100的特征量抽出单元1102输出的图像特征数据相同的矢量表示。
另外,上述文字核对装置2000具有求出文字图像编码数据D20所具有的图像特征数据V20与从图像特征抽出单元2001得到的图像特征数据Vc的欧几里得距离并输出距离信息Cd的距离计算单元2005,和根据该距离信息Cd输出表示与文字图像编码数据D20对应的文字图像与由上述文字代码所特定的文字图像是否一致的核对结果的数据Sr的核对判断单元2006。
在本实施例中,包含在文字图像中的图像特征采用图32所示的缩小图像(网格特征)3202,图像特征数据为以例如扫描缩小图像的各像素(网格)的像素值而得到的多个值为分量的矢量。
下面,说明其动作。
在文字图像编码数据D20和文字代码Dco输入上述实施例20的文字核对装置2000时,由文字图像生成单元2002根据计算机等所使用的文字字体信息生成由文字代码Dco所特定的文字图像的数据Di。
在该文字图像数据Di输入特征量抽出单元2003时,由该单元2003抽出文字图像的图像特征,生成表示该图像特征的数据(矢量)Vc。该特征量抽出单元2003的处理和实施例9的特征量抽出单元901的处理相同。
作为上述图像特征而得到的缩小图像由8像素×8像素构成时,缩小图像可以考虑64维的欧几里得空间上的矢量(特征矢量)。
并且,由距离计算单元2004根据附加到文字图像编码数据D20上的图像特征数据V20和从上述图像特征抽出单元2001输出的图像特征数据Vc求出表示这些数据的2个特征矢量间的欧几里得距离并输出距离信息Cd。
于是,在核对判断单元2005中,根据该距离信息Cd,如果上述欧几里得距离小于某一阈值,就判定与文字图像编码数据D20对应的文字图像与由文字代码Dco所特定的文字图像一致,如果上述欧几里得距离大于阈值,就判定上述两文字图像不一致。
这样,在本实施例20的文字核对装置2000中,具有根据从外部输入的文字代码Dco抽出由该文字代码所特定的文字图像的图像特征并输出图像特征数据Vc的图像特征抽出单元2001,所以,将包含在文字图像编码数据D20中的特征图像数据V20与和文字代码Dco对应的文字图像的图像特征数据Vc进行比较。
因此,在附加了图像特征数据V20的文字图像编码数据D20与文字代码Dco之间可以进行对应的文字图像的核对。
于是,在由文字代码Dco所特定的文字图像与和文字图像编码数据D20对应的文字图像一致时,不将文字图像编码数据D20进行译码也可以知道与文字图像编码数据D20对应的文字图像,从而可以进行与文字图像编码数据D20对应的文字图像和其他的文字图像之间的形状比较。
(实施例21)图21是表示本发明实施例21的文字核对装置的结构的框图。本实施例21与权利要求39、权利要求40对应。
本实施例21的文字核对装置2100可以作为例如图39所示的文书文卷编排装置3900等电子仪器中的信息检索装置的一部分使用。
文字核对装置2100接收从外部输入的特定文字图像的文字代码Dco,将与附加了和上述文字图像类似的预测文字图像的数据(预测文字图像数据)PDi的文字图像编码数据D21对应的文字图像与由上述文字代码所特定的文字图像进行核对,并输出表示核对结果的数据Sr。
即,文字核对装置2100具有接收上述文字图像编码数据D21并根据附加到其上的预测文字图像数据PDi从预测文字图像中抽出其图像特征从而输出第1图像特征数据Vc1的第1特征量抽出单元2101,和接收上述文字代码Dco并抽出由该文字代码所特定的文字图像的图像特征从而输出第2图像特征数据Vc2的第2图像特征抽出单元2102。
该第2图像特征抽出单元2102由根据文字代码Dco生成由该文字代码所特定的文字图像的数据Di的文字图像生成单元2103和根据上述文字图像数据Di输出上述第2图像特征数据Vc2的特征量抽出单元2104构成。这里,上述文字图像生成单元2103的结构和实施例20的文字图像生成单元2002相同,上述特征量抽出单元2104和第1图像特征抽出单元2101的结构分别和实施例11的特征量抽出单元1102相同。因此,上述第1、第2图像特征数据Vc1、Vc2和从实施例11的图像编码装置1100的特征量抽出单元1102输出的图像特征数据一样,利用在实施例11的文字识别等中使用的特征矢量来表述。
另外,上述文字核对装置2100具有计算从上述第1图像特征抽出单元2101输出的第1图像特征数据Vc1和从第2图像特征抽出单元2103输出的第2图像特征数据Vc2的欧几里得距离并输出距离信息Cd的距离计算单元2105和根据该距离信息Cd输出表示与文字图像编码数据D21对应的文字图像和由上述文字代码所特定的文字图像是否一致的核对结果的数据Sr的核对判断单元2106。
下面,说明其动作。
在文字图像编码数据D21和文字代码Dco输入上述实施例21的文字核对装置2100时,由上述文字图像生成单元2103根据文字代码Dco进行和实施例20的文字图像生成单元2002相同的处理,并由特征量抽出单元2104和第1图像特征抽出单元2101进行和实施例11的特征量抽出单元1102相同的图像特征的抽出处理。这样,就从第1图像特征抽出单元2101输出第1图像特征数据(特征矢量)Vc1,从特征量抽出单元2104输出第2图像特征数据(特征矢量)Vc2。
其次,由距离计算单元2105根据上述第1、第2图像特征数据Vc1、Vc2计算这2个特征矢量间的欧几里得距离,并输出距离信息Cd。
于是,在核对判断单元2106中,如果该欧几里得距离小于某一阈值时,就判定与文字图像编码数据D21对应的文字图像与由文字代码Dco所特定的文字图像一致,如果上述欧几里得距离大于阈值,就判定上述两文字图像不一致。
这样,在本实施例21的文字核对装置2100中,具有接收文字图像编码数据D21并根据附加到其上的预测文字图像数据PDi输出与预测文字图像对应的第1图像特征数据Vc1的第1特征量抽出单元2101,和根据从外部输入的文字代码Dco抽出由该文字代码所特定的文字图像的图像特征并输出第2图像特征数据Vc2的第2图像特征抽出单元2102,所以,与文字代码Dco对应的文字图像的图像特征数据Vc2与包含在文字图像编码数据D21中的预测文字图像的特征图像数据Vc1进行比较。
因此,在附加了预测文字图像数据PDi的文字图像编码数据D21与文字代码Dco之间可以进行对应的文字图像的核对。
于是,在由文字代码Dco所特定的文字图像与和文字图像编码数据D20对应的预测文字图像一致时,不将文字图像编码数据D20进行译码也可以知道与文字图像编码数据D20对应的文字图像,从而可以进行与文字图像编码数据D20对应的文字图像和其他的文字图像之间的形状比较。
(实施例22)图22是表示本发明实施例22的文字核对装置的结构的框图。本实施例22与权利要求41对应。
本实施例22的文字核对装置2200可以作为例如图39所示的文书文卷编排装置3900等电子仪器中的信息检索装置的一部分使用。
文字核对装置2200接收从外部输入的特定文字图像的文字代码Dco并将与附加了预测文字图像标识符Pid的文字图像编码数据D22对应的文字图像与由上述文字代码所特定的文字图像进行核对从而输出表示核对结果的数据Sr。这里,上述预测文字图像标识符Pid是用于识别与由上述文字代码Dco所特定的文字图像类似的预测文字图像的标识符。
即,文字核对装置2200具有存储表示上述预测文字图像标识符Pid和文字代码Dco与以它们为变量计算的距离信息的对应关系的文字间距离表3701的表存储部2201、接收文字图像编码数据D22和文字代码Dco并参照上述文字间距离表计算以附加到文字图像编码数据D22上的预测文字图像标识符Pid和文字代码Dco为变量的距离信息Cd的距离计算单元2202、和输出表示与文字图像编码数据D22对应的文字图像与由上述文字代码Dco所特定的文字图像是否一致的核对结果的数据Sr的核对判断单元2203。
图37是用于说明文字间距离表3701的图。
上述预测文字图像标识符Pid是与利用实施例11的矢量量化单元1103将特征矢量进行量化处理而得到的各代表特征矢量对应的标识符。
在上述文字间距离表3701中,利用预测文字图像标识符Pid的值P(j)(j=0~n-1)和文字代码Dco的值S(i)(i=0~m-1)定义了以它们为变量的距离信息Cd的值Dij。
下面,简单地说明上述距离信息Cd。
根据VQ代码薄,上述各预测文字图像标识符的值P(j)与代表特征矢量V(j)一一对应。另外,文字代码的值S(i)与通过和上述实施例20的图像特征抽出单元2001的处理相同的对上述文字代码的图像特征抽出处理而求出的特征矢量W(i)对应。
并且,上述文字间距离表的要素(距离信息的值)Dij就成为上述特征矢量W(i)与代表特征矢量V(j)之间的欧几里得距离。
文字间距离表的要素(距离信息的值)Dij通过预先与阈值T进行比较,如果小于阈值T就取为1,如果在上述阈值T以上就取为0,可以压缩表的大小,从而可以进行高速的核对处理。这时,如果距离为1,核对判断单元2203就判定文字图像编码数据与文字代码一致,如果为0就判定不一致。
下面,说明其动作。
在上述文字图像编码数据D22和文字代码Dco输入上述实施例22的文字核对装置2200时,首先由上述距离计算单元2202参照文字间距离表2201计算附加到文字图像编码数据D22上的预测文字图像标识符Pid和由文字代码Dco定义的距离信息Cd。该距离信息Cd的值Dij是根据上述文字代码Dco的值S(i)得到的特征矢量W(i)与根据预测文字图像标识符Pid的值P(j)得到的代表特征矢量V(j)之间的欧几里得距离。
于是,在核对判断单元2203中,如果该距离信息的值Dij小于指定的阈值T,就判定文字图像编码数据D22与文字代码Dco一致,如果该距离信息的值Dij大于指定的阈值T,就判定文字图像编码数据D22与文字代码Dco不一致。
这样,在本实施例22的文字核对装置2200中,具有存储表示附加到文字图像编码数据D22上的预测文字图像标识符Pid和文字代码Dco与以它们为变量而定义的距离信息Cd的对应关系的文字间距离表3701的表存储部2201,将上述预测文字图像标识符Pid用于识别与和上述文字图像编码数据D22对应的文字图像类似的预测文字图像,将上述距离信息Cd的值Dij作为根据上述文字代码Dco的值S(i)得到的特征矢量W(i)与根据预测文字图像标识符Pid的值P(j)得到的代表特征矢量V(j)间的欧几里得距离,所以,将与文字代码Dco对应的特征矢量与和包含在文字图像编码数据D22中的预测文字图像标识符对应的特征矢量进行比较。
因此,可以进行附加了预测文字图像标识符Pid的文字图像编码数据D22与文字代码Dco间的对应的文字图像的核对。
于是,在判定由文字代码Dco所特定的文字图像由和文字图像编码数据D22对应的预测文字图像一致时,不将文字图像编码数据D22进行译码,根据输入的文字代码Dco也可以知道与文字图像编码数据D22对应的文字图像,从而可以进行与文字图像编码数据D22对应的文字图像与其他的文字图像之间的形状比较。
(实施例23)图23是表示本发明实施例23的文字核对装置的结构的框图。本实施例23与权利要求42、权利要求43对应。
本实施例23的文字核对装置2300可以作为例如图39所示的文书文卷编排装置3900等电子仪器中的信息检索装置的一部分使用。
文字核对装置2300接收从外部输入的特定文字图像的文字代码Dco,将与附加了和上述文字图像类似的预测文字图像的数据(预测文字图像数据)PDi的文字图像编码数据D23对应的文字图像与由上述文字代码Dco所特定的文字图像进行核对,并输出表示核对结果的数据Sr。
即,文字核对装置2300具有接收上述文字图像编码数据D23并根据附加到其上的预测文字图像标识符Pid从该标识符表示的预测文字图像中抽出其图像特征从而输出第1图像特征数据Vc1的第1特征量抽出单元2301和接收上述文字代码Dco抽出由该文字代码所特定的文字图像的图像特征并输出第2图像特征数据Vc2的第2图像特征抽出单元2302。
第2图像特征抽出单元2302由根据文字代码Dco生成由该文字代码所特定的文字图像的数据Di的文字图像生成单元2303和根据上述文字图像数据Di输出上述第2图像特征数据Vc2的特征量抽出单元2304构成。这里,上述文字图像生成单元2303的结构和实施例20的文字图像生成单元2002相同,上述特征量抽出单元2304的结构和实施例11的特征量抽出单元1102相同。另外,第2图像特征抽出单元2302的结构和图像特征抽出单元2001相同。另外,上述第1、第2图像特征数据Vc1、Vc2和从实施例11的图像编码装置1100的特征量抽出单元1102输出的图像特征数据一样,利用在实施例11的文字识别等中使用的特征矢量来表述。
另外,上述文字核对装置2300具有计算从上述第1图像特征抽出单元2301输出的第1图像特征数据Vc1与从第2图像特征抽出单元2302输出的第2图像特征数据Vc2的欧几里得距离并输出距离信息Cd的距离计算单元2305和根据该距离信息Cd输出表示与文字图像编码数据D23对应的文字图像与由上述文字代码Dco所特定的文字图像是否一致的核对结果的数据Sr的核对判断单元2306。
上述预测图像标识符假定是通过例如实施例11的矢量量化处理而得到的标识符。
下面,说明其动作。
在附加了预测文字图像标识符Pid的文字图像编码数据D23和文字代码Dco输入上述实施例23的文字核对装置2300时,由第1图像特征抽出单元2301根据预测文字图像标识符Pid从该标识符表示的预测文字图像中抽出其图像特征,并输出第1图像特征数据Vc1。
另外,由上述文字图像生成单元2303根据文字代码Dco进行和实施例20的文字图像生成单元2002相同的处理,由特征量抽出单元2304进行和实施例11的特征量抽出单元1102相同的图像特征的抽出处理,并输出第2图像特征数据(特征矢量)Vc2。
其次,由距离计算单元2305根据上述第1、第2图像特征数据Vc1、Vc2计算这2个特征矢量间的欧几里得距离,并输出距离信息Cd。
于是,在核对判断单元2306中,如果该欧几里得距离小于某一阈值,就判定与文字图像编码数据D23对应的文字图像与由文字代码Dco所特定的文字下面一致,如果上述欧几里得距离大于阈值,就判定上述两文字图像不一致。
如果预测文字图像标识符Pid是作为对文字图像进行文字识别的结果的文字代码,则第1特征量抽出单元2301的结构就与实施例20的特征量抽出单元2001相同。
这样,在本实施例23的文字核对装置2300中,具有接收文字图像编码数据D23并根据附加到其上的预测文字图像标识符Pid输出与预测文字图像对应的第1图像特征数据Vc1的第1特征量抽出单元2301和根据从外部输入的文字代码Dco抽出由该文字代码所特定的文字图像的图像特征并输出第2图像特征数据Vc2的第2图像特征抽出单元2102,所以,进行与文字代码Dco对应的文字图像的图像特征数据Vc2和与包含在文字图像编码数据D23中的预测文字图像标识符对应的特征图像数据Vc1进行比较。
因此,可以进行附加了预测文字图像标识符Pid的文字图像编码数据D23与文字代码Dco之间的对应的文字图像的核对。
于是,在判定由文字代码Dco所特定的文字图像与和文字图像编码数据D23对应的预测文字图像一致时,不将文字图像编码数据D23进行译码,根据输入的文字代码Dco也可以知道与文字图像编码数据D23对应的文字图像,从而可以进行与文字图像编码数据D23对应的文字图像与其他的文字图像之间的形状比较。
通过作成记录用于使计算机执行构成上述各实施例中某一个实施例的装置的多个单元的全部或一部分单元的功能的程序的磁记录媒体或光记录媒体并使用它们使计算机执行上述动作,也可以得到和上述相同的效果。
另外,在本发明的实施例1~7中,作为图像特征,使用从文字识别装置得到的文字代码,但是,也可以使用可以再生实施例8用网格特征所示的图像形状的特征量。这时,图1~图7所示的各装置的预测图像生成单元的结构和预测图像生成单元801相同。
这种结构的装置,不仅可以应用于文书图像的编码,而且也可以应用于一般的图像的编码。
另外,在本发明的实施例1~7中,作为图像特征,使用从文字识别装置得到的文字代码,但是,也可以利用在实施例11中使用的矢量量化处理,使用预测图像标识符.这时,图1~图7的装置中的预测图像生成单元的结构和图11的预测图像生成单元1104相同。
另外,实施例2、4、6的图像特征抽出单元(参见图2、图4、图6)也可以作为图38所示的图像特征抽出单元3801使用.该图像特征抽出单元3801由根据图像数据Di从图像中抽出其部分图像并输出部分图像数据Dbi的区域分割单元3802、根据各部分图像数据Dbi抽出与部分图像对应的特征矢量Vbi的特征量抽出单元3803、和根据得到的特征矢量Vbi求出与代表特征矢量对应的预测图像标识符Dbip的矢量量化单元3804构成。
这样,在将上述实施例2、4、6的图像特征抽出单元置换为上述图像特征抽出单元3801的图像编码装置中,输出将文字数据Dc的文字代码置换为预测图像标识符的部分图像特征数据Dbid。
上述区域分割单元3802与作为对象的图像的种类有关,在是文书图像时,可以使用例如“迁分离检出法文书画像构造解析、信学论、Vol.J74-D-Ⅱ、No.4、pp.491-499”等中所述的方法。
另外,在本发明的实施例11、12中,使用矢量量化处理求出与图像类似的预测图像的标识符,但是,在作为对象的图像限定为文字时,也可以使用文字识别装置。
即,在图11所示的图像编码装置中,具有文字识别装置取代图像特征抽出单元1101,并输出文字代码取代预测文字图像标识符。这时,图11和图12的预测图像生成单元必须采用和图1的预测图像生成单元103相同的结构。
另外,在本发明的实施例1~15中,熵编码单元、熵译码单元、块预测编码单元和块预测译码单元进行算术编码处理和与其对应的算术译码处理,但是,编码处理和译码处理也可以使用霍夫曼编码处理和与其对应的译码处理。
(实施例24)图42是表示本发明实施例24的图像编码装置的结构的框图。本实施例24与权利要求21、权利要求22对应。
本实施例24的图像编码装置4200可以作为例如图39所示的文书文卷编排装置3900、传真装置等具有扫描器的电子仪器中的图像编码单元使用。
本实施例24的图像编码装置4200,对于作为编码处理的对象的对象图像数据Dit,接收与文字对应的文字图像的数据,参照其预测图像对上述对象图像数据Dit进行熵编码处理,并作为与上述对象图像对应的编码数据输出熵代码Die。
即,上述图像编码装置4200具有通过对上述对象图像的文字识别而输出与上述对象图像对应的文字代码Dco和表示该对象图像的特征的第1特征矢量Vc1的图像特征抽出单元4201。
该图像特征抽出单元4201由从上述对象图像中抽出其图像特征并输出特征矢量Vc1的特征量抽出单元4202和使用该特征矢量Vc1对上述对象图像进行文字识别并输出与上述对象图像对应的文字代码Dco的文字识别单元4203构成。
另外,上述图像编码装置4200具有接收对象图像数据Dit和从对象图像数据Dit得到的文字代码Dco及特征矢量Vc1并根据与作为现在处理对象的文字图像(对象图像)对应的文字代码Dco选择预测的第2预测图像数据PDit1和与已处理过的文字图像对应的图像数据(第2预测图像数据PDit2)中的哪一个的预测图像选择单元4205。该预测图像选择单元4205与上述选择的预测图像数据PDit1或PDit2一起输出表示选择上述第1、第2预测图像数据PDit1、PDit2的哪一个的标志Fc0或Fc1和与上述对象图像对应的文字代码Dco。
此外,上述图像编码装置4200具有通过预测图像选择单元4205接收与上述对象图像对应的文字代码Dco并根据与上述对象图像的文字代码Dco对应的字体图像生成第1预测图像数据PDit1的预测图像生成单元4206,和使上述对象图像数据Dit与和其对应的文字代码Dco及第1特征矢量Vc1关联而作为与1个项目对应的1组数据进行存储的预测图像存储单元4207。这里,上述预测图像生成单元4206的结构和实施例1的图像编码装置100的预测图像生成单元103相同。另外,上述预测图像生成单元4207接收上述预测图像选择单元4205的要求即与对象图像对应的文字代码Dco而将与该文字代码Dco对应的文字图像数据和特征矢量分别作为第2预测图像数据PDit2和第2特征矢量Vc2而输出。
并且,上述图像编码装置4200具有参照从上述预测图像选择单元4205输出的第1预测图像数据PDit1或第2预测图像数据PDit2对上述对象图像数据Dit进行算术编码处理并输出与上述对象图像对应的熵代码Die的熵编码单元4208。
下面,说明其动作。
在作为编码处理的对象的文字图像(对象图像)的图像数据Dit输入本实施例24的图像编码装置4200时,由图像特征抽出单元4201生成与上述对象图像数据Dit对应的文字代码Dco和第1特征矢量Vc1。
即,由特征量抽出单元4202从上述对象图像中抽出在文字识别等中利用的特征量,并输出与其对应的第1特征矢量Vc1。于是,由文字识别装置4203探索具有与上述第1特征矢量Vc1最接近的图像特征的文字,并输出与该文字对应的文字代码Dco。该单元4203的文字识别的方法在“模式识别、电子情报通信学会”等中有详细的介绍,所以,这里省略详细的说明。
然后,由预测图像选择单元4205根据上述文字代码Dco和第1特征矢量Vc1选择由预测图像生成单元4206生成的第1预测图像数据PDit1和预测图像存储单元4207存储的第2预测图像数据PDit2中的一方。并且,与所选择的预测图像数据一起输出表示选择哪一个预测图像数据的标志Fc0、Fc1和文字代码Dco。
由熵编码单元4208根据由上述预测图像选择单元4205选择的预测图像数据PDit1或PDit2对对象图像数据Dit进行算术编码处理,并输出熵代码Die作为与上述对象图像对应的编码数据。
下面,详细说明上述预测图像选择单元4205的处理。
图44表示上述预测图像选择单元4205的动作流程。
首先,由上述预测图像选择单元4205开始进行处理时(步骤S4401),顺序读入对象图像数据Dit、从图像特征抽出单元4201输出的文字代码Dco和第1特征矢量Vc1(步骤S4402~S4404)。
其次,判断在预测图像存储单元4207上是否有上述对象图像的文字代码Dco的项目(步骤S4405)。判断的结果,如果有与上述对象图像的文字代码对应的项目,就从该预测图像存储单元4207读入与该文字代码Dco对应的特征量(第2特征矢量)(步骤S4406)。
于是,就计算上述第1特征矢量Vc1与第2特征矢量Vc2之间的欧几里得距离(步骤S4407),并判断该距离是否比指定的阈值大(步骤S4408)。该判断的结果,在上述距离比指定的阈值大时,由上述预测图像生成单元4206生成的对对象图像的第1预测图像数据PDit1就从上述预测图像选择单元4205向熵编码单元4208输出(步骤S4409),同时,与上述对象图像的文字代码Dco一起输出表示选择了上述第1预测图像数据的标志Fc0(步骤S4410)。
另一方面,在上述步骤S4408的判断结果是上述欧几里得距离小于指定的阈值时,预测图像存储单元4207存储的与上述文字代码Dco对应的文字图像数据就作为对上述对象图像的第2预测图像数据PDit2从上述预测图像选择单元5205向熵编码单元4208输出(步骤S4411),同时,与上述对象图像的文字代码Dco一起输出表示选择了上述第2预测图像数据PDit2的标志Fc1(步骤S4412)。
最后,通过上述步骤S4402~S4404的数据读入处理读入上述预测图像选择单元4205的对象图像数据Dit、文字代码Dco和特征量(第1特征矢量)Vc1就作为与新的项目对应的1组数据而存储到预测图像存储单元4207中(步骤S4413)。
与和对象图像的文字代码对应的新的项目对应的数据向上述预测图像存储单元4207中存储时,与同一文字代码Dco对应的项目已存储到上述存储单元4207中时,就进行将与已有的项目对应的老的特征量和对象图像数据改写为与新的项目对应的特征量和对象图像数据的改写处理,或将与对象图像的文字代码对应的特征量和对象图像数据在新的项目与已有的项目之间求平均从而将与已有的项目对应的老的特征量和对象图像数据改写为平均的特征量和平均的对象图像数据的平均化处理。
这样,在本实施例24的图像编码装置4200中,具有根据对象图像的文字代码Dco生成作为与对象图像的文字代码对应的字体图像的数据的第1预测图像数据PDit1的预测图像生成单元4206,和使对象图像数据Dit和与其对应的文字代码Dco及第1特征矢量Vc1相关联而进行存储的预测图像存储单元4207,将根据对象图像的文字代码得到的字体图像(第1预测图像)和过去已编码的文字图像(第2预测图像)中与对象图像类似的一方选择为预测图像,根据所选择的预测图像数据切换发生概率模型,对对象图像数据进行算术编码处理,所以,不仅可以提高算术编码器的编码效率,而且在作为编码处理的对象的文字图像和已进行了编码处理的文字图像相同时,可以省略对对象图像生成预测图像数据的表,从而可以减轻使用预测图像的算术编码处理的运算负担。
另外,将与对象图像对应的文字代码Dco和与对象图像对应的熵代码Die一起输出,所以,也可以使用上述文字代码进行对对象图像的编码数据Die的检索。
(实施例25)图43是表示本发明实施例25的图像译码装置的结构的框图。本实施例25与权利要求23、权利要求24对应。
本实施例25的图像译码装置4300是与上述实施例24的图像编码装置4200对应的译码装置,可以作为图39所示的文书文卷编排装置3900、传真装置等具有扫描器的电子仪器中的图像译码单元使用。
即,图像译码装置4300接收从上述实施例24的图像编码装置4200输出的熵代码(编码数据)Die、文字代码Dco和标志Fc0及Fc1,并参照根据文字代码Dco和标志Fc0及Fc1而生成的预测图像数据PDit对该编码数据Die进行算术译码处理,从而复原对象图像数据Did。
具体而言,上述图像译码装置4300具有根据输入的对象图像的文字代码Dco使用字体信息等输出对对象图像的第1预测图像数据PDit1的预测图像生成单元4302和使上述对象图像数据Dit和与其对应的文字代码Dco关联从而作为与1个项目对应的1组数据进行存储的预测图像存储单元4303。这里,上述预测图像生成单元4302的结构和实施例1的图像编码装置100的预测图像生成单元103相同。另外,上述预测图像存储单元4303接收与对象图像对应的文字代码Dco并将与该文字代码Dco对应的文字图像数据作为第2预测图像数据Pdit2而输出。
另外,上述图像译码装置4300具有根据与作为译码的对象的熵代码Die对应的文字代码Dco和标志Fc0及Fc1选择并输出从上述预测图像生成单元4302得到的第1预测图像数据PDit1和从预测图像存储单元4303得到的第2预测图像数据PDit2中的某一个的预测图像选择单元4301。
此外,上述图像译码装置4300具有参照从预测图像选择单元4302输出的第1预测图像数据PDit1或第2预测图像数据PDit2对上述熵代码Die进行算术译码处理并将上述译码数据作为对象图像数据Did而输出的熵译码单元4304。该熵译码单元4304的结构和实施例3的图像译码装置300的熵译码单元306相同。
下面,说明其动作。
在与作为编码处理的对象的文字图像(对象图像)对应的文字代码Dco、标志Fc0或Fc1和熵代码Die从上述实施例24的图像编码装置4200输入本实施例25的图像译码装置4300时,由预测图像选择单元4301根据上述文字代码Dco和标志Fc0、Fc1选择由预测图像生成单元4302生成的第1预测图像数据PDit1和预测图像存储单元4303存储的第2预测图像数据PDit2中的一方。并且,将所选择的预测图像数据PDit1或PDit2和与其对应的标志Fc0、Fc1一起向上述熵译码单元4304输出。
由该熵译码单元4304根据由上述预测图像选择单元4301选择的预测图像数据PDit1或PDit2对熵代码Die进行算术译码处理,并作为与上述对象图像对应的译码数据而输出对象图像数据Did。
下面,详细说明上述预测图像选择单元4301的处理。
图45表示上述预测图像选择单元4301的动作流程。
首先,由上述预测图像选择单元4301开始进行处理时(步骤S4501),从上述图像编码装置4200顺序读入与对象图像对应的文字代码Dco和标志Fc0或Fc1(步骤S4502、S4503)。
并且,进行该标志是表示在熵代码的译码处理中使用由预测图像生成单元4302生成的第1预测图像数据PDit1的标志Fc0和表示使用预测图像存储单元4303存储的第2预测图像数据PDit2的标志Fc1中的哪一个的判断(步骤S4504)。
上述判断的结果,在输入的标志是标志Fc1时,就从预测图像存储单元4303读入与其存储的上述文字代码Dco对应的文字图像数据(第2预测图像数据)(步骤S4505)。
另一方面,在输入的标志是标志Fc0时,就读入由预测图像生成单元4302根据文字代码Dco生成的第1预测图像数据PDit1(步骤S4506)。
并且,使用由上述预测图像选择单元4301选择的预测图像数据PDit1或PDit2对熵代码进行算术译码处理而得到的译码数据(对象图像数据)Did和与其对应的文字代码Dco一起作为与新的项目对应的1组数据记录到预测图像存储单元4303中(步骤S4507)。
在与和对象图像的文字代码对应的新的项目对应的数据向上述预测图像存储单元4303中存储时,与同一文字代码Dco对应的项目已存储到上述存储单元4303中时,就进行将与已有的项目对应的老的特征量和对象图像数据置换为与新的项目对应的特征量和对象图像数据的置换处理,或将与对象图像的文字代码对应的特征量和对象图像数据在新的项目与已有的项目之间求平均从而将与已有的项目对应的老的特征量和对象图像数据置换为平均的特征量和平均的对象图像数据的平均化处理。
这样,在本实施例25的图像译码装置4300中,具有根据对象图像的文字代码Dco生成作为与对象图像的文字代码对应的字体图像的数据的第1预测图像数据PDit1的预测图像生成单元4302和使对象图像数据Dit和与其对应的文字代码Dco相关联而进行存储的预测图像存储单元4303,将根据对象图像的文字代码得到的字体图像(第1预测图像)和过去进行了译码处理的文字图像(第2预测图像)中与对象图像类似的一方选择为预测图像,根据选择的预测图像数据切换发生概率模型,对与对象图像对应的熵代码进行算术译码处理,所以,在算术编码器的编码效率高、而且作为编码处理的对象的文字图像和已进行了编码处理的文字图像相同时,就可以实现与可以省略对对象图像的预测图像数据的生成处理从而可以降低运算负担的算术编码处理单元的算术译码处理。
另外,在本实施例25的图像译码装置4300中,与和对象图像对应的熵代码Die一起接收与对象图像对应的文字代码Dco,所以,使用上述文字代码也可以进行对对象图像的编码数据De的检索。
在上述实施例24中,作为熵编码装置,是进行算术编码处理,但是,也可以进行霍夫曼编码处理。
另外,在上述实施例25中,作为熵译码装置,是进行算术译码处理,但是,也可以进行霍夫曼译码处理。
另外,具有上述实施例24的图像编码装置4200和实施例25的图像译码装置4300的传真装置,可以通过将图41(a)的传真装置中的图像编码装置200a和图像译码装置300a分别置换为上述图像编码装置4200和图像译码装置4300而实现。
此外,具有上述实施例24的图像编码装置4200和实施例25的图像译码装置4300的文书文卷编排装置,可以通过将图41(b)的文书文卷编排装置中的图像编码装置200a和图像译码装置300a分别置换为上述图像编码装置4200和图像译码装置4300而实现。
(实施例26)图46是表示本发明实施例26的图像编码装置的结构的框图。本实施例26与权利要求25、权利要求26对应。本实施例26的图像编码装置6400可以作为例如图39所示的文书文卷编排装置3900、传真装置等具有扫描器的电子仪器中的图像编码单元使用。
本实施例26的图像编码装置6400对于作为编码处理的对象的对象图像数据Dit接收与文字对应的文字图像的数据,根据表示该文字图像的图像特征的特征量对上述对象图像数据Dit进行熵编码处理,作为与上述对象图像对应的编码数据输出熵代码Die,同时输出与上述文字图像对应的文字代码Dco和关于上述熵编码处理的信息。
即,上述图像编码装置6400具有通过对上述对象图像的文字识别输出与上述对象图像对应的文字代码Dco和表示该对象图像的特征的特征矢量(第1特征矢量)Vc1的图像特征抽出单元4601。该图像特征抽出单元4601由从上述对象图像中抽出其图像特征并输出上述第1特征矢量Vc1的特征量抽出单元4602和使用该第1特征矢量Vc1对上述对象图像进行文字识别并输出与上述对象图像对应的文字代码Dco的文字识别单元4603构成。
另外,上述图像编码装置4600具有根据从对象图像数据Dit得到的文字代码Dco和第1特征矢量Vc1进行第1和第2数据输出处理中的一方的处理的预测图像选择单元(数据输出控制单元)4604。这里,在上述第1数据输出处理中,输出与作为现在处理对象的文字图像(对象图像)对应的文字代码Dco、预测图像数据PDit1和标志Fc0,在第2数据输出处理中,输出上述对象图像的文字代码Dc0和标志Fc1。
此外,上述图像编码装置4600具有通过预测图像选择单元4604接收与上述对象图像对应的文字代码Dco并将与上述对象图像的文字代码Dco对应的字体图像的图像数据作为第1预测图像数据PDit1而输出的预测图像生成单元4605和使与上述对象图像数据Dit对应的文字代码Dco和特征矢量(第1特征矢量)Vc1关联而作为与1个项目对应的1组数据进行存储的预测图像存储单元4606。
这里,上述图像特征抽出单元4601的结构和上述实施例24的图像特征抽出单元4201相同,上述预测图像生成单元4605的结构和实施例1的图像编码装置100的预测图像生成单元103相同。另外,上述预测图像存储单元接收上述预测图像选择单元4603的要求即与对象图像对应的文字代码Dco,输出表示由该文字代码Dco所特定的处理过的文字图像的图像特征的特征矢量(第2特征矢量)Vc2。
并且,上述图像编码装置4600具有在接收到上述标志Fc0时就参照对象图像的预测图像数据PDit1对对象图像数据Dit利用对象图像与预测图像的像素值相关进行算术编码处理并作为与对象图像对应的编码数据而输出熵代码Die、而在接收到上述标志Fc1时就不对对象图像数据Dit进行算术编码处理从而不输出编码数据的熵编码单元4607。
下面,说明其动作。
在作为编码处理的对象的文字图像(对象图像)的图像数据Dit输入本实施例26的图像编码装置4600时,由图像特征抽出单元4601生成与上述对象图像数据Dit对应的文字代码Dco和特征矢量(第1特征矢量)Vc1。
即,由特征量抽出单元4602从上述对象图像中抽出在文字识别等中利用的特征量,并输出与其对应的上述第1特征矢量Vc1。于是,由文字识别单元4603探索具有与由上述第1特征矢量Vc1所示的图像特征最接近的图像特征的文字,并输出与该文字对应的文字代码Dco。该单元4603的文字识别的方法在“模式识别、电子情报通信学会”等中有详细的介绍,所以,这里省略详细的说明。
然后,由预测图像选择单元4604根据上述文字代码Dco和第2特征矢量Vc1选择上述第1和第2数据输出处理中的一方的处理。在选择了第1数据输出处理时,就输出与作为现在处理对象的文字图像(对象图像)对应的文字代码Dco、预测图像数据PDit1和标志Fc0,在选择了第2数据输出处理时,就输出上述对象图像的文字代码Dco和标志Fc1。
并且,与熵编码单元4607在接收到上述标志Fc0时参照对象图像的预测图像数据PDit1对对象图像数据Dit进行算术编码处理,作为与对象图像对应的编码数据输出熵代码Die。另一方面,在接收到标志Fc1时,就不对对象图像数据Dit进行算术编码处理,从而也不输出编码数据。
下面,详细说明上述预测图像选择单元4604的处理。
图48表示上述预测图像选择单元4604的动作流程。
首先,由上述预测图像选择单元4604开始进行处理时(步骤S4801),从图像特征抽出单元4601顺序读入文字代码Dco和第1特征矢量Vc1(步骤S4802、S4803)。
其次,判断在预测图像存储单元4606中是否有上述对象图像的文字代码Dco的项目(步骤S4804)。该判断的结果,如果有与上述对象图像的文字代码对应的项目,就从该预测图像存储单元4605读入与该文字代码Dco对应的特征量(第2特征矢量)Vc2(步骤S4805)。
然后,计算上述第1特征矢量Vc1与第2特征矢量Vc2之间的欧几里得距离(步骤S4806),并判断该距离是否大于指定的阈值(步骤S4807)。该判断的结果,在上述距离大于指定的阈值时,就从上述预测图像选择单元4604向熵编码单元4607输出由上述预测图像生成单元4605生成的与对象图像对应的第1预测图像数据PDit1(步骤S4808),同时上述标志Fc0与上述对象图像的文字代码Dco一起输出(步骤S4809)。
另一方面,在上述步骤S4807的判断结果为上述欧几里得距离小于指定的阈值时,上述标志Fc1就与上述对象图像的文字代码Dco一起输出(步骤S4810)。
最后,通过在上述步骤S4802、S4803的数据读入处理读入上述预测图像选择单元4604的文字代码Dco和特征量(第1特征矢量)Vc1作为与新的项目对应的1组数据存储到预测图像存储单元4606中(步骤S4812)。
向上述预测图像存储单元4606中存储与新的项目对应的数据时,在上述存储单元4606中已存储了与同一文字代码Dco对应的项目时,就进行将与已有的项目对应的老的特征量改写为与新的项目对应的特征量的改写处理或将特征量在新的项目与已有的项目之间求平均从而将与已有的项目对应的老的特征量改写为平均的特征量的平均化处理。
这样,在本实施例26的图像编码装置4600中,具有根据对象图像的文字代码Dco生成作为与对象图像的文字代码对应的字体图像的数据的第1预测图像数据PDit1的预测图像生成单元4605和使与对象图像数据Dit对应的文字代码Dco和第1特征矢量Vc1关联而进行存储的预测图像存储单元4606,根据作为处理的对象的文字图像的特征矢量(第1特征矢量)Vc1与和处理过的文字图像对应的特征矢量(第2特征矢量)Vc2的比较结果,将上述字体图像作为预测图像,对对象图像进行算术编码处理,从而进行输出熵代码Die、文字代码Dco和标志Fc1的第数据输出处理或仅输出文字代码Dco和标志Fc1的第数据输出处理,所以,不仅可以提高算术编码器的编码效率,而且在作为编码处理的对象的文字图像和已进行了编码处理的文字图像相同时可以省略生成与对象图像对应的预测图像数据的处理和对对象图像数据的算术编码处理,从而可以减轻使用预测图像的算术编码处理的运算负担。
另外,在上述图像编码装置4600中,不论上述第1和第2数据输出处理任何,都输出作为编码处理的对象的文字图像的文字代码Dco,所以,使用上述文字代码也可以进行对对象图像的编码数据De的检索。
(实施例27)图47是表示本发明实施例27的图像译码装置的结构的框图。本实施例27与权利要求27、权利要求28对应。
本实施例27的图像译码装置4700是与上述实施例26的图像编码装置4600对应的译码装置,可以作为图39所示的文书文卷编排装置3900、传真装置等具有扫描器的电子仪器中的图像译码单元使用。
即图像译码装置4700接收从上述实施例26的图像编码装置4600输出的熵代码(编码数据)Die、文字代码Dco和标志Fc0、Fc1,根据文字代码Dco和标志Fc0、Fc1对该编码数据Die进行算术译码处理,从而复原对象图像数据Did。
具体而言,上述图像译码装置4700具有根据输入的对象图像的文字代码Dco使用字体信息等而输出与对象图像对应的第1预测图像数据PDit1的预测图像生成单元4702和使上述复原的对象图像数据Did和与其对应的文字代码Dco关联而作为与1个项目对应的1组数据进行存储的预测图像存储单元4703。这里,上述预测图像生成单元4702的结构和实施例1的图像编码装置100的预测图像生成单元103相同。另外,上述预测图像存储单元4703接收与对象图像对应的文字代码Dco并将与文字代码Dco对应地存储的文字图像数据作为第2预测图像数据PDit2而输出。
另外,上述图像译码装置4700具有根据与作为译码的对象的熵代码Die对应的文字代码Dco和标志Fco、Fc1选择从上述预测图像生成单元4702得到的第1预测图像数据PDit1和从预测图像存储单元4703得到的第2预测图像数据PDit2中的某一个并与对应的标志Fc0、Fc1一起输出的预测图像选择单元4701。
此外,上述图像译码装置4700具有参照从预测图像选择单元4702输出的第1预测图像数据PDit1对上述熵代码Die进行算术译码处理并根据上述标志Fc0或标志Fc1进行将上述译码数据作为对象图像数据Did而输出的第1数据输出处理和直接输出上述第2预测图像数据PDit2的第2数据输出处理的熵译码单元4704。
这里,标志Fc0表示应参照从预测图像生成单元4702得到的第1预测图像数据PDit1进行算术译码处理,标志Fc1表示应将从预测图像存储单元4703得到的第2预测图像数据PDit2直接作为译码数据而输出。
下面,说明其动作。
在与作为编码处理的对象的文字图像(对象图像)对应的文字代码Dco、标志Fc0或标志Fc1和熵代码Die输入本实施例27的图像译码装置4700时,由预测图像选择单元4701根据上述文字代码Dco和标志Fc0、Fc1选择由预测图像生成单元4702生成的第1预测图像数据PDit1和预测图像存储单元4703存储的第2预测图像数据PDit2中的一方的数据。并且,与选择的预测图像数据PDit1或PDit2一起将和其对应的标志Fc0、Fc1向上述熵译码单元4704输出。
由该熵译码单元4704进行通过使用由上述预测图像选择单元4701选择的预测图像数据PDit1对熵代码Die的算术译码处理而复原对象图像数据Did的第1数据输出处理和将由上述预测图像选择单元4701选择的预测图像数据PDit2直接作为译码数据而输出的第2数据输出处理中的某一处理。
下面,详细说明上述预测图像选择单元4701的处理。
图47表示上述预测图像选择单元4701的动作流程。
首先,由上述预测图像选择单元4701开始进行处理时(步骤S4701),从上述图像编码装置4600顺序读入与对象图像对应的文字代码Dco和标志Fc0、Fc1(步骤S4702、S4703)。
并且,进行该标志是表示在熵代码的译码处理中使用由预测图像生成单元4702生成的第1预测图像数据PDit1的标志Fc0和表示使用预测图像存储单元4703存储的第2预测图像数据PDit2的标志Fc1中的哪一个的判断(步骤S4704)。
上述判断的结果,在输入的标志是标志Fc1时,就从预测图像存储单元4703读入与其存储的上述文字代码Dco对应的文字图像数据(第2预测图像数据)(步骤S4705)。
另一方面,在输入的标志是标志Fc0时,就读入由预测图像生成单元4702根据文字代码Dco生成的第1预测图像数据PDit1(步骤S4706)。
并且,使用由上述预测图像选择单元4701选择的预测图像数据PDit1或PDit2对熵代码的译码数据(对象图像数据)Did和与其对应的文字代码Dco一起作为与新的项目对应的1组数据记录到预测图像存储单元4703中。
在与和对象图像的文字代码对应的新的项目对应的数据向上述预测图像存储单元4703中存储时,与同一文字代码Dco对应的项目已存储到上述存储单元4703中时,就进行将与已有的项目对应的老的对象图像数据改写为与新的项目对应的对象图像数据的改写处理,或将与对象图像的文字代码对应的对象图像数据在新的项目与已有的项目之间求平均从而将与已有的项目对应的老的对象图像数据改写为平均的对象图像数据的平均化处理。
这样,在本实施例27的图像译码装置4700中,具有根据对象图像的文字代码Dco将与对象图像的文字代码对应的字体图像的数据作为第1预测图像数据PDit1而输出的预测图像生成单元4702和使对象图像数据Did和与其对应的文字代码Dco关联而进行存储的预测图像存储单元4703,选择根据对象图像的文字代码得到的字体图像(第1预测图像)和过去进行了译码处理的文字图像(第2预测图像)中与对象图像类似的一方,根据第1预测图像数据切换发生概率模型,对与对象图像对应的熵代码进行算术译码处理,从而进行生成译码数据的第1数据输出处理和直接输出第2预测图像数据的第2数据输出处理中的一方的处理,所以,不仅可以提高算术编码器的编码效率,而且在作为编码处理的对象的文字图像和已进行了编码处理的文字图像相同时,可以实现与可以省略生成与对象图像对应的预测图像数据的处理和对对象图像数据的算术编码处理从而可以降低运算负担的算术编码处理对应的算术译码处理。
另外,在本实施例27的图像译码装置4700中,与和对象图像对应的熵代码Die一起接收与对象图像对应的文字代码Dco,所以,使用上述文字代码也可以进行对对象图像的编码数据De的检索。
在上述实施例26中,作为熵编码装置,是进行算术编码处理,但是,也可以进行霍夫曼编码处理。
另外,在上述实施例27中,作为熵译码装置,是进行算术译码处理,但是,也可以进行霍夫曼译码处理。
另外,具有上述实施例26的图像编码装置4600和实施例27的图像译码装置4700的传真装置,可以通过将图41(a)的传真装置中的图像编码装置200a和图像译码装置300a分别置换为上述图像编码装置4600和图像译码装置4700而实现。
此外,具有上述实施例26的图像编码装置4600和实施例27的图像译码装置4700的文书文卷编排装置,可以通过将图41(b)的文书文卷编排装置中的图像编码装置200a和图像译码装置300a分别置换为上述图像编码装置4600和图像译码装置4700而实现。
此外,通过将用于使计算机进行上述各实施例所示的装置的图像编码处理、图像译码处理或文字核对处理的程序记录到软盘等数据存储媒体熵,可以在独立的计算机系统中简单地进行上述各实施例所示的处理。
图40(a)、图40(b)、图40(c)是用于说明由计算机系统使用存储上述程序的软盘进行上述实施例所示的处理时的图。
图40(b)表示从软盘的正面看的外观、剖面结构和软盘,图40(a)表示作为存储媒体本身的软盘的物理格式的例子。软盘FD内藏在盘壳F内,在该盘的表面以同心圆状从外周向内周形成多个磁道Tr,各磁道沿角度方向分割为16各扇区Se。因此,在存储上述程序的软盘上,作为上述程序的数据记录到在上述软盘FD上分配的区域中。
另外,图40(c)表示用于对软盘FD进行上述程序的记录再生的结构。在将上述程序记录到软盘FD上时,从计算机系统通过软盘驱动器FDD将作为上述程序的数据写入。另外,在利用软盘内的程序将上述图像编码装置、图像译码装置或文字核对装置构筑到计算机系统中时,利用软盘驱动器FDD从软盘中读出程序,向计算机系统传输。
在上述说明中,作为数据记录媒体,是使用软盘进行说明的,但是,使用光盘同样也可以进行。另外,记录媒体不只限于此,同样也可以使用IC卡、ROM存储器等,只要是可以记录程序的就行。
如上所述,本发明的图像编码装置、图像译码装置、文字核对装置和数据存储媒体可以提高图像编码的效率。特别是这些装置对于传输文书图像的传真装置及可以检索文书图像而进行存储的文书文卷编排装置是非常有用的。
权利要求
1.一种将与作为编码处理的对象的对象图像对应的图像数据根据与和该对象图像类似的预测图像对应的图像数据进行编码的装置,其特征在于具有根据表示构成上述对象图像的多个部分图像的特征的图像特征数据,生成与和上述多个部分图像类似的部分预测图像对应的图像数据的预测图像生成单元;根据与上述多个部分预测图像对应的图像数据和表示对象图像的部分图像的位置和大小的辅助数据,合成上述多个部分预测图像,从而生成与上述预测图像对应的图像数据的图像合成单元;和利用上述对象图像与预测图像间的像素值相关,对与上述对象图像对应的图像数据进行熵编码处理,并作为与上述对象图像对应的图像编码数据而输出熵代码的熵编码单元,与该熵代码一起输出上述图像特征数据和辅助数据。
2.按权利要求1所述的图像编码装置,其特征在于具有根据与上述对象图像对应的图像数据,生成表示构成上述对象图像的各部分图像的特征的图像特征数据和表示上述对象图像的各部分图像的位置和大小的辅助数据的图像特征抽出单元。
3.按权利要求2所述的图像编码装置,其特征在于上述熵编码单元具有与构成预测图像的指定尺寸的预测块对应地分割上述预测图像的图像数据,并输出与各预测块对应的图像数据的第1图像块化单元;与构成该对象图像的指定尺寸的对象块对应地分割上述对象图像的图像数据,并输出与各对象块对应的图像数据的第2图像块化单元;和根据各预测块和对象块间的像素值相关,对与上述各对象块对应的图像数据进行熵编码的块预测编码单元;上述块预测编码单元在上述对象块与预测块的差别在一定的基准值以上时,对与对象块对应的图像数据进行熵编码,与对应的图像编码数据一起输出编码标志,在上述对象块与预测块的差别小于一定的基准值时,就不对对象块进行熵编码处理,而输出非编码标志。
4.按权利要求2所述的图像编码装置,其特征在于具有对上述预测图像的图像数据进行省略该预测图像的细部的滤波处理并输出预测图像的滤波处理数据的图像滤波处理单元,在上述熵编码单元中,根据上述滤波处理数据,对对象图像的图像数据进行熵编码处理。
5.一种将对与作为编码处理的对象的对象图像对应的图像数据、利用该对象图像和与其类似的预测图像间的像素值相关进行熵编码处理而得到的与对象图像对应的图像编码数据进行译码的装置,其特征在于具有根据表示构成上述对象图像的多个部分图像的特征的图像特征数据,生成与和上述多个部分图像类似的部分预测图像对应的图像数据的预测图像生成单元;根据与上述多个部分预测图像对应的图像数据和表示上述对象图像的部分图像的位置和大小的辅助数据,合成上述多个部分预测图像从而生成与上述预测图像对应的图像数据的图像合成单元;和根据与上述预测图像对应的图像数据,利用上述对象图像与预测图像间的像素值相关,对与上述对象图像对应的图像编码数据进行熵译码处理,从而生成与上述对象图像对应的图像数据的熵译码单元。
6.一种接收从权利要求3所述的图像编码装置输出的图像编码数据、编码标志或非编码标志、图像特征数据和辅助数据而生成与对象图像对应的图像编码数据的图像译码装置,其特征在于具有根据表示构成上述对象图像的多个部分图像的特征的图像特征数据,生成与和上述多个部分图像类似的部分预测图像对应的图像数据的预测图像生成单元;根据与上述多个部分预测图像对应的图像数据和表示上述对象图像的部分图像的位置和大小的辅助数据,合成上述多个部分预测图像,从而生成与上述预测图像对应的图像数据的图像合成单元;与构成预测图像的指定尺寸的预测块对应地分割上述预测图像的图像数据,并输出与各预测块对应的图像数据的图像块化单元;根据与各预测块对应的图像数据,利用上述对象块与预测块间的像素值相关,对与上述对象块对应的图像编码数据进行熵译码处理,从而生成与上述对象块对应的图像数据的块预测译码单元;和接收与上述预测块对应的图像数据和与对象块对应的图像数据,并根据上述编码标志和非编码标志,使用对象块和预测块,组装上述对象图像,从而复原与该对象图像对应的图像数据的块组装单元。
7.按权利要求5所述的图像译码装置,其特征在于具有对上述预测图像的图像数据,进行省略该预测图像的细部的滤波处理,并输出预测图像的滤波处理数据的图像滤波处理单元,在上述熵译码单元中,根据上述滤波处理数据,对对象图像的图像编码数据进行熵译码处理。
8.一种对与作为编码处理的对象的对象图像对应的图像数据根据与和对象图像类似的预测图像对应的图像数据进行编码的装置,其特征在于具有根据表示上述对象图像的特征的图像特征数据,生成与和上述对象图像类似的预测图像对应的图像数据的预测图像生成单元,和利用上述对象图像与预测图像间的像素值相关,对与上述对象图像对应的图像数据进行熵编码处理,并作为与上述对象图像对应的图像编码数据而输出熵代码的熵编码单元,对上述对象图像输出熵代码和图像特征数据。
9.按权利要求8所述的图像编码装置,其特征在于具有根据与上述对象图像对应的图像数据,从上述对象图像中抽出其图像特征,并将图像特征数据向上述预测图像生成单元输出的图像特征抽出单元。
10.按权利要求9所述的图像编码装置,其特征在于上述图像特征抽出单元包括与分割对象图像的指定尺寸的多个块对应地分割与上述对象图像对应的图像数据,从而生成与各块对应的图像数据的块化单元;和将与上述各块对应的图像数据转换为在各块内的各像素的像素值中出现频度最高的最频像素值,并作为与上述对象图像对应的图像特征数据而输出与由和上述各块对应的最频像素值组成的缩小图像对应的图像数据的块平滑化单元,上述预测图像生成单元生成与对上述指定尺寸的块将上述缩小图像的各像素放大而成的应构成各块的像素成为与上述对象块对应的最频像素值的预测图像对应的图像数据。
11.按权利要求9所述的图像编码装置,其特征在于上述图像特征抽出单元包括根据与上述对象图像对应的图像数据,输出表示与该对象图像类似的类似图像的特征的特征矢量的特征量抽出单元;和将对通过对上述特征矢量的量化处理而划分定义了多个学习矢量的矢量空间的多个区域中的、包含上述特征矢量的区域设定的标识符、作为与上述对象图像对应的图像特征数据而输出的矢量量化单元,上述预测图像生成单元根据与设定了上述标识符的矢量空间的区域对应的代表特征矢量和最近的学习矢量,生成与上述对象图像对应的预测图像的图像数据。
12.一种将对与作为编码处理的对象的对象图像对应的图像数据、利用该对象图像与和其类似的预测图像间的像素值相关、进行熵编码处理而得到的与对象图像对应的图像编码数据进行译码的装置,其特征在于具有根据表示上述对象图像的图像特征的图像特征数据,生成与和该对象图像对应的预测图像对应的图像数据的预测图像生成单元;和根据与上述预测图像对应的图像数据,利用上述对象图像与预测图像间的像素值相关,对与上述对象图像对应的图像编码数据进行熵译码处理,从而生成与上述对象图像对应的图像数据的熵译码单元。
13.按权利要求1、2、8和9的任一权项所述的图像编码装置,其特征在于上述图像特征数据是与分割上述对象图像的指定尺寸的块对应地分割对象图像的图像数据,并将与各块对应的图像数据置换为各块内的像素的像素值中出现频度最高的最频像素值而得到的与缩小图像对应的图像数据,上述预测图像生成单元生成与将上述缩小图像的各像素对上述指定尺寸的块放大而成的应构成各块的像素成为与上述对象块对应的最频像素值的预测图像对应的图像数据。
14.按权利要求5或权利要求12所述的图像译码装置,其特征在于上述图像特征数据是与分割上述对象图像的指定尺寸的块对应地分割对象图像的图像数据,并将与各块对应的图像数据置换为各块内的像素的像素值中出现频度最高的最频像素值而得到的与缩小图像对应的图像数据,上述预测图像生成单元生成与将上述缩小图像的各像素放大为上述指定尺寸的块而成的应构成各块的像素成为与上述对象块对应的最频像素值的预测图像对应的图像数据。
15.按权利要求1、2、8、9的任一权项所述的图像编码装置,其特征在于上述图像特征数据是与从使用表示与该对象图像类似的类似图像的特征的特征矢量、预先在矢量空间中定义的多个已存矢量中选择的选择矢量对应的标识符,上述预测图像生成单元将由与上述标识符对应的选择矢量所特定的图像数据作为对上述对象图像的预测图像的图像数据而输出。
16.按权利要求5或12所述的图像译码装置,其特征在于上述图像特征数据是与从使用表示与该对象图像类似的类似图像的特征的特征矢量,预先在矢量空间中定义的多个已存矢量中选择的选择矢量对应的标识符,上述预测图像生成单元将由与上述标识符对应的选择矢量所特定的图像数据作为对上述对象图像的预测图像的图像数据而输出。
17.一种将与作为编码处理的对象的对象图像对应的图像数据根据与和上述对象图像类似的预测图像对应的图像数据进行编码的装置,其特征在于具有接收从外部输入的与上述预测图像对应的图像数据,并根据与上述预测图像对应的图像数据,利用上述对象图像与预测图像间的像素值相关,对与上述对象图像对应的图像数据进行熵编码处理,从而作为与上述对象图像对应的图像编码数据而输出熵代码的熵编码单元,与对上述对象图像的熵代码一起输出与上述预测图像对应的图像数据。
18.按权利要求17所述的图像编码装置,其特征在于具有根据与上述对象图像对应的图像数据将与和该对象图像类似的预测图像对应的图像数据向上述熵编码单元输出的图像预测单元。
19.按权利要求18所述的图像编码装置,其特征在于上述图像预测单元包括根据与上述对象图像对应的图像数据,输出表示与该对象图像类似的类似图像的图像特征的特征矢量的特征量抽出单元;通过对上述特征矢量的量化处理,将在划分定义了多个学习矢量的矢量空间的多个区域中的上述特征矢量的区域中设定的标识符,作为对上述对象图像的图像特征数据而输出的矢量量化单元;和根据与设定上述标识符的矢量空间中的区域对应的代表特征矢量和最近的学习矢量,生成与上述对象图像对应的预测图像的数据的预测图像生成单元。
20.一种将对与作为编码处理的对象的对象图像对应的图像数据、利用该对象图像和与其类似的预测图像间的像素值相关、进行熵编码处理而得到的与对象图像对应的图像编码数据进行译码的装置,其特征在于具有根据与和上述对象图像对应的图像编码数据独立地输入的与预测图像对应的图像数据,利用上述对象图像与预测图像间的像素值相关,对与上述对象图像对应的图像编码数据进行熵译码处理从而生成与上述对象图像对应的图像数据的熵译码单元。
21.一种将与作为编码处理的对象的对象图像对应的图像数据根据与该对象图像的预测图像对应的图像数据进行编码的装置,其特征在于具有根据与上述对象图像对应的图像数据,从上述对象图像中抽出其图像特征,并输出与对象图像对应的图像特征数据的图像特征抽出单元;根据与上述对象图像对应的图像特征数据,生成与和上述对象图像类似的类似图像对应的图像数据的预测图像生成单元;使与编码处理结束的对象图像对应的图像数据和图像特征数据相关联,作为与处理过的图像对应的图像数据和图像特征数据而存储的预测图像存储单元;通过比较与对象图像对应的图像特征数据和预测图像存储单元存储的与处理过的图像对应的图像特征数据,而将上述类似图像或指定的处理过的图像作为预测图像而选择的预测图像选择单元;和利用上述对象图像与预测图像间的像素值相关,对与上述对象图像对应的图像数据进行熵编码处理,并作为与上述对象图像对应的图像编码数据而输出熵代码的熵编码单元,上述预测图像选择单元,作为上述预测图像在输出表示选择上述类似图像和指定的处理过的图像中的哪一个的标志的同时,还输出与上述对象图像对应的图像特征数据。
22.按权利要求21所述的图像编码装置,其特征在于上述图像特征抽出单元包括根据与上述对象图像对应的图像数据,作为与对象图像对应的图像特征数据生成第1特征矢量的特征量抽出单元;和根据上述第1特征矢量,进行对上述对象图像的文字识别,并生成与对象图像对应的文字代码的文字识别单元,上述预测图像生成单元根据与上述对象图像对应的文字代码,作为第1预测图像数据而生成与该对象图像的类似图像对应的图像数据,上述预测图像存储单元将与结束了上述编码处理的对象图像对应的图像数据、文字代码和第1特征矢量相关联地进行存储,上述预测图像选择单元将和与对象图像对应的文字代码一致的文字代码相关联的图像数据和特征矢量作为第2预测图像数据和第2特征矢量而读出,根据上述第1和第2特征矢量的比较结果输出上述第1和第2预测图像数据中的一方。
23.一种将对与作为编码处理的对象的对象图像对应的图像数据、利用该对象图像和与其对应的预测图像间的像素值相关、进行熵编码处理而得到的与对象图像对应的图像编码数据进行译码的装置,其特征在于具有根据表示上述对象图像的图像特征的图像特征数据,生成与和该对象图像类似的类似图像对应的图像数据的预测图像生成单元;将与译码处理结束的对象图像对应的图像数据和图像特征数据相关联,作为与处理过的图像对应的图像数据和图像特征数据而存储的预测图像存储单元;作为在编码处理时与对象图像对应的预测图像,根据表示使用从对象图像的图像特征得到的类似图像和编码处理过的图像中的哪一个的标志信息,将上述类似图像或指定的处理过的图像选择为预测图像的预测图像选择单元;和根据与上述预测图像对应的图像数据,利用上述对象图像与预测图像间的像素值相关,对与上述对象图像对应的图像编码数据进行熵译码处理,从而生成与上述对象图像对应的图像数据的熵译码单元。
24.按权利要求23所述的图像译码装置,其特征在于上述预测图像生成单元,根据作为与对象图像对应的图像特征数据的文字代码,生成与上述对象图像对应的第1预测图像数据,上述预测图像存储单元,使与译码处理结束的对象图像对应的图像数据和文字代码相关联,作为与处理过的图像对应的图像数据和文字代码进行存储,上述预测图像选择单元将与和对象图像对应的文字代码一致的文字代码相关联的图像数据,作为第2预测图像数据从上述预测图像存储单元中读出,并根据上述标志信息输出上述第1和第2预测图像数据中的一方的数据。
25.一种将与作为编码处理的对象的对象图像对应的图像数据、根据与该对象图像的预测图像对应的图像数据进行编码的装置,其特征在于具有根据与上述对象图像对应的图像数据,从上述对象图像中抽出其图像特征,并输出与对象图像对应的图像特征数据的图像特征抽出单元;根据与上述对象图像对应的图像特征数据,生成与和上述对象图像类似的类似图像对应的图像数据的预测图像生成单元;将与编码处理结束的对象图像对应的图像特征数据作为与处理过的图像对应的图像特征数据,进行存储的预测图像存储单元、通过比较与对象图像对应的图像特征数据和与预测图像存储单元存储的处理过的图像对应的图像特征数据进行输出与上述类似图像对应的图像数据、与对象图像对应的图像特征数据和表示进行编码处理的编码标志的第1数据输出处理;和输出与对象图像对应的图像特征数据和表示不进行编码处理的非编码标志的第2数据输出处理中的一方的数据输出处理的数据输出控制单元;和利用上述对象图像和类似图像间的像素值相关,对与上述对象图像对应的图像数据进行熵编码处理,并作为与上述对象图像对应的图像编码数据而输出熵代码的熵编码单元,该熵编码单元接收到上述编码标志时就进行上述熵编码处理,在接收到上述非编码标志时就不进行上述熵编码处理,从而不输出熵代码。
26.按权利要求25所述的图像编码装置,其特征在于上述图像特征抽出单元包括根据与上述对象图像对应的图像数据,作为与对象图像对应的图像特征数据而生成第1特征矢量的特征量抽出单元;和根据上述第1特征矢量,对上述对象图像进行文字识别,并生成与对象图像对应的文字代码的文字识别单元,上述预测图像生成单元根据与上述对象图像对应的文字代码,作为预测图像数据生成与其类似图像对应的图像数据,上述预测图像存储单元使与上述编码处理结束的对象图像对应的文字代码与第1特征矢量相关联而进行存储,上述数据输出控制单元,将与和对象图像对应的文字代码一致的文字代码相关联的特征矢量,作为与预测图像对应的第2特征矢量而读出,进行输出与上述类似图像对应的图像数据、与对象图像对应的图像特征数据和表示进行编码处理的编码标志的第1数据输出处理、和输出与对象图像对应的图像特征数据和表示不进行编码处理的非编码标志的第2数据输出处理中的一方的数据输出处理。
27.一种将对与作为编码处理的对象的对象图像对应的图像数据、利用该对象图像和与其对应的预测图像间的像素值相关、进行熵编码处理而得到的与对象图像对应的图像编码数据进行译码的装置,其特征在于具有根据表示上述对象图像的图像特征的图像特征数据,生成与该对象图像对应的第1预测图像数据的预测图像生成单元;与译码处理结束的对象图像对应的图像数据和图像特征数据相关联,而作为与处理过的图像对应的图像数据和图像特征数据进行存储的预测图像存储单元;接收到表示进行了编码处理的编码标志时就进行输出上述第1预测图像数据和该编码标志的第1数据输出处理,而在接收到表示未进行编码处理的非编码标志时就从上述预测图像存储单元作为第2预测图像数据读出与译码处理过的图像对应的图像数据,并进行输出第2预测图像数据和该非编码标志的第2数据输出处理的数据输出控制单元;和在接收到上述编码标志时,根据第1预测图像数据,利用上述对象图像和预测图像间的像素值相关,对与该对象图像对应的图像编码数据进行熵译码处理,并生成与上述对象图像对应的译码数据,而在接收到上述非编码标志时,就将上述第2预测图像数据作为与上述对象图像对应的译码数据而输出的熵译码单元。
28.按权利要求27所述的图像译码装置,其特征在于上述预测图像生成单元根据作为与对象图像对应的图像特征数据的文字代码生成与上述对象图像对应的第1预测图像数据,上述预测图像存储单元将与译码处理结束的对象图像对应的图像数据和文字代码相关联,而作为与处理过的图像对应的图像数据和文字代码进行存储,上述数据输出控制单元将与和对象图像对应的文字代码一致的文字代码相关联的图像数据作为第2预测图像数据读出,并根据上述标志信息输出上述第1和第2预测图像数据的中的一方的数据。
29.按权利要求1、2、8、9、17、18、21和25的任一权项所述的图像编码装置,其特征在于上述熵代码是对与上述对象图像对应的图像数据进行切换构成对象图像的各像素的像素值的发生概率的算术编码处理而得到的算术代码,上述熵编码单元根据与和上述对象图像类似的预测图像对应的图像数据和与上述对象图像的编码过的部分对应的图像数据切换各像素的像素值的发生概率。
30.按权利要求5、12、20、23、和27的任一权项所述的图像译码装置,其特征在于上述熵代码是对与上述对象图像对应的图像数据进行切换构成对象图像的各像素的像素值的发生概率的算术编码处理而得到的算术代码,上述熵译码单元根据与和上述对象图像类似的预测图像对应的图像数据和与上述对象图像的译码过的部分对应的图像数据,对与上述对象图像对应的算术代码进行切换各像素的像素值的发生概率的算术译码处理,再生与上述对象图像对应的图像数据。
31.按权利要求1、2、8、9、17、18、21、和25的任一权项所述的图像编码装置,其特征在于上述熵代码是对与上述对象图像对应的图像数据进行切换构成对象图像的各像素的霍夫曼编码表的编码处理而得到的霍夫曼代码,上述熵编码单元根据与和上述对象图像类似的预测图像对应的图像数据和与上述对象图像的编码过的部分对应的图像数据切换各像素的霍夫曼编码表。
32.按权利要求5、12、20、23、和27的任一权项所述的图像译码装置,其特征在于上述熵代码是对与上述对象图像对应的图像数据进行对构成对象图像的各像素切换霍夫曼编码表的编码处理而得到的霍夫曼代码,上述熵译码单元,根据与和上述对象图像类似的预测图像对应的图像数据和与上述对象图像的译码过的部分对应的图像数据,对与上述对象图像对应的图像编码数据进行对各像素切换霍夫曼编码处理的译码处理,再生与上述对象图像对应的图像数据。
33.按权利要求1、2、8、9、17、18、21和25的任一权项所述的图像编码装置,其特征在于具有接收与上述对象图像关联的属性信息、并将上述属性信息附加到与上述对象图像对应的图像编码数据上而输出的属性信息附加单元。
34.一种将与作为编码处理的对象的包含文字图像的对象图像对应的图像数据进行编码的装置,其特征在于具有接收与上述对象图像对应的图像数据,对与包含在上述对象图像中的文字图像对应的图像数据进行编码,并输出文字图像代码的文字图像编码单元;将构成上述对象图像中的上述文字图像的配置部分的像素的像素值,利用位于上述对象图像中的上述文字图像的配置部分的周边的像素的像素值进行置换,生成与消去上述对象图像的文字图像的非文字图像对应的图像数据的文字图像消去单元;和将与上述非文字图像对应的图像数据进行编码并输出非文字图像代码的非文字图像编码单元,作为对上述对象图像的编码数据,输出上述文字图像代码和非文字图像代码。
35.一种接收将与包含在对象图像中的文字图像对应的图像数据编码而得到的文字图像代码和将构成上述对象图像中的上述文字图像的配置部分的像素、利用位于上述对象图像中的上述文字图像的配置部分的周边的像素、进行置换而得到的与非文字图像对应的图像数据、并再生与包含上述文字图像的对象图像对应的图像数据的图像译码装置,其特征在于具有将上述非文字图像代码进行译码,并输出与非文字图像对应的图像数据的非文字图像译码单元;和将上述文字图像代码进行译码,并输出与文字图像对应的图像数据的文字图像译码单元;和根据与上述文字图像对应的图像数据和与非文字图像对应的图像数据,将文字图像与非文字图像合成,并输出与包含上述文字图像的对象图像对应的图像数据的图像再构成单元。
36.一种将表示用于检索文字图像的检索条件的检索数据与将和文字图像对应的图像数据进行编码而得到的文字图像代码进行核对的装置,其特征在于具有将上述文字图像代码附加和与其对应的文字图像关联的属性信息,并根据附加到上述文字图像代码上的属性信息是否满足由上述检索数据所示的检索条件而进行上述检索数据与文字图像代码的核对的文字属性核对单元。
37.一种将特定应检索的文字图像的文字代码与将和文字图像对应的图像数据进行编码而得到的附加了表示该文字图像的图像特征的图像特征数据的文字图像代码进行核对的装置,其特征在于具有从由上述文字代码所特定的文字图像中抽出表示该文字图像的图像特征的图像特征,并输出图像特征数据的图像特征抽出单元;和通过附加到上述文字图像代码上的图像特征数据与根据上述文字代码得到的图像特征数据的核对,进行上述文字图像代码与文字代码是否一致的判断的核对判断单元。
38.按权利要求37所述的文字核对装置,其特征在于上述附加到上述文字图像代码上的图像特征数据是表示与文字图像代码对应的文字图像的图像特征的特征矢量,上述图像特征抽出单元包括根据上述文字代码生成与由该文字代码所特定的文字图像对应的图像数据的文字图像生成单元;和根据与上述文字图像对应的图像数据,抽出该文字图像的图像特征,并输出表示上述图像特征的特征矢量的特征量抽出单元,上述核对单元具有计算附加到文字图像代码上的特征矢量与根据上述文字代码得到的特征矢量的距离的距离计算单元,根据该距离是否大于指定的阈值来进行上述文字图像代码与文字代码的一致判断。
39.一种将特定应检索的文字图像的文字代码与将和文字图像对应的图像数据进行编码而得到的附加了与和该文字图像类似的预测文字图像对应的图像数据的文字图像代码进行核对的装置,其特征在于具有接收上述文字图像代码,并根据与附加到该文字图像代码上的预测文字图像对应的图像数据,从该预测文字图像中抽出其图像特征,从而输出第1图像特征数据的第1图像特征抽出单元;接收上述文字代码,并抽出由该文字代码所特定的文字图像的图像特征,从而输出第2图像特征数据的第2图像特征抽出单元;和通过上述第1图像特征数据与第2图像特征数据的核对而进行上述文字图像代码与文字代码是否一致的判断的核对判断单元。
40.按权利要求39所述的文字核对装置,其特征在于上述第1图像特征抽出单元作为上述第1图像特征数据输出第1特征矢量,上述第2图像特征抽出单元包括根据上述文字代码,生成与由该文字代码所特定的文字图像对应的图像数据的文字图像生成单元;和根据与上述文字图像对应的图像数据,抽出该文字图像的图像特征,并输出表示上述图像特征的第2特征矢量的特征量抽出单元,上述核对判断单元具有计算上述第1特征矢量与第2特征矢量的距离的距离计算单元,根据该距离是否大于指定的阈值进行上述文字图像代码与文字代码的一致判断。
41.一种将特定应检索的文字图像的文字代码与将和文字图像对应的图像数据进行编码而得到的附加了表示与该文字图像类似的预测文字图像的标识符的文字图像代码进行核对的装置,其特征在于具有存储表示上述预测文字图像的标识符和上述文字代码与将它们作为变量而计算的距离信息的对应关系的文字间距离表的表存储部;接收上述文字图像代码和文字代码,并参照上述文字间距离表求出以附加到上述文字图像代码熵的预测文字图像标示符和上述文字代码为变量的距离信息的距离计算单元,和根据上述距离信息判断上述文字图像代码与上述文字代码是否一致的核对判断单元。
42.一种将特定应检索的文字图像的文字代码与将和文字图像对应的图像数据进行编码而得到的附加了表示与该文字图像类似的预测文字图像的标识符的文字图像代码进行核对的装置,其特征在于具有接收上述文字图像代码,并根据附加到该文字图像代码上的表示预测文字图像的标识符,从预测文字图像中抽出其图像特征而输出第1图像特征数据的第1图像特征抽出单元;接收上述文字代码,并抽出由该文字代码特定的文字图像的图像特征而输出第2图像特征数据的第2图像特征抽出单元;和通过上述第1图像特征数据与第2图像特征数据的核对而进行上述文字图像代码与文字代码是否一致的判断的核对判断单元。
43.按权利要求42所述的文字核对装置,其特征在于上述第1图像特征抽出单元作为上述第1图像特征数据输出第1特征矢量,上述第2图像特征抽出单元包括根据上述文字代码生成与由该文字代码所特定的文字图像对应的图像数据的文字图像生成单元;和根据与上述文字图像对应的图像数据,抽出该文字图像的图像特征,并输出表示上述图像特征的第2特征矢量的特征量抽出单元,上述核对判断单元具有计算上述第1特征矢量与第2特征矢量的距离的距离计算单元,根据该距离是否大于指定的阈值进行上述文字图像代码与文字代码的一致判断。
44.一种存储用于利用计算机进行图像数据的处理的图象处理程序的数据存储媒体,其特征在于作为上述图象处理程序,存储用于利用计算机进行权利要求1~权利要求43中的任一权项所述的装置的图象处理的程序或利用计算机实现构成上述权利要求1~权利要求43中的任一权项所述的装置的至少1个单元的功能的程序。
45.一种传真装置,其特征在于具有将作为发信对象的对象图像变换为电子数据而输出对象图像数据的扫描器;进行对象图像数据的编码处理并与编码数据一起输出表示对象图像的特征的图像特征数据的图像编码装置;给与上述对象图像对应的编码数据附加上与其对应的图像特征数据,并通过通信线路收发包含编码数据和图像特征数据的复合数据的收发装置;接收包含在上述收发装置接收的复合数据中的编码数据和图像特征数据,并根据图像特征数据将该编码数据进行译码,从而输出对象图像数据的图像译码装置;和根据上述对象图像数据进行对象图像的显示或打印输出的图像输出装置,上述图像编码装置采用和上述权利要求2、权利要求8、权利要求9、权利要求14、权利要求17、权利要求18和权利要求33中的任一权项所述的图像编码装置相同的结构。
46.一种传真装置,其特征在于具有将作为发信对象的对象图像变换为电子数据而输出对象图像数据的扫描器;进行对象图像数据的编码处理并与和对象图像对应编码数据一起输出表示对象图像的特征的图像特征数据的图像编码装置;给上述编码数据附加上与其关联的图像特征数据,并通过通信线路收发包含编码数据和图像特征数据的复合数据的收发装置;接收包含在上述收发装置接收的复合数据中的编码数据和图像特征数据,并根据图像特征数据将该编码数据进行译码,从而输出对象图像数据的图像译码装置;和根据上述对象图像数据进行对象图像的显示或打印输出的图像输出装置,上述图像译码装置采用和上述权利要求5、权利要求12、和权利要求20的任一权项所述的图像译码装置相同的结构。
47.一种文书文卷编排装置,其特征在于具有将作为传真的对象的对象图像变换为电子数据而输出对象图像数据的扫描器;进行对象图像数据的编码处理并与和上述对象图像对应的编码数据一起输出表示对象图像的特征的图像特征数据的图像编码装置;使上述编码数据和与其对应的图像特征数据相关联而进行存储的图像存储单元;将上述图像存储单元存储的与指定的图像对应的编码数据与和其对应的图像特征数据一起读出的数据读出单元;使用上述图像特征数据将该读出的编码数据进行译码而复原与指定的图像对应的图像数据的图像译码单元;和根据上述图像数据进行上述指定的图像的显示或打印输出的图像输出装置,上述编码装置采用和上述权利要求2、权利要求8、权利要求9、权利要求14、权利要求17、权利要求18、和权利要求33中的任一权项所述的图像编码装置相同的结构。
48.一种文书文卷编排装置,其特征在于具有将作为传真的对象的对象图像变换为电子数据而输出对象图像数据的扫描器;进行对象图像数据的编码处理并与和上述对象图像对应的编码数据一起输出表示对象图像的特征的图像特征数据的图像编码装置;使上述编码数据和与其对应的图像特征数据相关联而进行存储的图像存储单元;将上述图像存储单元存储的与指定的图像对应的编码数据与和其对应的图像特征数据一起读出的数据读出单元;使用上述图像特征数据将该读出的编码数据进行译码而复原与指定的图像对应的图像数据的图像译码单元;和根据上述图像数据进行上述指定的图像的显示或打印输出的图像输出装置,上述编码装置采用和上述权利要求5、权利要求12、权利要求16、和权利要求20中的任一权项所述的图像编码装置相同的结构。
49.一种文书文卷编排装置,其特征在于具有将作为传真的对象的对象图像变换为电子数据而输出对象图像数据的扫描器;进行对象图像数据的编码处理并与和上述对象图像对应的编码数据一起输出表示对象图像的特征的图像特征数据的图像编码装置;使上述编码数据和与其对应的图像特征数据相关联而进行存储的图像存储单元;将上述图像存储单元存储的与指定的图像对应的编码数据与和其对应的图像特征数据一起读出的数据读出单元;使用上述图像特征数据将该读出的编码数据进行译码而复原与指定的图像对应的图像数据的图像译码单元;和根据上述图像数据进行上述指定的图像的显示或打印输出的图像输出装置,上述数据读出单元采用包含上述权利要求36~权利要求43中的任一权项所述的文字核对装置的结构。
全文摘要
一种图像编码装置,如图所示,具有根据表示文书图像(201)的图像数据Di生成与包含在文书图像中的文字图像对应的文字代码和包含表示文书图像中各文字图像的大小和位置的辅助信息的文字数据Dc的图像特征抽出单元(202)。根据上述文字数据Dc作成与上述文书图像(201)对应的预测文书图像(205),对上述文书图像数据Di参照上述预测文书图像数据PDi进行切换发生概率模型的所述编码处理。从而由发生概率模型所示的白像素、黑像素的发生概率与文书图像中的白像素和黑像素的发生概率非常接近,可以提高算术编码器对上述文书图像数据的编码效率。
文档编号H04N1/417GK1311951SQ99809407
公开日2001年9月5日 申请日期1999年6月9日 优先权日1998年6月9日
发明者松川善彦, 今川太郎, 目片强司, 畑幸一, 荣藤稔 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1