翻译文档图像生成装置、记录介质以及翻译文档图像生成方法

文档序号：6649615阅读：162来源：国知局

专利名称：翻译文档图像生成装置、记录介质以及翻译文档图像生成方法
技术领域：
本发明涉及用于翻译位图化文档的技术。
背景技术：
目前，为了扫描纸介质上的文档并将该文档优化处理为文档数据，已经提出了多种技术。例如，日本专利申请特开公报H05-274397公开了在扫描文档中执行字符识别，并且在对该数据的内容进行适当修改之后，在远程装置之间交换数据的技术。另外，日本专利申请特开公报2002-108855公开了即使在包括地图、插图等的文档的一部分中，也能以高精度识别字符的技术。
过去，已进行了以下尝试仅利用翻译为另一种语言的新字符替换文档的字符部分，同时通过在像素级改变通过扫描该文档而获得的文档数据，来保持构成该文档的背景的颜色、图案等外观。通常，将文档数据设置为位图，其中通过多对像素位置和像素值来显示扫描文档的内容。因此，当在位图内的区域中的原样添印通过翻译书写在该区域中的字符而获得的新字符时，如图4(A)所示，由于添印字符位于最初书写的字符的上面，所以其易读性明显下降。另一方面，如果在将构成最初存在的字符的像素的像素值设置为白色之后写入新字符，则肯定可以避免字符的堆叠。然而，即使采用了这种方法，当将文档的背景绘制为白色以外的颜色或图案时，如图4(B)所示，该字符的白色轮廓残留在文档的背景中，以上述相同的方式降低了可读性。
鉴于以上情形提出了本发明，并且本发明提供了一种构造，利用该构造可以仅使用翻译为另一种语言的新字符来替换文档的字符部分，同时保持构成该文档的背景的颜色、图案等外观。

发明内容
根据本发明的一个方面，提供了一种翻译文档图像生成装置。该翻译文档图像生成装置具有提取部分、翻译部分以及区域回填部分。该提取部分提取要处理的像素组，该像素组具有用于构成字符或字符串的像素。该翻译部分对该字符或字符串进行翻译。该区域回填部分对所提取的像素组进行回填，以保持所翻译的字符或字符串的背景，并且书写所翻译的字符或字符串。
根据本发明的实施例，可以仅使用翻译为另一种语言的新字符来替换文档的字符部分，同时保持构成该文档的背景的颜色、图案等外观。

下面将根据以下附图详细说明本发明的实施例，附图中图1是翻译文档图像生成装置的硬件结构图；图2(A)、2(B)、2(C)、2(D)和2(E)表示位像的变换；图3是(变型例中的)翻译文档图像生成装置的硬件结构图；以及图4(A)和4(B)示出了传统技术。
具体实施例方式以下说明根据本发明的实施例。
在本实施例中，在通过扫描其中在单色纸上印刷黑色文本的文档而获得的位像中识别出字符之后，在使用属性与纸相同的像素回填构成该字符的像素之后，书写新的翻译字符。
图1是表示根据本实施例的翻译文档图像生成装置的硬件结构的框图。如图1所示，翻译文档图像生成装置1配备有文档图像数据输入部分10、字符部分图像提取部分11、字符识别部分12、翻译部分13、字符图像数据生成部分14、背景图像提取部分15、字符部分图像删除部分16、回填部分17、图像写入部分18，以及文档图像数据输出部分19。
文档图像数据输入部分10将文档的位像输入到装置1本身中。经由该文档图像数据输入部分10输入的位像具有多个配对，这些配对包括表示构成文档图像的像素的位置的地址和将这些像素的属性表示为RGB 256级的RGB值。例如，当特定地址的像素为白色时显示(0，0，0)的RGB值，而当特定地址的像素为黑色时显示(255，255，255)的RGB值。
字符部分图像提取部分11从通过文档图像数据输入部分10输入的待处理的位像中的各种书写矩形区域当中指定一个矩形区域(下文中，将待处理的矩形区域称作“处理目标区”)，并向背景图像提取部分15和字符部分图像删除部分16提供表示所指定的处理目标区的位置的位置信息。另外，该字符部分图像提取部分11提取构成该处理目标区域中的字符的像素组。根据由字符部分图像提取部分11提取的像素组，字符识别部分12识别通过该像素组显示的字符，并向翻译部分13提供所识别的字符的字符编码。翻译部分13对从字符识别部分12提供的字符编码进行翻译并获得新的字符编码，然后将新获得的字符编码提供给字符图像数据生成部分14。例如，当从字符识别部分12提供了拉丁字符“A”的字符编码时，将日文平假名字符“あ”提供给字符图像数据生成部分14。字符图像数据生成部分14产生与从字符识别部分12提供的字符编码相对应的图像数据，并将该字符图像提供给图像写入部分18。
在位像中指定了由字符部分图像提取部分11提供的位置信息表示的处理目标区域之后，背景图像提取部分15提取构成该区域内的字符的背景的像素的RGB值。
另一方面，在位像中指定了由字符部分图像提取部分11提供的位置信息所表示的处理目标区域之后，字符位置图像删除部分16将构成该区域内的字符的背景的像素的RGB值重置为白色(0，0，0)。然后，回填部分17将与由背景图像提取部分15提取的相同的RGB值和由字符部分图像删除部分16重置的像素地址重新进行关联。因此，使用RGB值与构成背景的像素相同的像素替换构成处理目标区域中的字符的像素，并且通过颜色与背景相同的像素遮蔽该处理目标区域内的区域。
图像写入部分18将由字符图像数据生成部分14提供的字符图像填充在由回填部分17进行了处理的处理目标区域中。
当从文档图像数据输入部分10输入包含多个字符的位像时，将书写有各个字符的区域作为处理目标区域，并重复由上述处理部分执行的处理。因此，获得了显示该翻译文档的新位像。经由文档图像数据输出部分19将新获得的位像输出至外部打印装置。
下面作为示例，参照图2具体说明通过上述处理部分执行的处理实现的文档位像的变换。图2(A)示出了从文档图像数据输入部分10输入的位像。如图2(A)所示，在该位像中，拉丁字符“A”由黑色像素(RGB值255，255，255)组绘制，而该字符的背景由蓝色像素(RGB值0，255，0)绘制。图2(B)示出了由字符部分图像提取部分11进行了处理之后的位像。在该阶段，将写有该拉丁字符“A”的矩形区域指定为处理目标区域X，并将由该处理目标区域X内的黑色像素组表示的字符“A”的字符编码从字符识别部分12提供给翻译部分13。
图2(C)示出了由字符部分图像删除部分16进行了处理之后的位像。在该阶段，通过将构成该拉丁字符“A”的像素的RGB值设定为白色，从处理目标区域X中以白色切除字符“A”。
图2(D)示出了由回填部分17进行了处理之后的位像。在该阶段，通过将由背景图像提取部分15提取的背景RGB值与重置像素的地址重新进行关联，使用背景色遮蔽整个处理目标区域X。
图2(E)示出了由图像写入部分18进行了处理之后的位像。在该阶段，将通过翻译而获得的日文平假名字符“あ”的图像重新写入处理目标区域X的大致中心位置。新写入的字符是由字符图像数据生成部分14根据由翻译部分13提供的字符编码而生成的。
在从输入位像的处理目标区域中识别出字符之后，上述翻译文档图像生成装置1在使用与背景相同的颜色回填写有该字符的区域的像素之后写入新的字符图像，该新的字符图像是通过翻译而获得的。因此，可以避免由于源文档的背景色的某些影响而导致的书写字符的可读性下降。

本发明的多种变型例也是可行的。
上述实施例是假设在其中输入位像中的字符的背景为单色的情况下构造的，其并不适用于翻译其中在纸上预印刷有图案的文档。另一方面，通过提供具有下述功能的回填部分17，甚至可以将本发明应用于背景不是单色的文档。作为变型例描述的回填方法包括将处理目标区域和所分离的背景部分复制为补丁(patch)图像，并且在将该补丁的尺寸调整为合适尺寸之后，将其粘贴到处理目标区域。在本发明中，如果回填部分17具有执行预定内插处理的功能，则可以根据需要采用任何方法作为该回填方法，使得从处理目标区域中提取的像素组与所提取的像素组附近的像素组的绘制内容相匹配。
在上述实施例中，在字符部分图像删除部分16将构成处理目标区域内的字符的像素的RGB值设定为白色之后，回填部分17将与背景图像提取部分15所提取的相同的RGB值和重置像素的地址重新进行关联。然而，由字符部分图像删除部分16执行的重置并不是本发明中的必需处理；可以直接使用与背景图像提取部分15所提取的相同的RGB值来替换构成该字符的像素的RGB值。
在上述实施例中，回填部分17将背景图像提取部分15所提取的背景的RGB值与由字符部分图像删除部分16重置的像素的地址重新进行关联。即，由回填部分17回填的像素的RGB值是根据背景图像提取部分15执行的提取的结果来确定的。另一方面，通过将由回填部分17回填的RGB值预先设定为表示原色白色(RGB值0，0，0)和蓝色(RGB值0，255，0)的默认值，可以采用其中不必提供背景图像提取部分15的简单结构。
图3是表示根据该变型例的翻译文档图像生成装置1的硬件结构的框图。如图3所示，根据该变型例的翻译文档图像生成装置1配备有文档图像数据输入部分10、字符部分图像提取部分11、字符识别部分12、翻译部分13、字符图像数据生成部分14、字符部分图像删除部分16、回填部分17、图像写入部分18，以及文档图像数据输出部分19，但是与图1所示的翻译文档图像生成装置1不同，其不包括背景图像提取部分15。相反，在该变型例中的回填部分17中，预先为应该作为背景回填的像素设置预定的RGB值，并且回填部分17将所设置的RGB值与由字符部分图像删除部分16重置的像素的地址重新进行关联。即使通过这种简单的结构，也可以实现本发明的操作。
上述实施例构造有作为独立部分的翻译部分13和字符图像数据生成部分14，但是也可以将字符图像数据生成部分14的功能合并到翻译部分13中。在该变型例的情况下，翻译部分13本身生成新的像素组(该新的像素组显示由通过翻译而获得的字符编码表示的字符)，并将其提供给图像写入部分18。
在上述实施例中，在单个处理目标区域内仅书写一个字符，但是该处理目标区域也可以是包括各个预定组的字符串的矩形区域。
如上所述，在一个方面，本发明提供了一种翻译文档图像生成装置，其具有提取部分，用于提取要处理的像素组，该像素组具有用于构成字符或字符串的像素；翻译部分，用于翻译该字符或字符串；以及区域回填部分，用于回填所提取的像素组，以保持所翻译的字符或字符串的背景，并且写入所翻译的字符或字符串。
在该方面中，该区域回填部分可以通过使用具有与所提取的像素附近的像素相同的像素值的像素替换所提取的像素组，来回填所提取的像素组。
本发明的另一方面是一种翻译文档图像生成方法，具有提取要处理的像素组，该像素组具有用于构成字符或字符串的像素；翻译该字符或字符串；以及对所提取的像素进行回填，以保持所翻译的字符或字符串的背景，并且写入所翻译的字符和字符串。
在该方面中，可以通过使用具有与所提取的像素附近的像素相同的像素值的像素替换所提取的像素组，来回填所提取的像素组。
本发明的另一方面是一种计算机可读存储介质，该存储介质存储有可以由计算机执行的指令程序，以执行生成翻译文档的功能，该功能具有提取要处理的像素组，该像素组具有用于构成字符或字符串的像素；翻译该字符或字符串；以及对所提取的像素进行回填，以保持所翻译的字符或字符串的背景，并且写入所翻译的字符和字符串。
在该方面中，可以通过使用具有与所提取的像素附近的像素相同的像素值的像素替换所提取的像素组，来回填所提取的像素组。
本发明的另一方面是一种翻译文档图像生成装置，其包括输入部分，用于输入通过扫描文档而获得的位像；提取部分，用于在所输入的位像中指定写有字符或字符串的区域，并提取构成该指定区域中的字符或字符串的像素组；字符识别部分，用于识别通过所提取的像素组显示的字符或字符串；翻译部分，用于对所识别的字符或字符串进行翻译，并获得新的像素组，该新的像素组绘制出通过翻译获得的新字符或字符串；区域回填部分，用于使用通过执行预定的内插处理，使构成指定区域中的字符或字符串的像素与构成这些像素附近的背景的像素相匹配而获得的其他像素来替换所提取的像素组；图像写入部分，用于通过将新获得的像素组写入其中像素已被替换的区域，来获得翻译文档的位像；以及输出部分，用于输出该翻译文档的所获得的位像。
在该方面中，区域回填部分可以使用像素值与所提取的像素附近的像素相同的像素来替换所提取的像素组。
本发明的另一方面是一种计算机可读记录介质，其记录有使计算机执行以下操作的程序输入通过扫描文档而获得的位像；在所输入的位像中指定写有字符或字符串的区域，并提取构成该指定区域中的字符或字符串的像素组；识别通过所提取的像素组显示的字符或字符串；对所识别的字符或字符串进行翻译，并获得新的像素组，该新的像素组绘制出通过翻译而获得的新字符或字符串；使用通过执行预定内插处理，使构成指定区域中的字符或字符串的像素与构成这些像素的附近的背景的像素相匹配而获得的其他像素来替换所提取的像素组；通过将新获得的像素组写入其中像素已被替换的区域，来获得翻译文档的位像；以及输出该翻译文档的所获得的位像。
在该方面中，所述替换步骤可以包括使用像素值与所提取的像素附近的像素相同的像素来替换所提取的像素组。
出于示例和说明的目的给出了本发明的实施例的前述说明。这些说明并不旨在对本发明进行穷尽或将本发明限制为所公开的确切形式。显然，本领域的技术人员可以很容易想到许多修改和变化。为了最好地说明本发明的原理及其实际应用而选择并描述了以上实施例，由此使得本领域的其他技术人员可以理解本发明的适于所期望的具体应用的各种实施例以及各种变型例。其旨在通过以下权利要求及其等价物来限定本发明的范围。
在此通过引用并入2005年3月8日提交的日本专利申请No.2005-064130的全部公开内容，包括说明书、权利要求、附图及摘要。
权利要求
1.一种翻译文档图像生成装置，其包括提取部分，用于提取要处理的像素组，该像素组具有用于构成字符或字符串的像素；翻译部分，用于翻译所述字符或字符串；以及区域回填部分，用于回填所提取的像素组，以保持所翻译的字符或字符串的背景，并写入所翻译的字符和字符串。
2.根据权利要求1所述的翻译文档图像生成装置，其中所述区域回填部分通过使用像素值与所提取的像素附近的像素相同的像素替换所提取的像素组，来回填所提取的像素组。
3.一种翻译文档图像生成方法，包括提取要处理的像素组，该像素组具有用于构成字符或字符串的像素；翻译所述字符或字符串；以及回填所提取的像素组，以保持所翻译的字符或字符串的背景，并写入所翻译的字符或字符串。
4.根据权利要求3所述的翻译文档图像生成方法，其中通过使用像素值与所提取的像素附近的像素相同的像素替换所提取的像素组，来回填所提取的像素组。
5.一种计算机可读存储介质，该存储介质存储有可以由计算机执行的指令程序，用于执行生成翻译文档的功能，该功能包括提取要处理的像素组，该像素组具有用于构成字符或字符串的像素；翻译所述字符或字符串；以及回填所提取的像素组，以保持所翻译的字符或字符串的背景，并写入所翻译的字符或字符串。
6.根据权利要求5所述的计算机可读存储介质，其中通过使用像素值与所提取的像素附近的像素相同的像素替换所提取的像素组，来回填所提取的像素组。
7.一种翻译文档图像生成装置，其包括输入部分，用于输入通过扫描文档而获得的位像；提取部分，用于在所输入的位像中指定写有字符或字符串的区域，并提取构成该指定区域中的字符或字符串的像素组；字符识别部分，用于识别通过所提取的像素组显示的字符或字符串；翻译部分，用于对所识别的字符或字符串进行翻译，并获得新的像素组，该新的像素组绘制出通过翻译而获得的新字符或字符串；区域回填部分，用于使用通过执行预定内插处理，使构成所述指定区域中的字符或字符串的像素与构成这些像素附近的背景的像素相匹配而获得的其他像素来替换所提取的像素组；图像写入部分，用于通过将新获得的像素组写入其中像素已被替换的区域，来获得翻译文档的位像；以及输出部分，用于输出所述翻译文档的所获得的位像。
8.根据权利要求7所述的翻译文档图像生成装置，其中所述区域回填部分使用像素值与所提取的像素附近的像素相同的像素来替换所提取的像素组。
9.一种计算机可读记录介质，其记录有使计算机执行以下操作的程序输入通过扫描文档而获得的位像；在所输入的位像中指定写有字符或字符串的区域，并提取构成该指定区域中的字符或字符串的像素组；识别通过所提取的像素组显示的字符或字符串；对所识别的字符或字符串进行翻译，并获得新的像素组，该新的像素组绘制出通过翻译而获得的新字符或字符串；通过执行预定内插处理，使构成所述指定区域中的字符或字符串的像素与构成这些像素附近的背景的像素相匹配而获得的其他像素来替换所提取的像素组；通过将新获得的像素组写入其中像素已被替换的区域，来获得翻译文档的位像；以及输出所述翻译文档的所获得的位像。
10.根据权利要求9所述的记录介质，其中所述替换步骤包括使用像素值与所提取的像素附近的像素相同的像素来替换所提取的像素组。
全文摘要
翻译文档图像生成装置、记录介质以及翻译文档图像生成方法。该翻译文档图像生成装置具有提取部分、翻译部分以及区域回填部分。该提取部分提取要处理的像素组，该像素组具有用于构成字符或字符串的像素。该翻译部分翻译该字符或字符串。该区域回填部分回填所提取的像素组，以保持所翻译的字符或字符串的背景，并写入所翻译的字符和字符串。
文档编号G06K9/00GK1831818SQ200510109710
公开日2006年9月13日申请日期2005年9月15日优先权日2005年3月8日
发明者越裕, 木村俊一申请人:富士施乐株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：越裕;木村俊一
技术所有人：富士施乐株式会社
我是此专利的发明人

上一篇：计算机、图像处理系统以及图像处理方法
上一篇：翻译设备、翻译方法和存储介质的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。