翻译装置和翻译方法

文档序号:6462420阅读:102来源:国知局
专利名称:翻译装置和翻译方法
技术领域
本发明涉及一种翻译装置和翻译方法。
背景技术
已知这样一种装置即,该装置分析具有第一语言的原始语句 的文档的扫描图像以将包含在该扫描图像中的原始语句翻译成第二
语言并输出。例如,日本专利No.3636490披露了这样一种技术在 用翻译语句替换扫描图像的原绵语句的同时将该原始语句输出。另 夕卜,JP-A-5-324720 (这里使用的术语"JP-A"是指"未经审查的已
公开日本专利申请")披露了这样一种技术在各行上下排列原始语 句与翻译语句的同时将该原始句与翻译语句输出。
在日本专利No.3636490所披露的技术中,可以在维持扫描图像 的版面布局的状态下输出翻译语句,但是例如不便于比较翻译语句与 原始语句。另外,在JP-A-5-324720所披露的技术中,在有些情况下 扫描图像的版面布局可能改变或者翻译语句中的字符可能过小,从而 难于比较翻译语句与原始语句。结果,可能出现降低便利性的问题。

发明内容
本发明的目的在于提供这样一种翻译装置和程序其可以在显 著确保用户的便利性的同时输出翻译语句。
(1)根据本发明的第一方面,提供了一种翻译装置,其包括.-图像获取单元,其获取从包括有第一语言的原始语句的原始文档(原 稿文档)中所读取的原始文档图像;翻译单元,其将包含在所述原始 文档图像中的所述原始语句翻译成第二语言;行间区域指定单元,其 指定包含在所述原始文档图像中的所述原始语句的各行的行间区域; 第一翻译文档生成单元,其通过将翻译语句布置在所述原始文档图像
的各行间区域中来生成第一翻译文档;第二翻译文档生成单元,其通 过将所述原始文档图像中的所述原始语句替换成所述翻译语句来生 成第二翻译文档;判断单元,其基于各行间区域来判断是否满足非干 涉条件,其中所述非干涉条件用于判断所述原始语句是否与所述翻译
语句相干涉;以及输出单元,在满足所述非干涉条件的情况下所述输 出单元输出所述第一翻译文档,或者在不满足所述非干涉条件的情况 下所述输出单元输出所述第二翻译文档。
(2) 根据第(1)项所述的翻译装置,其中,所述判断单元根 据所述各行间区域之间的间隔是否在预定阈值以上来判断是否满足 所述非干涉条件。
(3) 根据第(2)项所述的翻译装置,其中,所述判断单元根 据所述第一翻译文档中与小于所述预定阈值的行间隔相对应的行间 区域中所布置的翻译语句的字符(文字)数目来判断是否满足所述非 干涉条件。
(4) 根据第(3)项所述的翻译装置,其中,在与小于所述预
定阈值的行间隔相对应的行间区域中所布置的翻译语句的字符数目 与所述翻译语句的字符总数的比率不大于预定比率的情况下,所述判 断单元判断为满足所述非干涉条件。
(5) 根据第(2)至(4)项中任一项所述的翻译装置,还包括
阈值确定单元,其根据所述第一语言与所述第二语言的组合来确定所 述预定阈值。
(6) 根据第(1)项所述的翻译装置,其中,所述判断单元根
据所述原始语句的字符是否与所述第一翻译文档中所述翻译语句的 字符的外接矩形区域相干涉来判断是否满足所述非干涉条件。
(7) 根据第(6)项所述的翻译装置,其中,所述判断单元根 据翻译语句的字符中其外接矩形区域与所述原始语句的字符相干涉 的字符数目来判断是否满足所述非干涉条件。
(8) 根据第(7)项所述的翻译装置,其中,在翻译语句的字 符中其外接矩形区域与所述原始语句的字符相干涉的字符数目与所 述翻译语句的字符总数的比率不大于预定比率的情况下,所述判断单
元判断为满足所述非干涉条件。
(9) 根据第(1)项所述的翻译装置,其中,所述判断单元根 据所述原始语句的字符是否与所述第一翻译文档中所述翻译语句的 字符相干涉来判断是否满足所述非干涉条件。
(10) 根据第(9)项所述的翻译装置,其中,所述判断单元根 据所述翻译语句的字符与所述原始语句的字符相干涉的部分的像素 数目来判断是否满足所述非干涉条件。
(11) 根据第(10)项所述的翻译装置,其中,在所述翻译语 句的字符与所述原始语句的字符相干涉的部分的像素数目与所述翻 译语句的字符的像素总数的比率不大于预定比率的情况下,所述判断 单元判断为满足所述非干涉条件。
(12) 根据第(1)至(11)项中任一项所述的翻译装置,其中,
所述第一翻译文档生成单元在将各行间区域中的像素值平滑化之后 将所述翻译语句布置在各行间区域中。
(13) 根据第(1)至(11)项中任一项所述的翻译装置,其中, 所述第一翻译文档生成单元在将各行间区域中的像素值设定成预定 值之后将所述翻译语句布置在各行间区域中。
(14) 根据第(1)至(13)项中任一项所述的翻译装置,其中, 所述第一翻译文档生成单元根据所述行间区域的背景颜色来确定布 置在各行间区域中的所述翻译语句的字符颜色。
(15) 根据第(1)至(14)项中任一项所述的翻译装置,其中, 所述原始文档包括图片,并且所述第二翻译文档生成单元指定所述原 始文档图像中所述图片的图片区域,并且在至少有一部分原始语句包 含在所指定的区域中的情况下,限制将所述至少一部分原始语句替换 成翻译语句。
(16) 根据本发明的第二方面,提供了一种翻译方法,其包括 获取从包括有第一语言的原始语句的原始文档中所读取的原始文档 图像;将包含在所述原始文档图像中的所述原始语句翻译成第二语 言;指定包含在所述原始文档图像中的所述原始语句的各行的行间区 域;通过将翻译语句布置在所述原始文档图像的各行间区域中来生成
第一翻译文档;通过将所述原始文档图像中的所述原始语句替换成所 述翻译语句来生成第二翻译文档;基于各行间区域判断是否满足非干 涉条件,其中所述非干涉条件用于判断所述原始语句是否与所述翻译
语句相干涉;以及在满足所述非干涉条件的情况下输出所述第一翻译 文档,或者在不满足所述非干涉条件的情况下输出所述第二翻译文 档。
根据第(1)项或第(16)项所述的本发明,可以以对于用户显 著便利的形式输出所述翻译语句。
根据第(2)项所述的本发明,可以根据所述行间区域的宽度来
选择对于所述翻译语句的显著便利的输出形式。
根据第(3)项所述的本发明,可以基于简单的数值指标来选择
对于所述翻译语句的显著便利的输出形式。
根据第(4)项所述的本发明,与未采用这种构造的情况相比, 可以可靠地选择对于所述翻译语句的显著便利的输出形式。
根据第(5)项所述的本发明,可以根据所述原始语句的语言与 所述翻译语句的语言的组合来选择对于所述翻译语句的显著便利的 输出形式。
根据第(6)项所述的本发明,可以根据在将所述翻译语句布置 在所述行间区域中时所述翻译语句是否易于与所述原始语句相重叠 来选择对于所述翻译语句的显著便利的输出形式。
根据第(7)项所述的本发明,可以基于简单的数值指标来选择 对于所述翻译语句的显著便利的输出形式。
根据第(8)项所述的本发明,与未采用这种构造的情况相比, 可以可靠地选择对于所述翻译语句的显著便利的输出形式。
根据第(9)项所述的本发明,可以根据在将所述翻译语句布置 在所述行间区域中时所述翻译语句是否与所述原始语句相重叠来选 择对于所述翻译语句的显著便利的输出形式。
根据第(10)项所述的本发明,可以基于简单的数值指标来选 择对于所述翻译语句的显著便利的输出形式。
根据第(11)项所述的本发明,与未采用这种构造的情况相比, 可以可靠地选择对于所述翻译语句的显著便利的输出形式。
根据第(12) 、 (13) 、 (14)及(15)项中任一项所述的本 发明,与未采用这种构造的情况相比,可以显著改善用户的便利性。


基于以下各图对本发明的示例性实施例进行详细说明,其中 图1为示出根据本发明实施例的翻译装置的硬件构造实例的示
图2为示出根据本发明实施例的翻译装置的功能块实例的示图3为示出原始文档的实例的示图4为示出指定行间区域和字符行区域的状态的示图5为示出行间区域和字符行区域的实例的示图6为示出附加单词型翻译文档的实例的示图7为示出计算重叠率的状态的示图8为示出翻译替换文档的实例的示图9为示出由根据本发明实施例的翻译装置进行的处理实例的 流程图;^
图IO为示出由根据本发明实施例的翻译装置进行的处理实例的 流程图11为示出计算重叠率的状态的示图; 图12为示出计算重叠率的状态的示图13为示出由根据本发明实施例的翻译装置进行的处理实例的 流程图14为示出生成翻译替换文档的状态的示图;以及 图15为示出由根据本发明实施例的翻译装置进行的处理实例的 流程图。
具体实施例方式
将参照各附图对本发明的示例性实施例进行说明。图1为示出 根据本发明实施例的翻译装置2的硬件构造实例的示图。如该图所 示,翻译装置2包括中央处理单元40、主存储器42、辅助存储器44、 图像读取单元46、操作单元48以及显示器50。各个单元可以通过数 据总线54相互通信。翻译装置2包括在图中未示出的网络接口、打 印机等。
中央处理单元40是CPU或MPU。利用预先存储在主存储器42 中的程序操作中央处理单元40以控制各单元。另外,中央处理单元 40利用存储在主存储器42中的信息进行计算操作,然后将所计算出 的数值输出到主存储器42中。该程序并不局限于存储在主存储器42 中的程序,而是也可以是存储在诸如CD-ROM或DVD-ROM等信息 存储介质中的程序或从网络提供的程序。
主存储器42是诸如RAM或ROM等的存储元件。主存储器42 对程序进行存储。另外,主存储器42存储从各单元输入的信息。
辅助存储器44是硬盘等。辅助存储器44根据从中央处理单元 40输出的控制信号来存储在主存储器42中所存储的信息。
图像读取单元46是扫描仪。图像读取单元46根据从中央处理 单元40输出的控制信号来读取原始文档,然后将所读取的原始文档 图像输出到主存储器42中。这里,原始文档包括以第一语言记载的 语句。这里,第一语言为日语。
操作单元48是键盘、鼠标等。操作单元48将操作信息输出到 主存储器42中。
显示器50根据从中央处理单元40输出的控制信号而对存储在 主存储器42中的信息进行显示。
图2为示出当基于程序操作中央处理单元40时由翻译装置2实 现的功能的方框图。这里,将主要说明本发明所涉及的功能。如该图 所示,翻译装置2包括原始文档图像获取单元60、行间区域指定单 元62、翻译单元64、附加单词型翻译文档生成单元66、重叠判断单 元68、翻译替换文档生成单元70以及翻译结果输出单元72。
原始文档图像获取单元60主要通过图像读取单元46实现。原 始文档图像获取单元60读取原始文档从而获取原始文档图像。
行间区域指定单元62主要通过中央处理单元40实现。行间区
域指定单元62对原始文档图像获取单元60所获取的原始文档图像的
版面布局进行分析,然后指定该原始文档图像中所包含的语句的各行 之间的行间区域。
在本实施例中,行间区域指定单元62分析原始文档图像的版面 布局,然后指定各语句的语句区域(参见图3)。另外,行间区域指 定单元62为语句区域指定字符行区域。
具体而言,如图4所示,行间区域指定单元62对认为是形成各 语句区域中的字符的像素(字符像素)进行投影计算,并相对于这样 的方向(在水平方向的情况下为Y轴或者在竖直方向的情况下为X 轴)生成投影直方图即,该方向与语句区域中字符彼此相连的方向 垂直。然后,行间区域指定单元62基于各语句区域的投影直方图指 定各语句区域的字符行区域。也就是说,行间区域指定单元62在各 语句区域中指定坐标区域并将所指定的区域设定为各字符行区域的 竖直宽度,其中在该坐标区域中字符像素的数目沿着投影轴连续为1 个或更多个。另外,行间区域指定单元62将语句区域的水平宽度设 定成各字符行区域的水平宽度。这样,如图5所示,行间区域指定单 元62为各语句区域指定字符行区域。
此外,行间区域指定单元62基于各语句区域的投影直方图来计 算用于指定行间区域的频率阈值TH1。这里,在每个语句区域中, 通过这样的方式计算平均字符像素数目Nm:即,用字符像素的总数 除以语句区域的竖直宽度。此外,将所计算出的平均字符像素数目 Nm乘以1/a (其中"a"为预先设定的常数)而获得的数值称为TH1。 例如如图4所示,平均字符像素数目Nm对应于用语句区域中字符像 素的总数除以语句区域的竖直宽度(Y2-Y1)而得到的商,并且TH1 对应于再用Nm除以a而得到的商。
行间区域指定单元62在各语句区域中指定Y轴区域并将所指定 的区域设定为各行间区域的竖直宽度,其中在该Y轴区域中字符像 素的数目连续为TH1或更小。另外,将语句区域的水平宽度设定成 各行间区域的水平宽度。这样,如图5所示,行间区域指定单元62 为各语句区域指定行间区域。行间区域指定单元62甚至将假想设置 在第一行的字符行区域的上部的预定区域指定为行间区域。
翻译单元64主要通过中央处理单元40实现。翻译单元64将原
始文档图像中所包含的各语句翻译成第二语言。
在本实施例中,翻译单元64针对行间区域指定单元62所指定 的各语句区域而识别语句区域中所包含的语句,然后将所识别的语句 翻译成第二语言。这里,第二语言为英语。
附加单词型翻译文档生成单元66主要通过中央处理单元40实 现。附加单词型翻译文档生成单元66通过以在原始语句中标记附加
单词的方式将翻译语句布置在原始文档图像的各行间区域中来生成 第一翻译文档。这里,附加单词型翻译文档生成单元66通过将翻译 语句布置在各行间区域中的方式生成如图6所示的附加单词型翻译 文档的图像数据(即位图数据)。
具体而言,附加单词型翻译文档生成单元66生成原始文档图像 的副本。另外,附加单词型翻译文档生成单元66针对所复制的原始 文档图像的各语句区域而将对应语句区域中所包含的语句的翻译语 句的各字符的图像布置在该语句区域的各行间区域中。这里,附加单 词型翻译文档生成单元66基于第一语言与第二语言的组合以预定的 字符尺寸来布置翻译语句的各字符的图像。另外,附加单词型翻译文 档生成单元66以取决于行间区域背景颜色的字符颜色来布置翻译语 句的各字符的图像。例如,附加单词型翻译文档生成单元66可以采 用相对于行间区域背景颜色的预定字符颜色来布置翻译语句的各字 符的图像,或者可以采用略微不同于行间区域背景颜色的字符颜色来 布置各字符的图像。这样,附加单词型翻译文档生成单元66生成附 加单词型翻译文档的图像数据。当将翻译语句布置在各行间区域中 时,翻译语句的字符尺寸可能大于原始语句的字符尺寸,或者也可能 小于原始语句的字符尺寸。
重叠判断单元68主要通过中央处理单元40实现。重叠判断单 元68判断是否满足非干涉条件,其中该非干涉条件用于判断在附加 单词型翻译文档中原始语句是否与翻译语句重叠。
在本实施例中,如图7所示,重叠判断单元68参照附加单词型
翻译文档的图像数据来对字符Nl的数目进行计数,其中该字符N1
布置在与小于预定行间隔TH2的行间区域相对应的行间区域中。重 叠判断单元68计算出字符Nl的数目与字符总数Mtotal的比率Pl (Nl/Mtotal),从而判断比率Pl是否为预定阈值TH3或更小。这 里,预定行间隔TH2为翻译语句的字符的高度。翻译语句的字符尺 寸是基于第一语言与第二语言的组合而预先设定的尺寸,行间隔TH2 随着第一语言与第二语言的组合而改变。在下文中,将比率P1称为 重叠率。
当重叠率大于TH3时,重叠判断单元68确定不满足非干涉条件。 与此同时,当重叠率不大于TH3时,重叠判断单元68确定满足非干 涉条件。重叠判断单元68将判断结果输出至翻译结果输出单元72。
翻译替换文档生成单元70主要通过中央处理单元40实现。翻 译替换文档生成单元70生成第二翻译文档,在该第二翻译文档中原 始文档图像的语句被替换为翻译语句。这里,翻译替换文档生成单元 70生成如图8所示的翻译替换文档的图像数据,其中各语句区域中 所包含的语句被替换为翻译语句。
具体而言,翻译替换文档生成单元70生成原始文档图像的副本。 然后,翻译替换文档生成单元70确定所复制的原始文档图像的各语 句区域的背景颜色,并用所确定的背景颜色涂绘对应的语句区域。例 如,翻译替换文档生成单元70利用对应语句区域中所包含的其中一 个行间区域的背景颜色涂绘各语句区域。然后,翻译替换文档生成单 元70将翻译语句的图像布置在各语句区域中。这样,翻译替换文档 生成单元70生成翻译替换文档的图像数据。这里,翻译替换文档生 成单元70确定翻译语句的字符尺寸以将翻译语句插入到语句区域 中。翻译语句的字符颜色可以是预定颜色或者是不同于语句区域背景 颜色的颜色。
翻译结果输出单元72主要通过显示器50实现。翻译结果输出 单元72根据重叠判断单元68的判断结果输出翻译结果。
在本实施例中,当满足非干涉条件时,翻译结果输出单元72基 于附加单词型翻译文档的图像数据将附加单词型翻译文档的图像输
出到显示器50中,或者当不满足非干涉条件时,翻译结果输出单元
72基于翻译替换文档的图像数据将附加单词型翻译文档的图像和翻 译替换文档的图像输出到显示器50中。当不满足非干涉条件时,翻 译结果输出单元72可以仅将翻译替换文档的图像输出到显示器50 中。另外,翻译结果输出单元72可以打印出附加单词型翻译文档的 图像或翻译替换文档的图像。
接下来,将参照图9中所示的流程图说明由具有上述功能的翻 译装置2进行的示例性处理。在本实施例中,当用户通过使翻译装置 2读取原始文档来进行翻译指示操作时,进行处理。
翻译装置2通过读取原始文档获取原始文档图像(S101)。随 后,翻译装置2利用行间区域指定单元62的功能分析原始文档图像 的版面布局,并指定语句区域(S102)。作为另一种选择,翻译装 置2利用行间区域指定单元62的功能指定每个语句区域中的字符行 区域和行间区域(S103)。
随后,翻译装置2通过OCR处理识别各字符行区域中的字符 (S104)。随后,翻译装置2将所识别的各语句区域中的字符组合 起来(S105)。这样,翻译装置2识别各语句区域中的对应语句区 域中所包含的语句。随后,翻译装置2将各语句区域中的语句翻译成 第二语言,并生成翻译语句的文本(S106)。
随后,翻译装置2生成附加单词型翻译文档的图像数据(S107)。 具体而言,翻译装置2通过进行如图10的流程图中所示的处理来生 成附加单词型翻译文档的图像数据。
也就是说,翻译装置2生成原始文档图像的副本。随后,翻译 装置2进行诸如倾斜补偿、底色消除等公知的高清晰化处理(S201)。 随后,翻译装置2从所复制的原始文档图像中选择处理对象的语句区 域(目标语句区域)(S202)。随后,翻译装置2从目标语句区域 中选择目标行间区域(S203)。随后,翻译装置2指定目标行间区 域的背景颜色,并根据所指定的背景颜色确定翻译语句的字符颜色 (S204)。例如,翻译装置2将事先相对于所指定的背景颜色而确 定的颜色或不同于所指定的背景颜色的颜色设定为翻译语句的字符
颜色。随后,翻译装置2利用在步骤S204中所指定的字符颜色将翻 译语句的各字符的图像布置到目标行间区域中(S205)。
随后,当未将翻译语句的各字符的图像布置到每个行间区域中 时(S206中判断结果为否),翻译装置2返回到步骤S203,或者当 已将翻译语句的各字符的图像布置到每个行间区域中时(S206中判 断结果为是),翻译装置2转入步骤S207。随后,当未对每个语句 区域都进行从S203到S206的处理时(S207中判断结果为否),翻 译装置2返回到步骤S202,或者当已对每个语句区域都进行从S203 到S206的处理时,翻译装置2结束处理。这样,翻译装置2生成附 加单词型翻译文档的图像数据。翻译装置2在步骤S203之后利用公 知的方法将目标行间区域平滑化,然后可转入步骤S204。例如,翻 译装置2在步骤S203之后计算在目标行间区域的像素中的下述像素 的像素数目,其中所述像素的像素值(即RGB值、反差值、亮度值 等)与相邻像素的像素值的平均值相差预定值或更大。然后,当所计 算出的像素数目与目标行间区域的像素总数的比率不小于预定比率 时,翻译装置2可以将目标行间区域平滑化。作为另一种选择,翻译 装置2在步骤S203之后利用预定颜色(即白色等)涂绘目标行间区 域,然后可以转入步骤S204。
当生成附加单词型翻译文档的图像数据时,翻译装置2利用重 叠判断单元68的功能计算比率Pl即重叠率(S109)。这里,翻译 装置2可以基于各行间区域的长度(水平宽度)和翻译语句的字符尺 寸通过计算布置在各行间区域中的字符的数目,从而计算出字符数目 Nl。在这种情况下,由于翻译装置2为了计算重叠率而没有使用附 加单词型翻译文档的图像数据,则可以在步骤S108之后的步骤中生 成附加单词型翻译文档的图像数据。
这里,将重叠率设定成布置在与小于行间隔TH2的行间区域相 对应的行间区域中的字符数目Nl与翻译语句的像素总数Mtotal的比 率P1,但该重叠率可以是不同的数值。例如,翻译装置2参照附加 单词型翻译文档的图像数据而对翻译语句的各字符设定外接矩形。然 后,如图11所示,翻译装置2判断原始语句的字符是否部分或全部
包含在翻译语句的各字符的外接矩形区域中,也就是说,原始语句的 字符是否与该外接矩形区域相干涉,然后对翻译语句的字符中其外接
矩形区域与原始语句的字符相干涉的字符数目N2进行计数。然后,
翻译装置2计算字符数目N2与字符总数Mtotal的比率P2。可以将 这样得到的比率P2设定成重叠率。
另外,例如翻译装置2参照附加单词型翻译文档的图像数据来 对翻译语句的字符与原始语句的字符相干涉的整个部分中的像素数 目的总和N3进行计数(参见图12)。然后,翻译装置2计算像素数 目N3与翻译语句的全部字符中像素数目的总和Mtotal的比率P3。 可以将这样得到的比率P3设定成重叠率。
当这样计算出重叠率时,翻译装置2判断是否满足非干涉条件。 也就是说,翻译装置2判断重叠率是否不大于预定阈值TH3(S109)。 当重叠率不大于预定阈值TH3时(S109中的判断结果为是),翻译 装置2基于附加单词型翻译文档的图像数据输出附加单词型翻译文 档的图像(S110)。例如,翻译装置2在显示器50上显示附加单词 型翻译文档的图像或者借助于打印机打印出该图像。
另一方面,当重叠率大于预定阈值TH3时(S109中判断结果为 否),翻译装置2生成翻译替换文档的图像数据(S111)。具体而 言,翻译装置2通过进行如图13的流程图中所示的处理来生成翻译 替换文档的图像数据。
也就是说,翻译装置2生成原始文档图像的副本,并对所复制 的原始文档图像进行诸如倾斜补偿、底色消除等公知的高清晰化处理
(5301) 。随后,翻译装置2从所复制的原始文档图像中选择处理 对象的语句区域(目标语句区域),并确定目标语句区域的背景颜色
(5302) 。例如,翻译装置2将目标语句区域中所包含的其中一个 行间区域的背景颜色设定为目标语句区域的背景颜色。随后,翻译装 置2利用在步骤S302中所确定的背景颜色涂绘目标语句区域
(5303) 。
随后,翻译装置2确定布置在目标语句区域中的翻译语句的字 符颜色(S304)。例如,翻译装置2将翻译语句的字符颜色设定为
与在步骤S302中所确定的背景颜色相关的预定颜色或不同于对应的 背景颜色的颜色。随后,翻译装置2确定布置在目标语句区域中的翻
译语句的字符尺寸(S305)。例如,翻译装置2确定翻译语句的字 符尺寸以将翻译语句插入到目标语句区域中。
随后,翻译装置2将翻译语句的图像布置在目标语句区域中 (S306)。随后,翻译装置2检查翻译语句的图像是否已布置在每 个语句区域中(S307),当翻译语句的图像未布置在每个语句区域 中时(S307中判断结果为否),翻译装置2返回到步骤S302。另一 方面,当翻译语句的图像己布置在每个语句区域中时(S307中判断 结果为是),翻译装置2结束处理。这样,翻译装置2生成翻译替换 文档的图像数据。翻译装置2可以在步骤S109之前的步骤中生成翻 译替换文档的图像数据。
当这样生成翻译替换文档的图像数据时,翻译装置2基于附加 单词型翻译文档的图像数据和翻译替换文档的图像数据输出附加单 词型翻译文档的图像和翻译替换文档的图像(S112)。例如,翻译 装置2在显示器50上显示这些图像或者借助于打印机打印出这些图 像。这里,翻译装置2可以在步骤S112中仅输出翻译替换文档的图 像。如上所述,已经说明了由翻译装置2进行的具体处理。当原始文 档具有多页纸张时,翻译装置2对每一页进行从S101到S112的处 理。
本发明的实施例并不局限于上述实施例。
也就是说,本发明可以应用于第一和第二语言的种类以外的任 何语言。例如,本发明可应用于将法语翻译成德语的情况或者将古语 翻译成现代日语的情况。另外,例如本发明甚至可应用于将关西方言 翻译成关东方言的情况。
本发明不仅可应用于原始文档包括沿水平方向书写的语句的情 况,而且也可应用于原始文档包括沿竖直方向书写的语句的情况。
翻译装置2可在步骤S109中判断至少一个行间区域的高度(当 沿水平方向写入原始语句时)是否小于行间隔TH2。另外,当至少 一个行间区域的高度小于行间隔TH2时,进行步骤Slll中的处理。作为另一种选择,当每个行间区域的高度都不小于行间隔TH2 (即, 在行间隔TH2以上)时,可以进行步骤S110中的处理。在这种情况 下,翻译装置2不必计算重叠率。
翻译装置2可以将比率P1、比率P2以及比率P3中之一设定为 重叠率。
例如,翻译装置2计算出比率Pl,当所计算出的比率P1大于 预定阈值TH31时将比率Pl设定为重叠率,或者当比率Pl不大于预 定阈值TH31时计算出比率P2。另外,当所计算出的比率P2大于预 定阈值TH32时翻译装置2将比率P2设定为重叠率,或者当比率P2 不大于预定阈值TH32时计算出比率P3,并将所计算出的比率P3设 定为重叠率。这样,可以确定重叠率。
在翻译对象原始文档包括含有语句(或单词)的图片的情况下 (参见图14),翻译装置2可以通过在步骤Slll中另外进行如图 15所示流程图的各步骤,从而可在不用翻译语句替换包含在图片中 的语句的情况下生成翻译替换文档的图像数据。
也就是说,在步骤S301之后,翻译装置2利用公知的方法指定 原始文档图像中图片区域的位置/范围(S401)。例如,翻译装置2 生成所复制的原始文档图像的双值图像,并对该双值图像进行标记处 理。翻译装置2对于通过标记处理所提取的每个连接组分设定外接矩 形。然后,翻译装置2对于每个连接组分而计算连接组分相对于外接 矩形的占有率,然后将占有率高的区域设定为图片区域。这样,翻译 装置2指定图片区域。
翻译装置2判断目标语句区域是否处于图片区域的外部(S402), 然后当目标语句区域处于图片区域的外部时(S402中判断结果为是) 转入步骤S302,或者当目标语句区域处于图片区域的内部时(S402 中判断结果为否)选择其它的目标语句区域以再次进行步骤S402中 的处理。这样,翻译装置2在步骤S302之后仅对图片区域外部的语 句区域进行处理。
在上述实施例中,翻译装置2以图像数据形式生成附加单词型 翻译文档(第一翻译文档),但是也可以其它数据形式生成该附加单
词型翻译文档。例如,翻译装置2可将附加单词型翻译文档生成为包 括描绘位置、描绘尺寸、描绘颜色等的描绘数据。在这种情况下,翻 译装置2基于描绘数据通过描绘原始文档图像的各行间区域中的翻 译语句来输出附加单词型翻译文档的图像。
通过相同的方式,翻译装置2可以以图像数据以外的其它数据 形式生成翻译替换文档(第二翻译文档)。例如,翻译装置2可将附
加单词型翻译文档生成为翻译文档的各语句相对于背景图像(将原始 文档图像的各语句区域涂绘成背景颜色的图像)的包括描绘位置、描
绘尺寸、描绘颜色等的描绘数据。在这种情况下,翻译装置2基于描 绘数据通过描绘背景图像的各行间区域中的翻译语句来输出翻译替 换文档的图像。
以上提供了对本发明示例性实施例的说明,其目的在于举例和 说明。这并不意味上述实施例为穷举的或将本发明局限于所公开的确 切形式。显然,很多变型和变更对于本领域的普通技术人员来说是显 而易见的。选择和说明上述示例性实施例旨在更好地解释本发明的原 理及其实际应用,从而使本领域的其他技术人员能够理解本发明的各 种实施例以及适用于预期的特定应用的各种变型。本发明的范围由所 附权利要求书及其等同内容限定。
权利要求
1.一种翻译装置,包括图像获取单元,其获取从包括有第一语言的原始语句的原始文档中所读取的原始文档图像;翻译单元,其将包含在所述原始文档图像中的所述原始语句翻译成第二语言;行间区域指定单元,其指定包含在所述原始文档图像中的所述原始语句的各行的行间区域;第一翻译文档生成单元,其通过将翻译语句布置在所述原始文档图像的各行间区域中来生成第一翻译文档;第二翻译文档生成单元,其通过将所述原始文档图像中的所述原始语句替换成所述翻译语句来生成第二翻译文档;判断单元,其基于各行间区域判断是否满足非干涉条件,其中所述非干涉条件用于判断所述原始语句是否与所述翻译语句相干涉;以及输出单元,在满足所述非干涉条件的情况下所述输出单元输出所述第一翻译文档,或者在不满足所述非干涉条件的情况下所述输出单元输出所述第二翻译文档。
2. 根据权利要求l所述的翻译装置,其中, 所述判断单元根据所述各行间区域之间的间隔是否在预定阈值以上来判断是否满足所述非干涉条件。
3. 根据权利要求2所述的翻译装置,其中, 所述判断单元根据所述第一翻译文档中与小于所述预定阈值的行间隔相对应的行间区域中所布置的翻译语句的字符数目来判断是 否满足所述非干涉条件。
4. 根据权利要求3所述的翻译装置,其中, 在与小于所述预定阈值的行间隔相对应的行间区域中所布置的 翻译语句的字符数目与所述翻译语句的字符总数的比率不大于预定 比率的情况下,所述判断单元判断为满足所述非干涉条件。
5. 根据权利要求2所述的翻译装置,还包括阈值确定单元,其根据所述第一语言与所述第二语言的组合来 确定所述预定阈值。
6. 根据权利要求l所述的翻译装置,其中,所述判断单元根据所述原始语句的字符是否与所述第一翻译文 档中所述翻译语句的字符的外接矩形区域相干涉来判断是否满足所 述非干涉条件。
7. 根据权利要求6所述的翻译装置,其中, 所述判断单元根据翻译语句的字符中其外接矩形区域与所述原始语句的字符相干涉的字符数目来判断是否满足所述非干涉条件。
8. 根据权利要求7所述的翻译装置,其中, 在翻译语句的字符中其外接矩形区域与所述原始语句的字符相干涉的字符数目与所述翻译语句的字符总数的比率不大于预定比率 的情况下,所述判断单元判断为满足所述非干涉条件。
9. 根据权利要求1所述的翻译装置,其中, 所述判断单元根据所述原始语句的字符是否与所述第一翻译文档中所述翻译语句的字符相干涉来判断是否满足所述非干涉条件。
10. 根据权利要求9所述的翻译装置,其中, 所述判断单元根据所述翻译语句的字符与所述原始语句的字符相干涉的部分的像素数目来判断是否满足所述非干涉条件。
11. 根据权利要求IO所述的翻译装置,其中,在所述翻译语句的字符与所述原始语句的字符相干涉的部分的 像素数目与所述翻译语句的字符的像素总数的比率不大于预定比率 的情况下,所述判断单元判断为满足所述非干涉条件。
12. 根据权利要求l所述的翻译装置,其中,所述第一翻译文档生成单元在将各行间区域中的像素值平滑化 之后将所述翻译语句布置在各行间区域中。
13.根据权利要求l所述的翻译装置,其中,所述第一翻译文档生成单元在将各行间区域中的像素值设定成 预定值之后将所述翻译语句布置在各行间区域中。
14. 根据权利要求l所述的翻译装置,其中, 所述第一翻译文档生成单元根据所述行间区域的背景颜色来确定布置在各行间区域中的所述翻译语句的字符颜色。
15. 根据权利要求l所述的翻译装置,其中, 所述原始文档包括图片,并且所述第二翻译文档生成单元指定所述原始文档图像中所述图片 的图片区域,并且在至少有一部分原始语句包含在所指定的区域中的 情况下,限制将所述至少一部分原始语句替换成翻译语句。
16. —种翻译方法,包括获取从包括有第一语言的原始语句的原始文档中所读取的原始文档图像;将包含在所述原始文档图像中的所述原始语句翻译成第二语曰;指定包含在所述原始文档图像中的所述原始语句的各行的行间区域; 通过将翻译语句布置在所述原始文档图像的各行间区域中来生成第一翻译文档;通过将所述原始文档图像中的所述原始语句替换成所述翻译语句来生成第二翻译文档;基于各行间区域判断是否满足非干涉条件,其中所述非干涉条 件用于判断所述原始语句是否与所述翻译语句相干涉;以及在满足所述非干涉条件的情况下输出所述第一翻译文档,或者 在不满足所述非干涉条件的情况下输出所述第二翻译文档。
全文摘要
本发明公开了一种翻译装置,该装置包括图像获取单元,其获取从包括有第一语言的原始语句的原始文档中所读取的原始文档图像;翻译单元,其将所述原始语句翻译成第二语言;行间区域指定单元,其指定所述原始语句的各行的行间区域;第一翻译文档生成单元,其通过将翻译语句布置在所述原始文档图像的各行间区域中来生成第一翻译文档;第二翻译文档生成单元,其生成第二翻译文档;判断单元,其基于各行间区域判断是否满足非干涉条件;以及输出单元,在满足所述非干涉条件的情况下所述输出单元输出所述第一翻译文档,或者在不满足所述非干涉条件的情况下所述输出单元输出所述第二翻译文档。
文档编号G06F17/28GK101373465SQ200810094518
公开日2009年2月25日 申请日期2008年4月18日 优先权日2007年8月24日
发明者加藤雅弘 申请人:富士施乐株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1