翻译设备、翻译系统以及翻译方法与流程

文档序号:13454059阅读:231来源:国知局

本发明涉及翻译设备、翻译系统以及翻译方法。



背景技术:

近来,提供了用于将使用源语言记载的纸质原稿或电子原稿翻译成另一种语言的翻译服务。翻译服务例如作为云服务提供。在该服务中,从终端设备等向提供翻译服务的云服务器发送原文,并且翻译后的译文被返回。

日文特开2007-87056号公报公开了以下技术。从图像数据提取文字数据,该图像数据从包含由读取单元读取的原文在内的原稿获得,并且文字数据被翻译成指定的语言。译文临时排列在原文的布局中,并且检查排列错误的存在。当排列错误存在时,执行变更译文的文字属性的文字属性变更处理。产生的译文临时排列在原文的布局中,并且检查排列错误的存在。当排列错误仍然存在时,基于翻译结果执行再翻译处理,该再翻译处理包括变更翻译方法的翻译方法变更处理和变更翻译后原稿的已翻译原稿变更处理中的一个或两个。获得不同的翻译结果,使得译文被调节到原文的布局。

日文特开第2007-52614号公报公开了翻译服务器。在该翻译服务器中,如果对应于原文的最新的翻译数据预先存在于原稿数据库中,则使用该翻译数据。如果最新的翻译数据不存在并且如果最新的原稿数据存在,则翻译该原稿数据从而获得翻译数据。如果最新的原稿数据和最新的翻译数据都不存在,则翻译从原稿获得的原稿数据,并且使用翻译数据。

在一些情况下,以第一语言记载的原稿被翻译成第二语言,然后已翻译的原稿被再翻译成另一种语言。示例性情况如下。从发送源发送且以用作第一语言的英语记载的原稿被翻译成用作第二语言的日语,并且使用日语添加必要的项目。然后,原稿被再翻译成英语,并且向发送源返回产生的原稿。

然而,在这种情况下,从发送源发送的原稿的内容经过多个翻译操作。因此,在多个翻译操作之后不总是保持英语的源内容。



技术实现要素:

本发明的目的是提供使得原稿的源内容在源内容经过多个翻译操作之后几乎不改变的翻译设备等。

根据本发明的第一个方面,提供了一种翻译设备,该翻译设备包括翻译单元、历史创建单元、提取单元以及组合单元。翻译单元将原稿的内容翻译成不同的语言。当翻译单元将原稿的内容从第一语言翻译成第二语言时,历史创建单元创建包括第一语言的原文与第二语言的译文之间的对应性在内的历史信息。当翻译单元要将原稿的内容从第二语言翻译成另一种语言时,如果以第二语言记载的原稿的内容存在于历史信息中,则提取单元提取不存在于历史信息中的内容。组合单元将翻译结果与替换结果组合。翻译结果通过由翻译单元翻译不存在于历史信息中的内容来获得。翻译从第二语言到另一种语言来执行。替换结果通过替换存在于历史信息中的内容来获得。替换基于历史信息从第二语言到另一种语言来执行。

根据本发明的第二个方面,在根据第一个方面的翻译设备中,另一种语言为第一语言。组合单元将翻译结果与替换结果组合。翻译结果通过由翻译单元翻译不存在于历史信息中的内容来获得。翻译从第二语言到第一语言来执行。替换结果通过替换存在于历史信息中的内容来获得。替换基于历史信息从第二语言到第一语言来执行。

根据本发明的第三个方面,在根据第一个方面的翻译设备中,另一种语言为不同于第一语言和第二语言的第三语言。组合单元将翻译结果与的结果组合。翻译结果通过由翻译单元将不存在于历史信息中的内容从第二语言翻译成第三语言来获得。替换结果通过基于历史信息将存在于历史信息中的内容从第一语言翻译成第三语言以替换来获得。

根据本发明的第四个方面,在根据第一个方面至第三个方面中的任一个方面的翻译设备中,不存在于历史信息中的内容是关于已由用户添加到原稿的项目。

根据本发明的第五个方面,根据第一个方面至第四个方面中的任一个方面的翻译设备还包括布局分析单元,该布局分析单元分析原稿的布局。翻译单元和组合单元保持借助由布局分析单元执行的分析获得的布局,并且排列翻译结果。

根据本发明的第六个方面,在根据第五个方面的翻译设备中,提取单元基于要翻译的目标的位置提取不存在于历史信息中的内容。位置借助由布局分析单元执行的分析来获得。

根据本发明的第七个方面,提供了一种翻译系统,该翻译系统包括翻译部和原稿发送部。翻译部翻译原稿的内容。原稿发送部向翻译部发送以源语言记载的原稿的原稿数据。翻译部包括翻译单元、历史创建单元、提取单元以及组合单元。翻译单元将原稿的内容翻译成不同的语言。当翻译单元将原稿的内容从第一语言翻译成第二语言时,历史创建单元创建包括第一语言的原文与第二语言的译文之间的对应性的历史信息。当翻译单元要将原稿的内容从第二语言翻译成另一种语言时,如果以第二语言记载的原稿的内容存在于历史信息中,则该提取单元提取不存在于历史信息中的内容。组合单元将翻译结果与替换结果组合。翻译结果通过由翻译单元翻译不存在于历史信息中的内容来获得。翻译从第二语言到另一种语言来执行。替换结果通过替换存在于历史信息中的内容来获得。替换基于历史信息从第二语言到另一种语言来执行。

根据本发明的第八个方面,提供了一种翻译方法,该翻译方法包括以下步骤:将原稿的内容翻译成不同的语言;当将原稿的内容从第一语言翻译成第二语言时,创建包括第一语言的原文与第二语言的译文之间的对应性在内的历史信息;当要将原稿的内容从第二语言翻译成另一种语言时,如果以第二语言记载的原稿的内容存在于历史信息中,则提取不存在于历史信息中的内容;以及将翻译结果与替换结果组合,翻译结果通过翻译不存在于历史信息中的内容来获得,翻译从第二语言到另一种语言进行,替换结果通过替换存在于历史信息中的内容来获得,替换基于历史信息从第二语言到另一种语言来执行。

根据本发明的第一个方面,可以提供一种翻译设备,该翻译设备使得第一语言的原稿的源内容在源内容经多个翻译操作之后几乎不改变。

根据本发明的第二个方面,在将第一语言的原稿的内容翻译成第二语言之后,即使在将翻译后的内容进一步翻译成第一语言时,也几乎不改变第一语言的原稿的源内容。

根据本发明的第三个方面,在将第一语言的原稿的内容翻译成第二语言之后,即使在将翻译后的内容进一步翻译成第三语言时,也几乎不改变第一语言的原稿的源内容。

根据本发明的第四个方面,可以提取由用户添加的项目,并且可以翻译所提取的项目。

根据本发明的第五个方面,可以容易地保持翻译后的原稿的布局。

根据本发明的第六方面,更容易地提取不存在于历史信息中的内容。

根据本发明的第七个方面,可以提供一种翻译系统,该翻译系统使得第一语言的原稿的源内容在源内容经过多个翻译操作之后几乎不改变。

根据本发明的第八个方面,可以提供一种翻译方法,该翻译方法使得第一语言的原稿的源内容在源内容经过多个翻译操作之后几乎不改变。

附图说明

将基于以下附图详细地描述本发明的示例性实施方式,附图中:

图1是例示了本发明的示例性实施方式应用于的翻译系统的示例性整体构造的图;

图2是例示了终端设备的硬件构造的图;

图3是例示了图像形成设备的示例性硬件构造的图;

图4a是例示了通过使用传真发送来的示例性原稿的图;

图4b是例示了已经由云服务器翻译了的示例性原稿的图;

图4c是例示了用户向翻译后的原稿添加用于必要项目的信息而获得的示例的图;

图4d是例示了通过将在图4c中例示的添加之后的原稿再次从日语再翻译成英语获得的示例的图;

图5是例示了云服务器的示例性功能构造的框图;

图6是用于描述翻译系统中的操作的流程图;

图7是例示了由布局分析单元执行的、原稿的布局的分析的结果的图;

图8是例示了由历史创建单元创建的示例性历史信息的图;

图9a是例示了由布局分析单元执行的对原稿的布局的再分析的结果的图;

图9b是由提取单元检测的差异的图;

图10是例示了指示差异且由历史创建单元创建的示例性历史信息的图;以及

图11是例示了在历史创建单元添加翻译结果后获得的示例性历史信息的图。

具体实施方式

下面将参照附图详细描述本发明的示例性实施方式。

在以下描述中,“源语言”是从其执行翻译的语言和翻译之前的语言。“翻译语言”是翻译后的语言。进一步地,“原文”是包含以源语言记载的一个或更多个文字(字)的文本。“译文”是包含以翻译语言记载的一个或更多个文字(字)的文本。

图1是例示了示例性实施方式应用于的翻译系统的示例性整体构造的图。

如图1所例示,翻译系统1包括连接到网络90的终端设备10和图像形成设备30。网络90例如借助网关服务器(未例示)连接到网络70,并且云服务器50连接到网络70。

图1仅例示了一个终端设备10。另选地,可以设置多个终端设备10。图1还仅例示了一个图像形成设备30。另选地,可以设置多个图像形成设备30。

终端设备10是请求云服务器50翻译原稿的计算机设备。作为终端设备10,可以使用个人计算机(pc)、便携式终端、移动电话等。

图像形成设备30在诸如纸张的记录介质上形成图像,并且输出记录介质,作为打印介质。图像形成设备40设置有打印机功能。除此之外,图像形成设备30还可以设置有其他图像处理功能,诸如扫描仪功能和传真功能。

图像形成设备30可以请求云服务器50翻译原稿,这将在下面详细描述。图像形成设备30充当向云服务器50发送以源语言记载的原稿的原稿数据的原稿发送部。

云服务器50是为翻译提供云服务的服务器计算机。云服务器50充当翻译原稿的内容的翻译部(翻译设备)。

网络70是用于终端设备10与云服务器50之间的信息通信中且用于图像形成设备30与云服务器50之间的信息通信中的通信单元,例如是因特网。

网络90是作为用于终端设备10与图像形成设备30之间的信息通信中的通信单元,例如是局域网(lan)。

将描述终端设备10的硬件构造。

图2是例示了终端设备10的硬件构造的图。

如图2所例示,终端设备10包括作为计算单元的中央处理单元(cpu)11,并且还包括作为存储的主存储器12和硬盘驱动器(hdd)13。cpu11执行各种类型的软件,诸如操作系统(os)和应用。主存储器12是用于存储各种类型的软件、软件执行中的数据等的存储区域。hdd13是用于存储用于各种类型的软件的输入数据、来自各种类型的软件的输出数据等的存储区域。

进一步地,终端设备10包括用于与外部通信的通信接口(下文中被表示为“通信i/f”)14、由视频存储器、显示器等构成的显示机构15以及诸如键盘和鼠标的输入装置16。

图2可以被理解为是例示了云服务器50的硬件构造的图。

图3是例示了图像形成设备30的示例性硬件构造的图。

如图3所例示,图像形成设备30包括cpu31、随机存取存储器(ram)32、只读存储器(rom)33、硬盘驱动器(hdd)34、操作板35、图像读取单元36、图像形成单元37以及通信i/f38。

cpu31将rom33等中所存储的各种程序加载到ram32中,并且执行程序,以实现下面描述的功能。

ram32是用作cpu31的工作存储器等的存储器。

rom33是用于存储由cpu31执行的各种程序等的存储器。

hdd34例如是存储由图像读取单元36读取的图像数据、用于由图像形成单元37执行的图像形成中的图像数据等的磁盘装置。

操作板35例如是显示各种类型的信息且接收来自用户的操作输入的触摸板。

图像读取单元36读取原稿上所记录的图像。图像读取单元36例如是扫描仪。作为扫描仪,可以使用电荷耦合装置(ccd)系统或接触式图像传感器(cis)系统。在ccd系统中,通过使用透镜会聚通过反射从光源向原稿发射的光获得的光,并且由ccd接收会聚的光。在cis系统中,由cis接收通过在移动时反射从发光二极管(led)光源向原稿发射的光获得的光。

图像形成单元37是在记录介质上形成图像的示例性打印机构。图像形成单元37例如是打印机。作为打印机,可以使用电子照相系统或喷墨系统。在电子照相系统中,附着到感光鼓的色调剂被转印到记录介质从而形成图像。在喷墨系统中,墨水被喷射到记录介质上从而形成图像。

通信i/f38借助网络从/向其他设备接收/发送各种类型的信息。

在翻译系统1的构造中,终端设备10向云服务器50发送翻译前的源语言的原稿数据。例如,该发送可以通过使用诸如在终端设备10上操作的网络浏览器这样的软件来执行。具体地,该发送通过在终端设备10的显示机构15上显示由云服务器50提供的云服务的网页并使用输入装置16操作网页上的菜单等来执行。云服务器50将原稿从源语言翻译成翻译语言,并且向终端设备10返回翻译后的原稿。终端设备10在网页上显示已经被返回的翻译后的原稿。例如,字(word)格式或便携式原稿格式(pdf)格式可以用作原稿数据的格式。

不仅终端设备10而且图像形成设备30可以向云服务器50发送源语言的原稿数据。在这种情况下,例如,使用图像读取单元36来扫描原稿,并且获得原稿上所记录的图像的图像数据。原稿的图像数据被转换成诸如pdf格式这样的格式的原稿数据,并且该原稿数据被发送到云服务器50。

在云服务器50将原稿从源语言翻译成翻译语言之后,云服务器50向图像形成设备30或终端设备10返回翻译后的原稿数据。当翻译后的原稿数据返回到图像形成设备30时,图像形成设备30例如在操作板35上显示翻译后的原稿。另选地,原稿可以存储在hdd34中。当原稿返回到终端设备10时,类似于上述情况,在网页上显示翻译后的原稿。

将描述已经通过使用传真发送来的原稿用于翻译系统1中的示例。

图4a例示了已经通过使用传真发送来的示例性原稿。

图4a中例示的原稿是订货单,并且包含使用英语的文本。在这种情况下,在顶部处描述指示原稿名称的“ordersheet”(订货单)。在原稿名称下部的左侧,描述了指示用于下订单的必要项目的“name”(名称)、“e-mailaddress”(电子邮件地址)、“phonenumber”(电话号码)、“zipcode”(邮政编码)、“address”(地址)、“itemcode”(项目代码)以及“remarks”(意见)。用于记载对应于这些项目的实际信息的空白栏设置在下部的右侧。

用户通过使用图像形成设备30的图像读取单元36扫描原稿,并且向云服务器50发送格式为pdf格式等的原稿数据。结果,云服务器50将如图4a例示的翻译前的原稿的内容从作为源语言的英语翻译成作为翻译语言的日语。云服务器50向图像形成设备30返回翻译后的原稿,作为原稿数据。

图4b例示了由云服务器50翻译了的示例性原稿。

如图4b例示,表示在原稿的顶部处描述的原稿名称的“ordersheet”被翻译成“注文書”(订货单)。另外,指示用于下订单的必要项目且在原稿名称下方的部分的左侧描述的“name”、“e-mailaddress”等被翻译成“名前”(名称)、“電子メールアドレス”(电子邮件地址)、“電話番号”(电话号码)、“郵便番号”(邮政编码)、“ァドレス”(地址)、“ァィテムュード”(项目代码)以及“意見”(意见)。

用户对所接收的翻译后的原稿添加用于必要项目的信息。在这种情况下,用于必要项目的信息被记载在描述“name”、“e-mailaddress”等的区域右侧的空白栏中。此时,用户可以添加手写信息或者可以通过使用电子数据来添加信息。

图4c是例示了用户对翻译后的原稿添加用于必要项目的信息而获得的示例的图。

在该示例中,用户对“名前”记入“富士太郎”。类似地,用户对“電子メ一ルアドレス”记入“fuji.taro@fujixerox.co.jp”,对“電話番号”记入“123-4567-8910”,对“郵便番号”记入“123-4567”、对“アドレス”记入“日本国日本県日本村1-2-3”、对“アイテムコ一ド”记入“abcdef”并且对“意見”(意见)记入“日本特别仕様にして下さい。”。

然后,为了向传真的发送源返回图4c中例示的添加后的原稿,用户再次使用翻译系统1将原稿从日语再翻译成英语。然后,用户通过使用传真返回已经被翻译成英语的再翻译后的原稿。

图4d是例示了通过将在图4c中例示的添加后的原稿从日语再翻译成英语获得的示例的图。

在该示例中,作为日语文本的“注文書”、“名前”、“電子メ一ルアドしス”、“電話番号”、“郵便番号”、“アドしス”、“アイテムコ一ド”以及“意見”被返回为在源英语原稿中描述的“ordersheet”、“name”、“e-mailaddress”、“phonenumber”、“zipcode”、“address”、“itemcode”以及“remarks”。另外,由用户添加的“富士太郎”、“fuji.taro@fujixerox.co.jp”、“123-4567-8910”、“123-4567”、“日本国日本県日本村1-2-3”、“abcdef”以及“日本特别仕様にして下さい。”分别被翻译成“fujitarou”、“fuji.taro@fujixerox.co.jp”、“123-4567-8910”、“123-4567”、“"japanjapanprefecturejapanvillage1-2-3”、“abcdef”以及“makeajapanesespecialseries.”。

如果在那时执行了从日语到英语的简单再翻译,则全部文本经过再翻译。因此,源原稿中的文本不总是如图4d中例示的那样返回为源英语文本。即,当执行从英语经由日语到英语的两个翻译操作时,一些文本可能不被返回为它们的源英语文本。具体地,“注文書”(订货单)、“名前”(名称)、“電子メ一ルアドレス”(电子邮件地址)等不总是被翻译成源原稿中描述的“ordersheet”、“name”、“e-mailaddress”等。在这种情况下,当从发送源发送的翻译前的原稿中的文本的含义与使用再翻译语言的原稿中的文本的含义不同时或在翻译准确度低时,文本可能丢失它的源含义。在这种情况下,发送源在理解返回的再翻译后的原稿方面有困难。

关于云服务器50的描述

在示例性实施方式中,为了致力于抑制该问题的出现,云服务器50具有下面描述的构造。

图5是例示了云服务器50的示例性功能构造的框图。在图5中,选择并例示了在为云服务器50设置的各种功能之中且与示例性实施方式有关的功能。

如图5所例示,云服务器50包括数据获取单元501,该数据获取单元501获取原稿的原稿数据;确定单元502,该确定单元502参照作为翻译历史的历史信息,并且确定对应于所获得的原稿的数据是否存在;布局分析单元503,该布局分析单元分析原稿的布局;翻译单元504,该翻译单元504翻译原文,以获得译文;存储器505,该存储器505用于存储翻译词典和历史信息;历史创建单元506,该历史创建单元506创建历史信息;提取单元507,该提取单元507提取预定文本;组合单元508,该组合单元508将翻译结果彼此组合;以及数据输出单元509,该数据输出单元509输出翻译后的原稿数据。

数据获取单元501从图像形成设备30获取原稿的原稿数据。下面将在数据获取单元501获取图4a所描述的以英语记载的原稿的原稿数据的假定下进行描述。

确定单元502确定与所获取的原稿对应的数据是否存在于下面描述的历史信息中。在关于与原稿对应的数据是否存在于历史信息中的确定中,例如,确定单元502确定所获取的原稿是否包含指示历史信息的快速响应(qr)码(注册商标)。

布局分析单元503分析原稿的布局,并且提取区域。下面将描述布局分析单元503分析布局的方法。

翻译单元504将原稿的内容翻译成不同的语言。翻译单元504使用存储器505中所存储的翻译词典来翻译以源语言记载的原文,从而获得以翻译语言记载的译文。在这种情况下,翻译单元504将英语翻译成日语,并且执行翻译以获得图4b中描述的以日语记载的文本。

当翻译单元504将原稿的内容从第一语言翻译成第二语言时,历史创建单元506创建历史信息,该历史信息包括第一语言的原文与第二语言的译文之间的对应性的翻译结果。在这种情况下,第一语言是英语,并且第二语言是日语。在图4a和图4b例示的示例中,“ordersheet”与“注文書”、“name”与“名前”、“e-mailaddress”与“電子メ一ルアドレス”、“phonenumber”与“電話番号”、“zipcode”与“郵便番号”、“address”与“アドレス”、“itemcode”与“アイテムコ一ド”以及“remarks”与“意見”之间的联系是以英语记载的原文与以日语记载的译文之间的对应性。该历史信息包括该对应性。

当翻译单元504将原稿的内容从第二语言翻译成另一种语言时(如果以第二语言记载的原稿的内容存在于历史信息中),提取单元507提取不存在于历史信息中的原稿内容。

将通过使用图4c中的示例来进行描述。“注文書”、“名前”、“電子メ一ルアドレス”、“電話番号”、“郵便番号”、“アドレス”、“アイテムコ一ド”以及“意見”的文本存在于历史信息中,作为使用作为第二语言的日语记载的原稿的内容。相反,由用户添加的“富土太郎”、“fuji.taro@fujixerox.co.jp”、“123-4567-8910”、“123-4567”、“日本国日本県日本村1-2-3”、“abcdef”以及“日本特别仕様にして下さい”的文本不存在于历史信息中。因此,提取单元507提取由用户添加的、诸如“富士太郎”和“fuji.taro@fujixerox.co.jp”的文本。即,不存在于历史信息中的内容对应于由用户添加在原稿上的项目。提取单元507基于要翻译的文本的位置提取不存在于历史信息中的内容,作为差异,该位置借助由布局分析单元503执行的分析来获得。下面将描述细节。

组合单元508将翻译结果与替换结果组合。翻译结果通过由翻译单元504将不存在于历史信息中的内容从第二语言翻译成不同语言来获得。替换结果通过基于历史信息用使用不同语言的内容替换存在于历史信息中的第二语言中的内容来获得。

在这种情况下,通过由翻译单元504将不存在于历史信息中的内容从第二语言(在这种情况下为日语)翻译成不同语言(在这种情况下为英语)获得的翻译结果是图4d中例示的“fujitarou”、“fuji.taro@fujixerox.co.jp”、“123-4567-8910”、“123-4567”、“japanjapanprefecturejapanvillage1-2-3”、“abcdef”以及“makeajapanesespecialseries.”。通过基于历史信息用以不同语言(在这种情况下为英语)记载的内容替换存在于历史信息中的以第二语言记载的内容获得的替换结果为“ordersheet”、“name”、“e-mailaddress”、“phonenumber”、“zipcode”、“address”、“itemcode”以及“remarks”。即,翻译结果借助从日语文本到英语文本的翻译来获得,而替换结果在没有翻译的情况下获得,并且源英语文本基于历史信息来恢复。即,源原稿中的文本不经过从英语经由日语到英语的两个翻译操作,而是基于历史信息来恢复。因此,获得图4d中例示的以英语记载的原稿。

在示例性实施方式中,分析原稿的布局的布局分析单元503被设置为分析原稿的布局。因此,翻译单元504和组合单元508可以在保持借助由布局分析单元503执行的分析获得的布局的同时排列翻译结果。因此,可以在不打乱原稿的布局的情况下获得翻译结果。

数据输出单元509向图像形成设备30输出翻译后的原稿的数据和再翻译后的原稿的数据,作为原稿数据。

关于翻译系统1的操作的描述

将描述在翻译系统1中执行的操作。

图6是描述了在翻译系统1中执行的操作的流程图。

首先,用户向云服务器50上传对其要执行翻译的原稿(翻译前的原稿)的原稿数据(步骤101)。

当在图像形成设备30上执行该操作时,用户通过使用图像读取单元36扫描原稿,并且获得原稿的图像数据。原稿的图像数据被转换成格式为pdf格式等的原稿数据,并且向云服务器50发送产生的原稿数据。假定此时发送的原稿数据例如是在图4a中例示的翻译前的原稿的原稿数据。

云服务器50的数据获取单元501获取所发送的原稿数据,作为原稿的原稿数据(步骤102)。

然后,确定单元502确定由数据获取单元501获取的原稿数据是否存在于历史信息中(步骤103)。在关于所获取的原稿数据是否存在于历史信息中的确定中,确定单元502确定该原稿是否包含指示历史信息的qr码。例如,图4a所例示的原稿不包含qr码。因此,确定单元502确定所获取的原稿数据是不存在于历史信息中的新数据。

如果数据获取单元501所获取的原稿数据是新数据且如果确定单元502确定原稿数据不存在于历史信息中(步骤103中为否),则布局分析单元503分析原稿的布局(步骤104)。

图7是例示了通过布局分析单元503分析原稿的布局获得的结果的图。

如图7例示,布局分析单元503对于文本存在于原稿中的部分设置矩形区域。在图7所例示的示例中,对于“ordersheet”、“name”、“e-mailaddress”、“phonenumber”、“zipcode”、“address”、“itemcode”以及“remarks”分别设置矩形区域s1至s8。布局分析单元503针对各矩形区域s1至s8创建区域信息。各区域信息例如包括指示矩形区域的位置的信息、矩形区域中所包含的文本以及矩形区域中所包含的文本的语言。指示矩形区域的位置的信息例如包括矩形区域的起点(矩形区域的左上位置的坐标)和矩形区域的终点(矩形区域的右下位置的坐标)。除此之外,还可以包括页码等。矩形区域中所包含的文本是上面描述的文本数据,诸如“ordersheet”、“name”或“e-mailaddress”。矩形区域中所包含的文本的语言在这种情况下是英语。除此之外,还可以包括关于翻译要执行到的语言(在这种情况下为日语)的信息。

返回到图6,翻译单元504使用存储器505中所存储的翻译词典,以将原稿的内容从英语翻译成日语(步骤105)。

在这种情况下,区域信息中所包括的“ordersheet”、“name”、“e-mailaddress”、“phonenumber”、“zipcode”、“address”、“itemcode”以及“remarks”分别被翻译成“注文書”、“名前”、“電子メ一ルアドレス”、“電話番号”、“郵便番号”、“アドレス”、“スイテムコ一ド”以及“意見”。

历史创建单元506创建历史信息(步骤106)。历史信息包括以英语记载的原文与以日语记载的译文之间的对应性。

图8是例示了由历史创建单元506创建的示例性历史信息的图。

图8中例示的历史信息包括历史id、原稿id、源语言、翻译语言以及翻译结果。例示了已经存储历史id是10121和10122的历史信息和该次已经添加历史id是10123的历史信息的示例。

原稿id是联系信息。当参照原稿id是“3”的原稿数据时,可以获得图7中所述的区域信息和翻译前的原稿的图像信息。

翻译结果也是联系信息。当参照翻译结果是“r-3”的数据时,可以获得“ordersheet”与“注文書”、“name”与“名前”、“e-mailaddress”与“電子メ一ルアドレス”、“phonenumber”与“電話番号”、“zipcode”与“郵便番号”、“address”与“アドレス”、“itemcode”与“ァィテムコ一ド”以及“remarks”与“意見”的上述对应性。另外,可以获得翻译后的原稿的图像信息。即,历史信息包括以英语记载的原文与以日语记载的译文之间的对应性。

返回到图6,使用存储器505来存储历史信息(步骤107)。

数据输出单元509向图像形成设备30输出翻译后的以日语记载的原稿的原稿数据(步骤108)。此时,数据输出单元509将历史id(在这种情况下为10123)作为qr码嵌入原稿数据中。因此,所得到的原稿是图4b中例示的翻译后的原稿,并且用户可以获得翻译后的原稿。

然后,用户向所接收的翻译后的原稿添加用于必要项目的信息。因此,获得如图4c中例示的添加后的原稿。

当用户再次上传添加后的原稿以向发送了翻译前的原稿的发送源返回原稿时,处理返回到图6中的流程图中的步骤101。然而,在步骤101中以及在步骤102后的步骤103中,因为原稿包含指示历史信息的qr码,所以确定单元502确定所获得原稿数据存在于历史信息中(步骤103中为是)。在这种情况下,布局分析单元503再次分析原稿的布局(步骤109)。

图9a是例示了通过布局分析单元503再次分析原稿的布局获得的结果的图。

类似于图7中的情况,布局分析单元503对于文本存在于原稿中的部分设置矩形区域。因此,布局分析单元503首先对于与图7中例示的矩形区域s1至s8相同的部分设置矩形区域。在图9a中例示的示例中,布局分析单元503对于“注文書”、“名前”、“電子メ一ルアドレス”、“電話番号”、“郵便番号”、“アドレス”、“ァィテムコ一ド”以及“意見”设置矩形区域t1至t8。进一步地,布局分析单元503对于用户已经向原稿添加信息的部分设置矩形区域t9至t15。即,对于“富士太郎”、“fuji.taro@fujixerox.co.jp”、“123-4567-8910”、“123-4567”、“日本国日本県日本村1-2-3”、“abcdef”以及“日本特别仕様にして下ちい”设置矩形区域t9至t15。然后,布局分析单元503对于矩形区域t1至t15创建区域信息。区域信息类似于图7中描述的区域信息。

再次返回到图6,提取单元507基于区域信息检测图4b中例示的翻译后的原稿与图4c中例示的添加后的原稿之间矩形区域的差异(步骤110)。差异通过将从历史信息获得的翻译之后的原稿的图像与添加后的原稿的图像进行比较来获得。

图9b是例示了由提取单元507检测的差异的图。

在这种情况下,矩形区域t9至t15被检测为差异。换句话说,当以第二语言(日语)记载的原稿的内容存在于历史信息中时,提取单元507提取不存在于历史信息中的原稿内容。

提取单元507确定差异是否存在(步骤111)。此时,提取单元507确定没有差异存在(步骤111中为否)的情况为用户尚未向翻译后的原稿添加信息的情况。在这种情况下,处理进行到步骤114。

相反,提取单元507确定差异存在(步骤111中为是)的情况为用户已经向翻译后的原稿添加信息从而获得图4c中例示的原稿的情况。在这种情况下,历史创建单元506创建针对差异的历史信息(步骤112)。历史信息包括以日语记载的原文与以英语记载的译文之间的对应性。

图10是例示了由历史创建单元506创建的针对差异的示例性历史信息的图。

所例示的历史信息除了包括图8中例示的历史id、原稿id、源语言、翻译语言以及翻译结果之外,还包括父历史。例示了添加历史id是10124的数据的示例。作为联系信息的原稿id是“4”。当参照原稿id时,可以获得用于矩形区域t9至t15的区域信息。另外,可以获得添加后的原稿的图像信息。作为父历史,描述了“10123”。其示出了历史id为10124的原稿是通过向历史id为10123的原稿添加由该原稿id指示的差异获得的原稿。

翻译单元504通过使用在存储器505中存储的翻译词典来将被检测为差异的矩形区域t9至t15中的文本从日语翻译成英语(步骤113)。

具体地,矩形区域t9至t15中所包含的“富士太郎”、“fuji.taro@fujixerox.co.jp”、“123-4567-8910”、“123-4567”、“日本国日本県日本村1-2-3”、“abcdef”以及“日本特别仕様にして下さい”分别被翻译成“fujitarou”、“fuji.taro@fujixerox.co.jp”、“123-4567-8910”、“123-4567”、“japanjapanprefecturejapanvillage1-2-3”、“abcdef”以及“makeajapanesespecialseries.”。

组合单元508将翻译结果与替换结果组合(步骤114)。翻译结果通过由翻译单元504将不存在于历史信息中的内容从第二语言(在这种情况下为日语)翻译成不同的语言(在这种情况下为作为第一语言的英语)来获得。替换结果通过用基于历史信息从第二语言(在这种情况下为日语)到不同的语言(在这种情况下为作为第一语言的英语)替换存在于历史信息中的内容来获得。翻译结果对应于通过将矩形区域t9至t15中所包含的“富士太郎”、“fuji.taro@fujixerox.co.jp”等翻译成“fujitarou”、“fuji.taro@fujixerox.co.jp”等获得的结果。替换结果对应于通过用“ordersheet”、“name”等替换矩形区域t1至t8中所包含的“注文書”、“名前”等获得的结果。

如果确定结果在步骤111中是否(即,如果用户尚未向翻译后的原稿添加信息),则仅执行用“ordersheet”、“name”等替换矩形区域t1至t8中所包含的“注文書”、“名前”等的第二提到的处理。即,恢复图4a中例示的翻译前的原稿。

历史创建单元506将该翻译结果添加到步骤112中创建的历史信息(步骤115)。

图11是例示了在历史创建单元506添加翻译结果后获得的示例性历史信息的图。

与图10中例示的历史信息比较,将数据r-4作为翻译结果添加到图11中例示的历史信息中。当参照翻译结果r-4时,获得上述的“富士太郎”与“fujitarou”、“fuji.taro@fujixerox.co.jp”与“fuji.taro@fujixerox.co.jp”、“123-4567-8910”与“123-4567-8910”、“日本国日本県日本村1-2-3”与“japanjapanprefecturejapanvillage1-2-3”、“abcdef”与“abcdef”以及“日本特别仕様にして下さい”与“makeajapanesespecialseries.”之间的对应性。另外,获得由组合单元508创建的组合之后的原稿的图像。

然后,使用存储器505来存储已经被添加了翻译结果的历史信息(步骤116)。

数据输出单元509向图像形成设备30输出翻译后的以英语记载的原稿的原稿数据(步骤108)。此时,数据输出单元509将历史id(在这种情况下为10124)作为qr码嵌入要输出的原稿数据中。结果,获得图4d中例示的再翻译后的原稿,并且用户可以获得再翻译后的原稿。

上述示例性实施方式可以应用于组合单元508将除了英语之外的语言用作再翻译被执行到的语言的情况。例如,假定再翻译被执行到的语言是作为第三语言的法语。在这种情况下,组合单元508将翻译结果与替换结果组合。翻译结果通过由翻译单元504将不存在于历史信息中的内容从第二语言(在这种情况下为日语)翻译成第三语言(在这种情况下为法语)来获得。替换结果通过基于历史信息将存在于历史信息中的内容从第一语言(在这种情况下为英语)翻译成第三语言(在这种情况下为法语)并用结果替换内容来获得。即,翻译结果通过将日语文本翻译成法语文本来获得,而替换结果通过基于历史信息将源英语文本翻译成法语文本来获得。即,翻译前的源原稿中的文本经过从英语到法语的单个翻译操作,不经过从英语经由日语到法语的两个翻译操作。因此,源英语文本的含义与翻译后的法语文本的含义之间的差异几乎不出现。

在上述示例性实施方式中,在关于所获得的原稿数据是否存在于历史信息中的确定中,确定单元502确定该原稿是否包含指示历史信息的qr码。这不是限制性的。可以使用条形码等而不是qr码。

另选地,诸如qr码和条形码的识别信息不是限制性的。例如,当原稿数据是结构化原稿时,可以嵌入历史信息作为数据。另选地,历史信息可以被设置为原稿数据的文件特性。进一步地,历史信息的存在可以从文本的布局的相似性来确定。

在上述示例中,云服务器50连接到网络70,并且提供云服务。另选地,云服务器50可以连接到网络90,并且可以用作翻译服务器。即,不特别限制连接到云服务器50的网络。进一步地,云服务器50的功能可以由图像形成设备30来提供,并且图像形成设备30可以单独执行一系列处理。在这种情况下,图像形成设备30充当翻译设备。

关于程序的描述

由示例性实施方式中的云服务器50执行的处理例如通过cpu11将hdd13等中所存储的各种程序加载到主存储器12并执行程序来执行。

由云服务器50执行的处理可以被认为是用于实现以下功能的程序:将原稿的内容翻译成不同的语言;当将原稿的内容从第一语言翻译成第二语言时,创建包括以第一语言的原文与以第二语言的译文之间的对应性的历史数据;当要将原稿的内容从第二语言翻译成另一种语言时(如果以第二语言记载的原稿的内容存在于历史信息中),提取不存在于历史信息中的内容;以及将翻译结果与替换结果组合,翻译结果通过翻译不存在于历史信息中的内容来获得,翻译从第二语言到另一种语言来执行,替换结果通过替换存在于历史信息中的内容来获得,替换基于历史信息从第二语言到另一种语言来执行。

用于实现示例性实施方式的程序不仅可以借助通信单元来设置,而且可以借助存储程序的、诸如光盘只读存储器(cd-rom)的记录介质来提供。

已经为了例示和描述的目的而提供了本发明的示例性实施方式的前面描述。不旨在穷尽或将本发明限于所公开的精确形式。明显地,许多修改例和变型例对于本领域技术人员将是明显的。选择并描述实施方式以最好地说明本发明的原理及其实际应用,从而使本领域其他普通技术人员能够理解本发明的各种实施方式,以及适合于所设想的具体用途的各种变型。预期的是本发明的范围由以下权利要求及其等同物来限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1