翻译质量量化设备和方法

文档序号:6568689阅读:128来源:国知局
专利名称:翻译质量量化设备和方法
技术领域
本发明涉及语言翻译系统,更具体地讲涉及用于增强译文翻译和译审 的客观性的新型系统和方法。2.背景技术随着自身的发展壮大和在全球市场中的扩张,公司有必要对其提供的 产品、服务和支持文档进行全球化。这类产品、服务等均须专门定制以满 足目标市场的具体文化、语言、法律和技术要求。要想高效,就必须以及 时、经济、准确且可重复的方式提供这种定制。在将一种产品推向新市场的准备过程中,相当 一部分的时间和费用都 花费在翻译用户手册、宣传资料等方面。所用时间和费用的多少取决于当 前生成优质译文所需的大量人力。例如目前,即便"完成"了翻译,也只 有在训练有素的译审人员阅读和分析已翻译文档的显著部分后,才能确定译文质量的具体水平。而译审人员难以确定在某 一 特定文档中他或她必须阅读哪些部分以及阅读这些部分的多少内容才能准确评估译文质量。因此,译审人员通常会 审阅和分析更多而非更少的材料。通常,译审人员将审阅和分析整个文 档。此外,即使一名译审人员凭借经验得出合理的样本大小和抽样频率, 该译审人员可能仍然无法得到可重复的结果。再者,某一译审人员采用的 样本大小和抽样频率可能与另一名译审人员所用的大相径庭。因此,译审 流程中可能存在明显的不一致性。上述及其它的不一致性和当前使用的费时方法增加了成本并降低了所 产生的译文的质量。因此需要一种可为所有类型的文档和材料的译文提供 客观的、自动化的质量控制或质量保证的设备和方法。另外还需要一种将 这种客观的质量控制集成到监控翻译流程所有部分或其大部分的翻译系统 中的设备和方法。发明内容鉴于上述情况,根据本文对本发明的具体及简要描述,本发明的一个 实施例中所公开的方法和设备包括由不同组件组成的翻译系统,这些组件 包括翻译辅助软件、质量量化软件和资源管理软件。翻译团队可使用翻译 辅助软件所提供的工具和功能以有效且可预测的方式将源文档翻译成目标 文档。译审团队可使用质量量化软件所提供的工具和功能来有效且客观地确 定翻译团队所生成的译文质量。资源管理软件可在质量量化软件收集到的 数据的范围内协助管理人员识别模式并提供框架,通过此框架传达和执行 对整个系统或对其运行的更改和调整。在选定的实施例中,选定的信息、程序、电子文档等的库或数据库可 被各种软件程序使用并包括在根据本发明的翻译系统中。例如,翻译辅助 软件可从数据库中检索源(未翻译的)文档和将目标(已翻译的)文档保 存到数据库中。同样,质量量化软件从数据库中检索源文档和目标文档和 将质量数据保存到数据库中。另外,资源管理软件可从数据库中检索文档 和质量数据,并通过数据库传达指令、项目、更改和调整。根据本发明,翻译系统的运行首先是从由译者组成的翻译团队中选择 译者。译者可使用翻译辅助软件来检索和翻译未翻译的源文档,以及存储 所得的已翻译的目标文档。然后,从译审团队中选择译审人员。译审人员 可使用质量量化软件来检索目标文档和对应的源文档,以及对所示译文进 行客观评估。在选定的实施例中,该评估可包括应用预定的评价标准。如 果译文通过具有阈值分数的评估,则目标文档即可定稿。作为另外一种选 择,如果译文未达到至少阈值分数,则可能要接受完整编辑、其它评估 等。通过对先前已确定的评估进行存储,可继续运行该系统。 一旦存储, 即可结合先前采集的数据并分析评估以识别模式,例如文档类型、内容类 型、译者等方面的模式。模式一经识别,就可改进资源分配。适当的改进 可包括对特定译者的单独反馈、对整个翻译团队的总体反馈、调整分配给 特定译者的译文数量、大小或类型、调整给定的特定译者的报酬等。根据本发明,可以采用任何适当的方式将运行翻译系统的各个步骤或 任务在翻译辅助软件、质量量化软件和资源管理软件中划分。例如,在选 定的实施例中,翻译辅助软件可协助译者检索和翻译未翻译文档,以及将 所得的已翻译目标文档存储到数据库中。质量量化软件可协助译审人员检 索目标文档和对应的源文档、客观地评估所示译文、以及将评估结果存储 到数据库中。资源管理软件可协助管理选择译者、选择译审人员、识别模 式和改进资源分配。


通过结合附图阅读以下说明和所附权利要求,本发明的上述特征将变 得显而易见。应当理解,这些附图只图示了本发明的典型实施例,因此不 可认为是对其范围的限制。将使用下列附图来描述本发明的其它特异性和 细节图1为示意性框图,其图示说明用于执行根据本发明的翻译系统的 计算机系统;图2为示意性框图,其提供了对根据本发明的翻译系统的高度概苋;图3为图示说明运行图2所示翻译系统的可行方法的框图;图4为能够实施根据本发明的翻译系统的网络的一个实施例的示意图;图5为图示说明根据本发明的翻译辅助软件的一个实施例的示意性 框图,该翻译辅助软件包括各种可能模块和用于存储该翻译辅助软件所用 信息和记录的相应的数据库;图6为图示说明根据本发明的质量量化软件的一个实施例的示意性 框图,该质量量化软件包括各种可能模块(例如,通常"可执行程序") 和用于存储该质量量化软件所用信息和记录的相应的数据库;图7为图示说明用于结合到根据本发明的质量量化软件内的评价标 准模块的一个实施例的示意性框图;图8为图示说明客观性和人工干预之间的逆相关性的坐标图;图9为图示说明人工干预和自动化控制之间的逆相关性的坐标图;图10为图示说明根据本发明的翻译评估中可能包含的各种自动化要 素和人为要素的框图;图11为图示说明根据本发明的翻译评估中可能施加在人为要素上的 各种控制的框图;图12为图示说明用于结合到根据本发明的质量量化软件内的错误报 告模块的一个实施例的示意性框图;图13为图示说明用于结合到质量量化软件内的输出模块的一个实施 例的示意性框图;图14为图示说明用于计算根据本发明的译文总体质量指数的一种方 法的示意性框图;以及图15为图示说明根据本发明,包括各种可能模块的资源管理软件的 一个实施例的示意性框图。
具体实施方式
易于理解的是,本发明的组件,如本文一般性描述和在附图中所示, 可按许多不同的构造进行布置和设计。因此,本发明的系统和方法的实施 例的以下详述(如附图所示)并非旨在限制本发明所要求保护的范围,而 只是本发明的各种实施例的代表。参见附图可更好地理解本发明的图示实 施例,其中类似部件由类似的数字标示。参见图1,用于执行本发明的设备10或系统10可包括一个或多个 节点12 (例如客户端12、计算机12)。这些节点12可包括处理器14 或CPU 14。 CPU 14可以可操作地连接到存储装置16。存储装置16可 包括一种或多种装置,诸如硬盘18或其它永久性存储装置18、只读存 储器20(R0M 20)和随机存取(且通常为易失性的)存储器22 (RAM 22 或可橾作存储器22)。这些組件14、 16、 18、 20、 22可共同存在于单 个节点12中,或者分别存在于多个远程节点12中。在选定的实施例中,设备10可包括用于接收来自用户或另一个装置 的输入装置24。输入装置24可包括一种或多种物理实施例。例如,可 使用键盘26与用户进行交互,也可使用鼠标28或手写板30。可使用 触摸屏32、电话34或只是使用远程通信线路34与其它设备、用户等进行通信。同样,可使用扫描仪36来接收图形输入,这些图形输入可能会或不会被转换为其它格式。硬盘38或其它存储装置38可用作输入装 置,可驻留在网络40连接的具体节点12中或其它节点12中。在选定 的实施例中,节点12内可具有网卡42 (接口卡)或端口 44,以利于通 过如网络40进行通信。在某些实施例中,节点12内可具有输出装置46,或者可在设备10 内访问输出装置。输出装置46可包括一个或多个物理硬件设备。例如, 一般来讲,端口 44可用于接收发送到节点12中的输入和发送自节点 12的输出。此外,监视器48可向用户提供输出以便在流程执行期间进 行反馈,或协助处理器14和用户之间的双向交流。也可使用打印机 50、硬盘52或其它设备作为输出装置46来输出信息。在内部, 一条总线54或多条总线54可使处理器14、存储装置 16、输入装置24、输出装置46、网卡42和端口 44可橾作地互连。总 线54可被视为数据载体。因此,总线54可体现为多种构造。同样,通 过可见光、红外线和射频实现适合总线54和网络40的有线、光纤、无 线电磁通信。一般来讲,节点12连接的网络40可通过路由器56继而连接另一 个网络58。 一般来讲,节点12可能位于同一网络40、毗连网络(即, 网络40和相邻网络58),或被多个路由器56和多个网络分隔,作为 网间网上的独立节点12。独立节点12可具有不同的通信能力。在某些 实施例中,任何节点12都具备最低限度的逻辑能力。例如,每个节点 12可包含处理器12,并或多或少地包含上文所述的其它组件。网络40可包括一个或多个服务器60。服务器60可为网络40中 其它节点12对任何实际数量的文件、数据库等进行管理、存储、通信、 传送、访问、更新等橾作。通常,网络40上的所有节点12都可访问服 务器60。除此之外,单个服务器60或多个服务器60还可执行其它特 殊功能,包括通信、应用程序、目录服务等。一般来讲,节点12可能需要通过网络40与服务器60、路由器56 或其它节点12进行通信。同样,节点12可能需要通过网间连接中的另 一个相邻的网络58与一些远程节点12进行通信。同样,独立組件彼此之间可能需要交换数据。 一般来讲,任何一对设备之间都可能存在通讯连 接装置。参见图2,根据本发明,设备10可能支持翻译系统62。翻译系统62可能由各种組件组成,所述组件包括翻译辅助软件64、质量量化软件 66和资源管理软件68。这些组件64、 66、 68作为一个或多个程序、库 或软件应用程序,可在一个或多个存储器位置中体现为任何数量的"可通 过处理器执行的逻辑代码段"(即,可执行程序)。例如,在选定的实施例中,单个应用程序可具备针对辅助翻译的某些 功能、针对质量量化的其它功能、以及针对资源管理的其它功能。在其它 实施例中,翻译辅助软件64可由一个应用程序提供,质量量化软件66 可由另一个应用程序提供,而资源管理软件68可由又一个应用程序提 供。同样,所有功能可作为库中的程序提供给另一个应用程序。一般来讲,可由任意数量的节点12上运行的任意数量的应用程序提 供功能,所述功能共同生成翻译系统62或其组件64、 66、 68中的任何 一个。在选定的实施例中,期望提供选定的信息、程序、电子文档等的库 70或数据库70供翻译系统62的其它組件62、 64、 66中的一个或多 个组件访问。例如,翻译辅助软件62可需要位置70,可以从该位置来 检索源(未翻译)文档和在此位置存储目标(已翻译)文档。同样,质量 量化软件66可需要位置70,可以从该位置检索源文档和目标文档和在 此位置存储质量数据。另外,资源管理软件68可需要位置70,可以从 该位置检索已定稿的文档和质量数据,以及通过该位置来分配用于实施的 指令、项目、更改和调整。因此,在选定的实施例中,翻译系统62可包括数据库70,该数据 库可操作地连接到翻译系统62的其它组件64、 66和68。数据库70 可能包含信息、指令、数据、程序、电子文档等的任何集合。在选定的实 施例中,数据库70可驻留在一个或多个节点12的存储装置16中。在 其它实施例中,数据库70可被集中在有限的装置16和节点12中。例 如,在某些实施例中,数据库70可包含存储在单个服务器60或其它计 算机的硬盘18上的信息和文档等。翻译团队72由一个或多个人工译者组成。可将翻译团队72的专业 知识74融入到翻译辅助软件64提供的工具和功能中。翻译辅助软件 64同翻译团队72结合可有效且可预测地将源文档翻译为目标文档。同样,译审团队76由一个或多个人工译审人员組成。可将译审团队 76的专业知识78融入到质量量化软件66提供的工具和功能中。质量 量化软件66同译审团队76结合可有效且客观地确定翻译团队72和翻 译辅助软件64所生成的译文的质量。使用质量量化软件66收集和存储的信息,管理人员80可以更加准 确地确定需要作出何种更改或调整才能提高最终产品的质量。在选定的实 施例中,资源管理软件68可有效地促进将管理人员80的专业知识82 应用到最为关键的问题上。例如,在某些实施例中,资源管理软件68可以在质量量化软件66 所收集的数据的范围内协助管理人员识别模式。另外,资源管理软件68 可提供框架,通过此框架传达和执行对整个系统62或其运行的更改和调 整。参见图3,根据本发明的翻译系统62的运行可从翻译团队72选择 84译者开始。该译者可使用翻译辅助软件64来检索86和翻译88未 翻译的源文档,以及存储90所得的已翻译的目标文档。在选定的实施例 中,该译者可以将源文档和目标文档作为关联的对存储90。在选定的实 施例中,可通过命名规则使所述对相关联。在其它实施例中,可通过在同 一个电子文件中存储90源文档和目标文档来使它们相关联。可从译审团队76选择译审人员92来继续运行系统62。译审人员 可使用质量量化软件66来检索94目标文档和对应的源文档,以及客观 地评估所示译文96。在选定的实施例中,客观地评估96译文可生成译 文对应的分数(即,数值、类別等)。根据此分数,可确定98译文是否 通过某一特定质量阈值。如果译文确实通过阈值分数,则目标文档可定稿 100。作为另外一种选择,如果译文未达到至少阈值分数,则可评估和选 择102其它选项。例如,在选定的实施例中,所有未能满足特定质量阈值的目标文档都 要接受完整编辑104。此编辑104可包括重新翻译有问题的部分、纠正语法错误、改正标点符号错误、更正拼写错误等、或它们的任意組合。作 为另外一种选择,在某些实施例中,对目标文档进行附加抽样106和审阅可能较为有利。抽样106可以更加准确地确定译文质量。例如,它可 以确定第一次评估96是否真正准确地表征译文。它还可以将精力和注意 力集中到严重降低译文质量的具体错误上。一般来讲,可以继续执行任何能提高译文质量、识别造成质量不达标 的错误等的选项108。例如,在选定的实施例中,在完成完整编辑104 后,可再次客观评估96译文以确定分数。因此,可确定98完整编辑 104是否充分修正译文以通过质量阈值。可通过存储110之前已确定的评估来继续运行系统62。存储110 后,即可结合先前采集的数据分析评估以识别112各种模式。例如,分 析可能表明翻译团队72中的具体译者在翻译时会持续犯特定的语法错 误。其它模式可包括译文质量和翻译经验年数之间的相关性、技术背景、 文档内容、词汇、年龄、掌握口语会话能力的年数、源语言或目标语言是 否为母语等。模式一经识别112,就可改进114资源分配。该改进114的效果在很大程度上取决于所识别的模式的性质。例如,如果确定翻译团队72的 具体译者在翻译时会持续出现特定的(即,语法、上下文、内容)错误,则会向其个人提供116单独反馈。这种反馈可以指导译者,使其在以后 的翻译中减少或消除类似错误。其它改进114可包括在向翻译团队72提供的整体培训的重点的改 动118。当不少译者的译文中都存在特定错误时,此项改进尤其有用。例 如,这种整体培训可向翻译团队72提供有关翻译辅助软件64中为解决 特定问题而新增的功能的指导。如果在多个反馈会话后,某一特定译者继续犯特定错误,则可能调整 120对该名译者的选择标准84。例如,可能限制发送给该翻译的文件的 重要性、内容或主题,甚至解雇该译者。作为另外一种选择,可基于可用 的时间、成本和内容等调整分配给该名译者的工作,以便更加适合他或她 的能力并与其输出量相配。在选定的实施例中,可改进114资源分配,以便调整122与具体客户或译者相关的定价或报酬。例如,如果确定某一特定译者的译文一向获 得高质量分数,则可以提高该译者的经济报酬。这样可以提高该名译者的 能力、激发其动力或兼而有之,以使其继续为特定企业服务。因此,企业可以更好地保护其最具效益的人力资本。反之,则可降低112给予任何 生成译文质量持续低于选定质量标准的译者的报酬,更为准确地反映出其 所作工作的真实价值。还可能调整122对翻译选定文档的要价。例如,如果确定某一特定 客户的翻译十分复杂或具有很强的技术性,例行要求进行完整编辑104, 因而为了更准确地反映所涉及的工作,可能会调整122这些译文的要 价。同样,如果客户要求其译文要达到某一特定质量标准,则可能需要准 确确定生成和校验作品质量所必需的额外工作量,并可能会因此调整122 向该客户收取的价格。根据本发明,上述用于运行翻译系统62的各种步骤和任务可以任何 适当的方式在系统62的不同組件64、 66、 68和70中划分。例如,在 选定的实施例中,翻译辅助软件64可以协助译者检索86和翻译88未 翻译文档,以及将所得的已翻译的目标文档存储90在数据库70中。质 量量化软件66可以协助译审人员检索94目标文档和对应的源文档、客 观地评估96所示的已翻译文档,以及将评估结果存储110到数据库70 中。资源管理软件68可以协助管理人员80选择84译者、选择92译 审人员、识別112模式和改进114资源的分配。同样,确定98译文是否通过质量阔值、定稿文档100以及评估和 选择选项102都可以任何适当的方式在系统62的不同组件64、 66、 68 和70中划分。例如,在选定的实施例中,质量量化软件66可负责确定 98译文是否通过质量阈值,而资源管理软件68可负责把准备要发送给 客户的文档100定稿。另外,资源管理软件68可负责评估和选择选项 102,但可指示译审团队76使用质量量化软件66进行完整编辑104或 其它抽样108。参见图4,在选定的实施例中,提供翻译服务的企业可雇用集中在一 起的翻译团队72、译审团队76和管理人员80。在其它实施例中,提供翻译服务的企业可能雇用分布在世界各地的翻译团队72、译审团队76 和管理人员80。根据本发明,系统62既可满足这两种运营方式的需 要,也可满足混用这两种方式的其它运营方式的需要。例如,在选定的实施例中,可通过网络40连接一个或多个服务器 60、译审人员工作站124、译者工作站126和管理者工作站128。 一个 或多个服务器60可支持数据库70。可将一个或多个译审人员工作站 124编程以包括质量量化软件66。可将一个或多个译者工作站126编程 以包括翻译辅助软件64。可将一个或多个管理者工作站128编程以包括 资源管理软件68,以便管理工作项目的分配和跟踪。可以任何适当的方法来调整网络40的规模以满足不同计算机60、 124、 126和128所在区域规定的强制性地域要求。例如,在选定的实施 例中,网络40可包括局域网(LAN)。在其它实施例中,网络40可包括 因特网。在其它实施例中,网络40可包括可操作地连接到因特网的广域 网(WAN)、 VPN或局域网。不同计算机60、 124、 126、 128及其橾作员72、 76、 80之间可以 采用任何适当的方式进行通信。例如,在选定的实施例中, 一个或多个服 务器60可在因特网上构建网站。组成翻译团队72、译审团队76和管 理人员80的个人都配有用户名和密码,有权访问该网站(即数据库 70)中包含的信息。因此,译者可以访问该网站以检索可供翻译的合适的 源文档,译审人员可以访问该网站以检索可供评估的源文档和目标文档对 等。如果需要,此类网站可以支持或提供对于每个个体的议程。议程可以 列出当前分配给特定个体的所有任务。该议程还可链接至用于执行特定任 务所必需的或有用的材料。该网站还可限制个人访问与不相关任务相关的 材料。该网站还可形成用于递送单独反馈116、整体培训118等的递送 机制。在其它实施例中,不同计算机60、 124、 126、 128及其操作员72、 76、 80之间可以通过电子邮件进行通信。例如,管理人员80可通过电 子邮件将任务或项目发送给译者。项目完成后,可通过电子邮件发回给管 理人员80。与译审团队76的译审人员进行通信时,可遵循类似的流程。如果需要,资源管理软件68可在一定程度上自动运行,诸如发送电 子邮件。例如,管理人员80可使用资源管理软件68来准备供翻译的源文 档。然后该软件68可根据某些轮换方案,从翻译团队72中自动选择合 格译者,并通过电子邮件将源文档发送给该名译者。该译者随后作出响 应,接受或拒绝此项目。如果译者接受此项目,资源管理软件68便会按 此记录。相反,如果该名译者拒绝了此项目,则资源管理软件68可根据 轮换方案选择下一位合格的译者,使流程继续进行。在其它实施例中,可采用更常规的通信方法。例如,在一些实施例 中,通过空邮或平邮、电话、传真等进行通信足以满足需要。如果需要, 可使用多种通信形式。例如,管理人员80可通过电话确认译者完成所选 项目的能力和意愿,但使用电子邮件将电子格式的源文档发送给该名译 者。参见图5,根据本发明的翻译辅助软件64可提供任何期望的功能。 一般来讲,可由一个或多个模块体现该功能。例如,在选定的实施例中, 翻译辅助软件64可包括过滤模块130来用于分离内容与格式。例如, 译者可使用翻译辅助软件64从数据库70检索未翻译的文档132或源 文档132。此类文档132可具有两个方面的特征,即内容(包括文字或 文本)和格式(包括字体、行间距、段落间距、页面上的文字位置等)。 因此,过滤模块130可以将内容与格式分离。由此,译者可集中精力翻 译内容,而无需考虑格式。在某些实施例中,翻译辅助软件64可包括分割模块134。分割模块 134可将源文档132的内容分成不同的短句,每个短句代表具体的意 思。因此,译者可逐个短句地翻译源文档132。在选定的实施例中,分割 模块134在很大程度上依赖标点符号来确定如何最为合适地分割源文档 132。在选定的实施例中, 一旦源文档132被分割,分割模块134可复制 源文档132,以形成已翻译文档136或目标文档136。开始时,目标文 档136可能与源文档132完全相同。然而,随着译者的翻译,他或她会 用新的短句(包含原有短句转换为目标语言的翻译)替换目标文档136中的短句。因此,完成翻译后,目标文档136由源文档132逐个短句翻 i奪的i奪文构成。根据本发明,翻译辅助软件64可包括预翻译模块138来利用(即 重新使用、参考)先前已完成、已译审且已批准的译文来提高对新材料的 翻译速度。在选定的实施例中,预翻译模块138会将当前未翻译的目标 文档136的片段或短句与资源对142的集合140进行比较。该集合 140的每个资源对142可包括分別与对应的已完成的目标文档136a、 136b和136n成对的源文档132a、 132b和132n。当预翻译模块136发现当前目标文档136中的短句与资源对142 源文档132a中的短句完全相同时,预翻译模块138可以识别资源对 142的对应目标文档136a中对应的已翻译短句。然后,预翻译模块138 可将当前目标文档136中的这个短句替换为从资源对142中提取的已翻 译短句。这样,可避免重复翻译,可提高翻译流程的效率,以及可增加翻 译的客观性和一致性。在选定的实施例中,根据本发明的翻译辅助软件64可包括编辑模块 144来提供软件64和译者之间的界面。在某些实施例中,编辑模块144 可在与执行翻译辅助软件64的计算机12相对应的监视器48上提供各 种查看窗口。编辑模块144还可支持对一个或多个此类窗口中所含的文 字进行编辑。例如,在一个实施例中,编辑模块144可支持第一个窗口 (其显示 源文档132的选定部分)和第二个窗口 (其显示目标文档136的对应部 分)。这两个窗口可以垂直校准或同步。因此,当译者在第一个窗口中通 过滚动来更改所显示的源文档部分时,编辑模块144可以同步调整第二 个窗口中所显示的目标文档136部分。同样,改变第二个窗口中所显示 的目标文档136部分也会同步改变第一个窗口中所显示的源文档132部 分。编辑模块144可根据需要支持对第一个或第二个窗口中的文字进行 编辑。在某些实施例中,翻译辅助软件64可包括字典模块146以提高翻 译单个字词的速度。在选定的实施例中,字典模块146可将当前未翻译 的目标文档136中的单词与包含各种词对150的字典148进行比较。这样的字典148中的每个词对150都包括源语言的单词152a、 52b和 152n,与目标语言中具有相同含义和用法的单词154a、 154b和154n成 对(或换句话讲,匹配)。当字典模块146发现当前目标文档136中的单词也位于字典148 的词对150中,字典模块146可将该单词更换为其翻译。作为另外一种 选择,字典模块146可提示编辑模块144指出该单词存在可用翻译。例如,当字典模块146通知某一特定单词也位于字典148的词对 150中时,则根据预定规则,编辑模块144可以突出显示(即,更改单 词的颜色、给单词加下划线等)该单词。因此,译者可得知在字典148 中能找到特定单词的翻译。在选定的实施例中,译者可通过单击或其它方式选择突出显示的单词 来查看字典148中所含的翻译。这样可启动新窗口来显示该单词、翻 译、含义、用法样例等。作为另外一种选择,可只是在显示器48的屏幕 上预定显示字典信息的窗口中引入该单词、翻译、含义、用法样例等以便 查看。如果需要,可包含虚拟按钮或其它命令布置,使译者能够将当前的 目标文档136中未翻译的单词换位成其翻译。在某些实施例中,翻译辅助软件64可包括模糊网络模块156。即使 与集合140包含的短句和目标文档136中的短句不同,这样的模块156 也会协助预翻译模块138从资源对142的集合140中查找相关短句。 在选定的实施例中,模糊网络模块156可与编辑模块144协作,以允许 译者修改从集合140或资源对142中检索出来的相似的已翻译短句,然 后并入当前目标文档136中。在一些情况下,译者可能拥有数量可观的源文档和目标文档132、 136,但这些文档不是使用根据本发明的翻译辅助软件64生成的。此类 资源不能立即整合到供未来翻译所用的资源对142的集合140中。因 此,根据本发明的翻译辅助软件64可包括校准模块158。这样的模块 158可与过滤模块130和分割模块134协作来将此类文档132、 136转 换为资源对。例如,翻译辅助软件64中可加载代表相应源文档和目标文档132、 136的电子文件。过滤模块130可将文档132、 136中的内容与格式分离开来。分割模块134可将源文档132和目标文档136分割为片段或 短句。最后,校准模块158可将源文档132中的片段或短句与目标文档 136中适当的片段或短句进行比较并校准。片段可能是单词、分句、句 子、段落或其它方便的界限。在选定的实施例中,校准功能可突出显示这两个文档132、 136中任 何看似不匹配的区域。因此,译者可以对有问题的特定片段进行手动生 成、校准等操作。在其后续步骤中,翻译辅助软件64会丰富资源对142 的集合140和利用各个源文档和目标文档132、 136,而不考虑其来源。在某些实施例中,可期望根据本发明的翻译辅助软件64与其它外部 的或不同类型的软件应用程序配合使用。因此,翻译辅助软件可包含各种 接口模块以利于与这些应用程序的交互。例如,在所选的实施例或情形 中,可能期望包括机器翻译接口 160。这样的接口 160可支持与计算机 系统和编程为生成完整译文的应用程序的双向通信。在一些实施例中,根据本发明的翻译辅助软件64可包含控制管理系 统(CMS)接口 162。此接口 162有利于与控制管理系统之间的交互,以便 分析文本、读取文件、传递统计信息、传递项目说明、传递翻译参数,从 而辅助翻译等。同样,工作流程服务器接口 164可有利于与工作流程服 务器(可能作为资源管理软件68的一部分而包含在内)的交互,控制往 返于翻译团队72各位译者的项目流程。除上述模块和接口外,翻译辅助软件64可根据需要包含其它模块 166。 一般来讲,其它模块166可提供额外的功能以提高翻译辅助软件 64的效率、适应性、易用性等。例如,在选定的实施例中,其它模块 166可包括译者模块。这样的模块可在译者和所得目标文档136之间建 立联系。因此,可在数据库70中用译者模块生成译者记录168,将译文 与其译者联系起来。参见图6,根据本发明的质量量化软件66可提供任何期望的功能。 一般来讲,可由一个或多个模块体现该功能。例如,在选定的实施例中, 质量量化软件66可包含识别模块170来收集和存储可能对质量控制目 的有用的选定的信息。例如,识别模块170可包括标识符172 (指明译 审团队76中审阅译文的译审人员)、标识符174 (指明翻译团队72中生成译文的译者)、标识符176 (指明有争议的具体文档)、有关源语言 的信息178、有关目标语言的信息180、以及其它任何可能有用的或者在 统计上较为重要的信息182。在选定的实施例中,根据本发明的质量量化软件66还可包括评价标 准模块184,限定阈值、抽样步骤等,以便进行质量评估;错误报告模块 186,其有利于收集译文中发现的具体错误的相关信息;以及输出模块 188,其用于将质量量化软件66获得的信息汇编并存储在一个或多个日 志文件190中。在某些实施例中,可为每个已审定译文的文档生成一个 日志文件190。除上述模块外,质量量化软件66可根据需要包括其它模块。 一般来 讲,其它模块可提供额外的功能,以提高质量量化软件64的效率、适应 性、客观性、重复性、易用性等。参见图7,在选定的实施例中,评价标准模块184可支持评价标准 选择器192,其允许译审人员选择在译审流程中应用的具体评价标准。在 某些实施例中,评价标准选择器192可为译审人员提供评价标准库 194,该库列出了可供译审人员选择的各种评价标准。在一个实施例中, 评价标准库194可让用户选择评价标准,这些评价标准基于美国翻译协 会(ATA)196、本地化行业标准組织(LISA) 198、以及诸如美国机动工程师 协会(SAE)200的技术性协会所颁布的标准,或基于其它一些组织202所 颁布的标准。另外,在根据本发明的翻译评估中,评价标准库194可支 持创建和选择自定义的评价标准204,这种评价标准是为具体项目而开发 的或者基于积累的广博经验。在选定的实施例中,可由客户或管理人员80规定所要施行的评价标 准。因此,评价标准的选择可能不在译审人员自行决断的权限之内。在一些实施例中,评价标准模块184可支持错误鉴定器206,其限 定翻译错误的各种类别或大小。在选定的实施例中,译审人员可使用错误 鉴定器206来限定错误类别或大小。作为另外一种选择,从评价标准库 194中选择的评价标准可限定类別或大小。在选定的实施例中,错误鉴定器206可定义多种(例如三种)错误 等级或大小,即,轻微208、严重210和关键212。错误鉴定器206也可分配与每个错误等级相关的分数。例如,轻微错误可分配一分、严重错 误可分配五分,关键错误可分配为确保译文无法达到相应的质量阈值所需 要的分值。评价标准模块184也可支持错误标识符214和阈值选择器216。错 误标识符214可详细说明从译文中搜索出的各种类型的错误。阈值选择 器216可为译文限定通过分数的构成。在选定的实施例中,译审人员可 以逐个项目、逐个客户等为基础限定由错误标识符214详细说明的具体 错误以及阈值选择器216限定的阈值。作为另外一种选择,从评价标准 库194中选择的评价标准可限定阈值并针对从译文中搜索出的各种类型 的错误进行详细说明。在某些实施例中,对译文的审阅可包括详细审阅从译文抽取的一个或 多个样本。译文的样本可视为样本段。因此,评价标准模块184可包括 样本段定义器218和样本段选择器220。样本段定义器218可限定样本 段或样本的范围。样本段选择器220可限定选择样本段或样本的方式。 在选定的实施例中,译审人员可以逐个项目或逐个客户等为基础限定样本 段定义器218和样本段选择器220所使用的方法。作为另外一种选择, 从评价标准库194中选择的评价标准可详细说明样本段定义器218和样 本段选择器220所使用的方法。样本段定义器218可以任何统计学上可接受的方式来限定样本段或 样本的范围。在选定的实施例中,可明确地222规定样本段的范围。例 如,样本段定义器218可规定样本段的单词序列中所含单词的具体数 量。作为另外一种选择,样本段的范围可由公式224限定。例如,样本 段定义器218可规定样本段单词序列的所含单词量等于具体的数值和占 总字数的百分比这二者中的较大值。在选定的实施例中,限定样本段的方法可因项目而异。例如,可基于 翻译的主题226来限定样本段。因此,可对包含复杂的技术性术语的译 文进行更加深入细致的审阅。同样,也可基于被翻译文档所属的具体客户 228来限定样本段。例如,客户可能明确要求样本段的具体大小。另外, 也可基于译者230来限定样本段。例如,新译者和有经验的译者的样本 段大小可以不同。样本段选择器220可以任何统计学上可接受的方式限定样本段或样 本的选择方式。与样本段定义器218相似,通常可通过样本段选择器 220明确地232或由公式234选择样本段。另外,可随机236选择样 本段。在一些实施例中,随机选择236可基于计数238 (例如,单词数 目、句子数目、段落数目、页数等)。作为另外一种选择,随机选择236 可基于其它一些240标准。在某些实施例中,样本段选择器220对样本段的选择可被触发 242。也就是说,发生在文档中的一些事件可触发对样本段的选择。适当 的触发可包括文档中的新标题244、文档中单词使用246的变化、从文 档提取的各种计数248、字典条目(即,字典148和文档中都有的单 词)密度或百分比的变化250、已预翻译的短句(即,位于资源对142 中的短句)的密度或百分比的变化252、转换254成新文件(例如,电 子文档文件)等。除了上文所列的那些以外,样本段选择也可使用其它触发256。 一般 来讲,任何指示文档主题变化的触发都是可用的。这些触发突出显示文档 中可能要检验不同翻译技能并因此需要仔细推敲的区域。根据本发明,样本段选择器220可使用明确的232、公式的234、 随机的236或触发的242方法中的任意组合258来限定样本段或样本 的选择方式。例如,在一些实施例中,可根据明确的232命令来选择第 一个样本段,而通过公式234、随机236或通过触发242来选择后续的 样本段。在选定的实施例中,选择样本段的方法可因项目而异。例如,可基于 译文的主题260、被翻译文档所属的具体客户262或译者264来选择样 本段。因此,可对包含复杂的技术性术语的译文进行深入细致的审阅,客 户可能具体要求样本段选择的特定方法,针对新译者的样本段选择方法可 与针对有经验的译者而使用的选择方法不同,等等。参见图8,客观性可定义为不受个人情感、偏见或臆測的曲解而展开 深入且准确的分析的能力。要生成一致的和可重复的译文质量分析或评 估,必须具备一定程度的客观性。当由多位译审人员进行评估时,这一点 尤为重要。一般来讲,在量化或评估译文质量时,评估的客观性与人工干预成反 比。因此,增加人工干预通常会降低客观性。相反,限制人工干预可提高 客观性。参见图9,减少人工干预进而提高客观性的一种方法是将尽可能多的 评估步骤和决定自动化。在自动化中,可由机器(例如,计算机)负责原 本由人作出的决定,机器的能力在于它们能精确遵循预定路径和指示。机 器能与其所遵循的路径或指示一样客观。因此,可将人力集中到完善路径 和指示上,因为路径和指示在统计意义上的显著性和客观性方面一旦得到 充分的改进,就能由机器进行精确且可重复的执行。参见图10,根据本发明,翻译评估266可分为自动化要素268和 人工要素270。翻译评估266的自动化要素268可包括对译审人员的选 择272。例如,计算机可针对特定译文从合格译审人员列表中随机选择译 审人员。其它自动化要素266可包括评价标准的选择274。例如,可决 定使用特定评价标准来对特定客户的所有译文进行评估。在选定的实施例 中,也可根据需要对其它要素276或任务276进行自动化。由于选择了 274特定评价标准,需要译审人员自行决定的范围大大 缩小。例如,选择274评价标准可自动确定样本段的限定方式、样本段 的选择方式、用于评估样本段错误的各种错误类别或类型、各种错误的分 值、阈值"通过分数"等。此外,在选定的实施例中,质量量化软件66可实施这些要素272、 274。例如,评价标准可规定在样本段定义和样本段选择中使用的方法, 而软件66可据此限定样本段的大小并选择样本段。因此,软件66可只 向译审人员提供他或她要审阅的样本段。这样,通过充分限制在定义和选 择样本段方面的人工干预,极大地提高了评估266的客观性。译文评估266中的人工要素270可包括确定含义278。确定含义可 包括判断目标文档的特定部分是否准确表达源文档的意思。其它人工要素 270可包括应用语法规则280、标点符号规则282、拼写惯例284和风 格规则286。在选定的实施例中,翻译评估266可根据需要包括其它人 工要素288或任务288。参见图11,根据本发明的所选实施例,难以将翻译评估266中所涉及的所有任务全部自动化时,可对将由译审人员执行的剩余要素270的 控制290进行整合。这些控制290可提高人工要素270的客观性。例如, 一个控制290可限制292所用译审人员的数量。通过限制 292译审人员的数量,可用于监管和培训译审团队76的有限资源将得到 更加密集的使用。其它控制290可包括深入歸选294和測试296以确 定有资格加入译审团队76的人员;开展培训298,提高译审团队76的 技能水平和理解能力;对所审译文的译者匿名300和样本段管理302。在选定的实施例中,样本段管理302可限制或最小化在特定的译文 评估266过程中译审人员必须检查的样本段的大小和数量。 一般来讲, 人的注意力的集中程度会随着时间的推移而下降。因此,与冗长的样本段 相比,译审人员能更加深入地评估短小的样本段。所以,可以将每个样本段的大小最小化到由其统计意义上的显著性限定的值。同样,可以将所选 样本段的数量最小化到由其统计意义上的显著性限定的值。在某些实施例中,源文档的质量可能制约所得目标文档的质量。例 如,如果源文档有歧义,则这种歧义很可能被传递到目标文档中,从而降 低目标文档的质量。因此,对人工干预的另一项控制290可包括对源文 档的质量评估304。此项评估304可提供改进源文档的机会。作为另外 一种选择,可调整应用于目标文档的期望值或上限分数。对人工干预的另一项控制290可以是语言技术306的持续进步。随 着此项技术306的不断发展,目前由人工执行的其它要素270可最终变 为自动化要素268。除上述译文评估266中对人工干预的控制290夕卜, 还可根据需要实施其它施加控制的方法308。参见图12,在选定的实施例的译文评估266过程中,错误报告模块 186可协助译审人员输入生成日志文件190所必需的信息。错误报告模 块186可向译审人员提供错误类别310的列表以供其选择。该列表310 可与评价标准模块184的错误标识符214中详细说明的错误一致。在某些实施例中,错误类别310的列表可包含选项"无"312,该选 项在样本段中没有识别出任何错误时选择。该列表310中的其它选项可 包括术语错误314、遗漏316、语法错误318、拼写错误320、标点符号错误322、写作风格错误324、格式错误326、其它错误328、非译者错 误330等指示。非译者错误330是指不是译者所犯的错误。此类错误 330可包括存储错误,诸如从资源对导入错误的预翻译错误,以及源文档 中的错误造成的源错误。错误报告模块186可向译审人员提供错误权重332或大小332列 表以供其选择。这些大小332与评价标准模块184的错误鉴定器206 中详细说明的错误大小一致。另外,错误报告模块186可允许译审人员 输入注释334来表征或解释具体的问题、错误等。在操作中,当译审人员在样本段中找出错误时,他或她可从错误类别 310列表中选择错误的类型。错误类型的选择可自动规定已经分配的错误 权重332。例如,在某些实施例中,当译审人员选择"标点符号错误" 322时,可自动分配"轻微"权重332。在其它实施例中,不考虑所选错 误的类型310,译审人员可每次自行选择权重332。在其它实施例中,某 些类型的错误310可自动分配权重332,而其它类型的错误310允许译 审人员选择权重332。一旦选定错误类型310,并且选定或分配了适当的权重332,译审人 员可根据需要添加注释334。然后,就可提交错误报告。同样,译审人员 然后可继续记录从样本段内找出的下一个错误。可继续进行此流程,直到 已记录完样本段内的所有错误。然后,译审人员可继续审阅下一个样本 段,错误记录流程也将继续进行。参见图13,在选定的实施例中,输出模块188可汇编由错误报告模 块186提交的所有错误报告,以生成表征特定译文的日志文件190。在 某些实施例中,输出模块188可包括日志文件生成器336,专门执行此 项汇编与生成功能。根据本发明,日志文件190可包括任何对表征译文有用的信息。例 如,在选定的实施例中,日志文件190可包括译审人员标识338、译者 标识340、文档标识342、评价标准标识344和日期信息346 (例如, 翻译日期、审阅日期等)、总字数348、源语言350、目标语言352、错 误表354、分配给译文的总分数356 (例如,总质量指数356)或任何其 它所需的信息358。在某些实施例中,错误表354可包含一张表,该表列出位于选自文 档的样本段或样本段集合中的各种类型错误的数量360。该表354也可 示出轻微错误的数量362、严重错误的数量364和关键错误的数量 366。适当求和可算出总计368,表示查找到的错误总数量、轻微错误的 总数量、严重错误的总数量等。
要表格化显示各种错误类型的权重总计370,则用轻微错误的数量 362乘以分配给轻微错误的权重(例如,1分),用严重错误的数量364 乘以分配给严重错误的权重(例如,5分),用关键错误的数量366乘 以分配给关键错误的惩罚型权重(例如,足以使文档不合格的分数)。然 后,可对每个错误求和并计算出所有错误类型的总和,以得到该文档相应 的错误分数372。以这种方式计算出的错误分数372代表查找到的错误 数量,以及这些错误的大小或严重程度。
参见图14,有多种方法374、步骤374或公式374将错误分数 372转换为可用于量化译文质量的总质量指数356。 一般来讲,这些方法 只是将从实际审阅的一个或多个样本段求得的错误分数372以一些合理 的方式对整个文档评级。
例如,在一个实施例中,假定审阅过程中只使用一个样本段。因此, 得出总质量指数356的步骤374首先是将文档中的总字数348除以样 本段的大小376或样本段的字数376,来计算出该文档的样本段数量 378。然后,样本段的总数378乘以这一个样本段的错误分数372,从而 算出总预测错误分数380。总预测错误分数380可除以文档中的总字数 348,得到每个单词的预測错误分数382。
每个单词的预测错误分数382可转换为百分比384。该百分比可用 作总质量指数356。作为另外一种选择,该百分比384可转换为"正" 百分比,而非"负"百分比。例如, 一些人喜欢使用总质量指数356表 示正确翻译的单词百分比,而不是表示错误翻译的单词百分比。因此,可 以根据需要修改百分比384,以得到所需的总质量指数356。
上述举例说明基于"每个单词"来生成总质量指数356。根据需要, 可给出基于每句、每段、每页等的其它合适的指数356。公式374可进 行相应的调整。另外,在使用从一个以上的样本段中收集到的错误分数372的实施例中,在输入图示的公式374前,错误分数372可转换为每 个样本段的错误分数。
参见图15,根据本发明的资源管理软件68可提供任何期望的功 能。 一般来讲,可由一个或多个模块体现该功能。例如,在选定的实施例 中,资源管理软件68可包含人员跟踪模块386。这样的模块386可记 录有关翻译团队72、译审团队76等的简历信息388。
简历信息388可包括姓名、年龄、性别、专业技术领域、就读的教 育机构、出生国、居住国家/地区的列表、居住年数、所操语言、培训年 数、翻译经验的年数、报酬率、生产率、带有相关日期的译文分数356 等。该简历信息388可协助管理人员80识别趋势或模式。模式一经识 別,即可协助管理人员改进114资源分配。
在选定的实施例中,资源管理软件68可包括项目评估模块390。该 模块390可协助管理人员80准备完成所选项目的报价。在某些实施例 中,项目评估模块390可包含预处理器模块392,来确定在需要翻译的 文档中,哪些部分包含已在资源对140、字典148等中翻译了的单词或 短句。比较模块394可将可以预翻译的材料中的这个密度与已完成的相 似译文中的这个密度进行比较。然后,预测模块396使用比较模块394 提供的信息来预測出翻译新文档的成本。然后,输出模块398可协助管 理人员80生成报价,详细阐述预期工作量和相关成本预测的各个方面。
在一些实施例中,资源管理软件68可包括项目跟踪模块400来协 助管理人员80随着项目的进展跟踪项目进度,直至完成。在某些实施例 中,项目跟踪模块400可包括进度跟踪器402以确保及时执行各项翻 译、审阅任务;预算跟踪器404以监视与项目有关的经济资源的分配和 消耗;以及流程检查列表420以提供翻译流程的概况并确保正确及时地 执行所有要求的任务。
在某些实施例中,资源管理软件68可包括模式检测模块408,以协 助管理人员80识别统计意义上的显著性的模式,这些模式可用于改进 114资源分配。为强化这种能力,模式检測模块408可包括查询引擎 410,以利于手动或自动搜索数据库70中包含的信息。模式检测模块408也可包括联想模块412,以协助管理人员80分离特定结果的合理因 素。
在选定的实施例中,资源管理软件68可包括项目分配模块414,以 协助管理人员80管理往返于翻译团队72、译审团队76等之间的项目 流程。在一些实施例中,项目分配模块414可起到工作流程服务器的作 用。要提供这类功能,项目分配模块414可包括评估器416,以协助作 出决定,确定接受项目的译者和译审人员。分配器418可协助将项目交 付给所选的译者或译审人员。例如,分配器418可通过电子邮件将项目 发送给译者。作为另外一种选择,分配器418只将项目发布到安全网站 上,译者、译审人员等可登录该网站并检索项目。项目分配模块414也 可包括流程检查列表420,提供翻译流程的概况,和确保正确且及时地执 行所有要求的任务。
在不脱离其基本结构或基础特性的前提下,可以其它具体形式实施本 发明。所述实施例在各个方面都只被视作示例性的,而不是限制性的。因 此,本发明的范围由所附权利要求书指明,而非由上述具体实施方式
指 明。在与权利要求等同的含义和范围内所做的所有更改均包含在权利要求 的范围之内。
权利要求
1.一种系统,所述系统包括包括可操作地互连的处理器和存储装置的计算机;存储在所述存储装置中并且与第一语言对应的源文本;存储在所述存储装置中并且包括第二语言(区别于第一语言)的源文本的译文的目标文本;和多个可执行程序,所述多个可执行程序存储在所述存储装置中并被成形为当由所述处理器执行时能够独立地识别包括一个或多个样本段的测试样本,每个样本段包括匹配的组,该组具有选自所述源文本的源部分和选自所述目标文本的对应的目标部分。
2. 根据权利要求1所述的系统,其中所述一个或多个样本段中的至 少一个样本段的源部分和目标部分之一内所含的字数由所述多个可执行程序确定。
3. 根据权利要求2所述的系统,其中所述一个或多个样本段中的至 少 一个样本段的源文本中的源部分和目标部分之一的位置由所述多 个可执行程序确定。
4. 根据权利要求3所述的系统,其中所述位置由所述多个可执行程 序内包含的明确公式规定。
5. 根据权利要求3所述的系统,其中所述位置由所述多个可执行程 序随机规定。
6. 根据权利要求3所述的系统,其中 所述存储装置还存储多个字典条目,这些条目将所述第一语言中的 单词与所述第二语言中的单词相匹配;和所述位置由所述多个可执行程序根据既包含在所述源文本和目标文 本之一内又包含在所述多个字典条目中的单词的集中程度的变化来 选择。
7. 根据权利要求3所述的系统,其中所述存储装置包括一个或多个 电子存储单元。
8. 根据权利要求7所述的系统,其中所述一个或多个电子存储单元 中的至少一个远离所述处理器设置。
9. 根据权利要求8所述的系统,其中所述一个或多个电子存储单元 中的至少一个通过因特网与所述处理器连接。
10. 根据权利要求1所述的系统,其中所述存储装置包括一个或多个 电子存储单元。
11. 一种系统,所述系统包括包括可操作地互连的第 一处理器和第 一存储装置的第 一计算机; 包括可操作地互连的第二处理器和第二存储装置的第二计算机; 第一多个可执行程序,所述第一多个可执行程序存储在所述第一存储装置上并被成形为能协助人工译者将对应第 一语言的源文本翻译为对应第二语言(区别于第一语言)的目标文本;和第二多个可执行程序,所述第二多个可执行程序存储在所述第二存储装置上并被成形为能够独立地识别包括一个或多个样本段的测试样本,每个样本段包括匹配的组,该组具有选自所述源文本的源部分和选自所述目标文本的对应的目标部分。
12. 根据权利要求11所述的系统,其中所述一个或多个样本段中的至 少一个样本段的源部分内所含的字数由所述第二多个可执行程序规定。
13. 根据权利要求12所述的系统,其中所述一个或多个样本段中的至 少一个样本段的源文本内的源部分的位置由包含在所述第二多个可执行程序中的明确公式和所述第二多个可执行程序的随机选择之一 规定。
14. 根据权利要求11所述的系统,所述系统还包括接收来自所述第一 计算机的源文本和目标文本的电子存储装置。
15. 根据权利要求14所述的系统,其中所述第二计算机接收来自所述 电子存储装置的源文本和目标文本。
16. 根据权利要求15所述的系统,其中所述电子存储装置、第一计算 机和第二计算机通过网络互连。
17. 根据权利要求16所述的系统,其中所述网络包括因特网。
18. —种方法,所述方法包括选择计算机,所述计算机包括可橾作地互连的处理器和存储装置,所述存储装置包括选定的可执行程序;在所述存储装置中存储对,所述对由对应第一语言的源文本和包括 源文本转变为第二语言(区别于第一语言)的译文的目标文本组 成;和在所述处理器上执行所述选定的可执行程序,以便从所述源文本和 所述目标文本之一独立地识别包括一个或多个样本段的测试样本, 每个样本段包括匹配的组,该组具有选自所述源文本的源部分和选自所述目标文本的对应的目标部分。
19. 根据权利要求18所述的方法,所述方法还包括执行在所述测试样 本中证明译文质量的人工评估。
20. 根据权利要求19所述的方法,其中所述人工评估包括在拼写、语 法、格式、风格、标点符号和保持原义中的至少一个方面对测试样 本进行评分。
全文摘要
本发明公开了一种使译文质量评估自动化的系统(10)。该系统(10)可包括具有可操作地互连的处理器(14)和存储装置(16)的计算机(12)。第一语言的源文本可存储在存储装置(16)中。包括源文本转变为第二语言的译文的目标文本也可存储在存储装置(16)中。另外,多个可执行程序可存储在存储装置(16)上且被成形为当由处理器(14)执行时能够独立地识别包括一个或多个样本段的测试样本,每个样本段包括匹配的组,该组具有选自所述源文本的源部分和选自所述目标文本的对应的目标部分。
文档编号G06F17/28GK101248432SQ200680030897
公开日2008年8月20日 申请日期2006年8月17日 优先权日2005年8月25日
发明者B·R·桑多尔, M·V·桑多恩 申请人:慕迪灵公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1