翻译平台匹配方法及装置与流程

文档序号:17866809发布日期:2019-06-11 23:17阅读:218来源:国知局
翻译平台匹配方法及装置与流程

本发明实施例涉及互联网领域,尤其涉及一种翻译平台匹配方法及装置。



背景技术:

随着互联网的兴起,翻译服务业正向着大规模产业化、平台化的方向发展,平台化处理翻译项目成为主流处理方式。平台化的处理方式可将之前线下处理方式搬到线上,让译员能够在线翻译,并实时提交翻译成果。

目前的翻译平台以人工翻译为主,人工翻译业务通常是由专门的翻译公司运营;随着互联网的发展,翻译公司为了拓宽业务的地域范围,翻译管理系统或平台逐步被开发出来。通过现有的翻译系统或平台,客户可以进行下单,运营管理系统或平台的公司接单订单后,进行内部分配,员工拿到订单后开始进行翻译,从而完成整个业务过程。

目前的人工翻译效率较低,而采用机器翻译则准确率较低。同时目前的翻译途径选取较为主观,如何时选择机器翻译,何时选择人工翻译,无法准确的根据订单选取翻译途径。目前的翻译系统或平台仅仅是以接单为目的,而随着大量翻译需求的出现,目前的翻译平台逐渐无法满足用户的业务需求。因此,亟需一种能够实现根据订单准确匹配翻译途径或翻译人员的方法。



技术实现要素:

为了解决上述问题,本发明实施例提供一种翻译平台匹配方法及装置。

第一方面,本发明提供一种翻译平台匹配方法,包括:接收待匹配订单,并获取所述订单的质量级别及订单类型,所述质量级别表示所述订单对翻译结果的质量要求,所述订单类型包括笔译订单和口译订单,所述笔译订单包括机器翻译、人机共译以及人工翻译;所述口译订包括即时口译和线下陪同口译;根据所述订单的质量级别及订单类型,获取应匹配的翻译实施对象,所述翻译实施对象包括翻译引擎和译员。

第二方面,本发明提供一种翻译平台匹配装置,包括:获取模块,用于接收待匹配订单,并获取所述订单的质量级别及订单类型,所述质量级别表示所述订单对翻译结果的质量要求,所述订单类型包括笔译订单和口译订单,所述笔译订单包括机器翻译、人机共译以及人工翻译,所述口译订单包括即时口译和线下陪同口译;匹配模块,用于根据所述订单的质量级别及订单类型,获取应匹配的翻译实施对象,所述翻译实施对象包括翻译引擎和译员。

第三方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行程序时实现本发明第一方面翻译平台匹配方法的步骤。

第四方面,本发明提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本发明第一方面翻译平台匹配方法的步骤。

本实施例提供的翻译平台匹配方法,根据订单的质量级别及订单类型,获取应匹配翻译实施对象,实现了翻译引擎及译员的准确匹配,同时为高效匹配提供基础。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的翻译平台匹配方法流程图;

图2为本发明实施例提供的翻译平台匹配装置结构图;

图3为本发明实施例提供的一种电子设备的实体结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

目前的人工翻译效率较低,而采用机器翻译则准确率较低。同时目前的翻译途径选取较为主观,如何时选择机器翻译,何时选择人工翻译,无法准确的根据订单选取翻译途径。

为解决这一问题,本发明实施例提供一种翻译平台匹配方法。该方法可应用于上述翻译平台的匹配场景中。该方法对应的执行主体可以为翻译平台的后台服务器,也可以为单独设置的匹配装置,本发明实施例对此也不作具体限定。为了便于说明,本发明实施例以执行主体为翻译平台的后台服务器为例,对本发明实施例提供的翻译平台匹配方法进行阐述。

图1为本发明实施例提供的翻译平台匹配方法流程图,如图1所示,本发明实施例提供一种翻译平台匹配方法,包括:

101,接收待匹配订单,并获取订单的质量级别及订单类型,质量级别表示订单对翻译结果的质量要求,订单类型包括笔译订单和口译订单,笔译订单包括机器翻译、人机共译以及人工翻译,口译订单包括即时口译和线下陪同口译。

在101中,待匹配订单为客户通过翻译平台进行下达的订单,订单中包括待翻译的稿件或者翻译需求,稿件是待翻译内容的载体,可以为文本形式,如word,excel,ppt、pdf等主流稿件类型以及html网页形式,也可以为语音形式,语音类型订单可以通过语音识别技术生成相应的文本形式,翻译需求包括特定时间的线下口译形式的翻译、线下陪同翻译等。订单的类型可以为笔译订单也可以为口译订单,即客户期望的翻译结果的形式,笔译订单包括机器翻译、人机共译以及人工翻译,口译订单包括即时口译和线下陪同口译。人机共译主要针对稿件中存在质量要求不同的内容,为了提高翻译效率,对于稿件中质量要求高的内容进行人工翻译,质量要求相对较低的内容进行机器翻译。本发明实施例不对订单类型的获取方法作具体限定,包括但不限于客户通过翻译平台的客户端进行下单选择订单类型(一般客户选择类型主要为笔译订单或口译订单),翻译平台后台服务器根据客户提交订单中的待翻译稿件或翻译需求自动识别获取等(可获取具体类型)。

质量级别用于表示订单对翻译结果的质量要求,可以根据用户下单时的操作进行选取(若用户不选取,则默认一个质量级别),也可以通过翻译平台的后台服务器根据用户订单中的稿件或需求进行自定义,本发明实施例对质量级别的获取方式不作具体限定。

102,根据订单的质量级别及订单类型,获取应匹配的翻译实施对象,所述翻译实施对象包括翻译引擎和译员。

一方面,根据订单类型选取对应的译员或翻译引擎,订单类型包括笔译和口译,根据该两类别以及译员的业务能力对译员进行划分。口译订单选取具有口译技能的人工译员,笔译订单则根据质量级别的要求情况选取翻译引擎和译员,同时均参考质量级别。以三个质量级别包括阅读级、标准级和专业级为例进行说明如下,根据获取的质量级别匹配相应的译员,在匹配前对译员进行分级,如根据从业经验、业务能力进行分级,按级别高低分为对应的t6级、t5级和t4级,可包括更高和更低的等级。若获取的质量级别为专业级,则匹配对应的t6及以上的译员;若获取的质量级别为标准(可将标准级别设为默认级别,即客户不选取质量级别,默认为标准),则匹配t5及以上的译员;若获取的质量级别为阅读级则匹配t4级以上的译员。同时,根据质量级别,质量级别较低时可匹配机器翻译(通过各翻译引擎实现,如google翻译),如质量级别为阅读级时匹配机器翻译。对于实施机器翻译的翻译引擎也可按质量级别进行相应的划分,根据订单类型可匹配人工和翻译引擎共同翻译,匹配的对象用于实施订单的翻译任务,即上述翻译实施对象。

基于上述实施例的内容,作为一种可选实施例,翻译实施对象还包括第三方翻译平台。若翻译引擎和译员中均无合适的匹配对象,或者其他第三方翻译平台的翻译结果更为准确,可匹配其它第三方翻译平台,第三方翻译平台为本翻译平台以外的其它翻译平台。

本实施例提供的翻译平台匹配方法,根据订单的质量级别及订单类型,获取应匹配的翻译实施对象,实现了翻译引擎及译员的准确匹配,同时为高效匹配提供基础。

基于上述实施例的内容,作为一种可选实施例,本发明实施例不对根据订单的质量级别及订单类型,获取应匹配的翻译实施对象的方法作具体限定,包括但不限于:根据订单的质量级别及订单类型,通过自动语种识别、自动领域识别以及基因匹配,对订单的稿件进行分析操作,生成匹配识别结果,根据匹配识别结果,获取订单应匹配的翻译实施对象。

稿件的分析操作包括判断稿件的语种和领域,以及对稿件进行拆分,判断每一部分应匹配的翻译实施对象是人工翻译还是机器翻译。由于稿件的每一部分的质量要求可能会不同,需判断每一部分对应的质量级别。还包括确定笔译订单的机器翻译、人机共译以及人工翻译结果,以及确定口译订单为即时口译或线下陪同口译。稿件的上述各个特征,包括质量级别、订单类型等、语种领域等,通过基因对其进行表达。将稿件对应的基因表达与平台待匹配的译员、翻译引擎以及第三方翻译平台的基因进行匹配,得到适合执行翻译任务的匹配结果。经过基因匹配得到的匹配对象可以得到最佳翻译效果。

本发明实施例不对通过自动语种识别、自动领域识别以及基因匹配,对所述订单的稿件进行分析操作,生成匹配识别结果的方法作具体限定,包括但不限于根据机器深度学习、自然语言处理以及大数据挖掘处理等方法实现自动语种识别、自动领域识别以及基因匹配,对订单的稿件进行分析操作,生成匹配识别结果。

通过机器深度学习,包括经验性归纳学习、遗传算法、神经网络以及lda(latentdirichletallocation,一种文档主题生成模型)主题模型等,自然语言处理,包括文本分类、聚类、情感分析、词法分析、句法分析等,大数据挖掘处理,包括hadoop并行计算、sparkstreaming流式计算、storm实时计算、elasticsearch或solr搜索引擎等,形成五大核心算法,为匹配服务提供支持。从而根据待翻译的稿件或者翻译需求,实现自动化语种识别、自动领域识别以及基因匹配,生成匹配识别结果,从而获取订单应匹配的翻译实施对象。

本实施例提供的翻译平台匹配方法,根据机器深度学习、自然语言处理以及大数据挖掘处理等方法实现自动语种识别、自动领域识别以及基因匹配,生成匹配识别结果,实现了翻译平台的高效匹配。

基于上述实施例的内容,作为一种可选实施例,上述分析操作包括风险预警评估,并生成相应的风险等级,若获取应匹配的翻译实施对象失败,则根据风险等级选取翻译实施对象。

上述分析操作中还包括进行风险预警评估,并生成相应的风险等级,可根据上述订单的质量级别以及订单的类型,生成风险等级。例如,质量级别为专业级,订单类型为口译、匹配的语种识别结果为小语种以及领域识别结果为译员比较少的情况,上述情况下用于调度的资源有限,则生成高风险等级预警信息。通过翻译平台后台服务器的自动化匹配,若遇到匹配失败时,如匹配的对应级别译员无空闲的译员,根据风险等级从高到低从空闲资源中择优选取翻译实施对象。以翻译实施对象包括翻译引擎和译员为例,高风险等级时选取质量级别较高的翻译引擎或译员,低风险等级时选取质量级别相对较低的翻译引擎或译员。

基于上述实施例的内容,作为一种可选实施例,该方法还包括:采用自然语言处理方法将获取的订单稿件生成对应的语料库、术语库及文稿库,结合已匹配的翻译实施对象进行存储,用于新订单的匹配。

订单进行匹配后的匹配结果,可用于下次匹配的参考依据。为实现快速的自动化识别订单的稿件,采用自然语言处理(naturallanguageprocessing,简称nlp)方法将获取的语订单稿件生产对应的语料库、术语库、文稿库。结合对应订单的匹配结果,对新的订单匹配时,可将上述数据放入elasticsearch搜索引擎中,根据大数据挖掘算法,形成完善的“产能画像”。通过该画像,即可实现对翻译实施对象的精准匹配。

基于上述实施例的内容,作为一种可选实施例,该方法还包括:对实施翻译后的翻译结果进行质量评估,结合已匹配的翻译实施对象进行存储,用于新订单的匹配。

基于上述实施例的内容,作为一种可选实施例,该方法还包括:对实施翻译后的翻译结果进行客户满意度评估,结合已匹配的翻译实施对象进行存储,用于新订单的匹配。

对于匹配对应翻译引擎和译员后,实施翻译完成订单。可对翻译结果实施质量评估,如对完成的返稿进行审校、抽查检验等,根据检验结果进行统计,作为对应译员或翻译引擎的质量评估结果。将这些结果进行存储,用于新订单匹配时的参考依据。同时还可参考客户的反馈结果,根据客户对翻译结果的评价进行打分,结合实施这些翻译的译员或翻译引擎,进行存储,用于新订单的匹配。

例如,通过数据仓库技术(extract-transform-load,简称etl)数据采集转换(包括flume、kettle、hawk、sqoop等)工具,将内部平台和外部平台获取的订单中的数据进行分类存储。其中,半结构化数据以xml的形式存储到mongodb中;非结构化数据以hive和hbase为存储媒介,存储到hdfs(分布式文件系统)中;结构化数据存储至oracle和mysql中。

图2为本发明实施例提供的翻译平台匹配装置结构图,如图2所示,该翻译平台匹配装置包括:获取模块201和匹配模块202。其中,获取模块201用于接收待匹配订单,并获取订单的质量级别及订单类型,质量级别表示订单对翻译结果的质量要求,订单类型包括笔译订单和口译订单,笔译订单包括机器翻译、人机共译以及人工翻译,口译订单包括即时口译和线下陪同口译;匹配模块202用于根据订单的质量级别及订单类型,获取应匹配的翻译实施对象,该翻译实施对象包括翻译引擎和译员。

待匹配订单为客户通过翻译平台进行下达的订单,订单中包括待翻译的稿件或者翻译需求,稿件是待翻译内容的载体,可以为文本形式,也可以为语音形式,语音类型订单可以通过语音识别技术生成相应的文本形式,翻译需求包括特定时间的线下口译形式的翻译、线下陪同翻译等。订单的类型可以为笔译订单也可以为口译订单,即客户期望的翻译结果的形式。笔译订单包括机器翻译、人机共译以及人工翻译,口译订单包括即时口译和线下陪同口译。

匹配模块202根据订单类型匹配对应的译员,订单类型包括笔译和口译,根据该两类别以及译员的业务能力对译员进行划分。口译时匹配人工的译员,笔译可根据情况匹配机器翻译引擎,同时参考质量级别。

本实施例提供的翻译平台匹配装置,根据获取模块获取订单的质量级别及订单类型,从而匹配模块获取应匹配的翻译实施对象,实现了翻译引擎及译员的准确匹配,同时为高效匹配提供基础。

本发明实施例提供的装置实施例是为了实现上述各方法实施例的,具体流程和详细内容请参照上述方法实施例,此处不再赘述。

本发明实施例提供一种翻译平台,该翻译平台实施上述各方法实施例,构架上包括控制层(control)、匹配层(match)、数据层(data)、以及术语层(corpus)。

控制层是翻译平台的应用层。直接应用于稿件或者译员上,进行稿件分析、自动识别、语义匹配以及合适度匹配等。

匹配层是翻译平台的算法层。通过机器深度学习(经验性归纳学习、遗传算法、神经网络、lda主题模型等)、自然语言处理(文本分类、聚类、情感分析、词法分析、句法分析等)、大数据挖掘处理(hadoop并行计算、sparkstreaming流式计算、storm实时计算、elasticsearch或solr搜索引擎等)三个维度,形成五大核心算法,为匹配服务提供支持。

数据层是翻译平台的中央数据层。算法建立在丰富的数据基础上,在数据层,存储海量历史语料库、术语库、文稿库与译员的行为数据结果,构造一个庞大的数据体系。将上述数据放入elasticsearch搜索引擎中,根据大数据挖掘算法,形成完善的“产能画像”。通过该画像,实现对译员的精准匹配。

术语层是语联网大脑的术语采集层。术语是翻译中的关键,只有保障术语采集,才能为数据层提供支持。通过etl数据采集转换(flume、kettle、hawk、sqoop等)工具,将内部平台和外部平台采集到数据进行分类存储,其中,半结构化数据以xml的形式存储到mongodb中;非结构化数据以hive和hbase为存储媒介,存储到hdfs(分布式文件系统)中;结构化数据存储至oracle和mysql中。

图3为本发明实施例提供的一种电子设备的实体结构示意图,如图3所示,该电子设备可以包括:处理器(processor)301、通信接口(communicationsinterface)302、存储器(memory)303和总线304,其中,处理器301,通信接口302,存储器303通过总线304完成相互间的通信。通信接口302可以用于电子设备的信息传输。处理器301可以调用存储器303中的逻辑指令,以执行包括如下的方法:接收待匹配订单,并获取订单的质量级别及订单类型,质量级别表示订单对翻译结果的质量要求,订单类型包括笔译订单和口译订单,笔译订单包括机器翻译、人机共译以及人工翻译,口译订单包括即时口译和线下陪同口译;根据订单的质量级别及订单类型,获取应匹配的翻译实施对象,该翻译实施对象包括翻译引擎和译员。

此外,上述的存储器303中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明上述各方法实施例的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本发明实施例提供一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令使计算机执行上述实施例所提供的翻译平台匹配方法,例如包括:接收待匹配订单,并获取订单的质量级别及订单类型,质量级别表示订单对翻译结果的质量要求,订单类型包括笔译订单和口译订单,笔译订单包括机器翻译、人机共译以及人工翻译,口译订单包括即时口译和线下陪同口译;根据订单的质量级别及订单类型,获取应匹配的翻译实施对象,该翻译实施对象包括翻译引擎和译员。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1