翻译模型构建方法和装置与流程

文档序号:17490235发布日期:2019-04-23 20:24阅读:400来源:国知局
翻译模型构建方法和装置与流程
本申请涉及机器翻译
技术领域
,尤其涉及一种翻译模型构建方法和装置。
背景技术
:在构建翻译模型时,通常利用大规模的双语语料来训练翻译模型,以提高翻译模型的翻译质量。但是,对于具有小语种的语言对,很难获得大规模双语语料,那么如果利用小规模的双语语料来训练翻译模型,得到的翻译模型的质量会比较低。技术实现要素:本申请提出一种翻译模型构建方法和装置,用于解决利用小规模的双语语料训练翻译模型,得到的翻译模型的翻译质量较低的问题。本申请一方面实施例提出了一种翻译模型构建方法,包括:在第一正例语料集中的翻译词对的数量小于阈值时,根据获取的第一正例语料集中的各翻译词对,随机生成负例语料集,其中,所述第一正例语料集及负例语料集中的翻译词对分别包括源语言及对应的目标语言;对所述第一正例语料集及所述负例语料集进行机器学习,以生成分类模型;利用所述分类模型,将预设的翻译模型进行剪枝处理,以生成与所述源语言及目标语言对应的翻译模型;其中,所述预设的翻译模型,为将第一翻译模型及第二翻译模型融合后得到的翻译模型,第一翻译模型为利用包括源语言与参考语言的第二正例语料集训练得到的、第二翻译模型为利用包括参考语言与目标语言的第三正例语料集训练得到的。本申请实施例的翻译模型构建方法,通过在第一正例语料集中的翻译词对的数量小于阈值时,根据获取的第一正例语料集中的各翻译词对,随机生成负例语料集,其中,第一正例语料集及负例语料集中的翻译词对分别包括源语言及对应的目标语言,对第一正例语料集及负例语料集进行机器学习,以生成分类模型,利用分类模型,将预设的翻译模型进行剪枝处理,以生成与源语言及目标语言对应的翻译模型,其中,预设的翻译模型,为将第一翻译模型及第二翻译模型融合后得到的翻译模型,第一翻译模型为利用包括源语言与参考语言的第二正例语料集训练得到的、第二翻译模型为利用包括参考语言与目标语言的第三正例语料集训练得到的。由此,在源语言与目标语言的双语语料较少时,利用源语言与目标语言的翻译词对得到分类模型,通过分类模型对借助于参考语言的得到的源语言与目标语言的翻译模型进行过滤,大大降低了翻译模型的噪声,提高了翻译模型的翻译质量。本申请另一方面实施例提出了一种翻译模型构建装置,包括:第一生成模块,用于在第一正例语料集中的翻译词对的数量小于阈值时,根据获取的第一正例语料集中的各翻译词对,随机生成负例语料集,其中,所述第一正例语料集及负例语料集中的翻译词对分别包括源语言及对应的目标语言;第二生成模块,用于对所述第一正例语料集及所述负例语料集进行机器学习,以生成分类模型;第三生成模块,用于利用所述分类模型,将预设的翻译模型进行剪枝处理,以生成与所述源语言及目标语言对应的翻译模型;其中,所述预设的翻译模型,为将第一翻译模型及第二翻译模型融合后得到的翻译模型,所述第一翻译模型为利用包括源语言与参考语言的第二正例语料集训练得到的第一翻译模型、所述第二翻译模型为利用包括参考语言与目标语言的第三正例语料集训练得到的。本申请实施例的翻译模型构建装置,通过在第一正例语料集中的翻译词对的数量小于阈值时,根据获取的第一正例语料集中的各翻译词对,随机生成负例语料集,其中,第一正例语料集及负例语料集中的翻译词对分别包括源语言及对应的目标语言,对第一正例语料集及负例语料集进行机器学习,以生成分类模型,利用分类模型,将预设的翻译模型进行剪枝处理,以生成与源语言及目标语言对应的翻译模型,其中,预设的翻译模型,为将第一翻译模型及第二翻译模型融合后得到的翻译模型,第一翻译模型为利用包括源语言与参考语言的第二正例语料集训练得到的、第二翻译模型为利用包括参考语言与目标语言的第三正例语料集训练得到的。由此,在源语言与目标语言的双语语料较少时,利用源语言与目标语言的翻译词对得到分类模型,通过分类模型对借助于参考语言的得到的源语言与目标语言的翻译模型进行过滤,大大降低了翻译模型的噪声,提高了翻译模型的翻译质量。本申请另一方面实施例提出了一种计算机设备,包括处理器和存储器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如上述一方面实施例所述的翻译模型构建方法。本申请另一方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述一方面实施例所述的翻译模型构建方法。本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本申请实施例提供的一种翻译模型构建方法的流程示意图;图2为本申请实施例提供的另一种翻译模型构建方法的流程示意图;图3为本申请实施例提供的又一种翻译模型构建方法的流程示意图;图4为本申请实施例提供的再一种翻译模型构建方法的流程示意图;图5为本申请实施例提供的一种翻译模型构建装置的结构示意图;图6示出了适于用来实现本申请实施方式的示例性计算机设备的框图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。下面参考附图描述本申请实施例的翻译模型构建方法和装置。本申请实施例,针对相关技术中对于语料较少的小语种语言对,直接利用双语语料训练得到的翻译模型的质量比较低的问题,提出一种翻译模型构建方法。本申请实施例提出的翻译模型构建方法,在源语言与目标语言的双语语料较少时,利用源语言与目标语言的翻译词对得到分类模型,通过分类模型对借助于参考语言的得到的源语言与目标语言的翻译模型进行过滤,大大降低了翻译模型的噪声,提高了翻译模型的翻译质量。图1为本申请实施例提供的一种翻译模型构建方法的流程示意图。本申请实施例的翻译模型构建方法,可由本申请实施例提供的翻译模型构建装置执行,以实现利用源语言与目标语言的翻译词对得到的分类模型,对借助于参考语言的得到的源语言与目标语言的翻译模型进行过滤,以提高翻译模型的翻译质量。如图1所示,该翻译模型构建方法包括:步骤101,在第一正例语料集中的翻译词对的数量小于阈值时,根据获取的第一正例语料集中的各翻译词对,随机生成负例语料集。在构建翻译模型时,通常是利用大规模的双语语料通过训练得到翻译模型,但是对于存在小语种的翻译模型,例如中文与日文,中日语料较少,通过少量的中日语料训练得到的中日翻译模型的翻译质量对比较低。本申请中,当源语言与目标语言的语料较少时,可借助于参考语言得到源语言与目标语言的预设的翻译模型,并利用源语言与目标语言的语料对翻译模型进行过滤,得到源语言与目标语言的翻译模型。具体而言,在第一正例语料集中的翻译词对的数量小于阈值时,可根据第一正例语料集中的各翻译词对,随机生成负例语料集。其中,第一正例语料集和负例语料集中的翻译词对均包括源语言及对应的目标语言。也就是说,第一例语料集和负例语料集中的翻译词对是源语言与目标语言词对。本实施例中,正例语料集中的翻译词对是正确的互译词对,而负例语料集中的翻译词对不是互译词对。在根据第一正例语料集中的各翻译词对,随机生成负例语料集时,可随机互换第一正例语料集中的翻译词对中的源语言,或者是随机互换目标语言,生成负例语料集。例如,源语言为中文,目标语言为日文,第一正例语料集中的翻译词对包括:{(河岸:河原),(银行:銀行),(存款:预ける},那么互换翻译词对中日文“河原”与“銀行”的位置,可得到翻译词对:(河岸:銀行)和(银行:河原),这两个翻译词对可作为负例语料集中的翻译词对。步骤102,对第一正例语料集及负例语料集进行机器学习,以生成分类模型。本实施例中,可利用第一正例语料集和负例语料集中的翻译词对进行机器学习,生成分类模型。分类模型用于判断源语言与目标语言的翻译词对是否为合法词对,即是否为互译关系的词对。在进行机器学习时,可利用支持向量机分类算法、决策树算法、贝叶斯算法、k-近邻算法等分类算法进行分类训练,得到分类模型。步骤103,利用分类模型,将预设的翻译模型进行剪枝处理,以生成与源语言及目标语言对应的翻译模型。本实施例中,预设的翻译模型是借助于参考语言得到的源语言与目标语言的翻译模型。其中,参考语言可以看作是源语言与目标语言之间的桥梁。具体地,预设的翻译模型是将源语言与参考语言的第一翻译模型,与参考语言与目标语言的第二翻译模型融合得到的。其中,第一翻译模型是利用包括源语言与参考语言的第二正例语料集训练得到的,第二翻译模型是利用参考语言与目标语言的第三正例语料集训练得到的。可以理解的是,第二正例语料集中包括的翻译词对是源语言与参考语言的翻译词对,第三正例语料集中包括的翻译词对是参考语言与目标语言的翻译词对。以构建中日翻译模型为例,如果获取的中日翻译词的数量对小于阈值,而可以获得大规模的中英翻译词对和英日翻译词对,那么可以将利用中英翻译词对训练得到中英翻译模型,和利用英日翻译词对训练得到的英日翻译模型,进行融合得到预设的中日翻译模型。由于参考语言可能会存在多义性,例如,中文“存款”和“银行”都可翻译为英文“bank”,而“bank”可翻译为日文“河原”、“銀行”、“预ける”。因此,将中英翻译模型与中日翻译模型进行融合时,会存在噪声。例如,融合得到“银行”:“bank”:“河原”,即中日翻译词对为“银行”:“河原”,而中文“银行”与日文“河原”之间是不存在互译关系的。尽管源语言与目标语言的翻译词对的数量小于阈值,但是其具有较高的互译质量。为了提高翻译模型的翻译质量,本实施例中,可利用根据源语言与目标语言的正例语料集和负例语料集训练得到的分类模型,对预设的翻译模型进行剪枝处理,以过滤预设的翻译模中的噪声,生成源语言及目标语言对应的翻译模型。例如,通过分类模型,可对预设的翻译模型中的双语数据库中不存在互译关系的翻译词对过滤掉。由于利用分类模型过滤了预设的翻译模型中的噪声,从而可以提高源语言与目标语言的翻译模型的翻译质量。对于上述通过第一正例语料集和随机生成的负例语料集进行机器学习,可得到用于确定源语言与目标语言的翻译词为合法词对的概率,进而根据概率对预设的翻译模型进行剪枝处理。下面结合图2进行说明,图2为本申请实施例提供的另一种翻译模型构建方法的流程示意图。如图2所示,上述利用分类模型,将预设的翻译模型进行剪枝处理,包括:步骤201,将预设翻译模型中的双语数据库中的每个翻译词对分别输入分类模型中,以确定每个翻译词对为合法词对的概率。本实施例中,预设的翻译模型中的双语数据库中包括源语言与目标语言的翻译词对。在对预设的翻译模型进行剪枝处理时,可将双语数据库中的每对翻译词对输入至分类模型中,得到每个对翻译词对为合法词对的概率。其中,合法词对是指存在互译关系的翻译词对。步骤202,根据获取的合法词对对预设的翻译模型进行剪枝处理。本实施例中,将每个翻译词对为合法词对的概率与预设的阈值概率进行比较,将大于阈值概率的翻译词作为合法词对进行保留,将双语数据库中其他翻译词对删除,从而完成对预设的翻译模型的剪枝处理,生成与源语言及目标语言对应的翻译模型。本申请实施例中,通过分类模型确定预设的翻译模型中双语数据库中每个翻译词对为合法词对的概率,根据概率确定合法词对,并根据合法词对对预设的翻译模型进行剪枝处理,从而对融合得到的翻译模型进行过滤,提高了翻译模型的翻译质量。在本申请的一个实施例中,可通过对抽取的翻译词对的特征进行机器学习得到分类模型,以及利用分类模型,对预设的翻译模型中的双语数据库中的翻译词对的特征进行识别,来对预设的翻译模型进行剪枝处理。下面结合图3进行说明,图3为本申请实施例提供的又一种翻译模型构建方法的流程示意图。如图3所示,该翻译模型构建方法包括:步骤301,在第一正例语料集中的翻译词对的数量小于阈值时,根据获取的第一正例语料集中的各翻译词对,随机生成负例语料集。本实施例中,步骤301与上述步骤101类似,故在此不再赘述。步骤302,对第一正例语料集及负例语料集中的每个翻译词对进行解析处理,以确定每个翻译词对的特征集。本实施例中,可通过抽取每个翻译词对的特征,通过特征区分正例语料集中的翻译词对和负例语料集中翻译词对。在对第一正例语料集及负例语料集中的每个翻译词对的特征集进行机器学习,以生成分类模型之前,可先针对第一正例语料集和负例语料集中每个翻译词对进行分析,得到每个翻译词对的特征,特征的集合为每个翻译词对的特征集。其中,特征集包括:源语言短语长度、目标语言短语长度、翻译词对长度比及翻译词对互译概率值等特征的一种或多种。步骤303,对第一正例语料集及负例语料集中的每个翻译词对的特征集进行机器学习,以生成分类模型。本实施例中,利用分类算法对第一正例语料集及负例语料集中每个翻译词对的特征集进行训练,生成分类模型。步骤304,对预设的翻译模型中的双语数据库中的每个翻译词对进行解析处理,以确定每个翻译词对的特征集。本实施例中,针对预设的翻译模型中的双语数据库中每个翻译词对进行解析处理,确定每个翻译词对的特征,特征的集合为特征集。步骤305,通过利用分类模型对预设的翻译模型中的双语数据库中的每个翻译词对的特征集进行识别,将预设的翻译模型进行剪枝处理,以生成与源语言及目标语言对应的翻译模型。本实施例中,可将预设的翻译模型中的双语数据库中的每个翻译词对的特征集输入分类模型,分类模型输出每个翻译词对为合法词对的概率,根据概率可以确定双语数据库中为合法词对的翻译词对,并保留合法词对,那么可删除双语数据库中除合法词对外的其他翻译词对,从而完成对预设的翻译模型进行剪枝处理,生成与源语言及目标语言对应的翻译模型。在本申请的一个实施例中,在根据获取的第一正例语料集中的各翻译词对,随机生成负例语料集之前,可先从语料库中获取源语言与目标语言的第一正例语料集,然后再根据第一正例语料集生成负例语料集。其中,语料库中可包括多种双语短语对,例如包括中英短语对、英日短语对、中日短语对、中俄短语对等多种语料。具体而言,当用户发起翻译模型构建请求时,翻译模型构建装置可获取翻译模型构建请求,其中,构建请求中包括源语言类型及目标语言类型。例如,构建请求中包括源语言类型中文和目标语言日文,那么要构建的翻译模型为中日翻译模型。然后,根据源语言类型和目标语言类型,可以从语料库中获取源语言类型和目标语言类型的短语对,之后从源语言短语与目标语言短语中提取出源语言词与目标语言词,得到包含源语言与目标语言的翻译词对,多个翻译词对组成第一正例语料集。在获取第一正例语料集后,可根据第一正例语料集中的翻译词对随机生成负例语料集。在本申请的一个实施例中,在利用分类模型,对预设的翻译模型进行剪枝处理之前,可先确定参考语言,借助参考语言得到预设的翻译模型。下面结合图4进行说明,图4为本申请实施例提供的再一种翻译模型构建方法的流程示意图。如图4所示,在利用分类模型,将预设的翻译模型进行剪枝处理之前,该翻译模型构建方法还包括:步骤401,根据语料库中每种第一类翻译词对的数量及对应的第二类翻译词对的数量,确定目标参考语言。由于源语言与目标语言的翻译词对的数量小于阈值,直接用包含源语言与目标语言的翻译词对训练得到源语言与目标语言的翻译模型,该翻译模型的翻译质量对比较低。本申请实施例中,可借助于中间语言类型构建源语言与目标语言的翻译模型。在确定作为中间语言类型的目标参考语言时,从语料库中获取第一类型翻译词对及对应的第二类翻译词对,根据语料库中每种第一类翻译词对的数量及对应的第二类翻译词对的数量,确定目标参考语言。可以理解的是,从语料库中获取第一类型翻译词对及第二类翻译词对的方法,与从语料库中获取第一正例语料集中的方法类似,故在此不再赘述。其中,第一类翻译词对及对应的第二类翻译词对中包含的参考语言相同,第一类翻译词对包含源语言及对应的参考语言,第二类翻译词对中包参考语言及对应的目标语言。例如,第一类翻译词对为中英翻译词对,对应的第二类翻译词对为英日翻译词对,第一类翻译词对为中俄翻译词对,对应的第二类翻译词对为俄日翻译词对等。为了提高翻译模型的翻译质量,可将每种第一类翻译词对的数量及对应的第二类翻译词对的数量与预设数量进行比较,将第一类翻译词对的数量及对应的第二类翻译词对的数量均超过预设数量的第一类翻译词对及对应的第二类翻译词对中包含的参考语言作为目标参考语言。需要说明的是,如果有多种源语言与参考语言及对应的参考语言与目标语言的翻译词对都满足数量要求,那么可选取第一类翻译词对的数量及对应的第二类翻译词对的数量之和最大的第一类翻译词对及对应的第二类翻译词对中包含的参考语言作为目标参考语言。例如,语料库中中英翻译词对的数量及对应的英日翻译词对的数量超过预设数量,而中俄翻译词对的数量及对应的俄日翻译词对的数量也超过了预设数量,若中英翻译词对的数量及对应的英日翻译词对的数量之和,大于中俄翻译词对的数量及对应的俄日翻译词对的数量之和,则将中英翻译词对与英日翻译词对包含的参考语言英文作为目标参考语言。步骤402,利用包含参考语言的第一类翻译词对构成的第二正例语料集训练得到第一翻译模型,并利用包含参考语言的第二类翻译词对构成的第三正例语料集训练得到第二翻译模型。本实施例中,对包含目标参考语言的第一类翻译词对构成的第二正例语料集进行训练得到第一翻译模型,以及对包含目标参考语言的第二类翻译词对构成的第三正例语料集进行训练得到第二翻译模型。其中,第一翻译模型为源语言与目标参考语言的翻译模型,第二翻译模型为目标参考语言与目标语言的翻译模型。本实施例中,利用大规模的源语言与参考语言翻译词对,及大规模的参考语言与目标语言的翻译词对训练得到第一翻译模型与第二翻译模型,具有较高的翻译质量。在获取第一翻译模型与第二翻译模型后,将第一翻译模型与第二翻译模型进行融合得到源语言与目标语言的预设的翻译模型。在进行融合时,可将第一翻译模型中的双语数据库中的翻译词对,与第二翻译模型中说的双数据库中的翻译词对进行对应组合,得到预设的翻译模型的双语数据库。例如,表1为中英翻译模型中的双语数据库中的翻译词对,表2为英日翻译模型中的双语数据库中的翻译词对,表3为表1与表2中的翻译词对融合得到翻译词对。表1中文英文河岸riverside河岸bank银行bank存款bank存款deposit表2英文日文riverside河原bank河原bank銀行bank预けるdeposit预ける表3中文(英文)日文河岸(riverside)河原河岸(bank)河原河岸(bank)銀行河岸(bank)预ける银行(bank)河原银行(bank)銀行银行(bank)预ける存款(bank)河原存款(bank)銀行存款(bank)预ける存款(deposit)预ける由表3可以看出,由于英文“bank”存在多义性,导致融合后得到的中日翻译词对中包含不存在互译关系的翻译词对如(河岸:銀行)、(河岸:预ける)、(银行:河原)、(银行:预ける)、(存款:河原)、(存款:銀行)。因此,在根据第一翻译模型和第二翻译模型融合得到预设的翻译模型后,可对预设的翻译模型进行剪枝处理,过滤掉不合法的翻译词对,即过滤掉不存在互译关系的翻译词对,以提高借助于参考语言构建得到的翻译模型的翻译质量。为了实现上述实施例,本申请实施例还提出一种翻译模型构建装置。图5为本申请实施例提供的一种翻译模型构建装置的结构示意图。如图5所示,该翻译模型构建装置包括:第一生成模块510、第二生成模块520、第三生成模块530。第一生成模块510,用于在第一正例语料集中的翻译词对的数量小于阈值时,根据获取的第一正例语料集中的各翻译词对,随机生成负例语料集,其中,第一正例语料集及负例语料集中的翻译词对分别包括源语言及对应的目标语言;第二生成模块520,用于对第一正例语料集及负例语料集进行机器学习,以生成分类模型;第三生成模块530,用于利用分类模型,将预设的翻译模型进行剪枝处理,以生成与源语言及目标语言对应的翻译模型;其中,预设的翻译模型,为将第一翻译模型及第二翻译模型融合后得到的翻译模型,第一翻译模型为利用包括源语言与参考语言的第二正例语料集训练得到的、第二翻译模型为利用包括参考语言与目标语言的第三正例语料集训练得到的。在本申请实施例一种可能的实现方式中,上述第三生成模块530具体用于:将预设翻译模型中的双语数据库中的每个翻译词对分别输入分类模型中,以确定每个翻译词对为合法词对的概率;根据获取的合法词对对预设的翻译模型进行剪枝处理。在本申请实施例一种可能的实现方式中,该装置还可包括:第一确定模块,用于对第一正例语料集及负例语料集中的每个翻译词对进行解析处理,以确定每个翻译词对的特征集;第一确定模块,还用于对预设的翻译模型中的双语数据库中的每个翻译词对进行解析处理,以确定每个翻译词对的特征集。在本申请实施例一种可能的实现方式中,每个翻译词对的特征集中包括以下特征中的至少一个:源语言短语长度、目标语言短语长度、翻译词对长度比、翻译词对互译概率值及翻译词对中每个词的翻译概率。在本申请实施例一种可能的实现方式中,上述第一生成模块510具体用于:将第一正例语料集的各翻译词对中的目标语言进行随机互换,生成负例语料集。在本申请实施例一种可能的实现方式中,该装置还包括:第一获取模块,用于获取翻译模型构建请求,构建请求中包括源语言类型及目标语言类型;第二获取模块,用于根据源语言类型及目标语言类型,从语料库中获取第一正例语料集。在本申请实施例一种可能的实现方式中,该装置还可包括:第二确定模块,用于根据语料库中每种第一类翻译词对的数量及对应的第二类翻译词对的数量,确定目标参考语言;其中,第一类翻译词对及对应的第二类翻译词对中包含的参考语言相同,第一类翻译词对包含源语言及对应的参考语言,第二类翻译词对中包参考语言及对应的目标语言;训练模块,用于利用包含参考语言的第一类翻译词对构成的第二正例语料集训练得到第一翻译模型,并利用包含参考语言的第二类翻译词对构成的第三正例语料集训练得到第二翻译模型。需要说明的是,前述对翻译模型构建方法实施例的解释说明,也适用于该实施例的翻译模型构建装置,故在此不再赘述。本申请实施例的翻译模型构建装置,通过在第一正例语料集中的翻译词对的数量小于阈值时,根据获取的第一正例语料集中的各翻译词对,随机生成负例语料集,其中,第一正例语料集及负例语料集中的翻译词对分别包括源语言及对应的目标语言,对第一正例语料集及负例语料集进行机器学习,以生成分类模型,利用分类模型,将预设的翻译模型进行剪枝处理,以生成与源语言及目标语言对应的翻译模型,其中,预设的翻译模型,为将第一翻译模型及第二翻译模型融合后得到的翻译模型,第一翻译模型为利用包括源语言与参考语言的第二正例语料集训练得到的、第二翻译模型为利用包括参考语言与目标语言的第三正例语料集训练得到的。由此,在源语言与目标语言的双语语料较少时,利用源语言与目标语言的翻译词对得到分类模型,通过分类模型对借助于参考语言的得到的源语言与目标语言的翻译模型进行过滤,大大降低了翻译模型的噪声,提高了翻译模型的翻译质量。为了实现上述实施例,本申请实施例还提出一种计算机设备,包括处理器和存储器;其中,处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于实现如上述实施例所述的翻译模型构建方法。图6示出了适于用来实现本申请实施方式的示例性计算机设备的框图。图6显示的计算机设备12仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。如图6所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(industrystandardarchitecture;以下简称:isa)总线,微通道体系结构(microchannelarchitecture;以下简称:mac)总线,增强型isa总线、视频电子标准协会(videoelectronicsstandardsassociation;以下简称:vesa)局域总线以及外围组件互连(peripheralcomponentinterconnection;以下简称:pci)总线。计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(randomaccessmemory;以下简称:ram)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(compactdiscreadonlymemory;以下简称:cd-rom)、数字多功能只读光盘(digitalvideodiscreadonlymemory;以下简称:dvd-rom)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(localareanetwork;以下简称:lan),广域网(wideareanetwork;以下简称:wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的方法。为了实现上述实施例,本申请实施例还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例所述的翻译模型构建方法。在本说明书的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属
技术领域
的技术人员所理解。在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。本
技术领域
的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1