翻译文本的生成方法和装置、存储介质、电子装置与流程

文档序号：31504122发布日期：2022-09-14 09:43阅读：78来源：国知局

1.本技术涉及人工智能领域，具体而言，涉及一种翻译文本的生成方法和装置、存储介质、电子装置。

背景技术：

2.机器翻译是一种利用机器学习的技术，将一种自然语言翻译成另外一种自然语言的过程。作为计算语言学的一个重要分支，它涉及认知科学、语言学等学科，是人工智能的终极目标之一。
3.目前的机器翻译一般是基于人工智能模型实现，目前的人工智能模型在翻译过程中，没法人工干预，进而会导致翻译正确性受到影响。
4.针对上述的问题，目前尚未提出有效的解决方案。

技术实现要素：

5.本技术实施例提供了一种翻译文本的生成方法和装置、存储介质、电子装置，以至少解决相关技术中人工智能模型在翻译过程中没法人工干预的技术问题。
6.根据本技术实施例的一个方面，提供了一种翻译文本的生成方法，包括：获取第一文本，其中，所述第一文本为采用第一语言的、待翻译为第二语言的文本；展示机器翻译模型对所述第一文本进行翻译得到的第二文本，其中，所述第二文本为采用第二语言的文本；根据与用户的交互，对所述第二文本中的部分词语进行替换，得到第三文本，其中，所述第二文本中被替换的词语与所述第三文本中替换后的词语为所述第一文本中同一目标词语的翻译。
7.可选地，根据与用户的交互，对所述第二文本中的部分词语进行替换，得到第三文本，包括：根据与用户的交互，确定所述第一文本中所述目标词语对应的第一词语；将所述第二文本中与所述目标词语对应的第二词语替换为所述第一词语，得到所述第三文本。
8.可选地，根据与用户的交互，确定所述第一文本中所述目标词语对应的第一词语，包括：在展示界面中展示所述第二文本；在检测到对所述第二文本中与所述目标词语对应的词语的点击操作的情况下，展示下拉框，其中，所述下拉框用于提供所述目标词语的多个候选翻译词；在检测到对所述下拉框中候选翻译词的选择操作的情况下，将所述多个候选翻译词中被选中的候选翻译词作为所述第一词语。
9.可选地，在展示界面中展示所述第二文本的同时，所述方法还包括：在所述展示界面中展示所述第一文本；在检测到对所述第二文本中与所述目标词语对应的词语的点击操作的情况下，所述方法还包括：在所述展示界面内对所述第一文本中的所述目标词语进行高亮展示。
10.可选地，将所述第二文本中与所述目标词语对应的第二词语替换为所述第一词语，得到所述第三文本，包括：将所述第二文本中与所述目标词语对应的第二词语替换为所述第一词语后得到起始文本段，其中，所述起始文本段包括所述第二文本中的所述第二词
语之前连续的词语和所述第一词语，以所述第二文本中的起始词语为起始词语、以所述第一词语为结束词语；将所述起始文本段和所述第一文本输入所述机器翻译模型，得到所述机器翻译模型输出的所述第三文本。
11.可选地，将所述起始文本段和所述第一文本输入所述机器翻译模型，得到所述机器翻译模型输出的所述第三文本，包括：将所述第一文本输入所述机器翻译模型的编码器，其中，所述编码器用于对所述第一文本中为第一语言的词语进行编码；将所述起始文本段输入所述机器翻译模型的解码器，以指定所述第一文本中部分词语的翻译词语，其中，所述解码器用于将所述编码器输入所述第一文本中其他词语的编码解码为第二语言的词语；获取所述解码器输出的所述第三文本。
12.根据本技术实施例的另一方面，还提供了一种翻译文本的生成装置，包括：获取单元，用于获取第一文本，其中，所述第一文本为采用第一语言的、待翻译为第二语言的文本；展示单元，用于展示机器翻译模型对所述第一文本进行翻译得到的第二文本，其中，所述第二文本为采用第二语言的文本；生成单元，用于根据与用户的交互，对所述第二文本中的部分词语进行替换，得到第三文本，其中，所述第二文本中被替换的词语与所述第三文本中替换后的词语为所述第一文本中同一目标词语的翻译。
13.可选地，所述生成单元还用于：根据与用户的交互，确定所述第一文本中所述目标词语对应的第一词语；将所述第二文本中与所述目标词语对应的第二词语替换为所述第一词语，得到所述第三文本。
14.可选地，所述生成单元还用于：在展示界面中展示所述第二文本；在检测到对所述第二文本中与所述目标词语对应的词语的点击操作的情况下，展示下拉框，其中，所述下拉框用于提供所述目标词语的多个候选翻译词；在检测到对所述下拉框中候选翻译词的选择操作的情况下，将所述多个候选翻译词中被选中的候选翻译词作为所述第一词语。
15.可选地，所述生成单元还用于：在展示界面中展示所述第二文本的同时，在所述展示界面中展示所述第一文本；在检测到对所述第二文本中与所述目标词语对应的词语的点击操作的情况下，在所述展示界面内对所述第一文本中的所述目标词语进行高亮展示。
16.可选地，所述生成单元还用于：将所述第二文本中与所述目标词语对应的第二词语替换为所述第一词语后得到起始文本段，其中，所述起始文本段包括所述第二文本中的所述第二词语之前连续的词语和所述第一词语，以所述第二文本中的起始词语为起始词语、以所述第一词语为结束词语；将所述起始文本段和所述第一文本输入所述机器翻译模型，得到所述机器翻译模型输出的所述第三文本。
17.可选地，所述生成单元还用于：将所述第一文本输入所述机器翻译模型的编码器，其中，所述编码器用于对所述第一文本中为第一语言的词语进行编码；将所述起始文本段输入所述机器翻译模型的解码器，以指定所述第一文本中部分词语的翻译词语，其中，所述解码器用于将所述编码器输入所述第一文本中其他词语的编码解码为第二语言的词语；获取所述解码器输出的所述第三文本。
18.根据本技术实施例的另一方面，还提供了一种电子装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器通过计算机程序执行上述的方法。
19.根据本技术的一个方面，提供了一种计算机程序产品或计算机程序，该计算机程
序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述方法中任一实施例的步骤。
20.应用本发明的技术方案，获取第一文本，所述第一文本为采用第一语言的、待翻译为第二语言的文本；展示机器翻译模型对所述第一文本进行翻译得到的第二文本，所述第二文本为采用第二语言的文本；根据与用户的交互，对所述第二文本中的部分词语进行替换，得到第三文本，所述第二文本中被替换的词语与所述第三文本中替换后的词语为所述第一文本中同一目标词语的翻译，可以解决相关技术中人工智能模型在翻译过程中没法人工干预的技术问题。
21.除了上面所描述的目的、特征和优点之外，本发明还有其它的目的、特征和优点。下面将参照图，对本发明作进一步详细的说明。
附图说明
22.为了更清楚地说明本发明的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对本发明保护范围的限定。在各个附图中，类似的构成部分采用类似的编号。
23.图1是根据本技术实施例的一种可选的翻译文本的生成方法的流程图；
24.图2是根据本技术实施例的一种可选的翻译界面的示意图；
25.图3是根据本技术实施例的一种可选的翻译模型的示意图；
26.图4是根据本技术实施例的一种可选的翻译模型的示意图。
具体实施方式
27.下面将结合本发明实施例中附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。
28.通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。
29.在下文中，可在本发明的各种实施例中使用的术语“包括”、“具有”及其同源词仅意在表示特定特征、数字、步骤、操作、元件、组件或前述项的组合，并且不应被理解为首先排除一个或更多个其它特征、数字、步骤、操作、元件、组件或前述项的组合的存在或增加一个或更多个特征、数字、步骤、操作、元件、组件或前述项的组合的可能性。
30.此外，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。
31.除非另有限定，否则在这里使用的所有术语(包括技术术语和科学术语)具有与本发明的各种实施例所属领域普通技术人员通常理解的含义相同的含义。所述术语(诸如在一般使用的词典中限定的术语)将被解释为具有与在相关技术领域中的语境含义相同的含义并且将不被解释为具有理想化的含义或过于正式的含义，除非在本发明的各种实施例中
被清楚地限定。
32.根据本技术实施例的一方面，提供了一种翻译文本的生成方法的方法实施例。本技术实施例的翻译文本的生成方法可以由服务器、终端来执行。其中，终端执行本技术实施例的翻译文本的生成方法也可以是由安装在其上的客户端来执行。图1是根据本技术实施例的一种可选的翻译文本的生成方法的流程图，如图1所示，该方法可以包括以下步骤：
33.步骤s102，获取第一文本，第一文本为采用第一语言的、待翻译为第二语言的文本，如英文文本、中文文本、俄文文本等。
34.步骤s104，展示机器翻译模型对第一文本进行翻译得到的第二文本，第二文本为采用第二语言的文本，第二语言与第一语言不同。
35.步骤s106，根据与用户的交互，对第二文本中的部分词语进行替换，得到第三文本，第二文本中被替换的词语与第三文本中替换后的词语为第一文本中同一目标词语的翻译。
36.可选地，根据与用户的交互，对所述第二文本中的部分词语进行替换，得到第三文本，包括：
37.步骤s1062，根据与用户的交互，确定所述第一文本中所述目标词语对应的第一词语。
38.可在展示界面中展示所述第二文本，同时在所述展示界面中同步展示所述第二文本；在检测到对所述第二文本中与所述目标词语对应的词语的点击操作的情况下，展示下拉框，并在所述展示界面内对所述第一文本中的所述目标词语进行高亮展示，所述下拉框用于提供所述目标词语的多个候选翻译词；在检测到对所述下拉框中候选翻译词的选择操作的情况下，将所述多个候选翻译词中被选中的候选翻译词作为所述第一词语。
39.步骤s1064，将所述第二文本中与所述目标词语对应的第二词语替换为所述第一词语，得到所述第三文本。
40.先将所述第二文本中与所述目标词语对应的第二词语替换为所述第一词语后得到起始文本段，其中，所述起始文本段包括所述第二文本中的所述第二词语之前连续的词语和所述第一词语，以所述第二文本中的起始词语为起始词语、以所述第一词语为结束词语。
41.然后将所述起始文本段和所述第一文本输入所述机器翻译模型，得到所述机器翻译模型输出的所述第三文本，如将所述第一文本输入所述机器翻译模型的编码器，其中，所述编码器用于对所述第一文本中为第一语言的词语进行编码；将所述起始文本段输入所述机器翻译模型的解码器，以指定所述第一文本中部分词语的翻译词语，其中，所述解码器用于将所述编码器输入所述第一文本中其他词语的编码解码为第二语言的词语；获取所述解码器输出的所述第三文本。
42.通过上述步骤，获取第一文本，所述第一文本为采用第一语言的、待翻译为第二语言的文本；展示机器翻译模型对所述第一文本进行翻译得到的第二文本，所述第二文本为采用第二语言的文本；根据与用户的交互，对所述第二文本中的部分词语进行替换，得到第三文本，所述第二文本中被替换的词语与所述第三文本中替换后的词语为所述第一文本中同一目标词语的翻译，可以解决相关技术中人工智能模型在翻译过程中没法人工干预的技术问题。
43.机器翻译模型是使用基于自注意力机制的编码-解码结构的神经网络模型，由编码器和解码器组成，二者均以自注意力层为主，翻译流程主要包括：首先把输入的词映射到高维的向量空间得到词向量，再把词向量输入到编码器，通过自注意力机制得到上下文向量，解码器再根据上下文向量和自注意力机制，通过softmax层输出到目标语言的词向量空间，最后通过词典得到目标语言词汇。由于神经网络模型的特点，对于神经网络模型的人工干预还是较少，人工介入模型内部容易有较大的影响，很少有人工介入已经完成训练的神经网络模型。
44.与机器翻译有较多流程和多个模型不同，神经网络机器翻译主要只有一个神经网络模型。由于其“黑盒”的特点，用户无法介入中间的翻译过程，最多是在多个候选译文中做选择。但是某个词在多个候选译文中并没有理想的译文，也无法单独指定这个词的含义。
45.在统计机器翻译系统中，译文由一个个的短语组成，再通过调序模型调整短语的顺序。这时候，用户可以对短语选择其他候选短语，尤其是在一词多义的情况下，可以明显改善译文的翻译质量。
46.在神经网络机器翻译模型中，所有的计算都是在模型内部，译文是直接生成为句子，很难对模型内部中某一个词进行单独指定翻译，并且，神经网络机器翻译模型翻译时的特点决定了某个词的变化可能会影响后面的译文。
47.因此，本技术针对神经网络机器翻译模型的特点，设计了一套用户可交互式的神经网络机器翻译系统，用户可指定某个词的翻译，进而使翻译更准确也更人性化。
48.针对上述存在的问题以及神经网络机器翻译的特点，本技术提出了一种基于神经网络的可交互机器翻译系统。系统主要分为两部分：前端交互和机器翻译模型翻译。
49.前端简单的交互：如图2所示，用户在翻译某句话后，在译文部分点击某个词后，可依据该语境下的正确翻译结果，然后再下拉框中选择该词的候选译文，按照从左往右的顺序依次选择需要指定译文的词，最终得到新的译文。当用户认为“中和”这个词翻译不准确，点击展开该词的其他候选译文，有“消灭、中性、中立、删除”，然后选择了“消灭”作为译文。
50.机器翻译模型翻译：机器翻译模型接收用户在前端输入的译文，在解码时，通过指定前几个词的翻译，来生成后续的译文，如图3所示，机器翻译模型收到用户指定前几个词的翻译：例如用户指定了“消灭”来替换“中和”，那么收到的指定翻译就为“印度军队挫败渗透企图，消灭”。模型指定该句的译文以“印度军队挫败渗透企图，消灭”为开头，最终得到新的译文。
51.机器翻译模型使用的是transformer结构，如图4所示。
52.其中，各个部分的计算如下：
53.点乘注意力：
[0054][0055][0056]
多头注意力：
[0057]
multihead(q,k,v)＝concat(head1,
…
,headn)
[0058][0059]
其中，head1,
…
,headn为第一个词向量，q,k,v均为词向量，w为权重矩阵，concat是指把向量拼接起来，dk表示k向量的维度，k
t
表示k向量的转置，xi表示第i个x，xj表示第j个x，i取值是1到j，j的取值是所有输入x的维度，表示q向量权重的的第i个分量，表示k向量权重的的第i个分量，表示v向量权重的的第i个分量；
[0060]
前馈神经网络：
[0061]
ffn(x)＝max(0,xw1+b1)w2+b2[0062][0063]
其中，x表示输入向量，w1表示权重，b1和b2为偏差，w2表示第二组权重。
[0064]
最后通过softmax得到目标语言的词向量，再通过词典得到目标语言词汇。其计算如下：
[0065][0066]
其中，θi为权重参数，k为目标语言词表的大小，表示输入为x 时当前的系统参数，k表示词表大小，i表示第i组参数，t表转置，x表示输入。
[0067]
本发明通过指定前面译文的翻译，再结合与用户的交互，实现交互式的机器翻译系统。可让用户以词为最小单位，从候选集中指定译文，以此为据获得后续词的翻译结果。虽然人工介入神经网络机器翻译模型的程度还较少，但这简单的实现进一步加强了用户对于神经网络机器翻译模型的控制，实现了简单的交互式机器翻译，拓宽了机器翻译的应用场景，为未来更多的机器翻译应用带来可能。
[0068]
需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本技术并不受所描述的动作顺序的限制，因为依据本技术，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本技术所必须的。
[0069]
通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如 rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本技术各个实施例所述的方法。
[0070]
根据本技术实施例的另一个方面，还提供了一种用于实施上述翻译文本的生成方法的翻译文本的生成装置。该装置可以包括：
[0071]
获取单元，用于获取第一文本，其中，所述第一文本为采用第一语言的、待翻译为第二语言的文本；展示单元，用于展示机器翻译模型对所述第一文本进行翻译得到的第二
文本，其中，所述第二文本为采用第二语言的文本；生成单元，用于根据与用户的交互，对所述第二文本中的部分词语进行替换，得到第三文本，其中，所述第二文本中被替换的词语与所述第三文本中替换后的词语为所述第一文本中同一目标词语的翻译。
[0072]
可选地，所述生成单元还用于：根据与用户的交互，确定所述第一文本中所述目标词语对应的第一词语；将所述第二文本中与所述目标词语对应的第二词语替换为所述第一词语，得到所述第三文本。
[0073]
可选地，所述生成单元还用于：在展示界面中展示所述第二文本；在检测到对所述第二文本中与所述目标词语对应的词语的点击操作的情况下，展示下拉框，其中，所述下拉框用于提供所述目标词语的多个候选翻译词；在检测到对所述下拉框中候选翻译词的选择操作的情况下，将所述多个候选翻译词中被选中的候选翻译词作为所述第一词语。
[0074]
可选地，所述生成单元还用于：在展示界面中展示所述第二文本的同时，在所述展示界面中展示所述第一文本；在检测到对所述第二文本中与所述目标词语对应的词语的点击操作的情况下，在所述展示界面内对所述第一文本中的所述目标词语进行高亮展示。
[0075]
可选地，所述生成单元还用于：将所述第二文本中与所述目标词语对应的第二词语替换为所述第一词语后得到起始文本段，其中，所述起始文本段包括所述第二文本中的所述第二词语之前连续的词语和所述第一词语，以所述第二文本中的起始词语为起始词语、以所述第一词语为结束词语；将所述起始文本段和所述第一文本输入所述机器翻译模型，得到所述机器翻译模型输出的所述第三文本。
[0076]
可选地，所述生成单元还用于：将所述第一文本输入所述机器翻译模型的编码器，其中，所述编码器用于对所述第一文本中为第一语言的词语进行编码；将所述起始文本段输入所述机器翻译模型的解码器，以指定所述第一文本中部分词语的翻译词语，其中，所述解码器用于将所述编码器输入所述第一文本中其他词语的编码解码为第二语言的词语；获取所述解码器输出的所述第三文本。
[0077]
可选地，本实施例中的具体示例可以参考上述实施例中所描述的示例，本实施例在此不再赘述。
[0078]
可选地，在本实施例中，上述存储介质可以包括但不限于：u盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random accessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0079]
上述本技术实施例序号仅仅为了描述，不代表实施例的优劣。
[0080]
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取的存储介质中。基于这样的理解，本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。
[0081]
在本技术的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。
[0082]
在本技术所提供的几个实施例中，应该理解到，所揭露的客户端，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一
种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。
[0083]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0084]
另外，在本技术各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。
[0085]
以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：贝超宗浩苑聪虎刘清民
技术所有人：中译语通科技股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。