一种语音翻译方法及装置与流程

文档序号：15760983发布日期：2018-10-26 19:17阅读：178来源：国知局

本申请涉及人工智能
技术领域：
，尤其涉及一种语音翻译方法及装置。
背景技术：
：语音翻译是指将源语言的语音数据自动翻译成目标语言的语音数据的过程，其中，源语言与目标语言属于不同的语种。在现有的语音翻译技术中，是将源语言的语音数据直接进行翻译并得到翻译结果，但是，该翻译结果可能并不准确性。例如，源语言的语音数据为中文语音数据“行李必须经过安检吗？”，目标语言的语音数据为英文语音数据“doesleehavetogothroughsecurity？”，但是，该英文语音数据对应的中文含义实际是“李先生通过安检了吗？”，可见，翻译前的中文语音数据“行李必须经过安检吗？”与翻译后的英文语音数据的实际含义“李先生通过安检了吗？”是不同的，即翻译结果不准确。技术实现要素：本申请实施例的主要目的在于提供一种语音翻译方法及装置，能够提高语音翻译结果的准确性。本申请实施例提供了一种语音翻译方法，包括：对用户的源语音数据进行翻译，得到第一翻译文本，其中，所述第一翻译文本的语种与所述源语音数据的语种不同；通过与所述用户进行交互，判断所述第一翻译文本作为所述源语音数据的翻译结果是否正确。可选的，所述判断所述第一翻译文本作为所述源语音数据的翻译结果是否正确之后，还包括：若判断得到所述第一翻译文本作为所述源语音数据的翻译结果是错误的，则对所述第一翻译文本进行修正，并将修正后的文本作为所述源语音数据的翻译结果。可选的，所述通过与所述用户进行交互之前，还包括：判断所述第一翻译文本的翻译质量是否大于预设质量阈值，其中，所述第一翻译文本的翻译质量用于表征所述第一翻译文本作为所述源语音数据的翻译结果的正确性；若否，则执行通过与所述用户进行交互的步骤。可选的，所述判断所述第一翻译文本的翻译质量是否大于预设质量阈值，包括：对所述第一翻译文本进行翻译，得到第二翻译文本，其中，所述第二翻译文本的语种与所述源语音数据的语种相同；根据所述第二翻译文本，判断所述第一翻译文本的翻译质量是否大于预设质量阈值。可选的，所述根据所述第二翻译文本，判断所述第一翻译文本的翻译质量是否大于预设质量阈值，包括：根据所述源语音数据的识别文本以及所述第二翻译文本，判断所述第一翻译文本的翻译质量是否大于预设质量阈值。可选的，所述通过与所述用户进行交互，判断所述第一翻译文本作为所述源语音数据的翻译结果是否正确，包括：利用所述第二翻译文本与所述用户进行交互，判断所述第一翻译文本作为所述源语音数据的翻译结果是否正确。可选的，所述利用所述第二翻译文本与所述用户进行交互，判断所述第一翻译文本作为所述源语音数据的翻译结果是否正确，包括：向所述用户输出第一询问语音，其中，所述第一询问语音用于询问所述源语音数据与所述第二翻译文本的语义是否相似；若接收到所述用户对所述第一询问语音的肯定回答，则所述第一翻译文本作为所述源语音数据的翻译结果是正确的；若接收到所述用户对所述第一询问语音的否定回答，则所述第一翻译文本作为所述源语音数据的翻译结果是错误的。可选的，所述对所述第一翻译文本进行修正，包括：采用文本匹配的方式，对所述第一翻译文本进行修正。可选的，所述采用文本匹配的方式，对所述第一翻译文本进行修正，包括：将所述源语音数据的识别文本与数据库中的文本数据进行匹配操作，其中，所述数据库中存储至少一组语句对，所述语句对包括第一样本文本以及对所述第一样本文本进行正确翻译后的第二样本文本，所述第一样本文本的语种与所述源语音数据的语种相同，所述第二样本文本的语种与所述第一翻译文本的语种相同；通过所述匹配操作，获取与所述源语音数据的识别文本最相似的第一样本文本；根据所述最相似的第一样本文本，对所述第一翻译文本进行修正。可选的，所述根据所述最相似的第一样本文本，对所述第一翻译文本进行修正，包括：利用所述最相似的第一样本文本与所述用户进行交互，实现对所述第一翻译文本的修正。可选的，所述利用所述最相似的第一样本文本与所述用户进行交互，实现对所述第一翻译文本的修正，包括：向所述用户输出第二询问语音，其中，所述第二询问语音用于询问所述源语音数据与所述最相似的第一样本文本的语义是否相似；若接收到所述用户对所述第二询问语音的肯定回答，则从所述最相似的第一样本文本所属的语句对中获取第二样本文本，作为对所述第一翻译文本进行成功修正后的文本。可选的，所述方法还包括：若接收到所述用户对所述第二询问语音的否定回答，则输出提示语音，其中，所述提示语音用于提示所述用户重复所述源语音数据、或者更换所述源语音数据的说法。本申请实施例还提供了一种语音翻译装置，包括：语音翻译单元，用于对用户的源语音数据进行翻译，得到第一翻译文本，其中，所述第一翻译文本的语种与所述源语音数据的语种不同；用户交互单元，用于通过与所述用户进行交互，判断所述第一翻译文本作为所述源语音数据的翻译结果是否正确。可选的，所述装置还包括：文本修正单元，用于若判断得到所述第一翻译文本作为所述源语音数据的翻译结果是错误的，则对所述第一翻译文本进行修正，并将修正后的文本作为所述源语音数据的翻译结果。可选的，所述装置还包括：质量判断单元，用于判断所述第一翻译文本的翻译质量是否大于预设质量阈值，其中，所述第一翻译文本的翻译质量用于表征所述第一翻译文本作为所述源语音数据的翻译结果的正确性；若否，则触发所述用户交互单元来通过与所述用户进行交互判断所述第一翻译文本作为所述源语音数据的翻译结果是否正确。可选的，所述质量判断单元包括：反向翻译子单元，用于对所述第一翻译文本进行翻译，得到第二翻译文本，其中，所述第二翻译文本的语种与所述源语音数据的语种相同；质量判断子单元，用于根据所述第二翻译文本，判断所述第一翻译文本的翻译质量是否大于预设质量阈值。可选的，所述质量判断子单元，具体用于根据所述源语音数据的识别文本以及所述第二翻译文本，判断所述第一翻译文本的翻译质量是否大于预设质量阈值。可选的，所述用户交互单元，具体用于利用所述第二翻译文本与所述用户进行交互，判断所述第一翻译文本作为所述源语音数据的翻译结果是否正确。可选的，所述用户交互单元包括：第一询问子单元，用于向所述用户输出第一询问语音，其中，所述第一询问语音用于询问所述源语音数据与所述第二翻译文本的语义是否相似；结果确定子单元，用于若接收到所述用户对所述第一询问语音的肯定回答，则所述第一翻译文本作为所述源语音数据的翻译结果是正确的；若接收到所述用户对所述第一询问语音的否定回答，则所述第一翻译文本作为所述源语音数据的翻译结果是错误的。可选的，所述文本修正单元，具体用于采用文本匹配的方式，对所述第一翻译文本进行修正。可选的，所述文本修正单元包括：文本匹配子单元，用于将所述源语音数据的识别文本与数据库中的文本数据进行匹配操作，其中，所述数据库中存储至少一组语句对，所述语句对包括第一样本文本以及对所述第一样本文本进行正确翻译后的第二样本文本，所述第一样本文本的语种与所述源语音数据的语种相同，所述第二样本文本的语种与所述第一翻译文本的语种相同；文本获取子单元，用于通过所述匹配操作，获取与所述源语音数据的识别文本最相似的第一样本文本；文本修正子单元，用于根据所述最相似的第一样本文本，对所述第一翻译文本进行修正。可选的，所述文本修正子单元，具体用于利用所述最相似的第一样本文本与所述用户进行交互，实现对所述第一翻译文本的修正。可选的，所述文本修正子单元包括：第二询问子单元，用于向所述用户输出第二询问语音，其中，所述第二询问语音用于询问所述源语音数据与所述最相似的第一样本文本的语义是否相似；修正完成子单元，用于若接收到所述用户对所述第二询问语音的肯定回答，则从所述最相似的第一样本文本所属的语句对中获取第二样本文本，作为对所述第一翻译文本进行成功修正后的文本。可选的，所述文本修正子单元还包括：语音提示子单元，用于若接收到所述用户对所述第二询问语音的否定回答，则输出提示语音，其中，所述提示语音用于提示所述用户重复所述源语音数据、或者更换所述源语音数据的说法。本申请实施例还提供了一种语音翻译装置，包括：处理器、存储器、系统总线；所述处理器以及所述存储器通过所述系统总线相连；所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行上述语音翻译方法中的任意一种实现方式。本申请实施例还提供了一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行上述语音翻译方法中的任意一种实现方式。本申请实施例提供的一种语音翻译方法及装置，对用户的源语音数据进行翻译，得到第一翻译文本，该第一翻译文本的语种与源语音数据的语种不同，然后，通过与用户进行交互，判断第一翻译文本作为源语音数据的翻译结果是否正确。可见，通过对第一翻译文本作为源语音数据的翻译结果是否正确进行判断，可以基于判断结果对第一翻译文本进行处理，从而可以提高翻译结果的准确性。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种语音翻译方法的流程示意图；图2为本申请实施例提供的一种翻译质量判定方法的流程示意图；图3为本申请实施例提供的一种判断翻译结果是否可信的方法流程示意图；图4为本申请实施例提供的一种翻译文本修正方法的流程示意图；图5为本申请实施例提供的一种语音翻译装置的组成示意图；图6为本申请实施例提供的一种语音翻译装置的硬件结构示意图。具体实施方式语音翻译是指将源语言的语音数据(即翻译前的语音数据)自动翻译成目标语言的语音数据(即翻译后的语音数据)的过程，一般地，语音翻译技术涉及语音识别、机器翻译和语音合成这三个主要组成部分。其中，语音识别是指通过语音识别技术将源语言的语音数据进行识别，生成源语言文本；机器翻译是指通过机器翻译技术将源语言文本翻译成目标语言文本；语音合成是指通过语音合成技术将目标语言文本合成为目标语言的语音数据。随着语音翻译技术的应用越来越广泛，人们对翻译结果的准确性要求也越来越高。一种语音翻译方法是通过一轮人机对话实现语音翻译，即，通过一次输入和一次输出实现语音翻译，输入的是源语言的语音数据，输出的是目标语言的语音数据，具体是由用户将所需翻译的源语言的语音数据输入到语音翻译设备中，语音翻译设备再通过语音识别、机器翻译和语音合成等步骤，将源语言的语音数据自动翻译成目标语言的语音数据，并反馈给用户，但是，在此过程中，语音识别、机器翻译的结果都有可能会出现偏差，从而导致最后输出的目标语言的语音数据不准确，也就是说，用户只能被动的接受语音翻译设备的一次性翻译结果，而当翻译结果错误时，语音翻译设备无法对错误翻译结果进行及时修正，从而降低了翻译结果的准确性。为此，本申请实施例提供了一种语音翻译方法，增加了对翻译结果的修正功能，即，可以对上述一次性翻译结果的准确性进行评估，当评估结果表示翻译结果的准确性较低时，可以对该翻译结果进行修正，具体可以通过与用户进行交互，根据交互结果进行修正，从而提高了翻译结果的准确性。需要说明的是，本申请实施例提供的语音翻译方法，不对其应用场景进行限制，比如，该方法可以用于用户出国旅游、出入境安检等需要翻译的场景。为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。第一实施例参见图1，为本实施例提供的一种语音翻译方法的流程示意图，该语音翻译方法包括以下步骤：s101：对用户的源语音数据进行翻译，得到第一翻译文本，其中，所述第一翻译文本的语种与所述源语音数据的语种不同。本实施例将翻译前的语音数据(也即待翻译语音)称为源语音数据；并且，本实施例不限制源语音数据的语种类型，比如，源语音数据可以是中文语音、或英文语音等。本实施例将翻译后的文本数据称为第一翻译文本；并且，本实施例不限制第一翻译文本的语种类型，只要第一翻译文本与源语音数据属于不同的语种类型即可，比如，源语音数据是中文语音，第一翻译文本是英文文本，又比如，源语音数据是英文语音，第一翻译文本是中文文本。在本实施例中，可以通过语音识别技术对源语音数据进行语音识别，得到源语音数据的识别文本a1，再通过机器翻译技术对识别文本a1进行机器翻译，得到第一翻译文本b1。需要说明的是，本实施例中的语音识别技术可以是现有的或未来出现的任意一种语音识别技术，同样地，本实施例中的机器翻译技术也可以是现有的或未来出现的任意一种机器翻译技术。例如，在出入境安检时，用户希望通过语音翻译设备与安检人员进行对话，假设用户说的源语音数据为“行李必须经过安检吗？”，语音翻译设备对其进行语音识别后，得到的识别文本a1为“李必须经过安检吗？”，再将识别文本a1进行翻译(中译英)，得到的第一翻译文本b1是“doesleehavetogothroughsecurity？”。可见，对源语音数据进行语音识别时，其识别文本a1出现了识别错误。s102：通过与所述用户进行交互，判断所述第一翻译文本作为所述源语音数据的翻译结果是否正确。在本实施例中，语音翻译设备可以与用户进行交互，具体可以采用语音交互、或文本交互等方式，并根据交互结果，判断第一翻译文本作为源语音数据的翻译结果是否正确。如果判断得到第一翻译文本作为源语音数据的翻译结果是正确的，则可以将第一翻译文本b1作为源语音数据的翻译结果。此时，可以进一步对第一翻译文本b1进行语音合成，得到目标语音数据，并将目标语音数据直接反馈给用户，从而结束本轮翻译。当然，当将第一翻译文本b1作为源语音数据的文本翻译结果后，也可以对其进行其它处理，本实施例不对后续处理方式进行限制。需要说明的是，如果判断得到第一翻译文本作为源语音数据的翻译结果是错误的，可以通过后续第四实施例对第一翻译文本b1进行修正处理，或者，请求用户重复一遍源语音数据、或者换一种与源语音数据在语义上相似的说法，以便开启新一轮的翻译交互。综上，本实施例提供的一种语音翻译方法，对用户的源语音数据进行翻译，得到第一翻译文本，该第一翻译文本的语种与源语音数据的语种不同，然后，通过与用户进行交互，判断第一翻译文本作为源语音数据的翻译结果是否正确。可见，通过对第一翻译文本作为源语音数据的翻译结果是否正确进行判断，可以基于判断结果对第一翻译文本进行处理，从而可以提高翻译结果的准确性。第二实施例在本实施例中，还可以在第一实施例中的判断步骤s102之前，即，可以在通过人机交互方式判断第一翻译文本作为源语音数据的翻译结果是否正确之前，先由机器(即语音翻译设备)判断第一翻译文本作为源语音数据的翻译结果是否正确。因此，在第一实施例中的判断步骤s102之前，还可以包括：判断所述第一翻译文本的翻译质量是否大于预设质量阈值，其中，所述第一翻译文本的翻译质量用于表征所述第一翻译文本作为所述源语音数据的翻译结果的正确性；若否，则执行第一实施例中的判断步骤s102。在本实施例中，可以评估第一翻译文本b1的翻译质量，如果其翻译质量不高于预先设定的质量阈值，这里称其为预设质量阈值，则认为第一翻译文本b1作为源语音数据的翻译结果是不可信的，即第一翻译文本b1作为源语音数据的翻译结果是错误的，此时，可以继续执行步骤s102，来对第一翻译文本b1作为翻译结果的正确性做进一步判断。反之，如果第一翻译文本b1的翻译质量高于预设质量阈值，则认为第一翻译文本b1作为源语音数据的翻译结果是可信的，即第一翻译文本作为源语音数据的翻译结果是正确的，此时，可以将第一翻译文本b1作为源语音数据的翻译结果，进一步地，可以对第一翻译文本b1进行语音合成，得到目标语音数据，并将目标语音数据直接反馈给用户，从而结束本轮翻译。当然，当将第一翻译文本b1作为源语音数据的文本翻译结果后，也可以对其进行其它处理，本实施例不对后续处理方式进行限制。下面将对上述翻译质量判断步骤(即“判断所述第一翻译文本的翻译质量是否大于预设质量阈值”)的具体实现方式进行介绍。参见图2，为本实施例提供的一种翻译质量判定方法的流程示意图，该翻译质量判定方法包括以下步骤：s201：对所述第一翻译文本进行翻译，得到第二翻译文本，其中，所述第二翻译文本的语种与所述源语音数据的语种相同。在本实施例中，可以对第一翻译文本b1进行反向翻译，得到第二翻译文本a2。其中，第一翻译文本b1的语种为翻译后语言的语种，比如英文；第二翻译文本a2的语种为翻译前语言的语种，比如中文。例如，继续上述例子，假设第一翻译文本b1是“doesleehavetogothroughsecurity？”，对其进行反向翻译后得到的第二翻译文本a2是“李先生通过安检了吗？”。s202：根据所述第二翻译文本，判断所述第一翻译文本的翻译质量是否大于预设质量阈值。在本实施例中，可以基于第二翻译文本a2，来对第一翻译文本b1的翻译质量进行判定。在一种实现方式中，本步骤s202具体可以包括：根据所述源语音数据的识别文本以及所述第二翻译文本，判断所述第一翻译文本的翻译质量是否大于预设质量阈值。在本步骤202的具体实现方式中，具体可以利用bleu(bilingualevaluationunderstudy)算法，判断所述第一翻译文本的翻译质量是否大于预设质量阈值。具体来讲，bleu算法是一种对机器翻译结果的评测算法，用于评估一种自然语言翻译成另外一种自然语言的翻译质量。具体算法如下：首先，为了对第一翻译文本b1的翻译效果进行全面考虑，需要依次从1个词为基础单元(1-gram)到多个词为基础单元(n-gram)等多个角度，去统计识别文本a1与第二翻译文本a2之间可以匹配的基础单元个数，在统计过程中，不考虑各个基础单元在文本中所处的位置。然后，根据匹配出的基础单元个数，分别计算第二翻译文本a2在各阶基础单元下的匹配准确率。可以按照下面公式，计算第二翻译文本a2在各阶基础单元i-gram(i＝1、2…n)下的匹配准确率percison：其中，corret是第二翻译文本a2中与识别文本a1正确匹配的同阶基础单元个数，output_length是第二翻译文本a2中的同阶基础单元的总数。例如，继续上述例子，假设识别文本a1是“李必须经过安检吗？”、第二翻译文本a2是“李先生通过安检了吗？”，则匹配准确率percison的计算结果如下表1所示。表1正确匹配的基础单元匹配准确率percison1-gram李、过、安、检、吗、？6/10＝0.62-gram过安、安检、吗？3/9＝0.333-gram过安检1/8＝0.1254-gram(无)0/7＝0然后，还要考虑对第二翻译文本a2中的冗余单词进行惩罚，所以，引入了长度惩罚因子来解决这个问题，其原则是，第二翻译文本a2越长，惩罚扣分则越多，长度惩罚因子c的计算公式如下：c＝min(1,l1/l2)(2)其中，l1是识别文本a1的长度，l2是第二翻译文本a2的长度。在公式(2)中，如果识别文本a1和第二翻译文本a2为中文文本，可以以字为单位计算文本长度。例如，当识别文本a1是“李必须经过安检吗？”，其长度为9；当第二翻译文本a2是“李先生通过安检了吗？”，其长度为10。最后，当按照上述公式(1)和(2)分别计算得到匹配准确率corret和长度惩罚因子c后，可以计算第二翻译文本a2的bleu分数。具体可以选择某阶基础单元对应的bleu分数，比如选择4-igram对应的bleu分数，计算公式如下所示：bleu4-gram＝c*f(4-gram)(3)其中，bleu4-gram为第二翻译文本a2的bleu分数，c为长度惩罚因子，f是对1-gram、2-gram、3-gram、4-gram对应的匹配准确率的处理函数。例如，当识别文本a1是“李必须经过安检吗？”、第二翻译文本a2是“李先生通过安检了吗？”时，将通过公式(1)计算得到的各个匹配准确率(如表1所述)以及通过公式(2)计算得到的长度惩罚因子代入公式(3)，可以计算得到第二翻译文本a2的bleu分数为20.56。在本实施例中，可以预先设置一个翻译评分阈值，这里将该翻译评分阈值作为预设质量阈值，比如将该阈值设置为50，由于上述计算得到的分数20.56小于阈值50，因此，可以判定第一翻译文本b1作为源语音数据的翻译结果是不可信的，比如上述第一翻译文本b1“doesleehavetogothroughsecurity？”是不可信的；反之，当bleu分数大于或等于阈值50，则判定第一翻译文本b1作为源语音数据的翻译结果是可信的。综上，本实施例提供的一种翻译质量判定方法，可以对第一翻译文本进行反向翻译，得到第二翻译文本，并基于源语音数据的识别文本以及第二翻译文本，采用bleu算法对第二翻译文本进行评分，从而可以根据评分结果对第一翻译文本的翻译质量进行判定，实现了翻译质量的评估问题。第三实施例在本实施例中，若通过上述第二实施例判断得到第一翻译文本的翻译质量不大于预设质量阈值，即判断第一翻译文本b1作为源语音数据的翻译结果不可信之后，由于语音翻译设备的判断结果可能并不准确，因此，语音翻译设备可以通过第一实施例中的步骤s102与用户进行交互，基于用户的交互反馈，来判断第一翻译文本b1是否是源语音数据的正确翻译结果。在本实施例的一种实现方式中，第一实施例中的步骤s102具体可以包括：利用所述第二翻译文本与所述用户进行交互，判断所述第一翻译文本作为所述源语音数据的翻译结果是否正确。在本实施方式中，可以将第二翻译文本a2作为与用户进行交互的内容，并根据用户反馈结果进行判断。具体可以按照以下方式实现该判断步骤。如图3所示，为本实施例提供的一种判断翻译结果是否可信的方法流程示意图，可以包括以下步骤：s301：向所述用户输出第一询问语音，其中，所述第一询问语音用于询问所述源语音数据与所述第二翻译文本的语义是否相似。在本实施例中，可以将第二翻译文本a2合成语音后与用户进行交互，其交互的目的是询问用户想要翻译的语句是不是第二翻译文本a2(即源语音数据与第二翻译文本a2的语义是否相似)，为便于描述和区分，本实施例将该询问用户的语音称为第一询问语音，该第一询问语音具体可以是“您想要翻译的是第二翻译文本a2吗？”。例如，假设第一翻译文本b1是“doesleehavetogothroughsecurity？”，通过第二实施例s201对其进行反向翻译得到第二翻译文本a2是“李先生通过安检了吗？”，当利用bleu算法对该第二翻译文本a2进行评分，比如得到分值为20.56分，由于其低于预设质量阈值50分，则将反向翻译后的第二翻译文本a2合成第一询问语音，比如“请问您想翻译的是“李先生通过安检了吗？””。此时，语音翻译设备将该第一询问语音反馈给用户，并等待用户的回答。s302：若接收到所述用户对所述第一询问语音的肯定回答，则所述第一翻译文本作为所述源语音数据的翻译结果是正确的。用户可以以语音或按键等方式，对第一询问语音作出肯定回答，比如，用户可以向语音翻译设备输入语音“是的”、或者在语音翻译设备上按下“ok”或“确认”键等。在这种情况下，语音翻译设备认为第一翻译文本b1作为源语音数据的翻译结果是可信的，即，认为第一翻译文本b1作为源语音数据的翻译结果是正确的，因此，可以通过步骤s103将第一翻译文本b1作为源语音数据的翻译结果。s303：若接收到所述用户对所述第一询问语音的否定回答，则所述第一翻译文本作为所述源语音数据的翻译结果是错误的。用户可以语音或按键等方式，对第一询问语音作出否定回答，比如，用户可以向语音翻译设备输入语音“不是”、或者在语音翻译设备上按下“no”键等。在这种情况下，语音翻译设备认为第一翻译文本b1作为源语音数据的翻译结果是不可信的，即，认为第一翻译文本b1作为源语音数据的翻译结果是错误的。综上，本实施例提供的一种判断翻译结果是否可信的方法，可以向用户输出第一询问语音，该第一询问语音用于询问源语音数据与第二翻译文本的语义是否相似；若接收到肯定回答，则认为第一翻译文本作为源语音数据的翻译结果是可信的，反之，若接收到否定回答，则认为第一翻译文本作为源语音数据的翻译结果是不可信的。可见，通过与用户进行人机交互，可以确认第一翻译文本是否正确，从而保证了翻译结果的准确性。第四实施例在本实施例中，当第一实施例通过步骤s102判断所述第一翻译文本作为所述源语音数据的翻译结果是错误的时，可以进一步对所述第一翻译文本进行修正，并将修正后的文本作为所述源语音数据的翻译结果。当修正成功后，可以将修正后的文本数据作为源语音数据的文本翻译结果，此时，可以进一步对修正后的文本数据进行语音合成，得到目标语音数据，并将目标语音数据直接反馈给用户，从而结束本轮翻译。当然，当将修正成功后的文本数据作为源语音数据的文本翻译结果后，也可以对其进行其它处理，本实施例不对后续处理方式进行限制。可见，本实施例增加了对翻译结果的修正功能，即，可以对第一翻译文本的翻译质量进行评估，当评估结果表示第一翻译文本作为翻译结果的翻译质量较低时，可以对该翻译结果进行修正，从而提高了翻译结果的准确性。需要说明的是，本申请可以在上述任一实施例的基础上，按照本实施例提供的修正方法对第一翻译文本b1进行修正。在本实施例的一种实现方式中，具体可以采用文本匹配的方式，对第一翻译文本b1进行修正，接下来，将对本修正步骤的具体实现方式进行介绍。参见图4，为本实施例提供的一种翻译文本修正方法的流程示意图，该翻译文本修正方法包括以下步骤：s401：将所述源语音数据的识别文本与数据库中的文本数据进行匹配操作。在本实施例中，可以预先构建一个数据库，其中，所述数据库中存储至少一组语句对，所述语句对包括第一样本文本以及对所述第一样本文本进行正确翻译后的第二样本文本，所述第一样本文本的语种与所述源语音数据的语种(翻译前语言的语种)相同，所述第二样本文本的语种与所述第一翻译文本的语种(翻译后语言的语种)相同。具体来讲，可以预先收集大量的第一样本文本以及对第一样本文本进行正确翻译后的第二样本文本，将相互对应的第一样本文本和第二样本文本形成语句对，利用这些语句对构建数据库，该数据库可以是语音翻译设备的本地数据库、也可以是与语音翻译设备进行通信的云服务器侧的数据库。在本实施例中，该数据库可以根据具体的应用需求进行构建，即，该数据库可以只存储与具体应用场景相关的语句对，例如，用户需要在出入境安检时使用语音翻译设备，那么，可以预先在该数据库中存储出入境安检常用的语句对；当然，该数据库中也可以存储多个应用场景相关的语句对，在实际应用时，可以根据用户的源语音数据，自动判定应用场景，然后选择相应应用场景的语句对集合。需要说明的是，本实施例不限制某一应用场景下的语句对的数量，比如1-4万个左右的语句对，但为了达到修正效果，需尽量涵盖与相应应用场景相关的常用或不常用语句对。以出入境安检场景为例，某语句对在数据库中的存储格式如下：{"cn":"行李必须经过安检吗？","update_time":"20171018t173941","en":"musttheluggagebecheckedbysecurity？","create_time":"20171018t173941","id":"00000001"}其中：cn：表示中文语句；en：表示对应的英文语句；update_time：表示上传数据库时间；create_time：表示制作语句对的时间；id：表示数据对在数据库中的唯一标识。在本实施例中，将源语音数据的识别文本a1与数据库中的文本数据进行匹配，比如，可以采用doc2vec算法进行匹配，其中，doc2vec又叫做paragraph2vec或sentenceembeddings，是一种非监督式算法。s402：通过所述匹配操作，获取与所述源语音数据的识别文本最相似的第一样本文本。通过将识别文本a1与数据库中的文本数据进行匹配，得到数据库中与识别文本a1最相似的第一样本文本，这里简称其为样本文本a3。在进行匹配时，可以先将识别文本a1向量化后，得到识别文本a1的句向量，然后，对于数据库中与识别文本a1为相同语种的每一第一样本文本，分别计算识别文本a1的句向量与每一第一样本文本的句向量之间的距离，选择距离最近的第一样本文本，作为与识别文本a1最相似的样本文本a3。例如，当利用doc2vec算法进行匹配时，假设识别文本a1为“李必须经过安检吗？”，将其与数据库进行文本匹配，若确定id为“00000001”的第一样本文本“行李必须经过安检吗？”的句向量与“李必须经过安检吗？”的句向量之间的距离最短，则将id为“00000001”的第一样本文本“行李必须经过安检吗？”，作为与识别文本a1最相似的样本文本a3。s403：根据所述最相似的第一样本文本，对所述第一翻译文本进行修正。在本实施例中，当获取到与源语音数据的识别文本a1最相似的第一样本文本，即样本文本a3，可以利用样本文本a3对第一翻译文本b1进行修正。在本实施例的一种实现方式中，可以直接将样本文本a3所属的语句对中的第二样本文本，作为对第一翻译文本进行成功修正后的文本。在本实施例的另一种实现方式中，步骤s403具体可以利用所述最相似的第一样本文本与所述用户进行交互，实现对所述第一翻译文本的修正。在本实现方式中，可以将所述最相似的第一样本文本即样本文本a3，作为与用户进行交互的内容，并根据用户反馈结果对第一翻译文本的修正。步骤s403的该具体实现方式，可以包括以下步骤a-b：步骤a：向所述用户输出第二询问语音，其中，所述第二询问语音用于询问所述源语音数据与所述最相似的第一样本文本的语义是否相似。可以将从数据库匹配出的样本文本a3，合成语音后与用户进行交互，其交互的目的是询问用户想要翻译的语句是否是样本文本a3(即源语音数据与样本文本a3的语义是否相似)，为便于描述和区分，本实施例将该询问用户的语音称为第二询问语音，该第二询问语音具体可以是“您想要翻译的是样本文本a3吗？”。例如，假设样本文本a3为“行李必须经过安检吗？”，则第二询问语音可以是“请问您想翻译的是“行李必须经过安检吗？””。此时，语音翻译设备将该第二询问语音反馈给用户，并等待用户的回答。步骤b：若接收到所述用户对所述第二询问语音的肯定回答，则从所述最相似的第一样本文本所属的语句对中获取第二样本文本，作为对所述第一翻译文本进行成功修正后的文本。用户可以以语音或按键等方式，对第二询问语音作出肯定回答，比如，用户可以向语音翻译设备输入语音“是的”、或者在语音翻译设备上按下“ok”或“确认”键等。在这种情况下，可以通过查询数据库，从样本文本a3所属的语句对中获取第二样本文本，这里将其称为样本文本b3，将样本文本b3作为对第一翻译文本进行成功修正后的文本。例如，用户听到语音翻译设备发出第二询问语音“请问你想翻译的是“行李必须经过安检吗？””，如果回答的结果为“是的”，此时，语音翻译设备认为用户想要翻译的是样本文本a3：“行李必须经过安检吗？”，并将语句对中与之对应的样本文本b3“musttheluggagebecheckedbysecurity？”作为对第一翻译文本b1进行成功修正后的文本，修正成功。进一步地，用户也可能对第二询问语音作出否定回答，因此，本实施例还可以包括：步骤c：若接收到所述用户对所述第二询问语音的否定回答，则输出提示语音，其中，所述提示语音用于提示所述用户重复所述源语音数据、或者更换所述源语音数据的说法。用户可以语音或按键等方式，对第二询问语音作出否定回答，比如，用户可以向语音翻译设备输入语音“不是”、或者在语音翻译设备上按下“no”键等。在这种情况下，认为修正失败，此时，语音翻译设备可以以语音方式，请求用户重复一遍源语音数据、或者换一种与源语音数据在语义上相似的说法，以便开启新一轮的翻译交互。综上，本实施例提供的一种翻译文本修正方法，将源语音数据的识别文本与数据库中的文本数据进行匹配操作，以获取与识别文本最相似的语句，然后根据该最相似的语句，对第一翻译文本进行修正。可见，本实施例可以预先积累各翻译方向、各应用场景下的语句对，并存储在数据库中，可通过匹配算法，在数据库中查找与识别文本最相似的语句，将该语句的翻译文本作为修正后的文本，从而实现了文本修正。第五实施例本实施例将对一种语音翻译装置进行介绍，相关内容请参见上述方法实施例。需要说明的是，该语音翻译装置可以是上述语音翻译设备、也可以是上述语音翻译设备中的一部分。参见图5，为本实施例提供的一种语音翻译装置的组成示意图，该装置500包括：语音翻译单元501，用于对用户的源语音数据进行翻译，得到第一翻译文本，其中，所述第一翻译文本的语种与所述源语音数据的语种不同；用户交互单元502，用于通过与所述用户进行交互，判断所述第一翻译文本作为所述源语音数据的翻译结果是否正确。在本实施例的一种实现方式中，所述装置500还可以包括：文本修正单元，用于若判断得到所述第一翻译文本作为所述源语音数据的翻译结果是错误的，则对所述第一翻译文本进行修正，并将修正后的文本作为所述源语音数据的翻译结果。在本实施例的一种实现方式中，所述装置500还可以包括：质量判断单元，用于判断所述第一翻译文本的翻译质量是否大于预设质量阈值，其中，所述第一翻译文本的翻译质量用于表征所述第一翻译文本作为所述源语音数据的翻译结果的正确性；若否，则触发所述用户交互单元502来通过与所述用户进行交互判断所述第一翻译文本作为所述源语音数据的翻译结果是否正确。在本实施例的一种实现方式中，所述质量判断单元包括：反向翻译子单元，用于对所述第一翻译文本进行翻译，得到第二翻译文本，其中，所述第二翻译文本的语种与所述源语音数据的语种相同；质量判断子单元，用于根据所述第二翻译文本，判断所述第一翻译文本的翻译质量是否大于预设质量阈值。在本实施例的一种实现方式中，所述质量判断子单元，具体用于根据所述源语音数据的识别文本以及所述第二翻译文本，判断所述第一翻译文本的翻译质量是否大于预设质量阈值。在本实施例的一种实现方式中，所述用户交互单元502，具体可以用于利用所述第二翻译文本与所述用户进行交互，判断所述第一翻译文本作为所述源语音数据的翻译结果是否正确。在本实施例的一种实现方式中，所述用户交互单元502可以包括：第一询问子单元，用于向所述用户输出第一询问语音，其中，所述第一询问语音用于询问所述源语音数据与所述第二翻译文本的语义是否相似；结果确定子单元，用于若接收到所述用户对所述第一询问语音的肯定回答，则所述第一翻译文本作为所述源语音数据的翻译结果是正确的；若接收到所述用户对所述第一询问语音的否定回答，则所述第一翻译文本作为所述源语音数据的翻译结果是错误的。在本实施例的一种实现方式中，所述文本修正单元，具体可以用于采用文本匹配的方式，对所述第一翻译文本进行修正。在本实施例的一种实现方式中，所述文本修正单元可以包括：文本匹配子单元，用于将所述源语音数据的识别文本与数据库中的文本数据进行匹配操作，其中，所述数据库中存储至少一组语句对，所述语句对包括第一样本文本以及对所述第一样本文本进行正确翻译后的第二样本文本，所述第一样本文本的语种与所述源语音数据的语种相同，所述第二样本文本的语种与所述第一翻译文本的语种相同；文本获取子单元，用于通过所述匹配操作，获取与所述源语音数据的识别文本最相似的第一样本文本；文本修正子单元，用于根据所述最相似的第一样本文本，对所述第一翻译文本进行修正。在本实施例的一种实现方式中，文本修正子单元，具体可以用于利用所述最相似的第一样本文本与所述用户进行交互，实现对所述第一翻译文本的修正。在本实施例的一种实现方式中，所述文本修正子单元可以包括：第二询问子单元，用于向所述用户输出第二询问语音，其中，所述第二询问语音用于询问所述源语音数据与所述最相似的第一样本文本的语义是否相似；修正完成子单元，用于若接收到所述用户对所述第二询问语音的肯定回答，则从所述最相似的第一样本文本所属的语句对中获取第二样本文本，作为对所述第一翻译文本进行成功修正后的文本。在本实施例的一种实现方式中，所述文本修正子单元还可以包括：语音提示子单元，用于若接收到所述用户对所述第二询问语音的否定回答，则输出提示语音，其中，所述提示语音用于提示所述用户重复所述源语音数据、或者更换所述源语音数据的说法。第六实施例本实施例将对另一种语音翻译装置进行介绍，相关内容请参见上述方法实施例。参见图6，为本实施例提供的一种语音翻译装置的硬件结构示意图，所述语音交互装置600包括存储器601和接收器602，以及分别与所述存储器601和所述接收器602连接的处理器603，所述存储器601用于存储一组程序指令，所述处理器603用于调用所述存储器601存储的程序指令执行如下操作：对用户的源语音数据进行翻译，得到第一翻译文本，其中，所述第一翻译文本的语种与所述源语音数据的语种不同；通过与所述用户进行交互，判断所述第一翻译文本作为所述源语音数据的翻译结果是否正确。在本实施例的一种实现方式中，所述处理器603还用于调用所述存储器601存储的程序指令执行如下操作：若判断得到所述第一翻译文本作为所述源语音数据的翻译结果是错误的，则对所述第一翻译文本进行修正，并将修正后的文本作为所述源语音数据的翻译结果。在本实施例的一种实现方式中，所述处理器603还用于调用所述存储器601存储的程序指令执行如下操作：判断所述第一翻译文本的翻译质量是否大于预设质量阈值，其中，所述第一翻译文本的翻译质量用于表征所述第一翻译文本作为所述源语音数据的翻译结果的正确性；若否，则执行通过与所述用户进行交互的步骤。在本实施例的一种实现方式中，所述处理器603还用于调用所述存储器601存储的程序指令执行如下操作：对所述第一翻译文本进行翻译，得到第二翻译文本，其中，所述第二翻译文本的语种与所述源语音数据的语种相同；根据所述第二翻译文本，判断所述第一翻译文本的翻译质量是否大于预设质量阈值。在本实施例的一种实现方式中，所述处理器603还用于调用所述存储器601存储的程序指令执行如下操作：根据所述源语音数据的识别文本以及所述第二翻译文本，判断所述第一翻译文本的翻译质量是否大于预设质量阈值。在本实施例的一种实现方式中，所述处理器603还用于调用所述存储器601存储的程序指令执行如下操作：利用所述第二翻译文本与所述用户进行交互，判断所述第一翻译文本作为所述源语音数据的翻译结果是否正确。在本实施例的一种实现方式中，所述处理器603还用于调用所述存储器601存储的程序指令执行如下操作：向所述用户输出第一询问语音，其中，所述第一询问语音用于询问所述源语音数据与所述第二翻译文本的语义是否相似；若接收到所述用户对所述第一询问语音的肯定回答，则所述第一翻译文本作为所述源语音数据的翻译结果是正确的；若接收到所述用户对所述第一询问语音的否定回答，则所述第一翻译文本作为所述源语音数据的翻译结果是错误的。在本实施例的一种实现方式中，所述处理器603还用于调用所述存储器601存储的程序指令执行如下操作：采用文本匹配的方式，对所述第一翻译文本进行修正。在本实施例的一种实现方式中，所述处理器603还用于调用所述存储器601存储的程序指令执行如下操作：将所述源语音数据的识别文本与数据库中的文本数据进行匹配操作，其中，所述数据库中存储至少一组语句对，所述语句对包括第一样本文本以及对所述第一样本文本进行正确翻译后的第二样本文本，所述第一样本文本的语种与所述源语音数据的语种相同，所述第二样本文本的语种与所述第一翻译文本的语种相同；通过所述匹配操作，获取与所述源语音数据的识别文本最相似的第一样本文本；根据所述最相似的第一样本文本，对所述第一翻译文本进行修正。在本实施例的一种实现方式中，所述处理器603还用于调用所述存储器601存储的程序指令执行如下操作：利用所述最相似的第一样本文本与所述用户进行交互，实现对所述第一翻译文本的修正。在本实施例的一种实现方式中，所述处理器603还用于调用所述存储器601存储的程序指令执行如下操作：向所述用户输出第二询问语音，其中，所述第二询问语音用于询问所述源语音数据与所述最相似的第一样本文本的语义是否相似；若接收到所述用户对所述第二询问语音的肯定回答，则从所述最相似的第一样本文本所属的语句对中获取第二样本文本，作为对所述第一翻译文本进行成功修正后的文本。在本实施例的一种实现方式中，所述处理器603还用于调用所述存储器601存储的程序指令执行如下操作：若接收到所述用户对所述第二询问语音的否定回答，则输出提示语音，其中，所述提示语音用于提示所述用户重复所述源语音数据、或者更换所述源语音数据的说法。在一些实施方式中，所述处理器603可以为中央处理器(centralprocessingunit，cpu)，所述存储器601可以为随机存取存储器(randomaccessmemory，ram)类型的内部存储器，所述接收器602可以包含普通物理接口，所述物理接口可以为以太(ethernet)接口或异步传输模式(asynchronoustransfermode，atm)接口。所述处理器603、接收器602和存储器601可以集成为一个或多个独立的电路或硬件，如：专用集成电路(applicationspecificintegratedcircuit，asic)。进一步地，本实施例还提供了一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行上述语音翻译方法中的任意一种实现方式。通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如rom/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者诸如媒体网关等网络通信设备，等等)执行本申请各个实施例或者实施例的某些部分所述的方法。需要说明的是，本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：占萌萌;刘俊华
技术所有人：科大讯飞股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。