翻译译文的提供方法、装置和系统的制作方法

文档序号:6526729阅读:141来源:国知局
翻译译文的提供方法、装置和系统的制作方法
【专利摘要】本发明提出一种翻译译文的提供方法、装置和系统,其中,该方法包括:接收客户端发送的翻译请求,并获取客户端的当前位置信息,其中,翻译请求包括待翻译内容和目标语言类型;根据目标语言类型获取与目标语言类型对应的地图数据和预设互信息集合;根据当前位置信息、地图数据和预设互信息集合获取待翻译内容的位置特征;根据位置特征和预设翻译模型获取待翻译内容的翻译译文,并将翻译译文发送至客户端。本发明实施例的翻译译文的提供方法使获取的翻译译文能够满足用户在特定位置上的翻译需求,并且翻译结果更符合用户预期。特别是对于一词多译的情况,能够快速准确的为用户提供翻译结果,极大的改善了用户的翻译体验。
【专利说明】翻译译文的提供方法、装置和系统
【技术领域】
[0001]本发明涉及机器翻译领域,特别涉及一种翻译译文的提供方法、装置和系统。
【背景技术】
[0002]随着机器翻译技术的不断发展,用户可随时通过在线翻译在多种语言对之间进行翻译。特别是随着移动终端制造技术的发展,移动终端上的在线翻译应用程序也日益丰富,这使得用户随时随地都可以进行翻译。例如用户出国旅游时,可随时通过键盘输入、语音输入、拍照加OCR识别等输入方式将看到的路标、招牌、菜单、景点介绍等等输入到在线翻译应用程序中进行翻译。
[0003]目前机器翻译在译文选择时主要考虑两方面的因素,即翻译概率和语言模型概率。其中,翻译概率是基于一个大规模的源语言到目标语言的平行语料库,经过词对齐和短语抽取之后训练得到的,体现的是一个源语言短语翻译到一个目标语言短语的可能性;语言模型概率是基于目标语言的大规模单语语料库统计得到的目标语言词序列的出现概率。因而,目前机器翻译中源语言短语的候选翻译的选择取决于短语本身以及该短语所处在的上下文句子。但是,存在源语言中的一个短语对应目标语言中的多个译文的情况,现有的机器翻译系统无法从多个译文中为用户筛选出更符合用户当前需求的译文。

【发明内容】

[0004]本发明旨在至少在一定程度上解决上述技术问题。
[0005]为此,本发明的第一个目的在于提出一种翻译译文的提供方法,该方法能够满足用户在特定位置上的翻译需求,快速准确的为用户提供翻译结果,极大的改善了用户的翻译体验。
[0006]为达上述目的,根据本发明第一方面实施例提出了一种翻译译文的提供方法,包括:接收客户端发送的翻译请求,并获取所述客户端的当前位置信息,其中,所述翻译请求包括待翻译内容和目标语言类型;根据所述目标语言类型获取与所述目标语言类型对应的地图数据和预设互信息集合;根据所述当前位置信息、所述地图数据和所述预设互信息集合获取所述待翻译内容的位置特征;根据所述位置特征和预设翻译模型获取所述待翻译内容的翻译译文,并将所述翻译译文发送至所述客户端。
[0007]本发明实施例的翻译译文的提供方法,通过获取发送翻译请求的客户端的当前位置信息,并获取与该当前位置信息相关的翻译译文,从而使获取的翻译译文能够满足用户在特定位置上的翻译需求,并且翻译结果更符合用户预期。特别是对于一词多译的情况,能够快速准确的为用户提供翻译结果,极大的改善了用户的翻译体验。
[0008]本发明第二方面实施例提供了一种翻译译文的提供装置,包括:接收模块,用于接收客户端发送的翻译请求,其中,所述翻译请求包括待翻译内容和目标语言类型;第一获取模块,用于获取所述客户端的当前位置信息;第二获取模块,用于根据所述目标语言类型获取与所述目标语言类型对应的地图数据和预设互信息集合;第三获取模块,用于根据所述当前位置信息、所述地图数据和所述预设互信息集合获取所述待翻译内容的位置特征;提供模块,用于根据所述位置特征和预设翻译模型获取所述待翻译内容的翻译译文,并将所述翻译译文发送至所述客户端。
[0009]本发明实施例的翻译译文的提供装置,通过获取发送翻译请求的客户端的当前位置信息,并获取与该当前位置信息相关的翻译译文,从而使获取的翻译译文能够满足用户在特定位置上的翻译需求,并且翻译结果更符合用户预期。特别是对于一词多译的情况,能够快速准确的为用户提供翻译结果,极大的改善了用户的翻译体验。
[0010]本发明第三方面实施例提供了一种翻译译文的提供系统,包括:本发明第二方面实施例所述的翻译译文的提供装置;以及客户端。
[0011]本发明实施例的翻译译文的提供系统,通过获取发送翻译请求的客户端的当前位置信息,并获取与该当前位置信息相关的翻译译文,从而使获取的翻译译文能够满足用户在特定位置上的翻译需求,并且翻译结果更符合用户预期。特别是对于一词多译的情况,能够快速准确的为用户提供翻译结果,极大的改善了用户的翻译体验。
[0012]本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
【专利附图】

【附图说明】
[0013]本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
[0014]图1为根据本发明一个实施例的翻译译文的提供方法的流程图;
[0015]图2为根据本发明一个具体实施例的翻译译文的提供方法的流程图;
[0016]图3为根据本发明一个实施例的建立预算互信息集合的方法的流程图;
[0017]图4为根据本发明一个实施例的获取每个地标词汇的位置得分的方法的流程图;
[0018]图5为根据本发明一个实施例的获取待翻译内容的位置特征的方法的流程图;
[0019]图6为根据本发明一个实施例的翻译译文的提供装置的结构示意图;
[0020]图7为根据本发明一个具体实施例的翻译译文的提供装置的结构示意图。
【具体实施方式】
[0021]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
[0022]在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0023]在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
[0024]在现有的机器翻译技术中,源语言语句的候选翻译的选择只取决于源语言语句中短语本身以及短语所处在的上下文句子,当源语言语句含的短语的译文较多时,获得的该源语言语句的译文更多,这就需要用户根据需要在众多译文中选择,或者翻译系统自动为用户提供使用率较高的译文,但却不一定是用户所需要的。而当为用户提供翻译译文时,如果根据用户发出翻译请求时所处的地理位置提供翻译译文,则会使翻译译文更加准确。例如:当一个不懂英文的中国游客在翻译系统中输入“park”这个多义词时,他要找的中文翻译到底是什么便与他彼时彼刻正处于的位置有关。若此时他处于公园、动物园、旅游景点等的门口,则park很可能是“公园”的意思;但倘若他的旁边是商务区、办公区、马路等,则park便很可能是“停车场”的意思。为此,本发明提出了一种翻译译文的提供方法、装置和系统。下面参考附图描述根据本发明实施例的翻译译文的提供方法、装置和系统。
[0025]一种翻译译文的提供方法,包括以下步骤:接收客户端发送的翻译请求,并获取客户端的当前位置信息,其中,翻译请求包括待翻译内容和目标语言类型;根据目标语言类型获取与目标语言类型对应的地图数据和预设互信息集合;根据当前位置信息、地图数据和预设互信息集合获取待翻译内容的位置特征;根据位置特征和预设翻译模型获取待翻译内容的翻译译文,并将翻译译文发送至客户端。
[0026]图1为根据本发明一个实施例的翻译译文的提供方法的流程图。如图1所示,该翻译译文的提供方法包括以下步骤。
[0027]S101,接收客户端发送的翻译请求,并获取客户端的当前位置信息,其中,翻译请求包括待翻译内容和目标语言类型。
[0028]在本发明的实施例中,客户端优选为移动终端,例如,IOS操作系统(10S是由苹果公司开发的手持设备操作系统)、安卓操作系统(Android系统是一种基于Linux的自由及开放源代码的操作系统)、Windows Phone操作系统(Windows Phone是微软公司发布的一款手机操作系统)的移动终端,当然也适用于个人计算机以及其他智能移动终端,本发明对此不作限定。应当理解,在本发明的实施例中,移动终端可以是手机、平板电脑、个人数字助理、电子书以及智能穿戴式设备等具有各种操作系统的硬件设备。待翻译内容为用户不熟悉或不理解的语言类型的语句,目标语言类型为用户根据需要选择的能够理解的语言类型中的一个或多个。其中,客户端的当前位置信息可通过GPS(Global Positioning System,全球定位系统)来获取。
[0029]S102,根据目标语言类型获取与目标语言类型对应的地图数据和预设互信息集
口 ο
[0030]在本发明的一个实施例中,地图数据为各种地图应用软件提供的包括道路、建筑、商铺、景点等地标信息的地图数据。与目标语言类型对应的地图数据可由地图应用程序直接提供,如果地图应用程序无法提供目标语言类型的地图数据,则可根据现有的翻译系将地图应用程序可提供的一种语言类型的地图数据翻译为目标语言数据。预设互信息集合为预先建立的包括任意地标信息中的词汇之间共同出现的互信息的集合。具体地,可根据各个语言类型的地图数据中距离小于预设阈值的两个地标信息建立相应的地图数据中每两个地标词汇之间的互信息,其中,每个语言类型对应一个预设信息集合。互信息是指两个事件集合之间的相关性的信息度量,因此,预设互信息集合中的每个互信息可表示与该互信息相应的两个词在地图数据中的关联紧密度。
[0031]S103,根据当前位置信息、地图数据和预设互信息集合获取待翻译内容的位置特征。
[0032]在本发明的实施例中,待翻译内容的位置特征为与待翻译内容的当前位置信息相关的特征。
[0033]S104,根据位置特征和预设翻译模型获取待翻译内容的翻译译文,并将翻译译文发送至客户端。
[0034]相关技术中,主要根据翻译概率、语言模型概率以及调序模型分值等多种特征构成的对数线性模型。在本发明的一个实施例中,可在离线阶段将位置特征作为一个新的特征,与上述翻译概率、语言模型概率以及调序模型分值等多种特征一起训练预设翻译模型,举例来说,该预设翻译模型可为对数线性模型。从而,在线翻译时,可将获取的位置特征代入该预设翻译模型,即可获取与翻译请求客户端所在的当前位置信息相符的翻译译文。
[0035]本发明实施例的翻译译文的提供方法,通过获取发送翻译请求的客户端的当前位置信息,并获取与该当前位置信息相关的翻译译文,从而使获取的翻译译文能够满足用户在特定位置上的翻译需求,并且翻译结果更符合用户预期。特别是对于一词多译的情况,能够快速准确的为用户提供翻译结果,极大的改善了用户的翻译体验。
[0036]图2为根据本发明一个具体实施例的翻译译文的提供方法的流程图。如图2所示,在本实施例中,可通过步骤S203-S206根据所述当前位置信息、所述地图数据和所述预设互信息集合获取所述待翻译内容的位置特征,使得获取的待翻译内容的位置特征更加准确,从而可为用户提供更加满足其需求的翻译译文。具体地,该训练翻译模型的方法包括以下步骤。
[0037]S201,接收客户端发送的翻译请求,并获取客户端的当前位置信息,其中,翻译请求包括待翻译内容和目标语言类型。
[0038]在本发明的实施例中,客户端优选为移动终端,例如,IOS操作系统(10S是由苹果公司开发的手持设备操作系统)、安卓操作系统(Android系统是一种基于Linux的自由及开放源代码的操作系统)、Windows Phone操作系统(Windows Phone是微软公司发布的一款手机操作系统)的移动终端,当然也适用于个人计算机以及其他智能移动终端,本发明对此不作限定。应当理解,在本发明的实施例中,移动终端可以是手机、平板电脑、个人数字助理、电子书以及智能穿戴式设备等具有各种操作系统的硬件设备。待翻译内容为用户不熟悉或不理解的语言类型的语句,目标语言类型为用户根据需要选择的能够理解的语言类型中的一个或多个。其中,客户端的当前位置信息可通过GPS(Global Positioning System,全球定位系统)来获取。
[0039]S202,根据目标语言类型获取与目标语言类型对应的地图数据和预设互信息集

口 ο
[0040]在本发明的一个实施例中,地图数据为各种地图应用软件提供的包括道路、建筑、商铺、景点等地标信息的地图数据。与目标语言类型对应的地图数据可由地图应用程序直接提供,如果地图应用程序无法提供目标语言类型的地图数据,则可根据现有的翻译系将地图应用程序可提供的一种语言类型的地图数据翻译为目标语言数据。
[0041]在本发明的一个实施例中,预设互信息集合为预先建立的包括任意地标信息中的词汇之间共同出现的互信息的集合。图3为根据本发明一个实施例的建立预算互信息集合的方法的流程图。如图3所示,在本发明的一个实施例中,预设互信息集合可通过以下步骤
建立:
[0042]S301,获取第一语言的地图数据。
[0043]其中,第一语言可为现有语言中的任意一种。
[0044]S302,根据第一语言的地图数据获取地图上任意距离小于预设阈值的两个地标信息,以获取多对地标信息。
[0045]其中,预设阈值可为根据多次试验获得的阈值。地图上的地标信息为标识地理位置的信息,如道路、建筑、商铺、景点等。
[0046]S303,根据多对地标信息获取多个第一语言地标词汇。
[0047]其中,第一语言地标词汇为通过对上述多对地标信息进行分词得到的单词或短语。
[0048]S304,分别获取每个第一语言地标词汇的出现概率,并获取任意两个第一语言地标词汇之间的共现概率。
[0049]在本发明的实施例中,可首先获取每个第一语言地标词汇在获取到的多个第一语言地标词汇中的出现的次数,然后用该次数除以多个第一语言地标词汇的总数以获取每个第一语言地标词汇的出现概率。对于第一语言地标词汇W1和《2,如果W1与W2分别为一对距离小于预设阈值的地标信息中每个地标信息中的一个单词或词组(例如,对于一对地标信息P1和P2,W1是地标信息P1中的单词,W2是地标信息中的单词P2),则记W1和W2共现一次。按照此方法,可获取^和《2在获取到的第一语言地标词汇中的共现次数。从而,根据W1和W2的共现次数可计算W1和W2的共现概率。
[0050]S305,根据每个第一语言地标词汇的出现概率和任意两个第一语言地标词汇之间的共现概率获取任意两个第一语言地标词汇之间的互信息,以建立第一语言的预设互信息集合
[0051]具体地,在本发明的一个实施例中,可通过以下公式获取任意两个第一语言地标词汇W1和W2之间的互信息,以表示与W1和W2在地图数据中的关联紧密度:



[0052]
【权利要求】
1.一种翻译译文的提供方法,其特征在于,包括: 接收客户端发送的翻译请求,并获取所述客户端的当前位置信息,其中,所述翻译请求包括待翻译内容和目标语言类型; 根据所述目标语言类型获取与所述目标语言类型对应的地图数据和预设互信息集合; 根据所述当前位置信息、所述地图数据和所述预设互信息集合获取所述待翻译内容的位置特征; 根据所述位置特征和预设翻译模型获取所述待翻译内容的翻译译文,并将所述翻译译文发送至所述客户端。
2.如权利要求1所述的翻译译文的提供方法,其特征在于,所述根据所述当前位置信息、所述地图数据和所述预设互信息集合获取所述待翻译内容的位置特征具体包括: 根据所述当前位置信息和所述地图数据获取与所述当前位置信息距离小于预设阈值的多个地标信息,并分别记录所述多个地标信息与所述当前位置信息的距离; 对所述多个地标信息进行分词以获取M个地标词汇,其中,M为正整数; 根据所述多个地标信息和所述多个地标信息与所述当前位置信息的距离分别获取所述M个地标词汇 的位置得分; 根据所述M个地标词汇的位置得分和所述互信息集合获取所述待翻译内容的位置特征。
3.如权利要求2所述的翻译译文的提供方法,其特征在于,所述根据所述多个地标信息和所述多个地标信息与所述当前位置信息的距离分别获取所述M个地标词汇的位置得分,具体包括: 对于每个地标词汇w,从所述M个地标信息中获取包括所述地标词汇w的K个地标信息,其中,K为正整数; 获取所述K个地标信息到所述当前位置信息的平均距离; 根据所述地标词汇w在所述K个地标信息中的出现次数和所述平均距离通过以下公式获取所述地标词汇w的位置得分:
4.如权利要求2所述的翻译译文的提供方法,其特征在于,所述根据所述M个地标词汇的位置得分和所述互信息集合获取所述待翻译内容的位置特征,具体包括:获取所述待翻译内容中的至少一个短语,并获取所述至少一个短语中每个短语对应的多个候选翻译短语,其中,每个所述候选翻译短语中包括N个目标语言词汇,N为正整数;根据所述预设互信息集合分别获取所述M个地标词汇和所述N个目标语言词汇中每个地标词汇与每个目标语言词汇之间的互信息; 根据所述每个地标词汇与每个目标语言词汇之间的互信息与每个地标词汇的位置得分获取相应的候选翻译短语基于位置的特征分值; 根据每个候选翻译短语基于位置的特征分值获取所述待翻译内容的位置特征。
5.如权利要求4所述的翻译译文的提供方法,其特征在于,通过以下公式获取每个候选翻译短语Pt基于位置的特征分值:
6.如权利要求1-5任一项所述的翻译译文的提供方法,其特征在于,所述预设互信息集合通过以下步骤建立: 获取第一语言的地图数据; 根据所述第一语言的地图数据获取地图上任意距离小于预设阈值的两个地标信息,以获取多对地标信息; 根据所述多对地标信息获取多个第一语言地标词汇; 分别获取每个第一语言地标词汇的出现概率,并获取任意两个第一语言地标词汇之间的共现概率; 根据所述每个第一语言地标词汇的出现概率和所述任意两个第一语言地标词汇之间的共现概率获取所述任意两个第一语言地标词汇之间的互信息,以建立第一语言的预设互信息集合。
7.如权利要求6所述的翻译译文的提供方法,其特征在于,通过以下公式获取所述任意两个第一语言地标词汇之间的互信息:

8.一种翻译译文的提供装置,其特征在于,包括: 接收模块,用于接收客户端发送的翻译请求,其中,所述翻译请求包括待翻译内容和目标语言类型; 第一获取模块,用于获取所述客户端的当前位置信息; 第二获取模块,用于根据所述目标语言类型获取与所述目标语言类型对应的地图数据和预设互信息集合; 第三获取模块,用于根据所述当前位置信息、所述地图数据和所述预设互信息集合获取所述待翻译内容的位置特征; 提供模块,用于根据所述位置特征和预设翻译模型获取所述待翻译内容的翻译译文,并将所述翻译译文发送至所述客户端。
9.如权利要求8所述的翻译译文的提供装置,其特征在于,所述第二获取模块具体包括: 记录子模块,用于根据所述当前位置信息和所述地图数据获取与所述当前位置信息距离小于预设阈值的多个地标信息,并分别记录所述多个地标信息与所述当前位置信息的距离; 第一获取子模块,用于对所述多个地标信息进行分词以获取M个地标词汇,其中,M为正整数; 第二获取子模块,用于根据所述多个地标信息和所述多个地标信息与所述当前位置信息的距离分别获取所述M个地标词汇的位置得分; 第三获取子模块,用于根据所述M个地标词汇的位置得分和所述互信息集合获取所述待翻译内容的位置特征。
10.如权利要求9所述的翻译译文的提供装置,其特征在于,所述第二获取子模块具体包括: 第一获取单元,用于对于每个地标词汇《,从所述M个地标信息中获取包括所述地标词汇w的K个地标信息,其中,K为正整数; 第二获取单元,用于获取所述K个地标信息到所述当前位置信息的平均距离; 第三获取单元,用于根据所述地标词汇w在所述K个地标信息中的出现次数和所述平均距离通过以下公式获取所述地标词汇w的位置得分:
11.如权利要求9所述的翻译译文的提供装置,其特征在于,所述第三获取子模块具体包括: 第四获取单元,用于获取所述待翻译内容中的至少一个短语,并获取所述至少一个短语中每个短语对应的多个候选翻译短语,其中,每个所述候选翻译短语中包括N个目标语言词汇,N为正整数; 第五获取单元,用于根据所述预设互信息集合分别获取所述M个地标词汇和所述N个目标语言词汇中每个地标词汇与每个目标语言词汇之间的互信息; 第六获取单元,用于根据所述每个地标词汇与每个目标语言词汇之间的互信息与每个地标词汇的位置得分获取相应的候选翻译短语基于位置的特征分值; 第七获取单元,用于根据每个候选翻译短语基于位置的特征分值获取所述待翻译内容的位置特征。
12.如权利要求11所述的翻译译文的提供装置,其特征在于,所述第六获取单元通过以下公式获取每个候选翻译短语Pt基于位置的特征分值:
13.如权利要求8-12任一项所述的翻译译文的提供装置,其特征在于,还包括: 建立模块,用于建立所述预设互信息集合,其中,所述建立模块具体包括: 第四获取子模块,用于获取第一语言的地图数据; 第五获取子模块,用于根据所述第一语言的地图数据获取地图上任意距离小于预设阈值的两个地标信息,以获取多对地标信息; 第六获取子模块,用于根据所述多对地标信息获取多个第一语言地标词汇; 第七获取子模块,用于分别获取每个第一语言地标词汇的出现概率,并获取任意两个第一语言地标词汇之间的共现概率; 建立子模块,用于根据所述每个第一语言地标词汇的出现概率和所述任意两个第一语言地标词汇之间的共现概率获取所述任意两个第一语言地标词汇之间的互信息,以建立第一语言的预设互信息集合。
14.如权利要求13所述的翻译译文的提供装置,其特征在于,所述建立子模块通过以下公式获取所述任意两个第一语言地标词汇之间的互信息:
15.一种翻译译文的提供系统,其特征在于,包括: 如权利要求8-14任一项所述的翻译译文的提供装置;以及 客户端。
【文档编号】G06F17/27GK103699528SQ201310746678
【公开日】2014年4月2日 申请日期:2013年12月30日 优先权日:2013年12月30日
【发明者】王海峰, 赵世奇, 吴华 申请人:北京百度网讯科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1