用于多用户多语言通信的系统和方法

文档序号:9383087阅读:319来源:国知局
用于多用户多语言通信的系统和方法
【技术领域】
[0001] 本发明一般地涉及通信,并且尤其涉及包括多用户和多语言的全球通信。
【背景技术】
[0002] 在基于机器的语言翻译(下文中称作"机器翻译")出现之前,两种语言之间的翻 译仅能够通过学习过这两种语言的人的介入和解释才能实现。相反地,典型的翻译机器基 于对上下文以及语法的统计分析或随机分析来运行,通常无需人为介入或解释。
[0003] 典型的机器翻译通常容易出错,尤其是在待翻译的文本的上下文极少的情况中。 上下文极少的文本通常出现在采用简短的句子结构的会话中。另外,机器翻译在简称、缩 写、昵称、口语化词语/短语、专有名词、以及通用名词方面通常存在困难,这些方面也通常 出现在会话文本中。

【发明内容】

[0004] 本文中描述的各种实施方式提供涉及在多用户之间的多语言通信的系统和方法, 其中这些用户可能位于两个或更多的客户端系统。由实施方式所促进的通信模式可包括基 于互联网的聊天(例如,苹!4i?iMessage、Windows必Live Messenger等)、电子邮件 (例如,嵌入式论坛消息、雅虎邮箱?、RFC 5322等)、基于文本的移动电话通信(例如, SMS消息或MMS消息)、在线论坛的帖子(例如,基于网络的爱好论坛的帖子)、以及在线社 会媒体服务的帖子(例如,Twitter?、Facebook?等)。例如,系统和方法可实施多语言、 多用户聊天系统。
[0005] 对于一些实施方式,提供的方法包括:识别第一语言和第二语言;从第一聊天客 户端的第一方接收以第一语言的初始消息,其中第一方以第一语言通信;以及从数据存储 器中查询以第二语言的第一对应消息,其中第一对应消息基于以第一语言的初始消息。如 果数据存储器包括第一对应消息,则该方法帮助将该对应消息发送至在第二聊天客户端系 统的第二方,其中第二方以第二语言通信。根据该实施方式,初始消息可包括文本、表情符 号、基于ascii的图片、或者适于或常见于通过网络发送的人可读的消息的其它内容。另 外,初始消息可以是在聊天客户端系统之间通信的更大的消息的一部分(例如,初始消息 是多句消息中的一句)。
[0006] 如果数据存储器不包括第一对应消息,则该方法利用转换引擎尝试将初始消息的 至少一部分转换至以第一语言的转换后的消息。该方法然后可使用该转换后的消息从数据 存储器中查询以第二语言的第二对应消息,其中第二对应消息基于该转换后的消息。
[0007] 对于某些实施方式,该系统或方法可尝试在查询数据存储器(从该数据存储器中 查询基于转换后的消息的第二对应消息)之前使用一系列转换操作转换初始消息。可替代 的,在一些实施方式中,该系统或方法可迭代地执行转换和查询,其中:使用可用的转换操 作的子集来转换初始消息;基于得到的转换后的消息从数据存储器中查询第二对应消息; 以及如果没有识别出第二对应消息,则执行另外的转换和查询的迭代(例如,使用可用的 转换操作的另外的子集进一步转换得到的转换后的消息,以及基于该得到的转换后的消息 从数据存储器中查询第二对应消息)。在一些这种实施方式中,应用于每个迭代中的转换操 作的子集可应用于初始消息或可应用于最新得到的转换后的消息。
[0008] 最终,该方法可帮助将初始消息或转换后的消息翻译至以第二语言的对应消息。 在一些实施方式中,当数据存储器中不存在初始消息的第一对应消息以及转换引擎不转换 初始消息的至少一部分时,初始消息可被翻译至该对应消息。另外,在各种实施方式中,当 有以下条件时转换后的消息可被翻译至该对应消息,这些条件如:初始消息的第一对应消 息不在数据存储器中;转换引擎产生包括初始消息的至少一部分的转换的转换后的消息; 以及数据存储器不包括该转换后的消息的第二对应消息。
[0009] 根据该实施方式,转换初始消息的一部分可包括:识别在初始消息中的聊天用语 词语或短语(例如,"L0L"、"gr8t")以及用非聊天用语词语或短语替代该聊天用语词语或 短语;对初始消息的该部分执行拼写检查;或者识别初始消息的该部分中的简写以及用对 应于(例如,代表)该简写的词语或短语替代该简写(例如,用"California"替代"CA"或 者用 "be right back" 替代 "brb")。
[0010] 另外,转换初始消息的一部分可包括:识别初始消息的该部分中的缩写以及用对 应于(例如,代表)该缩写(例如,"USA")的词语或短语替代该缩写;或者识别初始消息的 该部分中的口语化词语或短语以及用代表该口语化词语或短语的词语或短语替代该口语 化词语或短语。此外,转换初始消息的一部分可包括识别初始消息的该部分中的粗俗的词 语或短语以及用非粗俗的词语或短语(例如,代表该粗鄙的词语或短语的词语或短语)替 代该粗鄙的词语或短语,或者去除该粗俗的词语或短语
[0011] 对于一些实施方式,转换初始消息的一部分包括标记初始消息的不翻译的部分。 例如,当初始消息的特定部分包括专有名词、通用名词、昵称、简写、或缩写时,该方法可标 记该特定部分使得在后续操作中不翻译该部分。
[0012] 某些实施方式提供包括配置为执行本文中描述的各种操作的各种部件的系统。类 似地,某些实施方式提供包括计算机指令代码的计算机程序产品,该计算机指令代码配置 为引发计算机系统执行本文中描述的各种操作。
[0013] 通过参照附图的以下详细描述,各种实施方式的其它特征及方面将变得显而易 见,这些描述以示例的方式示出了这些实施方式的特征。
【附图说明】
[0014] 参照以下附图具体描述各种实施方式。附图仅用于说明的目的,并且仅描述了一 些实施方式。这些附图不应理解为对实施方式的宽度、范围或适用性的限制。
[0015] 图1是示出了根据各种实施方式的利用多语言通信系统的示例性的环境的框图。
[0016] 图2是示出了根据各种实施方式的示例性的通信转换和翻译系统的框图。
[0017] 图3是示出了根据各种实施方式的示例性的转换模块的框图。
[0018] 图4是示出了根据各种实施方式的示例性的聊天客户端系统的框图。
[0019] 图5是示出了根据各种实施方式的多语言通信的示例性的方法的流程图。
[0020] 图6是示出了根据各种实施方式的转换通信的示例性的方法的流程图。
[0021] 图7是示出了根据各种实施方式的在聊天客户端系统之间的示例性的多语言聊 天会话的图表。
[0022] 图8是示出了根据各种实施方式的示例性的多语言通信方法的操作的流程图。
[0023] 图9是示出了根据各种实施方式的示例性的多语言通信方法的操作的流程图。
[0024] 图10是示出了根据各种实施方式的示例性的多语言通信方法的操作的流程图。
[0025] 图11是示出了根据各种实施方式的示例性的多语言通信方法的操作的流程图。
[0026] 图12是示出了可用于各种实施方式的实施例中的示例性的数字化设备的框图。
【具体实施方式】
[0027] 本文中描述的各种实施方式涉及并便于多语言通信。一些实施方式的系统和方法 可实现经由不同的通信模式的多语言通信,这些不同的通信模式例如:基于互联网的聊天 (例如,苹果?iMessage、Windows'? Live Messenger等)、电子邮件(例如,嵌入式论 坛消息、雅虎⑧^^卩箱、RFC 5322等)、基于文本的移动电话通信(例如,SMS消息或MMS消 息)、在线论坛的帖子(例如,基于网络的爱好论坛的帖子)、在线社会媒体服务的帖子(例 如,Twitter?、Facebook?等)等。某些实施方式也可用于翻译过去发生的通信或会话 的抄本(例如,沉积累积抄本或聊天历史)。各种实施方式可实施在两种或更多语言之间 翻译文本(例如,口头的)的通信系统和方法,同时处理/调节文本中的一个或多个下列项 目:专业/领域术语(例如,聊天用语)、简写、缩写、专有名词、通用名词、昵称、口语化词语 或短语、以及粗鄙的粗俗的词语或短语。例如,本文中描述的一些系统和方法可与通常具有 以不同语种聊天的用户的聊天系统一起使用,诸如在大规模多玩家在线(MMO)游戏中使用 的聊天系统。通过某些实施方式,两个或更多用户之间的聊天对话可以被清楚地翻译,并以 每个用户各自的本国语言或选择的语言呈现至每个用户。另外,相较于仅通过传统翻译系 统的其他方式,通过使用多层/多模块转换过程,某些实施方式可助于在两个或更多用户 之间的通信的更快的翻译(例如,以其各自的本国语言)(例如,以大约毫秒的速度翻译)。
[0028] 根据一些实施方式,系统或方法可执行从第一语言(如英语)的聊天用语到第二 语言(如法语)的聊天用语的翻译。在另一实施例中,系统或方法可在尝试将第一语言(例 如,英语)的聊天用语翻译至第二语言(例如,法语)之前,执行从第一语言(例如,英语) 的聊天用语到第一语言(例如,英语)的正式用语的转换。一些实施方式可通过首先查询 数据存储器(例如,翻译缓存)来实现这种文本翻译,该数据存储器可包括由操作员手动输 入的翻译或基于由翻译系统先前执行的翻译(例如,由实施方式执行的历史的翻译)。实 施方式可尝试转换文本的一个或多个部分(例如,处理文本中的一个或多个下列项目:聊 天用语、缩写、简写、专有名词、通用名词、口语、以及粗语)以使其适于精确的文本翻译。例 如,某些实施方式可转换给定的文本以解释跨越不同的语言的(当前或过去的)惯用语言 的使用。实施方式可在转换了文本的该部分之后再次尝试查询数据存储器。如果该翻译查 找的再次尝试失败,则实施方式可尝试使用机器翻译服务(例如,诸如谷歌翻译第三方的 云翻译服务)翻译该(可以是转换后的)文本。
[0029] 实施方式可尝试将翻译的正式文本的片段转换至新的语言中的聊天用语以进一 步完善最终产生的文本的翻译。因此,某些实施方式助于第一语言(例如,英语)的聊天用 语到第二语言(例如,俄语、法语、西班牙语、汉语、北印度语等)的聊天用语之间聊天翻译。
[0030] 一些实施方式可帮助减少或避免对机器翻译的使用需求(从而减少与机器翻译 相关的时间、成本和其他费用(overhead)),并且可助于对上下文极少或包括短句结构的文 本的精确翻译。当机器翻译由第三方服务促进或在安全网络连接(例如,安全套接层(SSL) 连接)上时,由某些实施方式所避免的成本或费用将会是显著的。
[0031] 在本文中所理解的是,"转换"指将第一语言的第一文本片段处理成第一语言的第 二文本片段。所得的第二文本片段在本文中也可称作"转换后的文本"。"翻译"应理解为 将第一语言的文本片段转变至第二语言的对应的文本片段。
[0032] 同样,在本文中理解的是,"转换后的翻译"指已根据本文描述的实施方式转换(例 如,从第一语言的聊天用语文本转换至第一语言的正式文本)的文本片段的翻译(从第一 语言至第二语言)。"未转换的翻译"应理解为指在文本片段根据本文描述的实施方式转换 之前的该文本片段的翻译(从第一语言至第二语言)。
[0033] 各种实施方式可实施不同的转换/翻译策略,其中某些策略能很好地适用于特定 的翻译应用。例如,对于特定的聊天系统应用,所实施的转换策略可包括以所列的顺序应用 以下一组转换相关的模块:聊天用语模块、缩写模块、专有名词模块、通用名词模块、口语模 块、拼写检查模块、简写模块、以及粗语模块。一般地,所采用的转换/翻译策略确定了执行 哪个转换操作、在整个翻译过程中何时执行转换操作(例如,在机器翻译之前或之后执行 转换)、或者以怎样的顺序执行转换操作(例如,转换操作的优先序或优先级)。转换/翻 译策略也可确定预植入数据存储器的翻译(例如,翻译可存储在翻译缓存中以提高整体处 理的速度)以及在整个翻译过程中何时使用翻译缓存。对于某些实施方式,可基于实施方 式所使用的环境条件动态地确定所采用的转换/翻译策略。例如,当聊天系统正在承受比 通常更大的用户负荷时,转换/翻译策略可切换至减轻聊天系统的处理负担的策略(例如, 更依赖于机器翻译而不是数据存储器)。
[0034] 图1是示出了根据各种实施方式的利用多语言系统的示例性环境100的框图。如 图1所示,示例性环境100包括客户端102-1至102-N(以下均称作客户端102)、聊天服务 器108、以及翻译服务器110。通过计算机网络106,该客户端102、聊天服务器108、以及翻 译服务器110中的每个均可以可通信地彼此联接。根据一些实施方式,可使用一个或多个 局域通信网络或广域通信网络(例如互联网、WiFi网络、WiMax网络、私人网络、公共网络 等)实施或促进计算机网络106。根据该实施方式,与计算机网络106连接的一些或全部通 信可使用加密(例如,安全套接层(SSL))以保护在示例性环境100所示的各种实体之间传 输的信息。
[0035] 可使用一个或多个数字化设备实施客户端102、聊天服务器108、以及翻译服务 器110中的每个,该数字化设备可类似于随后参照图12讨论的数字化设备。例如,客户端 102-1可以是能够接收用户输入(例如,配置为用户交互)、能够提供便于与一个或多个其 它客户端(例如,客户端102-2至102-N中的任意一个)通信的客户端用户界面、以及能够 通过计算机网络106与聊天服务器108通信的任意形式的计算机设备。这种计算机设备可 包括移动电话、平板计算机设备、膝上计算机、台式计算机、个人数字助理、便携式游戏机、 有线游戏机、精简型客户端、机顶盒、便携式多媒体播放器、或本领域技术人员所公知的任 何其它类型的可访问网络的用户设备。此外,聊天服务器108和翻译服务器110中的一个 或多个可包括一个或多个服务器,该服务器可运行于一个或多个云服务上(例如,系统即 服务(SaaS)、平台即服务(PaaS)、或基础结构即服务(IaaS))或使用该一个或多个云服务 实施。
[0036] 客户端102可配置为与聊天服务器108可通信地连接,聊天服务器108提供或以 其它方式便于客户端102之间的聊天会话。客户端102-1至102-N中的每个可包括聊天客 户端系统(分别是104-1至104-N),该聊天客户端系统使得客户端102中的每个的用户能 够通过聊天服务器108访问聊天会话。另外,根据该实施方式,聊天客户端系统104-1至 104-N(以下均称作"聊天客户端系统104")中的每个可作为单独的聊天应用实施、可作为 嵌入在非聊天应用(例如,视频游戏)中的聊天特征实施、或者可通过可经由网页浏览器在 客户端访问的聊天服务实施。本领域技术人员应理解,对于一些实施方式,聊天客户端系统 104彼此之间可以是非异构性的,但仍能够彼此之间建立聊天会话。聊天客户端系统104能 够从其各自的用户接收以用户选择的(例如,基于用户设置或喜好)语言(以及对应的字 符集)聊天输入(例如,聊天消息),以及将该聊天输入发送至聊天服务器108以转发至另 一个用户(例如,在另一个聊天客户端系统的另一个用户)。聊天客户端系统104也能够从 聊天服务器108 (例如,从在另一个聊天客户端系统的另一个用户)接收聊天输出(例如, 聊天会话对话),以及将该接收到的聊天输出以用户(例如,基于用户设置或喜好)选择的 语言(以及对应的字符集)显示出来。
[0037] 通过一些实施方式的使用,随着对话在聊天客户端系统104之间传递,聊天对话 的翻译对于用户可以是易懂的。因此,对于一些实施方式,呈现在给定聊天客户端系统104 上的全部聊天对话可以是该给定聊天客户端系统104的用户的本国语言或由该用户选择 的语言,而不管在参与同一聊天对话的其它客户端系统104上的用户正在使用什么语言。 例如,当在聊天客户端系统104-1上的用户与在聊天客户端系统104-2上的用户正在参与 同一个聊天对话(即,在同一聊天会话中)时,在聊天客户端系统104-1上的用户可能选择 用英语输入和接收聊天对话,而在聊天客户端系统104-2上的用户可能选择用俄语输入和 接收聊天对话。虽然在客户端系统104-1和104-2上的用户将看到同样的聊天内容,然而 该聊天对话将以用户各自选择的语言呈现出来。
[0038] 如图所示,聊天服务器108可包括:聊天主机系统112,配置为建立和/或便于聊 天客户端系统104之间的聊天会话;以及通信
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1