允许在多个参与者之间进行实时通信的方法和系统的制作方法

文档序号：7768431阅读：340来源：国知局

专利名称：允许在多个参与者之间进行实时通信的方法和系统的制作方法
技术领域：
本发明涉及使用η路选择性话音协议将短语从一种语言翻译成另一种语言的电子翻译设备和方法。
背景技术：
网际协议(IP)专用交换分机(PBX)是在IP网络上为内部参与者路由呼叫并提供对外线的访问的专用交换分机或电话交换系统。通常，IP PBX还在VoIP参与者和传统电话系统上的呼叫者之间交换呼叫。这些产品通常是运行在服务器或专用设备上的软件包。 IP PBX消除了对分立话音网络的需要，而是将话音和数据业务会聚在同一个网络上。现有产品提供了诸如话音菜单系统、电话会议、点击呼叫、呼叫记录和跟踪、话音邮件和呼叫转发的多种呼叫管理特征。借助于它们的IP PBX，公司可以选择使用“软电话”，即，运行在参与者桌面上的IP电话的纯软件实现，或被设计成在IP网络上工作的传统桌面电话机。按照来自Nemertes Research的Robin Gareiss的说法，当机构转移到VoIP时，可以使它们的WAN成本节约15%到40%，平均节约23%。三个主要节约领域是1.通常从帧中继、异步传送模式或租用线路网络转移到多协议标记交换(MPLS)。 VoIP是切换到MPLS的驱动，但同速电路的总成本更小。有关内容请参见http/www. networkworld. com/community/node/18007。2.综合接入，从而公司在同一接入线上组合话音和数据，因此消除了未充分利用的管道。3.集成核心电路。机构将它们的话音和数据网络组合在一起，导致管理极好的网络上的60%的平均使用和达到75%到85%的峰值使用。它们消除了对核心的空闲较高速电路的需要。MPLS来源于Ipsilon公司的(TM) IP交换、Cisco公司的(TM)标签交换、IBM公司的(TM)ARIS(TM)技术、和将在面向连接的异步传送模式和帧中继网络中找到的那种业务工程带到无连接的IP网络的少数其它建议。这个概念将IP业务引向多条路由，而不是通过诸如边界网关协议的内部网关协议发现的单条路由，以避免拥塞或故障，或能够提供特定类别的服务或保证的服务水平。MPLS交换机和路由器根据分组的目的地、服务类型参数、虚拟专用网络成员资格或其它准则将标记附在分组上。随着分组穿越网络，其它交换机和路由器构建将分组和路由与标记相关联的表格。MPLS交换机和路由器-被称为标记交换路由器-将与通过网络的特定路径相对应的标记指定给每个分组。具有相同标记的所有分组使用相同路径-所谓的标记交换路径(LSP)。因为标记指的是路径而不是端点，所以去往相同端点的分组可以使用多条LSP到达那里。现有网际交换系统(IPPBX)被优化成将分组从一个端点路由到另一个端点。但是，利用VOIP分组的应用除了实时路由要求之外，还有实时处理要求。当前，在讲不同语言的人之间使用IP话音(VoIP)的通信只能用呼叫方和接收方两者都能理解/讲的语言来进行。随着公司将全球资源整合成它们的劳动力，语言隔阂已经变成较重要的障碍。本发明涉及使用η路选择性话音协议将短语从一种语言翻译成另一种语言的电子翻译设备和方法。在一个开发项目中，地理上分散的团队之间的通信不方便使项目风险和成本都增加。当前，在讲不同语言的人之间使用IP话音(VoIP)的通信只能用呼叫方和接收方两者都能理解/讲的语言或经由翻译器来进行。本发明将现有VOIP网络推广成能够提供多参与者同时翻译能力和服务。

发明内容
鉴于传统方法和结构的上述和其它示范性问题、缺点和不足，本发明的实施例的示范性方面提供了一种允许在多个参与者之间使用选择性广播协议来进行实时通信的计算机实现方法，所述方法包括在第一服务器上接收来自第一参与者的实时通信，所述实时通信由第一口语构成并针对第二参与者。由所述第二参与者识别接收所述实时通信的优选口语。确定所述优选的接收口语是否不同于所述实时通信的所述第一口语。每当所述优选口语不同于所述第一口语时，将所述实时通信从所述第一口语翻译成所述第二参与者接收的所述优选口语，以创建翻译后的实时通信。将翻译后的实时通信传递给所述第二参与者。本发明的另一个示范性实施例提供了一种通信系统，包括至少一个发送网际协议话音(VOIP)服务器、至少一个接收VOIP服务器、以及提供所述发送VOIP服务器和所述接收VOIP服务器之间的通信的至少一个VOIP通信网络。翻译模块跨越所述至少一个VOIP 通信网络在所述发送和接收VOIP服务器之间建立活动η路双向自动话音翻译信道。位于特定地点的处理VOIP服务器翻译所述至少一个VOIP通信网络上不同口语的参与者之间的至少一种口语。根据各个参与者的位置和简档，确定在所述处理VOIP服务器的所述特定地点进行所述至少一种口语的处理。本发明的另一个示范性实施例提供了一种计算机实现的方法，包括启动多地点多参与者的话音翻译会话，然后根据参与者来确定是否需要话音翻译处理。确定多个位置的每个位置上的可用翻译资源，并且根据所述多个位置的每个位置上的可用翻译资源和通信会话的实时要求，计算可能的同时翻译进程的最大数量。确定默认服务器是否能够满足所述话音翻译会话的实时处理要求和实时路由要求两者，并且根据讲话的参与者和收听的参与者的参与者简档的比较，将翻译处理服务分配给可用翻译资源。借助于这些新特征，本发明的实施例可提供一种协议方法和系统，其中，讲话VOIP 服务器能够定位和识别用于同时处理源语言内容和目标语言内容的最佳地点的可用资源，使得最终参与者实时地接收来自收听VOIP服务器的处理后的数据，在在线通信会话期间保持通信进度。

通过参照附图对本发明的示范性实施例作如下详细描述，可以使本发明的上述和其它示范性目的、方面和优点得到更好理解，在附图中图1例示了基于会话发起协议(SIP)的网际协议话音(VOIP)；图2例示了本发明的一个实施例的基于SIP的VOIP ；图3Α例示了四(4)个简档配置显示页的系列；图;3Β例示了针对翻译问题显示的用户/参与者提示窗；
图4例示了本发明的一个实施例的基于SIP的VOIP ；图5例示了包括在最佳地点进行处理的服务器分配过程的本发明的一个实施例的基于SIP的VOIP ；图6例示了包括VOIP会话例子的本发明的一个实施例的基于SIP的VOIP ；图7例示了包括VOIP网络上的多方话音处理的本发明的一个实施例的基于SIP 的 VOIP ；图8例示了包括空闲模式的本发明的一个实施例的基于SIP的VOIP ；图9例示了包括利用选择性协议的通信的本发明的一个实施例的基于SIP的 VOIP ；图10例示了包括本发明的一个实施例的方法的逻辑流程图的本发明的一个实施例的基于SIP的VOIP ；图11例示了包括本发明的一个实施例的系统图的本发明的一个实施例的基于 SIP 的 VOIP ；图12例示了包括本发明的一个实施例的方法的逻辑流程图的本发明的一个实施例的基于SIP的VOIP ；图13例示了可以用于实现按照本发明的一个实施例的各个方面的计算机系统和方法的典型硬件配置系统；以及图14例示了可以用于实现按照本发明的一个实施例的各个方面的计算机系统和方法的可编程存储介质。
具体实施例方式现在参照附图，更具体地说，图1-14，来说明本发明的实施例的方法和结构的示范性实施例。综述通过引用并入本文的美国专利第6，434，526号描述了包含语音识别能力的网络应用软件服务。语音识别软件与专用软件相结合配备在通信网络上。模拟话音数据在用户所在地被数字化，被识别成话音数据，并且发送给驻留在中心地点的应用软件。接收被识别成话音数据的数据的网络服务器将它发送给语音服务器。驻留在语音服务器上的语音识别软件包含词典和适合语音识别软件的每个用户的话音的模块。当用户讲话时，口述的翻译被发送回用户所在地，并且打在用户的计算机屏幕上供检查，如果有必要，对其内容作话音或打字校正。多个用户交叉访问语音识别软件，使得同时发送回每个用户。通过引用并入本文的美国专利第7，058，046号描述了一种可伸缩的呼叫管理系统。该系统可以包括托管一个或多个话音浏览器的至少一个话音服务器，该话音服务器具有单个通信端口，通过该单个通信端口，话音呼叫请求能够由话音浏览器处理，每个话音浏览器具有端口别名，通过该端口别名，能够处理呼叫请求。该系统还可以包括将公共交换电话网(PSTN)中的电话端点与话音服务器链接的呼叫处理网关。最后，该系统可以包括将端口别名映射到各自的话音浏览器的翻译表。通过引用并入本文的美国专利第7，406，414号描述了一种在话音流内提供翻译的方法，该方法可以包括接收第一语言的语音信号，从该语音信号中确定文本，将该文本翻译成不同的第二语言，以及编码语音信号内的翻译后的文本。随着公司将全球资源整合成它们的劳动力，语言隔阂已经变成较重要的障碍。本发明涉及一种电子翻译设备和方法，通过η路选择性话音协议，使用VOIP信道将短语从一种语言翻译成另一种语言。通常，当需要不止一种语言翻译时，VOIP实时要求可能超过给定服务器的应用设计能力。棘手的问题是确定哪个服务器能够满足本发明所面对的任意数量的同时基于简档的VOIP处理的实时处理和路由要求。本发明的一个实施例提供了一种系统和方法，其中，讲话VOIP服务器能够定位和识别用于同时处理源语言内容和目标语言内容的最佳位置的可用资源，使得至少一个最终参与者实时地接收来自收听VOIP服务器的处理后的数据，在基于选择性广播协议的在线通信会话期间保持通信进度。示范性方面再次参照附图，图1例示了基于会话发起协议(SIP)的网际协议话音(VOIP)。SIP 应用层定义一个或多个参与者的终端设备如何能够创建、修改和终止连接，内容是话音、视频、数据还是基于web。但是，SIP的局限性是，在远程会议会话中，向所有参与者广播所有 SIP分组，因此限制了计算的可伸缩性和同时参与者的对等(P2P)带宽。图1展示了通信的开始100，此后，生成或接收广播分组102。如果未确定终止通信104，则继续生成和接收广播分组，否则，终止通信106。图2例示了本发明的一个实施例的新的基于SIP的V0IP，其中，在远程会议会话中，增强SIP分组沿着根据参与者语言简档以及可用计算和通信资源的选择性广播通信信道前进，以保持参与者之间的连贯性。从200开始通信，此后，确定该通信是否是η路通信 202。η路通信是对于涉及至少两种语言的单个通信会话不止有两方的通信。如果确定不是η路用户/参与者通信，例如，只是双向通信，那么，生成或接收广播分组204，并且继续生成或接收广播分组，直到确定终止通信206，然后完全结束通信208。注意，单元204、206和 208与图1中的单元104、106和108相同。如果确定用户/参与者已经发起η路通信202，则生成或接收广播分组210。在通信期间，如果确定接收到用户/参与者的讲话请求212，则仲裁器服务214可以在同步或 “synch”点中断广播分组。只要未确定终止通信会话，就可以继续通信会话216。在确定终止通信会话之后216，结束通信会话218。图3A例示了四(4)个简档配置显示页300的系列，其中，用户/参与者可以在通信会话开始之前，首先选择用户/参与者简档设置。“语言设置”页302例示了用户/参与者可以启动语言翻译，选择优选和可替代的翻译语言，根据用户/参与者联系人简档来选择特定用户/参与者特有的语言优选，以及选择是否使用每个用户/参与者联系人最后一次使用的语言以及提醒用户/参与者通信正在被翻译。“话音识别”页304例示了用户/参与者可以选择通过显示用户/参与者的照片、姓名或标识来识别翻译后的合成话音。“翻译引擎”页306例示了用户/参与者可以选择进行服务器翻译的地方。例如，在用户/参与者服务器上进行翻译，在用户/参与者设备上进行翻译，或可以根据服务器负载、用户/参与者的设备能力、和/或用户/参与者的数量以及要翻译的语言的数量来自动确定翻译。“文本”页308例示了用户/参与者可以选择使用用户/参与者的原始语言或优选语言将翻译后的文本转换成语音、将输入的翻译后的话音转换成文本，以及当转换成文本时使输入的翻译后的话音静音。图:3B例示了当发起通信会话时针对翻译问题显示的用户/参与者提示窗310。例如，用户/参与者被识别成用特定语言开始话音通信。用户/参与者提示窗310请求用户 /参与者允许将通信翻译成在图3A的“语言设置”302中选择的用户/参与者的优选语言。图4例示了本发明一个实施例的基于SIP的V0IP，其中，VOIP网络400用包括多个服务器402、406、408、410、412和414的圆圈表示。讲话服务器1402用于由母语是，例如，英语的基于SIP的用户/参与者404发起η路通信会话。讲话服务器1402在多个信道Chi、
Ch2、Ch3.....Chn上向多个收听服务器2-6406-414进行转发。每个收听服务器接收英语
广播音频分组、以及用户/参与者1404的用户/参与者简档信息和收听服务器各自的用户 /参与者的用户/参与者简档信息。例如，基于SIP的用户/参与者2被设置成优选翻译语言是西班牙语的用户/参与者简档。收听服务器M06识别用户/参与者1和用户/参与者2的两个用户/参与者简档之间的语言差异，并且处理收听服务器M06的英语广播音频分组以便翻译成合成话音和用户/参与者M26的西班牙语。同样，用户/参与者34 从收听服务器3408接收基于法语的译文，类似地，用户/参与者M32从收听服务器M12接收基于俄语的译文，以及用户/参与者6434从收听服务器6414接收基于阿拉伯语的译文。但是，基于SIP的用户/参与者4430的用户/参与者简档信息被设置成英语是优选翻译语言。由于无需翻译从讲话服务器402发送的英语广播音频分组，所以收听服务器 410无需翻译通信传输，而仅仅将英语广播音频分组直接转发给用户/参与者430。Synch 点 416、418、420、422 和 424 分别沿着通信信道 Chl、Ch2、. · ·、Chn 处在 VOIP 网络400中。这些synch点允许除了发起对话的讲话用户/参与者之外的其它用户/参与者在完成了特定用户/参与者的翻译的点进入通信会话，以保证连贯性。例如，根据用户/ 参与者定义的简档为通信资源生成话音服务请求。这些话音服务请求可以定义一类动作，即，η路通信会话中的一个参与者请求采取同步边界动作时发生的事件序列。这可以是用户/参与者想在正在进行的通信会话中发起对话的通知。与话音服务请求相关联的特定控制分组信息涉及如下情形1)讲话服务器向收听服务器发送信息；和/或2)服务器从收听模式转变到讲话模式。当用户/参与者之间的翻译/转发空闲时，在同步边界点上兑现这些服务请求。对于在同步点上开始的新通信，在同步点之间处理服务请求。用户简档可被配置成在完成翻译的部分百分比时向同步边界425发出服务请求。在一种极端情况下，一旦检测到用母语的第一口头响应，就可以发起服务请求，以便在发生翻译之前使收听者能够变成下一个讲话者。这样，要讲话的第一个基于SIP的用户将变成下一个讲话服务器，而所有其它参与者延迟后变成收听者，直到听见翻译。在其它极端情况下，用户配置只有当完成翻译时才作出服务请求。可替代地，在折衷模式下，用户配置能够在成功翻译了口头通信中的前η个字时作出服务请求。在这样的方式下，用户配置可被优化用于交谈。图5例示了本发明一个实施例的基于SIP的V0IP，包括在发起η路多用户/参与者话音翻译会话500和检索用户/参与者简档502的最佳位置进行处理的服务器分配过程。如果确定不需要话音处理/翻译504，则与图4中的收听服务器4410类似，服务器分配转发服务506。如果确定需要话音处理/翻译504，则服务器计算特定语言所需的同时处理 /翻译的最大数量508。然后，服务器可以根据各个翻译服务器的位置来查找可用资源510。确定默认/讲话服务器是否能够满足实时处理和路由要求512，如果是，将处理/翻译服务分配给默认/讲话服务器516。如果默认转发/讲话服务器不能满足实时处理和路由要求，那么，在能够满足实时处理和路由要求的收听服务器上调度基于简档的处理和路由。另外，可以将原始话音数据文件/分组发送给较接近许多类似语言用户/参与者的不同位置上的翻译服务器，这些类似语言用户/参与者在地理接近度上与该服务器靠得更近。因此，可以根据参与者定义的简档，将话音文件的位置发送给另一个服务器，而无需实际发送分组。为翻译处理识别最佳服务器的服务器可以根据基于参与者定义简档的活动η路通信会话中的各个参与者的全球定位系统(GPQ位置信息来识别服务器。因此，服务器确定转发/翻译参与者的位置，并使用与特定用户/参与者靠得较近的服务器来分配翻译服务器，以便最小化通信业务拥塞和传输延迟。图6例示了包括VOIP双路会话例子的本发明一个实施例的基于SIP的VOIP。IP 话音服务器600接收来自讲英语用户/参与者1602和讲法语用户/参与者沈06的通信。讲英语用户/参与者1的对话604反映出发起用户/参与者1的对话和来自用户/参与者 2的从法语到英语的翻译后的响应。讲法语用户/参与者2的对话608反映出对用户/参与者1的对话的响应和来自用户/参与者1的从英语到法语的翻译后的响应。讲“N语言” 者用户/参与者“N”将接收以用户/参与者“N”的“N语言”的用户/参与者1和用户/参与者2的整个对话的译文。图7例示了包括VOIP网络上的η路多方话音处理的本发明一个实施例的基于SIP 的VOIP。用于η路多语言通信的VOIP服务器700检测用户/参与者对于用于话音和/或文本多语言通信的服务器中的η路语言翻译的语言优选。除了经受翻译和/或转发的话音和文本数据之外，可以将补充音频、带有文本的文档和带有音频的视频数据合并到η路通信中，并且经受基于用户/参与者定义的简档数据的相同翻译和/或转发功能。VOIP服务器可以包括可以分布在不同地理位置的多个服务器。例如，用户/参与者#1、用户/参与者#2、用户/参与者#3和用户/参与者#4的优选语言分别是英语、西班牙语、法语和英语。可以将话音和文本数据翻译成收听用户/参与者的优选语言，或者，当不需要翻译，例如，在优选语言相同，即，都是英语的用户/参与者#1和用户/参与者#4之间进行通信时，直接转发给用户/参与者。图8例示了包括空闲模式的本发明一个实施例的基于SIP的V0IP，其中，VOIP服务器800检测用户/参与者的语言优选，并利用用户/参与者简档数据来更新用户/参与者简档数据库806。参与者简档数据库806用于将SIP协议推广到关于用户/参与者简档数据之间的相似性或不相似性的比较和确定的基本通信。用户/参与者1802由讲话服务器(TS)识别，而用户/参与者观02由收听服务器(LS)识别。图9例示了包括利用选择性协议的通信的本发明一个实施例的基于SIP的VOIP。用户/参与者1发起(900)用至少两种语言与许多用户/参与者的η路通信。检验(902) 用户/参与者1和预期接收者-用户/参与者2的语言优选904，以确定是否对语言进行翻译。如果不需要翻译而仅仅将通信转发给讲类似语言的接收者，那么，直接将原始话音数据发送给用户/参与者906，并由用户/参与者2在η路通信中接收908。如果根据来自用户/参与者简档数据库904的用户/参与者简档数据的差异，确定(902)需要翻译，那么，根据服务器负载、通信路由和与具有相同语言简档的其它用户/ 参与者的地理接近度，确定在最佳位置翻译话音或文本数据910。通知(91 将接收发送的合成话音译文或文本译文914的用户/参与者2。用户/参与者2接收翻译后的话音/文本数据或原始未经翻译的话音/文本数据 908，并且可能对用户/参与者1或通信会话中的另一个用户/参与者(未示出)作出响应。用户/参与者2在同步点916作出响应，在该同步点916，翻译服务器在翻译了来自先前通信用户/参与者，例如，900上的用户/参与者1的数据之后进入空闲状态。用户/参与者 2的收听/转发服务器现在变成讲话服务器，并根据用户/参与者简档数据库904来检验是否需要语言翻译918。如果不需要翻译，则将原始话音/文本数据发送给用户/参与者926 或如用户/参与者2所指的另一个其它用户/参与者。如果根据来自用户/参与者简档数据库904的用户/参与者简档数据的差异，确定(918)需要翻译，那么，根据服务器负载、通信路由和与具有相同语言简档的其它用户/ 参与者的地理接近度，确定在最佳位置翻译话音或文本数据920。通知(92 将接收发送的合成话音译文或文本译文924的用户/参与者1。图10例示了允许在多个参与者之间进行实时通信的示范性计算机实现实施例，其中，该方法包括在第一服务器处接收来自第一参与者的实时通信，该实时通信由第一口语构成并针对第二参与者1000。由第二参与者识别接收所述实时通信的优选口语1002。确定所述优选接收口语是否不同于所述实时通信的第一口语1004。每当所述优选口语不同于第一口语时，将实时通信从第一口语翻译成第二参与者的优选接收口语，以创建翻译后的实时通信1006。将翻译后的实时通信传递给第二参与者1008。根据参与者定义的简档，生成对通信资源的话音服务请求，并在第一参与者与第二参与者之间按需处理话音通信。翻译后的文本、补充翻译后的音频、翻译后的文档文本和具有翻译后的音频的视频数据也可以根据参与者定义的简档被合并到参与者通信中。可以根据参与者定义的简档来完成话音文件的位置的发送，而不实际发送文档。另外，翻译可以进一步包括根据参与者定义的简档，识别活动通信信道中的各个参与者的全球定位系统(GPS)位置信息。实时通信的处理可以进一步包括根据参与者定义的简档来确定处理实时通信的最佳位置。图11例示了包括通信系统1100的另一个示范性实施例，该通信系统1100包括至少一个发送网际协议话音(VOIP)服务器1102、至少一个接收VOIP服务器1104、以及提供发送VOIP服务器1102与接收VOIP服务器1104之间的通信的至少一个VOIP通信网络 1106。翻译模块1106跨越所述至少一个VOIP通信网络1106在发送(1102)和接收(1104) VOIP服务器之间建立活动η路双向自动话音翻译信道。处于特定位置1110的处理VOIP 服务器1108翻译所述至少一个VOIP通信网络1106上的不同口语的参与者之间的至少一种口语。根据不同口语的参与者的各自参与者简档，确定在处理VOIP服务器1108的特定位置1110进行至少一种口语的处理。如果确定发送VOIP服务器1102或接收VOIP服务器 1104处在管理翻译的处理的特定位置1108，那么，处理服务器1108可以包括那些服务器 (1102/1104)中的某一个。存储在参与者简档数据库中的每个参与者简档包括参与者口语简档。话音服务请求模块根据参与者简档来生成对可用通信资源的请求。媒体合并器将根据参与者简档的包含文本、话音、文档和视频数据的信息与被翻译的至少一种口语合并。多个收听VOIP服务器可以托管具有不同参与者口语简档的参与者。处理VOIP服务器包括多个VOIP讲话服务器和多个VOIP收听服务器。图12例示了包括一种计算机实现方法的另一个示范性实施例，该计算机实现方法包括发起多位置多参与者话音翻译会话1200，然后根据话音翻译会话中的会话参与者的参与者简档来确定是否需要话音翻译处理1202。在多个位置的每一个位置确定可用翻译资源1204，并且根据多个位置的每一个位置上的可用翻译资源来计算可能的同时翻译进程的最大数量1206。确定默认服务器是否能够满足话音翻译会话的实时处理要求和实时路由要求两者1208，并且根据讲话参与者和收听参与者的参与者简档的比较，将翻译处理服务分配给可用翻译资源1210。转发服务的分配基于根据参与者简档对是否需要话音翻译处理的确定。在至少一个收听服务器上，基于根据讲话参与者和收听参与者的参与者简档的比较的确定，调度基于参与者简档的翻译处理服务。借助于其独特的和新颖的特征，本发明的实施例提供了一种协议方法和系统，其中，讲话VOIP服务器能够定位和识别位于同时处理源语言内容和目标语言内容的最佳位置的可用资源，使得最终参与者实时地接收来自收听VOIP服务器的处理后的数据，在所述收听VOIP服务器中，保持在线通信会话期间的通信进度。本领域的普通技术人员应该懂得，本发明的各个方面可以具体化成系统、方法和计算机程序产品。于是，本发明的各个方面可以采取纯硬件实施例、纯软件实施例(包括固件、驻留软件、微码等)或综合本文可以统称为“电路”、“模块”或“系统”的软件和硬件方面的实施例的形式。而且，本发明的各个方面可以采取具体化在一种或多种计算机可读介质中的计算机程序产品的形式，这些计算机可读介质含有具体化在上面的计算机可读程序代码。可以利用一种或多种计算机可读介质的任何组合。该计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是，例如，但不局限于，电、磁、光、电磁、红外、或半导体系统、装置或设备、或前者的任何适当组合。计算机可读存储介质的更具体例子(非排他列表)包括如下含有一根或多根导线的电连线、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、固态器件(SSD)、只读存储器(ROM)、可擦可编程只读存储器(EPR0M或闪速存储器)、光纤、便携式光盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或前者的任何适当组合。在本文件的背景下，计算机可读存储介质可以是可以包含或存储供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合在一起使用的程序的任何有形介质。计算机可读信号介质可以包括计算机可读程序代码具体化在其中，例如，在基带中或作为载波的一部分的传播数据信号。这样的传播信号可以采取多种形式的任何一种，包括，但不局限于，电-磁形式、光形式、或它们的任何适当组合。计算机可读信号介质可以是非计算机可读存储介质的和可以传送，传播，或输送供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合在一起使用的程序的任何计算机可读介质。具体化在计算机可读介质上的程序代码可以使用任何合适介质发送，包括，但不局限于，无线、有线、光纤缆线、RF(射频)等，或前者的任何适当组合。
为本发明的各个方面执行操作的计算机程序代码可以以一种或多种编程语言的任何组合编写，包括像Java、Smalltalk、C++等那样的面向对象编程语言、和像“C”编程语言或类似编程语言那样的传统过程编程语言。程序代码可以完全在用户计算机上执行，部分在用户计算机上执行，作为独立软件包执行，部分在用户计算机上执行而部分在远程计算机上执行，或完全在远程计算机或服务器上执行。在后一种情形下，远程计算机可以通过任何类型的网络与用户计算机连接，包括局域网(LAN)或广域网(WAN)，或可以与外部计算机连接(例如，通过使用因特网服务提供者的因特网)。下面参照按照本发明实施例的方法、装置(系统)和计算机程序产品的流程图范例和/或方块图来描述本发明的各个方面。应该明白，流程图范例和/或方块图的每个方块、和流程图范例和/或方块图中的方块的组合可以通过计算机程序指令实现。可以将这些计算机程序指令提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器，以生产出这样的机器，使经由计算机或其它可编程数据处理装置的处理器执行的指令形成实现规定在流程图和/或方块图的一个或多个方块中的功能/动作的手段。这些计算机程序指令也可以存储在可以指示计算机、其它可编程数据处理装置、或其它设备以特定方式起作用的计算机可读介质中，以便存储在计算机可读介质中的指令形成包括实现规定在流程图和/或方块图的一个或多个方块中的功能/动作的指令的制
P
ΡΠ O计算机程序指令也可以装载到计算机、其它可编程数据处理装置、或其它设备中，使一系列操作步骤在计算机、其它可编程数据处理装置、或其它设备中得到执行，形成这样的计算机实现进程，使在计算机或其它可编程数据处理装置上执行的指令提供实现规定在流程图和/或方块图的一个或多个方块中的功能/动作的进程。图13例示了可以用于实现按照本发明一个实施例的各个示范性方面的计算机系统和方法的典型硬件配置系统。现在参照图13，系统1300例示了可以用于实现本发明系统和方法的典型硬件配置。该配置最好具有至少一个处理器或中央处理单元(CPU) 1310a、1310b。CPU 1310a、1310b 经由系统总线1312与如下设备互连随机访问存储器(RAM)和/或固态器件(SSD) 1314、只读存储器(ROM) 1316、输入/输出(I/O)适配器1318 (将像盘单元1321和磁带驱动器1340 那样的外围设备与总线1312连接)、参与者接口适配器1322 (将键盘1324、鼠标13 、扬声器1328、麦克风1332、和/或其它参与者接口设备与总线1312连接)、将信息管理系统与数据处理网络、因特网、内联网、个人区域网(PAN)等连接的通信适配器1334、以及将总线 1312与显示设备1338和/或打印机1339连接的显示适配器1336。并且，可以包括自动读取器/扫描仪1341。这样的读取器/扫描仪可从许多公司购买到。除了上述的系统之外，本发明的不同方面包括执行上述方法的计算机实现方法。举例来说，这种方法可以在上面讨论过的特定环境下实现。这样的方法可以通过，例如，操作如通过数字数据处理装置具体化的计算机执行一系列机器可读指令来实现。这些指令可以存在于多种类型的信号承载介质中。因此，本发明的实施例的这个方面以编程产品为目的，包括有形地体现可被数字数据处理器执行以便执行上述方法的机器可读指令的程序的信号承载介质。这样的方法可以通过，例如，操作CPU 1310以便执行一系列机器可读指令来实现。这些指令可以存在于多种类型的信号承载介质中。因此，本发明的实施例的这个方面以编程产品为目的，包含有形地体现可被合并了 CPU 1310和上述硬件的数字数据处理器执行以便执行本发明的方法的机器可读指令的程序的信号承载介质。这种信号承载介质可以包括，例如，如例如快速访问存储器所代表的包含在CPU 1310内的RAM和/或SSD。可替代地，这些指令可以包含在CPU 1410可直接或间接访问、像数据存储磁盘1400、⑶-ROM 1402或像USB(通用串行总线)闪存驱动器那样的“即插即用”存储器件1404(图14)那样的另一种信号承载介质中。无论包含在计算机服务器/CPU 1310中，还是处在其它地方，这些指令都可以存储在多种机器可读数据存储介质上，譬如，DASD存储设备(例如，传统“硬盘驱动器”或 RAID阵列)、磁带、电只读存储器(例如，ROM、SSD、EPR0M、或EEPR0M)、光存储设备(例如， ⑶-ROM、WORM、DVD、数字光带等)、纸质“穿孔”卡、或包括像数字和模拟通信链路和无线那样的传输介质的其它适当信号承载介质。在本发明的例示性实施例中，机器可读指令可以包含从像“C”等那样的语言中编译而来的软件目标代码。图中的流程图和方块图例示了按照本发明各种实施例的系统、方法和计算机程序代码的可能实现的结构、功能和操作。关于这一点，流程图或方块图中的每个方块可以代表包含实现指定逻辑功能的一条或多条可执行指令的代码的模块、片段、或局部。还应该注意到，在一些可替代实现中，标注在方块中的功能可能并非按照标注在图中的次序发生，例如，相继示出的两个方块事实上可能几乎同时被执行，或取决于所涉及的功能，这些方块有时可能按相反次序执行。还应该注意到，方块图和/或流程图范例的每个方块，和方块图和 /或流程图范例中的方块的组合可以通过执行指定功能或动作的基于专用硬件的系统，或专用硬件和计算机指令的组合来实现。
权利要求
1.一种允许在多个参与者之间进行实时通信的计算机实现的方法，所述方法包含在第一服务器处接收来自第一参与者的实时通信，所述实时通信由第一口语构成并针对第二参与者；由计算设备识别所述第二参与者接收实时通信的优选口语；由所述计算设备确定所述优选接收口语是否不同于所述实时通信的所述第一口语；每当所述优选口语不同于所述第一口语时，由所述计算设备将所述实时通信从所述第一口语翻译成所述第二参与者的所述优选接收口语，以创建翻译后的实时通信；以及由所述计算设备将所述翻译后的实时通信传递给所述第二参与者。
2.按照权利要求1所述的方法，进一步包含由所述计算设备根据参与者定义的简档来生成对通信资源的话音服务请求。
3.按照权利要求1所述的方法，进一步包含由所述计算设备根据参与者定义的简档来按需处理第一和第二参与者之间的所述话首通信 ο
4.按照权利要求1所述的方法，进一步包含由所述计算设备根据参与者定义的简档将翻译后的文本、补充翻译后的音频、翻译后的文档文本和具有翻译后的音频的视频数据合并到所述通信中。
5.按照权利要求4所述的方法，进一步包含由所述计算设备根据参与者定义的简档来传送话音数据的位置，而不实际发送所述话音数据。
6.按照权利要求1所述的方法，进一步包含其中，所述翻译包含由所述计算设备根据参与者定义的简档，识别活动通信信道中的各个参与者的全球定位系统(GPS)位置信息。
7.按照权利要求1所述的方法，其中，所述实时通信的所述处理进一步包含根据所述参与者定义的简档来确定处理所述实时通信的最佳位置。
8.一种通信系统，包含至少一个发送网际协议话音(VOIP)服务器；至少一个接收VOIP服务器；提供所述发送VOIP服务器和所述接收VOIP服务器之间的通信的至少一个VOIP通信网络；跨越所述至少一个VOIP通信网络在所述至少一个发送和所述至少一个接收VOIP服务器之间建立活动η路双向自动话音翻译信道的至少一个翻译模块；以及翻译所述至少一个VOIP通信网络上的不同口语参与者之间的至少一种口语的处于特定位置的处理VOIP服务器，其中，根据不同口语的所述参与者的各自参与者简档，确定在所述处理VOIP服务器的所述特定位置进行所述至少一种口语的所述处理。
9.按照权利要求8所述的系统，其中，所述参与者简档每一个都包括参与者口语简档。
10.按照权利要求8所述的系统，进一步包含根据所述参与者简档来生成对可用通信资源的请求的话音服务请求模块。
11.按照权利要求8所述的系统，进一步包含将根据所述参与者简档的包含文本、话音、文档和视频数据的信息与被翻译的所述至少一种口语合并的媒体合并器。
12.按照权利要求8所述的系统，进一步包括参与者简档数据库。
13.按照权利要求8所述的系统，进一步包含托管具有不同参与者口语简档的参与者的多个收听VOIP服务器。
14.按照权利要求8所述的系统，其中，所述处理VOIP服务器包含多个VOIP讲话服务器和多个VOIP收听服务器中的至少一个。
15.一种计算机实现的方法，包含由计算设备发起多位置多参与者话音翻译会话；由所述计算设备根据所述话音翻译会话中的会话参与者的参与者简档来确定是否需要话音翻译处理；确定所述多个位置的每一个位置上的可用翻译资源；由所述计算设备根据所述多个位置的每一个位置上的所述可用翻译资源来计算可能的同时翻译进程的最大数量；由所述计算设备确定默认服务器是否能够满足所述话音翻译会话的实时处理要求和实时路由要求两者；以及由所述计算设备根据讲话参与者和收听参与者的所述参与者简档的比较，将翻译处理服务分配给所述可用翻译资源。
16.按照权利要求15所述的方法，进一步包含由所述计算设备基于根据参与者简档对是否需要话音翻译处理的所述确定来分配转发服务。
17.按照权利要求15所述的方法，进一步包含基于根据所述讲话参与者和所述收听参与者的所述参与者简档的比较的所述确定，在至少一个收听服务器上调度基于参与者简档的翻译处理服务。
18.按照权利要求15所述的方法，进一步包含由所述计算设备根据参与者定义的简档将文本、话音、文档和视频数据合并到所述话音翻译会话中。
19.按照权利要求15所述的方法，进一步包含由所述计算设备根据参与者定义的简档将参与者的全球定位系统(GPQ位置信息合并到所述话音翻译会话中。
20.按照权利要求15所述的方法，其中，所述参与者简档每一个都包括参与者口语简档。
全文摘要
本发明涉及允许在多个参与者之间进行实时通信的方法和系统，具体地，允许在多个参与者之间使用选择性广播协议来进行同时实时多语言通信的计算机实现的方法和系统，该方法包括在第一服务器处接收来自第一参与者的实时通信，实时通信由第一口语构成并针对第二参与者。由第二参与者识别实时通信的优选接收口语。确定优选接收口语是否不同于实时通信的第一口语。每当优选口语不同于第一口语时，将实时通信从第一口语翻译成第二参与者的优选接收口语，以创建翻译后的实时通信，而当第二参与者的优选口语与第一参与者的第一口语相同时，转发实时通信而无需翻译。
文档编号H04L12/58GK102088456SQ20101058341
公开日2011年6月8日申请日期2010年12月3日优先权日2009年12月8日
发明者A·苏伦, E·D·B·豪尔, P·A·萨姆, S·T·温特罗内, 赵季群申请人:国际商业机器公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵季群;Ｅ.Ｄ.Ｂ.豪尔;Ｐ.Ａ.萨姆;Ａ.苏伦;Ｓ.Ｔ.温特罗内
技术所有人：国际商业机器公司
我是此专利的发明人

上一篇：一种基于协同工作的交互式电子白板系统的制作方法
上一篇：信号传送方法和装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。