用于为电话通话的语音到文本转录确定语言的方法和设备的制造方法

文档序号:8532118阅读:477来源:国知局
用于为电话通话的语音到文本转录确定语言的方法和设备的制造方法
【专利说明】用于为电话通话的语音到文本转录确定语言的方法和设备
[0001]本发明总体上涉及用于将语音消息转录成文本的方法、设备和系统。本发明更特别地涉及用于确定语音到文本转录的语言的方法、设备和系统。
[0002]已经开发了许多转录系统和方法。例如当呼叫者建立连接以给接收者留消息时,通话可能会被转录代理监控或者被转录算法分析以识别出正确的转录语言。语音消息然后被代理手动地或者通过转录算法转录成文本文件。由现有解决方案提供的手动的语音到文本转录系统的一个缺点在于需要人力来转录,由于成本的原因这限制了语音到文本转录服务(VTTS)的可用性并且抑制了 VTTS在国家和国际层面上的传播。由于会涉及不同语言,手动VTTS的传播需要大量的人力。此外,由于语音到文本转录(VTT)的算法性能不够,可用的自动VTTS是不可靠的。语音识别系统领域中的首要问题是语言识别。在不能识别出正确的语言的情况下,这导致自动转录的所有在后处理步骤的讹误。抑制VTTS的地域扩展的另一个原因是,在实际接收者不可及或者不方便的情况下,用于接收通话的应答机不提供可接受的语言以与呼叫者通信和以根据正确的语言转录语音消息。
[0003]因此,需要用于通过基于不同的规范或条件而确定正确的语言来将语音消息转录成文本的方法、设备和系统,以增强转录性能。
[0004]本发明的另一个目标在于向呼叫者和/或接收者提供期望的语言用于转录语音消息。
[0005]本发明的又一目标在于提供用于电话、特别是用于手机的语音到文本转录模式,其能够由接收者激活,使得当接收者不方便应答语音通话时,转录语言被选择为使得接收者在任何情况下都能够接收文本形式的被转录的语音消息。
[0006]通过以下方法实现本发明的前述目标和其他目标,所述方法用于从可用于由应答机系统提供的对呼叫者和接收者之间的电话通话进行语音到文本转录的多种语言中确定语言,其特征在于,基于以下选项中的至少两个向呼叫者建议所述可用语言中的至少两种:
[0007]-与所述呼叫者对应的电话国家代码,
[0008]-与所述接收者对应的电话国家代码,
[0009]-在可用于由所述应答机系统进行的转录的一组语言中包含的语言,
[0010]-基于由呼叫者或接收者设定的参数而自动选择的语言,
[0011]-由所述呼叫者定义的语言,
[0012]-由所述接收者定义的语言。
[0013]其中所述呼叫者选择与所述应答机系统交互的所述语言,并且相应的语音消息被转录成所选语言的文本用于传送给所述接收者。
[0014]在基于前述条件建议了一种或更多种语言后,呼叫者通过输入相应的号码或者通过语音命令来选择语言,使得语音消息被转录成文本。还能够基于由呼叫者或接收者设定的参数自动选择用于语音到文本转录的语言。
[0015]考虑以下详细描述和附图,本发明的以上和其他的方面和优点会变得明显,在附图中:
[0016]图1表示实施方法并且包括根据本发明的一些实施例的用于将语音消息转录成文本的设备和系统的电话网络的框图。
[0017]在用于确定语音消息到文本的转录(VTTS)中的语言的系统中起着重要作用的实体是:呼叫者的电话3、实际与呼叫者的电话3联系的服务提供者4(不管服务提供者4是否进行漫游服务)、连接全世界服务提供者的全球网络6、实际与接收者的电话5和应答机联系的服务提供者1,其中所述应答机包含在正接收来自呼叫者的电话通话的服务提供者I的服务器中托管(host)的语音到文本转录VTT 2。
[0018]因此,基于本发明,技术问题在于,当呼叫者进行电话通话而接收者未应答并且服务提供者I想向接收者提供不仅听取呼叫者的消息而且将由呼叫者留下的语音消息的呼叫者语言转录成文本的可能性时,具有VTT设施的服务器侧要做什么。然而,能够仅使用伴随呼叫者的电话3的少量信息(例如国家代码)或根据在接收者的服务提供者I的服务器中存储的一些信息来选择转录语言。例如,在接收者与服务提供者I签订电话协议的时刻,可以设定他/她想要用于VTTS的转录语言。
[0019]根据本发明的一些有用的实施例,服务器能够存储呼叫者和接收者先前选择的语言和/或设置。根据存储的信息,服务器向呼叫者和/或接收者建议优选的语言,或者其自动选择由同一呼叫者在先前通话期间使用的VTT2的语言。存储相关信息的一个有利的实施例是存储与特定电话号码相关的语音到文本转录语言。在这种情况下,服务提供者I记录呼叫者的电话号码和同一呼叫者之前使用的用于转录的语言,应答机具有自动选择用于未应答来电并且用于执行语音到文本转录的语言的可能性,而不需要搜索可用于转录的所有语言。
[0020]存在几个有利的可选方案来限定依赖关系以建议优选的语言。第一可选方案是根据呼叫者的电话号码建议所选语言。在这种情况下,使用从特定的呼叫者到特定的接收者的先前通话中的语言选择来建议优选的语言。第二可选方案是根据特定的接收者来建议所选语言。根据该可选方案,建议与接收者的国家代码相关的语言或者以前使用的语言,而不管呼叫人的电话号码和在服务器中所存储的语言。该可选方案具有如下优点,在使用语音到文本转录系统一段时间之后,根据特定的接收者的所有可使用的语言都被存储在服务器上,这提高了为将来的语言到文本转录而建议和选择合适语言的效率和速度。
[0021]存在数种可能性来限定电话国家代码。电话国家代码得自在呼叫者或接收者的相应电话号码中包含的电话国家代码(例如德国是+41,英国是+44,法国是+33等),所述国家代码对VTT来说是已知的,这是由于其例如是来电时由电信网络6发送到VTT的。
[0022]电话国家代码还与所使用的SIM卡的来源国有关(或者对应于所述呼叫者或接收者在通话期间的当前位置),或者还与MCC(移动国家代码)和MNC(移动网络代码)有关,这两种代码结合形成国际移动用户识别码(IMSI),其唯一地标识移动电话运营商/承载商,并且由此隐含地标识通话源自哪个国家或呼叫者的国家。
[0023]使用与术语“语言”相关的术语“建议”来表示提供可视或可听的信息或指示(如语音消息),其指定一种或更多种语言或者指定包括一种或更多种语言的列表以用于手动或自动选择。短语“国家代码”的使用等同于电话国家代码。
[0024]使用与呼叫者或接收者对应的国家代码作为条件,在两端(即在呼叫者端和接收者端)都涉及数种可能性。依赖于呼叫者的一个可选方案是验证呼叫者的电话号码的国家代码。这意味着如果呼叫者的电话号码源自特定国家或基地在特定国家的特定电信公司,那么相应地使用和建议这些国家中的一个的国家代码,其通常为同一国家代码。当呼叫者停留在他/她居住和说
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1