一种用于向无线信息设备提供语音邮件的方法

文档序号:7606272阅读:173来源:国知局
专利名称:一种用于向无线信息设备提供语音邮件的方法
技术领域
本发明涉及一种用于向无线信息设备提供语音邮件的方法。在本专利说明书中使用的术语‘无线信息设备’应该被可扩展地解释为覆盖具有双向无线信息能力的任何类型的设备,并且包括但不限于无线电话、智能电话、发信机、无线消息终端、个人计算机、计算机和应用程序专用设备。它包括能够经由任何类型的网络依照任何方式来进行通信的设备,诸如GSM或者UMTS、CDMA和WCDMA移动无线电通信、蓝牙、IrDA(红外线数据传输)等等。
背景技术
语音邮件具有这样的专用目的,即当某人尝试呼叫一用户的电话但该用户不可用时,用于存储来自该人的语音消息,并且随后在方便的时候将该消息传递给该用户。但是如今的语音邮件系统(尤其是对于诸如移动电话之类的无线信息设备而言)无法智能地执行此操作。主要原因在于从用户无线信息设备到远程语音邮件服务器的交互特性通常,移动电话用户将呼叫由网络操作方控制的语音邮件服务器(或者由语音邮件服务器呼叫移动电话用户)。所述语音邮件服务器将生成合成语音,用于向用户通告消息数目,然后重放所述消息;然后由所述合成语音讲出各种选项,诸如“按1回复”、“按2删除”、“按3重复”等。这向用户提出了多个问题第一,他也许没有笔和纸在手边来记下任何重要的信息;第二,他可能忘记或不能够听到选项,并且因此将无法有效地操作语音邮件系统。
由于这种不适当的并且晦涩的交互,所以至少45%的移动电话用户不使用语音邮件。在使用语音邮件的用户中,语音邮件通常占据用户通话时间和花费的30%。这种可能令人吃惊的高程度的其中一个原因是由于交互困难,仅仅为了收听在第一次收听时没有得到关键消息的细节,用户经常再次拨入电话。
为了使获取语音邮件更加容易,已经做出了一些努力例如可以参考Breveon公司的US 6507643在该篇专利中,使用语音识别计算机将语音邮件自动地转换为文本消息,该文本消息适合作为电子邮件消息发送,并且可以在诸如PC或者膝上型计算机的文本显示设备上查看。读取书面消息比必须收听讲出的语音邮件要快;而且因为已经将其转录,所以不需要写下来自消息的重要信息。然而,自动语音邮件系统具有十分有限的性能和准确性;它们还盲从地转录人的话语中的正常停顿(‘呃’、‘嗯’、‘啊’等)。当一个人正在收听人讲话时,他很容易过滤出这些声音并且关注于实质交流。把这些停顿盲从地转录为电子邮件会使发件人看起来不容易被理解。
从理论上看,在移动电话自身内也可以配置自动语音-文本转换可以参考“Nokia Short Voice Messaging system”(诺基亚短语音消息系统)(参见EP 1248486),在该系统中,用户可以向其移动电话讲一条消息,所述移动电话使用自动语音识别引擎在本地将其转换为文本,然后将其打包并且作为SMS消息发送。
在语音-文本转换系统的领域中不可避免的偏见在于改善自动语音识别软件的准确性;然而,当前一代的软件仍需要被训练来识别特定人员所讲的单词,或者仅限于识别非常有限的词汇,而且在语境方面存在很大困难。训练要求用户读出非常广泛的测试段落,然后校正由机器转录引入的转录错误。这是非常慢并且是费力的工作。虽然这可以避免使用移动电话的小按键来输入文本消息,但是它没有解决常规自动语音识别软件固有的不准确和不恰当转录的问题。
构造可以可靠并且正确识别涉及任何对象、任何人并且以正常速度讲出的自然言语的语音识别软件的任务是令人畏惧的事情。然而,在语音-文本系统的领域中,这是重要的目标。本发明挑战这种传统观念。

发明内容
依照第一方面,提供了一种用于向无线信息设备提供语音邮件的方法,包括如下步骤(a)在语音邮件服务器上接收语音消息;(b)把所述语音消息转换为音频文件格式;(c)经由广域网向包括计算机网络的语音-文本转录系统发送或者流送所述音频文件;其中所述方法的特征在于如下步骤(i)一个联网计算机向操作方播放所述语音消息;(ii)所述操作方智能地把原始语音消息转录到所述计算机中,以生成转录的文本消息;(iii)所述操作方使所述转录的文本消息将被从计算机发送到所述无线信息设备。
因为使用操作员而不是机器转录,所以语音邮件能够被正确地、智能地、适当地并且简练地转录为文本消息(例如,SMS/MMS)。
使用此方法提供语音邮件存在许多优点A.替你记录ο不进行拨入来获取消息;取而代之,它们已经被正确地并且智能地(例如省去停顿、重复等等)转录为消息格式。
ο通过给予用户接收的语音邮件的‘收件箱’视图,可以在打开并且读取消息前看见该消息实际来自于谁,并且控制读取哪些以及何时对其进行存储、转发、删除、回复等。已转换的语音邮件将具有与标准文本消息不同的图标。在号码可以得到的情况下,呼叫方ID被用于利用该号码来填充文本消息首部,从而使其看上去像是直接来自那个人。否则,如果所述号码不能得到,那么收件人将看到它是来自于‘Spin Vox语音邮件’。
ο关键信息在手边—当你被假定‘移动’时,不需要搜索笔和纸·大部分新的电话(尤其是智能电话)都能够解析文本,然后提供其有用部分以便在电话及其应用程序内部自动使用,由此节省用户复制交叉——例如,电话号码可用于立即存储或者使用,地址可以被超链接并且被添加到联系人,或者被用于在映射软件上自动地定位等等。
B.离散的并且便利ο当繁忙时没有来自语音邮件的骚扰呼叫。相反,用户可以在会议时看到语音消息到达,并且自行决定是否读取它们。
C.始终可以给你消息οSMS存储&转发能力确保一旦用户电话返回到或返回进覆盖范围内,就快速地递送ο选择便利的递送方法SMS、电子邮件、传真D.将支持呼叫转移的任何其他电话,例如你的办公室电话(座机)转移至文本转换服务ο座机&移动语音邮件现在都可以作为文本递送到用户的移动电话——所有都在一个地方,在手边很方便ο从任何电话——移动电话或者座机,来访问语音邮件,这是因为语音邮件的原始语音文件被存储在服务器,其中所述服务器可以由任何电话利用密码来访问E.当在国外漫游时,语音消息递送便宜ο无论用户在何地,他们都可以继续接收到文本形式的语音消息ο用户可以改为电子邮件接收它们,以便用户可以在全世界以及移动覆盖范围之外获取ο不需要漫游费用或者昂贵的回拨来获取消息付账存在两种选择——预付或者后付,可以经由用户电话账单上的小账单或者信用/借记卡,以及可以直接借记按月付款。实际上,经由第三方商业服务供应商可以使用任何支付方法,因此甚至是美国常见的PayPal在欧洲正变得作为有效支付方法可用。
信用/借记卡用户将能签约信用/借记卡来用于自动按月付款,包括直接借记(UK)以及美国的PayPal。
小账单用户将能通过单个回复付款的SMS来购买SpinVox信用(例如£10的价值),该SMS将确认他们的新信用。通常,这样做将引起预付市场的兴趣。这样做巧妙地避免了每当他们使用所述服务时、多个个体微小事务的相对昂贵的成本(60%+),在相反的情况下,会使其非常昂贵,并且鼓励来自用户的对服务的一些承诺。


将参照附图描述本发明,其中图1-3是依照本发明的整个语音邮件处理过程的示意图,所述处理过程从语音邮件发起开始、直到语音邮件处理、以及语音邮件递送;图4描述了使用本发明的方法转录的语音邮件的消息通知格式(在移动电话的消息收件箱中显示);图5描述了常规的文本消息通知;图6描述了使用本发明的方法转录的语音邮件如何表现为在移动电话上显示的文本消息;图7描述了在消息收件箱中显示文本消息列表的移动电话。转录的语音邮件存在于所述列表中;插图示出了如果选择,将如何进行显示;图8描述了可作为与转录语音邮件有关的选项加以利用的三个新功能的菜单列表;图9A至9D描述了用于管理常规音频语音邮件的基于GUI的语音邮件管理应用程序;图10描述了允许用户向其移动电话讲入消息并且使其远程转换为文本消息的应用程序的操作;图11示出了语音邮件服务器处的动作的整个流程,以表明由用户输入启动的动作;
图12示出了在语音消息转录方进行的整体动作流程;图13示出由语音消息转录方使用的基于网页的交互的屏幕快照。
发明详述本发明是作为一组移动电话产品的一部分由英国伦敦的SpinVox有限公司实现的1.VoicemailViewTM语音邮件-文本系统——这给予订户选项,以将语音邮件作为文本(SMS/MMS或等效消息格式)递送到其移动电话,其中具有选项来在移动电话上听取原始语音邮件。术语‘SMS’指的是短消息服务,用于向移动电话发送明文消息;‘MMS’指的是由3GPP(第三代合伙项目,Third Generation Partnership Project)开发的多媒体消息服务,用于在移动电话以及其他形式的无线信息设备之间发送多媒体通信。所述术语还包含任何中间技术(诸如EMS(增强消息业务))以及诸如收费SMS之类的变体,以及这些业务的任何进一步增强和开发。
2.VoicemailManagerTM新的语音邮件管理应用程序——其向移动电话添加了GUI(图形用户界面);它补充了(或者替代)由蜂窝电话语音邮件系统提供的现有音频菜单系统(UI)并且集成了电话的呼叫转移特征、问候控制以及其它有关控制,以便在移动电话上为语音邮件管理提供单个环境(应用程序)。
3.VoiceMessengerTM语音-文本系统——其允许用户向他们的移动电话讲出文本消息,使其被远程转换为文本,然后在不使用通常令人厌倦的字母数字的电话键盘输入系统情况下进行发送。
把语音消息准确转录为文本格式(如VoicemailView和VoiceMessenger中所配置的)的关键在于使用操作员来通过提取消息(不是罗嗦的逐词转录)智能地执行实际转录、而不是利用自动语音识别系统。此系统有效操作的关键在于这样一种IT体系结构该IT体系结构向操作方快速地发送语音文件,并且允许他们快速地听取这些消息且有效地生成转录,以及允许他们把转录的消息作为文本消息发送。
A.VoicemailViewTM语音邮件-文本系统描述了用于递送的语音邮件-文本系统的三种解决方案1.网络操作方内部——所述系统被集成在操作方的网络服务内(参见图1)。
2.网络操作方的外部——服务公司经由固定电话来访问网络操作方的语音邮件系统,并且提供导向终端用户的外部服务;参见图2,或者在服务公司内安放自己的语音邮件系统且完全在网络操作方的服务以外递送其服务,并且因此是网络操作方和手机相互独立,参见图3。
A.1VoicemailView操作方变体的内部现在参照图1,如下配置所述过程1呼叫者从PSTN或者移动电话网络留下语音邮件。
2通过语音转录服务把语音邮件转换为SMS或者MMS文件这不是由自动语音识别系统执行,而是由操作员来执行。这些操作员比自动语音识别系统更加准确并且灵活,并且可以智能地翻译所述消息、消除不必要停顿和重复,从而生成短的、简单的并且易懂的消息。附录II定义了有效的并且简明转录的要求。操作员往往能够显著地缩短消息以便使它们适合在160个字符的现有SMS文本消息最大限度内(否则经由标准级连使更长的消息适合多个SMS消息);然而对于MMS,则没有这种最大限度。
·生成至原始语音邮件文件的链接(唯一i/d)——此i/d可以仅仅是时间/日期&呼叫者号码的散列·把语音邮件的所述时间&日期添加到SMS/MMS文件的首部·把呼叫者号码添加到SMS/MMS文件的首部3把消息文件发送到SMS或者MMS服务器以用于存储。
4经由SMS或者MMS网关把消息发送至无线终端。
5用户在SMS或者MMS应用程序内查看并且管理‘文本’语音邮件,或者甚至在取决于平台的消息应用程序内部查看并且管理‘文本’语音邮件。
6用户可以请求通过在终端上运行的新VoicemailManager应用程序(其为所有语音邮件功能提供GUI接口;参见B.2)听取原始语音邮件播放、快进(FFW)、回倒(REW)、下一、擦除、存储、转发、消息的时间/日期、回呼(以及通过音频提示/菜单可得到的任何其他现有语音邮件控制)。
7当消息‘读取’时,SMS/MMS的可靠递送使SMS/MMS存储与语音邮件存储同步。
A.2操作方变体的外部;服务公司为操作方提供语音-文本设施现在参照图2,如下配置所述过程1新的订户向服务公司提供他们的电话号码、语音邮箱PIN号以及其它细节。这使得所述语音邮件获取和存储服务器能够通过对其进行定时轮询或者通过操作方内部的语音邮件系统向其发送新的语音邮件通知,来访问它们的语音邮箱,以获取消息。对于用户付账存在2种选项(预付或者后付)1.回复文本账单(小账单)2.按月信用/借记卡账单2呼叫者从PSTN或者移动电话网络留下语音邮件。
3服务公司语音邮件获取&存储服务器访问订户的语音邮箱&‘收听’消息·使用标准DTMF音调播放消息、获取呼叫的时间、呼叫者号码以及其他数据来构建文本递送所必需的数据·创建唯一的i/d——可以仅仅是时间/日期&呼叫者号码的散列·存储语音邮件,以用于将来播放4将语音邮件音频文件发送给基于操作员的语音转录系统并且将其转换为SMS或者MMS文件,并且发送给第3方SMS/MMS网关以用于递送·生成至原始语音邮件文件的链接(唯一i/d)并且被作为用户无法知晓的信息嵌入SMS/MMS文件中·把语音邮件的时间&日期添加到SMS/MMS文件的首部·把呼叫者号码添加到SMS/MMS文件的首部·MMS文件可以包含被嵌入来用于本地播放的原始音频文件5经由订户的网络操作方来递送SMS或者MMS消息·经由SMS或者MMS网关把消息发送至无线终端。
·用户在SMS或者MMS应用程序内查看并且管理‘文本’语音邮件,或者甚至在取决于平台的消息应用程序内部查看并且管理‘文本’语音邮件。
6用户可以使用终端上的新语音邮件管理应用程序(其提供了GUI;参见B.2)拨入他们在网络上的语音邮件播放、快进(FFW)、回倒(REW)、下一、擦除、存储、转发、消息的时间/日期、回呼(以及通过音频提示/菜单可得到的任何其他现有语音邮件控制)。
7为了听到原始语音邮件,用户被连接回服务公司的语音邮件存储服务器。所述唯一的i/d(在SMS/MMS消息中用户无法知晓的)获取正确的文件来用于播放。
A.3操作方外部由服务公司完全提供的语音邮件现在参照图3,如下配置所述过程1新的订户向服务公司提供他们的电话号码和账单细节。
他们现在正在将服务公司用作他们的语音邮件供应商。
2个选项1.他们人工地把对他们电话的呼叫转移为服务公司语音邮件网关号码2.服务公司提供空中传递(over the air)升级来改变这个行为对于付账存在2种选择(预付或者后付)3.回复文本账单(小账单)
4.按月信用/借记卡账单2呼叫者从任何电话,通常是PSTN或者移动电话网络留下语音邮件。
3服务公司语音邮件提供所有语音邮件功能1.存储语音邮件以用于将来播放2.创建唯一的i/d——可以仅仅是时间/日期&呼叫者号码的散列4将语音邮件音频文件发送给基于操作员的语音转录系统并且由操作员转换为SMS或者MMS文件,并且发送给第3方SMS/MMS网关以用于递送·生成至原始语音邮件文件的链接(唯一i/d)并且作为SMS/MMS文件中用户无法知晓的信息被嵌入·把语音邮件时间&日期添加到SMS/MMS文件的首部·把呼叫者号码添加到SMS/MMS文件的首部·MMS文件可以包含被嵌入来用于本地播放的原始音频文件5经由订户的网络操作方来递送SMS或者MMS消息·经由SMS或者MMS网关把消息发送至无线终端。
·用户在SMS或者MMS应用程序内查看并且管理‘文本’语音邮件,或者甚至在取决于平台的消息应用程序内部查看并且管理‘文本’语音邮件。
6用户可以使用标准IVR控制或者终端上的新语音邮件管理应用程序(提供GUI;参见B.2)拨入他们在网络上的语音邮件播放、快进(FFW)、回倒(REW)、下一、擦除、存储、转发、消息的时间/日期、回呼(以及通过音频提示/菜单可得到的任何其他现有语音邮件控制)。
7为了听取原始语音邮件,用户被连接回服务公司的语音邮件存储服务器。所述唯一的i/d(在SMS/MMS消息中用户无法知晓的)获取正确文件以用于播放。
B.移动电话软件在任何上述变体中,所述移动电话(或者具有某些特性的其他无线信息设备)将需要经由OTA(空中传递)进行升级或另外采用以下方式升级B.1查看语音邮件-文本消息存在两种选项1.不修改现有电话GUI——仅仅将所述SMS处理为另一消息,所述SMS是转录的语音邮件2.将所述GUI修改为并入如下所示的新特征图4示出了电话手持机图标,该电话手持机图标可以紧跟SMS消息使用,以表明它是消息收件箱中的语音邮件消息。转录为文本的语音邮件存在于设备的消息收件箱中;它已经被从Homer Simpson发送。图5示出了当前SMS文本图标看起来的样子。另一个解决方案是对于语音邮件而言在每个首部之前加上某些逻辑,诸如“V”——因此,“VHomer Simpson”将表明转录的语音邮件的SMS来自Homer Simpson。另外,在语音邮件消息的文本文件内部,应该添加语音邮件的时间和日期(由于不是所有网关都正确地用时间戳表明已发送消息),如图6所示。图7示出了移动电话环境中的此种操作。用户对高亮度显示的已转录语音邮件(来自Daniel Davies)选择‘读取’选项;所述设备依照正常方式显示所述SMS,但是具有所添加的数据和时间。还可能的是,仅仅通过按下并按住特定按键(在该图中是按键‘1’)来激活基于正常音频的语音邮件播放功能。
当人们打开标准SMS消息时,通常可以容易地访问进一步的功能(例如经由诺基亚移动电话中的选项菜单),诸如‘擦除(Erase)’、‘回复(Reply)’、‘编辑(Edit)’等等。基于此标准‘选项’菜单或等效物,本实现方式添加了三种新功能,如图8所示·听取原始文件·回呼·添加联系人下面我们详述这些新的功能听取原始文件其允许用户此刻听取原始语音邮件,并且使用编码入SMS/MMS消息的唯一i/d来正确地连接到原始语音文件。
存在三个选项(i)用户进入标准语音邮件系统,并且遵循现有音频提示来听取消息。
(ii)用户进入下文在B.2示出的新的语音邮件管理应用程序。
在任何一种情况下,当结束对语音邮件的呼叫时,用户返回到消息应用程序中的同一点来判定采用文本/音频版本做什么。
(iii)用户把原始声音文件嵌入MMS消息(或等效物,诸如电子邮件)以待在终端上本地播放。
回呼此操作使用与消息一同记录的呼叫者号码来对其进行回呼。添加联系人此操作获取呼叫者的号码并且自动将其添加到用户的新联系人/地址条目以便利用名称等来完成。
这是移动电话软件的特定例子,其能够解析已经从语音转换的文本并且智能地使用它。其他例子包括(a)提取讲出的电话号码,以允许它被使用(来进行一个呼叫)、保存、编辑或添加到电话簿;(b)提取电子邮件地址并且允许它被使用、保存、编辑或添加到地址簿;(c)提取物理地址并且允许它被使用、保存、编辑或添加到地址簿;(d)提取网页地址(超链接)并且允许它被使用、编辑、保存或添加到地址簿或者浏览器收藏夹。
(e)提取会议时间并且允许它被使用、保存、编辑并且作为条目添加到议程(f)提取号码并且将它保存到其中一个设备应用程序(g)提取实际名词并且提供选项来在网页上(WAP或者全部的浏览器)对其进行搜索或者查找。
此操作可以进行的程度取决于你手机的智能性(实质上是其解析能力以及与其它应用程序和通常存储这种数据以用于其它应用程序的普遍剪贴板之间的互操作性)。目前,几乎所有的电话都支持从文本消息中提取电话号码、电子邮件地址和网页地址。当用户读取到消息时,利用加下划线的内容通常可以获得它(如超链接或等效物);然后用户仅仅选择‘选项’(如在诺基亚电话上找到的、或在不同手机上的等效物)和‘使用’(如在诺基亚电话上找到的,或者在不同手机上的等效物),然后根据内容类型,进一步进行上下文相关的选项(例如利用它可以提供的街道地址——在地址簿查找、导航、保存等等)。
B.2VoicemailManagerTM语音邮件管理应用程序此应用程序可被单独使用或者作为如上在B.1所述的VoicemailView语音-SMS/MMS系统(或等效的文本递送系统)的组成部分。
在访问和管理正常的音频语音邮件时,除通常接收到的标准音频提示以外,所述语音邮件管理应用程序还给予用户GUI(图形用户界面)。当订户使用他们的移动电话访问(图9A)他们的音频语音邮件时,首先使他们进入其‘语音邮件收件箱’,然后利用图9B至9D示出的控制来进行呈现。
出于编程的目的,这些控制将几乎全部涉及标准DTMF音调,当用户现在按下他们电话小键盘上的按键时,所述语音邮件系统将其用作对它的输入。
图9A示出了用户呼叫语音邮件;图9B示出了如何调用新的管理应用程序,其首次显示收件箱的所有语音邮件内容(此处,3条新的音频呼叫以及2条存储音频呼叫)。所述选项菜单如下操作

参照图9C,如果用户选择他希望收听的音频语音邮件类别(即,新的或者存储的),那么向其示出该类别中的音频语音邮件的菜单列表,每个邮件利用发件人名字(如果可得到的话)或者缺少名字、以及呼叫者号码进行标识。转录的文本消息在理想情况下已经通过转录服务为其添加呼叫者名字。这包括通知用户何时在VoicemailView中关闭语音-文本转换(即,他们希望明码语音邮件),以便使他们在判断是否拨入并且收听它之前,能够看到给他们留下语音邮件的人员名字。用户可以容易地导航到和选择他希望收听的音频消息。一旦消息被选择,那么如图9C所示,在屏幕上显示新的语音邮件控制。它们的功能如下


在此过程期间,始终向用户提供听觉的导航选项,其与显示在屏幕上的内容同步,以便使他们在两个领域都是最好的。通过使用基于简单命令的语音识别,用户可以仅仅讲出他们希望执行的命令,因此如果用户希望播放新消息,那么他们将仅仅说出“播放”,并且VoicemailManager引擎将识别此命令并且仅仅执行该操作——播放消息。
注释正确的号码(小键盘号码)以及它们的相关功能与现有语音邮件系统相同,并且通过网络操作方/语音邮件系统来改变。
B.3VoiceMessengerTM语音-文本(SMS/MMS)服务对于用户而言,优选的是,希望依照文本格式发送消息、而不是语音——例如,如果他们不希望干扰收件人,但是希望给他们消息。对于人们在小型字母数字小键盘上使用手指键入文本通常是十分困难的。他们还可能在移动(诸如步行),或者在汽车中,或者只有一只手可用,或者不能键入(诸如正在驾车时)。所述VoiceMessengerTM语音-文本服务解决了此种需要。
用户进入在他们的移动电话上运行的他们的消息/文本应用程序,仅仅从他们电话的地址簿中或者键入他们的号码来选择消息收件人,然后通过按下并且按住‘2’键来选择新的VoiceMessenger选项,如图10所示。所述用户还可以被连接到所述服务来开始,并且仅仅向本地(移动电话上)或者远程语音识别引擎讲出所述号码或者名字,其中所述语音识别引擎将通过所述处理来获取用户。
当被连接至远程VoiceMessenger引擎时,所述用户仅仅讲出其消息,并且所述远程VoiceMessenger引擎记录它,然后发送所述音频文件以用于使用基于操作员的语音转录系统来转换为文本。然后把所述文本格式消息打包为SMS/MMS(电子邮件或者其他适当的消息系统)并且通过SMS/MMS等等网关发送。将给予用户听觉上的提示以便控制所述输入,听取所述转换并且发送所述消息。
C.扩展C.1MMS语音备忘录(voice-note)至文本具有允许MMS操作的电话的用户将能经由MMS发送语音备忘录,然后,基于操作员的语音转录服务将其转录并且发送到他们期望的目的地。如果优选,他们还可以依照MMS格式来转换语音邮件并且发送到他们的电话。
C.2自动语音识别其将会加速进入的语音文件的处理并且减少操作成本。主要的功能将是自动检测讲出的电话号码,并且检测语言以便把音频文件发送至转录处的恰当操作方。它还用于检测来自用户在线电话簿(参见下文)的名字和讲出的号码以及地址以及用于VoicemailManager控制的命令。
C.3在线地址簿将有两种形式的在线地址簿,其中当仅仅通过说出他们希望诉说的人员名字来连接至SpinVox服务时,用户就能使用所述两种在线地址簿。
SpinVox在线电话簿——经由用户网络登录,他们能够将他们希望的人员名字和号码添加在他们的SpinVox在线地址簿中。
与他们的Microsoft Outlook(Express或者完全版)或者其他电子邮件/PIM/地址簿客户端同步——这样做使得他们能够使他们的所有联系人在线,并且不仅能说出收件人的名字,而且能确定他们希望发送的消息类型SMS、MMS、电子邮件、传真等等。
利用网络操作方,还能够提供SIM备份功能,然后向他们提供SIM电话簿以便于他们从中呼叫名字。
C.4目前可用的服务(当前)使用目前可用的服务器,用户可以定义他们希望的模式以用于接收通信,例如‘会议’让用户在通信之前知道他们希望联络的那个人正在会议中,并且将接受所说的SMS/MMS或者VoiceView文本消息。一旦在会议之外,用户就能将其联络状态改变为‘可用’并且可以通过电话联络到。
附录I1.SpinVox语音邮件IVR结构具有IVR的标准语音邮件服务器系统是基础;所述IVR被编程为如图11中所示的流程图。
2.VoicemailView用户的电话将重新编程(在如下显示的技术提供期间)‘1’键(标准语音邮件访问键)以便自动地呼叫SpinVox语音邮件服务器,并且让它们自动登录(唯一的电话号码+PIM),从而将其带入IVR树的顶层。
如果在任一点用户挂断,那么所述会话以相关结果终止。如果这发生在记录期间,包括来自另一个移动呼叫者的掉线(dropped line),那么被假定记录结束,并且系统进行到转录阶段。
每个转录的语音邮件将包含从说‘4’开始的唯一号码(取决于最终IVR树配置),使得当用户按下并按住‘1’来连接至SpinVox的语音邮件服务器时,他们仅仅按下唯一消息i/d(例如403),这将把他们带入队列中其拥有的第三个消息。
2.1座机或者其他移动电话访问如图11所示,所述IVR树将允许用户使用他们的唯一转移号(语音邮件号)来拨入,并且随后将被提示来输入他们的PIN。
2.2快速拨号所述IVR系统将接受在快速拨号时的用户编程,这允许他们拨出他们的唯一SpinVox号码+PIN。然后他们能够访问上面示出的所有特征。
2.3留下语音邮件用户的电话被配置为在他们如下定义的条件下转移到SpinVox语音邮件,其中呼叫者将听到下述之一 默认SpinVox问候“欢迎来到SpinVox语音邮件。请在嘟声后清楚地口述你的消息。”[嘟] 用户自己的问候[用户的记录问候][嘟]然后1.系统在默认长度(30秒)或者用户定义的长度(10秒-2分钟或者任何SpinVox设置的参数)内记录呼叫者的语音邮件。
2.在记录结束时,呼叫者通过提示听取标准IVR选项“按下1.听取你的消息2.删除你的消息并且重新记录3.重新记录你的消息#结束或者只挂断”3.如果用户超出记录长度,那么他们被提示“对不起,你已经超出可用的记录时间。在嘟声后请重试”。
a.如果用户挂断而不记录新消息,那么消息被发送来用于转录。
b.如果用户已经选择了‘高级转录选项’,那么出现另一个变体;此种选项操作来使得如果消息的记录时间小于用户设置的最大时间时,那么转录所述消息,否则,就不转录,而是把标准的通知发送给用户,以便依照下面4c中示出的格式通知他们有新的语音邮件要收听。此操作阐明了这样的事实,即偶尔向用户发送了更有利于收听而不是读取的长语音邮件。然而,对于这些长消息来说,转录方可以简要地收听所述语音消息,并且写下发送给消息收件人的呼叫主题的非常短的指示。此外,对于支持小于一定文本量的手机(通常是旧手机)来说,系统首先查找用户手机以及电话数据库中的限制(由SpinVox提供),然后向用户提供相关的记录长度。例如,对于不支持链接并且最多仅4个文本消息的旧西门子电话来说,系统警告用户记录长度应该保持在说30秒以下,以确保大多数消息适合他们的电话并且告诉他们为什么。同样,需要系统为他们把这些手机的默认记录长度设置为相称的长度。
4.把消息发送给相关转录队列a.如果呼叫者CLID(呼叫线路识别,Caller Line Identification)被获取,那么自动填充‘From(来自)’字段。如果没有,插入‘SpinVoxVoicemailView’作为发件人。
b.如果能够转录,那么把消息的文本版本发送给用户c.如果不能转录,那么把具有自动填充的某些字段的模板文本消息发送给用户“你有[来自CLI的,如果可得到]新的语音邮件要收听。按你电话上的‘1’连接至你的语音邮件,然后按4xx可听取此指定消息。谢谢。SpinVox”。所述‘From’字段是来自于‘SpinVox VoicemailView’d.依照SMS的发送数目来付账。
5.把文本消息发送给用户并且他们可以按照其手机上可用的标准选项来选择接下来做什么。
3.VoiceMessenger上述IVR图表示出了用户如何访问VoiceMessenger,是直接从他们的移动电话还是通过另一个电话访问。
3.1快速拨号所述IVR系统将接受在快速拨号时的用户编程,这允许他们拨出他们的唯一SpinVox号码+PIN+‘3’。
如果利用他们的移动电话,那么下面的技术提供将配置有快速拨号(通过默认键‘2’)来拨号并且使他们直接登入(语音邮件号码+PIN+3)到VoiceMessenger选项。
他们于是将听到标准提示″欢迎来到SpinVox的VoiceMessenger。在嘟声后,请讲出目的地号码或者键入它,然后口述你希望发送的消息。挂断来发送,或者按#来发送新消息。”[嘟]然后1.如果无法检测到DTMF音调,或者发生混淆(当使用*或者+进行国际拨号时),那么提示输入新号码“对不起,我们无法检测到你键入的号码。请重试,并且记住国际号码以00开头,没有+”[嘟声提示重新输入]2.系统在默认长度(30秒)或者用户定义的长度(10秒-2分钟)内记录。
3.在记录结束时,用户通过提示听到标准的IVR选项“按下4.听取你的消息5.删除你的消息并且重新记录6.重新记录你的消息#发送新消息或者只挂断”4.如果用户超出记录长度,那么他们被提示“对不起,你已经超出可用的记录时间。在嘟声后请重试”。
a.如果用户挂断而不记录新消息,那么消息被发送来用于转录。
5.把消息发送给转录队列,其中所述‘From’字段自动填充(当SpinVox知道谁是客户端时)a.如果能够转录,那么把消息的文本版本发送给用户b.如果不能转录,那么把自动填充某些字段的模板文本消息发送给用户“对不起,但是我们不能转换[时间/日期]你口述的消息[到号码,如果检测到]。请在安静环境下重试并且清楚地口述。谢谢。SpinVox”。所述‘From’字段是‘SpinVox VoiceMessenger’。
c.依照SMS的发送数目或者MMS大小(千字节)付账。
6.把文本消息发送给收件人并且他们可以按照其手机上可用的标准选项来选择接下来做什么。
4.技术提供在技术提供期间,用户数据(手机、网络等)将重新用于确认用户已经选择了什么。
关键是发送用户SMS消息的系统使用户手机的配置部分自动化(用于VoiceMessenger的转移&V.Card)并且确认成功设置。把这些消息全部作为高优先级发送,以便确保用户/销售员在等待配置SMS成功时不会‘挂电话’(hanging)。
所述步骤是步骤1从在提供屏幕上显示的下拉列表中进行手机选择(通常在销售点)步骤2语音邮件查看设置<创建如下符号串‘+COUNTRY CODE_USERS UNIQUEVOICEMAIL NUMBER_p_PIN NUMBER_#_’>>>>这被称为SPINVOX语音邮件号并且对于每个用户而言是唯一的!>
步骤3呼叫转移选择其解释通常如何设置移动电话来转移到用户的语音邮件(基于所有如下情况)。如果他特别希望其转移到他人或者号码,而不是他自己的语音邮件,那么用户可以改变这些<基于上面用于配置手机的选择创建的USSD符号串...(数字线)作为具有4xUSSD符号串的高优先级SMS被发送,其中用户需要4xUSSD符号串来进行回答/动作。>
步骤4经由SMS的呼叫转移设置。告诉顾客他刚才已经发送SMS并且在接收时应该点击提供屏幕上的指定按钮(或者如果在3分钟内未接收到,那么另外点击‘未接收到’按钮)。
步骤5呼叫转移设置SMS。所述提供屏幕通知用户如果他已经接收到配置SMS,那么请执行下列步骤1.打开SMS消息2.选择‘选项’(具有用于每个手机的功能名称的数据库)3.滚动&选择‘使用号码’4.你此刻将看到4个号码,选择第一个号码并且按‘发送’。
你此刻将看到正在拨出的号码并且在你的移动电话的屏幕上显示‘正在请求’。如果你接收到确认消息,那么对剩余3个号码重复此步骤。
步骤5呼叫转移设置移动电话。所述提供屏幕通知用户在你的移动电话上1.选择‘菜单’2。
<为指定的手机从数据库导入VOICEMAILVIEW数据...告诉你将做什么/利用‘+COUNTRY CODE_USERS UNIQUE VOICEMAILNUMBER_p_PIN NUMBER_#_’>
步骤6选择递送方法。一旦语音邮件被转换为文本(典型的选项是带有音频文件的SMS、MMS、MMS,电子邮件,带有音频文件的电子邮件),所述提供屏幕允许用户选择他想要如何接收语音邮件。然后所述系统把适当的vCard发送至用户的移动电话。
步骤7语音消息器设置。所述提供屏幕通知用户请如下执行我们刚向你发送SMS-VCard。当你已经接收到它时,请执行下列步骤1.接受并且在你的移动电话上保存所述VCard,而不对其进行修改——进入步骤2。
如果你在5分钟内未接收到此消息,或者无法保存所述VCard,那么请执行下列步骤创建称为‘VoiceMessenger’的新‘联系人’,其具有如下号码+COUNTRY CODE_USERS UNIQUE VOICEMAILNUMBER_p_PIN NUMBER_#_,1′如果你不知道如何添加新的‘联系人’,请点击这里——(进入‘如何’页面,该页面具有从数据库获得的信息——告诉你做什么)2.<为指定的手机导入来自数据库的VOICEMESSENGER快速拨号配置数据...告诉你做什么/利用>
步骤8祝贺屏幕感谢选择SpinVox服务。
*你此刻将接收到作为文本的语音邮件,并且不要忘记你总是可以仅仅通过按下并按住你电话上的‘1’键(以便与你的SpinVox语音邮件账号连接)来听取原始邮件。
*为了讲出文本消息——按下并按住‘2’(或者你指定为VoicemailView的键)并且你将立即被连接到VoiceMessenger。清楚地口述你的号码以及消息——你说它...我们将它转换为文本!*你可以通过按下并按住‘1’键并且遵照提示来一直访问VoiceMessenger。
*你可以使用你的移动电话号码和PIN在www.SpinVox.com上查看你的账号设置,查看帐目并且管理你的SpinVox账号。
如果你尚未打印或者记录你的PIN号,在这里再次得到12345.转录辅助当操作转录方登记他们的账号时,将这提供给他们。所有他们需要的是网络浏览器、声卡、能够播放并且控制媒体文件播放或者流送协议的媒体播放器以及高速互联网接入。图12示出了转录的处理流程图。每个转录方登录并且开始接收VoicemailView(参见图13,他们在其中键入转录消息并且用来导致消息被发送的屏幕),或者待转录的VoiceMessenger音频文件(参见图14),一次一个。当登录时,只存在2个状态消息目前在转录过程中,以及暂停。
5.1转录方控制面板按钮(参见图13) 已完成转录 不可译的转录——按照上面2&3ο对于VoicemailView来说,依照下文将具有自动填充的字段(如果能得到)的自动SMS发送给他们,所述文本是“你有[‘From CLI’,如果能够得到]的新语音邮件要听取。按你电话上的‘1’来连接到你的语音邮件,然后按4xx来听此指定消息。谢谢。SpinVox。”所述‘From’字段是来自于‘SpinVox VoicemailView’ο对于VoiceMessenger来说,当数据可得到时,依照下文利用自动填充字段把自动的SMS发送给他们,所述文本是“对不起,但是我们不能转换你[时间/日期“到电话号码”,如果能得到]口述的消息。请在安静的环境下重试并且清楚地口述。谢谢。SpinVox”。
ο所述‘From’字段是‘SpinVox VoiceMessenger’。
暂停并且重新队列当前信息 将当前信息重新路由至不同语言处,菜单用于选择语言或者“未知”。使转录方回到队列以便接收新消息。
5.2电话号码 在VoicemailView的情况下,‘From’字段是利用当呼叫者留下信息时获取的CLID(插入消息首部中)或者“SpinVoxVoicemailView”自动填充的 在VoiceMessenger的情况下,所述‘From’字段是用户使用DTMF时为转录方自动填充的,或者如果未使用DTMF,所述转录辅助向所述转录方提供字段以便将其键入。
注释出于用户数据保护原因,转录方决不会看到自动填充的电话字段(或者其他用户数据字段),因此所述系统不会示出这些,除非其要求所述转录方键入目的地号码。
5.3拼写检查当所述转录方敲击‘发送’时,系统将自动地对消息进行拼写检查,并且如果发生任何错误,那么纠正它们并且利用提示“接受&发送”来向转录方显示校正结果,或者允许他们人工地纠正(由于可能有他们希望的特殊拼写)。
为了正确地执行此操作,所述拼写检查过程将包括与用户的地理区域和文化有关的实际名词词典。因此,例如在英国,实际名词词典将不仅包含英语名字,而且包括地名、地标、公路名称、连锁商店名称(例如酒馆、酒吧、饭店等)等等。
当不存在匹配时,所述转录方仅仅双击加下划线的字,就可被提供最接近的匹配。如果有必要,他们可以倒带并且重听该部分消息以便做出适当选择。
5.4转录处管理员他们可以查看他们自己名下的所有转录方账号的统计量。他们将能查看并且分析 每小时、每日、每周、每月、每年键入的转录数目(签字,支持) 每小时、每日、每周、每月、每年键入的SMS的发送数目 每小时、每日、每周、每月、每年的队列时间 每小时、每日、每周、每月、每年键入的平均消息长度 每小时、每日、每周、每月、每年的转录次数/速率 每小时、每日、每周、每月、每年键入的转录次数/速率的变化 转录方账号的所有这些

每日、每周、每月、每年键入的不能转录消息的数目和%

每日、每周、每月、每年发送给不同处来转录的消息数目和%

转录准确度——通过每日随机采样并且测量相对于原始的准确度(CCA管理器执行此操作&把结果输入系统)以及来自CCA关于事故单的反馈来执行。这两个数字中较差的是准确性。
附录II转录服务要求这些是用于VoicemailView(语音邮件查看)和VoiceMessenger(语音消息)服务的转录服务的要求。
要求关键要求在于递送实际消息,而不是所有的冗余信息,这些冗余信息经常被讲出并且留在信息中。







权利要求
1.一种用于向无线信息设备提供语音邮件的方法,包括如下步骤(a)在语音邮件服务器接收语音消息;(b)把所述语音消息转换为音频文件格式;(c)经由广域网向包括计算机网络的语音-文本转录系统发送或者流送所述音频文件;其中所述方法的特征在于如下步骤(i)一个所述联网计算机向操作方播放所述语音消息;(ii)所述操作方智能地把原始语音消息转录到计算机中,以生成转录的文本消息;(iii)所述操作方使所述转录的文本消息将被从所述计算机发送到所述无线信息设备。
2.如权利要求1所述的方法,其中,所述转录的文本消息包括唯一标识,所述唯一标识把所述文本消息链接至在所述语音邮件服务器保存的所述语音消息,以便允许通过终端用户选择在设备上显示的涉及所述转录的文本消息的选项,向所述无线信息设备播放所述语音消息。
3.如前述权利要求中任一项权利要求所述的方法,其中,所述转录的文本消息已经被添加了时间和日期,所述时间和日期是在所述语音邮件服务器最初接收所述语音消息的时间和日期。
4.如前述权利要求中任一项权利要求所述的方法,其中,所述语音消息是在移动电话或者在座机电话发起的。
5.如前述权利要求中任一项权利要求所述的方法,其中,所述转录的文本消息已经被添加了呼叫者标识数据,诸如电话号码或者呼叫者名字。
6.如权利要求5所述的方法,其中,所述转录的文本消息被显示在所述设备上,如同所述转录的文本消息是直接从所述语音消息的发起者发送的一样。
7.如权利要求3所述的方法,其中所述计算机不向所述操作方显示与所述无线信息设备相关联的所述电话号码。
8.如前述权利要求中的任一项权利要求所述的方法,其中所述计算机向所述操作方显示一选项,以把所述音频文件重新路由至由于语言、方言或者文化的原因而更加适合转录所述语音消息的具有操作方的不同计算机。
9.如前述权利要求中任一项权利要求所述的方法,其中,所述计算机向所述操作方提供专业术语的可查找列表,以帮助所述操作方正确地转录那些专业术语,其中所述专业术语与文化谚语、常规事件、体育赛事、媒体事件、其它类型的有新闻价值的事件有关。
10.如前述权利要求中任一项权利要求所述的方法,其中,所述操作方使用书面描述或者表情,在所述转录的文本消息中表示留下所述语音消息的所述呼叫者的情绪。
11.如前述权利要求中任一项权利要求所述的方法,其中,所述操作方简洁地概括所述语音消息。
12.如权利要求10所述的方法,其中,所述操作方概括所述语音消息,以使其符合160字符的SMS限制或者级连的文本消息。
13.如前述权利要求中任一项权利要求所述的方法,其中,所述操作方从所述转录的文本消息中略去所述语音消息中出现的任何停顿、假象或者重复。
14.如前述权利要求中任一项权利要求所述的方法,其中,依照先前由所述设备用户适当指定的格式将所述文本消息发送至所述无线信息设备。
15.如权利要求所述的方法,其中,所述文本消息是作为SMS、MMS、电子邮件或者传真发送的。
16.如前述权利要求中任一项权利要求所述的方法,还包括步骤解析所述转录的文本消息并且把所述已解析的数据用于在所述无线信息设备上运行的应用程序。
17.如权利要求16所述的方法,其中,解析所述转录的文本消息并且使用所述已解析数据的步骤涉及一个或多个如下步骤(a)提取讲出的所述电话号码,以允许它被使用(来进行一个呼叫)、保存、编辑或添加到电话簿;(b)提取电子邮件地址并且允许它被使用、保存、编辑或添加到地址簿;(c)提取物理地址并且允许它被使用、保存、编辑或添加到地址簿;(d)提取网页地址(超链接)并且允许它被使用、编辑、保存或添加到地址簿或者浏览器收藏夹;(e)提取会议时间并且允许它被使用、保存、编辑并且作为条目添加到议程;(f)提取号码并且将它保存到其中一个所述设备应用程序;(g)提取实际名词并且提供选项来在网页上(WAP或者全部的浏览器)对其进行搜索或者查找。
18.如前述权利要求中任一项权利要求所述的方法,其中,如果语音消息的所述记录时间小于用户设置的最大时间,那么转录所述语音消息,否则,不进行转录,而是把标准的通知发送给所述用户,即他们有新的语音邮件要收听。
19.如权利要求18所述的方法,其中转录员收听所述语音消息,并且书面记录被发送给消息收件人的所述呼叫的主题的非常短的指示。
20.如权利要求18所述的方法,其中,对于支持小于一定文本量的设备而言,首先在数据库中查找文本限制,随后自动建议合适的最大记录时间。
21.一种文本消息,其是使用如先前权利要求1-20中任一项所述的方法从语音邮件转录而来并且被提供给无线信息设备。
全文摘要
在语音邮件服务器接收语音邮件并且将其转换为音频文件格式;然后经由广域网将其发送或者流送至包括计算机网络的语音-文本转录系统。其中一个联网计算机向操作方播放所述语音消息,并且操作方通过把对应的文本消息(实际上是原始语音消息的简练版本,不是啰嗦的字对字的转换)输入计算机以生成转录的文本消息来智能地根据原始语音消息转录实际消息。然后把转录的文本消息从计算机发送到无线信息设备。因为是使用操作员而不是机器转录,所以得以正确地、智能地、适当地并且简练地将语音邮件转录为文本消息(SMS/MMS)。
文档编号H04M1/725GK1836431SQ200480013615
公开日2006年9月20日 申请日期2004年4月22日 优先权日2003年4月22日
发明者丹尼尔·迈克尔·道尔顿 申请人:斯皮沃克斯有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1