基于语音识别的通话的制作方法

文档序号:7760834阅读:197来源:国知局
专利名称:基于语音识别的通话的制作方法
技术领域
本发明涉及通信网络中的通话,尤其涉及基于语音识别的通话。
背景技术
目前电话(包括固定电话和移动电话)已经非常普及,但是市场上罕有针对聋哑人设计的电话,他们若要与正常人通过电话交流,只能通过短消息的方式来进行。美国专利 US5991723中提出了一种电话中继服务,通过一个额外的电话中继设备来实现语音信号和文本信号的转换,并且用户通过该电话中继设备拨打电话时,在拨打被叫用户的号码之前, 必须先拨打一个特定的号码,这给用户的使用带来了麻烦,同时额外的电话中继设备会成为整个系统的容量及性能的瓶颈。

发明内容
本发明提出了一种新的通话装置及通话方法。根据本发明的一个具体实施例,提供了一种在通信网络的用户终端中用于与另一用户终端进行通话的方法,包括以下步骤-接收来自所述用户终端使用者输入的文字信号;-将所述文字信号转换为语音信号;-将所述转换后的语音信号发送给所述另一用户终端;所述方法还包括以下步骤-接收来自所述另一用户终端的语音信号;-将所述语音信号转换为文字信号;-将所述文字信号进行显示。根据本发明的另一个具体实施例,提供了一种在通信网络的用户终端中用于与另一用户终端进行通话的方法,该方法包括以下步骤-接收来自所述另一用户终端的通信信息;-根据所述通知信息,指示本用户终端的使用者以语音识别训练模式发音。。根据本发明的又一个具体实施例,提供了一种在通信网络的用户终端中用于与另一用户终端进行通话的通话装置,包括第一接收装置,用于将接收来自所述用户终端使用者输入的文字信号;第一转换装置,用于将所述文字信号转换为语音信号;第一发送装置,用于将所述转换后的语音信号发送给所述另一用户终端;所述通话装置还包括以下步骤第二接收装置,用于接收来自所述另一用户终端的语音信号;第二转换装置,用于将所述语音信号转换为文字信号;显示装置,用于将所述文字信号进行显示。根据本发明的再一个具体实施例,提供了一种
通过本发明的方法和装置,一种在通信网络的用户终端中用于与另一用户终端进行通话的装置,包括第三接收装置,用于接收来自所述另一用户终端的通知信息;指示装置,用于根据所述通知信息,指示本用户终端的使用者以语音识别训练模式发首。通过本发明的通话方法和通话装置,聋哑用户能够与正常人一样使用电话,只需拨打一个被叫号码即可,大大地方便了聋 用户的使用,并且本发明无需额外的中继设备。 另外,本发明的通话装置和通话方法不仅适用于聋哑人的情形,对于用户不宜发出声音的某些紧急场合下,本发明亦能适用。


通过阅读以下参照附图对非限制性实施例所作的详细描述,本发明的其它特征、 目的和优点将会变得更明显。图1为根据本发明的一个具体实施方式
的应用场景示意图;图2为根据本发明的一个具体实施方式
的在通信网络的用户终端中用于与另一用户终端进行通话的流程图;图3为根据本发明的一个具体实施方式
的网络拓扑结构示意图;图4为根据本发明的一个具体实施方式
的以用户终端101作为主叫呼叫用户终端 102的会话建立流程图;图5为根据本发明的一个具体实施方式
的另一个网络拓扑结构示意图;图6为根据本发明的一个具体实施方式
的在通信网络的用户终端中用于与另一用户终端进行通话的通话装置600的结构框图;图7为根据本发明的一个具体实施方式
的在通信网络的用户终端中用于与另一用户终端进行通话的装置700的结构框图;其中,相同或相似的附图标记表示相同或相似的步骤特征或装置(模块)。
具体实施例方式以下结合附图对本发明的具体实施例进行详细说明。图1示出了根据本发明的一个具体实施方式
的应用场景示意图。在图1中,用户终端101与用户终端102通过网络103进行通话。图2示出了根据本发明的一个实施例的在通信网络的用户终端中用于与另一用户终端进行通话的流程图。以下根据图1所示的应用场景,对用户终端101与用户终端102 进行通话的流程进行详细说明。首先,在步骤S201中,用户终端101接收来自本用户终端使用者输入的文字信号。 如上文所述,使用者可以是一个聋 人,也可以是特定场合下的正常人。为简明起见,在图 1中未示出用户终端101和102的使用者。接着,在步骤S202中,用户终端101将来自使用者的文字信号转换为语音信号。在步骤S203中,用户终端101将转换后的语音信号发送给用户终端102。接着,在步骤S204中,用户终端101接收来自用户终端102的语音信号。
在步骤S205中,用户终端101将语音信号转换为文字信号。然后,在步骤S206中,用户终端101将转换后的文字信号进行显示,以便用户终端 101的使用者进行阅读。需要说明的是,在步骤S201之前,用户终端101的使用者像正常人拨打电话一样, 拨打被叫用户终端102的号码,或者是接听来自用户终端102的呼叫。在通信链路建立之后,用户终端101中进行图2所示的流程。再一个需要说明的是,步骤S201至S203与步骤 S204至S206的执行不分先后,在一个实施例中,步骤S201至S203与步骤S204至S206轮流执行。可选地,在用户终端101和102的使用者开始通话之前,用户终端101还可以发送通知信息至用户终端102,通知用户终端102用户终端101端将进行语音信号与文字信号的互换。在一个实施例中,该通知消息可由会话建立过程中的交互消息来承载,如用于分组交换网络中的SIP协议中的INVITE消息或者2000K消息,或者电路交换网络中的七号信令 IAM和ACM消息。当然,用户终端101也可以专门创建一个消息用来承载通知信息而无需利用现有的交互消息。用户终端102在接收到该通知信息后,根据所述通知信息,指示本用户终端的使用者以语音识别训练模式发音,以提高用户终端101的语音识别准确率。本领域的普通技术人员应能理解,用户终端102可以多种方式进行指示,例如,以文本显示的方式、播放语音提示的方式、播放视频提示信号的方式等或者是这三种方式的任意结合等。图1所示的用户终端101、102可以是位于分组交换网络中,电路交换网络中;或者是一个位于分组交换网络中,另一个位于电路交换网络中。不失一般性地,图3示出了根据本发明的一个具体实施方式
的网络拓扑结构示意图,在图3中,用户终端101、102皆位于一个分组交换网络一IP多媒体子系统(IMS)网络中,其中网络301和303分别是用户终端101和102的访问网络,其中包括P-CSCF等设备(为简明期间,图中仅示出了 P-CSCF),网络302是用户终端101的驻地网络,其中包括 S-CSCF, HSS、AS等设备,网络304是用户终端102的驻地网络,其中包括I-CSCF、S-CSCF, AS、HSS等设备。用户终端101和102运行SIP (Session Initial Protocol)协议进行通话。图4示出了以用户终端101作为主叫呼叫用户终端102的会话建立流程图。首先,在步骤S401中,用户终端101发送一个INVITE消息至用户终端102,该 INVITE消息经由用户终端101侧的P-CSCF和S-CSCF、I-CSCF、用户终端102侧的S-CSCF 和P-CSCF转发至用户终端102。在一个实施例中,用户终端101中发送的INVITE消息中可包含一个SIP HEADER, 用于承载通知用户终端102用户终端101端将进行语音信号与文字信号的互换的通知信息。例如,该 SIP HEADER 的名称可以是 SILENT_CALL_INDICATION。该 SIP HEADER 经由所有中间节点一直到达用户终端102。接着,在步骤S402中,用户终端102在接收到该INVITE消息后,回送一个2000K 消息,该信息经由与上述INVITE消息相反的路径到达用户终端101。在一个实施例中,如果来自用户终端101的INVITE消息中含有用户终端102用户终端101端将进行语音信号与文字信号的互换的通知信息,则用户终端102会指示其使用者在后面的通话过程中,使用语音识别训练模式发音。然后,在步骤S403中,用户终端101响应来自用户终端102的2000K消息,回复一个ACK消息至用户终端102,该ACK消息该信息经由与上述INVITE消息相同的路径到达用户终端102。至此,用户终端101和用户终端102之间的会话建立已经完成,然后,用户终端101 和用户终端102进行如图2中的步骤S201至步骤S203以及步骤S204至步骤S206的交互, 以完成双方使用者的通话。需要说明的是,在图3所示的网络拓扑结构图中,如果用户终端101作为被叫用户终端,则通知用户终端102用户终端101端将进行语音信号与文字信号的互换的通知消息可由用户终端101响应用户终端102的2000K消息,也即SIP会话响应消息,来承载。同上文的用户终端101中发送的INVITE消息类似,2000K消息中可包含一个SIP HEADER,用于承载通知用户终端102用户终端101端将进行语音信号与文字信号的互换的通知信息。图5示出了根据本发明的另一个具体实施方式
的网络拓扑结构示意图的例子,在图3中,用户终端101、102皆位于一个电路交换网络,其中用户终端101位于GSM网络中,用户终端102位于PSTN网络中,用户终端101和102运行七号信令进行通话建立,其中BSS是基站子系统,GMSC是网关移动交换中心,IffF是互通功能设备(Inter-working function)。 具体地,用户终端101与用户终端102之间如何进行通话建立已是本领域非常成熟的技术,详细可参见 Jorg Eberspacher and Hans-Jorg Vogel, GSM Switching, Services andProtocols, New York J. Wiley, 1999. ISBN 0-471-98278-4 或者 ZoranZvonar, Peter Jung,and Karl Kammerlander,GSM Evolution Towards3rd Generation Systems,Boston Kluwer Academic Publihers, 1999. ISBN 0-7923-8351-6,在此不再赘述。在通话建立以后,用户终端101和用户终端102进行如图2中的步骤S201至步骤 S203以及步骤S204至步骤S206的至少一次,或者它们的交互,以完成双方使用者的通话。当然在用户终端101通知用户终端102其将进行语音信号与文字信号的互换的情形下,用户终端102在接收到该通知信息后,指示其使用者在通话中使用语音识别训练模式进行发音。图6示出了根据本发明的一个具体实施方式
的在通信网络的用户终端中用于与另一用户终端进行通话的通话装置600的结构框图。以下根据图1所示的应用场景,对位于用户终端101中的通话装置600与用户终端2进行通话的工作过程进行详细描述。首先,第一接收装置601接收来自本用户终端101使用者输入的文字信号。如上文所述,使用者可以是一个聋 人,也可以是特定场合下的正常人。为简明起见,在图1中未示出用户终端101和102的使用者。接着,第一转换装置602将来自使用者的文字信号转换为语音信号。然后,发送装置603将转换后的语音信号发送给用户终端102。接着,第二接收装置604接收来自用户终端102的语音信号。然后,第二转换装置605将语音信号转换为文字信号。然后,显示装置606将转换后的文字信号进行显示,以便用户终端101的使用者进行阅读。需要说明的是,在第一接收装置601接收来自使用者的文字信号之前,使用者像正常人拨打电话一样,拨打被叫用户终端102的号码,或者是接听来自用户终端102的呼叫。在通信链路建立之后,各个装置执行如上所述的工作过程。再一个需要说明的是,第一接收装置601、第一转换装置602、第一发送装置603的工作过程与第二接收装置604、第二转换装置605、显示装置606的工作过程不分先后,在一个实施例中,第一接收装置601、第一转换装置602、第一发送装置603与第二接收装置604、第二转换装置605、显示装置606 轮流进行工作。可选地,通话装置600还可以包括一个第二发送装置(图6中未示出),用于在用户终端101和102的使用者开始通话之前,发送通知信息至用户终端102,以通知用户终端 102用户终端101端将进行语音信号与文字信号的互换。在一个实施例中,该通知消息可由会话建立过程中的交互消息来承载,如用于分组交换网络中的SIP协议中的INVITE消息或者2000K消息,或者电路交换网络中的七号信令IAM/ACM消息。当然,用户终端101也可以专门创建一个消息用来承载通知信息而无需利用现有的交互消息。图7示出了根据本发明的一个具体实施方式
的在通信网络的用户终端中用于与另一用户终端进行通话的装置700的结构框图。以下根据图1所示的应用场景,对位于用户终端102中的装置700与用户终端101进行通话的工作过程进行详细描述。首先,第三接收装置701接收来自用户终端101的通知信息;然后,指示装置702根据所述通知信息,指示本用户终端102的使用者以语音识别训练模式发音,以提高用户终端101的语音识别准确率。本领域的普通技术人员应能理解, 指示装置702可以多种方式进行指示,例如,以文本显示的方式、播放语音提示的方式、播放视频提示信号的方式等或者是这三种方式的任意结合等。任何不背离本发明精神的技术方案均应落入本发明的保护范围之内。此外,不应将权利要求中的任何附图标记视为限制所涉及的权利要求;“包括”一词不排除其它权利要求或说明书中未列出的装置或步骤;装置前的“一个”不排除多个这样的装置的存在;在包含多个装置的设备中,该多个装置中的一个或多个的功能可由同一个硬件或软件模块来实现;“第一”、“第二”、“第三”等词语仅用来表示名称,而并不表示任何特定的顺序。以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在所附权利要求的范围内做出各种变形或修改。
权利要求
1.一种在通信网络的用户终端中用于与另一用户终端进行通话的方法,包括以下步骤-接收来自所述用户终端使用者输入的文字信号;-将所述文字信号转换为语音信号;-将所述转换后的语音信号发送给所述另一用户终端;所述方法还包括以下步骤-接收来自所述另一用户终端的语音信号;-将所述语音信号转换为文字信号;-将所述文字信号进行显示。
2.根据权利要求1所述的方法,其中,在所述通话开始之前,还包括以下步骤-发送通知信息至所述另一个用户终端,该通知信息用于通知所述另一用户终端本用户终端将进行语音信号与文字信号的互换。
3.根据权利要求2所述的方法,其中,所述用户终端为分组交换网络的用户终端,所述通知信息由SIP会话邀请消息或者SIP会话响应消息承载。
4.根据权利要求1所述的方法,其中,所述用户终端为电路交换网络的用户终端。
5.一种在通信网络的用户终端中用于与另一用户终端进行通话的方法,该方法包括以下步骤-接收来自所述另一用户终端的通知信息;-根据所述通知信息,指示本用户终端的使用者以语音识别训练模式发音。
6.一种在通信网络的用户终端中用于与另一用户终端进行通话的通话装置,包括 第一接收装置,用于将接收来自所述用户终端使用者输入的文字信号;第一转换装置,用于将所述文字信号转换为语音信号;第一发送装置,用于将所述转换后的语音信号发送给所述另一用户终端;所述通话装置还包括以下步骤第二接收装置,用于接收来自所述另一用户终端的语音信号; 第二转换装置,用于将所述语音信号转换为文字信号; 显示装置,用于将所述文字信号进行显示。
7.根据权利要求6所述的通话装置,其中,还包括第二发送装置,用于在所述通话开始之前,发送通知信息至所述另一个用户终端,该通知信息用于通知所述另一用户终端本用户终端将进行语音信号与文字信号的互换。
8.根据权利要求7所述的通话装置,其中,所述用户终端为分组交换网络的用户终端, 所述通知信息由SIP会话邀请消息或者SIP会话响应消息承载。
9.根据权利要求6所述的通话装置,其中,所述用户终端为电路交换网络的用户终端。
10.一种在通信网络的用户终端中用于与另一用户终端进行通话的装置,包括 第三接收装置,用于接收来自所述另一用户终端的通知信息;指示装置,用于根据所述通知信息,指示本用户终端的使用者以语音识别训练模式发
全文摘要
本发明提出了一种新的通话装置及通话方法。首先,用户终端接收来自该用户终端使用者输入的文字信号,接着将所述文字信号转换为语音信号,然后将所述转换后的语音信号发送给所述另一用户终端;并且,该用户终端接收来自另一用户终端的语音信号,接着将所述语音信号转换为文字信号,最后将所述文字信号进行显示。通过本发明的通话方法和通话装置,聋哑用户能够与正常人一样使用电话,只需拨打一个被叫号码即可,大大地方便了聋哑用户的使用,并且本发明无需额外的中继设备。另外,本发明的通话装置和通话方法不仅适用于聋哑人的情形,对于用户不宜发出声音的某些紧急场合下,本发明亦能适用。
文档编号H04M3/42GK102413249SQ20101029297
公开日2012年4月11日 申请日期2010年9月20日 优先权日2010年9月20日
发明者唐善敬, 马小航 申请人:阿尔卡特朗讯
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1