一种用于对会话中的语音进行处理的方法、装置和系统的制作方法

文档序号：7986286阅读：145来源：国知局

一种用于对会话中的语音进行处理的方法、装置和系统的制作方法
【专利摘要】本发明的目的是提供一种用于对会话中的语音进行处理的方法、装置和系统。根据本发明的方法，当媒体网关接收到一会话的原始音频信号时，对该原始音频信号采用相应的音频效果进行处理，并将处理后的音频信号发送至所述会话相关的用户设备。本发明具有以下优点：通过的原始音频信号进行处理，以使用户能够获得更加丰富、多样的音频信号；并能够根据用户的选择，对会话中的原始音频信号进行处理，以获得符合用户需求的，多样化的音频信号，提升用户的使用体验。
【专利说明】一种用于对会话中的语音进行处理的方法、装置和系统
【技术领域】
[0001]本发明涉及通信【技术领域】，尤其涉及一种用于对会话中的语音进行处理的方法、装置和系统。
【背景技术】
[0002]在现有技术中，在通过通信系统进行语音通话时，用户仅能听到对方的语音，而不能获得其他的音效，这对于用户来说显得较为单调。

【发明内容】

[0003]本发明的目的是提供一种用于对会话中的语音进行处理的方法、装置和系统。
[0004]根据本发明的一个方面，提供一种在媒体网关中用于对会话中的语音进行处理的方法，其中，所述方法包括以下步骤:
[0005]a当接收到一会话的原始音频信号时，对该原始音频信号采用相应的音频效果进行处理，并将处理后的音频信号发送至所述会话相关的用户设备。
[0006]根据本发明的一个方面，还提供一种在用户设备中确定对会话中的语音进行处理的方法，其中，所述方法包括以下步骤:
[0007]-确定与一会话相对应的至少一个音频效果；
[0008]-将包含所述至少一个音频效果的音效标识信息的音效选择信息发送至媒体网关控制装置。
[0009]根据本发明的一个方面，还提供一种在媒体网关控制装置中辅助对会话的语音进行处理的方法，其中，所述方法包括以下步骤:
[0010]-接收来自用户设备的与一会话相对应的音效选择信息，其中，所述音效选择信息包括至少一个音频效果的音效标识信息；
[0011]-将所述音效选择信息发送至媒体网关。
[0012]根据本发明的一个方面，还提供一种对会话中的语音进行处理的媒体网关，其中，所述媒体网关包括:
[0013]音频处理装置，用于当接收到一会话的原始音频信号时，对该原始音频信号采用相应的音频效果进行处理，并将处理后的音频信号发送至所述会话相关的用户设备。
[0014]根据本发明的一个方面，还提供一种用于确定对会话中的语音进行处理的用户设备，其中，所述用户设备包括:
[0015]第二确定装置，用于确定与一会话相对应的至少一个音频效果；
[0016]第一发送装置，用于将包含所述至少一个音频效果的音效标识信息的音效选择信息发送至媒体网关控制装置。
[0017]根据本发明的一个方面，还提供一种用于辅助对会话的语音进行处理的媒体网关控制装置，其中，所述媒体网关控制设备包括:
[0018]第二接收装置，用于接收来自用户设备的与一会话相对应的音效选择信息，其中，所述音效选择信息包括至少一个音频效果的音效标识信息；
[0019]第二发送装置，用于将所述音效选择信息发送至媒体网关。
[0020]根据本发明的一个方面，还提供一种通信系统，其中，所述通信系统包括所述媒体网关、至少一个所述用户设备、以及所述媒体网关控制装置。
[0021]与现有技术相比，本发明具有以下优点:通过的原始音频信号进行处理，以使用户能够获得更加丰富、多样的音频信号；并能够根据用户的选择，对会话中的原始音频信号进行处理，以获得符合用户需求的，多样化的音频信号，提升用户的使用体验。
【专利附图】

【附图说明】
[0022]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显:
[0023]图1示意出了根据本发明的一种用于对会话中的语音进行处理的系统的结构示意图；
[0024]图2示意出了根据本发明的一种用于对会话中的语音进行处理方法；
[0025]图3示意出了根据本发明的一个优选实施例的用于对会话中的语音进行处理方法;
[0026]图4示意出了根据本发明的一种用于对会话中的语音进行处理的系统的结构示意图；
[0027]图5示意出了根据本发明的一个优选实施例的用于对会话中的语音进行处理的系统的结构示意图。
[0028]附图中相同或相似的附图标记代表相同或相似的部件。
【具体实施方式】
[0029]下面结合附图对本发明作进一步详细描述。
[0030]图1示意出了根据本发明的一种用于对会话中的语音进行处理的系统的结构示意图。
[0031]所述系统包括至少一个用户设备、媒体网关控制装置以及媒体网关。优选地，所述用户设备包括呼叫用户设备以及被叫用户设备。更优选地，所述被叫用户设备可以有多个。
[0032]其中，所述媒体网关(MG, Media Gateway)用于连接不同类型网络,例如分组电缆网络与公共交换电话网络(PSTN, Public SwitchedTelephone Network)等，并对承载于网络之上的媒体流执行处理操作。
[0033]所述媒体网关控制装置(MGC, Media Gateway Controller)用于接收和调停分组电缆网络与公共交换电话网络之间的呼叫信令信息，维护和控制需要与PSTN进行交互的呼叫的全局呼叫状态。并且，所述MGC用于控制媒体网关对承载于网络之上的媒体流执行处理操作。
[0034]优选地，所述处理操作包括但不限于创建、修改以及删除等。
[0035]优选地，根据本发明的系统的MGC还与应用服务器(ApplicationServer)相连，由所述应用服务器来提供与呼叫相关的应用服务。其中，本领域技术人员应可根据实际情况与需求来确定所述应用服务器与MGC之间的传输与通信的方式，因此，为简明清楚起见，根据本发明的实施例及附图中不再在对应用服务器的处理过程进行赘述。
[0036]根据本发明的系统中的各个设备可基于以下任一种协议来执行各自的操作:
[0037]I)会话发起协议(SIP, Session Initiation Protocol)；
[0038]2) Η.323 协议；
[0039]3) H.248 协议；
[0040]4)综合业务数字网(ISDN, Integrated Services Digital Network)协议。
[0041]在该系统中，会话呼叫方的呼叫用户设备向MGC发送会话发起请求，例如，当会话采用SIP协议时，用户设备向MGC发送SIP INVIT信息。MGC接收到该信息后，向相应的被叫用户设备发送与接收到的请求相应的会话发起请求，例如，当MGC接收到SIP INVIT信息时，向被叫方用户设备同样发送SIP INVIT信息，并且向媒体网关发送相应的信息，以使媒体网关对相应会话的音频信号进行处理。
[0042]接着，结合图2说明媒体网关对所接收到的原始音频信号的处理。
[0043]在步骤Sll中，当媒体网关接收到一会话的原始音频信号时，媒体网关对该原始音频信号采用相应的音频效果进行处理，并将处理后的音频信号发送至所述会话相关的用户设备。
[0044]其中，所述音频效果包括但不限于以下至少任一项:
[0045]I)背景音乐；
[0046]2)人声音效；例如，对人声的音调、音强和音色等进行处理后的效果等，又例如，将人声处理为特定的，如耳语等效果。
[0047]3)场景音效，例如，用于模拟咖啡馆、公园、海边、KTV等场景的音效等。
[0048]其中，媒体网关确定与原始音频信号相应的音频效果的方式包括但不限于以下任一种:
[0049]I)媒体网关根据预定的对应关系来确定与所述原始音频信号相对应的音频效果。
[0050]例如，媒体网关中预定对于来自会话的呼叫方的原始音频信号采用背景音乐Aud_mul,对于来自会话的被叫方的原始音频信号米用背景音乐Aud_mu2。
[0051]2)媒体网关获取与所述原始音频信号相应的至少一个音频效果。
[0052]具体地，媒体网关根据来自媒体网关控制装置的音效选择信息，来获取与所述原始音频信号相应的至少一个音频效果。
[0053]该实现方式将在后续参照图3所示的实施例中予以详述，此处不再赘述。
[0054]优选地，媒体网关可多次接收部分音频信号，并对其进行相应的音效处理，并将处理后的音频信号作为整体，发送至相应的用户设备；或者，媒体网关每获得音频信号，即对其进行相应的音效处理，并将处理后的音频信号发送至相应的用户设备。
[0055]根据本发明的方法，可以对会话中的原始音频信号进行处理，以使用户能够获得更加丰富、多样的音频信号。
[0056]图3示意出了根据本发明的一个优选实施例的用于对会话中的语音进行处理的系统。
[0057]根据图3的方法包括由用户设备执行的步骤S21、步骤S22，由媒体网关控制装置执行的步骤S31、步骤S32以及由媒体网关执行的步骤Sir、步骤S12。
[0058]在步骤S21中，用户设备确定与一会话相对应的至少一个音频效果。[0059]具体地，所述用户设备确定与一会话相对应的至少一个音频效果的方式包括但不限于以下任一种:
[0060]I)根据用户设备中的预定确定规则来确定与会话相对应的至少一个音频效果。其中，所述预定确定规则用于确定与用户设备发起的会话相对应的至少一个音频效果。
[0061]优选地，所述预定确定规则基于以下至少任一项信息来确定与所述会话对应的音频效果:
[0062]a)会话被呼叫方的相关信息；优选地，所述被呼叫方的相关信息包括以下至少任一项:
[0063]i)被呼叫方的姓名；例如，预定确定规则包括与用户“userl”、“user2”对应的咖啡馆场景的场景音效，以及与其他用户对应的演讲效果的人声音效。
[0064]ii)被呼叫方所处的地域相关信息；例如，预定确定规则包括与位于A市的被呼叫方对应的公园场景的场景音效，位于B市的被呼叫方对应的背景音乐Aud_mul以及海边的
场景音效等。
[0065]iii)被呼叫方所用的设备信息，例如，预定确定规则包括与使用iPhone设备的被呼叫方对应的背景音乐Aud_mu3。
[0066]b)时间信息，例如，预定确定规则包括在不同的时间段分别使用的一个或多个的
音频效果等。
[0067]根据本发明的第一示例，预定确定规则包括在每天18:01?22:00使用模拟咖啡馆场景的场景音效Aud_SCl，以及对人声进行“耳语”效果处理的人声音效Aud_V0l，以及在每天9:01?18:00使用模拟咖啡馆场景的场景音效Aud_sc2，则当发起会话呼叫时，用户设备根据当前时间信息19:30，确定与当前的会话相对应的音频效果包括场景音效Aud_scl以及人声音效Aud_vol。
[0068]2)用户设备获取用户所选择的至少一个音频效果。
[0069]具体地，所述用户设备获取用户所选择的至少一个音频效果的方式包括但不限于以下任一种:
[0070]a)用户设备通过已有的应用程序向用户提供一个或多个音频效果的选项，并获取用户所选择的至少一个音频效果。
[0071]例如，用户设备在用户拨号之前，提示用户“采用以下哪一种音频效果”，并在界面中显示用户可选择的一个或多个音频效果。
[0072]b)用户设备获取来自其他设备的一个或多个音频效果的选项，并获取用户所选择的至少一个音频效果。
[0073]例如，用户拨打声讯电话，则用户设备接收来自相应的服务设备的声讯反馈信息，其中通过语音来提示用户可选择的多个音频效果及其对应的数字编号，则用户设备获取用户所选择相应的数字。
[0074]需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何根据确定与一会话相对应的至少一个音频效果的实现方式，均应包含在本发明的范围内。
[0075]接着，在步骤S22中，用户设备将包含所述至少一个音频效果的音效标识信息的音效选择信息发送至媒体网关控制装置。[0076]其中，所述音效选择信息包括至少一个音频效果的音效标识信息。所述音效标识信息包括但不限于任何可用于标识音频效果的信息。例如，各个音频效果的ID，又例如，音频效果的名称信息等。
[0077]具体地，所述用户设备可将所述音效选择信息包含于用于发起会话的请求信息中发送至媒体网关控制装置，例如，通过SIP INVIT信息等，或者，用户设备可将所述音效选择信息嵌入于其他符合预定协议的消息中发送至媒体网关控制装置。
[0078]接着，在步骤S31中，媒体网关控制装置接收来自用户设备的与一会话相对应的音效选择信息。其中，所述音效选择信息包括至少一个音频效果的音效标识信息。
[0079]接着，在步骤S32中，媒体网关控制装置将所述音效选择信息发送至媒体网关。
[0080]具体地，所述媒体网关控制装置将所述音效选择信息包含于会话所采用的协议可支持的信息中发送至媒体网关。
[0081]例如，当会话采用SIP协议或者H.248协议时，将所述音效选择信息包含于会话描述信息(SDP, Session Description Protocol)中发送至媒体网关。
[0082]接着，在步骤S12中，媒体网关获取与所述会话相对应的音效选择信息。其中，所述音效选择信息包括至少一个音频效果的音效标识信息。
[0083]具体地，所述媒体网关从来自媒体网关控制装置的信息中提取与所述会话相对应的音效选择信息。
[0084]接着，在步骤Sll'中，媒体网关采用所述音效选择信息中的一个或多个音频效果，对所述原始音频信号进行音效处理，并将音效处理后的音频信号发送至所述会话相关的用户设备。
[0085]具体地，媒体网关根据所接收到的音效选择信息中所包含的一个或多个音频标识信息，分别获取与所述一个或多个音频标识信息对应的音频效果，并基于所获得的音频效果对所述原始音频信号进行音效处理，并将音效处理后的音频信号发送至所述会话相关的用户设备。
[0086]继续说明前述第一示例，媒体网关所接收到的音效选择信息包括模拟咖啡馆场景的场景音效AucLscl以及对人声进行“耳语”效果处理的人声音效Aud_V0l，则当媒体网关接收到来自呼叫方的原始音频信号时，对该原始音频信号先执行人声音效Aud_vol以获得耳语效果的音频信号，并在所获得的音频信号上叠加场景音效Aud_scl的音频信号，以获得最终的音效处理后的音频信号，并将该将音效处理后的音频信号发送至与该原始音频信号所属的会话相对应的被呼叫方的用户设备，相似地，当媒体网关接收到来自会话的被呼叫方的原始音频信号后，对该音频信号同样采用前述场景音效AucLscl以及人声音效Aud_vol进行音效处理，并将处理后的音频信号发送至该会话的呼叫方。
[0087]需要说明的是，上述举例仅为更好地说明本发明的技术方案，而非对本发明的限制，本领域技术人员应该理解，任何采用与所述音效选择信息中的一个或多个音频效果，对所述原始音频信号进行音效处理，并将音效处理后的音频信号发送至所述会话相关的用户设备的实现方式，均应包含在本发明的范围内。
[0088]优选地，媒体网关根据预定的音频效果与音频信号的对应关系，来确定用于对原始音频信号进行音效处理的音频效果。例如，预定场景音效对应所有原始音频信号，人声音效对应会话的呼叫方的原始音频信号等。[0089]更优选地，根据本发明的音效选择信息包括至少一个音频效果的音频标识信息以及与各个音效标识信息相对应的音频标识信息，其中，根据本实施例的方法，所述步骤Sir中对所述原始音频信号进行音效处理的步骤进一步包括步骤SllOl (图未示)，以及步骤S1102(图未示)。
[0090]其中，所述音频标识信息包括可用于标识音频信号的各类信息，优选地，所述音频标识信息包括但不限于以下任一种信息:
[0091]I)音频信号ID;
[0092]2)音频信号的来源相关信息；其中，所述来源相关信息包括但不限于以下任一项:
[0093]a)发送该音频信号的用户设备的标识信息；
[0094]b)发送该音频信号的用户的标识信息，例如，该音频信号所对应的来源用户的用户名称，用户号码等。
[0095]本领域技术人员应可根据实际情况和需求确定获取所接收到的原始音频信号的音频标识信息的方式，此处不再赘述。
[0096]在步骤SllOl中，媒体网关根据所述原始音频信号的音频标识信息，在所述音效选择信息中，确定与所述音频标识信息相对应的音频效果。
[0097]具体地，媒体网关根据所获得的原始音频信号的音频标识信息，在接收到的音效选择信息中进行匹配查询，以获得与该音频标识信息对应的一个或多个音频效果。
[0098]根据本发明的第二示例，媒体网关所获得的音效选择信息如下表1所示:
[0099]表1
[0100]
【权利要求】
1.一种在媒体网关中用于对会话中的语音进行处理的方法，其中，所述方法包括以下步骤: a当接收到一会话的原始音频信号时，对该原始音频信号采用相应的音频效果进行处理，并将处理后的音频信号发送至所述会话相关的用户设备。
2.根据权利要求1所述的方法，其中，所述方法还包括以下步骤: -获取与所述会话相对应的音效选择信息，其中，所述音效选择信息包括至少一个音频效果的音效标识信息；其中，所述步骤a包括: -采用所述音效选择信息中的一个或多个音频效果，对所述原始音频信号进行音效处理，并将处理后的音频信号发送至所述会话相关的用户设备。
3.根据权利要求2所述的方法，其中，所述音效选择信息包括至少一个音频效果的音频标识信息以及与各个音效标识信息相对应的音频标识信息，其中，所述对所述原始音频信号进行音效处理的步骤包括: -根据所述原始音频信号的音频标识信息，在所述音效选择信息中，确定与所述音频标识信息相对应的音频效果； -采用所确定的音频效果，对所述原始音频信号进行音效处理。
4.根据权利要求1至3中任一项所述的方法，其中，所述音频效果包括以下至少任一种: _ ^!旦立Gl _冃双曰尔； -人声音效； -场景首效。
5.一种在用户设备中确定对会话中的语音进行处理的方法，其中，所述方法包括以下步骤: -确定与一会话相对应的至少一个音频效果； -将包含所述至少一个音频效果的音效标识信息的音效选择信息发送至媒体网关控制>j-U ρ?α装直。
6.根据权利要求5所述的方法，其中，所述方法包括以下步骤: -接收由媒体网关处理后的音频信号。
7.—种在媒体网关控制装置中辅助对会话的语音进行处理的方法，其中，所述方法包括以下步骤: -接收来自用户设备的与一会话相对应的音效选择信息，其中，所述音效选择信息包括至少一个音频效果的音效标识信息； -将所述音效选择信息发送至媒体网关。
8.一种对会话中的语音进行处理的媒体网关，其中，所述媒体网关包括: 音频处理装置，用于当接收到一会话的原始音频信号时，对该原始音频信号采用相应的音频效果进行处理，并将处理后的音频信号发送至所述会话相关的用户设备。
9.根据权利要求8所述的媒体网关，其中，所述媒体网关还包括: 获取装置，用于获取与所述会话相对应的音效选择信息，其中，所述音效选择信息包括至少一个音频效果的音效标识信息；其中，所述音频处理装置还用于: -采用所述音效选择信息中的一个或多个音频效果，对所述原始音频信号进行音效处理，并将处理后的音频信号发送所述用户设备。
10.根据权利要求9所述的媒体网关，其中，所述音效选择信息包括至少一个音频效果的音频标识信息以及与各个音效标识信息相对应的音频标识信息，其中，所述音频处理装置通过以下装置对所述原始音频信号进行音效处理: 第一确定装置，用于根据所述原始音频信号的音频标识信息，在所述音效选择信息中，确定与所述音频标识信息相对应的音频效果；子处理装置，用于采用所确定的音频效果，对所述原始音频信号进行音效处理。
11.根据权利要求8至10中任一项所述的媒体网关，其中，所述音频效果包括以下至少任一种: _进旦立Cfl _冃用.曰尔； -人声音效； -场景首效。
12.一种用于确定对会话中的语音进行处理的用户设备，其中，所述用户设备包括: 第二确定装置，用于确定与一会话相对应的至少一个音频效果；第一发送装置，用于将包含所述至少一个音频效果的音效标识信息的音效选择信息发送至媒体网关控制装置。
13.根据权利要求12所述的用户设备，其中，所述用户设备还包括: 第一接收装置，用于接收由媒体网关处理后的音频信号。
14.一种用于辅助对会话的语音进行处理的媒体网关控制装置，其中，所述媒体网关控制设备包括: 第二接收装置，用于接收来自用户设备的与一会话相对应的音效选择信息，其中，所述音效选择信息包括至少一个音频效果的音效标识信息；第二发送装置，用于将所述音效选择信息发送至媒体网关。
15.一种通信系统，其中，所述通信系统包括根据权利要求8至10中任一项所述的媒体网关、至少一个根据权利要求10至13中任一项所述的用户设备、以及根据权利要求14所述的媒体网关控制装置。
【文档编号】H04L29/06GK103839550SQ201210489128
【公开日】2014年6月4日申请日期:2012年11月26日优先权日:2012年11月26日
【发明者】卜文飞申请人:阿尔卡特朗讯

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：卜文飞;
技术所有人：阿尔卡特朗讯;
我是此专利的发明人

上一篇：具有快速拨号功能的电子装置及快速拨号方法
上一篇：一种mme池场景能力信息上报的方法及装置制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。