基于元数据的用于语音通信的协同语音处理的方法

文档序号:8398279阅读:253来源:国知局
基于元数据的用于语音通信的协同语音处理的方法
【技术领域】
[0001 ] 本发明涉及语音通信的协同语音处理。
【背景技术】
[0002]在智能设备(例如:智能手机,平板电脑和智能电视)领域的最新进展允许部署用于智能设备应用的新用途。
[0003]尤其是,所谓的4G网络的部署具有增加的数据速度,以及通过各种语音互联网协议(VOIP)应用,如SKYPE或Facebook Messenger,表示了一种趋势,即语音通信,从传统的蜂窝网络,如GSM,转变为长期演进(LTE)或VoIP网络。
[0004]不同于传统的固定电话或手机网络语音电话,其中非语音信号信息的交流不存在或极其有限,VoIP电话是基于呼叫参与者之间的互联网协议(IP)数据包的交换。
[0005]新兴的语音通信标准,例如,WebRTC,能够使用网页或浏览器或任何类型的HTML 5的浏览器应用程序实现对等网络的语音呼叫。
[0006]抑制背景噪声是许多智能手机的一项功能,通常需要在进行语音通话前通过“呼叫设置”设备菜单进行开/关的操作。
[0007]典型的出厂设置为关闭。背景噪声抑制功能可从轻度抑制背景噪声调整到强度背景噪声抑制。然而,背景噪声抑制特性也可能影响所发送的语音信号的质量。
[0008]强度背景噪声抑制可能使声音信号减弱和/或失真。

【发明内容】

[0009]用于语音通信的两个或更多个智能设备之间的数据链路的使用能够通过智能设备之间的明确定义的元数据的交换语音信号的处理以协作的方式增强语音质量。
[0010]本发明提供了一种基于元数据的用于语音通信的协作语音处理的方法,包括:
[0011]在第一智能设备上检测来自第二智能设备的背景和/或回音噪声;
[0012]从第一智能设备发送元数据命令到第二智能设备以执行第二智能设备的背景噪声和/或回声消除功能的调节;
[0013]在第一智能设备上接收来自第二智能设备的指示已经执行调节的确认元数据消息。
[0014]本发明提供了一种基于元数据的用于语音通信的协作语音处理的方法,包括:
[0015]在第一智能设备上接收从第二智能设备发送的第一元数据对象;和
[0016]基于第一元数据调节由第一智能设备接收的来自第二智能设备的语音信号的处理。
【附图说明】
[0017]图1示出了根据本发明的系统。
[0018]图2示出了根据本发明的一个实施例;
[0019]图3示出了根据本发明的一个实施例;
[0020]图4示出了根据本发明的一个实施例;
[0021]图5示出了根据本发明的一个实施例;
[0022]图6示出了根据本发明示例性实施例的元数据对象。
【具体实施方式】
[0023]按照本发明,多个元数据类型可在VoiP/VoLTE呼叫之间交换,尤其是智能设备,例如智能电话。信息交换是通过传输以元数据对象形式的元数据字节来实现的,该元数据对象可能被封在VoIP数据包或通过单独IP连接在呼叫用户的智能之间交换。图1显示了呼叫参与者A的智能设备110和呼叫参与者B的智能设备120之间VoIP/VoLTE的通话过程中元数据对象130和140的交换。
[0024]图2中所示的本发明示例性实施例200包括远程激活和/或调整的其他呼叫参与者的背景噪声抑制和/或回声消除处理。这允许,例如,参与者A交互地激活并调整这些特性,其效果并不典型地被参与者B辨别。此外,背景噪音抑制可能会引入不希望的伪影,如变形的声音衰减,特别是当它被施加一次以上。如果参与者A,例如,已经在智能设备110上执行背景噪音抑制,智能设备120可自动禁用其背景噪声抑制功能以保持语音质量。
[0025]如图2,在VoiP/VoLTE的通话过程中,在步骤201,参与者A注意到有过多的从通话的呼叫参与者B那边传来的背景噪声,和/或从参与者B的那边传来的参与者A的显著地回声。按照本发明,参与者A从智能设备110向参与者B的智能设备120发送适当的元数据对象130。在此示例性实施例中,在步骤202中,元数据对象130包含从智能设备110到参与者B的智能设备120的的元数据命令,在参与者B的智能设备120中远程开启或调节背景噪声抑制和/或回声消除处理中。在步骤203,元数据命令被发送到参与者B的智能设别120中,并且根据元数据命令的接收,参与者B的智能设备120执行由元数据的命令所指示的动作,并在步骤204中,发送包含确认的元数据消息的元数据对象140到参与者A的智能设备110,以指示所述元数据命令已被执行。步骤202至204可以重复以实现参与者A可接受的语音质量,同样参与者B可以从智能设备120发送元数据命令以便在参与者A的智能设备110中调整背景噪声抑制和/或回声消除处理。
[0026]图3示出根据本发明的示范性实施例300,涉及参与者A的智能设备110和参与者B的智能设备120的本地语音的交换处理。在VoiP/VoLTE的呼叫中,在步骤301,开始时,参与者A的智能设备110的发送元数据对象130到参与者B的智能设备120 (也参见图1),以告知智能设备120,智能设备110执行了何种类型的本地语音处理,以避免重复处理或通过智能设备120优化本地语音处理。同样,在步骤302,智能设备120经由元数据对象140通知智能设备110,能设备120执行了何种类型的语音处理。在步骤303中,参与者A的智能设备110和参加者的B的智能设备120,按照接收的元数据对象140和元数据对象130调整各自的语音信号的处理。
[0027]例如,如果参加者A的智能设备110在语音信号被发送到参加者B的智能设备120前执行背景噪声抑制,智能设备120并不需要对输入语音信号进行抑制背景噪声,因为它是没有必要的。这样可以节省参与者B的智能设备120电池电源,通常提供更好的语音质量,参与者B以及作为背景噪声抑制的双重施加可能会导致显著的语音信号衰减或失真。没有包含声音处理数据的元数据对象130和元数据对象140的交互,智能设备110和智能设备120不知道在声音信号被传送到智能设备之前进行了何种类型的本地声音处理。在现有技术中,智能设备110和智能设备120通常对所接收到的语音信号施加通用预先设定本地语音处理。如果在发送声音信号之前,本地语音处理已被应用,可能导致信号饱和。抑制背景噪声典型地引入了不希望的效果,特别是当它被施加一次以上。根据本发明,如果参与者A,例如,已经对智能设备110上执行了背景噪声抑制,智能设备120可自动禁用其背景噪声抑制功能以保持语音质量。此外,消除不必要的语音信号处理减少了声音信号延迟或等待,可能满足网络运营商的最大信号延迟规格。
[0028]根据本发明的图4所示的示例性实施例400涉及在元数据对象130和元数据对象140的VoiP/VoLTE呼叫期间进行周期性传输,该周期性传输包含来自智能设备110的传感器150和智能设备160的传感器160的信息(见图1)。在VoiP/VoLTE呼叫期间,在智能设备110和120之间传送的元数据对象130和元数据对象140中周期性地包含GPS坐标、设备传感器数据等。使元数据对象130和140包含GPS坐标和设备传感器数据提供了与参与者A和参与者B的环境有关的信息,并允许通过智能设备110和智能设备120调整本地语音处理以动态地适应其他参与者的环境。对于其他参与者的主导背景噪声环境,可以应用专用的背景噪声抑制方案,而不是应用通用的背景噪声抑制方案。其他参与者的背景噪声环境有可能以汽车发动机的噪声,风噪,交通噪声,音乐等为主。
[0029]在图4的步骤401中,参与者A的智能设备110将包含来自传感器150 (例如,GPS,加速度计,罗盘)的数据的元数据对象130提供到参与者B的智能设备120。在步骤402中,参与者B的智能设备120将包含来自传感器160的数据的元数据对象140提供到智能参与者A的设备110。在步骤403中,智能设备110和智能设备120分别分析元数据对象140和元数据对象130,以确定是否需要对它们的本地语音处理分别进行调整以适应参与者B和参与者A的噪声环境。在步骤404中,根据步骤403的分析结果调整智能设备110和智能设备120中的本地语音处理。
[0030]例如,在由智能设备110从智能设备120接收到包含与参与者B有关
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1