语音交互方法及相应的设备、服务器、存储介质与流程

文档序号:34299441发布日期:2023-05-31 14:20阅读:40来源:国知局
语音交互方法及相应的设备、服务器、存储介质与流程

本申请涉及语音交互,尤其涉及一种语音交互方法及相应的设备、服务器、存储介质。


背景技术:

1、随着钉钉等云视频会议软件的普及,多个用户之间的语音通话、会议等更加方便,与此同时,用户的语音隐私被泄露的可能性大大增加,例如,操作系统和某些恶意软件可能会获取到语音通话的内容。相关技术在voip(voice over internet protocol,一种语音通话技术)软件中提供了加密功能,但该加密功能是数据级别、传输层的加密,无法对抗操作系统层面和恶意软件对麦克风输入的获取。


技术实现思路

1、本申请实施例提供一种语音交互方法及相应的设备、服务器、存储介质,以解决现有技术存在的技术问题。

2、第一方面,本申请实施例提供了一种语音输出设备,包括:

3、第一控制开关,位于语音输出设备的外侧,用于在被触发时生成加密开启指令;

4、加密控制模块,与第一控制开关电连接,用于在多人语音交互之前或多人语音交互过程中,响应于加密开启指令时进入语音加密状态,在语音加密状态中基于密钥对获取到的语音信号进行加密,生成加密语音信号;

5、第一通信模块,与加密控制模块电连接,用于向与语音输出设备连接的终端设备或服务器传输加密语音信号;终端设备用于向服务器转发加密语音信号,服务器用于向交互对象的语音接收设备转发加密语音信号。

6、第二方面,本申请实施例提供了一种服务器,包括:

7、第二通信模块,用于接收本申请实施例第一方面提供的语音输出设备或终端设备传输的加密语音信号,向交互对象的语音接收设备转发加密语音信号。

8、第三方面,本申请实施例提供了一种语音接收设备,包括:

9、第三通信模块,用于接收本申请实施例第二方面提供的服务器发送的加密语音信号;

10、解密控制模块,用于基于密钥对加密语音信号进行解密。

11、第四方面,本申请实施例提供了一种语音交互方法,可应用于语音输出设备,该方法包括:

12、在多人语音交互之前或多人语音交互过程中,响应于加密开启指令进入语音加密状态;

13、在语音加密状态中,基于密钥对获取到的语音信号进行加密,生成加密语音信号;

14、向与语音输出设备连接的终端设备或服务器传输加密语音信号;终端设备用于向服务器转发加密语音信号,服务器用于向交互对象的语音接收设备转发加密语音信号。

15、第五方面,本申请实施例提供了一种语音交互方法,可应用于服务器,该方法包括:

16、接收本申请实施例第一方面提供的语音输出设备或终端设备传输的加密语音信号;

17、向交互对象的语音接收设备转发加密语音信号。

18、第六方面,本申请实施例提供了一种语音交互方法,可应用于语音接收设备,该方法包括:

19、接收本申请实施例第二方面提供的服务器发送的加密语音信号;

20、基于密钥对加密语音信号进行解密;密钥为本申请实施例第四方面提供的语音交互方法中所使用的密钥。

21、第七方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现本申请任一实施例提供的语音交互方法。

22、与现有技术相比,本申请具有如下优点:

23、依据本申请实施例的技术方案,可通过语音输出设备、服务器和语音接收设备实现语音交互,可在音频域上对多人语音交互中的语音内容进行加密,操作系统、恶意软件等只能获取到加密后的语音数据,无法解密因而无法获取原始语音内容,从而可有效保护用户的通话隐,在保密通话、保密会议等场景中提高语音交互的安全性;是否进入语音加密状态的控制操作,可在多人语音交互之前,也可在多人语音交互的过程中执行,控制的灵活性较强;加密操作可以基于软硬件结合的形式实现。

24、上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,可依照说明书的内容予以实施,并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。



技术特征:

1.一种语音输出设备,其特征在于,包括:

2.根据权利要求1所述的语音输出设备,其特征在于,所述第一控制开关具有多个档位,每个档位在被触发时生成一个级别的加密开启指令,每个级别的加密开启指令与一个级别的语音加密状态相关联;

3.根据权利要求2所述的语音输出设备,其特征在于,还包括:

4.根据权利要求1-3中任一项所述的语音输出设备,其特征在于,还包括:

5.一种服务器,其特征在于,包括:

6.根据权利要求5所述的服务器,其特征在于,所述第二通信模块还用于接收所述语音输出设备或所述终端设备传输的语音传输规则信息;

7.根据权利要求5或6所述的服务器,其特征在于,所述第二通信模块还用于:获取所述语音输出设备或所述终端设备上传的交互对象列表;所述交互对象列表中包括多个交互对象和所述多个交互对象的组织架构信息;

8.一种语音接收设备,其特征在于,包括:

9.一种语音交互方法,其特征在于,应用于语音输出设备,所述方法包括:

10.根据权利要求9所述的语音交互方法,其特征在于,所述加密开启指令包括多个级别的加密开启指令;

11.根据权利要求10所述的语音交互方法,其特征在于,还包括:

12.根据权利要求10所述的语音交互方法,其特征在于,还包括:

13.根据权利要求12所述的语音交互方法,其特征在于,所述在所述语音加密状态中,基于密钥对获取到的语音信号进行加密,包括:

14.根据权利要求9-13中任一项所述的语音交互方法,其特征在于,还包括:

15.根据权利要求9-13中任一项所述的语音交互方法,其特征在于,所述密钥包括获取到的语音信号的频谱边界点和频谱切断点中的至少一项信息;

16.根据权利要求15所述的语音交互方法,其特征在于,还包括:

17.一种语音交互方法,其特征在于,应用于服务器,所述方法包括:

18.根据权利要求17所述的语音交互方法,其特征在于,还包括:

19.根据权利要求17或18所述的语音交互方法,其特征在于,还包括:

20.根据权利要求17所述的语音交互方法,其特征在于,还包括:

21.根据权利要求20所述的语音交互方法,其特征在于,还包括:

22.一种语音交互方法,其特征在于,应用于语音接收设备,所述方法包括:

23.根据权利要求22所述的语音交互方法,其特征在于,所述基于密钥对所述加密语音信号进行解密,包括:

24.一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求9-23任一项所述的语音交互方法。


技术总结
本申请提供了一种语音交互方法及相应的设备、服务器、存储介质。语音交互方法包括:在多人语音交互之前或多人语音交互过程中,响应于加密开启指令进入语音加密状态;在语音加密状态中,基于密钥对获取到的语音信号进行加密,生成加密语音信号;向与语音输出设备连接的终端设备或服务器传输加密语音信号。依据本申请的技术方案,可以有效地防止多人语音交互过程中的语音内容被泄露,提高多人语音交互的安全性。

技术研发人员:王康
受保护的技术使用者:阿里巴巴(中国)有限公司
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1