本公开的实施方式涉及用于处理语音的语音处理设备、语音处理系统和语音处理方法。
背景技术:
1、麦克风是用于将语音转换为电信号的设备。当麦克风设置在诸如会议室或教室的多个说话者所处的空间中时,麦克风从多个说话者接收所有语音,并生成与多个说话者的语音相关的语音信号。
2、同时,当多个说话者同时说话时,多个说话者的语音可以全部混合。此时,需要在多个说话者的语音中分离出表示特定说话者的语音的语音信号。
技术实现思路
1、[技术问题]
2、本公开涉及提供一种语音处理设备、语音处理系统和语音处理方法,其可以响应于说话者的语音生成与说话者的每个语音相关联的分离语音信号。
3、本公开还涉及提供一种语音处理设备、语音处理系统和语音处理方法,其可以使用与说话者的每个语音相关联的分离语音信号,根据为每个说话者设置的输出模式来输出说话者的每个语音。
4、[解决问题的方案]
5、根据本公开的实施方式的用于处理多个说话者的语音的语音处理设备,包括:麦克风,其被配置为响应于所述多个说话者的语音而生成语音信号;通信电路,其被配置为发送和接收数据;存储器;以及处理器,其中,所述处理器基于每个所述语音的声源位置来分离所述语音信号的声源,根据所述声源分离来生成与每个所述语音相关联的分离语音信号,确定与每个所述语音的所述声源位置相对应的输出模式;以及基于存储在所述存储器中的命令,使用所述通信电路,根据确定的所述输出模式来输出所述分离语音信号。
6、根据本公开的实施方式的处理多个说话者的语音的语音处理方法,包括:响应于所述多个说话者的语音而生成语音信号;基于每个所述语音的声源位置来分离所述语音信号的声源;生成与每个所述语音相关联的分离语音信号;确定每个所述语音的所述声源位置的输出模式;以及根据确定的所述输出模式来输出所述分离语音信号。
7、[发明的有益效果]
8、根据本公开的实施方式,由于可以基于语音的声源位置来生成与来自特定声源位置的语音相关联的分离语音信号,因此可以生成具有最小化的周围噪声影响的语音信号。
9、根据本公开的实施方式,由于多个说话者中的每一个的语音可以根据声源位置被分离,并且每个语音可以根据为每个说话者设置的输出模式被输出,所以用户可以仅(可听地)收听或(可视地)收看一些说话者的语音,并且因此根据说话者的重要性而选择性地收听或收看会话。
1.一种用于处理多个说话者的语音的语音处理设备,其特征在于,包括:
2.根据权利要求1所述的语音处理设备,其特征在于,所述麦克风包括设置为形成阵列的多个麦克风。
3.根据权利要求2所述的语音处理设备,其特征在于,所述处理器被配置为:
4.根据权利要求3所述的语音处理设备,其特征在于,所述处理器被配置为:
5.根据权利要求1所述的语音处理设备,其特征在于,所述存储器存储表示输出模式的输出模式信息,所述输出模式与每个所述语音的所述声源位置相对应,
6.根据权利要求1所述的语音处理设备,其特征在于,所述处理器被配置为:
7.根据权利要求6所述的语音处理设备,其特征在于,所述处理器根据所述输出模式将所述第一分离语音信号的所述格式转换为文本数据格式和语音数据格式中的任何一种。
8.一种处理多个说话者的语音的语音处理方法,其特征在于,包括:
9.根据权利要求8所述的语音处理方法,其特征在于,生成所述语音信号包括使用设置为形成阵列的多个麦克风来生成语音信号。
10.根据权利要求9所述的语音处理方法,其特征在于,分离所述声源包括:
11.根据权利要求10所述的语音处理方法,其特征在于,分离所述声源包括:
12.根据权利要求8所述的语音处理方法,其特征在于,确定所述输出模式包括:
13.根据权利要求8所述的语音处理方法,其特征在于,根据所确定的输出模式输出所述分离语音信号包括:
14.根据权利要求13所述的语音处理方法,其特征在于,生成所述第二分离语音信号包括: