本公开涉及用于对言语数据进行匿名化的系统和技术。
背景技术:
1、许多现代车辆包括语音识别系统。这种系统包括传声器。所述系统将由传声器检测到的口头词语转换成文本或可以与命令匹配的另一种形式。所识别的命令可以包括调整气候控制、选择要播放的媒体等。
技术实现思路
1、本文描述的系统和技术可以对言语数据进行匿名化。对言语数据进行匿名化可以防止语音识别系统基于分析言语来识别说话者。具体地,该系统可以接收第一言语数据,从所述第一言语数据中移除说话者识别特性的第一矢量以生成提取的第一言语数据,生成所述说话者识别特性的随机矢量,以及通过将所述随机矢量应用于所述提取的第一言语数据来生成第二言语数据。因此,第二言语数据是匿名化的。此外,该系统可以保留言语数据的非识别特性,诸如内容和语音风格,例如语速、音量、音高、口音等。
2、一种计算机包括处理器和存储器,并且所述存储器存储指令,所述指令可由所述处理器执行以:接收第一言语数据,从所述第一言语数据中移除说话者识别特性的第一矢量以生成提取的第一言语数据,生成所述说话者识别特性的随机矢量,以及通过将所述随机矢量应用于所述提取的第一言语数据来生成第二言语数据。
3、所述指令还可以包括用于根据第一言语数据来确定文本的指令。所述指令还可以包括用于基于所述第一言语数据的至少一个片段的所述文本在某个类别中而移除所述至少一个片段的指令。在移除所述第一言语数据的所述至少一个片段之后生成所述第二言语数据可发生。
4、所述类别可以是个人可识别信息。
5、所述指令还可以包括用于将所述第二言语数据传输到远程服务器的指令。所述指令还可以包括用于将随机矢量传输到远程服务器的指令。
6、第一言语数据可以包括语音命令。所述指令还可以包括用于基于语音命令来致动车辆的部件的指令。
7、生成所述随机矢量可以包括根据所述说话者识别特性的分布来进行采样。所述分布可源自对来自说话者群体的所述说话者识别特性的测量。
8、第一矢量可以包括语谱图。语谱图可以是梅尔语谱图。
9、从所述第一言语数据中移除所述第一矢量可包括对不具有所述第一矢量的所述第一言语数据进行编码以生成所述提取的第一言语数据。对不具有第一矢量的第一言语数据进行编码可以包括执行机器学习程序。机器学习程序可以是使用下采样的卷积神经网络。
10、将所述随机矢量应用于所述提取的第一言语数据可包括使用所述随机矢量对所述提取的第一言语数据进行解码。对提取的第一言语数据进行解码可以包括执行机器学习程序。机器学习程序可以是使用上采样的卷积神经网络。
11、一种方法包括接收第一言语数据,从所述第一言语数据中移除说话者识别特性的第一矢量以生成提取的第一言语数据,生成所述说话者识别特性的随机矢量,以及通过将所述随机矢量应用于所述提取的第一言语数据来生成第二言语数据。
1.一种方法,其包括:
2.如权利要求1所述的方法,其还包括根据所述第一言语数据确定文本。
3.如权利要求2所述的方法,其还包括基于所述第一言语数据的至少一个片段的所述文本在某个类别中而移除所述至少一个片段。
4.如权利要求3所述的方法,其中在移除所述第一言语数据的所述至少一个片段之后生成所述第二言语数据发生。
5.如权利要求3所述的方法,其中所述类别是个人可识别信息。
6.如权利要求1所述的方法,其还包括将所述第二言语数据传输到远程服务器。
7.如权利要求1所述的方法,其中所述第一言语数据包括语音命令,所述方法还包括基于所述语音命令来致动车辆的部件。
8.如权利要求1所述的方法,其中生成所述随机矢量包括根据所述说话者识别特性的分布来进行采样。
9.如权利要求8所述的方法,其中所述分布源自对来自说话者群体的所述说话者识别特性的测量。
10.如权利要求1所述的方法,其中所述第一矢量包括语谱图。
11.如权利要求1所述的方法,其中从所述第一言语数据中移除所述第一矢量包括对不具有所述第一矢量的所述第一言语数据进行编码以生成所述提取的第一言语数据。
12.如权利要求11所述的方法,其中对不具有所述第一矢量的所述第一言语数据进行编码包括执行机器学习程序,并且所述机器学习程序是使用下采样的卷积神经网络。
13.如权利要求11所述的方法,其中将所述随机矢量应用于所述提取的第一言语数据包括使用所述随机矢量对所述提取的第一言语数据进行解码。
14.如权利要求13所述的方法,其中对所述提取的第一言语数据进行解码包括执行机器学习程序,并且所述机器学习程序是使用上采样的卷积神经网络。
15.一种计算机,其包括处理器和存储器,所述存储器存储指令,所述指令能够由所述处理器执行以执行如权利要求1至14中的一项所述的方法。