一种跨平台信源语音加密的方法及装置与流程

文档序号:15233109发布日期:2018-08-21 19:55阅读:272来源:国知局

本发明涉及移动通信信息安全技术领域,特别涉及一种跨平台信源语音加密的方法及装置。



背景技术:

移动终端,特别是智能手机的发展如此迅猛,在手机上处理的事务越来越多,手机信息安全的隐患越来越大,语音通话防窃听的安全性就是其安全隐患之一。同时,众所周知的原因,语音加密本身对音质的损害较大,提升加密后的音效也是问题之一。

现有技术的语音通话加密多数是基于固定平台的信道加密,基本很少去关注加密后的音质。为此,如何提出一种跨平台语音加密的方案,是当前需要解决的技术问题。



技术实现要素:

本发明的目的旨在至少解决所述技术缺陷之一。

为此,本发明的目的在于提出一种跨平台信源语音加密的方法及装置。

为了实现上述目的,本发明的实施例提供一种跨平台信源语音加密的方法,包括如下步骤:

步骤s1,上行链路:由发送方移动终端采集处理转化后的标准pcm数据,并对该标准pcm数据依次进行音效处理、路由处理和加密处理,生成加密后的码流数据,并将该加密后的码流数据进行编码调制,所述移动终端将编码调制后的码流数据经载频调制后,通过无线信道发送到基站;

步骤s2,通过所述基站和核心网,将码流数据发送至接收方移动终端;

步骤s3,下行链路:所述接收方移动终端接收码流数据,对该码流数据依次进行解码调制、解密、混音和路由处理,选择正确的通道输送码流数据,并调整下行增益,将增益优化后的码流数据进行播放。

进一步,在所述步骤s1中,对标准pcm数据进行音效处理,包括如下步骤:对输入的标准pcm数据减去喇叭参考信号,以消除回声。

进一步,采用二次加密方式对码流数据进行加密,包括:获取原始pcm码流数据,生成一个随机秘钥对码流数据进行加密,且所述随机秘钥本身也再加密一次。

进一步,采用以下方式之一获取原始pcm码流数据:

(1)将采集处理后的原始码流数据,通过音频总线,发送到dsp处理芯片,dsp处理芯片接收到语音码流后通过dma方式发送到modem,在modem侧获取编码前的数据进行加密,加密后再进行编码调制和传输;

(2)将采集处理后的原始码流数据dsp芯片,将dsp芯片和modem之间的传输线路断开,在二者中间插入一个混音器,所述混音器用于在通话时通话录音的下行录音功能用来录取下行pcm码流,而将通话时给对方播放音频的上行通道来录取上行pcm码流,得到这两个码流后分别进行加解密处理,处理后送回原来获取的地方,再发送到modem,完成编码调制和传输。

进一步,在所述步骤s3之后,还包括如下步骤:将增益优化后的码流数据进行语音数据恢复的同时,将增益优化后的码流数据输送至上行通道进行音效处理。

本发明还提出一种跨平台信源语音加密的系统,包括:发送方移动终端、基站、核心网和接收方移动终端,其中,

所述发送方移动终端包括:依次连接的语音数据采集模块、音效处理模块、第一混音器模块、加密模块、第一声码器和编码调制模块,其中,

所述语音数据采集模块用于采集人声,并处理转化后的标准pcm数据;

所述音效处理模块用于对所述标准pcm数据进行音效处理;

所述第一混音器模块用于对音效处理后输入的码流数据进行混音处理和路由处理;

所述加密模块用于对路由处理后的码流数据进行加密处理,生成加密后的码流数据发送至所述第一声码器;

所述第一声码器用于对加密后的码流数据进行编码处理;

所述编码调制模块用于的编码后的码流数据进行载频调制,然后通过无线信道发送至基站;

所述基站和所述核心网将来自所述发送方移动终端的码流数据发送至接收方移动终端;

所述接收方移动终端包括:编码解调模块、第二声码器、解密模块、第二混音器模块和增益控制模块,其中,

所述编码解调模块用于接收来自所述基站的码流数据,并进行解调;

所述第二声码器用于对解调后的码流数据进行编码;

所述解密模块用于对编码后的码流数据进行解密;

所述第二混音器模块用于对解密后的码流数据进行混音处理和路由处理,选择正确的通道,将码流数据发送至增益控制模块;

所述增益控制模块用于对来自所述第二混音器模块的码流数据调整下行增益,并通过所述接收方移动终端进行播放。

进一步,所述音效处理模块对输入的标准pcm数据减去喇叭参考信号,以消除回声。

进一步,所述加密模块采用二次加密方式对码流数据进行加密,包括:获取原始pcm码流数据,生成一个随机秘钥对码流数据进行加密,且所述随机秘钥本身也再加密一次。

进一步,所述加密模块采用以下方式之一获取原始pcm码流数据:

(1)将采集处理后的原始码流数据,通过音频总线,发送到dsp处理芯片,dsp处理芯片接收到语音码流后通过dma方式发送到modem,在modem侧获取编码前的数据进行加密,加密后再进行编码调制和传输;

(2)将采集处理后的原始码流数据dsp芯片,将dsp芯片和modem之间的传输线路断开,在二者中间插入一个混音器,所述混音器用于在通话时通话录音的下行录音功能用来录取下行pcm码流,而将通话时给对方播放音频的上行通道来录取上行pcm码流,得到这两个码流后分别进行加解密处理,处理后送回原来获取的地方,再发送到modem,完成编码调制和传输。

进一步,还包括:语音数据恢复模块,所述语音数据恢复模块的输入端与所述增益控制模块的输出端相连,用于对增益优化后的码流数据进行语音数据恢复,然后播放恢复后的数据;

所述增益控制模块的输出端进一步连接至接收方移动终端的音效处理模块,以对该增益优化后的码流数据进行音效处理。

根据本发明实施例的跨平台信源语音加密的方法及装置,在加密前端加入了音效处理,根据加密后端对音质的损害,人为反馈到前端去提升损失的音质,特别是对于信噪比和频率响应的优化,令加密后的音质和加密前相比几乎没有多大损失,专门用于提升加密后音质衰减的问题,和加密后优化前的效果相比有明显提升。

另外,本发明对于音效处理模块可以采用软件算法也可以采用硬件dsp实现,灵活性高;硬件实现,方案更容易理解,代码复杂性更低,而软件方案,成本更低。本发明能更好的解决通话加密对硬件平台的强依赖性,提供的加密方法安全性更高,方案设计采用模块化思路。本发明采用基于信源加密的一种独立性很强,对硬件平台依赖很小,跨平台,移植性很强的一种加密方法,设计采用二次加密,对密钥本身也进行了加密,所以安全性更高。

本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:

图1为根据本发明实施例的跨平台信源语音加密的方法流程图;

图2为根据本发明实施例的跨平台信源语音加密的总体设计框图;

图3为满足本发明音效的mic布局图;

图4a和图4b为根据本发明实施例的混音器设计模块的示意图;

图5为根据本发明实施例的正常语音通话的数据流图;

图6为根据本发明实施例的语音通话数据流图

图7为根据本发明实施例的明文通话流程图;

图8为根据本发明实施例的密文通话流程图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

本发明提供一种跨平台信源语音加密的方法及装置,可以应用于移动终端的语音通信,对语音码流数据进行加密以及加密后进行音质处理。

如图1所示,本发明实施例的跨平台信源语音加密的方法,包括如下步骤:

步骤s1,上行链路:由发送方移动终端采集处理转化后的标准pcm数据,并对该标准pcm数据依次进行音效处理、路由处理和加密处理,生成加密后的码流数据,并将该加密后的码流数据进行编码调制,移动终端将编码调制后的码流数据经载频调制后,通过无线信道发送到基站。

具体的,发送方移动终端采集人声,其外部连接有mic,可用数字mic或者模拟mic。在本发明的一个实施例中,如果采用模拟mic,则需要通过a/d模块对采集的语音模拟信号进行模数转换,转换为语音数字信号。如果用到数字mic,则不需要进行a/d转换。

为了在后续音效处理得到更好的音效,本发明使用双mic采集语音数据,采集到的语音数据必须满足16bit采样精度,8khz采样率,单声道。双mic硬件布局必须严格满足双mic布局的标准,否则后续效果会有一定损失,mic布局图如图3所示。

需要说明的是,本步骤中,发送方移动终端内的语音采集模块,进一步设置单独的增益控制单元,对采集得到的语音信号进行增益控制,根据讲话者周围不同噪声环境去调整增益大小,精准控制,每次调整1db。该语音采集模块内还有一个i2s主控制器接口,用于将a/d转换后的数字信号传输到音效处理模块,人声经采集处理后转换为标准i2s信号输出到音效处理流程。

在本步骤中,对标准pcm数据进行音效处理,包括如下步骤:对输入的标准pcm数据减去喇叭参考信号,以消除回声。

通过发送方移动终端内置的音效处理模块执行音效处理,用于优化音效,通常语音加密对语音的音质有一定损失,所以调试音效时需要多次迭代调试,在数据送到加密之前就需要把音效处理好,包括噪声消除和回声抑制。

具体的,音效处理模块输入上行pcm码流和下行喇叭参考信号,因为采集的上行pcm码流本身就是人声、噪声、喇叭播放音三者的叠加,所以输入的pcm码流原理上减去喇叭参考信号就可消除回声,起到回声抑制效果。

对于噪声消除来说,可以使用单mic,也可以使用双mic。通常双mic的效果更佳,mic选用全向mic,但mic进音孔开口必须是主mic进音孔指向有效音源,辅mic进音孔指向反向环境噪声源。在算法层面上,音效处理模块包含高通滤波器、fir滤波、iir滤波、增益控制、drc和频谱补偿等,音频经过优化处理后的pcm码流再送到混音器进行处理。

对于同一个移动终端,内置的混音器模块用于路由语音数据码流,包括上行(作为发送方)和下行(作为接收方)两个通路。如图4a所示,对上行来说,从mic采集的pcm数据采用pcm标准接口pcm_write函数写入pcm设备pcm0,该数据从pcm0读出后有两路流向,一路是经过静音开关后,通过混音器mixer1后送到编码器模块;另外一路是直接把数据读取到混音器mixer2后路由到虚拟端口1,之后再通过混音器模块mixer1混音后传输到编码器encoder。这两路在mixer1处是二选一,实际使用中把发送静音开关打开,静音上面一路,而使用包含mixer2的第二路通路。

经过混音处理后的码流数据送入加密模块进行加密。本发明采用的加密方法由于数据在接入点ap侧饶了一圈,所以必须给上行加上单独的音效处理模块,可以使用软件的方法或者硬件方法。如果使用软件方法,借助alsa提供的标准函数接口在通话时加载录音的算法;如果使用硬件的方法,在mic数据采集时就可以处理音效,采用硬件dsp处理。此时相当于把语音数据采集模块和音效处理模块都集成进了硬件dsp中,不用单独经过这两个模块处理。本发明中软件和硬件两种方法都已实现,两种方法音效近似,音频指标snr,thn+d硬件方案稍好。

在本发明的一个实施例中,采用二次加密方式对码流数据进行加密,包括:获取原始pcm码流数据,生成一个随机秘钥对码流数据进行加密,且随机秘钥本身也再加密一次。

综上,步骤s1对应上行链路。对上行来说,人声首先经过语音数据采集模块采集处理后转化为标准pcm数据,该数据发送到音效处理模块,做音效处理,这里主要是噪声消除和回声抑制,处理后发送到混音器模块做路由处理,该混音器模块会选择正确的路由路径把pcm码流路由到加密模块,混音器模块还有一个主要作用就是把原始的通话通道mute掉,否则的话,上行和下行分别会有两路语音,造成语音重叠;经混音处理的码流数据发送到加密模块完成加密,加密方法采用二次加密,即产生一个随机密钥对语音加密,对随机密钥本身也会再加密一次,这样安全性更高;加密后的码流数据发送到声码器完成编码,该加密方法对声码器编码的耦合性较好,能满足目前主流的efr,evrc等语音编码方式并且对语音质量损失较小。声码器编码完成后经过载频调制到合适的频带经无线信道发送到基站。

下面对加密的具体过程进行说明:本发明采用信源加密方式,获取pcm码流的关键信息,包括相位,包络,频谱等,加密pcm码流;该方案的一个关键点是获取原始pcm码流。

在本发明的一个实施例中,采用以下方式之一获取原始pcm码流数据:

(1)将采集处理后的原始码流数据,通过音频总线,发送到dsp处理芯片,dsp处理芯片接收到语音码流后通过dma方式发送到modem,在modem侧获取编码前的数据进行加密,加密后再进行编码调制和传输。

具体的,正常cs域语音通话的pcm数据通过codded处理后直接发到modem侧再发送出去,其码流数据不经过ap侧,其码流数据流图如图5所示。人声被采集处理后,通过音频总线,发送到dsp芯片,dsp接收到语音码流后通过dma方式每20ms,发送320bytes到modem,在modem侧获取编码前的数据进行加密,加密后再进行编码,之后调制和传输。

(2)将采集处理后的原始码流数据dsp芯片,将dsp芯片和modem之间的传输线路断开,在二者中间插入一个混音器,混音器用于在通话时通话录音的下行录音功能用来录取下行pcm码流,而将通话时给对方播放音频的上行通道来录取上行pcm码流,得到这两个码流后分别进行加解密处理,处理后送回原来获取的地方,再发送到modem,完成编码调制和传输。

通话时前端数据传输和方式一相同,采集人声并进行pcm编码后把数据发送到audioasp,但将dsp和modem之间的传输线路断开,而在中间插入一个混音器,该混音器功能是把通话时通话录音的下行录音功能用来录取下行pcm码流,而把通话时给对方播放music的上行通道用来录取上行pcm码流,得到这两个码流后分别送到加密模块中去实现加解密处理,处理后送回原来获取的地方,再发送到modem,完成编码,调制,传输。其数据流图如图6所示。需要说明的是,本发明提供的加密方法获取pcm码流的方式为方式(2)。

步骤s2,通过基站和核心网,将码流数据发送至接收方移动终端。

步骤s3,下行链路:接收方移动终端接收码流数据,对该码流数据依次进行解码调制、解密、混音和路由处理,选择正确的通道输送码流数据,并调整下行增益,将增益优化后的码流数据进行播放。

接收方移动终端接收码流数据,对该码流数据依次进行解调和编码操作。具体的,利用接收方移动终端内的声码器进行编码操作。

需要说明的是,在步骤s1中,利用发送方移动终端的声码器对加密后的码流数据进行编码,在步骤s3中,利用接收方移动终端的声码器对解调。由于,在这两个步骤中,声码器的功能近似,下面进行统一说明。

声码器编码语音码流,语音通话时,voice语音经过采样之后的数据量非常大(16*8k=128kbps),这样的数据如果经过网络直接传输,网络的负载会很大;同时语音信号中存在非常大的信息冗余,完全没有必要把数据原封不动传输,只需提取出其中的关键语音特征,传输这些关键语音特征就可以,在接收方移动终端采用相同的方法恢复。

实际上这些关键语音信息是由每个人不同的喉头、口、鼻腔结构所决定的,如声带“振动-不振动”(浊-清音)、声带振动时的基本频率(基频),声道传输声源信号的特性。这些话音参数变化很慢,它们所占的总频带比话音本身的频带窄得多,因而对这些参数采样编码时总数码率只有几千甚至几百比特/秒,只有直接由话音信号采样编码的数码率的十几分之一,可以通过一个普通电话信道来传输。收信端的合成器利用这些参数来合成话音。gsm语音有五种形式的语音编码格式:afs自适应全速率编码;ahs自适应半速率编码;efr增强型全速率;fr普通全速率;hr普通半速率。这五种声码器,用得最多的是afs和efr,其语音的mos值也是最好的。

afs和ahs也合称amr,它们有12.2kbps,10.2kpbps,7.95kbps,7.4ksbps,6.7kbps,5.8kbps,5.15kbps,4.75kbps八种速率,一般自适应会在四种速率中变化,由网络决定其参数。efr编码速率为12.2kbps,每20ms一个语音帧(通常320bytes)。cdma编码格式:evrc。支持三种码率9.6kbps,4.8kbps和1.2kbps。另外,高通平台使用的cdma编码格式还有一种qcelp(communalcodeexcitedlinearpredictive,受激线性预测编码),使用适当的门限值来决定所需速率。可工作于4/4.8/8/9.6kbit/s等固定速率上,而且可变速率地工作于800bit/s~9600bit/s之间。qcelp算法被认为是到目前为止效率最高的一种算法,它的主要特点之一,是使用适当的门限值来决定所需速率。门限值随背景噪声电平变化而变化,这样就抑制了背景噪声,使得即使在喧闹的环境中,也能得到良好的话音质量,cdma8kbit/s的话音近似gsm13mbit/s的话音。cdma采用qcelp编码等一系列技术,具有话音清晰、背景噪声小等优势,其性能明显优于其他无线移动通信系统,语音质量可以与有线电话媲美,无线辐射低。本发明提供的加密通话方法和装置支持移动,电信,联通多种制式。

经过声码器调制后的码流数据进行解密处理。需要说明的是,本发明跨平台信源语音加密的方法和装置可实现明文和密文通话。

图7为根据本发明实施例的明文通话流程图。使用a手机dealer应用程序拨号按键呼叫b手机,按键后dealer应用程序发送指令告诉加密模块此时不需要加密,同时a手机的上行pcm码流数据发送到加密模块中,加密模块判断不需要加密。之后将pcm码流数据按照加密模块数据格式要求加上包头和包尾透传回a手机,明文通话模式下加密模块不用产生随机数密钥,接着a手机把回传收到的数据发送到b手机。b手机把接收到的数据发送到加密模块中,b手机的加密模块判断此时也是不需要加密,所以不用产生随机数密钥,之后按照加密协议的数据格式要求把收到的数据去掉包头包尾后回传到b手机,完成播放。

图8为根据本发明实施例的密文通话流程图。a手机发送主叫密文通话,dealer应用给加密模块发送加密指令,同时把语音数据发送到加密模块中,加密模块解析指令判断需要加密,产生随机数密钥key1并把key1用des加密,加密后的key1密钥回传回a手机,同时b手机会收到来电,dealer按键接通后给加密模块发送指令,同时把语音数据发送到加密模块中,加密模块解析指令判断需要加密,产生随机数密钥key2,并把key2用des加密,之后加密的key2密钥回传回b手机;之后a、b手机相互把各自的key1和key2密钥发送给对方,key2保存到a手机加密模块中,key1保存到b手机加密模块中,此时加密链路建立完成;之后a手机的加密模块把a手机发送给它的码流数据加密后回传到a手机,b手机也执行相应操作,接着a手机把收到的密文发送到b,b手机把收到的密文发送到a,a手机把收到的b手机的加密数据发送到加密模块中去解密,加密模块先把之前保存的加密后的key2利用对称des加密后,再用key2去加密加密数据,这样就还原出明文数据回传回a手机的喇叭或听筒播放,b手机也执行相应的操作,完成密文通话。

经过解密处理后的码流数据送入接收方法移动终端的混音器的下行通路。如图4b所示,对下行来说,从网络传输过来的下行码流发送到解码器decoder后有两路可选,一路是经过混音器3(mixer3)后发送到接收静音开关,之后发送到pcm设备pcm1,最后通过喇叭或听筒播放出来;另一路是从解码器出来的码流发送到虚拟端口2,之后发送到混音器4(mixer4),然后发送到pcm1通过喇叭或听筒播放出来。这两路可以同时传输,在实际使用时打开接收静音开关,静音上面一路,而使用包含mixer4的一路通路。

经过混音处理后的码流数据送入至接收方移动终端的增益控制pa模块,控制下行增益,当下行增益响度太小时增大下行增益,当下行增益过大时压制下行增益,起到保护喇叭的作用,pa模块本身可以选择模拟pa或者智能pa,pa的放大倍数要求在1~24倍之间,这样效果最好。如果选择智能pa,需要提前校准参数,参数校准根据喇叭阻抗和实际工作温度得到不同的boost功率值。

在本发明的一个实施例中,在步骤s3之后,还包括如下步骤:将增益优化后的码流数据进行语音数据恢复的同时,将增益优化后的码流数据输送至上行通道进行音效处理。具体的,利用语音数据恢复还原人声,其外部连接有喇叭或者听筒等播放声学器件,该模块内包含d/a模块,需要把数字信号转换为模拟信号,让喇叭播放出来。模块内部还有i2s主控制器接口,实际上该i2s主控制器和语音数据采集模块中的i2s主控制器是一个控制器,采集模块用到i2s发送通道,恢复模块用到i2s接收通道,该接收通道将音效处理模块处理后的数字信号传输到语音数据恢复模块。

综上,对下行来说,从无线信道接收到语音码流后经解调模块解调后发送到声码器,声码器解码后发送到解密处理,解密处理是步骤s1的加密算法的逆过程,经解密后的数据就是标准的pcm码流数据,该pcm数据发送到混音器模块经过混音和路由后选择正确的通道再把下行数据发送到增益控制pa模块,pa模块主要是调整下行增益大小,增益优化调整后的码流数据再送到语音数据恢复模块从喇叭或者听筒播放出来,至此,整个通话加解密的流程执行完成。需要说明的是,从增益控制pa出来的下行数据送到数据恢复模块的同时也送到上行的音效处理模块,这是为了做音效优化,包括消噪和回声抑制。

如图2所示,本发明实施例还提供一种跨平台信源语音加密的系统,包括:发送方移动终端、基站、核心网和接收方移动终端。

需要说明的是,这里的发送方移动终端和接收方移动终端,仅是针对该移动终端在本次语音通信中的角色而定。同一个移动终端即可以作为发送方移动终端和接收方移动终端,因此可同时兼具下述发送方和接收方的功能模块。

具体的,发送方移动终端包括:依次连接的语音数据采集模块100、音效处理模块200、第一混音器模块300、加密模块400、第一声码器500和编码调制模块600。

语音数据采集模块100用于采集人声,并处理转化后的标准pcm数据。

具体的,语音数据采集模块100采集人声,其外部连接有mic,可用数字mic或者模拟mic。在本发明的一个实施例中,如果采用模拟mic,则需要通过a/d模块对采集的语音模拟信号进行模数转换,转换为语音数字信号。如果用到数字mic,则不需要进行a/d转换。

为了在后续音效处理得到更好的音效,本发明使用双mic采集语音数据,采集到的语音数据必须满足16bit采样精度,8khz采样率,单声道。双mic硬件布局必须严格满足双mic布局的标准,否则后续效果会有一定损失,mic布局图如图3所示。

需要说明的是,语音采集模块进一步设置单独的增益控制单元,对采集得到的语音信号进行增益控制,根据讲话者周围不同噪声环境去调整增益大小,精准控制,每次调整1db。该语音采集模块内还有一个i2s主控制器接口,用于将a/d转换后的数字信号传输到音效处理模块200,人声经采集处理后转换为标准i2s信号输出到音效处理流程。

音效处理模块200用于对标准pcm数据进行音效处理。

具体的,音效处理模块200对输入的标准pcm数据减去喇叭参考信号,以消除回声。音效处理模块200优化音效,通常语音加密对语音的音质有一定损失,所以调试音效时需要多次迭代调试,在数据送到加密之前就需要把音效处理好,包括噪声消除和回声抑制。

具体的,音效处理模块200输入上行pcm码流和下行喇叭参考信号,因为采集的上行pcm码流本身就是人声、噪声、喇叭播放音三者的叠加,所以输入的pcm码流原理上减去喇叭参考信号就可消除回声,起到回声抑制效果。

对于噪声消除来说,可以使用单mic,也可以使用双mic。通常双mic的效果更佳,mic选用全向mic,但mic进音孔开口必须是主mic进音孔指向有效音源,辅mic进音孔指向反向环境噪声源。在算法层面上,音效处理模块200包含高通滤波器、fir滤波、iir滤波、增益控制、drc和频谱补偿等,音频经过优化处理后的pcm码流再送到第一混音器模块300进行处理。

第一混音器模块300用于对音效处理后输入的码流数据进行混音处理和路由处理。

如图4a所示,对上行来说,从mic采集的pcm数据采用pcm标准接口pcm_write函数写入pcm设备pcm0,该数据从pcm0读出后有两路流向,一路是经过静音开关后,通过混音器mixer1后送到编码器模块;另外一路是直接把数据读取到混音器mixer2后路由到虚拟端口1,之后再通过混音器模块mixer1混音后传输到编码器encoder。这两路在mixer1处是二选一,实际使用中把发送静音开关打开,静音上面一路,而使用包含mixer2的第二路通路。

加密模块400用于对路由处理后的码流数据进行加密处理,生成加密后的码流数据发送至第一声码器500。

本发明采用的加密方法由于数据在接入点ap侧饶了一圈,所以必须给上行加上单独的音效处理模块200,可以使用软件的方法或者硬件方法。如果使用软件方法,借助alsa提供的标准函数接口在通话时加载录音的算法;如果使用硬件的方法,在mic数据采集时就可以处理音效,采用硬件dsp处理。此时相当于把语音数据采集模块100和音效处理模块200都集成进了硬件dsp中,不用单独经过这两个模块处理。本发明中软件和硬件两种方法都已实现,两种方法音效近似,音频指标snr,thn+d硬件方案稍好。

具体的,加密模块400采用二次加密方式对码流数据进行加密,包括:获取原始pcm码流数据,生成一个随机秘钥对码流数据进行加密,且随机秘钥本身也再加密一次。

在本发明的一个实施例中,加密模块400采用以下方式之一获取原始pcm码流数据:

(1)将采集处理后的原始码流数据,通过音频总线,发送到dsp处理芯片,dsp处理芯片接收到语音码流后通过dma方式发送到modem,在modem侧获取编码前的数据进行加密,加密后再进行编码调制和传输。

具体的,正常cs域语音通话的pcm数据通过codded处理后直接发到modem侧再发送出去,其码流数据不经过ap侧,其码流数据流图如图5所示。人声被采集处理后,通过音频总线,发送到dsp芯片,dsp接收到语音码流后通过dma方式每20ms,发送320bytes到modem,在modem侧获取编码前的数据进行加密,加密后再进行编码,之后调制和传输。

(2)将采集处理后的原始码流数据dsp芯片,将dsp芯片和modem之间的传输线路断开,在二者中间插入一个混音器,混音器用于在通话时通话录音的下行录音功能用来录取下行pcm码流,而将通话时给对方播放音频的上行通道来录取上行pcm码流,得到这两个码流后分别进行加解密处理,处理后送回原来获取的地方,再发送到modem,完成编码调制和传输。

通话时前端数据传输和方式一相同,采集人声并进行pcm编码后把数据发送到audioasp,但将dsp和modem之间的传输线路断开,而在中间插入一个混音器,该混音器功能是把通话时通话录音的下行录音功能用来录取下行pcm码流,而把通话时给对方播放music的上行通道用来录取上行pcm码流,得到这两个码流后分别送到加密模块400中去实现加解密处理,处理后送回原来获取的地方,再发送到modem,完成编码,调制,传输。其数据流图如图6所示。需要说明的是,本发明提供的加密方法获取pcm码流的方式为方式(2)。

第一声码器500用于对加密后的码流数据进行编码处理。编码调制模块600用于的编码后的码流数据进行载频调制,然后通过无线信道发送至基站。

基站和核心网将来自发送方移动终端的码流数据发送至接收方移动终端。

接收方移动终端包括:编码解调模块700、第二声码器800、解密模块、第二混音器模块1000和增益控制模块1100。

具体的,编码解调模块700用于接收来自基站的码流数据,并进行解调。第二声码器800用于对解调后的码流数据进行编码。解密模块用于对编码后的码流数据进行解密。

第二混音器模块1000用于对解密后的码流数据进行混音处理和路由处理,选择正确的通道,将码流数据发送至增益控制模块1100。

经过解密处理后的码流数据送入接收方法移动终端的混音器的下行通路。如图4b所示,对下行来说,从网络传输过来的下行码流发送到解码器decoder后有两路可选,一路是经过混音器3(mixer3)后发送到接收静音开关,之后发送到pcm设备pcm1,最后通过喇叭或听筒播放出来;另一路是从解码器出来的码流发送到虚拟端口2,之后发送到混音器4(mixer4),然后发送到pcm1通过喇叭或听筒播放出来。这两路可以同时传输,在实际使用时打开接收静音开关,静音上面一路,而使用包含mixer4的一路通路。

经过混音处理后的码流数据送入至接收方移动终端的增益控制pa模块,控制下行增益,当下行增益响度太小时增大下行增益,当下行增益过大时压制下行增益,起到保护喇叭的作用,pa模块本身可以选择模拟pa或者智能pa,pa的放大倍数要求在1~24倍之间,这样效果最好。如果选择智能pa,需要提前校准参数,参数校准根据喇叭阻抗和实际工作温度得到不同的boost功率值。

增益控制模块1100用于对来自第二混音器模块1000的码流数据调整下行增益,并通过接收方移动终端进行播放。增益控制模块1100的输出端进一步连接至接收方移动终端的音效处理模块200,以对该增益优化后的码流数据进行音效处理。

具体的,从增益控制pa出来的下行数据送到数据恢复模块的同时也送到上行的音效处理模块200,这是为了做音效优化,包括消噪和回声抑制。

接收方移动终端还包括:语音数据恢复模块1200,语音数据恢复模块1200的输入端与增益控制模块1100的输出端相连,用于对增益优化后的码流数据进行语音数据恢复,然后播放恢复后的数据。

具体的,利用语音数据恢复还原人声,其外部连接有喇叭或者听筒等播放声学器件,该模块内包含d/a模块,需要把数字信号转换为模拟信号,让喇叭播放出来。模块内部还有i2s主控制器接口,实际上该i2s主控制器和语音数据采集模块100中的i2s主控制器是一个控制器,采集模块用到i2s发送通道,恢复模块用到i2s接收通道,该接收通道将音效处理模块200处理后的数字信号传输到语音数据恢复模块1200,进行语音数据恢复后进行播放。

根据本发明实施例的跨平台信源语音加密的方法及装置,在加密前端加入了音效处理,根据加密后端对音质的损害,人为反馈到前端去提升损失的音质,特别是对于信噪比和频率响应的优化,令加密后的音质和加密前相比几乎没有多大损失,专门用于提升加密后音质衰减的问题,和加密后优化前的效果相比有明显提升。

另外,本发明对于音效处理模块可以采用软件算法也可以采用硬件dsp实现,灵活性高;硬件实现,方案更容易理解,代码复杂性更低,而软件方案,成本更低。本发明能更好的解决通话加密对硬件平台的强依赖性,提供的加密方法安全性更高,方案设计采用模块化思路。本发明采用基于信源加密的一种独立性很强,对硬件平台依赖很小,跨平台,移植性很强的一种加密方法,设计采用二次加密,对密钥本身也进行了加密,所以安全性更高。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨的情况下在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。本发明的范围由所附权利要求及其等同限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1