一种基于量化特性的语音篡改定位检测方法

文档序号：9930284阅读：336来源：国知局

一种基于量化特性的语音篡改定位检测方法
【技术领域】
[0001] 本发明设及语音篡改定位检测方法，具体是指一种基于量化特性的语音篡改定位检测方法。
【背景技术】
[0002] 随着数字技术和互联网技术的快速发展，数字多媒体在日常生活中得到了广泛的应用。人们每天都在产生大量的多媒体信息，例如:使用数码相机拍摄视频、拍摄照片、语音聊天，人们可W将运些信息通过互联网技术在网络上与朋友分享，丰富了人们的精神文化生活，方便了人们之间的交流沟通，让人们因掌握了新的技术而受益。但是，任何技术都存在两面性，大量的多媒体编辑软件可W对运些数字信息进行篡改，如果篡改的信息被非法使用，将会给我们的生活带来极大的威胁，由此数字取证技术孕育而生。通常数字取证技术可分为两类:主动取证技术和被动取证技术;主动取证技术有两种常见的方法:第一种是数字水印，对认证的数字信息嵌入认证信息;第二种是数字签名，从数字信号中提取一个与内容相关的指纹作为数字签名。运两种方法都可W用来检测数字信息的真实性。被动取证技术是通过对数字内容进行分析，运用数字信号处理的技术鉴别数字信息的原始性和真实性，它不需要事先嵌入信息。在实际情况下要鉴别的数字信号往往都不具备数字水印和数字签名信息，因此实际应用中被动取证技术更具有现实意义。
[0003] MP3是目前流行的音频格式之一，MP3音频采用MPEG-I第S层音频压缩标准，W其近CD的音质、高压缩比、开放性和易用性深受好评，在因特网上广为流行，相应的编解码软件和硬件设备也不断涌现。音频是指人类能够听到的所有声音，语音是指由人的发音器官发出，负载着一定的语言意义，语音是音频的一个范畴。我们把经过MP3音频编码器压缩的语音信号称为MP3语音。正是因为MP3编码软件和硬件设备不断的普及使得我们获取MP3语音变得非常便捷，而音频编辑软件可W随意的对语音内容进行编辑篡改，如果被非法利用将会给我们的生活带来严重的威胁。例如在法庭上用于取证的录音材料："我没有看到事情的经过"篡改为"我看到了事情的经过"，仅仅将"没有"二字删除完全扭曲了原本的意思，将会破坏最终判决的公正性。语音内容常见的篡改方式有:删除、插入、拼接。删除操作就是将原始语音的内容删除部分，达到掩盖原始内容的目的；插入操作是将另一段语音内容插入原始语音特定位置处，同样达到掩盖原始语音内容表达的目的；拼接篡改操作是删除和插入操作的结合，首先将原始语音内容的部分内容删除，然后插入另一段语音内容，同样达到掩盖原始语音内容的目的。从运些篡改的操作过程可W看出，对语音内容的真实性和原始性验证是非常重要的。
[0004] 目前，语音内容篡改取证领域中也引起较多研究者的关注。《基于背景噪声的数字音频取证[J]. 2010 IE邸国际会议，106-110》文献中，Ikram和MaHk提出一种基于环境背景噪声的音频取证方法，利用待测音频中背景噪声与不同环境背景噪声的相关性大小来判断音频信号的完整性。《基于混响的录音环境识别[C].声学、语音信号处理.2012年： 1833-1836》文献中，MaUk等利用逆滤波器从音频文件中估计回响信号，提取回响信号的24 维梅尔倒谱系数和24维对数梅尔谱系数，构成48维的特征向量，然后利用SVM分类W实现对录音环境的识别。《基于双谱分析的数字取证检测[J]. M口，2004》文献中，化rid提出了利用双谱分析检测音频信号真伪的方法，他认为自然信号在频域内具有较弱的高阶相关性，而经篡改后的非自然信号，会引入了非线性，从而导致高阶相关性的增强；因此，可W利用双谱分析检测=阶相关性强弱的方法来检验音频信号有没有被篡改。《基于帖偏移的数字音频篡改取证[C].第10届ACM多媒体安全会议，牛津大学，2008: 21-26》文献中，Yang等人提出了一种检测MP3文件篡改的方法，文献中首先分析了 MP3的编解码过程，指出由于语音信号是W帖为单位进行编码的，在编码之后每一帖都具有固定的帖偏移量，而篡改会破坏运种偏移，文献中通过检测帖偏移的不一致性进行篡改定位检测。《基于频谱分析的MP3音频比特率[C].第11届多媒体信息安全会议.2009:57-61》文献中，Brian提出了一种通过频谱分析检测MP3格式音频的真实比特率的方法，作者通过实验证实不同比特率的音乐的功率谱在16kHz至20kHz频带内呈现不同分布。如果将低比特率音乐转换成高比特率，其高频段内的功率谱依然会保持与原来低比特率相同的特性，因此提取16kHz至20曲Z高频段功率谱的有效特征，并经过SVM分类器进行分类，即可有效检测出待检测音乐的真实比特率。《数字音频录音分析电网频率[J].语言与法律的国际会议，2005,12(1) :63-76》文献中， Grigoras提出了利用电网频率化Iectric Network Frequen巧，ENF)对数字音频录音进行分析，他认为数字录音设备在拾取音频信息的同时，还记录了 50/60HZ的电网频率，并且ENF 只在50/60HZ上下随机波动；因此，篡改过的音频信号，它的ENF声谱图会存在不连续的特征。实验表明，在同一电网条件下，不同录音系统所记录的音频信号，ENF声谱图之间的差异非常小，并且不同时间记录的音频中的频率偏差不同；因此，可W通过电力公司建立相关 ENF库，进一步确定录制音频的正确时间。
[0005] 综上所述，尽管语音篡改检测在国内外已得到了较大的关注和发展，并取得了一定的研究成果，但是还存在不少问题，如基于MP3音频格式特点的篡改检测，在对高码率压缩的情况往往无法检测，对于录音设备和环境特征的篡改检测准确率还有较大的提高空间，特别是对录音设备来源的描述不够准确。造成了识别的准确率较低等问题，因此在研究 W上方面问题时都有较大的发展空间。

【发明内容】

[0006] 本发明所要解决的技术问题在于克服现有技术的缺陷而提供一种检测过程计算简单、能够检测高码率和检测准确度高的一种基于量化特性的语音篡改定位检测方法，拟解决MP3语音格式特点的篡改在高码率无法检测的情况，W及改善已有方法计算复杂的问题。
[0007] 本发明的技术问题通过W下技术方案实现：一种基于量化特性的语音篡改定位检测方法，其包括如下步骤：步骤一、选取给定的包含L个样本的语音信号X，将X划分为每帖1152个样本，每帖有50% 的重叠，因此一共宅
[.、、';.，又;, ^ 其中F表不lame3.99.5编码器中分帖和加窗函数挺作；步骤二、应用滤波器组和MDCT到每一帖，W获取其频谱系数
痒中说表示lame3.99.5编码器中滤波器组和MDCT，及,-表示第i帖的频谱，每帖包含576个频谱系数；
其中r素示提取每帖频谱系数中值为O和化户的个数，记为；步骤=、对的每一个频谱系数f
进行如下公式量化：
诉^满表示第策帖中第/个频谱系数，》表示量化的第策帖第j个频谱系数，用华i 表示第龙帖的量化频谱系数；步骤四、将获取的量化频谱系数::取，应用乐'函数获取每帖中值为O的个数记为好^，
并计算/,=如公Ci; 步骤五、最后计算
其中find函数表示策中值不等于加时返回索引值;好表示设置的阔值，在实验中设置为 4,也即表示返回没有连续出现4个值为O值的位置，其中设置检测时滑动框数量为6个单位，表示检测的精度在6/2帖的范围，也即检测误差为3帖，经过计算并最终确认语音文件的篡改定位。
[000引所述的语音篡改定位检测方法的正确检测率AR按照如下公式计算：
式中，
-虚警率为将未篡改的判断为篡改语音的比例； --漏检率为将篡改的认为是未篡改语音的比例。
[0009] 与现有技术相比，本发明主要是基于现有技术中帖偏移的MP3篡改定位检测算法进行的深入研究，并提出一种新的检测方法用于描述量化特性，运种检测方法无需进行帖偏移检测，故能避免计算帖偏移带来的计算复杂性，极大降低了计算的复杂度，同时还解决了帖偏移无法检测的高码率情况，实验结果表明运种检测方法具有较高的检测准确率。
【附图说明】
[0010] 图1为MP3编码流程图。
[0011] 图2为不同偏移时Ac-化的变化情况示意图。
[0012]图3为发生篡改时Ac-Qc的变化障况示意图。
[OOU]图4为不同码率下发生篡改时Ac-Qc的变化情况示意图。
[0014] 图5为两种方法在计算复杂度上区别的检测过程示意图。
【具体实施方式】
[0015] 下面将结合上述附图对本发明实施例再作详细说明。
[0016] -种基于量化特性的语音篡改定位检测方法，它是针对现有基于帖偏移的MP3篡改定位检测算

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王让定;陶表犁;严迪群;金超;周劲蕾;
技术所有人：宁波大学;
我是此专利的发明人

上一篇：一种弦乐器演奏音质自动判别方法
上一篇：基于声纹识别的录音文件分离方法及装置的制造方法