验证方法和系统的制作方法_2

文档序号：9474034阅读：来源：国知局

一阶平滑作为参考，得到谱熵的门限ETH，即：
[0057] Enoise(k) = a EEnoise(k-l) + (l-a E)E(k)
[0058] ETH = Y E (k) · Enolse (k)
[0059] 其中，a E为平滑因子，YE(k)为偏差修补因子。
[0060] 对于原始音频的每一语音帧，需要计算其对数似然比和谱熵的门限，当对数似然比大于预设的第一阈值，且谱熵的门限大于预设的第二阈值时，则判定为语音帧，否则为非语音帧，从而区分出语音段和静音段。
[0061] 步骤324,对语音段的语音进行离散余弦变换。
[0062] 具体的，可采用如下公式对语音段的语音进行改进的离散余弦变换（MDCT变换）：
[0064] 其中，s(n)表不原始语音信号，N表不一帧语音信号的长度，k表不一帧语音信号内的频点，uk表示窗函数，一般指哈明窗。
[0065] 步骤334,对二值图像进行降维并置乱，得到置乱后的水印序列。
[0066] 二值图像可用一个矩阵表示，图像的像素值为矩阵内的值，像素值可以为0或1。如二值图像表示为W = w(i，j)，0 < KMd 0 < j〈M2，其中，表示矩阵的行数，M2表示矩阵的列数。
[0067] 由于数字的原始音频是一维的，要将二值图像嵌入到一维的数字原始音频中，需对二值图像进行降维，转换为一维序列，如下式所示：
[0068] V = {v (k) = w (i，j)，0 < iXM" 0 < j〈M2, k = i XM2+j}
[0069] 通过降维处理，二值图像W中的像素用序列V中的第k个元素 v(k)表示。
[0070] 进一步的，为了消除序列V中相邻元素的相关性，提高嵌入水印的稳健性，采用线性反馈移位寄存器生成的伪随机序列对V中的所有元素作伪随机排序，如下式所示：
[0072] 通过伪随机排序，序列V中的第k'个元素移动到第k个元素的位置上，从而得到置乱后的水印序列。
[0073] 步骤344,在离散余弦变换域内确定中频系数，在中频系数上嵌入置乱后的水印序列。
[0074] 由于人耳的听觉特性，对高频信息不敏感，对低频信息敏感，为保证在听原始音频时不会听到水印，应尽量可能的将水印嵌入到低频系数中，同时，为了尽量不破坏原始音频的信息，则选取离散余弦变换域内的中频系数，即在D(k)内选取第πν个系数d(k) (mw)，作为中频系数，用于嵌入序列Vp中相应的元素 vp (k)。其中，D (k) = MDCT (A (k))，0彡k〈 XM2)， A (k)为原始数字语音信号（原始音频）。
[0075] 步骤354,将嵌入了置乱后的水印序列的数字的原始音频进行反向离散余弦变换，得到添加了水印的原始音频。
[0076] 具体的，对嵌入了水印序列的数字的原始音频进行反向改进的离散余弦变换 (IMDCT变换），得到加入了水印的原始音频，如下式所示：
[0078] 在一个实施例中，可对原始音频进行傅立叶变换到频域；采用最小控制递归平均算法（MCRA，Minima_controlled Recursive Averaging)对变换到频域的音频进行信噪比估计，得到音频的先验信噪比和后验信噪比。
[0079] 具体的，可按照如下算法计算得到先验信噪比和后验信噪比：
[0080] 本算法中，噪声功率谱估计是基于以下两个修正假设获得的：
[0083] 其中，表示语音存在段，噪声延续前一帧的结果不更新功率谱；表示语音不存在段，语音噪声成分较多，这时更新噪声。
[0084] 具体的，信噪比估计的过程包括：
[0085] 1)计算平滑含噪功率谱密度
[0086] 采用如下公式计算平滑含噪功率谱密度：
[0089] 其中，λ为||1 贞号，k为频点，a s为平滑因子，Lw为帖长，w⑴为哈明窗， Υ(λ，k_i) |2为含噪语音功率谱密度，Sf(A，k)为在频域内的平滑含噪功率谱密度。
[0090] 2)求取含噪功率谱密度的最小值
[0091] 按照如下算式求取含噪功率谱密度的最小值3_(\，1〇 :
[0092] if mod (λ /D) = 0
[0093] Smin ( λ，k) = min {Stmp ( λ -1，k)，S ( λ，k)}
[0094] Stmp ( λ，k) = S ( λ，k)
[0095] else
[0096] Smin ( λ，k) = min {Smin ( λ -1，k)，S ( λ，k)}
[0097] Stmp ( λ，k) = min {Stmp ( λ -1，k)，S ( λ，k)}
[0098] end
[0099] 其中，D为搜索窗口长度，为m对D的求模运算，Stnip(m)为当前搜索窗口中功率谱的最小值，S_(m)为各个搜索窗口中连续更新的功率谱的最小值。
[0100] 因此，当前帧含噪语音的功率值与此时功率谱最小值SJ λ，k)的比值可改写为：
[0102] 其中，S_( λ，k)为当前频点k处含噪语音功率谱的最小值。
[0103] 3)计算局部语音存在概率P ( λ，k)
[0104] 通过将&(λ，1〇与一设定阈值δ相比，可以得到当前分析帧中频点k处的局部语音存在概率P ( λ，k)，如以下算式所示：
[0105] if Sr ( λ , k) > δ
[0106] p = 1 speech present
[0107] else
[0108] p = 0 speech absent
[0109] end
[0110] 以上算式中，P即为Ρ(λ，k)。
[0111] 4)计算平滑因子
[0112] 采用以下公式计算平滑因子ad(A，k):
[0113] a d ( λ，k) = ct + (1_ ct ) P ( λ，k)
[0114] 其中，a为固定常数，反映了噪声段中前一帧噪声估计对当前帧噪声估计的影响。
[0115] 5)更新噪声功率谱密度(/U}
[0116] 按如下公式计算噪声功率谱密度

[0118] 其中，6(/U)为当前分析帧中频点k处的噪声功率谱密度，|Υ( λ，k) 12为含噪语音功率谱密度。
[0119] 6)计算信噪比估计值
[0120] 其中，后验信噪比计算为：
[0121 ] Y k = Yk/ 人 d (k)
[0122] 其中，λ d(k)为噪声功率谱密度，也就是$(/1，/：)，Yk为含噪语音功率谱密度，也就是 |Υ(λ，k) |2。
[0123] 先验信噪比4为：
[0125] 其中，0〈α〈1为权因子，尤1)为前一帧的振幅估计。
[0126] 本实施例中，由于选择离散余弦域内的中频系数嵌入水印，不仅不会影响用户对音频内容的理解，也不会影响原始音频中的信息。这种水印添加方法对数字信号的滤波、压缩和重采样等操作具有很强的稳健性，实现了快速且低成本的在音频中添加水印。
[0127] 如图5所示，在一个实施例中，检测待验证音频中的水印的步骤，包括：
[0128] 步骤214,获取待验证音频对应的原始音频。
[0129] 本实施例中，服务器获取都待验证音频和对应的原始音频的编号，根据该编号获取到原始音频。
[0130] 步骤224,对待验证音频和对应的原始音频进行离散余弦变换，得到离散余弦变换域内的待验证音频和原始音频。
[0131] 具体的，可按照如下公式对原始音频Α (原始数字语音信号）和待验证音频As (待检测的数字语音信号）分别做MDCT变换：
[0132] D = MDCT (A) = {D (k) = MDCT (A (k)), 0 ^ k< (Μ, X M2)}
[0133] Ds = MDCT (As) = {Ds (k) = MDCT (As (k))，0 彡 k〈 (Μ! X M2)}
[0134] 步骤234,在离散余弦变换域内抽取水印序列信息。
[0135] 在一个实施例中，步骤234具体为：将离散余弦变换域内的原始音频作为先验信息，根据离散余弦变换域内的待验证音频、离散余弦变换域内的原始音频和用于添加水印时被选中嵌入水印的中频系数，计算得到水印序列信息。
[0136] 具体的，按照如下公式抽取水印序列信息：
[0138] 其中，α是比例系数，用于控制中频系数的修改量，d(k) (mw)为被选中的用于嵌入水印的中频系数，
[0139] 步骤244,对水印序列信息归一化成二值形式。
[0140] 由于抽取的水印信息应该是二维的，因此需要将抽取的水印序列信息vsp (k)归一化成二值形式，即：
[0142] 步骤254,对二值形式的水印序列信息做逆排序，得到一维水印序列。
[0143] 具体的，对抽取的序列vsp (k)做伪随机序列逆排序，得到抽取的一维水印序列Vs，如下式：
[0144] Vs = InversePermute (Vsp) = {vs (k) = vsp (k'), 0 ^ k, k' < (Mj XM2)}
[0145] 步骤264,对一维水印序列做升维处理。
[0146] 由于添加到原始音频的水印是二维的，需要对一维水印序列做升维处理，将一维水印序列Vs转换为二维图像Ws，如下式：
[0147]

完整全部详细技术资料下载

当前第2页1 2 3