一种视频会议实时音频防篡改水印嵌入、检测方法及装置与流程

文档序号：42646879发布日期：2025-08-05 18:32阅读：52来源：国知局

本发明涉及数字音频水印，特别是涉及一种视频会议实时音频防篡改水印嵌入、检测方法及装置。

背景技术：

1、随着视频会议的普及，会议内容的安全性日益重要。攻击者可能通过arp欺骗、dns劫持或路由劫持，将自己插入会议终端与服务器之间的通信链路，实现双向数据窃听，进而通过语音克隆技术冒充参会者发言或篡改会议关键音频内容进行欺诈。因此，亟需一种能够实时嵌入和检测的音频水印技术，在音频被篡改时及时告警。

2、现有音频水印技术主要分为时域水印和频域水印两类：

3、1.时域水印：通过修改采样点幅度嵌入水印，计算速度快但鲁棒性差，易受压缩和噪声影响；

4、2.频域水印：通常在离散余弦变换（dct）、小波变换域嵌入，鲁棒性较好，但多用于音频文件的嵌入与提取，未考虑到实时音频通讯场景下的压缩、重采样、丢包造成的水印失真问题。

5、现有音频水印技术存在以下问题：

6、1.同步困难：水印检测需要精确的起始位置，大部分现有方法对音频裁剪和位移敏感；

7、2.鲁棒性不足：在低码率压缩（如256kbps）下，水印提取准确率显著下降；因网络延迟、音视频同步造成的丢包也会造成误检，难以应用在对准确率要求极高的视频会议防篡改场景。

8、有鉴于此，特提出本发明。

技术实现思路

1、本发明解决的技术问题是：克服现有技术的不足，提出一种视频会议实时音频防篡改水印嵌入、水印检测方法及装置。所述视频会议实时音频防篡改水印嵌入方法，包括：将音频信号等分为多个音频帧，每帧分为两个子帧并进行dct；选取中频频段，通过修改所述子帧中频系数的奇异值关系嵌入水印比特；所述视频会议实时音频防篡改水印检测方法，包括：通过分析对应频段的系数比值进行加权投票决策，并结合同步搜索机制确定水印信息的起始位置。能够实时处理音频流，在保证高音质的同时，具有抗压缩、抗丢包、抗重采样等鲁棒性，在256kbps及以上音频传输率下检测准确率超过99.99%。

2、本发明第一实施例介绍一种视频会议实时音频防篡改水印嵌入方法，包括：

3、s11.对输入音频信号f取峰值绝对值，预设阈值t1，当所述峰值绝对值＜所述阈值t1时，跳过水印嵌入；当所述峰值绝对值≥所述阈值t1时，将所述音频信号f等分为j个音频帧ft，其中j是二进制水印序列w的信息长度，t，j∈n+，t≤j；

4、s12.将所述音频帧ft等分为两个子帧ft1，ft2，对所述两个子帧分别进行dct得到频域系数；

5、s13.根据采样率自适应计算所述两个子帧的dct频域系数的中频范围起点b，对所述两个子帧分别取n个连续中频系数 l 1i、 l 2i，其中b，i，n∈n+， 3≤n≤7，i≤n；

6、s14.修改所述两个子帧中频系数的奇异值关系调整所述中频系数得到两个新子帧，若bitt=0，修改所述中频系数 l 2i使，若bitt=1，修改所述中频系数 l 2i使，其中bitt是所述水印序列w的比特值，为水印嵌入强度因子；

7、s15.对所述两个新子帧进行idct合并得到含水印音频帧，将所述含水印音频帧按时序合并得到含水印音频信号。

8、本发明第二实施例介绍一种视频会议实时音频防篡改水印检测方法，基于第一实施例，包括：

9、s21.从实时音频流中按照所述音频信号f采样点数m的2倍采样得到音频信号f1，其中m∈n+；

10、s22.对所述音频信号f1取峰值绝对值，当所述峰值绝对值＜所述阈值t1时，跳过水印检测；当所述峰值绝对值≥所述阈值t1时，对所述音频信号f1进行同步检测确定候选水印序列w1的起始采样点，包括：

11、a.记所述音频信号f1的采样点序列示意图为|0|1|2|...|k|k+1|...|k+1023|...|2m|，选择偏移位k作为是候选水印序列w1的起始采样点；

12、b.计算所述音频信号f的音频帧ft的采样点数m=m/j；

13、c.记所述子帧ft1选取的连续n个中频系数： l 11 、l 12 、l 13 、… 、l 1i 、…、 l 1n，所述子帧ft2选取的连续n个中频系数： l 21 、l 22 、l 23 、… 、l 2i 、…、 l 2n，计算所述音频帧ft编码相同的频段数量pt、一致性得分qt，所述j个音频帧的一致性得分平均值q，其中

14、；

15、其中qi为水印提取得分，为权重因子，t2为预设检测阈值；

16、d.遍历偏移位k，记一致性得分平均值q排名前r的信息列为{qr、kr、w1r}，其中kr、w1r为对应的偏移位和候选水印序列，将所述候选水印序列w1r右移s位后得到水印序列w2r，计算所述水印序列w2r与所述水印序列w的汉明距离，选择最小汉明距离对应的偏移位kr作为同步采样点，则所述起始采样点；

17、预设阈值t3，若所述最小汉明距离＜所述阈值t3，则同步成功并记录所述起始采样点k，继续s23-s24；若所述最小汉明距离≥所述阈值t3，则同步失败返回s21重新开始；

18、s23.从实时音频流中按照采样点数2m采样得到音频信号f2，以所述起始采样点k为起点对所述音频信号f2按采样点数m采样得到音频信号f3，对所述音频信号f3提取水印得到水印序列w’，包括：

19、a.将所述音频信号f3等分为j个音频帧，并对所述音频帧进行dct；

20、b.将所述音频帧等分为两个子帧，并对所述两个子帧分别进行dct得到频域系数；

21、c.分别提取所述两个子帧的中频系数，其中所述中频系数的中频范围与所述水印序列w嵌入时的中频范围相同；

22、d.计算所述两个子帧的中频系数的比值，使用加权投票方式确定水印比特bitt1，得到水印序列w’，其中t1∈n+，t1≤j，当qt≥3.5，bitt1=1，当qt＜3.5，bitt1=0；

23、s24.计算所述水印序列w’与所述水印序列w的汉明距离，当所述汉明距离＜所述阈值t3，水印验证通过，即所述音频信号f1未被篡改；当连续x次所述汉明距离≥所述阈值t3，水印验证未通过，即所述音频信号f1已被篡改发出告警提示。

24、本发明第三实施例介绍一种视频会议实时音频防篡改水印嵌入装置，基于第一实施例，包括：

25、d11分帧模块，对输入音频信号f取峰值绝对值，预设阈值t1，当所述峰值绝对值＜所述阈值t1时，跳过水印嵌入；当所述峰值绝对值≥所述阈值t1时，将所述音频信号f等分为j个音频帧ft，其中j是二进制水印序列w的信息长度，t，j∈n+，t≤j；

26、d12 dct模块，将所述音频帧ft等分为两个子帧ft1，ft2，对所述两个子帧分别进行dct得到频域系数；

27、d13系数选择模块，根据采样率自适应计算所述两个子帧的dct频域系数的中频范围起点b，对所述两个子帧分别取n个连续中频系数 l 1i、 l 2i，其中b，i，n∈n+， 3≤n≤7，i≤n；

28、d14系数修改模块，修改所述两个子帧中频系数的奇异值关系调整所述中频系数得到两个新子帧，若bitt=0，修改所述中频系数 l 2i使，若bitt=1，修改所述中频系数 l 2i使，其中bitt是所述水印序列w的比特值，为水印嵌入强度因子；

29、d15音频输出模块，对所述两个新子帧进行idct合并得到含水印音频帧，将所述含水印音频帧按时序合并得到含水印音频信号。

30、本发明第四实施例介绍一种视频会议实时音频防篡改水印检测装置，基于第一实施例，包括：

31、d21预处理模块，从实时音频流中按照所述音频信号f采样点数m的2倍采样得到音频信号f1，其中m∈n+；

32、d22同步检测模块，对所述音频信号f1取峰值绝对值，当所述峰值绝对值＜所述阈值t1时，跳过水印检测；当所述峰值绝对值≥所述阈值t1时，对所述音频信号f1进行同步检测确定候选水印序列w1的起始采样点，包括：

33、a.记所述音频信号f1的采样点序列示意图为|0|1|2|...|k|k+1|...|k+1023|...|2m|，选择偏移位k作为是候选水印序列w1的起始采样点；

34、b.计算所述音频信号f的音频帧ft的采样点数m=m/j；

35、c.记所述子帧ft1选取的连续n个中频系数： l 11 、l 12 、l 13 、… 、l 1i 、…、 l 1n，所述子帧ft2选取的连续n个中频系数： l 21 、l 22 、l 23 、… 、l 2i 、…、 l 2n，计算所述音频帧ft编码相同的频段数量pt、一致性得分qt，所述j个音频帧的一致性得分平均值q，其中

36、；

37、其中qi为水印提取得分，为权重因子，t2为预设检测阈值；

38、d.遍历偏移位k，记一致性得分平均值q排名前r的信息列为{qr、kr、w1r}，其中kr、w1r为对应的偏移位和候选水印序列，将所述候选水印序列w1r右移s位后得到水印序列w2r，计算所述水印序列w2r与所述水印序列w的汉明距离，选择最小汉明距离对应的偏移位kr作为同步采样点，则所述起始采样点；

39、预设阈值t3，若所述最小汉明距离＜所述阈值t3，则同步成功并记录所述起始采样点k，继续s23-s24；若所述最小汉明距离≥所述阈值t3，则同步失败返回s21重新开始；

40、d23水印提取模块，从实时音频流中按照采样点数2m采样得到音频信号f2，以所述起始采样点k为起点对所述音频信号f2按采样点数m采样得到音频信号f3，对所述音频信号f3提取水印得到水印序列w’，包括：

41、a.将所述音频信号f3等分为j个音频帧，并对所述音频帧进行dct；

42、b.将所述音频帧等分为两个子帧，并对所述两个子帧分别进行dct得到频域系数；

43、c.分别提取所述两个子帧的中频系数，其中所述中频系数的中频范围与所述水印序列w嵌入时的中频范围相同；

44、d.计算所述两个子帧的中频系数的比值，使用加权投票方式确定水印比特bitt1，得到水印序列w’，其中t1∈n+，t1≤j，当qt≥3.5，bitt1=1，当qt＜3.5，bitt1=0；

45、d24验证告警模块，计算所述水印序列w’与所述水印序列w的汉明距离，当所述汉明距离＜所述阈值t3，水印验证通过，即所述音频信号f1未被篡改；当连续x次所述汉明距离≥所述阈值t3，水印验证未通过，即所述音频信号f1已被篡改发出告警提示。

46、本技术实施例还提供一种计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令用于执行上述任一项所述的实现的一种视频会议实时音频防篡改水印嵌入方法或一种视频会议实时音频防篡改水印检测方法的步骤。

47、本技术实施例又提供一种实现音频水印的设备，包括存储器和处理器，其中，存储器中存储有以下可被处理器执行的指令：用于执行上述任一项所述的一种视频会议实时音频防篡改水印嵌入方法的步骤或一种视频会议实时音频防篡改水印检测方法的步骤。

48、相比于现有技术，本发明的有益效果是：

49、多频段联合嵌入与同步机制：通过多个中频系数同时嵌入同一水印比特，并利用多频段检测结果的一致性作为同步依据，解决了实时音频流的水印同步难题；

50、自适应频段选择：根据自适应采样率动态调整中频范围，确保不同采样率下均能选取最佳频段，提升抗重采样能力；

51、加权投票检测算法：对多个dct中频系数按频率从低到高赋予递减权重，偏低频系数权重更高，增强抗压缩能力。

当前第1页1 2

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张志翔,李光辉
技术所有人：合肥高维数据技术有限公司
我是此专利的发明人

上一篇：一种多组空气净化装置的循环扇的制作方法
下一篇：一种记录宠物进食效果的视频喂食器的制作方法

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！