非负矩阵分解的音频感知哈希检索方法、装置、介质设备与流程

文档序号:38355339发布日期:2024-06-19 12:09阅读:105来源:国知局

本申请属于短距离无线通信,特别是涉及一种基于非负矩阵分解的音频感知哈希检索方法、装置、存储介质及设备。


背景技术:

1、随着网络和多媒体技术的迅速发展,网络上的多媒体信息的数量越来越多,如何从海量的信息中高效的检索出想要的信息显得尤为重要。多媒体信息中的音频信息是其中非常重要的一类,音频信息的检索技术受到越来越多的重视,是当前研究的热点。由于lc3编解码具有较低延迟、较高的音质和编码增益以及在蓝牙领域无专利费的技术优势,未来会有很多音频信息会以lc3格式存储或传输,如何高效的检索以lc3格式存储或传输的音频是一个急需解决的问题。

2、感知哈希(perceptual hash)是近年来出现的基于多媒体感知特征的鲁棒哈希技术。音频感知哈希算法通常分为感知特征提取和感知哈希建模。感知特征提取以人类感知模型为基础,分析提取音频对于各种内容保持操作的不变量,如分帧、滤波、降噪和编码压缩等,同时结合各种时频变换去除冗余信息,从而提取具有感知意义的特征参数。

3、目前主流的感知哈希方法通常基于时域的音频数据,研究音频编解码和感知特征提取的过程可知,两者存在相似的过程:时域到变换域的转换,而现实中很多数据是以压缩格式传输和存储的。以蓝牙领域为例,基于现有技术,其流程为:时域音频数据—编码—无线信道传输—解码—感知特征提取—哈希生成—哈希比对,在此流程的解码过程中,需要执行完整的解码过程,这会消耗较多的运算资源和存储资源。


技术实现思路

1、针对现有技术中存在的上述技术问题,本申请提供了一种基于非负矩阵分解的音频感知哈希检索方法、装置、存储介质及设备,在压缩域,通过与现有解码器相结合,对lc3音频码流执行部分解码,并使用非负矩阵分解生成感知哈希序列,从而节省了解码过程中占用的运算资源和存储资源,提高了音频检索的准确率和效率。

2、为了实现上述目的,本申请采用的第一个技术方案是:提供一种基于非负矩阵分解的音频感知哈希检索方法,包括:对一段lc3音频码流执行部分解码,得到每一帧lc3音频码流的谱系数;根据每一帧lc3音频码流的谱系数,得到每一帧lc3音频码流的感知特征;对感知特征执行非负矩阵分解,得到激活矩阵和编码矩阵;根据激活矩阵,生成lc3音频码流的感知哈希序列;以及将感知哈希序列与预存的哈希数据库中的哈希序列进行比对,判断是否检索到目标音频。

3、本申请采用的第二个技术方案是:提供一种基于非负矩阵分解的音频感知哈希检索装置,包括:用于对一段lc3音频码流执行部分解码,得到每一帧lc3音频码流的谱系数的模块;用于根据每一帧lc3音频码流的谱系数,得到每一帧lc3音频码流的感知特征的模块;用于对感知特征执行非负矩阵分解,得到激活矩阵和编码矩阵的模块;用于根据激活矩阵,生成lc3音频码流的感知哈希序列的模块;以及用于将感知哈希序列与预存的哈希数据库中的哈希序列进行比对,判断是否检索到目标音频的模块。

4、本申请采用的第三个技术方案是:提供一种计算机可读存储介质,其存储有计算机指令,其中计算机指令被操作以执行方案一中的基于非负矩阵分解的音频感知哈希检索方法。

5、本申请采用的第四个技术方案是:提供一种计算机设备,其包括处理器和存储器,存储器存储有计算机指令,其中处理器操作计算机指令以执行方案一中的基于非负矩阵分解的音频感知哈希检索方法。

6、本申请技术方案可以达到的有益效果是:本申请的技术方案既可以应用于低功耗蓝牙,也可以应用于经典蓝牙,在压缩域,通过与现有解码器相结合,对lc3音频码流执行部分解码,并使用非负矩阵分解生成感知哈希序列,从而节省了解码过程中占用的运算资源和存储资源,提高了音频检索的准确率和效率。



技术特征:

1.一种基于非负矩阵分解的音频感知哈希检索方法,其特征在于,包括:

2.如权利要求1所述的基于非负矩阵分解的音频感知哈希检索方法,其特征在于,所述对所述感知特征执行非负矩阵分解,包括:

3.如权利要求2所述的基于非负矩阵分解的音频感知哈希检索方法,其特征在于,所述根据每一帧所述lc3音频码流的感知特征,构建所述非负矩阵,包括:

4.如权利要求1所述的基于非负矩阵分解的音频感知哈希检索方法,其特征在于,所述根据所述激活矩阵,生成所述lc3音频码流的感知哈希序列,包括:

5.如权利要求1所述的基于非负矩阵分解的音频感知哈希检索方法,其特征在于,所述根据每一帧所述lc3音频码流的谱系数,得到每一帧所述lc3音频码流的感知特征,包括:

6.如权利要求1所述的基于非负矩阵分解的音频感知哈希检索方法,其特征在于,所述将所述感知哈希序列与预存的哈希数据库中的哈希序列进行比对,判断是否检索到目标音频,包括:

7.如权利要求1所述的基于非负矩阵分解的音频感知哈希检索方法,其特征在于,所述对一段lc3音频码流执行部分解码,包括:对所述lc3音频码流解码到完成频域噪声整形解码为止。

8.一种基于非负矩阵分解的音频感知哈希检索装置,其特征在于,包括:

9.一种计算机可读存储介质,其存储有计算机指令,其中所述计算机指令被操作以执行权利要求1-7任一项所述的基于非负矩阵分解的音频感知哈希检索方法。

10.一种计算机设备,其包括处理器和存储器,所述存储器存储有计算机指令,其中所述处理器操作所述计算机指令以执行权利要求1-7任一项所述的基于非负矩阵分解的音频感知哈希检索方法。


技术总结
本申请公开了一种基于非负矩阵分解的音频感知哈希检索方法、装置、存储介质及设备,属于短距离无线通信技术领域,该方法包括:对一段LC3音频码流执行部分解码,得到每一帧LC3音频码流的谱系数;根据每一帧LC3音频码流的谱系数,得到每一帧LC3音频码流的感知特征;对感知特征执行非负矩阵分解,得到激活矩阵和编码矩阵;根据激活矩阵,生成LC3音频码流的感知哈希序列;以及将感知哈希序列与预存的哈希数据库中的哈希序列进行比对,判断是否检索到目标音频。本申请在压缩域,通过与现有解码器相结合,对LC3音频码流执行部分解码,并使用非负矩阵分解生成感知哈希序列,从而节省了解码过程中占用的运算资源和存储资源,提高了音频检索的准确率和效率。

技术研发人员:李强,王凌志,叶东翔,朱勇
受保护的技术使用者:百瑞互联集成电路(上海)有限公司
技术研发日:
技术公布日:2024/6/18
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!
1