并行音频指纹检索方法

文档序号：6597996阅读：171来源：国知局

专利名称：并行音频指纹检索方法
技术领域：
本发明属于音频指纹检索技术领域，特别涉及一种通过并行计算机进行音频指纹
索引的检索方法。
背景技术：
随着网络的发展，音频节目呈海量增长之势，如何高效且有效地检索或监管音频内容成为一个重要的问题。音频指纹技术的出现为视频中音频内容的监管和检索提供了一种高效且有效的方法。音频指纹技术中的关键技术是(l)音频指纹的提取；和(2)音频指纹的检索。音频指纹的提取方法是否有效，直接决定了音频指纹检索的效率和精度；而音频指纹的检索系统则直接决定了整个音频指纹系统的效率和精度。在2002年的视觉信息最新进展国际会议上(Proceedings of Recent Advances in Visuallnformation Systems 2002) ， Oostveen和Kalker等人在《视频指纹的特征提取方法禾口数据库策略》(Feature Extraction and a Database Strategy for Video Fingerprinting)这篇文章中，提出了一种音频指纹特征提取方法，但是这种特征提取方法在实际使用中精度不高。另外，在索引方面，该文提出的数据库索引方案有几点不足(l) 候选的指纹文件没有进行过滤，这样会产生较大的、多余的计算量，影响索引的效率；(2) 若对每个候选指纹片段进行汉明(Hamming)距离计算的话，运算很大。

发明内容
本发明提供一种并行音频指纹检索方法，以提高音频指纹的检索效率。
为实现上述目的，本发明采用如下技术方案
—种并行音频指纹检索方法，包括以下步骤 1)音频指纹提取步骤对音频数据库中用户上传的音频文件进行音频指纹编码，提取音频文件指纹； 2)音频文件指纹打包步骤根据用户上传的时间先后顺序将音频文件指纹分成多个音频指纹包，并将该多个音频指纹包分布到多个并行计算的计算机1、2、……、n，每个计算机1、2、……、n分别对应其音频指纹包1、2、……、n; 3)并行检索步骤根据待检索音频文件的音频指纹及其指定的时间段，在具有对应时间段内的音频指纹包的计算机中进行并行计算的检索；
4)汇总并行计算检索的结果。进一步地，在所述步骤2)中，将所述多个音频指纹包均匀分布到多个并行计算的计算机上。进一步地，在所述步骤l)中，设音频指纹编码的总数为M个；在所述步骤2)中，对该M个音频指纹编码按用户上传时间顺序进行排序，每N个音频指纹编码打包成一个文件，得到M/N个音频指纹包；将该M/N个音频指纹包分别平均分布到n台并行计算的计算机上。
进一步地，所述步骤3)中，还包括一对待检索音频文件的音频指纹提取步骤。
本发明通过将音音频文件指纹按时间排序打包发送至并行计算的计算机中，进行音频和音频指纹的检索，减少了不必要的计算量，大大提高了指纹检索的速度和效率。

图1为本发明并行音频指纹检索方法实施例的流程图；
图2为本发明并行音频指纹检索方法实施例的检索流程图。
具体实施例方式
如图1所示，一种并行音频指纹检索方法，包括以下步骤 1)音频指纹提取步骤对音频数据库中用户上传的音频文件进行音频指纹编码，提取音频文件指纹； 2)音频文件指纹打包步骤根据音频文件的时间先后顺序将音频文件指纹分成多个音频指纹包，并将该多个音频指纹包分布到多个并行计算的计算机1、2、……、n，每个计算机1、2、……、n分别对应其音频指纹包1、2、……、n; 3)并行检索步骤根据待检索音频文件的音频指纹及其指定的时间段，在具有对应时间段内的音频指纹包的计算机中进行并行计算的检索；
4)汇总并行计算检索的结果。其中，在所述步骤2)中，将所述多个音频指纹包均匀分布到多个并行计算的计算机上。其中，在所述步骤l)中，设音频指纹编码的总数为M个；在所述步骤2)中，对该 M个音频指纹编码按用户上传时间顺序进行排序，每N个音频指纹编码打包成一个文件，得到M/N个音频指纹包；将该M/N个音频指纹包分别平均分布到n台并行计算的计算机上。
其中，在所述步骤3)中，还包括一对待检索音频文件的音频指纹提取步骤。即对用户上传待检索的音频文件，在提取其音频指指纹后，根据用户指定的时间段进行检索。
如图2所示，假设待检索音频文件的音频指纹指定的时间段为K，而落在该时间段内的音频指纹包的计算机为计算机K1至计算机K2(1 < Kl < K2 < n)，则此时只需要在计算机Kl至计算机K2的音频指纹库中进行并行计算检索，而无需在计算机1至K2和计算机 K2至n中检索，有效提高了检索的速度和效率。本发明中并行计算的计算机是指多台可以同时进行计算的计算机。每台计算机上包含一个或者多个音频或音频指纹包，并可运行一个或者多个指纹包来进行匹配检索。
以上所述的实施例仅用于说明本发明的技术思想及特点，其目的在使本领域内的技术人员能够了解本发明的内容并据以实施，当不能仅以本实施例来限定本发明的专利范围，即凡依本发明所揭示的精神所作的同等变化或修饰，仍落在本发明的专利范围内。
权利要求
一种并行音频指纹检索方法，其特征在于包括以下步骤1)音频指纹提取步骤对音频数据库中用户上传的音频文件进行音频指纹编码，提取音频文件指纹；2)音频文件指纹打包步骤根据用户上传的时间先后顺序将音频文件指纹分成多个音频指纹包，并将该多个音频指纹包分布到多个并行计算的计算机1、2、……、n，每个计算机1、2、……、n分别对应其音频指纹包1、2、……、n；3)并行检索步骤根据待检索音频文件的音频指纹及其指定的时间段，在具有对应时间段内的音频指纹包的计算机中进行并行计算的检索；4)汇总并行计算检索的结果。
2. 根据权利要求1所述的并行音频指纹检索方法，其特征在于在所述步骤2)中，将所述多个音频指纹包均匀分布到多个并行计算的计算机上。
3. 根据权利要求2所述的并行音频指纹检索方法，其特征在于在所述步骤l)中，设音频指纹编码的总数为M个；在所述步骤2)中，对该M个音频指纹编码按用户上传时间顺序进行排序，每N个音频指纹编码打包成一个文件，得到M/N个音频指纹包；将该M/N个音频指纹包分别平均分布到n台并行计算的计算机上。
4. 根据权利要求1至3中任一权利要求所述的并行音频指纹检索方法，其特征在于所述步骤3)中，还包括一对待检索音频文件的音频指纹提取步骤。
全文摘要
并行音频指纹检索方法，包括，1)音频指纹提取步骤对音频数据库中用户上传的音频文件进行音频指纹编码，提取音频文件指纹；2)音频文件指纹打包步骤根据用户上传的时间先后顺序将音频文件指纹分成多个音频指纹包，并将该多个音频指纹包分布到多个并行计算的计算机；3)并行检索步骤根据待检索音频文件的音频指纹及其指定的时间段，在具有对应时间段内的音频指纹包的计算机中进行并行计算的检索；4)汇总并行计算检索的结果。本发明通过将音频文件指纹按时间排序打包发送至并行计算的计算机中，进行音频和音频指纹的检索，减少了不必要的计算量，大大提高了指纹检索的速度和效率。
文档编号G06F17/30GK101777075SQ20101010644
公开日2010年7月14日申请日期2010年2月5日优先权日2010年2月5日
发明者连惠城申请人:上海全土豆网络科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：连惠城
技术所有人：上海全土豆网络科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。