一种基于音频特征码识别技术的音频文件管理方法和系统的制作方法

文档序号:6558344阅读:157来源:国知局
专利名称:一种基于音频特征码识别技术的音频文件管理方法和系统的制作方法
技术领域
本发明涉及一种计算机音频文件管理技术和系统,尤其涉及到一种计算机音频文件音频特征码识别技术以及基于音频特征识别技术的音频文件管理方法和系统。
背景技术
随着mp3等计算机数字音频文件的流行,如何在个人计算机上有效的管理成百上千的音频文件成为了一个亟待解决的问题。目前,一些媒体播放器(例如windows media player等)以及一些mp3播放器附带的随机软件(如iTune)等实现了一些音频文件分类管理功能,但是,上述这些音频文件管理软件在获取音频文件信息时是基于音频文件本身附带的元数据(tag数据),tag数据无法保证正确性及完整性。
所以,我们提出了基于音频文件本身的音频特征识别的音频文件管理方法和系统,利用先进的音频特征码技术,更准确地识别音频文件,帮助用户管理数字音频文件。

发明内容
针对现有音频文件管理软件管理方法的局限性,提出更准确的识别用户的数字音频文件的方法,并在此基础上实现完善的音频文件管理功能。
为达到上述的发明目的,本发明采用的技术方案如下一种基于音频特征码识别技术的音频文件管理方法,包括以下步骤步骤一、于服务器端创建一套音频文件库MDB;
步骤二、为音频文件库MDB中的每首音频文件采用音频特征码算法计算音频特征码FP;步骤三、把求出的所有音频特征码FP通过音频特征码索引算法建立音频特征码数据库FPDB;步骤四、在服务器端根据接收到的检索指令结合音频特征码数据库FPDB对音频文件进行检索识别;步骤五、在客户端机器上进行音频文件扫描,对扫描到的音频文件歌曲进行识别;步骤六、将扫描识别后的结果存储于本地音频文件库LMDB;步骤七、在本地音频文件库LMDB的基础上进行音频文件分类,专辑补全等管理。
进一步,在步骤一中,所述音频文件库MDB中的每首歌曲均包含歌曲的部分音频信息,所述部分音频信息是包括采用不同压缩算法的歌曲文件mp3、wma片断或未经压缩的原始音频文件片断。
再进一步,步骤一中,所述音频文件库MDB中的每首歌曲包括音频文件元数据,所述音频文件元数据包括准确的歌手、专辑信息。
步骤二中,所述音频特征码算法步骤如下步骤21、将音频文件片段解压缩成原始音频信息,得到音频文件的时域抽样序列;步骤22、将音频文件的时域抽样分成n个重叠的帧Frame;步骤23、对每个Frame的音频时域抽样进行傅立叶变换映射到频域;步骤24、将频域数据分成m个频段后计算每个频段的能量值;步骤25、对相邻帧的m个频段能量值进行比较,升高取1,降低取0从而生成一个包含m个二进制位的整数;步骤26、对所有的相邻帧重复进行步骤25所描述的频段能量比较,得到n个包含m个二进制位的整数,作为本歌曲的音频特征码FP。
步骤三中,所述音频特征码索引算法采用为歌曲音频特征码FP中的每个整数特征码建立HASH索引,并在HASH算法的基础上建立音频特征码数据库FPDB。在步骤(3)中,采用的算法是为歌曲FP中的每个整数特征码建立HASH索引,在HASH算法的基础上建立FPDB。
步骤四中,在FPDB的基础上,采用apache web server插件的方式运行音频文件检索识别服务程序。为了提高效率,采用了检索识别缓存服务(cache server)。
在步骤五和步骤六中,客户端程序扫描用户本地的磁盘,对扫描出的音频文件采用与步骤二中的音频特征码算法计算音频特征码FP,并通过HTTP协议发送到识别服务器进行音频文件识别,并将结果写入本地数据库LMDB。
在步骤七中,在本地音频文件库LMDB的基础上实现包括本地音频文件分类整理、本地音频文件查询、补全专辑、歌单管理、新歌下载管理的操作。
本发明还公开了一种基于音频特征码识别技术的音频文件管理系统,包括服务器端和客户端,其特征在于服务器端包括音频文件库MDB、音频特征码库FPDB、检索识别引擎和web服务器插件;客户端包括本地音频文件扫描单元、本地音频文件库LMDB和音频文件管理单元;所述位于服务器端的音频文件库MDB中的音频文件经过音频特征码算法处理后传送至音频特征码库,经过检索识别服务器或检索识别缓存服务器的处理后,通过web服务器插件上载到web服务器,并最终传送至客户端经过本地音频文件扫描单元扫描后,经过本地音频文件库LMDB处理后由音频文件管理单元进行管理。
进一步,所述一种基于音频特征码识别技术的音频文件管理系统中;所述检索识别引擎包括检索识别服务器和检索识别缓存服务器;所述web服务器插件包括音频文件识别插件。
所述音频文件库MDB为Music DataBase;所述音频特征码FP为FingerPring;所述音频特征码数据库FPDB为FingerPringDataBase;所述本地音频文件库LMDB为Local Music DataBase;本发明的有益效果在于本发明通过先进的音频特征码检索识别技术,准确的识别音频文件,并在此基础上管理用户计算机上的数字音频文件,使用户电脑上的音频文件井井有条,给电脑音频文件爱好者带来了极大的便利。


附图1是本发明所述的一种基于音频特征码识别技术的音频文件管理方法工作流程图;附图2是本发明所述的一种基于音频特征码识别技术的音频文件管理方法中关于音频特征码算法的流程图;附图3是本发明所述的一种基于音频特征码识别技术的音频文件管理系统的实施例。
具体实施例方式附图1是本发明所述的一种基于音频特征码识别技术的音频文件管理方法工作流程图。本发明包括如下步骤在流程101中,于服务器端创建一套音频文件库Music DataBase(简称MDB);进入流程102后,为音频文件库MDB中的每首音频文件执行采用音频特征码算法计算音频特征码FingerPring(简称FP);随后进入流程103,将所求出所有音频特征码FP通过音频特征码索引算法建立音频特征码数据库FPDB;在流程104中,于服务器端根据接受到的检索指令结合音频特征码数据库FPDB对音频文件进行检索识别;105流程中,于客户端机器上进行音频文件扫描,对扫描到的音频文件歌曲进行识别;随后到流程106中,将扫描识别后的结果存储于本地音频文件库LMDB;最后进入流程107,在本地音频文件库LMDB的基础上进行音频文件分类、专辑补全等音频文件管理操作。
附图2是本发明所述的一种基于音频特征码识别技术的音频文件管理方法中关于音频特征码算法的流程图。所述音频特征码算法包括如下步骤流程201中,将音频文件片段解压缩成原始音频信息,得到音频文件的时域抽样序列;流程202中,将音频文件的时域抽样分成256个重叠的帧Frame;流程203中,对每个帧Frame的音频时域抽样进行傅立叶变换映射到频域;流程204中,将频域数据分成32个频段后计算每个频段的能量值,流程205中,对相邻帧的32个频段能量值进行比较,如果升高取1,降低则取0从而进入流程206生成一个包含32个二进制位的整数;最后,对所有的相邻帧重复进行步骤25所描述的频段能量比较,得到256个包含32个二进制位的整数,作为本歌曲的音频特征码FP。
附图3是本发明所述的一种基于音频特征码识别技术的音频文件管理系统的实施例。如图所示,本发明所述系统包括服务器端1和客户端8,其特征在于,服务器端1包括音频文件库MDB 2、音频特征码库FPDB 3、音频文件检索识别引擎7以及音频文件识别插件6,本实施例中,所述音频文件检索识别引擎7还包括检索识别服务器4和检索识别缓存服务器5。所述检索识别服务器4用于执行音频特征码检索操作,所述检索识别缓存服务器5用于对音频文件进行缓存,提高检索性能。所述客户端8包括本地音频文件扫描单元11、本地音频文件库LMDB 9和音频文件管理单元10。所述服务器端1与客户端8之间采用HTTP协议通过互联网通讯。
所述检索识别服务器4用于执行音频特征码检索操作;所述检索识别缓存服务器5用于对音频文件进行缓存,提高检索性能所述Web服务器插件负责接受用户检索请求,并转发给检索识别服务器4或检索识别缓存服务器5。
所述客户端8的音频文件管理系统主要由本机音频文件管理单元10执行,包括执行音频文件分类管理,曲库补全,热歌速递等功能。
本地音频文件扫描识别单元11扫描本地硬盘上的音频文件并访问检索识别服务,生成本地音频文件库,在本地音频文件库LMDB 9的基础上,实现本地音频文件分类整理,本地音频文件查询,补全专辑,歌单管理,新歌下载等多项管理功能。
上述具体实施例仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种基于音频特征码识别技术的音频文件管理方法,包括以下步骤步骤一、于服务器端创建一套音频文件库MDB;步骤二、为音频文件库MDB中的每首音频文件采用音频特征码算法计算音频特征码FP;步骤三、把求出的所有音频特征码FP通过音频特征码索引算法建立音频特征码数据库FPDB;步骤四、在服务器端根据接收到的检索指令结合音频特征码数据库FPDB对音频文件进行检索识别;步骤五、在客户端机器上进行音频文件扫描,对扫描到的音频文件歌曲进行识别;步骤六、将扫描识别后的结果存储于本地音频文件库LMDB;步骤七、在本地音频文件库LMDB的基础上进行音频文件分类,专辑补全等管理。
2.如权利要求2所述的一种基于音频特征码识别技术的音频文件管理方法,其特征在于,步骤一中,所述音频文件库MDB中的每首歌曲均包含歌曲的部分音频信息,所述部分音频信息是包括采用不同压缩算法的歌曲文件mp3、wma片断或未经压缩的原始音频文件片断。
3.如权利要求1所述的一种基于音频特征码识别技术的音频文件管理方法,其特征在于步骤一中,所述音频文件库MDB中的每首歌曲包括音频文件元数据,所述音频文件元数据包括准确的歌手、专辑信息。
4.如权利要求1所述的一种基于音频特征码识别技术的音频文件管理方法,其特征在于步骤二中,所述音频特征码算法步骤如下步骤21、将音频文件片段解压缩成原始音频信息,得到音频文件的时域抽样序列;步骤22、将音频文件的时域抽样分成n个重叠的帧Frame,;步骤23、对每个Frame的音频时域抽样进行傅立叶变换映射到频域;步骤24、将频域数据分成m个频段后计算每个频段的能量值;步骤25、对相邻帧的m个频段能量值进行比较,升高取1,降低取0从而生成一个包含m个二进制位的整数;步骤26、对所有的相邻帧重复进行步骤25所描述的频段能量比较,得到n个包含m个二进制位的整数,作为本歌曲的音频特征码FP。
5.如权利要求1所述的一种基于音频特征码识别技术的音频文件管理方法,其特征在于步骤三中,所述音频特征码索引算法采用为歌曲音频特征码FP中的每个整数特征码建立HASH索引,并在HASH算法的基础上建立音频特征码数据库FPDB。
6.如权利要求1所述的一种基于音频特征码识别技术的音频文件管理方法,其特征在于步骤四中,在FPDB的基础上,采用apache web server插件的方式运行音频文件检索识别服务程序。
7.如权利要求1或6所述的一种基于音频特征码识别技术的音频文件管理方法,其特征在于采用检索识别缓存服务cache server。
8.如权利要求1所述的一种基于音频特征码识别技术的音频文件管理方法,其特征在于在步骤五和步骤六中,客户端程序扫描用户本地的磁盘,对扫描出的音频文件采用与步骤二中的音频特征码算法计算音频特征码FP,并通过HTTP协议发送到识别服务器进行音频文件识别,并将结果写入本地数据库LMDB。
9.如权利要求1、2、3、4、5、6或8所述的一种基于音频特征码识别技术的音频文件管理方法,其特征在于在步骤七中,在本地音频文件库LMDB的基础上实现包括本地音频文件分类整理、本地音频文件查询、补全专辑、歌单管理、新歌下载管理的操作。
10.一种基于音频特征码识别技术的音频文件管理系统,包括服务器端和客户端,其特征在于服务器端包括音频文件库MDB、音频特征码库FPDB、检索识别引擎和web服务器插件;客户端包括本地音频文件扫描单元、本地音频文件库LMDB和音频文件管理单元;所述位于服务器端的音频文件库MDB中的音频文件经过音频特征码算法处理后传送至音频特征码库,经过检索识别服务器或检索识别缓存服务器的处理后,通过web服务器插件上载到web服务器,并最终传送至客户端经过本地音频文件扫描单元扫描后,经过本地音频文件库LMDB处理后由音频文件管理单元进行管理。
11.一种基于音频特征码识别技术的音频文件管理系统,其特征在于,所述检索识别引擎包括检索识别服务器和检索识别缓存服务器。
12.一种基于音频特征码识别技术的音频文件管理系统,其特征在于,所述web服务器插件包括音频文件识别插件。
全文摘要
本发明公开了一种基于音频特征码识别技术的音频文件管理方法和系统。目前的媒体播放器(如windows media player等)以及mp3播放器附带的随机软件(如iTune)等音频文件管理软件在获取音频文件信息时是基于音频文件本身附带的元数据(tag数据),无法保证音频文件元数据的正确性及完整性。为此,本发明提出了一种基于音频文件本身的音频特征识别的音频文件管理方法和系统,通过音频特征码算法为歌曲库中的每首歌曲计算音频特征码(音频特征码),利用音频特征码索引技术为所述音频特征码建立数据库,提供音频文件识别检索服务。所述系统在客户端扫描本地歌曲文件,以音频特征码识别技术为基础,实现音频文件分类整理,本地专辑补全等管理功能,使得用户能够实现对音频文件科学有序的管理。
文档编号G06F17/30GK101063970SQ20061007639
公开日2007年10月31日 申请日期2006年4月24日 优先权日2006年4月24日
发明者周欣, 程兆炜, 沈坚 申请人:亿览在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1