基于曲库的音乐文件的匹配方法及系统的制作方法

文档序号:6489630阅读:286来源:国知局
基于曲库的音乐文件的匹配方法及系统的制作方法
【专利摘要】本发明提出一种基于曲库的音乐文件的匹配方法及系统。其中,方法包括以下步骤:获得曲库中的多个音乐文件,其中,每个音乐文件包括歌曲名;分别根据每个音乐文件的歌曲名确定对应的音乐文件的多个索引信息;根据多个索引信息建立曲库中多个音乐文件的索引字典;接收新上传的音乐文件;根据新上传的音乐文件的歌曲名生成新上传的音乐文件的多个新索引信息;以及根据新上传的音乐文件的多个新索引信息与索引字典进行匹配,以判断新上传的音乐文件是否已存在于曲库之中。根据本发明实施例的方法,通过建立曲库中音乐文件的索引字典和新上传的音乐文件的索引,并在索引字典中匹配对应索引,因此提高了匹配的效率。
【专利说明】基于曲库的音乐文件的匹配方法及系统
【技术领域】
[0001]本发明涉及音乐文件的匹配【技术领域】,特别涉及一种基于曲库的音乐文件的匹配方法及系统。
【背景技术】
[0002]随着互联网技术以及文化产业的发展,可以非常方便的利用互联网获取这种信息,例如在曲库中匹配歌曲。
[0003]然而,在曲库设计早期,由于收集大量第三方曲目,因此聚集了大量质量参差不齐的歌曲信息,严重妨碍了版权覆盖率、曲库元数据KPI统计。
[0004]现有的解决方案是,根据歌曲和歌手直接进行基于编辑距离的相似度匹配返回匹配结果,并根据返回结果判断是否与曲库中的音乐文件相匹配。
[0005]现有技术的缺点:根据歌曲名和歌手直接确定编辑距离的相似度,在匹配过程中错误率比较高,同时无法识别同一歌手的译名和别名、同一汉字的拼音和数字的不同表达形式,进而降低了正确匹配的准确率。

【发明内容】

[0006]本发明的目的旨在至少解决上述的技术缺陷之一。
[0007]为达到上述目的,本发明一方面的实施例提出一种基于曲库的音乐文件的匹配方法,包括以下步骤:获得曲库中的多个音乐文件,其中,所述每个音乐文件包括歌曲名;分别根据所述每个音乐文件的歌曲名确定对应的音乐文件的多个索引信息,其中,所述多个索引信息分别针对所述歌曲名中的不同字段;根据所述多个索引信息建立所述曲库中所述多个音乐文件的索引字典;接收新上传的音乐文件,其中,所述新上传的音乐文件包括歌曲名;根据所述新上传的音乐文件的歌曲名生成所述新上传的音乐文件的多个新索引信息,其中,所述多个新索引信息分别针对所述新上传的音乐文件的歌曲名中的不同字段;以及根据所述新上传的音乐文件的多个新索引信息与所述索引字典进行匹配,以判断所述新上传的音乐文件是否已存在于所述曲库之中。
[0008]根据本发明实施例的基于曲库的音乐文件的匹配方法,通过建立曲库中音乐文件的索引字典和新上传的音乐文件的索引,并在索引字典中匹配对应索引,因此提高了匹配的准确性和匹配的效率。
[0009]为达到上述目的,本发明的实施例另一方面提出一种基于曲库的音乐文件的匹配系统,包括:第一获取模块,用于获得曲库中的多个音乐文件,其中,所述每个音乐文件包括歌曲名;确定模块,用于分别根据所述每个音乐文件的歌曲名确定对应的音乐文件的多个索引信息,其中,所述多个索引信息分别针对所述歌曲名中的不同字段;索引字典模块,用于根据所述多个索引信息建立所述曲库中所述多个音乐文件的索引字典;接收模块,用于接收新上传的音乐文件,其中,所述新上传的音乐文件包括歌曲名;索引生成模块,用于根据所述新上传的音乐文件的歌曲名生成所述新上传的音乐文件的多个新索引信息,其中,所述多个新索引信息分别针对所述新上传的音乐文件的歌曲名中的不同字段;以及第一匹配判断模块,用于根据所述新上传的音乐文件的多个新索引信息与所述索引字典进行匹配,以判断所述新上传的音乐文件是否已存在于所述曲库之中。
[0010]根据本发明实施例的基于曲库的音乐文件的匹配系统,通过建立曲库中音乐文件的索引字典和新上传的音乐文件的索引,并在索引字典中匹配对应索引,因此提高了匹配的效率。
[0011]本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
【专利附图】

【附图说明】
[0012]本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0013]图1为根据本发明一个实施例的基于曲库的音乐文件的匹配方法的流程图;
[0014]图2为根据本发明另一个实施例的基于曲库的音乐文件的匹配方法的流程图;
[0015]图3为根据本发明又一个实施例的基于曲库的音乐文件的匹配方法的流程图;
[0016]图4为根据本发明再一个实施例的基于曲库的音乐文件的匹配方法的流程图;
[0017]图5为根据本发明一个实施例的基于曲库的音乐文件的匹配系统的结构框图;
[0018]图6为根据本发明另一个实施例的基于曲库的音乐文件的匹配系统的结构框图;
[0019]图7为根据本发明又一个实施例的基于曲库的音乐文件的匹配系统的结构框图;以及
[0020]图8为根据本发明再一个实施例的基于曲库的音乐文件的匹配系统的结构框图。【具体实施方式】
[0021]下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
[0022]在本发明的描述中,需要理解的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0023]图1为本发明实施例的基于曲库的音乐文件的匹配方法的流程图。如图1所示,根据本发明实施例的基于曲库的音乐文件的匹配方法,包括以下步骤:
[0024]步骤SlOl,获得曲库中的多个音乐文件,其中,每个音乐文件包括歌曲名。
[0025]具体地,曲库中存放着很多音乐文件,并且每个音乐文件都包括相对应的歌曲名。通过获取曲库中的多个音乐文件,进而得到相应音乐文件对应的歌曲名。
[0026]步骤S102,分别根据每个音乐文件的歌曲名确定对应的音乐文件的多个索引信息,其中,多个索引信息分别针对歌曲名中的不同字段。
[0027]具体地,多个索引信息为音乐文件的歌曲名的头部索引信息、尾部索引信息、部分头部索引信息和部分尾部索引信息联合组成的索引信息。例如,曲库中歌曲信息为“原来的我-王杰”、“回乡的我-王建杰”和“原来的你-古巨基”时,对应的头部索引信息、尾部索引信息、部分头部索引信息和部分尾部索引信息联合组成的索引信息分别为如下表。
[0028]
【权利要求】
1.一种基于曲库的音乐文件的匹配方法,其特征在于,包括以下步骤: 获得曲库中的多个音乐文件,其中,所述每个音乐文件包括歌曲名; 分别根据所述每个音乐文件的歌曲名确定对应的音乐文件的多个索引信息,其中,所述多个索引信息分别针对所述歌曲名中的不同字段; 根据所述多个索引信息建立所述曲库中所述多个音乐文件的索引字典; 接收新上传的音乐文件,其中,所述新上传的音乐文件包括歌曲名; 根据所述新上传的音乐文件的歌曲名生成所述新上传的音乐文件的多个新索引信息,其中,所述多个新索引信息分别针对所述新上传的音乐文件的歌曲名中的不同字段;以及根据所述新上传的音乐文件的多个新索引信息与所述索引字典进行匹配,以判断所述新上传的音乐文件是否已存在于所述曲库之中。
2.根据权利要求1所述的基于曲库的音乐文件的匹配方法,其特征在于,所述每个音乐文件和所述新上传的音乐文件还包括歌曲附属信息,所述索引字典中还包括所述歌曲附属信息,在判断所述多个新索引信息与所述索引字典中对应的音乐文件的多个索引信息分别匹配之后,进一步判断所述新上传音乐文件的歌曲附属信息与所述对应的音乐文件的歌曲附属信息是否匹配,如果判断匹配,则判断所述新上传的音乐文件已存在于所述曲库之中。
3.根据权利要求1所述的基于曲库的音乐文件的匹配方法,其特征在于,还包括: 对所述多个音乐文件和所述新上传的音乐文件进行预处理。
4.根据权利要求3所述的基于曲库的音乐文件的匹配方法,其特征在于,所述对多个音乐文件和所述新上传的音乐文·件进行预处理进一步包括: 将所述音乐文件信息的全角转换成半角,并且所述音乐文件信息为繁体中文时将繁体转换为简体; 删除所述音乐文件信息中的多余空格,并将特殊符号进行处理; 将所述音乐文件信息中阿拉伯数字转换为汉字;以及 对所述音乐文件信息中歌手别名进行语义分析并将所述歌手的别名转换为译名。
5.根据权利要求1所述的基于曲库的音乐文件的匹配方法,其特征在于,在确定对应的音乐文件的多个索引信息之前,还包括: 分析所述音乐文件中歌曲名是否为中文; 如果所述歌曲名为中文,则进一步判断所述歌曲名的字符串长度是否大于第一索引信息字节长度; 如果小于所述第一索引信息字节长度,则不为所述音乐文件建立所述索引信息。
6.根据权利要求5所述的基于曲库的音乐文件的匹配方法,其特征在于,还包括: 如果所述歌曲名为非中文,则进一步判断所述歌曲名的字符串长度是否大于第二索引信息字节长度,其中,所述第二索引信息字节长度大于所述第一索引信息字节长度; 如果小于所述第二索引信息字节长度,则不为所述音乐文件建立所述索引信息。
7.根据权利要求1所述的基于曲库的音乐文件的匹配方法,其特征在于,所述多个索引信息为音乐文件的歌曲名的头部索引信息、尾部索引信息、部分头部索引信息和部分尾部索引信息联合组成的索引信息。
8.一种基于曲库的音乐文件的匹配系统,其特征在于,包括:第一获取模块,用于获得曲库中的多个音乐文件,其中,所述每个音乐文件包括歌曲名; 确定模块,用于分别根据所述每个音乐文件的歌曲名确定对应的音乐文件的多个索引信息,其中,所述多个索引信息分别针对所述歌曲名中的不同字段; 索引字典模块,用于根据所述多个索引信息建立所述曲库中所述多个音乐文件的索引字典; 接收模块,用于接收新上传的音乐文件,其中,所述新上传的音乐文件包括歌曲名;索引生成模块,用于根据所述新上传的音乐文件的歌曲名生成所述新上传的音乐文件的多个新索引信息,其中,所述多个新索引信息分别针对所述新上传的音乐文件的歌曲名中的不同字段;以及 第一匹配判断模块,用于根据所述新上传的音乐文件的多个新索引信息与所述索引字典进行匹配,以判断所述新上传的音乐文件是否已存在于所述曲库之中。
9.根据权利要求8所述的基于曲库的音乐文件的匹配系统,其特征在于,所述系统还包括: 第二获取模块,用于获得所述曲库中的多个音乐文件和新上传的音乐文件的歌曲附属信息; 第二匹配判断模块,用于判断所述新上传音乐文件的歌曲附属信息与所述对应的音乐文件的歌曲附属信息是否匹配,以判断所述新上传的音乐文件是否已存在于所述曲库之中。
10.根据权利要求8所述的基于曲库的音乐文件的匹配系统,其特征在于,所述系统还包括:` 预处理模块,用于对所述多个音乐文件和所述新上传的音乐文件进行预处理。
11.根据权利要求10所述的基于曲库的音乐文件的匹配系统,其特征在于,所述预处理模块具体包括: 第一转换单元,用于将所述音乐文件信息的全角转换成半角,并且所述音乐文件信息为繁体中文时将繁体转换为简体; 处理单元,用于删除所述音乐文件信息中的多余空格,并将特殊符号进行处理; 第二转换单元,用于将所述音乐文件信息中阿拉伯数字转换为汉字;以及第三转换单元,用于对所述音乐文件信息中歌手别名进行语义分析并将所述歌手的别名转换为译名。
12.根据权利要求8所述的基于曲库的音乐文件的匹配系统,其特征在于,所述系统还包括: 第一处理模块,用于当所述音乐文件中歌曲名为中文时对其进行处理;以及 第二处理模块,用于当所述音乐文件中歌曲名不是中文时对其进行处理。
13.根据权利要求12所述的基于曲库的音乐文件的匹配系统,其特征在于,所述第一处理模块具体包括: 判断单元,用于判断所述歌曲名的字符串长度是否大于第一索引信息字节长度; 处理单元,用于当所述歌曲名的字符串长度小于所述第一索引信息字节长度时,则不为所述音乐文件建立所述索引信息。
14.根据权利要求12所述的基于曲库的音乐文件的匹配系统,其特征在于,所述第二处理模块具体包括: 判断单元,用于判断所述歌曲名的字符串长度是否大于第二索引信息字节长度,其中,所述第二索引信息字节长度大于所述第一索引信息字节长度; 处理单元,用于当所述歌曲名的字符串长度小于所述第一索引信息字节长度时,则不为所述音乐文件建立所述索引信息。
15.根据权利要求8所述的基于曲库的音乐文件的匹配系统,其特征在于,所述多个索引信息为音乐文件的歌曲名的头部索引信息、尾部索引信息、部分头部索引信息和部分尾部索引信息联合组成的 索引信息。
【文档编号】G06F17/30GK103714079SQ201210376717
【公开日】2014年4月9日 申请日期:2012年9月29日 优先权日:2012年9月29日
【发明者】李啸 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1