一种歌曲处理方法及系统的制作方法

文档序号：6377677阅读：197来源：国知局

专利名称：一种歌曲处理方法及系统的制作方法
技术领域：
本发明涉及音频处理领域，特别地涉及一种歌曲处理方法及系统。
背景技术：
随着移动互联网的迅猛发展，手机上网越来越多，而通过手机下载歌曲也就越来越多，但用户面临的问题是昂贵的流量费和慢的网速，无法满足用户需求。为用户提供歌曲快照片段(高潮部分)，能够很好的代表这首歌曲，歌曲文件大大减小，对用户来说能够很少的花费就可以听听这首歌曲好听不好听，对版不对版，而且对于现在的很慢的移动网速来说大大节约了用户时间。同时对移动运营商来说，能减少带宽并减少服务器压力，而且能提升用户体验。中国专利CN201010531964. O公开了一种音频切割装置及方法，其提供的歌曲音·频切割方法包括获取歌曲音频文件的歌词文本文件；分析该歌词文本文件中的每句歌词的重复程度，将该重复程度高于一特定阈值的重复歌词加入一候选集合；针对该候选集合中的重复歌词进行分析，获取其分布位置，连续分布的多句重复歌词组成段落；根据每句重复歌词的重复程度以及在段落中的位置，确定一句重复歌词作为切割起始歌词，以该切割起始歌词的开始时间点作为该歌曲音频文件的切割起始点；利用歌曲切割工具从该切割起始点开始，切割该歌曲音频文件。采用该方案还存在一些问题，无法精确进行歌词与歌曲文件的精确匹配，对于歌曲高潮部分的处理准确度较低，并且体验度无法满足用户需求，在处理效率上也有待提闻。因此，需要提供一种歌曲处理方案以更好地满足用户需求。

发明内容
本发明解决的技术问题在于提供了一种歌曲处理方法及系统，以解决现有技术中海量歌曲准确识别快照(歌曲关键片段)需要大量人力且低效、成本高问题。为解决上述问题，本发明提供了一种歌曲处理方法，包括，对海量歌曲文件进行选优，选择出较好版本的歌曲文件；对海量歌词选优出歌词文件，选择对版完整的歌词文件；格式化所述选择出的歌词文件为时间升序表；分析得出该歌曲快照区域时间；根据快照区域时间对所述歌曲文件进行切割，切割出快照文件。进一步地,上述的方法,还包括，将所述切割出的快照文件存储至存储服务器。上述的方法，其中，对海量歌曲文件进行选优，选择出较好版本的歌曲文件具体包括，将同名，同歌手的歌曲文件为同组，选择大于特定时长的歌曲文件；同组的歌曲文件中，筛选出相同时长最多的文件为候选文件作为选择出的较好版本的歌曲文件；如果选出的歌曲文件中有wma格式的，则优选wma格式的歌曲文件作为选择出的较好版本的歌曲文件；如果有多个歌曲文件，则优选好的来源的歌曲文件作为选择出的较好版本的歌曲文件。上述的方法，其中，所述对海量歌词选优出歌词文件，选择对版完整的歌词文件具体包括，将所述歌词文件统一为相同的歌词文件格式；对所述歌词文件进行去除噪音符；根据LRC格式将所述歌词文件解析成“时间，歌词”格式，按照时间进行排序列表;将不符合要求的歌词文件按照特定时长规则进行排除；检查歌曲文件跟歌词是否对版，不对版则排除歌词文件。所述将不符合要求的歌词文件按照特定时长规则进行排除具体包括，如果最后一句歌词开始时间小于70秒则排除该歌词文件；如果最后两行歌词时间差大于等于60秒则去掉最后一行；如果歌词最后一句时间减去筛选的歌曲时长小于-60或大于10，则排除歌词文件。所述检查歌曲文件跟歌词是否对版，不对版则排除歌词文件具体包括，在歌曲文件时长大于等于歌词最后一句时间时，(歌曲文件时长X4)小于(歌词最后一句时间X7)时，以及，在歌曲文件时长小于歌词最后一句时间时，(歌曲文件时长X5)小于等于(歌词最后一句时间X3)时，则对版；否则不对版。上述的方法，其中，所述格式化所述选择出的歌词文件为时间升序表具体包括，转换歌词为统一格式；替换所有\r、\n\n、\n为\n，替换所有\t、多空格为单空格；对所述歌词文件去噪，将噪符去除；解析歌词为时间升序表。上述的方法，其中，所述分析得出该歌曲快照区域时间具体包括，初步计算出快照区开始、结束时间；对确定的快照区开始、结束时间进行修正；增加歌曲淡化时间；检测快照区域时间是否异常。其中，所述初步计算出快照区开始、结束时间具体包括，按照片段计算快照时间；所述片段指连续几行的歌词且不能跨段或者根据歌名计算快照时间；或者根据重复句子计算快照时间；或者根据前、后缀计算快照时间；或者根据最后段落计算快照时间；或者根据最后30秒计算快照时间。其中，所述对确定的快照区开始、结束时间进行修正具体包括，
增加最后一行时间以确定快照区结束时间；修正获取的快照区开始、结束时间。其中，所述增加歌曲淡化时间具体包括，进行淡入处理包括获取的快照片断的开始时间向前延伸f 4秒作为起始时间；如果该起始时间到了歌头，则以歌曲开始时间为开始时间；以及进行淡出处理包括获取的快照结束时间向后延伸f 4秒作为结束时间；如果超越了歌曲文件的结尾时间，则直接取歌曲文件结束时间作为结束时间。其中，所述检测快照区域时间是否异常具体包括，如果快照区停止时间小于等于歌曲文件时长则无需修正，否则快照区停止时间需要采用歌曲文件结束时间。上述的方法，其中，所述根据快照区域时间对所述歌曲文件进行切割，切割出快照文件具体包括，对歌曲文件格式统一解压为wav ；切割计算出快照区域时间的歌曲区域的歌曲文件；淡化切割的快照歌曲文件；统一输出文件为MP3格式的文件并进行存储，且清理临时文件。本发明还提供了一种歌曲处理系统，包括，歌曲文件优选模块，用于对海量歌曲文件进行选优，选择出较好版本的歌曲文件；歌词文件优选模块，用于对海量歌词选优出歌词文件，选择对版完整的歌词文件；歌词文件处理模块，用于格式化所述选择出的歌词文件为时间升序表；歌曲快照分析模块，用于分析得出该歌曲快照区域时间；歌曲文件切割模块，用于根据快照区域时间对所述歌曲文件进行切割，切割出快照文件。进一步地，上述的系统，还包括，数据存储模块，用于将所述切割出的快照文件存储在存储服务器。采用本发明的技术方案，自动对有歌词的大量歌曲文件进行分布式系统批量处理，大大提高了处理效率；相对现有的一些自动识别，大大提高了能够识别高潮区的歌曲量比例，同时在准确度方面也大有改善，在切割的文件体验上做了很好的改善，加入淡化处理，切合人的听觉体验。

此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中图I是本发明第一实施例流程图；图2是本发明第二实施例结构图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白，以下结合附图和实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。如图I所示，是本发明第一实施例流程图，提供了一种歌曲处理方法，具体包括，步骤S101，对海量歌曲文件进行选优，选择出较好版本的歌曲文件；由于在互联网海量歌曲中，许多歌曲有不同版本，例如有不同人翻唱的、演唱会版、高潮版、现场版等等不同种情况，所以尽可能选出较好版本的歌曲文件，可以是原唱的、完整的、音质较好的歌曲文件。作为一个实施例，具体选取步骤如下
a，将同名，同歌手的歌曲文件为同组，选择大于特定时长的歌曲文件，该特定时长根据经验值可调，在7(Γ100秒内即可；b，同组的歌曲文件中，筛选出相同时长(误差范围近似一样，经验值4秒内)最多的文件为候选文件集作为选择出的较好版本的歌曲文件集合；c，如果b步选出的歌曲文件集合中有wma格式的，则优选wma格式的歌曲文件作为选择出的较好版本的歌曲文件；d，如果c步中有多个歌曲文件，则优选好的来源的歌曲文件作为选择出的较好版本的歌曲文件。步骤S102，对海量歌词选优出歌词文件，选择对版完整的歌词文件；根据目前的数据统计分析，互联网海量歌曲中，有歌词的不到30%，而且大多为网友制作，相当杂乱，如歌词只有部分，歌词时间跟歌曲对不上等问题，这些问题是能否选好快照区的关键因素，所以就需要整理和筛选。作为一个实施例，同名、同歌手为同一歌曲歌词，预处理歌词文件和选出歌词文件，具体包括，a，将所述歌词文件统一为相同的歌词文件格式，例如为UTF8 ；b，对所述歌词文件进行去除噪音符，例如将时间标签为
这样的行剔除；C，根据LRC格式将所述歌词文件解析成“时间，歌词”格式，按照时间进行排序列表;d，将不符合要求的歌词文件按照特定时长规则进行排除；具体地，如果最后两行歌词时间差>=60秒则去掉最后一行；如果最后一句歌词开始时间〈70秒则排除该歌词文件；如果歌词最后一句时间-步骤I筛选的歌曲时长〈-60或>10，则排除歌词文件。e，检查歌曲文件跟歌词是否对版，不对版则排除歌词文件；I)在歌曲文件时长 >=歌词最后一句时间时，歌曲文件时长X4 <歌词最后一句时间X7则对版；2)在歌曲文件时长〈歌词最后一句时间时，歌曲文件时长X5〈=歌词最后一句时间X3则对版；除去以上I) 2)规则符合对版，其它则不对版。步骤S103，格式化所述选择出的歌词文件为时间升序表；作为一个实施例，具体包括，
a，转换歌词为统一格式，如统一转换为小写(也可大写);b，替换所有\r、\n\n、\n为\n，替换所有\t、多空格为空格；C，对所述歌词文件去噪，将噪符去除，例如QQ这些符号的歌词；d，解析歌词为时间升序表(包括歌词时间，歌词)，例如，
张芸京-一代天骄
·
千百年来故老相传
大漠西边也有人烟
刀枪剑戟烽火连天
还有美人金色发丝
千军万马征战整个世界..............步骤S104，分析得出该歌曲快照区域时间；步骤S1041，初步计算出快照区开始、结束时间；I)按照片段(连续几行的歌词为片段，不能跨段)计算快照时间，具体包括，a.找出重复次数最多的片段；b.如果a步中有多个符合条件的片段，则在多个片段中找出包含歌词行数最多的片段；c.如果b步中有多个符合条件的片段，则在多个片段中找出所在段段号大的片段；d.如果c步中有多个符合条件的片段，则在多个片段中找出片段行号大的片段；e.以上步骤中如果找到了片段，则取片段的首行歌词时间为起始时间，而结束时间则取本片段外下行歌词开始时间；如果没有下行时间则取选中片段最后行歌词结束时间，且计算出该行字数。2)根据歌名计算快照时间如果I)不能找到快照区间，则按照本步计算快照时间，具体包括，a.找到所有包含歌名的歌词行；b.如果a步成功，则在找到的所有歌词行中取行号最大的一行；c.如果b步成功，则取所选行歌词时间为快照开始时间，快照结束时间选取最后一行歌词时间，该结束时间需要加入最后一行歌词时间。3)根据重复句子计算快照时间，至少重复2次；如果2)不能找出快照片段，则按照本步计算快照时间，具体包括，a.找出重复次数最多的单句歌词行；b.如果a步中有多个符合条件的行，则在多个歌词行中找出行号最大的行；c.取b步中确定行的起始时间为快照开始时间，结束时间选歌词最后行时间为结束时间，该结束时间需要加入最后一行歌词时间。
4)根据前、后缀计算快照时间；如果3)不能找出快照片段，则进行本步计算快照时间，具体包括，a.找出歌词前缀(取行前2个字)或后缀(行尾2字)重复最多行；b.如果a步中有多个符合条件的行，则在多个歌词行中找出行号最大的行；c.取b步中确定行的起始时间为快照开始时间，结束时间选歌词最后行时间为结束时间，该结束时间需要加入最后一行歌词时间。5)根据最后段落计算快照时间；如果4)不能找出快照片段，则进行本步计算快照时间，具体包括，a.找出最后歌词段落起始行； b.取a步中确定行的起始时间为快照开始时间，结束时间选歌词最后行时间为结束时间，该结束时间需要加入最后一行歌词时间。6)根据最后30秒计算快照时间；如果5)不能找出快照片段，则进行本步计算快照时间，具体包括，a.计算出最后行歌词时间减去30秒这个时间；b.取a步中确定的时间的下一行歌词时间作为快照开始时间，结束时间选最后行歌词时间为结束时间，该结束时间需要加入最后一行歌词时间。步骤S1042，对确定的快照区开始、结束时间进行修正；具体地,进行修正包括，I)增加最后一行时间以确定快照区结束时间；上步中没有计算最后一句歌词时间的，这步加入，主要是为了保证完整句子，尽可能不断句，提升用户体验感受。在上一步中，记录了最后行字数的，需要加最后行结束时间为快照结束时间；例如，上步确定的快照结束时间+上步计算的最后行字数*字速(例如I. 5秒一个字)作为快照结束时间；其中字速为最近歌词近似字速计算，根据需要计算速度的歌词的前两句歌词间时长/字数，计算出最近歌词速度秒/字例如I. 5秒/字。2)修正获取的快照区开始、结束时间；A.如果获得的快照时长〈30秒，这是经验值则a.快照开始时间+30秒时间之后的一句歌词时间作为结束时间；b.如果a步骤获取的快照时长> 60秒，则取快照开始时间+30秒作为结束时间。B.如果获取的快照时长>60秒，这是经验值则获取快照起始时间+60秒时间之前的一句歌词时间作为结束时间步骤S1043，增加歌曲淡化时间；对所述快照开始、结束时间进行淡化处理，主要为了提升用户体验，防止核心歌曲句子切断，歌词和歌曲文件间有可能会有少许偏差。具体包括，进行淡入处理获取的快照片断的开始时间向前延伸3秒(f 4秒值均可)作为起始时间；如果该起始时间到了歌头，则以歌曲开始时间为开始时间；进行淡出处理获取的快照结束时间向后延伸3秒(广4秒也可)作为结束时间；如果超越了歌曲文件的结尾时间，则直接取歌曲文件结束时间作为结束时间。
步骤S1044，检测快照区域时间是否异常。如果快照区停止时间〈=歌曲文件时长则无需修正，否则快照区停止时间需要采用歌曲文件结束时间。步骤S105，根据快照区域时间对所述歌曲文件进行切割，切割出快照文件；作为一个实施例，具体包括，a，对歌曲文件格式统一解压为wav ;b，切割计算出快照区域时间的歌曲区域的歌曲文件；C，淡化切割的快照歌曲文件；·d，统一输出文件为MP3格式的文件并进行存储，且清理临时文件。步骤S106，提交所述切割出的快照文件至数据库。如图2所示，本发明还提供了一种歌曲处理系统，包括，歌曲文件优选模块201，用于对海量歌曲文件进行选优，选择出较好版本的歌曲文件；歌词文件优选模块202，用于对海量歌词选优出歌词文件，选择对版完整的歌词文件；歌词文件处理模块203，用于格式化所述选择出的歌词文件为时间升序表；歌曲快照分析模块204，用于分析得出该歌曲快照区域时间；歌曲文件切割模块205，用于根据快照区域时间对所述歌曲文件进行切割，切割出快照文件；数据存储模块206，用于将所述切割出的快照文件存储在存储服务器。采用上述的技术方案，自动对有歌词的大量歌曲文件进行分布式系统批量处理，大大提高了处理效率；相对现有的一些自动识别，大大提高了能够识别(关键快照)高潮区的歌曲量比例，同时在准确度方面也大有改善，在切割的文件体验上做了很好的改善，加入淡化处理，切合人的听觉体验。对于用户而言，可以帮助用户提供节约带宽和流量以及提升用户体验，也可以帮助用户试听歌曲是否好听，是否对版(是否自己所要听的歌曲)，在高昂的手机流量费用下，很好的节约了带宽和金钱，另外，也可以帮助人们高效的批量制作铃声。上述说明示出并描述了本发明的一个优选实施例，但如前所述，应当理解本发明并非局限于本文所披露的形式，不应看作是对其他实施例的排除，而可用于各种其他组合、修改和环境，并能够在本文所述发明构想范围内，通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围，则都应在本发明所附权利要求的保护范围内。
权利要求
1.一种歌曲处理方法，其特征在于，包括，对海量歌曲文件进行选优，选择出较好版本的歌曲文件；对海量歌词选优出歌词文件，选择对版完整的歌词文件；格式化所述选择出的歌词文件为时间升序表；分析得出该歌曲快照区域时间；根据快照区域时间对所述歌曲文件进行切割，切割出快照文件。
2.根据权利要求I所述的方法，其特征在于，还包括，将所述切割出的快照文件存储至存储服务器。
3.根据权利要求I或2所述的方法，其特征在于，对海量歌曲文件进行选优，选择出较好版本的歌曲文件具体包括，将同名，同歌手的歌曲文件为同组，选择大于特定时长的歌曲文件；同组的歌曲文件中，筛选出相同时长最多的文件为候选文件作为选择出的较好版本的歌曲文件；如果选出的歌曲文件中有wma格式的，则优选wma格式的歌曲文件作为选择出的较好版本的歌曲文件；如果有多个歌曲文件，则优选好的来源的歌曲文件作为选择出的较好版本的歌曲文件。
4.根据权利要求3所述的方法，其特征在于，所述对海量歌词选优出歌词文件，选择对版完整的歌词文件具体包括，将所述歌词文件统一为相同的歌词文件格式；对所述歌词文件进行去除噪音符；根据LRC格式将所述歌词文件解析成“时间，歌词”格式，按照时间进行排序列表；将不符合要求的歌词文件按照特定时长规则进行排除；检查歌曲文件跟歌词是否对版，不对版则排除歌词文件。
5.根据权利要求4所述的方法，其特征在于，所述将不符合要求的歌词文件按照特定时长规则进行排除具体包括，如果最后一句歌词开始时间小于70秒则排除该歌词文件；如果最后两行歌词时间差大于等于60秒则去掉最后一行；如果歌词最后一句时间减去筛选的歌曲时长小于-60或大于10，则排除歌词文件。
6.根据权利要求5所述的方法，其特征在于，所述检查歌曲文件跟歌词是否对版，不对版则排除歌词文件具体包括，在歌曲文件时长大于等于歌词最后一句时间时，(歌曲文件时长X4)小于(歌词最后一句时间X7)时，以及，在歌曲文件时长小于歌词最后一句时间时，(歌曲文件时长X5)小于等于(歌词最后一句时间X3)时，则对版；否则不对版。
7.根据权利要求4至6任一所述的方法，其特征在于，所述格式化所述选择出的歌词文件为时间升序表具体包括，转换歌词为统一格式；替换所有\r、\n\n、\n为\n，替换所有\t、多空格为单空格；对所述歌词文件去噪，将噪符去除；解析歌词为时间升序表。
8.根据权利要求7所述的方法，其特征在于，所述分析得出该歌曲快照区域时间具体包括，初步计算出快照区开始、结束时间；对确定的快照区开始、结束时间进行修正；增加歌曲淡化时间；检测快照区域时间是否异常。
9.根据权利要求8所述的方法，其特征在于，所述初步计算出快照区开始、结束时间具体包括，按照片段计算快照时间；所述片段指连续几行的歌词且不能跨段或者根据歌名计算快照时间；或者根据重复句子计算快照时间；或者根据前、后缀计算快照时间；或者根据最后段落计算快照时间；或者根据最后30秒计算快照时间。
10.根据权利要求9所述的方法，其特征在于，所述对确定的快照区开始、结束时间进行修正具体包括，增加最后一行时间以确定快照去结束时间；修正获取的快照去开始、结束时间。
11.根据权利要求10所述的方法，其特征在于，所述增加歌曲淡化时间具体包括，进行淡入处理包括获取的快照片断的开始时间向前延伸广4秒作为起始时间；如果该起始时间到了歌头，则以歌曲开始时间为开始时间；以及进行淡出处理包括获取的快照结束时间向后延伸广4秒作为结束时间；如果超越了歌曲文件的结尾时间，则直接取歌曲文件结束时间作为结束时间。
12.根据权利要求11所述的方法，其特征在于，所述检测快照区域时间是否异常具体包括，如果快照区停止时间小于等于歌曲文件时长则无需修正，否则快照区停止时间需要采用歌曲文件结束时间。
13.根据权利要求8至12任一所述的方法，其特征在于，所述根据快照区域时间对所述歌曲文件进行切割，切割出快照文件具体包括，对歌曲文件格式统一解压为wav ；切割计算出快照区域时间的歌曲区域的歌曲文件；淡化切割的快照歌曲文件；统一输出文件为MP3格式的文件并进行存储，且清理临时文件。
14.一种歌曲处理系统，其特征在于，包括，歌曲文件优选模块，用于对海量歌曲文件进行选优，选择出较好版本的歌曲文件；歌词文件优选模块，用于对海量歌词选优出歌词文件，选择对版完整的歌词文件；歌词文件处理模块，用于格式化所述选择出的歌词文件为时间升序表；歌曲快照分析模块，用于分析得出该歌曲快照区域时间；歌曲文件切割模块，用于根据快照区域时间对所述歌曲文件进行切割，切割出快照文件。
15.根据权利要求14所述的系统，其特征在于，还包括，数据存储模块，用于将所述切割出的快照文件存储在存储服务器。
全文摘要
本发明涉及音频处理领域，提供了一种歌曲处理方法，包括，对海量歌曲文件进行选优，选择出较好版本的歌曲文件；对海量歌词选优出歌词文件，选择对版完整的歌词文件；格式化所述选择出的歌词文件为时间升序表；分析得出该歌曲快照区域时间；根据快照区域时间对所述歌曲文件进行切割，切割出快照文件。本发明还提供了一种歌曲处理系统。采用本发明的技术方案，自动对有歌词的大量歌曲文件进行分布式系统批量处理，大大提高了处理效率；大大提高了能够识别高潮区的歌曲量比例，同时在切中关键区以及其起止时间的准确度方面也大有改善，在切割的文件体验上做了很好的改善，切合人的听觉体验。
文档编号G06F17/30GK102902759SQ201210359839
公开日2013年1月30日申请日期2012年9月24日优先权日2012年9月24日
发明者张云飞, 刘军, 陈伟, 李锦根, 黄兴红申请人:北京宜搜天下科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张云飞;刘军;陈伟;李锦根;黄兴红
技术所有人：北京宜搜天下科技有限公司
我是此专利的发明人

上一篇：数据配置方法、装置和服务器的制作方法
上一篇：一种用于枚举系统进程的方法及装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。