一种数据处理方法及服务器与流程

文档序号:12364503阅读:来源:国知局

技术特征:

1.一种数据处理方法,其特征在于,包括:

获取被选定歌曲的第一数据与曲库中的各个参考歌曲的第二数据,其中,所述第一数据包括所述被选定歌曲的歌词段落数量,歌词段落时长,歌词段落字数和歌词字时长中的至少一个,所述第二数据包括所述各个参考歌曲的歌词段落数量,歌词段落时长,歌词段落字数和歌词字时长中的至少一个;

根据所述第一数据与所述第二数据确定相似度;

将所述相似度大于第一阈值的参考歌曲确定为所述被选定歌曲对应的推荐歌曲。

2.根据权利要求1所述的方法,其特征在于,当所述第一数据包括所述被选定歌曲的歌词段落数量和歌词段落时长,所述第二数据包括第一参考歌曲的歌词段落数量和歌词段落时长时,所述根据所述第一数据与所述第二数据确定相似度包括:

判断所述被选定歌曲的歌词段落数量是否与所述第一参考歌曲的歌词段落数量相等;

若是,获取所述被选定歌曲的每个歌词段落时长与所述第一参考歌曲对应的每个歌词段落时长的绝对差值的和,作为第一差值和;

判断所述第一差值和是否小于第二阈值;

若是,将所述第二阈值与所述第一差值和作差,并将作差的结果与所述第二阈值的比值确定为所述相似度。

3.根据权利要求1所述的方法,其特征在于,当所述第一数据包括所述被选定歌曲的歌词段落数量和歌词段落字数,所述第二数据包括第一参考歌曲的歌词段落数量和歌词段落字数时,所述根据所述第一数据与所述第二数据确定相似度包括:

判断所述被选定歌曲的歌词段落数量是否与所述第一参考歌曲的歌词段落数量相等;

若是,获取所述被选定歌曲的每个歌词段落字数与所述第一参考歌曲对应的每个歌词段落字数的绝对差值的和,作为第二差值和;

判断所述第二差值和是否小于第三阈值;

若是,将所述第三阈值与所述第二差值和作差,并将作差的结果与所述第三阈值的比值确定为所述相似度。

4.根据权利要求1所述的方法,其特征在于,当所述第一数据包括所述被选定歌曲的歌词段落数量,歌词段落时长和歌词段落字数,所述第二数据包括第一参考歌曲的歌词段落数量,歌词段落时长和歌词段落字数时,所述根据所述第一数据与所述第二数据确定相似度包括:

判断所述被选定歌曲的歌词段落数量是否与所述第一参考歌曲的歌词段落数量相等;

若是,分别判断所述被选定歌曲的每个歌词段落时长与所述第一参考歌曲对应的每个歌词段落时长的绝对差值是否都小于第四阈值;

若是,获取所述被选定歌曲的每个歌词段落字数与所述第一参考歌曲对应的每个歌词段落字数的绝对差值的和,作为第三差值和;

判断所述第三差值和是否小于第五阈值;

若是,将所述第五阈值与所述第三差值和作差,并将作差的结果与所述第五阈值的比值确定为所述相似度。

5.根据权利要求1所述的方法,其特征在于,当所述第一数据包括所述被选定歌曲的歌词段落数量,歌词段落时长,歌词段落字数和歌词字时长,所述第二数据包括第一参考歌曲的歌词段落数量,歌词段落时长,歌词段落字数和歌词字时长时,所述根据所述第一数据与所述第二数据确定相似度包括:

判断所述被选定歌曲的歌词段落数量是否与所述第一参考歌曲的歌词段落数量相等;

若是,分别判断所述被选定歌曲的每个歌词段落时长与所述第一参考歌曲对应的每个歌词段落时长的绝对差值是否都小于第六阈值;

若是,分别判断所述被选定歌曲的每个歌词段落字数与所述第一参考歌曲对应的每个歌词段落字数是否都相等;

若是,获取所述被选定歌曲的每个歌词字时长与所述第一参考歌曲对应的每个歌词字时长的绝对差值的和,作为第四差值和;

判断所述第四差值和是否小于第七阈值;

若是,将所述第七阈值与所述第四差值和作差,并将作差的结果与所述第七阈值的比值确定为所述相似度。

6.根据权利要求1所述的方法,其特征在于,当所述第一数据包括所述被选定歌曲的歌词段落数量,歌词段落时长,歌词段落字数和歌词字时长,所述第二数据包括第一参考歌曲的歌词段落数量,歌词段落时长,歌词段落字数和歌词字时长时,所述根据所述第一数据与所述第二数据确定相似度包括:

判断所述被选定歌曲的歌词段落数量是否与所述第一参考歌曲的歌词段落数量相等;

若是,获取所述被选定歌曲的每个歌词段落时长与所述第一参考歌曲对应的每个歌词段落时长的绝对差值的和;

判断所述被选定歌曲的每个歌词段落时长与所述第一参考歌曲对应的每个歌词段落时长的绝对差值的和是否小于第八阈值;

若是,获取所述被选定歌曲的每个歌词段落字数与所述第一参考歌曲对应的每个歌词段落字数的绝对差值的和;

判断所述被选定歌曲的每个歌词段落字数与所述第一参考歌曲对应的每个歌词段落字数的绝对差值的和是否小于第九阈值;

若是,当所述被选定歌曲中存在第一歌词段落字数与所述第一参考歌曲对应的第二歌词段落字数不相等时,按照预设规则处理,以使得所述被选定歌曲的第一歌词段落字数与所述第一参考歌曲对应的第二歌词段落字数相等,其中,所述预设规则包括:若所述第一歌词段落字数大于所述第二歌词段落字数,则确定所述第一歌词段落的差异字符,并将所述第一歌词段落的差异字符进行合并;若所述第二歌词段落字数小于所述第二歌词段落字数,则确定所述第二歌词段落的差异字符,并将所述第二歌词段落的差异字符进行合并;

获取所述被选定歌曲的每个歌词字时长与所述第一参考歌曲对应的每个歌词字时长的绝对差值的和,作为第五差值和;

判断所述第五差值和是否小于第十阈值;

若是,将所述第十阈值与所述第五差值和作差,并将作差的结果与所述第十阈值的比值确定为所述相似度。

7.一种服务器,其特征在于,包括:

第一获取模块,用于获取被选定歌曲的第一数据与曲库中的各个参考歌曲的第二数据,其中,所述第一数据包括所述被选定歌曲的歌词段落数量,歌词段落时长,歌词段落字数和歌词字时长中的至少一个,所述第二数据包括所述各个参考歌曲的歌词段落数量,歌词段落时长,歌词段落字数和歌词字时长中的至少一个;

第一确定模块,用于根据所述第一获取模块获取的所述第一数据与所述第二数据确定相似度;

第二确定模块,用于将所述第一确定模块确定的所述相似度大于第一阈值的参考歌曲确定为所述被选定歌曲对应的推荐歌曲。

8.根据权利要求7所述的服务器,其特征在于,当所述第一数据包括所述被选定歌曲的歌词段落数量和歌词段落时长,所述第二数据包括第一参考歌曲的歌词段落数量和歌词段落时长时,所述第一确定模块具体用于判断所述被选定歌曲的歌词段落数量是否与所述第一参考歌曲的歌词段落数量相等;若是,获取所述被选定歌曲的每个歌词段落时长与所述第一参考歌曲对应的每个歌词段落时长的绝对差值的和,作为第一差值和;判断所述第一差值和是否小于第二阈值;若是,将所述第二阈值与所述第一差值和作差,并将作差的结果与所述第二阈值的比值确定为所述相似度。

9.根据权利要求7所述的服务器,其特征在于,当所述第一数据包括所述被选定歌曲的歌词段落数量和歌词段落字数,所述第二数据包括第一参考歌曲的歌词段落数量和歌词段落字数时,所述第一确定模块具体用于

判断所述被选定歌曲的歌词段落数量是否与所述第一参考歌曲的歌词段落数量相等;若是,获取所述被选定歌曲的每个歌词段落字数与所述第一参考歌曲对应的每个歌词段落字数的绝对差值的和,作为第二差值和;判断所述第二差值和是否小于第三阈值;若是,将所述第三阈值与所述第二差值和作差,并将作差的结果与所述第三阈值的比值确定为所述相似度。

10.根据权利要求7所述的服务器,其特征在于,当所述第一数据包括所述被选定歌曲的歌词段落数量,歌词段落时长和歌词段落字数,所述第二数据包括第一参考歌曲的歌词段落数量,歌词段落时长和歌词段落字数时,所述第一确定模块具体用于判断所述被选定歌曲的歌词段落数量是否与所述第一参考歌曲的歌词段落数量相等;若是,分别判断所述被选定歌曲的每个歌词段落时长与所述第一参考歌曲对应的每个歌词段落时长的绝对差值是否都小于第四阈值;若是,获取所述被选定歌曲的每个歌词段落字数与所述第一参考歌曲对应的每个歌词段落字数的绝对差值的和,作为第三差值和;

判断所述第三差值和是否小于第五阈值;若是,将所述第五阈值与所述第三差值和作差,并将作差的结果与所述第五阈值的比值确定为所述相似度。

11.根据权利要求7所述的服务器,其特征在于,当所述第一数据包括所述被选定歌曲的歌词段落数量,歌词段落时长,歌词段落字数和歌词字时长,所述第二数据包括第一参考歌曲的歌词段落数量,歌词段落时长,歌词段落字数和歌词字时长时,第一确定模块具体用于判断所述被选定歌曲的歌词段落数量是否与所述第一参考歌曲的歌词段落数量相等;若是,分别判断所述被选定歌曲的每个歌词段落时长与所述第一参考歌曲对应的每个歌词段落时长的绝对差值是否都小于第六阈值;若是,分别判断所述被选定歌曲的每个歌词段落字数与所述第一参考歌曲对应的每个歌词段落字数是否都相等;若是,获取所述被选定歌曲的每个歌词字时长与所述第一参考歌曲对应的每个歌词字时长的绝对差值的和,作为第四差值和;判断所述第四差值和是否小于第七阈值;若是,将所述第七阈值与所述第四差值和作差,并将作差的结果与所述第七阈值的比值确定为所述相似度。

12.根据权利要求7所述的服务器,其特征在于,当所述第一数据包括所述被选定歌曲的歌词段落数量,歌词段落时长,歌词段落字数和歌词字时长,所述第二数据包括第一参考歌曲的歌词段落数量,歌词段落时长,歌词段落字数和歌词字时长时,第一确定模块具体用于判断所述被选定歌曲的歌词段落数量是否与所述第一参考歌曲的歌词段落数量相等;若是,获取所述被选定歌曲的每个歌词段落时长与所述第一参考歌曲对应的每个歌词段落时长的绝对差值的和;判断所述被选定歌曲的每个歌词段落时长与所述第一参考歌曲对应的每个歌词段落时长的绝对差值的和是否小于第八阈值;若是,获取所述被选定歌曲的每个歌词段落字数与所述第一参考歌曲对应的每个歌词段落字数的绝对差值的和;判断所述被选定歌曲的每个歌词段落字数与所述第一参考歌曲对应的每个歌词段落字数的绝对差值的和是否小于第九阈值;若是,当所述被选定歌曲中存在第一歌词段落字数与所述第一参考歌曲对应的第二歌词段落字数不相等时,按照预设规则处理,以使得所述被选定歌曲的第一歌词段落字数与所述第一参考歌曲对应的第二歌词段落字数相等,其中,所述预设规则包括:若所述第一歌词段落字数大于所述第二歌词段落字数,则确定所述第一歌词段落的差异字符,并将所述第一歌词段落的差异字符进行合并;若所述第二歌词段落字数小于所述第二歌词段落字数,则确定所述第二歌词段落的差异字符,并将所述第二歌词段落的差异字符进行合并;获取所述被选定歌曲的每个歌词字时长与所述第一参考歌曲对应的每个歌词字时长的绝对差值的和,作为第五差值和;判断所述第五差值和是否小于第十阈值;若是,将所述第十阈值与所述第五差值和作差,并将作差的结果与所述第十阈值的比值确定为所述相似度。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1