一种音乐标签的向量确定方法和相关装置与流程

文档序号:23818185发布日期:2021-02-03 14:13阅读:94来源:国知局
一种音乐标签的向量确定方法和相关装置与流程

[0001]
本申请涉及数据处理领域,特别是涉及一种音乐标签的向量确定方法和相关装置。


背景技术:

[0002]
音乐平台为了向用户提供服务,会为平台中的音乐标注音乐标签,通过音乐标签可以描述音乐的类型,例如“爵士乐”、“摇滚乐”等。
[0003]
音乐标签由于具有描述音乐的作用,故常用于音乐的相似度计算、音乐召回等场景。例如相关的相似度计算技术中,通过确定两个音乐的音乐标签重复数量或比例,来确定这两个音乐是否相似。
[0004]
然而,相关技术中对音乐标签的应用效果未能达到预期。


技术实现要素:

[0005]
为了解决上述技术问题,本申请提供了一种音乐标签的向量确定方法,可以结合音乐样本的音频特征,对分类模型中各个音乐标签所对应的初始标签向量进行训练调整,使调整后的初始标签中能够携带与音频特征相关的信息,从而在通过该分类模型确定音乐数据所对应的音乐标签时,能够结合该音乐数据的音频特征进行更加准确的判断。
[0006]
本申请实施例公开了如下技术方案:
[0007]
第一方面,本申请实施例提供了一种音乐标签的向量确定方法,所述方法包括:
[0008]
基于已分类的音乐标签的数量确定标签向量集合,所述标签向量集合包括与所述已分类的音乐标签一一对应的初始标签向量;
[0009]
根据音乐样本的音频特征和所述标签向量集合,通过分类模型对所述音乐样本进行标签分类,得到所述音乐样本对应的待定标签;
[0010]
根据所述待定标签和所述音乐样本的样本音乐标签,训练调整所述标签向量集合中的初始标签向量;
[0011]
根据调整后的初始标签向量确定所对应音乐标签的标签向量。
[0012]
第二方面,本申请实施例提供了一种音乐标签的向量确定装置,所述装置包括第一确定单元、分类单元、第一训练单元和第二确定单元:
[0013]
所述第一确定单元,用于基于已分类的音乐标签的数量确定标签向量集合,所述标签向量集合包括与所述已分类的音乐标签一一对应的初始标签向量;
[0014]
所述分类单元,用于根据音乐样本的音频特征和所述标签向量集合,通过分类模型对所述音乐样本进行标签分类,得到所述音乐样本对应的待定标签;
[0015]
所述第一训练单元,用于根据所述待定标签和所述音乐样本的样本音乐标签,训练调整所述标签向量集合中的初始标签向量;
[0016]
所述第二确定单元,用于根据调整后的初始标签向量确定所对应音乐标签的标签向量。
[0017]
第三方面,本申请实施例提供了一种计算机设备,所述设备包括处理器以及存储器:
[0018]
所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;
[0019]
所述处理器用于根据所述程序代码中的指令执行第一方面中所述的音乐标签的向量确定方法。
[0020]
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行第一方面中所述的音乐标签的向量确定方法。
[0021]
由上述技术方案可以看出,基于已分类的音乐标签的数量确定标签向量集合,该标签向量集合包括与已分类的音乐标签一一对应的初始标签向量。为了确定出能够更全面的体现出所对应音乐标签的标签向量,可以基于音乐样本,通过标签分类的方式来调整初始标签向量,以将音频特征融入到初始标签向量中。在进行分类训练的过程中,根据音乐样本的音频特征和该标签向量集合,通过分类模型对该音乐样本进行标签分类,得到该音乐样本对应的待定标签,然后根据该待定标签和该音乐样本的样本音乐标签的区别,训练调整该标签向量集合中的初始标签向量,从而使调整后的初始标签向量能够学习到同一类音乐标签下音乐样本所对应音频特征相关的信息。根据该调整后的初始标签向量确定所对应音乐标签的标签向量,该标签向量不仅能够表达所对应音乐标签,而且还可以体现出具有该音乐标签的音乐数据的共同音频特点。相对于相关技术所确定的标签向量,这种携带更丰富信息的标签向量可以更好的运用于与音乐标签相关的各类应用场景,为相似度计算、音乐推荐等提供准确的依据。
附图说明
[0022]
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0023]
图1为本申请实施例提供的一种实际应用场景中音乐标签的向量确定方法的示意图;
[0024]
图2为本申请实施例提供的一种音乐标签的向量确定方法的流程图;
[0025]
图3为本申请实施例提供的一种音乐标签的向量确定方法的示意图;
[0026]
图4为本申请实施例提供的一种音乐标签的向量确定方法的示意图;
[0027]
图5为本申请实施例提供的一种音乐标签的向量确定方法的示意图;
[0028]
图6为本申请实施例提供的一种音乐标签的向量确定方法的示意图;
[0029]
图7为本申请实施例提供的一种音乐标签的向量确定装置的结构框图;
[0030]
图8为本申请实施例提供的一种计算机设备的结构图;
[0031]
图9为本申请实施例提供的一种服务器的结构图。
具体实施方式
[0032]
下面结合附图,对本申请的实施例进行描述。
[0033]
为了能够有针对性的对各种音乐数据进行处理,为音乐数据进行准确分类是不可或缺的环节之一。在相关技术中,可以通过为音乐数据打上音乐标签来进行分类,例如摇滚乐、民谣、打击乐等标签,然而,这些标签通常是人为确定的,例如通过人耳来进行辨别,准确度较低。、
[0034]
为了解决上述技术问题,本申请实施例提供了一种音乐标签的向量确定方法,可以结合音乐样本的音频特征,对分类模型中各个音乐标签所对应的初始标签向量进行训练调整,使调整后的初始标签中能够携带与音频特征相关的信息,从而在通过该分类模型确定音乐数据所对应的音乐标签时,能够结合该音乐数据的音频特征进行更加准确的判断。
[0035]
可以理解的是,该方法可以应用于处理设备上,该处理设备为具有模型训练功能的处理设备,例如可以是具有模型训练功能的终端设备或服务器。该方法可以由终端设备或服务器独立运行,也可以应用于终端设备和服务器通信的网络场景,通过终端设备和服务器配合运行。其中,终端设备可以为手机、台式计算机、个人数字助理(personal digital assistant,简称pda)、平板电脑等设备。服务器可以理解为是应用服务器,也可以为web服务器,在实际部署时,该服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
[0036]
此外,本申请还涉及人工智能(artificial intelligence,ai)技术。人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0037]
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。其中,本申请涉及人工智能技术中的机器学习技术。
[0038]
机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。在本申请实施例中,根据音频特征和标签向量结合,通过分类模型进行训练调整可以用到该机器学习技术。
[0039]
为了便于理解本申请实施例提供的技术方案,接下来,将结合一种实际应用场景,对本申请实施例提供的一种音乐标签的向量确定方法进行介绍。
[0040]
参见图1,图1为本申请实施例提供的一种实际应用场景中音乐标签的向量确定方法的示意图。在该实际应用场景中,前述处理设备为服务器101,该服务器101能够训练用于对音乐数据进行标签分类的分类模型。为了实现上述功能,在该服务器101设置有n个音乐
标签,如“摇滚乐”、“打击乐”、“民谣”、“爵士乐”等,每一个音乐标签都有一一对应的一个初始标签向量,例如“初始标签向量1”、“初始标签向量2”、“初始标签向量3
”…“
初始标签向量n”等,该初始标签向量用于在该分类模型中来确定音乐数据所对应的音乐标签,上述n个初始标签向量能够组成标签向量集合。
[0041]
可以理解的是,音频特征是音乐数据最显著的特征之一,也是音乐数据所能够表现出的最主要的特征,该音频特征能够体现出音乐数据最基本的特点。不同音乐标签下的音乐数据,其音频特征往往也存在着一定区别,相同音乐标签下的音乐数据,其音频特征往往也存在着一定共性。例如,“打击乐”音乐标签所对应的音乐数据往往音乐节奏较快,“民谣”音乐标签所对应的音乐数据的音乐节奏通常较为舒缓。由此可见,具有相同音乐标签的音频特征在一定程度上也能够体现该音乐标签下的共性特征。因此,在设置各种音乐标签时,如果能够将音频特征或者说上述共性特征融入到对音乐标签的分类中,能够使分类结果更加准确,进一步贴合音乐数据实际的特点。基于此,在该实际应用场景中,服务器101可以从音频特征的角度出发,对该分类模型进行优化训练。
[0042]
首先,服务器101可以获取已分类的音乐样本,如图1所示,该音乐样本所对应的音频特征和样本音乐标签已知,该样本音乐标签可以为摇滚乐。服务器101可以将该音乐样本的音频特征和该标签向量集合,导入分类模型对该音乐样本进行标签分类,得到该音乐样本对应的待定标签。例如,处理设备可以将该标签向量集合作为该分类模型的模型参数,将该音乐样本的音频特征作为分类模型的模型输入,得到的模型输出可以为该待定标签。
[0043]
由于该初始标签向量中可能并没有携带与音频特征相关的信息,因此,根据该标签向量集合所得到的待定标签与该音乐样本所对应的音乐标签之间可能存在有一定差异。例如,该分类模型输出的待定标签可以为打击乐,而并不是摇滚乐,由此可见,该标签向量集合中的初始标签向量还无法用于通过音频特征对音乐标签进行准确判断,需要进行一定的参数调整。
[0044]
此时,服务器101可以根据该待定标签和该音乐样本的样本音乐标签,训练调整该标签向量集合中的初始标签向量,从而使该分类模型能够通过初始标签向量,依据该音乐样本对应的音频特征,准确判断出该音乐样本对应的音乐标签。例如,在本实际应用场景中,服务器101可以将该样本音乐标签作为分类模型的目标输出,对该分类模型进行反馈调节,使该分类模型中的初始标签向量在经过训练调整后,所输出的分类结果可以由待定标签转变为该样本音乐标签。此时,该调整后的初始标签向量在一定程度上具有使分类模型依据音乐数据的音频特征对音乐标签进行准确判断的能力,因此,在调整完成后,服务器101可以将该调整后的初始标签向量作为对应该音乐标签的标签向量,用于后续应用中对其它音乐数据进行标签分类。
[0045]
由此可见,通过该训练调整,服务器101可以使该调整后的初始标签向量中学习到与音频特征相关的信息,例如每一个调整后的初始标签向量中都可以携带有与对应的音乐标签下,音乐数据共有的音频特征相关的信息,从而在确定音乐数据所对应的音乐标签时,可以融合该音乐数据的音频特征对音乐标签进行判断,分析该音频特征是否贴合某一音乐标签下音乐数据所共有的音频特征,进而使得到的音乐标签能够体现出该音乐数据的音频特点,更加贴合音乐数据的真实特征,进一步提高音乐标签的准确度。
[0046]
接下来,将结合附图,对本申请实施例提供的一种音乐标签的向量确定方法进行
介绍。
[0047]
参见图2,图2为本申请实施例提供的一种音乐标签的向量确定方法的流程图,该方法包括:
[0048]
s201:基于已分类的音乐标签的数量确定标签向量集合。
[0049]
为了能够向用户提供个性化的音乐服务,如何在各类音乐数据上打上准确的音乐标签是其中的关键环节。其中,音乐标签是指该音乐数据所对应的类别标签,根据分类标准的不同,所得到的音乐标签内容也可能有所区别。例如,在根据音乐风格进行分类时,可以得到摇滚乐、民谣、爵士乐等音乐标签;根据演唱方式进行分类时,可以得到男低音、男高音、女高音等音乐标签。
[0050]
可以理解的是,音频特征是音乐数据最基础的特征之一,在展示音乐数据时,实际上就是音乐数据所对应的音频特征的体现。经研究发现,属于同一音乐标签下的音乐数据,其在音频特征上往往具有一定的共通性。例如,同属于“摇滚乐”这一音乐标签的音乐数据,其音频特征通常具有节奏点密集、音调较高的特点;同属于“民谣”这一音乐标签的音乐数据,其音频特征通常具有节奏点稀疏、音调较为平缓的特点。由此可见,如果能够从一类音乐标签所对应的音乐数据中提取出具有共性的音频特征,那么结合该音频特征,可以有助于对音乐数据所对应的音乐标签进行较为准确的判断。
[0051]
由于确定音乐标签实际上是对音乐数据的一种分类操作,而分类模型是执行分类操作的一种较为便捷的方式,因此,在本申请实施例中,处理设备可以通过对分类模型进行训练,使该分类模型能够结合音乐数据的音频特征,对该音乐数据对应的音乐标签进行判断。首先,处理设备可以基于已分类的音乐标签的数量,确定标签向量集合。其中,已分类的音乐标签是指该分类模型中所能够确定出的音乐标签,该标签向量集合中包括与该已分类的音乐标签一一对应的初始标签向量,该初始标签向量可以做为该分类模型中的模型参数,用于使该分类模型对音乐数据所对应的音乐标签进行判断。
[0052]
s202:根据音乐样本的音频特征和标签向量集合,通过分类模型对音乐样本进行标签分类,得到音乐样本对应的待定标签。
[0053]
为了能够将音频特征融入到对音乐数据所对应音乐标签的判断中,处理设备可以获取音频特征和所对应音乐标签已知的音乐数据作为音乐样本,通过该音乐样本对该分类模型进行训练。处理设备可以根据该音乐样本,通过该分类模型进行标签分类,得到该音乐样本所对应的待定标签,该待定标签是指基于该音乐样本所对应的音乐标签进行训练调整前的分类模型所确定出的音乐标签。
[0054]
在分类过程中,该分类模型能够结合标签向量集合,对该音乐样本的音频数据进行分析和处理,得到能够用于确定待定标签的相关参数。其中,分类模型进行分析处理的方式可以包括多种,例如,在一种可能的实现方式中,该分类模型能够基于该音频特征和标签向量集合,得到该音乐样本归属于各个音乐标签的概率参数,然后从中确定出概率参数最大的音乐标签作为该音乐样本所对应的待定标签。
[0055]
s203:根据待定标签和音乐样本的样本音乐标签,训练调整标签向量集合中的初始标签向量。
[0056]
可以理解的是,由于该分类模型中的初始标签向量的准确度可能不足,因此通过该初始标签向量所确定出的待定标签可能并不是该音乐样本所对应的音乐标签。此时,处
理设备可以基于该音乐样本的样本音乐标签,对该分类模型中的参数进行训练调整,该样本音乐标签是指该音乐样本所对应的音乐标签。
[0057]
在进行训练调整时,处理设备可以通过调整该标签向量集合中的初始标签向量,使该分类模型能够基于该音频特征和调整后的初始标签向量,确定出该样本音乐标签作为分类模型的分类结果。例如,在通过上述方式进行分析处理时,处理设备可以通过调整初始标签向量,使在该分类模型确定出的音乐样本归属各个音乐标签的概率参数中,归属该样本音乐标签的概率参数最大,从而能够使该分类模型在基于概率参数确定分类结果时,确定出该样本音乐标签作为分类结果。
[0058]
由于该训练调整过程是基于音频特征和初始标签向量来确定音乐标签,因此,通过该训练调整,可以使调整后的初始标签向量中携带有与音频特征相关的信息,该信息有助于分类模型确定出贴合音频特征的音乐标签。可以理解的是,在通过样本音乐标签相同的多个音乐样本对分类模型进行调整训练时,不同音乐样本所对应的音乐特征可能不完全相同,但在同一样本音乐标签下,多个音乐样本的音频特征中通常具有相似部分,为了满足在面对不同音乐样本时,都能够使分类模型准确确定出样本音乐标签,这部分具有共通性的音频特征的相关信息可以被该初始标签向量所学习,从而得到调整后的初始标签向量。
[0059]
此外,在通过多类样本音乐标签所对应的音乐样本进行训练调整时,处理设备还可以不断平衡多个初始标签向量,使每一个调整后的初始标签向量不仅能够用于确定所对应的音乐标签,也能够在确定其他音乐标签时起到一定的作用,进而使该分类模型能够基于调整后的标签向量集合来对多类音乐样本进行准确的标签分类。
[0060]
s204:根据调整后的初始标签向量确定所对应音乐标签的标签向量。
[0061]
经过上述训练调整过程,在最终调整得到的每一个初始标签向量中,都可以包括与所对应音乐标签下多个音乐样本共同具有的音频特征相关的信息,通过该信息,分类模型可以基于音乐样本的音频数据以及该调整后的标签向量集合中的初始标签向量,确定出该音乐样本所对应的样本音乐标签,从而实现了将音频特征融入到对音乐标签的确定过程中。最后,为了将该分类数据应用到其他为音乐数据进行标签分类的场景中,处理设备可以根据调整后的初始标签向量,确定所对应音乐标签的标签向量。
[0062]
上已述及,初始标签向量和已分类的音乐标签是一一对应的,因此,调整后的初始标签向量也具有对应的音乐标签。此时,处理设备可以直接将每一个调整后的初始标签向量确定为所对应音乐标签的标签向量。在其他可能的实现方式中,为了能够使标签向量中携带有更多与音乐数据相关的信息,从而对音乐数据所属的音乐标签进行更加准确的判断,处理设备也可以将该调整后的初始标签向量作为标签向量的一部分,结合其他的向量来确定标签向量。例如,由于不同的音乐创作者所创作的音乐数据可能具有一定独特的音频特征,该音频特征也可以反映到音乐标签中。例如,音乐创作者a所创作的摇滚乐通常具有某一段特定的音乐旋律,音乐创作者b所创作的摇滚乐不具有该音乐旋律,因此,如果能够在标签向量中进一步添加各个音乐创作者所创作各个音乐标签下音乐数据的音频特征信息,可以使得到的标签向量更加具有针对性。例如,处理设备还可以进一步通过分类模型,根据音乐样本所对应的音乐创作者、音频特征以及样本音乐标签,对该调整后的初始标签向量进行进一步的训练调整,将该训练调整后的初始标签向量确定为所对应音乐标签的标签向量,从而使该标签向量中除音频特征相关信息外,还可以学习到不同音乐创作者的
创作特点。
[0063]
由上述技术方案可以看出,基于已分类的音乐标签的数量确定标签向量集合,该标签向量集合包括与已分类的音乐标签一一对应的初始标签向量。为了确定出能够更全面的体现出所对应音乐标签的标签向量,可以基于音乐样本,通过标签分类的方式来调整初始标签向量,以将音频特征融入到初始标签向量中。在进行分类训练的过程中,根据音乐样本的音频特征和该标签向量集合,通过分类模型对该音乐样本进行标签分类,得到该音乐样本对应的待定标签,然后根据该待定标签和该音乐样本的样本音乐标签的区别,训练调整该标签向量集合中的初始标签向量,从而使调整后的初始标签向量能够学习到同一类音乐标签下音乐样本所对应音频特征相关的信息。根据该调整后的初始标签向量确定所对应音乐标签的标签向量,该标签向量不仅能够表达所对应音乐标签,而且还可以体现出具有该音乐标签的音乐数据的共同音频特点。相对于相关技术所确定的标签向量,这种携带更丰富信息的标签向量可以更好的运用于与音乐标签相关的各类应用场景,为相似度计算、音乐推荐等提供准确的依据。
[0064]
其中,在基于音乐样本的音频特征确定待定标签时,在不同的分类模型中,该初始标签向量所起的作用可能也有所区别。在一种可能的实现方式中,处理设备可以将该初始标签向量确定为该分类模型采用的类别权重,该类别权重用于标识在进行该标签分类时,该初始标签向量所对应音乐标签的权重,该权重能够体现出该音乐样本所归属各个音乐标签的归属概率。可以理解的是,在对某一音乐样本进行标签分类时,初始标签向量所对应的类别权重越高,该音乐样本归属所对应音乐标签的可能性也就越大。因此,处理设备可以根据该类别权重,通过该分类模型确定该音乐样本对应的待定标签。
[0065]
例如,如图3所示,图3为一种标签分类的示意图,encoder为一种音频编码器,该音频编码器能够用于确定音乐样本所对应的音频特征x;w为用于分类模型softmax的标签向量集合,其中包括多个初始标签向量。例如,当已分类的音乐标签有a、b、c

z这26类时,w中可以包括{w
a
,w
b
,w
c

w
z
}这26个初始标签向量,w
n
用于标识在进行标签分类时,音乐标签n的权重,y为该分类模型所确定出的待定标签,e为单位常数。在该分类模型中,确定音乐样本归属某一音乐标签n的归属概率p的公式如下:
[0066][0067]
n∈(a,b,c

z),
[0068]
n∈(a,b,c

z)
[0069]
其中,e^(x*w
n
)可以代表e的(x*w
n
)次方。在通过该公式确定出该音乐样本归属各个音乐标签的概率后,处理设备可以将其中归属概率最高的音乐标签作为此次标签分类所确定出的待定标签。
[0070]
可以理解的是,由于音乐风格、标签的多样化,同一音乐样本可能对应有多个样本音乐标签,例如,一首歌曲可能同时具有摇滚乐和打击乐的音乐标签。因此,为了使分类模型所确定出的音乐标签能够更加贴合音乐数据的实际情况,在进行模型训练时,处理设备可以综合音乐样本所对应的多个样本音乐标签,对初始标签向量进行训练调整。
[0071]
在一种可能的实现方式中,处理设备可以通过音乐样本所对应的每一个样本音乐标签,分别对初始标签向量进行训练调整。例如,在图3所示的分类模型中,某一音乐样本所
对应的音乐标签可能包括音乐标签a和音乐标签b,处理设备可以分别以音乐标签a作为样本音乐标签和以音乐标签b作为样本音乐标签,对w中的初始标签向量进行训练调整。由于该分类模型是根据音乐样本所归属各个音乐标签的归属概率来确定待定标签,因此,通过上述训练调整,最终可以使分类模型基于调整后的初始标签向量所确定出的归属概率中,该音乐样本归属音乐标签a和音乐标签b的概率较高且相似,从而能够体现出该音乐样本具有a、b两个音乐标签。通过分别训练的方式,处理设备可以使调整后的初始标签向量学习到多个音乐标签中的特性,从而在通过该初始标签向量确定音乐数据对应的音乐标签时,能够确定出贴合该音乐数据的多个音乐标签,进一步提高音乐标签的准确度和综合性。
[0072]
由于音频特征是提高分类模型标签分类准确度的关键因素,因此,如果能够确定出更加精确的音频特征,也有助于进一步提高标签向量中所学习到的音频特征相关信息的信息精度。可以理解的是,音乐数据的音频特征通常是通过时间和频率来确定的,频域能够决定音乐数据中音调的高地,时间能够决定音乐数据中音调的分布,因此,通过时间和频率,可以对音乐数据的音频特征进行较为准确的表示。
[0073]
基于此,在一种可能的实现方式中,处理设备可以根据该音乐样本的频率信息和时间信息,确定该音乐样本对应的特征向量序列,该特征向量序列能够体现出该音乐样本在各个时间段中的频率特征。处理设备可以根据该特征向量序列,通过音频编码器确定该音乐样本对应的音频特征。
[0074]
例如,当音乐样本为一首歌曲时,处理设备首先可以对歌曲进行时间维度的采样,比如每隔0.1s采样一个音频信号,可以得到一个离散的时间序列t1~tn,序列中的每个值代表该歌曲的音频在该采样点上的大小。然后,处理设备可以按照固定时间段,比如按照3s的固定时间段进行组合,则得到的每组序列中就包括了3s/0.1s=30个数值,比如t1~t30可以为1组序列,假设为g1,t30~t60就是g2,依次类推。随后,为了体现出该歌曲在频域上的特点,处理设备可以对每组时间序列做频域变换,得到频率信号,该频率信号能够体现出每一组时间序列里面包含的不同频率的分布情况。其中,频域变换的方式可以包括多种,例如可以包括但不限于快速傅立叶变换(fast fourier transform,简称fft)、mel频率倒谱系数(mel frequency cepstrum coefficient,简称mfcc)、离散傅里叶变换(discrete fourier transform,简称dft)等方式。
[0075]
通过对该频率信号进行采样,例如以10hz为采样标准进行采样,可以得到一个离散的频率序列。假设频率的上下限为0~f,那么每个频率序列的个数为f/10,每个gi(i=1,2,3

n)都可以表示成f/10个频率序列,区别在于基于不同的gi所得到的数值大小不同。对应到歌曲中,可以体现为歌曲的部分音乐低音较重,则这部分对应gi的低频值较大;部分音乐高音较高,这部分对应gi的高频值较大。假设有n个gi,m个频率,则处理设备可以得到一个mxn的矩阵,该矩阵可以为一种频谱图,如图4所示,图4为一种由频率信息和时间信息得到的频谱图的示意图,该频谱图的横轴为时间,时间间隔为1s。在该图中,每隔1.75s可以进行一次切分,得到一个时间片段,竖轴为各个时间片段所对应的频率,频率上下限为110hz~3520hz,颜色深浅代表不同频率对应的数值大小。
[0076]
通过上述处理,处理设备可以采用向量序列{g1,g2

,gn}来表示一个音乐样本,该向量序列即为该音乐样本所对应的特征向量序列。为了能够提高分类模型的处理效率,处理设备可以对该特征向量序列进行进一步的特征提取。例如,在图5所示的分类模型中,
处理设备可以通过音频编码器encoder对特征向量序列{g1,g2

,gn}进行归一化处理,得到音频特征x。其中,该音频编码器encoder可以包括多种类型,只要满足能够将输入的向量序列转化为单一向量即可。例如,该音频编码器可以为长短期记忆网络(long short-term memory,简称lstm)模型、卷积神经网络(convolutional neural networks,简称cnn)模型、注意力机制(transformer)模型等。此外,该音频编码器还可以为单层或多层音频编码器,例如,如果该音频编码器为lstm模型,则可以为单层音频编码器,该音频编码器的输入为gi;如果该音频编码器为cnn模型,则可以为多层音频编码器,该音频编码器的输入可以为一个包括g1~gn的向量矩阵。
[0077]
除了对音频特征所包括的内容进行更加精确的设计外,处理设备还可以对生成该音频特征的音频编码器进行进一步的训练调整。可以理解的是,由于该生成该音频特征的目的在于对音乐数据的音乐标签进行判断,因此,为了使该音频特征能够更加准确的体现出音乐数据在音乐标签分类上的特点,在一种可能的实现方式中,处理设备基于分类模型的分类结果,对该音频编码器的参数进行反馈调节。
[0078]
例如,在通过分类模型得到音乐样本对应的待定标签后,处理设备可以根据该待定标签和该音乐样本的样本音乐标签,训练调整该音频编码器的参数,以及训练调整标签向量集合中的初始标签向量。通过训练调整音频编码器的参数,处理设备可以该音频编码器确定出的音频特征能够更加利于分类模型确定出准确的音乐标签。例如,通过调整音频编码器参数,可以使该音频编码器在确定音频特征时,突出与音乐标签相关的音频特征,并去除部分不利于对音乐标签进行确定的音频特征,如杂音等。由于该音频编码器的参数是基于分类模型的分类结果来进行调整的,因此,在调整过程中,该音频编码器的参数可以更加偏向于突出频率信息和时间信息中,与音乐标签相关的信息部分,从而使得到的音频特征更加适用于对音乐标签进行确定。通过这种方式,处理设备可以实现对分类模型以及音频编码器的双重调节,使该分类模型的输入及处理参数的精确性进一步提高,进而提高最终得到的标签向量中所融合的音频特征信息的精度。
[0079]
在上述分类过程中,处理设备主要基于音乐数据本身所具有的特征对音乐标签进行分类,例如音频特征、创作者风格特征等。然而,在现实生活中,由于音乐数据主要应用于各种会与用户产生交互的场景,例如听歌、电影配乐、ktv演唱等,因此,用户对于音乐数据的喜好同样是对音乐数据进行分析的重要指标。例如,某一用户在听歌时,可能偏好于听取某一类型的歌,因此,该用户所听过的歌曲属于同一音乐标签下的概率可能较高,如喜欢听摇滚乐的用户,其用户歌单里所保存的歌曲有较大概率都可以对应摇滚乐的音乐标签。此外,被同一用户播放的歌曲,其在音乐标签上往往也具有一定的关联关系。例如,在某一用户的播放列表中,可能包括歌曲a、歌曲b和歌曲c三首歌曲,用户在听歌时常常连续播放这三首歌曲,说明这三首歌曲音乐标签所对应的音乐风格较为融洽,适合同时向用户进行推荐。因此,为了能够更好的向用户提供音乐推荐服务,当某一用户欣赏了歌曲a后,处理设备可以继续向该用户推荐歌曲b和歌曲c,从而使用户听到的歌曲之间连贯性更加,避免出现例如用户在听到一首较为舒缓的歌曲后,突然听到一首过于激烈的歌曲而带来一定的不适感的情况。基于此,在确定音乐数据所对应的音乐标签时,处理设备可以将与用户行为相关的信息融入到对分类模型中标签向量的调整中,从而能够结合用户行为对音乐标签进行更加准确的判断,以及向用户提供更加优质的音乐服务。
[0080]
在一种可能的实现方式中,训练调整分类模型所使用的音乐样本可以包括第一音乐样本和第二音乐样本,该音乐样本间还包括用户行为标签,该用户行为标签可以用于标识不同音乐样本是否被基于同一用户标识播放,该用户标识用于标识与该音乐样本产生交互的用户。例如,该用户行为标签中可以包括0或1中的一个数值,若第一音乐样本和第二音乐样本间的用户行为标签数值为1,则可以表明这两个音乐样本被基于同一用户标识播放过;若该用户行为标签的数值为0,则表明这两个音乐样本未被基于同一用户标识播放过。
[0081]
可以理解的是,由于用户的音乐欣赏风格通常比较固定,因此,如果两个音乐数据被基于同一用户标识播放过,那么这两个音乐数据多对应的音乐标签相同的可能性较高;此外,由于用户在听歌时,可能比较倾向于欣赏风格较为相似的歌曲,因此被基于同一用户标识播放播放的音乐数据在音乐标签上的相似度可能较高。基于此,处理设备可以获取该第一音乐样本、第二音乐样本以及与该第一音乐样本和第二音乐样本相关的目标用户行为标签,该目标用户行为标签可以用于标识该第一音乐样本和第二音乐样本是否被基于同一用户标识播放。
[0082]
其中,由于该音乐样本被用于训练调整分类模型中的标签向量,因此,该音乐样本在该分类模型中具有与其样本音乐标签对应的标签向量,该标签向量能够体现出该样本音乐标签下音乐数据的音频特点,从而在一定程度上,在训练过程中处理设备可以通过标签向量对音乐样本进行表达。为了能够在音频特点的基础上,在标签向量中进一步融入用户行为特点,处理设备可以根据第一音乐样本所对应样本音乐标签的第一标签向量,以及该第二音乐样本所对应样本音乐标签的第二标签向量,确定该第一音乐样本与该第二音乐样本间的相似度,然后基于该相似度得到与该第一音乐样本和第二音乐样本相关的待定用户行为标签。可以理解的是,标签向量之间相似度越高,说明音乐样本所对应样本音乐标签相同或音乐风格较为融洽的可能性也就越大,此时被同一用户播放过的可能性也就越高。因此,在向用户推荐音乐数据时,处理设备可以将对应的用户行为标签为被基于同一用户标识播放过的多个音乐数据推荐给同一用户,以提高该用户的音乐欣赏体验。
[0083]
由于该第一标签向量和第二标签向量中此时还未融入用户行为特点,因此,该待定用户行为标签和目标用户行为标签之间可能存在一定的差异。为了能够将用户行为特点也融入到标签向量中,处理设备可以通过该目标用户行为标签和待定用户行为标签,对第一标签向量和第二标签向量进行调整。
[0084]
例如,当待定用户行为标签和目标用户行为标签不同时,处理设备可以通过调整第一标签向量和第二标签向量,来改变标签向量之间的相似度,使该相似度满足处理设备能够得到与目标用户行为标签相似或相同的待定用户行为标签。由于是基于用户行为特征对标签向量进行调整,因此,在调整后的标签向量中能够融入与用户特征相关的信息,从而使分类模型基于该标签向量所确定出的音乐标签能够更加准确的反映出用户层面的音乐数据欣赏特点,使用户在基于音乐标签播放音乐数据时,能够更加贴合用户的欣赏品味。。
[0085]
其中,处理设备确定标签向量间相似度的方式也可以包括多种。在一种可能的实现方式中,为了提高相似度的确定效率以及确定精度,处理设备可以通过相似度模型来对相似度进行确定。
[0086]
上已述及,通过标签编码器对向量序列进行归一化处理,可以在简化模型处理复杂度的同时,突出向量序列中的主要特征,而同一音乐样本所对应的标签向量也可以包括
多个,多个标签向量同样能够构成一个向量序列,因此,为了提高相似度模型的处理效率和处理精度,在一种可能的实现方式中,处理设备可以根据第一标签向量,通过第一标签编码器确定该第一音乐样本对应的第一标签向量特征,该第一标签向量特征为第一标签向量经过归一化处理得到的输出结果,能够体现出该第一标签向量中的主要向量特征。同理,处理设备可以根据第二标签向量,通过第二标签编码器确定第二音乐样本对应的第二标签向量特征。
[0087]
可以理解的是,在使用音乐数据时,所展现出的特点基本为音乐数据本身的音乐特点,因此在上述训练调整过程中,当采用了模型进行训练特征时,为了提高模型训练的效果,处理设备还可以进一步削弱模型本身的因素对音乐数据的影响。例如,为了使相似度模型在确定相似度时,能够只基于该第一音乐样本和第二音乐样本自身的区别来计算相似度,避免其他因素的干扰,在一种可能的实现方式中,处理设备可以控制标签编码器中的参数,使该第一标签编码器和第二标签编码器具有相同的编码器参数。从而使标签编码器输出的标签向量特征之间的区别和相似的特点能够体现出标签向量本身的关联关系,排除通过标签编码器确定标签向量特征时对该标签向量所产生的干扰。处理设备可以根据该第一标签向量特征和第二标签向量特征,通过相似度模型来确定第一音乐样本与第二音乐样本间的相似度。由于该第一标签编码器和第二标签编码器的编码器参数相同,因此,在进行相似度计算时,标签编码器对于第一音乐样本的影响和对第二音乐样本的影响也是相近的,从而该相似度模型所确定出的相似度能够体现出两个音乐样本本身的相似度,该音乐样本之间的相似度能够体现出音乐样本之间的关联关系。
[0088]
如图6所示,图6为本申请实施例提供的一种相似度确定方法的示意图,该相似度模型可以为一种二元选择(binary)模型,该模型能够确定输入模型的第一标签向量特征α和第二标签向量特征β之间的相似度,并根据该相似度输出“0”或“1”作为输出结果,“0”表示两个标签向量特征之间的相似度较低,即该第一音乐样本和第二音乐样本大概率未被基于同一用户标识播放过;“1”标识两个标签向量特征之间的相似度较高,即该第一音乐样本和第二音乐样本大概率被基于同一用户标识播放过。其中,第一音乐样本所对应的样本音乐标签为标签a、b、c,因此第一标签向量为w
a
、w
b
、w
c
,第一标签向量特征α是第一标签编码器encoder根据第一标签向量确定出的;第二音乐样本所对应的样本音乐标签为标签d、e、f,因此第二标签向量为w
d
、w
e
、w
f
,第二标签向量特征β是第二标签编码器encoder根据第二标签向量确定出的。
[0089]
除了能够对相似度确定的方法进行更加精确的设计外,为了进一步提高对标签向量进行调整的准确度,本申请实施例还对训练调整标签向量的方式进行设计。在一种可能的实现方式中,由于第一标签向量特征和第二标签向量特征在输入相似度模型后,可以变为该相似度模型中的部分参数,因此,处理设备首先可以根据目标用户行为标签和待定用户行为标签,通过该相似度模型训练调整该第一标签向量特征和第二标签向量特征。
[0090]
例如,在图6所示的示意图中,当待定用户行为标签为0,目标用户行为标签为1时,处理设备可以通过训练调整第一标签向量特征和第二标签向量特征,使该相似度模型输出的结果能够向1接近。通过该训练调整,处理设备可以得到调整后的第一标签向量特征和调整后的第二标签向量特征,该训练后的标签向量特征能够进一步突出与用户行为特征相似度相关的信息。
[0091]
由于该标签向量特征是通过标签编码器编码得到的,因此该调整后的标签向量特征可以作为该标签编码器的期望输出,反馈到标签编码器中对标签编码器的参数进行调节。其中,作为第一标签编码器和第二标签编码器的输入,第一标签向量和第二标签向量同样可以分别看做第一标签编码器和第二标签编码器的编码器参数之一。因此,通过该标签编码器的期望输出,处理设备可以对该第一标签向量和第二标签进行训练调整。在本申请实施例中,处理设备可以根据调整后的第一标签向量特征,通过第一标签编码器训练调整第一标签向量,并根据调整后的第二标签向量特征,通过第二标签编码器训练调整第二标签向量,从而使调整后的标签向量中能够融入更多与用户行为特征相关的信息,该信息可以使处理设备在与用户之间进行与音乐数据相关的交互时,能够向用户推荐音乐风格较为相似或音乐风格之间关联性较强的音乐数据,从而提高用户的音乐观感。
[0092]
例如,在图6所示的示意图中,在得到调整后的第一标签向量特征α和和第二标签向量特征β后,处理设备可以根据调整后的α,通过第一标签编码器训练调整第一标签向量w
a
、w
b
、w
c
,根据调整后的β通过第二标签编码器训练调整第二标签向量w
d
、w
e
、w
f
。由于该示意图中的目标用户行为标签为1,因此,通过该训练调整,可以使该标签向量中学习到用户行为特征相关的信息,这些信息能够加强对应音乐标签a、b、c的音乐数据和对应音乐标签d、e、f的音乐数据之间的关联关系,从而有较大概率会被处理设备推荐给同一用户。
[0093]
可以理解的是,由于第一音乐样本和第二音乐样本都是用于对上述分类模型进行训练调整的音乐样本,因此第一标签向量和第二标签向量是同一分类模型中的模型参数。因此,通过设置第一标签编码器和第二标签编码器具有相同的编码器参数,还可以在对标签向量进行训练调整的过程中,保持该第一标签向量和第二标签向量中某些特性的一致性,使该第一标签向量和第二标签向量在基于用户行为特征进行调整后,还可以应用于同一分类模型中。
[0094]
为了便于理解本申请提供的技术方案,接下来,将结合一种实际应用场景,对本申请实施例提供的一种音乐标签的向量确定方法进行介绍。在该实际应用场景中,处理设备可以为某一音乐软件的后台服务器,该后台服务器能够获取该音乐软件的用户的听歌数据以及每一首歌曲的数据信息。
[0095]
首先,后台服务器可以基于歌曲数据信息中的频率信息和时间信息,通过编码器确定出每一首歌曲对应的音频特征,然后通过该音频特征和分类模型中的标签向量集合,对该分类模型进行训练调整,得到各个音乐标签所对应的标签向量,从而能够为每一首歌曲打上准确的音乐标签。
[0096]
随后,后台服务器可以获取每一个用户的听歌列表,并通过同一听歌列表中的歌曲信息来进一步训练各个音乐标签所对应的标签向量,使该标签向量中除了融合音频特征外,还能够融合用户行为特征,体现出各个音乐标签在用户层面上的关联关系。通过上述训练调整得到的标签向量,后台服务器在向用户提供音乐服务时,不但能够向用户提供分类准确的歌曲,还能够自动向用户推荐接受度较高的歌曲,从而提高用户使用该音乐软件的体验,改善服务质量。
[0097]
基于上述实施例提供的一种音乐标签的向量确定方法,本申请实施例还提供了一种音乐标签的向量确定装置。参见图7,图7为本申请实施例提供的一种音乐标签的向量确定装置700的结构框图,该装置700包括第一确定单元701、分类单元702、第一训练单元703
和第二确定单元704:
[0098]
第一确定单元701,用于基于已分类的音乐标签的数量确定标签向量集合,所述标签向量集合包括与所述已分类的音乐标签一一对应的初始标签向量;
[0099]
分类单元702,用于根据音乐样本的音频特征和所述标签向量集合,通过分类模型对所述音乐样本进行标签分类,得到所述音乐样本对应的待定标签;
[0100]
第一训练单元703,用于根据所述待定标签和所述音乐样本的样本音乐标签,训练调整所述标签向量集合中的初始标签向量;
[0101]
第二确定单元704,用于根据调整后的初始标签向量确定所对应音乐标签的标签向量。
[0102]
在一种可能的实现方式中,分类单元702具体用于:
[0103]
将所述初始标签向量确定为所述分类模型采用的类别权重,所述类别权重用于标识在进行所述标签分类时,所述初始标签向量所对应音乐标签的权重;
[0104]
根据所述类别权重,通过所述分类模型确定所述音乐样本对应的待定标签。
[0105]
在一种可能的实现方式中,装置700还包括第三确定单元和第四确定单元:
[0106]
第三确定单元,用于根据所述音乐样本的频率信息和时间信息,确定所述音乐样本对应的特征向量序列;
[0107]
第四确定单元,用于根据所述特征向量序列,通过音频编码器确定所述音乐样本对应的音频特征。
[0108]
在一种可能的实现方式中,第一训练单元703具体用于:
[0109]
根据所述待定标签和所述音乐样本的样本音乐标签,训练调整所述音频编码器的参数,以及训练调整所述标签向量集合中的初始标签向量。
[0110]
在一种可能的实现方式中,所述音乐样本间还包括用户行为标签,所述用户行为标签用于标识不同音乐样本是否被基于同一用户标识播放,所述音乐样本包括第一音乐样本和第二音乐样本,装置700还包括获取单元、第五确定单元、第六确定单元和第二训练单元:
[0111]
获取单元,用于获取所述第一音乐样本、所述第二音乐样本以及与所述第一音乐样本和第二音乐样本相关的目标用户行为标签;
[0112]
第五确定单元,用于根据所述第一音乐样本所对应样本音乐标签的第一标签向量,以及所述第二音乐样本所对应样本音乐标签的第二标签向量,确定所述第一音乐样本与所述第二音乐样本间的相似度;
[0113]
第六确定单元,用于基于所述相似度得到与所述第一音乐样本和第二音乐样本相关的待定用户行为标签;
[0114]
第二训练单元,用于通过所述目标用户行为标签和所述待定用户行为标签,对所述第一标签向量和所述第二标签向量进行调整。
[0115]
在一种可能的实现方式中,第五确定单元具体用于:
[0116]
根据所述第一标签向量,通过第一标签编码器确定所述第一音乐样本对应的第一标签向量特征;
[0117]
根据所述第二标签向量,通过第二标签编码器确定所述第二音乐样本对应的第二标签向量特征,所述第一标签编码器和所述第二标签编码器具有相同的编码器参数;
[0118]
根据所述第一标签向量特征和所述第二标签向量特征,通过相似度模型确定所述第一音乐样本与所述第二音乐样本间的相似度。
[0119]
在一种可能的实现方式中,第二训练单元具体用于:
[0120]
根据所述目标用户行为标签和所述待定用户行为标签,通过所述相似度模型训练调整所述第一标签向量特征和所述第二标签向量特征;
[0121]
根据调整后的第一标签向量特征,通过所述第一标签编码器训练调整所述第一标签向量;
[0122]
根据调整后的第二标签向量特征,通过所述第二标签编码器训练调整所述第二标签向量。
[0123]
本申请实施例还提供了一种计算机设备,下面结合附图对该设备进行介绍。请参见图8所示,本申请实施例提供了一种设备,该设备还可以是终端设备,该终端设备可以为包括手机、平板电脑、个人数字助理(personal digital assistant,简称pda)、销售终端(point of sales,简称pos)、车载电脑等任意智能终端,以终端设备为手机为例:
[0124]
图8示出的是与本申请实施例提供的终端设备相关的手机的部分结构的框图。参考图8,手机包括:射频(radio frequency,简称rf)电路810、存储器820、输入单元830、显示单元840、传感器850、音频电路860、无线保真(wireless fidelity,简称wifi)模块870、处理器880、以及电源890等部件。本领域技术人员可以理解,图8中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0125]
下面结合图8对手机的各个构成部件进行具体的介绍:
[0126]
rf电路810可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器880处理;另外,将设计上行的数据发送给基站。通常,rf电路810包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(low noise amplifier,简称lna)、双工器等。此外,rf电路810还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(global system of mobile communication,简称gsm)、通用分组无线服务(general packet radio service,简称gprs)、码分多址(code division multiple access,简称cdma)、宽带码分多址(wideband code division multiple access,简称wcdma)、长期演进(long term evolution,简称lte)、电子邮件、短消息服务(short messaging service,简称sms)等。
[0127]
存储器820可用于存储软件程序以及模块,处理器880通过运行存储在存储器820的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器820可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器820可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0128]
输入单元830可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元830可包括触控面板831以及其他输入设
备832。触控面板831,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板831上或在触控面板831附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板831可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器880,并能接收处理器880发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板831。除了触控面板831,输入单元830还可以包括其他输入设备832。具体地,其他输入设备832可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
[0129]
显示单元840可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元840可包括显示面板841,可选的,可以采用液晶显示器(liquid crystal display,简称lcd)、有机发光二极管(organic light-emitting diode,简称oled)等形式来配置显示面板841。进一步的,触控面板831可覆盖显示面板841,当触控面板831检测到在其上或附近的触摸操作后,传送给处理器880以确定触摸事件的类型,随后处理器880根据触摸事件的类型在显示面板841上提供相应的视觉输出。虽然在图8中,触控面板831与显示面板841是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板831与显示面板841集成而实现手机的输入和输出功能。
[0130]
手机还可包括至少一种传感器850,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板841的亮度,接近传感器可在手机移动到耳边时,关闭显示面板841和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
[0131]
音频电路860、扬声器861,传声器862可提供用户与手机之间的音频接口。音频电路860可将接收到的音频数据转换后的电信号,传输到扬声器861,由扬声器861转换为声音信号输出;另一方面,传声器862将收集的声音信号转换为电信号,由音频电路860接收后转换为音频数据,再将音频数据输出处理器880处理后,经rf电路810以发送给比如另一手机,或者将音频数据输出至存储器820以便进一步处理。
[0132]
wifi属于短距离无线传输技术,手机通过wifi模块870可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图8示出了wifi模块870,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
[0133]
处理器880是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器820内的软件程序和/或模块,以及调用存储在存储器820内的数据,执行手机的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器880可包括一个或多个处理单元;优选的,处理器880可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器880中。
[0134]
手机还包括给各个部件供电的电源890(比如电池),优选的,电源可以通过电源管理系统与处理器880逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
[0135]
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
[0136]
在本实施例中,该终端设备所包括的处理器880还具有以下功能:
[0137]
基于已分类的音乐标签的数量确定标签向量集合,所述标签向量集合包括与所述已分类的音乐标签一一对应的初始标签向量;
[0138]
根据音乐样本的音频特征和所述标签向量集合,通过分类模型对所述音乐样本进行标签分类,得到所述音乐样本对应的待定标签;
[0139]
根据所述待定标签和所述音乐样本的样本音乐标签,训练调整所述标签向量集合中的初始标签向量;
[0140]
根据调整后的初始标签向量确定所对应音乐标签的标签向量。
[0141]
本申请实施例还提供一种服务器,请参见图9所示,图9为本申请实施例提供的服务器900的结构图,服务器900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,简称cpu)922(例如,一个或一个以上处理器)和存储器932,一个或一个以上存储应用程序942或数据944的存储介质930(例如一个或一个以上海量存储设备)。其中,存储器932和存储介质930可以是短暂存储或持久存储。存储在存储介质930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器922可以设置为与存储介质930通信,在服务器900上执行存储介质930中的一系列指令操作。
[0142]
服务器900还可以包括一个或一个以上电源926,一个或一个以上有线或无线网络接口950,一个或一个以上输入输出接口958,和/或,一个或一个以上操作系统941,例如windows servertm,mac os xtm,unixtm,linuxtm,freebsdtm等等。
[0143]
上述实施例中由服务器所执行的步骤可以基于图9所示的服务器结构。
[0144]
本申请实施例还提供一种计算机可读存储介质,用于存储计算机程序,该计算机程序用于执行前述各个实施例所述的音乐标签的向量确定方法中的任意一种实施方式。
[0145]
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质可以是下述介质中的至少一种:只读存储器(英文:read-only memory,缩写:rom)、ram、磁碟或者光盘等各种可以存储程序代码的介质。
[0146]
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0147]
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1