音乐播放方法、音乐播放装置和终端设备与流程

文档序号:32379396发布日期:2022-11-30 01:32阅读:73来源:国知局
音乐播放方法、音乐播放装置和终端设备与流程

1.本公开涉及多媒体技术领域,尤其是音乐播放方法、音乐播放装置和终端设备。


背景技术:

2.相关技术中,可以基于用户发出的语音指令识别用户身份,并基于识别出的用户身份向用户推送一些个性化音乐。
3.然而,这需要用户费时费力地提前进行声纹录入以将自己的声纹特征保存在声纹库中,用户体验不佳。


技术实现要素:

4.为了解决上述问题,本公开实施例提出了如下解决方案。
5.根据本公开实施例的一方面,提供一种音乐播放方法,包括:接收请求唤醒终端设备的第一语音指令;接收请求播放音乐的第二语音指令;判断声纹库中是否有与所述第一语音指令的第一声纹特征匹配的基准声纹特征,以得到第一判断结果;判断声纹库中是否有与所述第二语音指令的第二声纹特征匹配的基准声纹特征,以得到第二判断结果;在第一判断结果和第二判断结果均为否的情况下,判断所述第一声纹特征和所述第二声纹特征是否匹配,以得到第三判断结果;在第三判断结果为是的情况下,播放歌曲,并将所述第一声纹特征和所述第二声纹特征中的至少一个作为基准声纹特征与用户标识对应地保存在声纹库中。
6.在一些实施例中,所述第二语音指令不包括对歌曲的限定;所述方法还包括:在第一判断结果和第二判断结果均为是的情况下,判断与所述第一声纹特征匹配的基准声纹特征的第一用户标识和与所述第二声纹特征匹配的基准声纹特征的第二用户标识是否相同,以得到第四判断结果;在第四判断结果为是的情况下,查询与所述第一用户标识对应的第一播放记录;基于所述第一播放记录确定第一歌曲,并播放所述第一歌曲。
7.在一些实施例中,所述第一播放记录包括第一组已播放歌曲中每首歌的播放信息,所述播放信息包括该首歌的歌曲名称和音乐风格中的至少一个;基于所述第一播放记录确定第一歌曲包括:从第一组歌曲和第二组歌曲中的至少一组中确定所述第一歌曲,其中,所述第一组歌曲是基于音乐风格确定的,所述第二组歌曲是基于歌曲名称确定的。
8.在一些实施例中,所述第一组歌曲根据如下方式确定:确定每种音乐风格在所述第一播放记录中所占的第一比例;确定第一比例大于第一阈值的一种或多种音乐风格;将符合所述一种或多种音乐风格的歌曲确定为所述第一组歌曲。
9.在一些实施例中,所述第二组歌曲根据如下方式确定:确定每首歌在所述第一播放记录中所占的第二比例;确定第二比例大于第二阈值的一首或多首歌;查询不同于所述第一用户标识的第三用户标识对应的第二播放记录,所述第二播放记录包括第二组已播放歌曲中每首歌的所述播放信息,所述第二组已播放歌曲包括所述一首或多首歌;确定每首歌在所述第二播放记录中所占的第三比例;将第三比例大于第三阈值的歌曲确定为所述第
二组歌曲。
10.在一些实施例中,从第一组歌曲和第二组歌曲中确定歌曲包括:确定属于所述第一组歌曲和所述第二组歌曲的第三组歌曲;从第三组歌曲中确定所述第一歌曲。
11.在一些实施例中,每首歌的播放信息还包括该首歌在结束播放时的播放时长占总时长的第四比例;基于所述第一播放记录确定歌曲还包括:确定每首歌在所述第一播放记录中的第四比例的平均值小于第四阈值的第四组歌曲,所述第一组歌曲和所述第二组歌曲不包括所述第四组歌曲。
12.在一些实施例中,所述方法还包括:在第三判断结果为否的情况下,不保存所述第一声纹特征和所述第二声纹特征,并播放歌曲。
13.在一些实施例中,所述方法还包括:在第四判断结果为否的情况下,进入睡眠模式。
14.根据本公开实施例的另一方面,提供一种音乐播放装置,包括:接收模块,被配置为接收请求唤醒终端设备的第一语音指令;接收请求播放音乐的第二语音指令;判断模块,被配置为判断声纹库中是否有与所述第一语音指令的第一声纹特征匹配的基准声纹特征,以得到第一判断结果;判断声纹库中是否有与所述第二语音指令的第二声纹特征匹配的基准声纹特征,以得到第二判断结果;在第一判断结果和第二判断结果均为否的情况下,判断所述第一声纹特征和所述第二声纹特征是否匹配,以得到第三判断结果;播放模块,被配置为在第三判断结果为是的情况下,播放歌曲,并将所述第一声纹特征和所述第二声纹特征中的至少一个作为基准声纹特征与用户标识对应地保存在声纹库中。
15.根据本公开实施例的又一方面,提供一种音乐播放装置,包括:存储器;和耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行上述任意一个实施例所述的方法。
16.根据本公开实施例的再一方面,提供一种终端设备,包括:上述任意一个实施例所述的音乐播放装置。
17.根据本公开实施例的再一方面,提供一种计算机可读存储介质,包括计算机可执行指令,所述计算机可执行指令在由一个或多个处理器执行时,使得所述一个或多个处理器执行上述任意一个实施例所述的方法。
18.本公开实施例中,一方面,在第一声纹特征和第二声纹特征均无法与声纹库的基准声纹特征匹配的情况下,将相互匹配的第一声纹特征和第二声纹特征中的至少一个作为基准声纹特征保存在声纹库中。如此,无需进行额外的声纹录入就能够实现个性化音乐的推送,从而提高用户体验。另一方面,声纹特征并不是简单地在接收到第一语音指令之后就被保存,而是在第三判断结果为是的情况下被保存,故,声纹库的存储空间可以被有效利用。
附图说明
19.为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
20.图1是根据本公开一些实施例的音乐播放方法的流程图;
21.图2是根据本公开另一些实施例的音乐播放方法的流程图;
22.图3是根据本公开一些实施例的音乐播放装置的结构示意图;
23.图4是根据本公开另一些实施例的音乐播放装置的结构示意图。
具体实施方式
24.下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
25.除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
26.同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
27.对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
28.在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
29.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
30.图1是根据本公开一些实施例的音乐播放方法的流程图。
31.如图1所示,音乐播放方法包括步骤102至步骤112。
32.在步骤102,接收请求唤醒终端设备的第一语音指令。
33.应理解,终端设备具备接收语音和播放音乐的功能。例如,终端设备可以是智能音箱或手机等。
34.在一些实施例中,第一语音指令可以包括提供终端设备的厂商预设的或用户自定义的唤醒词。例如,首先,终端设备处于睡眠模式。在接收到第一语音指令后,终端设备由睡眠模式进入唤醒模式,从而可以执行步骤104。
35.在步骤104,接收请求播放音乐的第二语音指令。
36.在一些实施例中,第二语音指令可以包括对歌曲的限定。例如,第二语音指令可以包括具体的歌曲名称或特定的音乐风格,例如,流行音乐、摇滚乐、纯音乐等。
37.在又一些实施例中,第二语音指令不包括对歌曲的限定。例如,第二语音指令为“请播放音乐”。
38.在步骤106,判断声纹库中是否有与第一语音指令的第一声纹特征匹配的基准声纹特征,以得到第一判断结果。
39.在步骤108,判断声纹库中是否有与第二语音指令的第二声纹特征匹配的基准声纹特征,以得到第二判断结果。
40.这里,可以利用合适的声纹识别算法来进行判断。例如,可以通过比对两个声纹特征的共振峰的分布情况来进行判断。
41.在一些实施例中,声纹库可以包括多个基准声纹特征。每个基准声纹特征具有对应的用户标识。
42.例如,可以在声纹录入阶段采集用户发出的语音a。可以基于语音a提取该用户的声纹特征,并将声纹特征作为基准声纹特征与该用户的用户标识对应地保存在声纹库中。当后续接收到由该用户发出的语音b(例如,第一语音指令或第二语音指令)时,语音b的声纹特征可以与声纹库中的基准声纹特征相匹配,从而可以确定语音b和语音a的发声者相同。
43.应理解,步骤106可以在步骤104之后执行,也可以在步骤104之前执行。还应理解,步骤104和步骤106可以同时执行。
44.在步骤110,在第一判断结果和第二判断结果均为否的情况下,判断第一声纹特征和第二声纹特征是否匹配,以得到第三判断结果。
45.换言之,在声纹库中不存在与第一声纹特征匹配的基准声纹特征并且也不存在与第二声纹特征匹配的基准声纹特征的情况下,进一步判断第一语音指令和第二语音指令的发声者是否相同。
46.在步骤112,在第三判断结果为是的情况下,播放歌曲,并将第一声纹特征和第二声纹特征中的至少一个作为基准声纹特征与用户标识对应地保存在声纹库中。
47.换言之,在第一语音指令和第二语音指令的发声者相同的情况下,播放歌曲,并将第一声纹特征和第二声纹特征中的至少一个作为基准声纹特征与用户标识对应地保存在声纹库中。
48.例如,可以将第一声纹特征和第二声纹特征都作为基准声纹特征保存在声纹库中。第一声纹特征和第二声纹特征对应相同的用户标识。可以理解的是,该用户标识不同于步骤106至步骤108的声纹库所包括的任何基准声纹特征的用户标识。如此,可以提高声纹识别的准确性。
49.在一些实施例中,在第三判断结果为否的情况下,不保存第一声纹特征和第二声纹特征,并播放歌曲。如此,可以提高声纹库的存储空间的有效利用率。
50.上述实施例中,一方面,在第一声纹特征和第二声纹特征均无法与声纹库的基准声纹特征匹配的情况下,将相互匹配的第一声纹特征和第二声纹特征中的至少一个作为基准声纹特征保存在声纹库中。如此,无需进行额外的声纹录入就能够实现个性化音乐的推送,从而提高用户体验。另一方面,声纹特征并不是简单地在接收到第一语音指令之后就被保存,而是在第三判断结果为是的情况下被保存,故,声纹库的存储空间可以被有效利用。
51.图2是根据本公开另一些实施例的音乐播放方法的流程图。
52.如图2所示,音乐播放方法还包括步骤202至步骤206。
53.这里,步骤104中的第二语音指令不包括对歌曲的限定。
54.在步骤202,在第一判断结果和第二判断结果均为是的情况下,判断与第一声纹特征匹配的基准声纹特征的第一用户标识和与第二声纹特征匹配的基准声纹特征的第二用户标识是否相同,以得到第四判断结果。
55.换言之,在声纹库中存在与第一声纹特征匹配的基准声纹特征并且也存在与第二声纹特征匹配的基准声纹特征的情况下,进一步判断第一语音指令和第二语音指令的发声者是否相同。
56.在步骤204,在第四判断结果为是的情况下,查询与第一用户标识对应的第一播放记录。
57.换言之,当第一语音指令和第二语音指令的发声者相同时,查询与第一用户标识(或第二用户标识)对应的第一播放记录。
58.在一些实施例中,第一播放记录包括第一组已播放歌曲中每首歌的播放信息。每首歌的播放信息可以包括该首歌的歌曲名称和音乐风格中的至少一个。
59.例如,声纹库包括某用户的基准声纹特征。每当该用户先后发出第一语音指令和第二语音指令时,为该用户播放歌曲,并将该首歌的播放信息保存到与该用户的标识对应的第一播放记录。
60.在一些实施例中,在第四判断结果为否的情况下,进入睡眠模式。因用户标识会影响到个性化推送的内容,故,在第一用户标识和第二用户标识不同的情况下进入睡眠模式能够确保个性化推送的歌曲的准确性,从而可以提高用户体验。
61.应理解,用户的第一播放记录能够反映该用户对音乐的偏好。
62.在步骤206,基于第一播放记录确定第一歌曲,并播放第一歌曲。
63.后文将结合一些实施例说明如何基于第一播放记录确定第一歌曲。
64.上述实施例中,在第一声纹特征和第二声纹特征匹配的基准声纹特征的用户标识相同的情况下,播放基于与该用户标识对应第一播放记录确定的歌曲。如此,可以在提高用户身份识别的准确率的情况下,实现个性化的音乐推送,从而提高用户体验。
65.下面将结合一些实施例说明如何基于第一播放记录确定第一歌曲。
66.在一些实施例中,从第一组歌曲和第二组歌曲中的至少一组中确定第一歌曲。第一组歌曲是基于音乐风格确定的。第二组歌曲是基于歌曲名称确定的。
67.下面将给出确定第一组歌曲和第二组歌曲的一些实现方式。
68.在一些实现方式中,首先确定每种音乐风格在第一播放记录中所占的第一比例。然后,确定第一比例大于第一阈值的一种或多种音乐风格。最后,将符合该一种或多种音乐风格的歌曲确定为第一组歌曲。
69.在一些实现方式中,首先确定每首歌在第一播放记录中所占的第二比例。然后,确定第二比例大于第二阈值的一首或多首歌。接着,查询不同于第一用户标识的第三用户标识对应的第二播放记录。类似地,第二播放记录包括第二组已播放歌曲中每首歌的播放信息。这里,第二组已播放歌曲包括第二比例大于第二阈值的一首或多首歌。然后,确定每首歌在第二播放记录中所占的第三比例。最后,将第三比例大于第三阈值的歌曲确定为第二组歌曲。
70.例如,可以将第一组歌曲作为待播曲库,并播放符合用户常听的一种或多种音乐风格的第一组歌曲中的第一歌曲。如此,可以在保证待播曲库的歌曲数量的同时,提高用户体验。
71.又例如,可以将第二组歌曲作为待播曲库,并播放相似用户常听的第二组歌曲中的第一歌曲。如此,可以在保证待播曲库的歌曲数量的同时,提高用户体验。
72.再例如,可以从第一组歌曲和第二组歌曲中确定属于第一组歌曲和第二组歌曲的第三组歌曲。然后,可以将第三组歌曲作为待播曲库,并播放从第三组歌曲中确定的第一歌曲。如此,可以在保证待播曲库的歌曲数量的同时,进一步提高用户体验。
73.在一些实施例中,每首歌的播放信息还包括该首歌在结束播放时的播放时长占总时长的第四比例。在这种情况下,可以确定每首歌在第一播放记录中的第四比例的平均值小于第四阈值的第四组歌曲。上述第一组歌曲和第二组歌曲不包括第四组歌曲。
74.因第四比例可以反映用户对歌曲的喜爱程度,故,通过将第四比例的平均值小于第四阈值的第四组歌曲从第一组歌曲和第二组歌曲中移除,可以在保证待播曲库的歌曲数量的同时,进一步提高用户体验。
75.图3是根据本公开一些实施例的音乐播放装置的结构示意图。
76.如图3所示,音乐播放装置包括接收模块301、判断模块302和播放模块303。
77.接收模块301被配置为被配置为接收请求唤醒终端设备的第一语音指令;接收请求播放音乐的第二语音指令。
78.判断模块302被配置为判断声纹库中是否有与第一语音指令的第一声纹特征匹配的基准声纹特征,以得到第一判断结果;判断声纹库中是否有与第二语音指令的第二声纹特征匹配的基准声纹特征,以得到第二判断结果;在第一判断结果和第二判断结果均为否的情况下,判断第一声纹特征和第二声纹特征是否匹配,以得到第三判断结果。
79.播放模块303被配置为:在第三判断结果为是的情况下,播放歌曲,并将第一声纹特征和第二声纹特征中的至少一个作为基准声纹特征与用户标识对应地保存在声纹库中。
80.在一些实施例中,音乐播放装置还包括未示出的查询模块。
81.判断模块302还被配置为在第一判断结果和第二判断结果均为是的情况下,判断与第一声纹特征匹配的基准声纹特征的第一用户标识和与第二声纹特征匹配的基准声纹特征的第二用户标识是否相同,以得到第四判断结果。
82.查询模块被配置为在第四判断结果为是的情况下,查询与第一用户标识对应的第一播放记录。
83.播放模块303还被配置为基于第一播放记录确定第一歌曲,并播放第一歌曲。
84.图4是根据本公开另一些实施例的音乐播放装置的结构示意图。
85.如图4所示,音乐播放装置400包括存储器401以及耦接至该存储器401的处理器402,处理器402被配置为基于存储在存储器401中的指令,执行前述任意一个实施例所述的音乐播放方法。
86.存储器401例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如可以存储有操作系统、应用程序、引导装载程序(boot loader)以及其他程序等。
87.音乐播放装置400还可以包括输入输出接口403、网络接口404、存储接口405等。这些接口403、404、405之间、以及存储器401与处理器402之间例如可以通过总线406连接。输入输出接口403为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口404为各种联网设备提供连接接口。存储接口405为sd卡、u盘等外置存储设备提供连接接口。
88.本公开实施例还提供了一种包括上述任意一个实施例所述的音乐播放装置的终端设备。
89.本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机可执行指令,该指令在由一个或多个处理器执行时实现上述任意一个实施例的方法。
90.至此,已经详细描述了本公开的各实施例。为了避免遮蔽本公开的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里
公开的技术方案。
91.本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于音乐播放装置和终端设备实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
92.另外,在本公开的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性和顺序。
93.本领域内的技术人员应当明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
94.本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解,可由计算机程序指令实现流程图中一个流程或多个流程和/或方框图中一个方框或多个方框中指定的功能。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
95.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
96.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
97.虽然已经通过示例对本公开的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上示例仅是为了进行说明,而不是为了限制本公开的范围。本领域的技术人员应该理解,可在不脱离本公开的范围和精神的情况下,对以上实施例进行修改或者对部分技术特征进行等同替换。本公开的范围由所附权利要求来限定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1