资源信息的推送方法和电子装置与流程

文档序号:30962318发布日期:2022-07-30 14:11阅读:88来源:国知局
资源信息的推送方法和电子装置与流程

1.本技术涉及智能家居领域,具体而言,涉及一种资源信息的推送方法和电子装置。


背景技术:

2.在有多媒体资源(例如,音乐、短视频等)播放需求时,用户可能并不会指定某一个或某种风格的多媒体资源进行播放,而是随机播放不同类型的多媒体资源。因此,具有多媒体资源播放功能的播放软件需要针对用户当下时刻的需求,推荐对应类型的多媒体资源进行播放。
3.目前,相关技术中的多媒体资源的推荐方式,是基于历史播放或互动记录进行推荐的,也有通过用户个人画像进行推荐的。这些方式都需要用户不断使用多媒体资源播放功能,累计一定量的用户数据之后,才能根据历史数据建立用户模型进行推荐。如果用户数据的累计量不足,或者用户的资源风格不明显,则会导致建立的用户模型不能很好的表征出用户或者该用户当前的状态,导致多媒体资源推荐的准确度低。
4.由此可见,相关技术中通过历史数据刻画用户使用习惯进行多媒体资源推荐的方式,存在推荐的准确度低的问题。


技术实现要素:

5.本技术实施例提供了一种资源信息的推送方法和电子装置,以至少解决相关技术中通过历史数据刻画用户使用习惯进行多媒体资源推荐的方式存在推荐的准确度低的技术问题。
6.根据本技术实施例的一个方面,提供了一种资源信息的推送方法,包括:在获取目标对象的资源播放请求的情况下,获取与所述资源播放请求对应的对象语音数据;对所述对象语音数据进行情绪识别,得到所述目标对象的目标情绪类型;根据所述目标情绪类型,确定待推送的资源信息列表,其中,所述资源信息列表中的每个资源信息所标识的多媒体资源的资源标签与所述目标情绪类型匹配;将所述资源信息列表推送给所述目标对象的终端设备,以在所述终端设备上显示所述资源信息列表。
7.根据本技术实施例的另一个方面,还提供了一种资源信息的推送装置,包括:第一获取单元,用于在获取目标对象的资源播放请求的情况下,获取与所述资源播放请求对应的对象语音数据;识别单元,用于对所述对象语音数据进行情绪识别,得到所述目标对象的目标情绪类型;确定单元,用于根据所述目标情绪类型,确定待推送的资源信息列表,其中,所述资源信息列表中的每个资源信息所标识的多媒体资源的资源标签与所述目标情绪类型匹配;推送单元,用于将所述资源信息列表推送给所述目标对象的终端设备,以在所述终端设备上显示所述资源信息列表。
8.在一个示例性实施例中,所述确定单元,包括:第一确定模块,用于根据情绪类型与资源标签之间的对应关系,确定与所述目标情绪类型匹配的目标资源标签;第二确定模块,用于按照所述目标资源标签,从多媒体资源库中确定出多个多媒体资源,其中,所述多
个多媒体资源中的每个多媒体资源均具有所述目标资源标签;排序模块,用于对所述多个多媒体资源的资源信息进行排序,得到所述资源信息列表。
9.在一个示例性实施例中,所述装置还包括:提示单元,用于在所述根据情绪类型与资源标签之间的对应关系,确定与所述目标情绪类型匹配的目标资源标签之后,在所述目标资源标签包含多个资源标签的情况下,通过所述终端设备向所述目标对象发出提示信息,其中,所述提示信息用于提示所述目标对象从所述多个资源标签中选取出待推送的资源标签;第二获取单元,用于在获取到用于指示所述目标对象从所述多个资源标签中选取的资源标签的标签选取信息的情况下,使用选取的资源标签更新所述目标资源标签,得到更新后的所述目标资源标签。
10.在一个示例性实施例中,所述确定单元,包括:第三确定模块,用于根据情绪类型与资源标签之间的对应关系,确定与所述目标情绪类型匹配的目标资源标签;第四确定模块,用于根据所述目标对象的用户画像,从多媒体资源库中确定出多个候选多媒体资源;选取模块,用于按照所述目标资源标签,从所述多个候选多媒体资源中选取出多个目标多媒体资源,得到所述资源信息列表,其中,所述多个目标多媒体资源中的每个目标多媒体资源具有所述目标资源标签,所述资源信息列表为所述多个目标多媒体资源的资源信息的列表。
11.在一个示例性实施例中,所述第一获取单元,包括:第一获取模块,用于获取所述目标对象对终端设备发出的所述对象语音数据,其中,所述资源播放请求是从所述对象语音数据中解析出的;或者,第二获取模块,用于获取所述目标对象对终端设备发出的语音控制数据、以及参考语音数据,其中,所述资源播放请求是从所述语音控制数据中解析出的,所述参考语音数据为在所述语音控制数据的起始时刻之前的目标时间段所采集到的语音数据,所述对象语音数据包括所述语音控制数据和所述参考语音数据;或者,第三获取模块,用于获取在目标时间段内所采集到的所述对象语音数据,其中,所述目标时间段包含检测到目标操作的时刻,所述目标操作为用于触发生成所述资源播放请求的操作。
12.在一个示例性实施例中,所述识别单元,包括:第一输入模块,用于将所述对象语音数据输入到三维情绪模型,得到所述三维情绪模型输出的目标情绪特征,其中,所述三维情绪模型为通过唤醒度、愉悦度和控制度来表征情绪的模型,所述目标情绪特征包含唤醒度特征、愉悦度特征和控制度特征;第五确定模块,用于根据所述目标情绪特征,确定出所述目标对象的所述目标情绪类型。
13.在一个示例性实施例中,所述识别单元,包括:提取模块,用于从所述对象语音数据中提取出情绪识别特征,其中,所述情绪识别特征包括以下至少之一:梅尔倒谱系数特征,基频特征,能量特征,时长特征,ivector特征;第六确定模块,用于根据所述情绪识别特征,确定与所述目标对象对应的目标情绪特征,其中,所述目标情绪特征包括唤醒度特征、愉悦度特征和控制度特征;第七确定模块,用于根据所述目标情绪特征,确定出所述目标对象的所述目标情绪类型。
14.在一个示例性实施例中,所述识别单元,包括:第二输入模块,用于将所述情绪识别特征输入到目标情绪回归模型,得到所述目标情绪回归模型输出的所述目标情绪特征,其中,所述目标情绪回归模型的网络结构采用视觉几何群网络结构,所述情绪回归模型的输出层采用激活函数。
15.在一个示例性实施例中,所述装置还包括:第三获取单元,用于在所述将所述情绪识别特征输入到目标情绪回归模型,得到所述目标情绪回归模型输出的所述目标情绪特征之前,获取用于进行模型训练的模型训练语料,其中,所述模型训练语料包括以下至少之一:通过自然采集的情绪语料,模拟的情绪语料,通过情绪引导信息所引导发出的情绪语料;训练单元,用于使用所述模型训练语料对初始情绪回归模型进行模型训练,得到所述目标情绪回归模型,其中,对所述初始情绪回归模型进行模型训练所采用的损失函数为均方损失函数。
16.根据本技术实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述资源信息的推送方法。
17.根据本技术实施例的又一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,上述处理器通过计算机程序执行上述的资源信息的推送方法。
18.在本技术实施例中,采用基于对象语音数据得到对象的情绪类型、并向对象推送与对象的情绪类型匹配的资源信息列表的方式,通过在获取目标对象的资源播放请求的情况下,获取与资源播放请求对应的对象语音数据;对对象语音数据进行情绪识别,得到目标对象的目标情绪类型;根据目标情绪类型,确定待推送的资源信息列表,其中,资源信息列表中的每个资源信息所标识的多媒体资源的资源标签与目标情绪类型匹配;将资源信息列表推送给目标对象的终端设备,以在终端设备上显示资源信息列表,由于对获取到的对象语音数据进行情绪识别,得到对象的情绪类型,确定待推送的资源信息列表,待推送的资源信息列表中的每个资源信息所标识的多媒体资源的资源标签与对象的情绪类型相匹配,可以实现基于对象的情绪类型自动进行多媒体资源推荐的目的,达到提升多媒体资源推送的准确度的技术效果,进而解决了相关技术中通过历史数据刻画用户使用习惯进行多媒体资源推荐的方式存在推荐的准确度低的技术问题。
附图说明
19.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
20.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
21.图1是根据本技术实施例的一种可选的资源信息的推送方法的硬件环境的示意图;
22.图2是根据本技术实施例的一种可选的资源信息的推送方法的流程示意图;
23.图3是根据本技术实施例的另一种可选的资源信息的推送方法的流程示意图;
24.图4是根据本技术实施例的一种可选的资源信息的推送装置的结构框图;
25.图5是根据本技术实施例的一种可选的电子装置的结构框图。
具体实施方式
26.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
27.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
28.根据本技术实施例的一个方面,提供了一种资源信息的推送方法。可选地,在本实施例中,上述资源信息的推送方法可以应用于如图1所示的由终端102和服务器104所构成的硬件环境中。如图1所示,服务器104通过网络与终端102进行连接,可用于为终端或终端上安装的客户端提供服务(如应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器104提供数据存储服务。
29.上述网络可以包括但不限于以下至少之一:有线网络,无线网络。上述有线网络可以包括但不限于以下至少之一:广域网,城域网,局域网,上述无线网络可以包括但不限于以下至少之一:wifi(wireless fidelity,无线保真),蓝牙。终端102可以并不限定于为pc、手机、平板电脑等。
30.本技术实施例的资源信息的推送方法可以由服务器104来执行,也可以由终端102来执行,还可以是由服务器104和终端102共同执行。其中,终端102执行本技术实施例的资源信息的推送方法也可以是由安装在其上的客户端来执行。
31.以由服务器104来执行本实施例中的资源信息的推送方法为例,图2是根据本技术实施例的一种可选的资源信息的推送方法的流程示意图,如图2所示,该方法的流程可以包括以下步骤:
32.步骤s202,在获取目标对象的资源播放请求的情况下,获取与资源播放请求对应的对象语音数据。
33.本实施例中的资源信息的推送方法可以应用到终端设备(即,上述终端102)基于目标对象的资源播放请求,向目标对象推送与该资源播放请求匹配的多媒体资源的场景,上述的终端设备可以是具有交互模块的智能家居设备,例如,智能音响,智能冰箱等,也可以是智能手机、平板电脑等智能终端。上述资源播放请求可以是通过语音请求的方式实现的,也可以是通过其他请求交互的方式实现的。上述多媒体资源可以包括但不限于以下至少之一:音乐,短视频等。本实施例中对于发送资源播放请求的方式和多媒体资源的资源类型不做限定。
34.以多媒体资源为音乐资源为例,在智能家居领域,用户一般都会有播放音乐的需求,很多时候用户并不会指定某一首或某种风格的音乐,而只是需要随机播放音乐。此时,
如果通过历史播放或互动记录进行推荐,或者,基于用户的个人画像进行推荐的,需要用户不断使用,累计一定的用户数据后,才能根据历史数据建立用户模型进行推荐。并且,根据历史数据刻画用户使用习惯的算法并不会考虑用户“现在时刻”的使用意愿,导致推荐的音乐不一定符合用户当前的状态,导致音乐推荐的准确度低。而适宜的推荐音乐会给用户好的体验,提升用户的使用感受,而不适宜的音乐推荐会给用户不好的体验,降低用户的使用感受。
35.在本实施例中,在有多媒体资源播放请求时,可以基于用户当前的情绪类型,推荐与当前的情绪类型匹配的多媒体资源。由于用户在不同的情绪下,会对不同多媒体资源(例如,音乐)有不同程度的反应,如果根据用户的情绪来进行播放多媒体资源,用户可能会有更多的共鸣,从而提高用户的使用体验。
36.在本实施例中,以终端设备为智能家居设备为例,在用户资源播放请求时,可以向智能家居设备发送资源播放请求,智能家居设备可以获取到目标对象(与使用智能家居设备的用户所对应的对象)发出的资源播放请求。上述资源播放请求的发送方式可以是语音请求,即,用户通过与智能家居设备进行语音交互发出资源播放请求。在智能家居领域中,语音交互是很重要的入口,可以方便与智能家居设备进行交互。
37.在获取到目标对象的资源播放请求时,智能家居设备可以获取与目标对象对应的对象语音数据。这里的对象语音数据可以包括获取到资源播放请求时获取到的语音数据,可以包括发出资源播放请求所使用的语音数据,也可以包括发出资源播放请求之前的一段时间内发出的语音数据,还可以包括发出资源播放请求之后的一段时间内发出的语音数据,本实施例中对此不做限定。
38.例如,用户在有播放音乐的需求时,可以向智能音响发出播放音乐的语音请求(例如,“我要听歌”),智能音响在检测到上述音乐播放的语音请求时,可以获取与“我要听歌”所在的采集时间段内所采集的语音数据,以便基于采集到的语音数据对用户的语音特征进行识别,进而识别用户当前的情绪类型。
39.这里,识别用户当前的情绪类型时,也可以通过面部表情来推测用户情绪,再根据用户情绪来推荐多媒体资源。这种方式需要影像设备放置在合适的位置来获取用户当前的面部表情,同时对用户所在的位置也有一定的限制,影响用户的使用体验。而通过声音的方式对用户没有位置、朝向的要求,使得多媒体资源播放的控制更加灵活。
40.步骤s204,对对象语音数据进行情绪识别,得到目标对象的目标情绪类型。
41.在本实施例中,可以基于用户语音来识别用户情绪,从而向用户进行多媒体资源推荐。为了确定目标对象的情绪类型,可以对对象语音数据进行情绪识别,确定目标对象当前的情绪类型,比如,对对象语音数据所包含的语音情绪特征进行提取,从而确定提取到的语音情绪特征所指示的情绪类型,得到目标情绪类型,上述的语音情绪特征可以是语气特征、语调特征、语速特征等,在此不做限定。
42.步骤s206,根据目标情绪类型,确定待推送的资源信息列表,其中,资源信息列表中的每个资源信息所标识的多媒体资源的资源标签与目标情绪类型匹配。
43.在确定出目标情绪类型之后,可以根据目标情绪类型,确定待推送目标对象的资源信息列表。上述资源信息列表中可以包含一组资源信息,一组资源信息中的每个资源信息用于标识一个多媒体资源,比如,多媒体资源库中的一个多媒体资源。多媒体资源库中的
每个多媒体资源可以具有对应的资源标签,例如,资源类型、资源风格等资源标签。每个资源信息所标识的多媒体资源的资源标签与目标情绪类型匹配。
44.需要说明的是,情绪类型与资源标签的匹配方式可以是完全匹配,即,资源标签即为某一情绪类型,例如,情绪类型为悲伤,如果多媒体资源的资源标签包括悲伤,则认为两者匹配。情绪类型与资源标签的匹配方式也可以是按照预设对应关系进行匹配,即,预先设定的与某一情绪类型对应的资源标签,如果多媒体资源的资源标签属于与某一情绪类型对应的资源标签,则认为多媒体资源的资源标签与情绪类型匹配。例如,情绪类型为悲伤,与其对应的资源标签包括舒缓、柔和、治愈。如果多媒体资源的资源标签包括治愈,则认为两者匹配。
45.这里,多媒体资源的资源信息可以包括用于描述对应的多媒体资源的一种或多种资源信息,例如,资源类型、资源来源、资源名称以及资源风格等相关资源信息。资源信息列表中可以包含单一资源类别的资源信息,也可以包含多种不同资源类别的资源信息,上述多种不同资源类别的资源信息可以分为多个信息区域在资源信息列表中进行展示,也可以采用组合的方式进行展示。
46.例如,待推荐的多媒体资源为歌曲,待推送歌曲的歌曲信息(即,资源信息)可以包括歌曲的歌名、演唱者、歌曲风格等,某一歌曲的不同资源信息可以显示在歌曲列表(即,资源信息列表)与该歌曲对应的区域中的不同位置,并且,不同歌曲风格的多种歌曲的歌曲信息可以显示在歌曲列表中的不同位置。
47.步骤s208,将资源信息列表推送给所述目标对象的终端设备,以在终端设备上显示资源信息列表。
48.在本实施例中,在确定出待推送的资源信息列表之后,服务器可以将资源信息列表推送给与目标对象对应的终端设备(即,上述的智能家居设备),终端设备接收到推送的资源信息列表之后,可以将资源信息列表进行显示。
49.可选地,在得到待推送的资源信息列表之后,可以结合目标对象的历史交互情况对资源信息列表中的资源信息进行排序,再将排序后的资源信息列表推送至目标对象的终端设备。除了资源信息列表中的资源信息(上述资源信息可以是在终端设备上显示的资源信息)以外,还可以包括其他的资源信息,例如,资源链接,以便通过其他的资源信息获取对应的多媒体资源进行播放。获取资源播放请求以及显示资源信息列表可以是由终端设备上的资源播放应用所执行的,本实施例中对此不做限定。
50.通过上述步骤s202至步骤s208,在获取目标对象的资源播放请求的情况下,获取与资源播放请求对应的对象语音数据;对对象语音数据进行情绪识别,得到目标对象的目标情绪类型;根据目标情绪类型,确定待推送的资源信息列表,其中,资源信息列表中的每个资源信息所标识的多媒体资源的资源标签与目标情绪类型匹配;将资源信息列表推送给目标对象的终端设备,以在终端设备上显示资源信息列表,解决了相关技术中通过历史数据刻画用户使用习惯进行多媒体资源推荐的方式存在推荐的准确度低的技术问题,提高了多媒体资源推送的准确度。
51.在一个示例性实施例中,根据目标情绪类型,确定待推送的资源信息列表,包括:
52.s11,根据情绪类型与资源标签之间的对应关系,确定与目标情绪类型匹配的目标资源标签;
53.s12,按照目标资源标签,从多媒体资源库中确定出多个多媒体资源,其中,多个多媒体资源中的每个多媒体资源均具有目标资源标签;
54.s13,对多个多媒体资源的资源信息进行排序,得到资源信息列表。
55.在本实施例中,可以预先为多媒体资料库中的多媒体资源定义对应的资源标签,以使多媒体资料库中的多个多媒体资源中的每个多媒体资源均具有对应的资源标签,还可以预先配置情绪类型与资源标签之间的对应关系,上述对应关系可以是根据经验所设定的,也可以是基于大数据分析确定的。情绪类型与资源标签之间的对应关系与前述实施例中类似,在此不做赘述。
56.在确定待推送的资源信息列表时,可以先根据情绪类型与资源标签之间的对应关系,确定出与目标情绪类型匹配的资源标签,得到目标资源标签。上述对应关系可以是正相关关系,也可以是负相关关系。例如,情绪类型为悲伤时,与悲伤对应的资源标签可以包括舒缓,又例如,情绪类型为悲伤时,与悲伤对应的资源标签可以包括欢快。
57.在确定出目标资源标签之后,可以按照目标资源标签,从多媒体资源库中确定出具备目标资源标签的多个多媒体资源,从多媒体资源库中确定出具备目标资源标签的多媒体资源的方式可以是:也可以确定多媒体资源库中的一组候选多媒体资源(比如,目标对象播放过的多媒体资源),再从一组候选多媒体资源中确定出具备目标资源标签的多媒体资源。
58.在得到多个多媒体资源之后,可以对多个多媒体资源的资源信息进行排序,得到待推送到目标对象的终端设备的资源信息列表。上述对多个多媒体资源的资源信息进行排序可以是基于目标对象的历史交互情况进行的,将历史交互情况中出现频次较高的多媒体资源对应的资源信息设置较高的展示优先级,以便在资源信息列表中进行优先展示。
59.通过本实施例,根据情绪类型与资源标签之间的对应关系确定出待推送的多媒体资源,并对确定出的多媒体资源的资源信息进行排序,提升了向目标对象进行多媒体资源推送的准确性。
60.在一个示例性实施例中,在根据情绪类型与资源标签之间的对应关系,确定与目标情绪类型匹配的目标资源标签之后,上述方法还包括:
61.s21,在目标资源标签包含多个资源标签的情况下,通过终端设备向目标对象发出提示信息,其中,提示信息用于提示目标对象从多个资源标签中选取出待推送的资源标签;
62.s22,在获取到用于指示目标对象从多个资源标签中选取的资源标签的标签选取信息的情况下,使用选取的资源标签更新目标资源标签,得到更新后的目标资源标签。
63.在目标资源标签包含多个资源标签时,可以分别使用各个资源标签或者资源标签的组合确定分别多媒体资源,从而得到多个多媒体资源。可选地,也可以由用户从多个资源标签中选取出待推荐的多媒体资源的资源标签,进而基于用户选择的资源标签确定待推荐的多媒体资源。
64.在本实施中,可以通过终端设备向目标对象发出提示信息,从而提示目标对象从多个资源标签中选取出待推送的资源标签。目标对象可以根据提示信息在终端设备上从多个资源标签中选取出待推送的资源标签(可以是通过触控操作选取,也可以是通过语音指示选取),在目标对象完成对于资源标签的选取之后,终端设备可以将目标对象从多个资源标签中选取的资源标签的标签选取信息发送给服务器,服务器在获取到用于指示目标对象
从多个资源标签中选取的资源标签的标签选取信息的情况下,可以使用选取的资源标签对目标资源标签进行更新,得到更新后的目标资源标签,并根据更新之后的目标资源标签从多媒体资源库中确定出待推送的多媒体资源的资源信息列表。
65.通过本实施例,通过与用户进行交互从多个资源标签中选取出待推送的资源标签,可以提升多媒体资源推荐的准确性,提升用户的使用体验。
66.在一个示例性实施例中,根据目标情绪类型,确定待推送的资源信息列表,包括:
67.s31,根据情绪类型与资源标签之间的对应关系,确定与目标情绪类型匹配的目标资源标签;
68.s32,根据目标对象的用户画像,从多媒体资源库中确定出多个候选多媒体资源;
69.s33,按照目标资源标签,从多个候选多媒体资源中选取出多个目标多媒体资源,得到资源信息列表,其中,多个目标多媒体资源中的每个目标多媒体资源具有目标资源标签,资源信息列表为多个目标多媒体资源的资源信息的列表。
70.在本实施例中,可以基于目标对象的用户画像,从多媒体资源库中确定出多个候选多媒体资源(例如,上述一组候选多媒体资源),然后在从多个候选多媒体资源中确定出推荐给目标对象的多媒体资源。例如,可以分别确定与目标情绪类型匹配的资源标签、确定多个候选多媒体资源,然后使用确定的资源标签从多个候选多媒体资源中选取待推荐的多媒体资源。也就是说,可以通过多级推荐策略,在根据用户画像推荐召回排序结果之后,结合情绪目标情绪标签,向目标对象推送对应的资源信息列表。
71.可选地,可以根据目标对象的用户画像,从多媒体资源库中确定出多个候选多媒体资源。确定多个候选多媒体资源的方式可以包括:将目标对象播放过的多媒体资源,确定为候选多媒体资源,将目标对象播放过的作者(例如,歌曲的演唱者、短视频的作者)的多媒体资源,确定为候选多媒体资源,还可以包括其他基于用户的用户画像确定候选多媒体资的方式,本实施例中对此不做限定。而与目标情绪类型匹配的资源标签可以是基于情绪类型与资源标签之间的对应关系确定的,确定的方式与前述实施例中类似,在此不做赘述。
72.按照目标资源标签,可以从多个候选多媒体资源中选取出多个目标多媒体资源,得到待推送的资源信息列表,选取出的目标多媒体资源中具有目标资源标签,如果目标资源标签有多个,选取出的目标多媒体资源中具有多个资源标签中的全部或者部分。
73.需要说明的是,目标对象的用户画像可以是根据目标对象的历史播放记录(例如,对于多媒体资源推送的反馈情况)确定的,也可以根据目标对象对于其他应用的操作记录确定的,还可以是其他的确定方式,本实施例中对于确定目标对象的用户画像的方式不做限定。
74.通过本实施例,通过多级推荐策略,结合目标对象的历史画像,与现有推荐系统进行结合,提升向目标对象进行多媒体资源推荐的准确性。
75.在一个示例性实施例中,获取与资源播放请求对应的对象语音数据,包括:
76.s41,获取目标对象对终端设备发出的对象语音数据,其中,资源播放请求是从对象语音数据中解析出的;或者,
77.s42,获取目标对象对终端设备发出的语音控制数据、以及参考语音数据,其中,资源播放请求是从语音控制数据中解析出的,参考语音数据为在语音控制数据的起始时刻之前的目标时间段所采集到的语音数据,对象语音数据包括语音控制数据和参考语音数据;
或者,
78.s43,获取在目标时间段内所采集到的对象语音数据,其中,目标时间段包含检测到目标操作的时刻,目标操作为用于触发生成资源播放请求的操作。
79.在本实施例中,获取与资源播放请求对应的对象语音数据的方式可以有多种,可以包括以下之一:
80.方式一:获取目标对象对终端设备发出的对象语音数据,资源播放请求是从对象语音数据中解析出的。
81.终端设备可以持续地采集目标对象的语音数据,并可以通过asr(automatic speech recognition,语音识别技术)系统以及nlp(natural language processing,自然语言识别)系统对上述对象语音数据进行解析,从而解析出资源播放请求(例如,“播放”、“听歌”等)。
82.可选地,上述对象语音数据的采集过程可以包括:在终端设备的唤醒之后,将唤醒之后采集到的语音数据(比如,唤醒之后的预定时间段内采集到的语音数据),确定为对象语音数据,从该对象语音数据中可以解析出上述资源播放请求。
83.方式二:获取目标对象对终端设备发出的语音控制数据、以及参考语音数据,其中,资源播放请求是从语音控制数据中解析出的,参考语音数据为在语音控制数据的起始时刻之前的目标时间段所采集到的语音数据,对象语音数据包括语音控制数据和参考语音数据。
84.在本实施例中,终端设备可以持续地采集目标对象的语音数据,并采用与前述相同或者类似的方式获取能够解析出资源播放请求的语音数据,得到语音控制数据。在获取到语音控制数据之后,可以查询在语音控制数据的起始时刻之前的目标时间段内(例如,前5s)所采集到的语音数据,得到参考语音数据,结合语音控制数据与参考语音数据得出目标对象的对象语音数据。
85.可选地,终端设备可以周期性地删除采集到的语音数据,比如,可以在采集一个时间周期内的语音数据之后,如果未识别到资源播放请求,则删除该时间周期内采集到的语音数据,并在下一个时间周期继续采集语音数据,如果在当前时间周期内检测到资源播放请求(采集到包含资源播放请求的资源控制数据的起始时刻位于当前时间周期内,结束时刻可以位于当前时间周期或者当前时间周期的下一个时间周期内)。则在当前时间周期的起始时刻至采集到资源控制数据的起始时刻之间采集到的语音数据,为参考语音数据。
86.例如,在检测到用户点歌的语音之后,可以收集用户点歌前和点歌时的语音,点歌前的语音可以是持续进行语音采集时所采集到的,提取相应特征和情绪回归网络,进行情绪判定,进而基于判断的情绪为用户推荐歌曲。
87.可选地,参考语音数据也可以包括在语音控制数据的起始时刻之前的第一时间段(即,目标时间段)内所采集到的语音数据、以及在语音控制数据的结束时刻之后的第二时间段内采集到的语音数据(可以是语音控制数据的结束时刻所在的时间周期内、语音控制数据的结束时刻之后采集到的语音数据)。
88.方式三:获取在目标时间段内所采集到的对象语音数据,其中,目标时间段包含检测到目标操作的时刻,目标操作为用于触发生成资源播放请求的操作。
89.上述资源播放请求可以是通过其他方式触发的,即,通过目标操作触发生成资源
播放请求,比如,用户点击进入到资源推荐页面。终端设备可以采用与前述相同或者类似的方式周期性地采集语音数据,并将检测到目标操作的时刻所在的时间周期作为目标时间段,将目标时间段内所采集到的语音数据,确定为对象语音数据。
90.通过本实施例,采用多种方式灵活获取目标对象的对应语音数据,以便对目标对象的交互需求进行及时响应,提升了用户的产品体验。
91.在一个示例性实施例中,对对象语音数据进行情绪识别,得到目标对象的目标情绪类型,包括:
92.s51,将对象语音数据输入到三维情绪模型,得到三维情绪模型输出的目标情绪特征,其中,三维情绪模型为通过唤醒度、愉悦度和控制度来表征情绪的模型,目标情绪特征包含唤醒度特征、愉悦度特征和控制度特征;
93.s52,根据目标情绪特征,确定出目标对象的目标情绪类型。
94.由于人的语音中蕴含了说话人的情绪信息,比如,大声说话,通常代表情绪激动的高兴、愤怒;缓慢低沉的说话,通常代表情绪的低落等,所以通过对语音的建模是可以区分用户当前的情绪情况。在本实施例中,可以通过三维情绪模型对语音语气、语调、语速等因素的捕捉,得到目标情绪特征,三维情绪模型为通过唤醒度、愉悦度和控制度来表征情绪的模型,对应地,目标情绪特征包含唤醒度特征、愉悦度特征和控制度特征。
95.这里,唤醒度代表情绪唤醒的高低,愉悦度代表积极情绪的高低,控制度代表相应的程度。唤醒度和愉悦度都可以通过数值代表高低,比如,愉悦度为数值区间为[1,9],1代表非常低迷/消极,9代表非常激动/积极,这样像“开心”就可以用高唤醒、高愉悦度来代表;而难过可以用低唤醒、低愉悦度表示。通过上述方式,几乎所有的人类情绪都可以通过三维的量化空间来表示。通过量化说话人的情绪后,根据情绪推送合适的多媒体资源,比如,在悲伤时,播放舒缓的歌曲,在高兴时,播放快节奏的歌曲等,让推荐更适宜用户当前的需求。
[0096]
可选地,在建立三维情绪模型的过程中,可以先准备三维情绪模型的情绪语料,通过自然采集的情绪语料、模拟情绪语料和诱导情绪语料等获取训练情绪语料,再从情绪语料中提取情绪识别特征,可以使用情绪识别特征利用vgg16(visual geometry group-16,视觉几何群)网络结构构建情绪回归模型。为了优化模型,可以将情绪回归模型中的输出层改成sigmod,损失函数改成mseloss(mean square error loss,均方损失函数),情绪回归模型最后的输出映射为情绪矩阵(即,基于唤醒度,愉悦度,控制度)的数值。
[0097]
通过上述方式,通过准备情绪语料,还可以为情绪语料打上对应的情绪类型的标签,以及不同情绪类型所对应的情绪矩阵范围,通过使用情绪语料对初始的三维情绪模型进行训练,调整模型参数,使得三维情绪模型输出的情绪类型与标注的情绪类型一致,进而得到训练好的三维情绪模型。
[0098]
在得到三维情绪模型之后,为了从对象语音数据中解析出目标对象对应的情绪特征,可以将对象语音数据作为输入,输入至上述三维情绪模型中,三维情绪模型输出的三维情绪特征(即,唤醒度特征、愉悦度特征和控制度特征),即为目标情绪特征。
[0099]
在得到目标情绪特征之后,可以基于目标情绪特征确定出目标对象的目标情绪类型,例如,可以基于预设的三维情绪特征与情绪类型之间的对应关系,可以确定与目标情绪特征匹配的情绪类型,得到目标情绪类型。
[0100]
通过本实施例,通过三维情绪模型对语音数据中的情绪特征进行量化,并基于量
化后的多维情绪特征确定情绪类型,可以提升对于对象语音数据进行情绪特征识别的准确性。
[0101]
在一个示例性实施例中,对对象语音数据进行情绪识别,得到目标对象的目标情绪类型,包括:
[0102]
s61,从对象语音数据中提取出情绪识别特征,其中,情绪识别特征包括以下至少之一:梅尔倒谱系数特征,基频特征,能量特征,时长特征,ivector特征;
[0103]
s62,根据情绪识别特征,确定与目标对象对应的目标情绪特征,其中,目标情绪特征包括唤醒度特征、愉悦度特征和控制度特征;
[0104]
s63,根据目标情绪特征,确定出目标对象的目标情绪类型。
[0105]
在本实施例中,在对对象语音数据进行情绪识别时,可以先从对象语音数据中提取出情绪识别特征,上述情绪识别特征可以包括但不限于以下至少之一:mfcc(mel frequency cepstral coefficient,梅尔频率倒谱系数)特征,pitch(基频,是音高、音调,可以量化为频率)特征,能量特征,时长特征,基于离散化量化情绪的ivector特征(即,基于i-vector说话人识别系统的基线系统)等,本实施例中对于情绪识别特征的类型不做限定。
[0106]
在从对象语音数据中提取出情绪识别特征之后,可以根据情绪识别特征,确定与目标对象对应的目标情绪特征,即,得到用于表征目标对象的情绪类型的目标情绪特征。目标情绪特征可以是用于描述情绪类型的特征,可以包括但不限于以下至少之一:唤醒度特征,愉悦度特征,控制度特征。在根据情绪识别特征确定目标情绪特征时,可以基于情绪识别特征分别对各个维度的情绪特征(例如,唤醒度特征,愉悦度特征,控制度特征)进行量化,确定各个维度的情绪特征的特征值,进而得到目标情绪特征。
[0107]
可选地,从对象语音数据中提取出情绪识别特征以及根据情绪识别特征,确定与目标对象对应的目标情绪特征可以是使用上述三维情绪模型实现的,即,将对象语音数据输入到三维情绪模型,由三维情绪模型先提取出情绪识别特征,然后基于提取出的情绪识别特征,确定目标情绪特征。
[0108]
在得到目标情绪特征之后,可以基于目标情绪特征确定出目标对象的目标情绪类型,例如,可以采用与前述实施例中相同或者类似的方式确定目标情绪类型,例如,可以基于预设的三维情绪特征与情绪类型之间的对应关系,可以确定与目标情绪特征匹配的情绪类型,得到目标情绪类型。
[0109]
通过本实施例,通过从语音数据中提取出的情绪识别特征,并基于提取出的情绪识别特征确定目标对象的情绪类型,可以提升情绪类型确定的准确性。
[0110]
在一个示例性实施例中,根据情绪识别特征,确定与目标对象对应的目标情绪特征,包括:
[0111]
s71,将情绪识别特征输入到目标情绪回归模型,得到目标情绪回归模型输出的目标情绪特征,其中,目标情绪回归模型的网络结构采用视觉几何群网络结构,情绪回归模型的输出层采用激活函数。
[0112]
在本实施例中,在获取到情绪识别特征之后,可以将情绪识别特征输入到目标情绪回归模型中,从而得到目标情绪回归模型输出的目标情绪特征。上述目标情绪回归模型的网络结构采用视觉几何群网络(例如,vgg-16),情绪回归模型的输出层采用激活函数(即,sigmod函数)。视觉几何群网络是一种卷积神经网络,而激活函数决定了卷积神经网络
中某个神经元是否被激活。
[0113]
上述输出的目标情绪特征可以用于描述情绪类型的特征,可以包括但不限于以下至少之一:唤醒度特征、愉悦度特征和控制度特征。对应地,提取情绪识别特征的模型和目标情绪回归模型可以均属于上述三维情绪模型。
[0114]
通过本实施例,从对象语音数据中提取出情绪特征,并采用视觉几何群网络以及激活函数,提升了提取情绪特征的效率。
[0115]
在一个示例性实施例中,在将情绪识别特征输入到目标情绪回归模型,得到目标情绪回归模型输出的目标情绪特征之前,上述方法还包括:
[0116]
s81,获取用于进行模型训练的模型训练语料,其中,模型训练语料包括以下至少之一:通过自然采集的情绪语料,模拟的情绪语料,通过情绪引导信息所引导发出的情绪语料;
[0117]
s82,使用模型训练语料对初始情绪回归模型进行模型训练,得到目标情绪回归模型,其中,对初始情绪回归模型进行模型训练所采用的损失函数为均方损失函数。
[0118]
在本实施例中,在使用目标情绪回归模型进行情绪特征提取之前,可以首先使用模型训练语料对初始情绪回归模型进行模型训练,从而得到目标情绪回归模型。用于进行模型训练的训练设备(可以是前述服务器、终端设备,也可以是其他设备)可以先获取用于进行模型训练的模型训练语料,获取模型训练语料的方式可以包括以下之一:通过自然采集的方式获取情绪语料;通过模拟获取到情绪语料(模拟情绪语料,可以是由机器自动合成的情绪语料);通过情绪引导信息的引导获取到情绪语料。
[0119]
具体地,通过自然采集的方式获取语料,可以是获取使用对象的历史语音数据,即,使用对象在过去预定时间段内的语音数据;通过模拟获取到情绪语料,可以是通过机器模拟的方式,生成的一系列的语料数据;通过情绪引导信息的引导获取到情绪语料,可以是通过情绪引导信息引导使用对象在不同的情绪引导信息的指示下,形成对应的语音反馈,从而获取到一系列与情绪引导信息匹配的情绪语料。
[0120]
在获取了进行模型训练的模型训练语料之后,可以使用模型训练语料对初始情绪回归模型进行模型训练,从而得到目标情绪回归模型。上述模型训练语料中可以带有对应的情绪类型的标签,上述标签中可以用于描述前述多个情绪类型的特征中各个特征的参数,例如,唤醒度特征、愉悦度特征和控制度特征的数值等。通过使用情绪语料对初始的情绪回归模型进行训练,调整模型参数,使得情绪模型输出的情绪类型与标注的情绪类型一致,进而得到训练好的目标情绪回归模型。
[0121]
可选地,对初始情绪回归模型进行模型训练所采用的损失函数为均方损失函数,即,mseloss。
[0122]
通过本实施例,采集情绪语料后,使用获取到的情绪语料对初始情绪回归模型进行模型训练,从而得到目标情绪回归模型,提升了采用情绪回归模型确定情绪类型的精确性。
[0123]
下面结合可选示例对本技术实施例中的资源信息的推送方法进行解释说明。在本可选示例中,终端设备为智能家居设备,多媒体资源为音乐(歌曲),资源信息为歌曲的歌曲信息,多媒体资源的资源标签包括情绪标签。
[0124]
本可选示例中提供了一种基于语音来识别用户情绪、进而进行音乐推荐的方案,
使用语音来做情绪识别的维度,基于语音特征来推测用户的情绪,即可以了解用户“现在时刻”的使用意愿,又避免了对用户所在空间的限制,提升了用户的体验。如图3所示,本可选示例中的资源信息的推送方法的流程可以包括以下步骤:
[0125]
步骤s302,采集说话人语音音频。
[0126]
在智能家居设备上检测到有说话人的语音信号输入时,对语音音频进行采集。
[0127]
步骤s304,判断是否是点歌需求,如果是,执行步骤s306,否则,执行步骤s308。
[0128]
通过asr系统(automatic speech recognition,语音识别技术)以及nlp系统(natural language processing,自然语言识别)对上述对象语音数据进行解析,判断语音音频中是否是点歌需求,如果是,执行步骤s306,否则,执行步骤s308。
[0129]
步骤s306,判断是否是随机点歌需求,如果是,执行步骤s310,否则,按照指定点歌需求进行音乐推荐。
[0130]
对于点歌需求,可以进一步判断是否是随机点歌需求如果是,执行步骤s310,否则,按照指定的点歌需求进行音乐召回,并将音乐召回列表显示给用户。
[0131]
步骤s308,对用户意图进行反馈。
[0132]
在检测到语音音频中的需求为非点歌需求时,根据用户的实际需求,对用户的需求进行反馈。例如,当检测到语音音频中的需求为“天气如何”时,将相关的天气信息推送至用户的终端设备上进行显示。
[0133]
步骤s310,点歌推荐系统进行音乐召回。
[0134]
点歌推荐系统可以根据用户历史画像或者是音乐播放量记录在音乐库中进行音乐召回,得到备选音乐列表。这里,音乐库中的音乐可以定义有对应的情绪标签,可以为后面情绪推荐做准备。
[0135]
步骤s312,情绪特征提取,情绪识别。
[0136]
在检测到存在随机点歌需求时,可以对对语音音频进行情绪特征提取,根据识别出的用户语音中的唤醒度、愉悦度以及控制度信息,对用户对应的情绪类型进行判定,得到用户的情绪。
[0137]
步骤s314,获取最后音乐召回列表。
[0138]
制定多级推荐策略,与现有推荐系统进行结合,提高整体推荐效果,比如,在用户画像等推荐召回排序结果后,利用情绪回归模型再次召回,做最后的推送。对于备选音乐列表,可以根据情绪模型选出最后的播放音乐列表,并将最后的播放音乐列表推送给用户。
[0139]
通过本可选示例,将用户的个人情绪加入到音乐推荐中,以此让音乐贴切用户的心境,采用语音作为情绪判别的来源,避免了对用户的空间限制,可以在家居各个地点进行语音操作,从而提升用户体验。
[0140]
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本技术所必须的。
[0141]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多
情况下前者是更佳的实施方式。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom(read-only memory,只读存储器)/ram(random access memory,随机存取存储器)、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本技术各个实施例所述的方法。
[0142]
根据本技术实施例的另一个方面,还提供了一种用于实施上述资源信息的推送方法的资源信息的推送装置。图4是根据本技术实施例的一种可选的资源信息的推送装置的结构框图,如图4所示,该装置可以包括:
[0143]
第一获取单元402,用于在获取目标对象的资源播放请求的情况下,获取与资源播放请求对应的对象语音数据;
[0144]
识别单元404,与获取单元402相连,用于对对象语音数据进行情绪识别,得到目标对象的目标情绪类型;
[0145]
确定单元406,与识别单元404相连,用于根据目标情绪类型,确定待推送的资源信息列表,其中,资源信息列表中的每个资源信息所标识的多媒体资源的资源标签与目标情绪类型匹配;
[0146]
推送单元408,与确定单元406相连,用于将资源信息列表推送给目标对象的终端设备,以在终端设备上显示资源信息列表。
[0147]
需要说明的是,该实施例中的第一获取单元402可以用于执行上述步骤s202,该实施例中的识别单元404可以用于执行上述步骤s204,该实施例中的确定单元406可以用于执行上述步骤s206,该实施例中的推送单元408可以用于执行上述步骤s208。
[0148]
通过上述模块,在获取目标对象的资源播放请求的情况下,获取与资源播放请求对应的对象语音数据;对对象语音数据进行情绪识别,得到目标对象的目标情绪类型;根据目标情绪类型,确定待推送的资源信息列表,其中,资源信息列表中的每个资源信息所标识的多媒体资源的资源标签与目标情绪类型匹配;将资源信息列表推送给目标对象的终端设备,以在终端设备上显示资源信息列表,解决了相关技术中通过历史数据刻画用户使用习惯进行多媒体资源推荐的方式存在推荐的准确度低的技术问题,提高了多媒体资源推送的准确度。
[0149]
在一个示例性实施例中,确定单元,包括:
[0150]
第一确定模块,用于根据情绪类型与资源标签之间的对应关系,确定与目标情绪类型匹配的目标资源标签;
[0151]
第二确定模块,用于按照目标资源标签,从多媒体资源库中确定出多个多媒体资源,其中,多个多媒体资源中的每个多媒体资源均具有目标资源标签;
[0152]
排序模块,用于对多个多媒体资源的资源信息进行排序,得到资源信息列表。
[0153]
在一个示例性实施例中,上述装置还包括:
[0154]
提示单元,用于在根据情绪类型与资源标签之间的对应关系,确定与目标情绪类型匹配的目标资源标签之后,在目标资源标签包含多个资源标签的情况下,通过终端设备向目标对象发出提示信息,其中,提示信息用于提示目标对象从多个资源标签中选取出待推送的资源标签;
[0155]
第二获取单元,用于在获取到用于指示目标对象从多个资源标签中选取的资源标
签的标签选取信息的情况下,使用选取的资源标签更新目标资源标签,得到更新后的目标资源标签。
[0156]
在一个示例性实施例中,确定单元,包括:
[0157]
第三确定模块,用于根据情绪类型与资源标签之间的对应关系,确定与目标情绪类型匹配的目标资源标签;
[0158]
第四确定模块,用于根据目标对象的用户画像,从多媒体资源库中确定出多个候选多媒体资源;
[0159]
选取模块,用于按照目标资源标签,从多个候选多媒体资源中选取出多个目标多媒体资源,得到资源信息列表,其中,多个目标多媒体资源中的每个目标多媒体资源具有目标资源标签,资源信息列表为多个目标多媒体资源的资源信息的列表。
[0160]
在一个示例性实施例中,第一获取单元,包括:
[0161]
第一获取模块,用于获取目标对象对终端设备发出的对象语音数据,其中,资源播放请求是从对象语音数据中解析出的;或者,
[0162]
第二获取模块,用于获取目标对象对终端设备发出的语音控制数据、以及参考语音数据,其中,资源播放请求是从语音控制数据中解析出的,参考语音数据为在语音控制数据的起始时刻之前的目标时间段所采集到的语音数据,对象语音数据包括语音控制数据和参考语音数据;或者,
[0163]
第三获取模块,用于获取在目标时间段内所采集到的对象语音数据,其中,目标时间段包含检测到目标操作的时刻,目标操作为用于触发生成资源播放请求的操作。
[0164]
在一个示例性实施例中,识别单元,包括:
[0165]
第一输入模块,用于将对象语音数据输入到三维情绪模型,得到三维情绪模型输出的目标情绪特征,其中,三维情绪模型为通过唤醒度、愉悦度和控制度来表征情绪的模型,目标情绪特征包含唤醒度特征、愉悦度特征和控制度特征;
[0166]
第五确定模块,用于根据目标情绪特征,确定出目标对象的目标情绪类型。
[0167]
在一个示例性实施例中,识别单元,包括:
[0168]
提取模块,用于从对象语音数据中提取出情绪识别特征,其中,情绪识别特征包括以下至少之一:梅尔倒谱系数特征,基频特征,能量特征,时长特征,ivector特征;
[0169]
第六确定模块,用于根据情绪识别特征,确定与目标对象对应的目标情绪特征,其中,目标情绪特征包括唤醒度特征、愉悦度特征和控制度特征;
[0170]
第七确定模块,用于根据目标情绪特征,确定出目标对象的目标情绪类型。
[0171]
在一个示例性实施例中,识别单元,包括:
[0172]
第二输入模块,用于将情绪识别特征输入到目标情绪回归模型,得到目标情绪回归模型输出的目标情绪特征,其中,目标情绪回归模型的网络结构采用视觉几何群网络结构,情绪回归模型的输出层采用激活函数。
[0173]
在一个示例性实施例中,上述装置还包括:
[0174]
第三获取单元,用于在将情绪识别特征输入到目标情绪回归模型,得到目标情绪回归模型输出的目标情绪特征之前,获取用于进行模型训练的模型训练语料,其中,模型训练语料包括以下至少之一:通过自然采集的情绪语料,模拟的情绪语料,通过情绪引导信息所引导发出的情绪语料;
[0175]
训练单元,用于使用模型训练语料对初始情绪回归模型进行模型训练,得到目标情绪回归模型,其中,对初始情绪回归模型进行模型训练所采用的损失函数为均方损失函数。
[0176]
此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。
[0177]
根据本技术实施例的又一个方面,还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行本技术实施例中上述任一项资源信息的推送方法的程序代码。
[0178]
可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。
[0179]
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:
[0180]
s1,在获取目标对象的资源播放请求的情况下,获取与资源播放请求对应的对象语音数据;
[0181]
s2,对对象语音数据进行情绪识别,得到目标对象的目标情绪类型;
[0182]
s3,根据目标情绪类型,确定待推送的资源信息列表,其中,资源信息列表中的每个资源信息所标识的多媒体资源的资源标签与目标情绪类型匹配;
[0183]
s4,将资源信息列表推送给目标对象的终端设备,以在终端设备上显示资源信息列表。
[0184]
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例中对此不再赘述。
[0185]
可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、rom、ram、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0186]
根据本技术实施例的又一个方面,还提供了一种用于实施上述资源信息的推送方法的电子装置,该电子装置可以是服务器、终端、或者其组合。
[0187]
图5是根据本技术实施例的一种可选的电子装置的结构框图,如图5所示,包括处理器502、通信接口504、存储器506和通信总线508,其中,处理器502、通信接口504和存储器506通过通信总线508完成相互间的通信,其中,
[0188]
存储器506,用于存储计算机程序;
[0189]
处理器502,用于执行存储器506上所存放的计算机程序时,实现如下步骤:
[0190]
s1,在获取目标对象的资源播放请求的情况下,获取与资源播放请求对应的对象语音数据;
[0191]
s2,对对象语音数据进行情绪识别,得到目标对象的目标情绪类型;
[0192]
s3,根据目标情绪类型,确定待推送的资源信息列表,其中,资源信息列表中的每个资源信息所标识的多媒体资源的资源标签与目标情绪类型匹配;
[0193]
s4,将资源信息列表推送给目标对象的终端设备,以在终端设备上显示资源信息列表。
[0194]
可选地,通信总线可以是pci(peripheral component interconnect,外设部件互
连标准)总线、或eisa(extended industry standard architecture,扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于上述电子装置与其他设备之间的通信。
[0195]
存储器可以包括ram,也可以包括非易失性存储器(non-volatile memory),例如,至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
[0196]
作为一种示例,上述存储器506中可以但不限于包括上述资源信息的推送装置中的第一获取单元402、识别单元404、确定单元406以及推送单元408。此外,还可以包括但不限于上述资源信息的推送装置中的其他模块单元,本示例中不再赘述。
[0197]
上述处理器可以是通用处理器,可以包含但不限于:cpu(central processing unit,中央处理器)、np(network processor,网络处理器)等;还可以是dsp(digital signal processing,数字信号处理器)、asic(application specific integrated circuit,专用集成电路)、fpga(field-programmable gate array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
[0198]
可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
[0199]
本领域普通技术人员可以理解,图5所示的结构仅为示意,实施上述资源信息的推送方法的设备可以是终端设备,该终端设备可以是智能手机(如android手机、ios手机等)、平板电脑、掌上电脑以及移动互联网设备(mobile internet devices,mid)、pad等终端设备。图5其并不对上述电子装置的结构造成限定。例如,电子装置还可包括比图5中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图5所示的不同的配置。
[0200]
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、rom、ram、磁盘或光盘等。
[0201]
上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
[0202]
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。
[0203]
在本技术的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0204]
在本技术所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
[0205]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例中所提供的方案的目的。
[0206]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以至少两个单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0207]
以上所述仅是本技术的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1