氛围设备控制方法及相关装置与流程

文档序号:18510907发布日期:2019-08-24 09:06阅读:307来源:国知局
氛围设备控制方法及相关装置与流程

本申请涉及设备控制技术领域,更具体地,是氛围设备控制方法及相关装置。



背景技术:

在一些空间环境中,布置有氛围设备,氛围设备可以通过改变自身模式为空间环境提供各种主题气氛,使处于该空间环境的用户得到不同的体验感受。

以汽车等交通设备为例,其内布置有氛围灯、仪表盘、车载控制设备等可以营造主题氛围的设备,不同的主题可以为车内人员提供不同的乘车氛围。如氛围灯亮度降低且设置为红色,仪表盘及车载控制设备的背景颜色设置为粉色,仪表盘及车载控制设备的图标设置为活泼主题,就会营造出一种轻松的主题氛围,车内人员会感觉到温暖放松。

目前,氛围设备输出氛围的主题类型依靠人工手动设置,设置方式不够便利。



技术实现要素:

有鉴于此,本申请提供了一种氛围设备控制方法,可以基于空间环境中存在的媒体信息自动调节氛围设备输出的氛围主题,更加便利。

为实现所述目的,本申请提供的技术方案如下:

第一方面,本申请提供了一种氛围设备控制方法,包括:

获取目标空间环境中的媒体信息;

从所述媒体信息中提取氛围特征,所述氛围特征为能够表示所述媒体信息所营造的氛围类型的特征;

确定所述氛围特征对应的氛围主题;

生成所述氛围主题对应的设备设置指令,并将所述设备设置指令发送至氛围设备,所述设备设置指令用于使所述氛围设备的输出数据符合所述氛围主题。

第二方面,本申请提供了一种氛围设备控制装置,包括:

媒体信息获取单元,用于获取目标空间环境中的媒体信息;

氛围特征提取单元,用于从所述媒体信息中提取氛围特征,所述氛围特征为能够表示所述媒体信息所营造的氛围类型的特征;

氛围主题确定单元,用于确定所述氛围特征对应的氛围主题;

设置指令发送单元,用于生成所述氛围主题对应的设备设置指令,并将所述设备设置指令发送至氛围设备,所述设备设置指令用于使所述氛围设备的输出数据符合所述氛围主题。

第三方面,本申请提供了一种氛围设备控制设备,包括:存储器以及处理器,所述处理器通过调用所述存储器内的可执行指令用于实现如下步骤:

获取目标空间环境中的媒体信息;

从所述媒体信息中提取氛围特征,所述氛围特征为能够表示所述媒体信息所营造的氛围类型的特征;

确定所述氛围特征对应的氛围主题;

生成所述氛围主题对应的设备设置指令,并将所述设备设置指令发送至氛围设备,所述设备设置指令用于使所述氛围设备的输出数据符合所述氛围主题。

第四方面,本申请提供了一种可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时,实现上述的氛围设备控制方法。

由以上方案可知,本申请提供了一种氛围设备控制方法,该方法可以获得空间环境中存在的媒体信息,从媒体信息中提取氛围特征,其中氛围特征为能够表示媒体信息在空间环境所营造的氛围类型的特征,根据氛围特征确定出氛围主题,进而根据氛围主题生成设备设置指令,将设备设置指令发送至氛围设备,以使氛围设备的输出氛围为所述氛围主题。该种方法并不需要由人工设置氛围设备的输出主题,而是根据空间环境中的媒体信息所能够营造的氛围类型,来自动设置氛围设备。氛围设备的控制不依赖人工操作,控制方式更加智能化,用户体验较好。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为氛围设备的现有控制方式的实现方式示意图;

图2为本申请提供的氛围设备控制方法的一种流程示意图;

图3为本申请提供的情绪的一种分析方式示意图;

图4为本申请提供的确定音乐的氛围主题的一种流程示意图;

图5为本申请提供的车载应用场景中对氛围设备进行控制的一种示意图;

图6为本申请提供的氛围设备控制装置的一种结构示意图;

图7为本申请提供的氛围设备控制设备的一种硬件结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

如图1所示,在一些空间场景中,设置有声光电等设备,这些设备通过输出灯光、声音、色彩、图像等数据信息,可以在空间场景中营造出独特的氛围环境,使人产生相应的感官体验。这些设备可以称为氛围设备,氛围设备输出的数据信息可以称为氛围数据。

在这些空间场景中,氛围设备的控制调节通常由人工操作,具体地如图1所示,向氛围设备发送人工设置指令,以在氛围设备所提供的多种氛围主题中选择一种,氛围设备进而输出该种氛围主题对应的数据信息。但是,这种方式需要依赖人工设置操作,不够智能化。

通过研究后发现,空间场景中通常不只有上述氛围设备在工作,用户一般会在空间场景中进行某些活动,这些活动会使得在空间场景中输出媒体信息,这些媒体信息在一定程度上也能够影响用户的情绪感受。因此可以对媒体信息进行分析,根据分析结果来自动控制氛围设备的输出模式。

以车内环境这一具体应用场景为例进行说明。车辆内通常设置有音乐播放、无线电接收等媒体设备,人员可以在车内收听音乐、电台节目。这些可以认为是车内环境中的媒体信息。媒体信息的类型不同,接收者的情绪感受也会不同。车辆内通常还设置有氛围灯、仪表盘等氛围设备,这些氛围设备可以通过自身输出的氛围主题,在车辆内营造出一定的氛围环境。用户在收听音乐、电台节目时,会想要根据收听感受来设置车辆内氛围设备的输出主题,以适应自身的感官体验。目前车载氛围设备完全依赖人工手动设置,并没有一种自动化调节的方案。本申请可以根据媒体设备输出的媒体信息,将车内氛围设备的输出模式自动设置为与媒体信息所营造的氛围环境相同的氛围主题。

以下具体介绍本申请技术方案的实现方式。

见图2,其示出了本申请提供的氛围设备控制方法的一种流程,具体包括如下步骤s201~s204。

s201:获取目标空间环境中的媒体信息。

其中,目标空间环境可以是任意空间环境,为了便于描述可以将其称为目标空间环境。需要说明的是,空间环境并不限定为封闭空间,可以是开放空间。空间环境中需要设置有媒体播放设备,例如空间环境可以是电影院、影音视唱场所(ktv)、装载有媒体设备的车辆等等。

媒体设备可以输出媒体信息,媒体信息可以语音、音乐、图像、文字等各种类型。空间环境中的媒体信息,可以具体在空间环境的媒体设备上获取。例如,车辆内设置有音乐播放器,可以在音乐播放器中获取在车辆内播放的音乐数据。或者,可以在空间环境中设置媒体信息采集单元,如语音采集模块、图像采集模块,使用媒体信息采集单元收集在空间环境中输出的媒体信息。例如,车辆内设置有语音采集模块,可以采集无线电设备播放的声音信息,声音信息可以是语音信息,也可以是音乐信息等。

s202:从媒体信息中提取氛围特征,氛围特征为能够表示媒体信息所营造的氛围类型的特征。

其中,媒体信息可以影响信息接收者的情绪感受,这种影响是通过媒体信息所营造的氛围环境实现的。在一种特定的氛围环境中,信息接收者会产生相应地感官体验及情绪感受,氛围设备所切换后的氛围主题也是为了增强这种情绪感受,使信息接受者更加沉浸在这种氛围环境中。

因此,可以确定媒体信息所营造的氛围主题,进而将氛围设备的输出主题设置为所确定的氛围主题即可。

需要说明的是,媒体信息本身会携带各种物理特征,本申请关注的是能够反映媒体信息在外部空间环境中所营造出的氛围类型的特征。例如,音乐具有旋律特征,强节奏的旋律可以营造出活力的氛围环境,轻缓的旋律可以营造出舒缓的氛围环境。文字具有语义特征,积极的语义也可以营造出活力的氛围环境,消极的语义可以营造出低沉的氛围环境。

因此,可以对媒体信息的数据信息进行分析,从中提取可以反映氛围类型的物理特征。为了便于描述,可以将提取到的该种特征称为氛围特征。氛围特征与媒体信息能够带给用户的情绪感受是对应的,以下对情绪感受进行介绍来说明氛围特征的具体内容。

不同的学术模型中,情绪感受的定义不同,基于可量化原则,本申请将情绪分为两个能量与压力两个维度进行描述。如图3所示,情绪可以包括能量及压力两个维度,能量高表示活力,能量低表示平静,压力低表示快乐,压力高表示焦虑,将能量高低及压力高低进行组合后,可以得到四种情绪类型,即(快乐,平静)、(焦虑,平静)、(快乐,活力)及(焦虑,活力),进行综合后分别称为平静、沮丧、活力、焦虑。

情绪感受是由媒体信息的氛围特征所影响的,情绪感受可以通过从能量及压力两个维度进行分析,因此可以从媒体信息中提取能够对用户的能量及压力产生影响的数据信息,分析数据信息后便可以得到氛围特征。

以音乐为例,音乐中乐器的音色可以影响用户的压力,音乐的节奏可以影响用户的能量,从而可以对乐器音色及节奏进行数据信息提取,使用声音分析模型分析数据信息后得到氛围特征。

媒体信息的呈现类型可能是各种,不同呈现类型的媒体信息,提取氛围特征的方式也会不同,因此需要首先确定媒体信息的呈现类型,其中呈现类型也可以称为呈现形式。基于呈现类型与提取内容对象的对应关系,进而为上述得到媒体信息的呈现类型确定所对应的提取内容对象。

例如,空间环境为影音视唱环境,该环境中可以播放音乐,媒体信息的呈现类型即音乐,基于预先设置的对应关系可知,音乐类型的媒体信息对应的提取内容对象包括音乐信号和/或音乐歌词,因此可以确定在这种应用场景中,所确定出的提取内容对象为音乐信号和/或音乐歌词。

又如,空间环境为车载环境,用户可以在车辆内收听无线电设备输出的语言节目,媒体信息的呈现类型为语音,基于预先设置的对应关系可知,语音类型的媒体信息对应的提取内容对象为语音转换为的语音文本,因此可以确定在这种应用场景中,所确定出的提取内容对象为语音文本。

提取内容对象是进行氛围特征分析的对象。因此,根据媒体信息的呈现类型确定内容提取对象后,从提取内容对象中提取氛围特征。例如,媒体信息的呈现类型包括音乐,则需要从音乐信号和/或音乐文本中提取氛围特征;又如,媒体信息的呈现类型包括语音,则需要从语音转换后的语音文本中提取氛围特征。氛围特征的具体提取方式参见下文,此处并不赘述。

s203:确定氛围特征对应的氛围主题。

其中,氛围特征是从内容提取对象中提取出来的物理特征,分析这种物理特征,以确定媒体信息所营造出的氛围的类型,氛围类型也可以称为氛围主题。可以理解的是,氛围可以影响用户的情绪,人在一种类型的氛围环境中,所产生的情绪类型是对应的,因此情绪类型与氛围主题是一一对应的。因此,可以根据情绪类型的划分来预先设置多种氛围主题。

上述一种对情绪的分析方法中,可以将情绪划分为四种类型,分别为平静、沮丧、活力、焦虑,那么氛围主题也可以划分为这四种。当然,不同的情绪分析方法中所得到的情绪类型可能不同,相应地,氛围主题的种类也随之不同,对此本申请并不做具体限定。

预设多种氛围主题后,设置氛围主题对应的氛围特征。不同种类的氛围主题所对应的氛围特征是不同的,步骤s202得到氛围特征后,根据对应关系确定该氛围特征所对应的氛围主题。

以上是通过氛围特征与氛围主题的预设对应关系,来确定氛围特征对应的氛围主题。除了该种实现方式之外,还可以基于预先构建的神经网络模型来得到氛围主题。具体地,得到氛围特征的训练样本,使用机器学习算法对氛围特征的训练样本进行训练,得到神经网络模型。神经网络模型的输入为氛围特征,神经网络模型的输出为氛围主题。在步骤s202得到氛围特征后,将该氛围特征输入至神经网络模型中,便可以得到氛围主题。其中机器学习算法可以是任意一种神经网络模型的训练方法,本申请并不做具体限定。

需要说明的是,除了使用氛围特征来确定媒体信息对应的氛围主题之外,还可以通过人工标注的方法。具体地,获得媒体信息后,在信息库中查找该媒体信息对应的氛围主题,其中信息库包含的是通过人工的方式为媒体信息所标注的氛围主题。

s204:生成氛围主题对应的设备设置指令,并将设备设置指令发送至氛围设备。

其中,设备设置指令用于使氛围设备的输出数据符合氛围主题。

氛围主题是空间环境中的媒体信息所营造的一种类型的氛围,为了增强在空间环境中的人的情绪感受,可以由氛围设备生成相同主题的氛围。需要说明的是,氛围设备可以输出多种氛围主题,不同的氛围主题对应的设置指令不同。在步骤s203确定氛围主题后,确定该氛围主题所对应的设备设置指令。将该设备设置指令发送至氛围设备,以指示氛围设备输出该氛围主题。

需要说明的是,氛围设备可以是一个,也可以是多个。若氛围设备为多个,不同的氛围设备对应的设备设置指令可以不同,需要为每个氛围设备确定其对应的设备设置指令,将各个设备设置指令发送至对应的氛围设备。

以车载环境为例进行说明。氛围设备可以包括仪表盘、氛围灯及中央控制设备,向各个氛围设备发送对应的设备设置指令,以使各个氛围设备营造出该氛围主题。

仪表盘,通常包括燃油、清洗液、雾灯等各种车辆状况的指示灯,是反映车辆各系统工作状况的车载装置。仪表盘通常提供多种氛围主题,氛围主题包括表盘背景颜色、表盘显示图标等各种元素,元素样式不同则表示氛围主题不同。仪表盘可以切换不同的氛围主题,来改变车内氛围环境的类型。例如,切换到一种氛围主题下,仪表盘的背景色为红色、显示图标风格较为活泼,则可以营造出较为活力的氛围环境。又如,切换到另一种氛围主题下,仪表盘的背景色为蓝色、显示图标风格较为朴素、则可以营造出较为平静的氛围环境。假设步骤s203确定的氛围主题为活力,则向仪表盘发送设备设置指令,该设备设置指令用于指示仪表盘将背景色设置为红色,将显示图标风格设置为活泼。

氛围灯,是设置在车辆内部用于营造驾驶舱气氛的一种装饰灯。氛围灯可以通过改变灯光颜色,在车辆内部营造出不同的氛围环境。例如红色可以营造出活力的环境、蓝色可以营造出放松舒适的环境。假设步骤s203确定的氛围主题为活力,则向氛围灯发送设备设置指令,该设备设置指令用于指示氛围灯将颜色设置为红色。

中央控制设备,具有显示屏可以反映车辆各系统的运行状况,同仪表盘类似,可以改变屏幕背景颜色及显示图标风格,来在车辆内营造出不同的氛围环境。假设步骤s203确定的氛围主题为活力,则向氛围灯发送设备设置指令,该设备设置指令用于指示中央控制设备将屏幕背景颜色设置为红色,显示图标风格设置为活泼。

由以上技术方案可知,本申请提供了一种氛围设备控制方法,该方法可以获得空间环境中存在的媒体信息,从媒体信息中提取氛围特征,其中氛围特征为能够表示媒体信息在空间环境所营造的氛围类型的特征,根据氛围特征确定出氛围主题,进而根据氛围主题生成设备设置指令,将设备设置指令发送至氛围设备,以使氛围设备的输出氛围为所述氛围主题。该种方法并不需要由人工设置氛围设备的输出主题,而是根据空间环境中的媒体信息所能够营造的氛围类型,来自动设置氛围设备。氛围设备的控制不依赖人工操作,控制方式更加智能化,用户体验较好。

在特定的应用环境中,氛围设备的控制方法还具有特定的优势。例如在车载环境中,车主在收听音乐的过程中,车内的氛围设备可以根据音乐所营造的氛围环境来自主调节输出主题,无需车主手动调节,保证了车主的安全驾驶。又如在影音视唱环境中,氛围灯等氛围设备可以随着输出音乐自动调节输出颜色,无需人工调节,对于用户来讲更加方便。

以下根据媒体信息的呈现类型不同,具体说明如何提取媒体信息中的氛围特征。

若媒体信息的呈现类型包括音乐,则氛围特征提取方式如图4所示,包括如下步骤s401~s406。

s401:若媒体信息的呈现类型包括音乐,将音乐信号和/或音乐歌词确定为提取内容对象。

其中,如果获取到的媒体信息为音乐这种呈现类型,则确定提取对象内容为音乐信号和/或音乐歌词。具体地,如果音乐的相关信息既包含音乐信号也包含音乐歌词,则可以确定提取内容对象包含以上两者;如果音乐的相关信息中包含其中一个,则可以确定提取内容对象为其中一个。

s402:若包含音乐信号,从音乐信号中提取频谱能量在不同频率区间的分布特征。

其中,音乐信号中能够反映氛围特征的数据特征是,频谱能量在不同频率区间的分布特征。分布特征不同,则表示音乐信号所营造的氛围特征不同。在语音识别领域,能够表示上述分布特征的数据特征有多种,本申请以梅尔频率倒谱系数(mel-frequencycepstralcoefficients,mfcc)为例进行说明。

梅尔频率倒谱系数mfcc是语音处理过程中常用的语音特征,顾名思义,特征提取过程包含两个关键步骤:将音乐信号转化到梅尔频率,然后进行倒谱分析。

关于第一个关键步骤,即将音乐信号转化到梅尔频率。梅尔频率倒谱系数是在梅尔标度频率域提取出来的倒谱参数,梅尔标度描述了人耳频率的非线性特性,梅尔刻度的滤波器组在低频部分的分辨率高,跟人耳的听觉特性是相符的,这也是梅尔刻度的物理意义所在。在本步骤中,首先对时域信号进行傅里叶变换转换到频域,然后再利用梅尔频率刻度的滤波器组对应频域信号进行切分,最后每个频率段对应一个数值。

关于第二个关键步骤,即倒谱分析。按照倒谱的定义,需要进行反傅里叶变换然后通过低通滤波器获得最后的低频信号,具体地,可以使用离散余弦变换获取频率谱的低频信息。离散余弦变换的作用是,为了获得频谱的倒谱,倒谱的低频分量就是频谱的包络,倒谱的高频分量就是频谱的细节,这些都是语音识别上经过科学验证十分有效的语音物理信息。

当然,在处理过程中还可以包括其他步骤,如预加重、加窗等,以上仅说明特征提取过程中最重要的两个步骤而已。

经过上述处理后,可以将音乐信号信息(频谱包络和细节)进行编码运算得到的一组向量序列,该组向量序列即梅尔频率倒谱系数,可以反映频谱能量在不同频率区间的分布特征。

需要说明的是,在进行氛围特征提取之前,还可以包括预处理步骤。预处理步骤是将音乐信号解码、分帧、去静音、生成音频段、信道自适应、训练识别,以达到提取向量序列的基础。

s403:确定频谱能量的分布特征对应的第一氛围主题。

其中,可以预先构建氛围主题确定模型,氛围主题确定模型可以是通过机器学习算法对分布特征样本数据训练得到的一种神经网络模型。基于氛围主题确定模型确定分布特征对应的氛围主题,具体地,模型的输入为频谱能量的分布特征,输出为氛围主题,因此将步骤s402得到的频谱能量的分布特征输入至模型后,便可以得到其对应的氛围主题。

或者,可以构建特征库,特征库中包含的是频谱能量的分布特征与氛围主题的对应关系,该对应关系是使用分布特征样本数据进行训练后建立的。步骤s402得到频谱能量的分布特征后,将该分布特征与特征库中的分布特征进行比对,查找最为相似的分布特征。需要说明的是,分布特征是向量序列,在查找最为相似的分布特征时,可以计算向量序列与特征库中各个向量序列的距离,将距离值最小的向量序列作为与s402得到的向量序列最相似的分布特征。将最相似的分布特征所对应的氛围主题确定为本步骤中的氛围主题。

为了便于与下文得到的氛围主题区分,可以将本步骤得到的氛围主题称为第一氛围主题。

s404:若包含音乐歌词,确定音乐歌词包含的情绪分词及情绪分词的词频特征。

其中,如果提取内容对象包含有音乐歌词,音乐歌词是一种文本内容,需要对音乐歌词进行文本语义分析。由于本申请是需要确定音乐歌词能够对用户情绪产生的影响,因此文本语义分析是对音乐歌词中的情绪分词进行分析。一种具体的分析方式如下所述。

对音乐歌词进行分词。比如,使用基于统计的机器学习算法,如隐马尔可夫模型(hiddenmarkovmodel,hmm)、条件随机场算法(conditionalrandomfields,crf)、支持向量机(supportvectormachine,svm)算法、深度学习等算法等构建的分词器,对音乐歌词进行分词。

从各个分词中提取情绪分词。具体地,可以预先构建情绪词库,情绪词库中包含的各种与情绪相关的词汇,如“开心”“美好”“沮丧”等等。使用情绪词库对音乐歌词的各个分词进行分析,选择包含在情绪词库中的分词,所选择分词即情绪分词。比如音乐歌词中包含“我今天很开心”,分词后包含有“我”“今天”“很”“开心”几个分词,根据情绪词库,可以从分词中提取“开心”这个分词作为情绪分词。

确定情绪分词的词频特征。词频特征可以包括情绪分词在音乐歌词中出现的次数及情绪分词的权重值。因此,可以统计每个情绪分词的出现次数,并为每个情绪分词分配权重值。其中,权重值表示的是情绪分词与氛围主题的关联程度,或者,权重值表示的是情绪分词对确定氛围主题的影响程度。例如,可以为“开心”设置权重值为1,为“蓝天”设置权重值为0.5。

情绪分词、情绪分词的权重及情绪分词的词频可以称为音乐歌词的情绪词典。

需要说明的是,在提取氛围特征之前,还可以进行预处理步骤,预处理步骤包括:除去音乐歌词中的非文本数据,将剩余的文本数据编码转化为预设格式。

s405:确定情绪分词的词频特征对应的第二氛围主题。

其中,可以预先构建情绪特征库,情绪特征库包括多种氛围主题如活力、平静、焦虑、沮丧等,以及每种氛围主题对应的分词。

具体地,情绪特征库中可以包含多个氛围主题,每个氛围主题包含多个情绪分词。步骤s404得到情绪分词后,可以首先确定这些情绪分词对应哪些氛围主题,再根据情绪分词的词频特征计算所对应的氛围主题的得分。在各个得分中选择得分最大值,将得分最大值对应的氛围主题作为本步骤中的氛围主题。其中,氛围主题的得分计算方式可以是,确定氛围主题对应的情绪分词,将情绪分词的词频特征中的出现次数与权重相乘,将情绪分词相乘后的数值相加。

例如,情绪特征库中包含有{活力、焦虑、快乐、沮丧}四种氛围主题,其中活力包含的情绪分词有(赞、搞笑),焦虑包含的情绪分词有(不安),快乐包含的情绪分词有(喜欢、搞笑),沮丧包含的情绪分词有(哭泣、痛苦)。假设上一步骤得到的情绪词典中,包含有情绪分词:喜欢、搞笑、赞、哭泣、痛苦,权重及出现次数分别为(1,2)、(1.5,1)、(0.5,1)、(1,3)、(0.5,4),则可以计算上述四种氛围主题的得分:

活力:0.5*1+1.5*1=2;焦虑:0;快乐:1*2+1.5*1=3.5;沮丧:1*3+0.5*4=5。根据得分大小可知,选择得分最大值5对应的沮丧作为本步骤中的氛围主题。

为了便于与上文得到的氛围主题区分,可以将本步骤得到的氛围主题称为第二氛围主题。

s406:若第一氛围主题与第二氛围主题相同,确定氛围特征对应的氛围主题为第一氛围主题或第二氛围主题。

其中,在本实现方式中,只有在通过音乐信号得到的氛围主题与音乐歌词得到的氛围主题相同的情况下,才会得到最终确定的氛围主题。这种方式结合了音乐信号与音乐歌词两个方面得到的分析结果,识别准确度更高。

当然,如果媒体信息仅包括音乐信号及音乐歌词中的一个方面,则可以将该一方面得到的氛围主题作为最终识别的氛围主题。

以上技术方案说明了如何对音乐类型的媒体信息进行氛围特征提取,以下说明语音类型的媒体信息如何提取氛围特征。

在不同的应用场景中,语音类型的媒体信息可以是不同形式。例如在车载环境中,语音类型的媒体信息可以是车载无线电设备输出的电台语音,又如在演讲场景中,语音类型的媒体信息可以是演讲语音。

收集到语音后,可以使用以下两种实现方式中的任意一种来提取氛围特征。

第一种提取方式,可以将语音转换为语音文本,并确定媒体呈现类型对应的提取内容对象包括所述语音文本;提取所述语音文本中的情绪分词,确定情绪分词的词频特征;以及确定情绪分词的词频特征对应的氛围主题。

具体地,首先对语音进行识别,将语音转换为语音文本。语音文本作为提取内容对象,需要从语音文本中提取氛围特征。需要说明的是,该种提取方式与歌词文本的提取方式相同,即从语音文本中提取情绪分词,并根据情绪分词来确定氛围主题,此处并不赘述,可以参见上述说明。

第二种提取方式,获得语音的内容描述标签,并确定媒体呈现类型对应的提取内容对象包括所述内容描述标签;以及提取所述内容描述标签中的情绪分词,并确定情绪分词的词频特征,确定情绪分词的词频特征;以及确定情绪分词的词频特征对应的氛围主题。

具体地,在某些情况下,语音具有内容描述标签,内容描述标签描述地是语音主要表达的内容。例如,电台节目具有内容说明,可以将内容说明作为提取内容对象。得到内容描述标签后,同样可以使用与音乐歌词相同的处理方式,即从语音文本中提取情绪分词,并根据情绪分词来确定氛围主题,此处并不赘述,可以参见上述说明。

为了便于理解本申请提供的技术方案,以下以车载环境为例对氛围设备的控制过程进行说明。

如图5所示,车辆内通常设置有媒体设备音乐播放器,车内人员可以收听音乐播放器内播放的音乐。音乐的类型不同,在车内营造的氛围环境也会不同,给车内人员造成的情绪影响也会不同。

为了快速地识别音乐对应的氛围主题,可以使用人工标注的方式。具体地,可以首先获得音乐的相关信息如音乐名、演唱者等,将音乐的相关信息发送至服务器。服务器上包含有对音乐对应的氛围主题的人工标注,如活力、平静、焦虑、沮丧。或者,服务器中记录的氛围主题并非由人工标注,也可以是经过自动情绪识别后验证过的数据。服务器接收到音乐的相关信息后,查询该音乐的相关信息对应的氛围主题,并将查询到的氛围主题返回给车辆。

如果服务器并未查询到氛围主题,可以由车辆通过氛围设备控制方法自主判断音乐对应的氛围主题。具体地,车辆可以获得音乐信号及音乐歌词,分别对音乐信号及音乐歌词进行分析,从音乐信号中获得用于表示该音乐能够营造出的氛围类型的特征,也从音乐歌词中获得用于表示该音乐能够营造出的氛围类型的特征。

为音乐信号得到的氛围特征,确定其对应的氛围主题;以及为音乐歌词得到的氛围特征,确定其对应的氛围主题。如果两个氛围主题相同,则可以将音乐所营造的氛围主题确定为该氛围主题。

如图5所示,车辆内还可以设置有氛围设备,如中央控制设备、仪表盘、氛围灯等,这些氛围设备可以通过设置自身的输出信息,在车内营造出各种不同主题的氛围。如图5所示,依据音乐的氛围主题生成设置指令,将设置指令发送至各个氛围设备,以使各个氛围设备的输出模式为该氛围主题。

例如,假设氛围主题为氛围主题a,中央控制设备将背景颜色、显示图标风格、提示音设置为氛围主题a下的样式;仪表盘将背景颜色、显示图标风格、亮度设置为氛围主题a下的样式;氛围灯将灯光颜色、灯光亮度设置为氛围主题a下的样式。

这样,车内人员并不需要手动设置氛围设备的输出主题,而是由车辆自动识别并调节,从而可以提高车内人员的体验,如提高车主的驾驶体验并保证驾驶安全性。同时,也可以提高车内人员欣赏音乐的沉浸度。

见图6,其示出了本申请提供的氛围设备控制装置的一种结构示意,具体包括:媒体信息获取单元601、氛围特征提取单元602、氛围主题确定单元603及设置指令发送单元604。

媒体信息获取单元601,用于获取目标空间环境中的媒体信息;

氛围特征提取单元602,用于从所述媒体信息中提取氛围特征,所述氛围特征为能够表示所述媒体信息所营造的氛围类型的特征;

氛围主题确定单元603,用于确定所述氛围特征对应的氛围主题;

设置指令发送单元604,用于生成所述氛围主题对应的设备设置指令,并将所述设备设置指令发送至氛围设备,所述设备设置指令用于使所述氛围设备的输出数据符合所述氛围主题。

在一个示例中,氛围特征提取单元602包括:呈现类型确定单元及氛围特征提取单元。其中,呈现类型确定单元,用于确定所述媒体信息对应的媒体呈现类型;以及氛围特征提取单元,用于获得所述媒体呈现类型对应的提取内容对象,并从所述提取内容对象中提取氛围特征。

在一个示例中,若所述媒体呈现类型包含音乐,则氛围特征提取单元包括:音乐内容确定单元、信号特征提取单元及歌词特征提取单元。其中,音乐内容确定单元,用于确定所述媒体呈现类型对应的提取内容对象包括音乐信号和/或音乐歌词;信号特征提取单元,用于若提取内容对象包含音乐信号,从所述音乐信号中提取频谱能量在不同频率区间的分布特征;歌词特征提取单元,用于若提取内容对象包含音乐歌词,确定所述音乐歌词包含的情绪分词及情绪分词的词频特征。

在一个示例中,氛围主题确定单元包括:信号及歌词氛围主题确定单元、及音乐氛围主题确定单元。其中,信号及歌词氛围主题确定单元,用于若氛围特征包含频谱能量的分布特征及情绪分词的词频特征,确定所述频谱能量的分布特征对应的氛围主题,以及确定情绪分词的词频特征对应的氛围主题;音乐氛围主题确定单元,在分布特征对应的氛围主题与词频特征对应的氛围主题相同的情况下,确定所述氛围特征对应的氛围主题为所述分布特征对应的氛围主题或词频特征对应的氛围主题。

在一个示例中,信号及歌词氛围主题确定单元在执行确定所述频谱能量的分布特征对应的氛围主题的方面,具体用于:基于氛围主题确定模型确定所述分布特征对应的氛围主题,其中所述氛围主题确定模型是通过机器学习算法对分布特征样本数据训练得到的。

在一个示例中,信号及歌词氛围主题确定单元在执行确定情绪分词的词频特征对应的氛围主题的方面,具体用于:根据词频特征,计算情绪分词归属各种预设氛围主题的得分,获得得分最大值对应的预设氛围主题。

在一个示例中,若所述媒体呈现类型包含语音,则氛围特征提取单元包括:语音内容确定单元、及音乐词频特征确定单元。其中,语音内容确定单元,用于将所述语音转换为语音文本,并确定所述媒体呈现类型对应的提取内容对象包括所述语音文本;音乐词频特征确定单元,用于提取所述语音文本中的情绪分词,并确定情绪分词的词频特征。

在一个示例中,若所述媒体呈现类型包含语音,则氛围特征提取单元包括:内容描述标签获得单元、及词频特征确定单元。其中,内容描述标签获得单元,用于获得所述语音的内容描述标签,并确定所述媒体呈现类型对应的提取内容对象包括所述内容描述标签;词频特征确定单元,用于提取所述内容描述标签中的情绪分词,并确定情绪分词的词频特征。

见图7,其示出了本申请提供的一种氛围设备控制设备,具体包括:媒体信息采集器701、存储器702、处理器703及通信总线704。

其中,媒体信息采集器701、存储器702、处理器703通过通信总线704完成相互间的通信。

媒体信息采集器701根据实际应用场景,可以是能够采集媒体信息的各种类型的采集器,如声音采集器、图像采集器等。

存储器702,用于存放程序;存储器702可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。

处理器703,用于执行程序,程序可以包括程序代码,所述程序代码包括处理器的操作指令。其中,程序可具体用于:

获取目标空间环境中的媒体信息;

从所述媒体信息中提取氛围特征,所述氛围特征为能够表示所述媒体信息所营造的氛围类型的特征;

确定所述氛围特征对应的氛围主题;

生成所述氛围主题对应的设备设置指令,并将所述设备设置指令发送至氛围设备,所述设备设置指令用于使所述氛围设备的输出数据符合所述氛围主题。

处理器703可能是一个中央处理器cpu,或者是特定集成电路asic(applicationspecificintegratedcircuit),或者是被配置成实施本申请实施例的一个或多个集成电路。

在控制车内氛围环境为例,氛围设备控制设备可以是车载设备,用于收集车内输出的媒体信息如音乐、电台语音等,通过控制总线与车内的氛围设备相连,将生成的设备设置指令通过控制总线发送至氛围设备。

需要说明的是,所述处理器可以执行与上述氛围设备控制方法相关的各个步骤,此处并不赘述。

本申请还提供了一种可读存储介质,其上存储有计算机程序,所述计算机程序可以被处理器执行,以实现氛围设备控制方法中的各个步骤。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括上述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1