适于室内环境的音频播放方法、设备、系统及存储介质与流程

文档序号:17797610发布日期:2019-05-31 20:52阅读:240来源:国知局
适于室内环境的音频播放方法、设备、系统及存储介质与流程

本申请涉及信号处理技术领域,尤其涉及一种适于室内环境的音频播放方法、设备、系统及存储介质。



背景技术:

随着消费类电子产品的推广普及,产品智能化的人机交互方式给用户带来了极大地便利性,例如,智能音频已经出现在越来越多的家庭中。但是,目前市面上的音频类产品基本都是单声道或者1.1声道的,其音效不能与传统的2.1声道或者5.1甚至7.1声道的音响系统相提并论。

在实际应用中,如果用户选择使用智能音频产品,那么如何提高其音效是亟待解决的一大问题。



技术实现要素:

本申请的多个方面提供一种适于室内环境的音频播放方法、设备、系统及存储介质,用以发挥智能音频设备的智能化优势,与此同时提高智能音频设备的音效,满足用户对智能性和音效的双重需求。

本申请实施例提供一种适于室内环境的音频播放方法,在所述室内环境的听音区周围分散地部署有多个智能音频设备;所述方法包括:第一智能音频设备根据接收到的播放指令,获取需要播放的目标音频信号,所述目标音频信号包括多个目标声源方位;所述第一智能音频设备根据对应的声源方位-播放参数映射关系,确定与各目标声源方位对应的播放参数;所述第一智能音频设备按照与各目标声源方位对应的播放参数分别输出所述目标音频信号中各目标声源方位上的声音信号,以配合其它智能音频设备在所述听音区产生环绕立体声的音效;其中,所述第一智能音频设备是所述多个智能音频设备中的任一音箱,所述声源方位-播放参数映射关系是根据所述室内环境的环境特征和所述第一智能音频设备与所述听音区的相对位置预先确定的。

本申请实施例还提供一种适于室内环境的音频播放系统,包括:多个智能音频设备;所述多个智能音频设备分散部署在所述室内环境中听音区的周围;所述多个智能音频设备,分别用于根据接收到的播放指令,获取需要播放的目标音频信号,所述目标音频信号包括多个目标声源方位;根据各自对应的声源方位-播放参数映射关系,确定与各目标声源方位对应的播放参数;按照与各目标声源方位对应的播放参数输出所述目标音频信号中各目标声源方位上的声音信号,以在所述听音区产生环绕立体声的音效;其中,所述多个智能音频设备各自对应的声源方位-播放参数映射关系是根据所述室内环境的环境特征和所述多个智能音频设备与所述听音区的相对位置预先确定的。

本申请实施例还提供一种智能音频设备,包括:通信组件、存储器、处理器以及音频组件;所述通信组件,用于接收播放指令;所述存储器,用于存储计算机程序和所述智能音频设备对应的声源方位-播放参数映射关系;所述处理器,用于执行所述计算机程序,以用于:根据所述通信组件接收到的播放指令,获取需要播放的目标音频信号,所述目标音频信号包括多个目标声源方位;根据所述存储器中存储的声源方位-播放参数映射关系,确定所述智能音频设备与各目标声源方位对应的播放参数,并输出至所述音频组件;所述音频组件,用于按照所述智能音频设备与各目标声源方位对应的播放参数输出所述目标音频信号中各目标声源方位上的声音信号,以与所述智能音频设备所在室内环境中其它智能音频设备配合在所述室内环境的听音区内产生环绕立体声的音效;其中,所述声源方位-播放参数映射关系是根据所述室内环境的环境特征和所述智能音频设备与所述听音区的相对位置预先确定的。

本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,当所述计算机程序被一个或多个处理器执行时,致使所述一个或多个处理器执行本申请方法实施例中的步骤。

在本申请实施例中,在室内环境中的听音区周围分散性部署多个智能音频设备,预先结合室内环境的环境特征和多个智能音频设备与听音区的相对位置确定各智能音频设备对应的声源方位-播放参数映射关系,这样,当需要播放环绕立体声时,各智能音频设备根据自己对应的映射关系即可确定出与环绕立体声中包含的目标声源方位对应的播放参数,进而按照与各目标声源方位对应的播放参数分别输出各目标声源方位上的声音信号,达到在听音区产生环绕立体声的音效的目的。在本实施例中,利用智能音频设备构建出环绕立体声场,不仅可以发挥智能音频设备的智能化优势,而且提高了智能音频设备的音效。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1a为本申请示例性实施例提供的适于室内环境的音频播放系统的结构示意图;

图1b为本申请示例性实施例提供的另一种适于室内环境的音频播放系统的结构示意图;

图1c为本申请示例性实施例以长方形区域为例确定各智能音频设备在候选声源方位下的播放参数的过程示意图;

图1d为本申请示例性实施例提供的又一种适于室内环境的音频播放系统的结构示意图;

图1e为本申请示例性实施例中录音设备上设置麦克的样式示意图;

图2a为本申请示例性实施例提供的一种适于室内环境的音频播放方法的流程示意图;

图2b为本申请示例性实施例提供的另一种适于室内环境的音频播放方法的流程示意图;

图3为本申请示例性实施例提供一种智能音频设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

在现有技术中,如果用户选择使用智能音频设备,那么将会面临如何提高智能音频设备的音效的技术问题。针对该技术问题,在本申请一些实施例中,在室内环境中的听音区周围分散性部署多个智能音频设备,预先结合室内环境的环境特征和多个智能音频设备与听音区的相对位置确定各智能音频设备对应的声源方位-播放参数映射关系,这样,当需要播放环绕立体声时,各智能音频设备根据各自对应的映射关系即可确定出与环绕立体声中包含的目标声源方位对应的播放参数,进而按照与各目标声源方位对应的播放参数分别输出各目标声源方位上的声音信号,达到在听音区产生环绕立体声的音效的目的。在本实施例中,利用智能音频设备构建出环绕立体声场,不仅可以发挥智能音频设备的智能化优势,而且提高了智能音频设备的音效。

以下结合附图,详细说明本申请各实施例提供的技术方案。

图1a为本申请示例性实施例提供的一种适于室内环境的音频播放系统的结构示意图。如图1a所示,该音频播放系统100部署于室内环境中,具体包括:多个智能音频设备101,多个智能音频设备101分散地部署在室内环境中听音区102的周围。智能音频设备101是指可以播放音频信号的设备,例如可以是智能音箱、智能手机等。

其中,室内环境中的听音区102是指用户习惯收听智能音频设备101播放音频信号的位置区域。根据室内环境的不同,其听音区也会有所不同。例如,假设室内环境是客厅,用户习惯性坐在沙发上收听音频或观看视频,则听音区可以是客厅中沙发所在的位置区域。又例如,假设室内环境是主卧室,用户习惯性躺在床上收听音频或观看视频,则听音区可以是主卧室中的床头位置。又例如,假设室内环境是多媒体会议室,则听音区可以是多媒体会议室中的会议桌所在的位置区域。

在本申请实施例中,并不限定多个智能音频设备101在听音区102周围分散部署的方式,具体需要根据听音区102的位置以及室内环境的形状等灵活部署。例如,假设室内环境是比较规则的长方形、正方形或圆形区域,听音区102是该长方形、正方形或圆形区域的中心区域,则多个智能音频设备101可以环绕该中心区域均匀部署。当然,若室内环境是不规则的区域,听音区102可能位于该不规则区域的某个边或角上,那么多个智能音频设备101可以分散到听音区102的周围,对该听音区102形成半包围的状态。由于室内环境是不规则区域,不同位置到听音区102的距离可能不同,则多个智能音频设备101之间可以是非均匀部署的,以便达到预期的环绕立体声的音效。

另外,本申请实施例也不对智能音频设备101的数量进行限定,可以根据预期的环绕立体声的音效以及室内环境的大小等灵活设定。例如,可以在听音区102的周围设置3、4、6或8个智能音频设备101。在本实施例中,预先在听音区102周围部署多个智能音频设备101,在部署多个智能音频设备101之后,可结合室内环境的环境特征以及多个智能音频设备101与听音区102的相对位置,确定每个智能音频设备101对应的声源方位-播放参数映射关系。其中,每个智能音频设备101对应的声源方位-播放参数映射关系中存储有该智能音频设备101在可能出现的各候选声源方位下对应的播放参数。对同一候选声源方位来说,若各智能音频设备101均按照该候选声源方位对应的播放参数进行播放,则在听音区102处会听到来自该候选声源方位上的环绕立体声的音效。

在此说明,在本申请实施例中,为便于描述和区分,将可能出现在音频信号(这里的音频信号是泛指)中的声源方位称为候选声源方位。其中,音频信号的多样化导致候选声源方位也是多样化的,在本实施例中,预先建立智能音频设备101在可能出现的各候选声源方位下的播放参数。另外,在本申请实施例中,将智能音频设备101在某次播放过程中所播放的某个具体音频信号中存在的声源方位称为目标声源方位。候选声源方位可以看作是声源方位的全集,而目标声源方位是其中一个子集。

基于上述,当需要使用该音频播放系统100播放音频信号时,可以向多个智能音频设备101发出播放指令。对每个智能音频设备101而言,可根据接收到的播放指令,获取需要播放的音频信号。为便于描述和区分,将需要播放的音频信号称为目标音频信号,该目标音频信号中包含多个目标声源方位,属于环绕立体声。然后,每个智能音频设备101可以根据自己对应的声源方位-播放参数映射关系,确定与目标音频信号中包含的各目标声源方位对应的播放参数。接着,每个智能音频设备101可以按照自己与各目标声源方位对应的播放参数分别输出目标音频信号中各目标声源方位上的声音信号,这样就会在听音区102处产生环绕立体声的音效。

可选地,目标音频信号的形式包括但不限于:音乐、影视配音、名人演讲、相声、有声读物、英文音频资料,等等。

在本实施例中,利用智能音频设备构建出环绕立体声场,不仅可以发挥智能音频设备的智能化优势,基于该环绕立体声场播放音频信号还有利于提高智能音频设备的播放效果。

在一种应用场景中,多个智能音频设备101支持语音交互方式,并且具有上网功能,则用户可以向多个智能音频设备101发出语音播放指令,要求多个智能音频设备101播放互联网上的环绕立体声。该语音播放指令可以携带需要智能音频设备101播放的环绕立体声的标识,例如可以是需要播放的音乐的名称、专辑等信息。对多个智能音频设备101而言,可以根据用户发出的语音播放指令,从互联网上获取需要播放的目标音频信号。

进一步可选地,多个智能音频设备101具有平等地位,则多个智能音频设备101均可以接收用户发出的语音播放指令,分别根据各自接收到的语音播放指令从互联网上获取需要播放的目标音频信号。

进一可选地,多个智能音频设备101被划分为主音箱和从音箱,从音箱与主音箱建立通信连接,例如蓝牙连接、wifi连接或红外连接等,从音箱接受主音箱的控制。基于此,用户可以向主音箱发出语音播放指令,主音箱接收用户发出的语音播放指令,一方面根据该语音播放指令从互联网上获取需要播放的目标音频信号,另一方面将该语音播放指令转发给从音箱;对从音箱而言,可以接收主音箱转发的语音播放指令,进而根据该语音播放指令从互联网上获取需要播放的目标音频信号。

在另一应用场景中,用户使用其它音视频播放设备播放音视频信号,为了提高音效,可以将音视频播放设备播放的音频信号传输给多个智能音频设备101,从而利用多个智能音频设备101产生环绕立体声的音效。其中,音视频播放设备可以是任何具有音视频播放功能的设备,可以是电视机、手机、笔记本电脑、平板电脑(ipad)、ar设备、vr设备或平板二合一等。在该应用场景中,多个智能音频设备101可以与音视频播放设备建立无线连接,例如wifi连接、蓝牙连接或红外连接等;音视频播放设备需要向多个智能音频设备101传输音频信号时,可以以无线方式发出播放指令,为便于区分和描述,将这里以无线方式发出的播放指令称为无线播放指令。对多个智能音频设备101而言,可以根据音视频播放设备发出的无线播放指令,接收音视频播放设备传输过来的目标音频信号。

进一步可选地,多个智能音频设备101具有平等地位,则多个智能音频设备101分别与音视频播放设备建立无线连接,这样可以分别接收音视频播放设备发出的无线播放指令,进而根据各自接收到的无线播放指令接收音视频播放设备传输过来的目标音频信号。

进一可选地,多个智能音频设备101被划分为主音箱和从音箱,从音箱与主音箱建立通信连接,例如蓝牙连接、wifi连接或红外连接等,从音箱接受主音箱的控制。基于此,主音箱可以与音视频播放设备建立无线连接,例如蓝牙连接、wifi连接或红外连接等,然后基于该无线连接接收音视频播放设备发送的无线播放指令,根据该无线播放指令接收音视频播放设备传输过来的目标音频信号,并将目标音频信号转发给从音箱;从音箱接收主音箱转发的目标音频信号。

无论是上述哪种应用场景,多个智能音频设备101在获取到目标音频信号之后,可以根据各自对应的声源方位-播放参数映射关系,确定各自与该目标音频信号中包含的各目标声源方位对应的播放参数;接着,每个智能音频设备可以按照各自与各目标声源方位对应的播放参数分别输出目标音频信号中各目标声源方位上的声音信号,以在听音区102处产生环绕立体声的音效。

在本申请实施例中,并不限定多个智能音频设备101各自对应的声源方位-播放参数映射关系的获取方式。例如,可以由智能音频设备101各自为自己建立声源方位-播放参数映射关系。又例如,也可以由多个智能音频设备101中的主音箱负责为各智能音频设备101建立声源方位-播放参数映射关系。又例如,也可以由服务器负责为各智能音频设备101建立声源方位-播放参数映射关系。

如图1b所示,在图1a所示音频播放系统100的基础上增加了服务器103。服务器103可以部署在云端,也可以部署在本地,对此不做限定。

在本实施例中,考虑到智能音频设备101的计算能力有限,故在音频播放系统100中部署服务器103,由服务器103负责为多个智能音频设备101分别建立各自对应的声源方位-播放参数映射关系。

在本实施例中,多个智能音频设备101分别与服务器103建立通信连接。该通信连接可以是有线的,也可以是无线的。服务器103可根据室内环境的三维空间信息和多个智能音频设备101与听音区102的相对位置信息,建立多个智能音频设备101各自对应的声源方位-播放参数映射关系,并将多个智能音频设备101各自对应的声源方位-播放参数映射关系分别下发给对应的智能音频设备101,供智能音频设备101存储在本地。

在一可选实施例中,用户可以预先获得室内环境的三维空间信息,例如户型图、装修图等;另外,在室内环境中部署多个智能音频设备101之后,用户可以手动测量得到多个智能音频设备101与听音区102的相对位置信息,并将室内环境的三维空间信息和多个智能音频设备101与听音区102的相对位置信息上传至服务器103。

在另一可选实施例中,多个智能音频设备101可以探测其与周围环境以及其与其它智能音频设备之间的距离信息,进而将这些距离信息上报给服务器103;服务器103根据多个智能音频设备101上报的这些距离信息,构建出室内环境的三维空间信息,并确定每个智能音频设备101与听音区102的相对位置信息。

在本实施例中,并不限定多个智能音频设备101探测其与周围环境以及其与其它智能音频设备之间的距离信息的方式,凡是可以供智能音频设备探测到其与周围环境以及其与其它智能音频设备之间的距离信息的方式均适用于本本申请实施例。下面列举几种探测方式:

在本实施例中,智能音频设备101包括超声波模块,超声波模块可以收发超声波信号。基于此,智能音频设备101可以利用超声波信号探测其与周围环境的距离信息。例如,在智能音频设备101的顶部设置超声波模块,利用该超声波模块向上方发出超声波信号,记录发出超声波信号的时间t1,并等待超声波信号碰到上方天花板后反射回来,记录接收到反射回来的超声波信号的时间t2,根据超声波在空气中的传输速率和时间差(t2-t1)可以计算出智能音频设备101到天花板的距离。同理,可以在智能音频设备101的前方设置超声波模块,利用该超声波模块向智能音频设备101正前方发出超声波信号,利用该超声波信号发出与返回的时间,结合超声波在空气中的传输速率可以计算出智能音频设备101到其正前方障碍物,例如墙面或书架等的距离。依次类推,可以在智能音频设备101的不同部位设置超声波模块,从而探测到该智能音频设备101与环境区域中各方位上相应障碍物的距离。由此可知,多个智能音频设备101可以分别利用超声波信号探测其与周围环境的距离信息并上报给服务器103。

在本实施例中,智能音频设备101包括蓝牙模块,蓝牙模块可以收发蓝牙信号。两个智能音频设备101可以通过各自的蓝牙模块建立蓝牙连接,并可基于蓝牙连接传输蓝牙信号。另外,智能音频设备101还包括音频模块,音频模块可以发出音频信号。两个智能音频设备101可以基于两者之间的蓝牙连接传输由其音频模块发出的音频信号。基于此,对两个智能音频设备101来说,一个智能音频设备101可以基于两者之间的蓝牙连接同时向另一智能音频设备101传输一个蓝牙信号和一个音频信号;另一智能音频设备101可以接收蓝牙信号和音频信号,由于蓝牙信号传输很快,蓝牙信号的传输时间可以忽略,这样,另一智能音频设备101可以根据接收到音频信号的时间和接收到蓝牙信号的时间之差,结合音频信号的传输速率,计算出其与另一智能音频设备101之间的距离信息。对多个智能音频设备101中的任一智能音频设备101来说,都可以利用蓝牙信号和音频信号探测其与其它智能音频设备的距离信息并上报给服务器103。

服务器103接收到每个智能音频设备101上报的其与周围环境的距离信息以及其与其它智能音频设备的距离信息,结合这些距离信息可以构建室内环境的三维空间信息,也可以计算出每个智能音频设备101与听音区102的相对位置信息;进而,可以根据室内环境的三维空间信息以及每个智能音频设备101与听音区102的相对位置信息,为每个智能音频设备101建立所对应的声源方位-播放参数映射关系。

可选地,以图1c所示的规则长方形区域为例,假设听音区102位于该长方形区域的中心位置o,则可以在该长方形区域的四个角上分别部署智能音频设备s1、s2、s3和s4。值得说明的是,为便于计算,这里以4个智能音频设备为例,但并不限于4个。对任何一个候选声源方位,服务器103可以采用相同的方式计算每个智能音频设备在该候选声源方位下的播放参数。

以来自中心位置o右前方δ角度的声源方位为例,服务器103可以根据之前所建立的该长方形区域的三维空间信息以及智能音频设备s1、s2、s3和s4与中心位置o(即听音区)的相对位置信息,计算出角度d1和角度d2以及角度a和b;进而根据矢量求解方法和三角函数,可得智能音频设备s1的响度值和智能音频设备s2的响度值的比值为(spl(s1))/(spl(s2))=(sin(b))/(sin(a))=(sin(d1-δ))/(sin(d1+δ))。以此类推,对于其它候选声源方位,都可以采用这样的方式计算出相应智能音频设备的响度值的比值,进而根据相应智能音频设备的响度值的比值确定相应智能音频设备的初始播放参数。这里的初始播放参数主要是指智能音频设备的整体播放音量。其中,spl的英文全拼是soundpressurelevel,是声压值的意思,是响度值的传统表示方式。spl(s1)表示智能音频设备s1的响度值,同理,spl(s2)表示智能音频设备s2的响度值。

进而,服务器103可以根据多个智能音频设备分别在各候选声源方位下的初始播放参数,建立多个智能音频设备各自对应的声源方位-播放参数映射关系。例如,对每个智能音频设备,服务器103可以将该智能音频设备在各候选声源方位下的播放参数与各候选声源方位进行对应存储,形成该智能音频设备对应的声源方位-播放参数映射关系。

值得说明的是,服务器103可以直接根据矢量求解方法和三角函数,计算出每个智能音频设备在各候选声源方位下的初始播放参数,进而直接基于初始播放参数为每个智能音频设备建立各自对应的声源方位-播放参数映射关系。但是,考虑到室内环境的环境特征具有随机、动态等特点,与理论计算可能会有些偏差。为了进一步提高各智能音频设备对应的声源方位-播放参数映射关系的精准度,如图1d所示,在图1b所示音频播放系统100的基础上增加了录音设备104,该录音设备104设置在听音区102中,负责模拟人耳,主要用于对服务器103直接根据矢量求解方法和三角函数计算出的各智能音频设备在各候选声源方位下的初始播放参数进行测试,以便提高播放参数的精准度,进而提高各智能音频设备对应的声源方位-播放参数映射关系的准确度。

值得说明的是,本申请实施例并不限定录音设备104的设备形态,凡是具有录音功能的设备均适用于本申请实施例。例如,录音设备104可以是额外的智能音频设备,也可以是手机、平板电脑、录音笔、录音机、录像机等等。

可选地,为了便于录音设备104能够准确收集各智能音频设备101发出的声音,录音设备104上可以设置多个麦克(mic),如图1e所示,录音设备104上可以均匀设置6个麦克,6个麦克环绕录音设备104。当然,录音设备104上麦克的数量并不限于6个,也可以是3个、4个、8个等。

在增设录音设备104的基础上,服务器103在根据室内环境的三维空间信息和多个智能音频设备与听音区的相对位置信息,计算出多个智能音频设备分别在各候选声源方位下的初始播放参数之后;可以控制多个智能音频设备按照在各候选声源方位下的初始播放参数输出测试音频信号;以及根据录音设备104上报的与各候选声源方位对应的环绕立体效果声的实际声源方位与相应候选声源方位的差异,对多个智能音频设备在各候选声源方位下的初始播放参数进行修正,进而基于修正后播放参数建立多个智能音频设备各自对应的声源方位-播放参数映射关系。

对录音设备104来说,可以在听音区102内采集由多个智能音频设备101输出的测试音频信号所产生的环绕立体效果声及其实际声源方位,并将与各候选声源方位对应的环绕立体效果声以及环绕立体效果声的实际声源方位上报至服务器103。

值得说明的是,服务器103对各候选声源方位下的各智能音频设备的初始播放参数进行修正的过程相同或类似,下面以其中第一候选声源方位为例进行说明。第一候选声源方位是各候选声源方位中的任一声源方位。

以第一候选声源方位为例,服务器103可以根据矢量求解方法和三角函数,计算出各智能音频设备在第一候选声源方位下的初始播放参数,之后可以控制多个智能音频设备按照在第一候选声源方位下的初始播放参数(主要是指整体播放音量)输出测试音频信号,这里的测试音频信号是指针对第一候选声源方位下的播放参数进行测试时使用的环绕立体声。例如,服务器103可以要求各智能音频设备按照计算出的初始播放参数(主要是指整体播放音量)对外播放20到20khz的声音信号,理论上该20到20khz的声音信号经过混合后应该产生来自第一候选声源方位的声音效果。各智能音频设备输出的声音信号经过混合后会到达听音区102内的录音设备104,对录音设备104会听到来自某个声源方位上的环绕立体效果声。录音设备104将采集到的环绕立体效果声及该环绕立体效果声的实际声源方位上报给服务器103。

服务器103将录音设备104采集到的环绕立体效果声的实际声源方位与第一候选声源方位进行比较;若两者的误差在设定的误差范围之内,认为各智能音频设备的初始播放参数是准确的,可以建立第一候选声源方位与各智能音频设备的初始播放参数的映射关系;若两者的误差不在设定的误差范围内,则认为各智能音频设备的初始播放参数不准确,服务器103对多个智能音频设备的初始播放参数进行修正,并将修正后播放参数重新下发给各智能音频设备,控制各智能音频设备按照修正后播放参数重新输出测试音频信号,直至录音设备104采集到的环绕立体效果声的实际声源方位与第一候选声源方位的误差在设定的误差范围之内时,建立第一候选声源方位与多个智能音频设备的修正后播放参数的映射关系。

可选地,服务器103可以根据录音设备104上报的环绕立体效果声的实际声源方位与第一候选声源方位的误差情况,确定需要修正播放参数的目标智能音频设备以及对播放参数的修正方向,然后按照设定的修正步长,沿着所确定的修正方向对目标智能影响的当前播放参数(当前播放参数可以是初始播放参数,也可以是上一次修正后的播放参数)进行修正。这里的修正方向是指往大了修正,还是往小了修正。

值得说明的是,智能音频设备的播放参数除了包括智能音频设备的整体播放音量之外,还可以进一步包括在某个频段上的音量均衡参数。这里的音量均衡参数主要用于在整体播放音量的基础上,对某个频段上的播放音量进行限制或补偿。例如,对特定高频信号,该音量均衡参数可以是需要降低的音量值,又例如,对于部分低频信号,该音量均衡参数可以是需要增大的音量值。

可选地,对服务器103来说,还可以对录音设备104上报的与各候选声源方位对应的环绕立体效果声进行频率响应分析,得到与各候选声源方位对应的环绕立体效果声的频率响应(fr)曲线,进而结合fr曲线和预期的音效确定出需要均衡处理的频段以及该频段对应的音量均衡参数。同理,在确定需要均衡处理的频段对应的音量均衡参数时,也可以经过多次调整,并重新下发给各智能音频设备进行测试,直至达到预期音效为止,并将此时各智能终端对应的音量均衡参数下发给相应智能终端,供其固化到本地存储器中。

在图1b或图1d所示实施例中,将智能音频设备与超声波、蓝牙等技术相结合,可以很方便得利用智能音频设备实现环绕立体声场的建立,大大降低了室内环境下专业立体声场的建立难度和成本,从而让人工智能和专业立体声可以同时走入千家万户,满足用户对智能化和高音效的双重需求。

基于上述系统实施例,本申请示例性实施例还提供一种适于室内环境的音频播放方法,该方法适用于第一智能音频设备,第一智能音频设备是上述系统实施例中分散部署于室内环境的听音区周围的多个智能音频设备中的任一智能音频设备。如图2a所示,该方法包括以下步骤:

201、第一智能音频设备根据接收到的播放指令,获取需要播放的目标音频信号,该目标音频信号包括多个目标声源方位。

202、第一智能音频设备根据对应的声源方位-播放参数映射关系,确定与各目标声源方位对应的播放参数。

203、第一智能音频设备按照与各目标声源方位对应的播放参数输出目标音频信号中各目标声源方位上的声音信号,以配合其它智能音频设备在听音区产生环绕立体声的音效;其中第一智能音频设备对应的声源方位-播放参数映射关系是根据室内环境的环境特征和第一智能音频设备与听音区的相对位置预先确定的。

在一种应用场景中,第一智能音频设备支持语音交互方式,并且具有上网功能,则可以根据用户发出的语音播放指令,从互联网上获取需要播放的目标音频信号。

进一步可选地,多个智能音频设备具有平等地位,则第一智能音频设备可以自己接收用户发出的语音播放指令,根据接收到的语音播放指令从互联网上获取需要播放的目标音频信号。

进一步可选地,多个智能音频设备被划分为主音箱和从音箱,从音箱与主音箱建立通信连接,例如蓝牙连接、wifi连接或红外连接等,从音箱接受主音箱的控制。基于此,若第一智能音频设备是主音箱,则可以接收用户发出的语音播放指令,一方面根据该语音播放指令从互联网上获取需要播放的目标音频信号,另一方面将该语音播放指令转发给从音箱。若第一智能音频设备是从音箱,则可以接收主音箱转发的语音播放指令,进而根据该语音播放指令从互联网上获取需要播放的目标音频信号。

在另一应用场景中,用户使用其它音视频播放设备播放音视频信号,为了提高音效,可以将音视频播放设备播放的音频信号传输给多个智能音频设备,从而利用多个智能音频设备产生环绕立体声的音效。基于此,第一智能音频设备可以根据音视频播放设备发出的无线播放指令,接收音视频播放设备传输过来的目标音频信号。

进一步可选地,多个智能音频设备具有平等地位,则第一智能音频设备可以与音视频播放设备建立无线连接,这样可以直接接收音视频播放设备发出的无线播放指令,进而根据接收到的无线播放指令接收音视频播放设备传输过来的目标音频信号。

进一步可选地,多个智能音频设备被划分为主音箱和从音箱,从音箱与主音箱建立通信连接,例如蓝牙连接、wifi连接或红外连接等,从音箱接受主音箱的控制。基于此,若第一智能音频设备是主音箱,则可以与音视频播放设备建立无线连接,并基于该无线连接接收音视频播放设备发送的无线播放指令,根据该无线播放指令接收音视频播放设备传输过来的目标音频信号,并将目标音频信号转发给从音箱。若第一智能音频设备是从音箱,则可以接收主音箱转发的目标音频信号。

可选地,第一智能音频设备还可以利用超声波信号探测其与周围环境的距离信息并上报给服务器,以及结合蓝牙信号和音频信号探测其与其它智能音频设备的距离信息并上报给服务器,以供服务器根据这些距离信息确定室内环境的三维空间信息和第一智能音频设备与听音区的相对位置信息。

对服务器来说,可以根据室内环境的三维空间信息和第一智能音频设备与听音区的相对位置信息建立第一智能音频设备对应的声源方位-播放参数映射关系,并下发给第一智能音频设备。第一智能音频设备接收服务器下发的其所对应的声源方位-播放参数映射关系,并保存在本地,以便于在播放目标音频信号中使用。其中,第一智能音频设备对应的声源方位-播放参数映射关系中包含第一智能音频设备在可能出现的各候选声源方位下的播放参数,这样使用时,直接查表即可。

进一步,如图2b所示,本申请示例性实施例提供的另一种适于室内环境的音频播放方法,包括以下步骤:

20a、多个智能音频设备分别利用超声波信号探测其与周围环境的距离信息。

20b、多个智能音频设备分别将探测到其与周围环境的距离信息上报给服务器。

20c、多个智能音频设备结合蓝牙信号和音频信号探测其与其它智能音频设备的距离信息。

20d、多个智能音频设备分别将探测到其与其它智能音频设备的距离信息上报给服务器。

20e、服务器根据多个智能音频设备上报的距离信息,确定多个智能音频设备所在室内环境的三维空间信息和多个智能音频设备与室内环境中听音区的相对位置信息。

20f、服务器根据室内环境的三维空间信息和多个智能音频设备与听音区的相对位置信息建立多个智能音频设备各自对应的声源方位-播放参数映射关系。

20g、服务器将多个智能音频设备各自对应的声源方位-播放参数映射关系分别下发给对应的智能音频设备。

相应地,多个智能音频设备接收服务器下发的各自对应的声源方位-播放参数映射关系,并保存在本地。

20h、多个智能音频设备分别接收用户发出的语音播放指令,根据该语音播放指令获取需要播放的目标音频信号,该目标音频信号包括多个目标声源方位。

20i、多个智能音频设备根据各自对应的声源方位-播放参数映射关系,确定与各目标声源方位对应的播放参数。

20j、多个智能音频设备按照与各目标声源方位对应的播放参数分别输出目标音频信号中各目标声源方位上的声音信号,这样用户会在听音区听到环绕立体声的音效。

在本实施例中,将智能音频设备与超声波、蓝牙等技术相结合,可以很方便得利用智能音频设备实现环绕立体声场的建立,大大降低了室内环境下专业立体声场的建立难度和成本,从而让人工智能和专业立体声可以同时走入千家万户,满足用户对智能化和高音效的双重需求。

需要说明的是,在上述实施例及附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如201、202等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。

图3为本申请示例性实施例提供的一种智能音频设备的结构示意图。如图3所示,该智能音频设备包括:通信组件31、存储器32、处理器33以及音频组件34。智能音频设备可以实现为智能音箱、智能手机等任何可以播放音频信号的设备。

在本实施例中,通信组件31被配置为便于智能音频设备和其他设备(例如其它智能音频设备或服务器)之间有线或无线方式的通信。智能音频设备可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信组件经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件可以支持近场通信(nfc)技术、射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术以及其他技术。如图3所示,通信组件31包括蓝牙模块、红外模块、wifi模块等。

在本实施例中,存储器32可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘,光盘或ssd。

存储器32,用于存储计算机程序,并可被配置为存储其它各种数据以支持在智能音频设备上的操作。这些数据的示例包括用于在智能音频设备上操作的任何应用程序、os或方法的指令,智能音频设备对应的声源方位-播放参数映射关系等。

在本实施例中,通信组件31可接收播放指令。处理器33与存储器32耦合,可执行存储器32中存储的计算机程序,以用于:根据通信组件31接收到的播放指令,获取需要播放的目标音频信号,该目标音频信号包括多个目标声源方位;根据存储器32中存储的声源方位-播放参数映射关系,确定智能音频设备与各目标声源方位对应的播放参数,并输出至音频组件34。

音频组件34,用于按照智能音频设备与各目标声源方位对应的播放参数输出目标音频信号中各目标声源方位上的声音信号,以与所智能音频设备所在室内环境中其它智能音频设备配合在室内环境的听音区内产生环绕立体声的音效。

其中,声源方位-播放参数映射关系是根据室内环境的环境特征和智能音频设备与听音区的相对位置预先确定的。

在一可选实施例中,本实施例的智能音频设备支持语音交互方式,并且具有上网功能。基于此,处理器33具体可根据用户发出的语音播放指令,从互联网上获取需要播放的目标音频信号。

进一步可选地,音频组件34可以接收用户发出的语音播放指令,将语音播放指令传输给处理器33,处理器33根据接收到的语音播放指令通过通信组件31从互联网上获取需要播放的目标音频信号。

进一步可选地,若本实施例的智能音频设备是主音箱,则音频组件34可以接收用户发出的语音播放指令,将语音播放指令传输给处理器33,处理器33一方面根据该语音播放指令通过通信组件31从互联网上获取需要播放的目标音频信号,另一方面通过通信组件31将该语音播放指令转发给从音箱。若本实施例的智能音频设备是从音箱,则音频组件34可以接收主音箱转发的语音播放指令,将语音播放指令传输给处理器33,处理器33根据该语音播放指令通过通信组件31从互联网上获取需要播放的目标音频信号。

在一可选实施例中,处理器33具体可根据音视频播放设备发出的无线播放指令,接收音视频播放设备传输过来的目标音频信号。

进一步可选地,通信组件31可以接收音视频播放设备发出的无线播放指令,将无线播放指令传输给处理器33,处理器33根据无线播放指令通过通信组件31接收音视频播放设备传输过来的目标音频信号。

进一步可选地,若本实施例的智能音频设备是主音箱,则通信组件31可以接收音视频播放设备发出的无线播放指令,将无线播放指令传输给处理器33,处理器33根据该无线播放指令通过通信组件31接收音视频播放设备传输过来的目标音频信号,并通过通信组件31将目标音频信号转发给从音箱。若本实施例的智能音频设备是从音箱,则通信组件31可以接收主音箱转发的目标音频信号。

进一步可选地,如图3所示,本实施例的智能音频设备还包括超声波模块35,超声波模块35可以收发超声波信号。基于此,处理器33还可以利用超声波模块35收发超声波信号,基于超声波信号探测智能音频设备与周围环境的距离信息,并通过通信组件31上报给服务器。

进一步可选地,处理器33还可以利用蓝牙模块和音频组件同时向其它智能音频设备发出蓝牙信号和音频信号,以便于其它智能音频设备根据蓝牙信号和音频信号的接收时间的差值,确定与本实施例智能音频设备的距离信息并上报给服务器。相应地,处理器33还可以接收其它智能音频设备同时发送的蓝牙信号和音频信号,并根据蓝牙信号和音频信号的接收时间的差值,确定本实施例智能音频设备与其它智能音频设备的距离信息并上报给服务器。

进一步,如图3所示,该智能音频设备还包括:显示器36、电源组件37等其它组件。图3中仅示意性给出部分组件,并不意味着智能音频设备只包括图3所示组件。另外,图3中虚线框所示组件为可选组件,而非必选组件。

采用本实施例提供的智能音频设备可以构建出环绕立体声场,不仅可以发挥智能音频设备的智能化优势,基于该环绕立体声场播放音频信号还有利于提高智能音频设备的播放效果。

相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被执行时能够实现上述方法实施例中可由智能音频设备执行的各步骤。

相应地,本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被执行时能够实现上述方法实施例中可由服务器执行的各步骤。

上述实施例中显示器包括屏幕,其屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。

上述实施例中的电源组件,为电源组件所在设备的各种组件提供电力。电源组件可以包括电源管理系统,一个或多个电源,及其他与为电源组件所在设备生成、管理和分配电力相关联的组件。

上述实施例的音频组件,可被配置为输出和/或输入音频信号。例如,音频组件包括一个麦克风(mic),当音频组件所在设备处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器或经由通信组件发送。在一些实施例中,音频组件还包括一个扬声器,用于输出音频信号。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1