基于多扬声器的播放方法和系统与流程

文档序号:11845421阅读:403来源:国知局
基于多扬声器的播放方法和系统与流程

本发明涉及智能控制技术领域,特别涉及一种基于多扬声器的播放方法和系统。



背景技术:

在智能家居中,扬声器必不可少。

但是,在控制扬声器进行播放时,听觉质量很容易被忽略,或者在控制扬声器进行播放时,直接控制整个空间内的全部扬声器或某几个扬声器工作,虽然在一定程度上可以提高听觉质量,但却增加了能耗,而且整个空间内不同区域的用户会受到干扰。



技术实现要素:

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此,本发明的一个目的在于提出一种基于多扬声器的播放方法,该方法根据用户的当前位置信息确定用户所在区域需要工作的扬声器,不仅保证了听觉质量,而且并非整个空间的所有扬声器或某几个扬声器工作,达到了节能环保的目的,而且保证了整个空间内其他区域的用户不受干扰,提高了用户体验。

本发明的另一个目的在于提出一种基于多扬声器的播放系统。

为实现上述目的,本发明一方面实施例提出了一种基于多扬声器的播放方法,包括以下步骤:获取用户的指令信息,并根据所述指令信息获取播放内容;获取所述用户当前的位置信息,并根据所述用户的当前位置信息确定所述用户所在区域,以及控制所述用户所在区域的至少一个扬声器进行播放。

根据本发明实施例的基于多扬声器的播放方法,首先获取用户的指令信息,并根据指令信息获取播放内容,然后获取用户当前的位置信息,并根据用户的当前位置信息确定用户所在区域,以及控制用户所在区域的至少一个扬声器进行播放。该方法根据用户的当前位置信息确定用户所在区域需要工作的扬声器,不仅保证了听觉质量,而且并非整个空间的所有扬声器或某几个扬声器工作,达到了节能环保的目的,而且保证了整个空间内其他区域的用户不受干扰,提高了用户体验。

根据本发明的一个实施例,所述指令信息包括:语音指令信息和姿势指令信息。

根据本发明的一个实施例,获取所述用户的语音指令信息,包括:通过设置在同一区域不同位置处的多个麦克风收集所述区域内的声音信息;对所述多个麦克风的声音信息进行解析以提取所述用户的语音指令信息。

根据本发明的一个实施例,获取所述用户的姿势指令信息,包括:采集所述用户的图像信息和红外信息;对所述图像信息和所述红外信息进行分析处理以提取所述用户的姿势信息,并根据所述姿势信息确定所述用户的姿势指令信息。

根据本发明的一个实施例,上述的基于多扬声器的播放方法,还包括:当所述用户从第一区域移动至第二区域时,控制所述第二区域的扬声器开始工作,并判断持续预设时间内是否有人进入所述第一区域;如果持续预设时间内没有人进入所述第一区域,则控制所述第一区域的扬声器关闭。

为实现上述目的,本发明另一方面实施例提出了一种基于多扬声器的播放系统,包括:第一获取模块,用于获取用户的指令信息;第二获取模块,用于获取所述用户当前的位置信息;控制模块,所述控制模块分别与所述第一获取模块和所述第二获取模块相连,所述控制模块用于根据所述指令信息获取播放内容,并根据所述用户的当前位置信息确定所述用户所在区域,以及控制所述用户所在区域的至少一个扬声器进行播放。

根据本发明实施例的基于多扬声器的播放系统,通过第一获取模块获取用户的指令信息,通过第二获取模块获取用户当前的位置信息,控制模块根据指令信息获取播放内容,并根据用户的当前位置信息确定用户所在区域,以及控制用户所在区域的至少一个扬声器进行播放。该系统根据用户的当前位置信息确定用户所在区域需要工作的扬声器,不仅保证了听觉质量,而且并非整个空间的所有扬声器或某几个扬声器工作,达到了节能环保的目的,而且保证了整个空间内其他区域的用户不受干扰,提高了用户体验。

根据本发明的一个实施例,所述指令信息包括:语音指令信息和姿势指令信息。

根据本发明的一个实施例,所述第一获取模块包括:多个声音收集模块,所述多个声音收集模块设置在同一区域不同位置处,用于收集所述区域内的声音信息;第一提取模块,所述第一提取模块分别与所述多个声音收集模块中的每个声音收集模块相连,用于对所述多个声音收集模块的声音信息进行解析以提取所述用户的语音指令信息。

根据本发明的一个实施例,所述第一获取模块包括:图像采集模块,用于采集所述用户的图像信息;红外信息采集模块,用于采集所述用户的红外信息;第二提取模块,所述第二提取模块分别与所述图像采集模块和所述红外信息采集模块相连,用于对所述图像信息和所述红外信息进行分析处理以提取所述用户的姿势信息,并根据所述姿势信息确定所述用户的姿势指令信息。

根据本发明的一个实施例,所述控制模块,还用于:当所述用户从第一区域移动至第二区域时,控制所述第二区域的扬声器开始工作,并判断持续预设时间内是否有人进入所述第一区域;如果持续预设时间内没有人进入所述第一区域,则控制所述第一区域的扬声器关闭。

附图说明

图1是根据本发明一个实施例的基于多扬声器的播放方法的流程图;

图2是根据本发明一个具体示例的多麦克风、多扬声器的设置示意图;

图3是根据本发明一个实施例的语音指令信息的获取流程图;

图4是根据本发明一个实施例的姿势指令信息的获取流程图;

图5是根据本发明另一个实施例的基于多扬声器的播放方法的流程图;

图6是根据本发明一个实施例的基于多扬声器的播放系统的结构示意图;

图7是根据本发明一个实施例的第一获取模块的框图;以及

图8是根据本发明另一个实施例的第一获取模块的框图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。

下面参照附图来描述根据本发明实施例提出的基于多扬声器的播放方法和系统。

图1是根据本发明一个实施例的基于多扬声器的播放方法的流程图。如图1所示,基于多扬声器的播放方法包括以下步骤:

S110,获取用户的指令信息,并根据指令信息获取播放内容。

在本发明的实施例中,指令信息可包括:语音指令信息和姿势指令信息。

根据本发明的一个实施例,如图3所示,获取用户的语音指令信息,包括:

S111,通过设置在同一区域不同位置处的多个麦克风收集区域内的声音信息。

由于语音识别对环境的要求较高,环境噪声和区域内的回声(墙壁回弹噪声)等会影响语音识别的质量,因此,可以在同一区域内,根据现场情况设置两个以上的麦克风,以抑制干扰噪声。

作为一个具体示例,如图2所示,可以将餐厅和客厅作为同一区域A,根据餐厅和客厅的面积和结构可以设置六个麦克风;将图中右上角的侧卧室作为同一区域B,根据侧卧室的面积可以设置两个麦克风;将图中右下角的主卧室作为同一区域C,根据主卧室的面积可以设置三个麦克风。然后,通过设置在区域内的多个麦克风获取所在区域内的声音信息,其中,声音信息可包括:区域内的环境噪声和回声。

例如,可通过区域A中的六个麦克风收集区域A中的所有声音信息,并将收集到的声音信息传输至服务器,其中,多个麦克风中每个麦克风可具有有线功能和无线功能,每个麦克风可通过有线以太网接入局域网中的服务器,也可以通过WIFI、蓝牙、Zigbee等无线方式传输至服务器,具体这里不做限定。

S112,对多个麦克风的声音信息进行解析以提取用户的语音指令信息。

具体地,服务器在接收到多个麦克风的声音信息后,通过一系列的算法进行噪声的分离和消除,得到有效的语音指令信息。其中,可以采用现有技术中的算法实现噪声的分离和消除,具体这里不再详述。

在该实施例中,由于通过设置在同一区域的多个麦克风来抑制干扰噪声,即通过设置在同一区域内的多个麦克风收集该区域内的所有声音信息,包括环境噪声和墙壁回弹噪声等,然后通过一系列算法进行噪声分离和消除,从而提取出有效的语音指令信息,因此,不仅可以有效提高语音识别率,而且服务器无需根据特定环境设置特定参数,大大降低了后期维护成本。

进一步地,考虑到实际应用中,当多个麦克风同时上传数据到服务器,可能出现带宽拥堵现象,为此,可以先对每个麦克风收集到的声音信息进行判断,如果声音信息满足一定要求,则再将该声音信息上传至服务器,以减少因同时上传较多数据导致带宽拥堵现象发生。

具体地,如图2所示,当区域A有声音时,区域A中的六个麦克风会自动检测声音的大小(分贝),并判断该声音是否在人的声音的频率范围内。如果声音比较大,如:声音信息的分贝大于预设分贝,并且该声音在人的声音的频率范围内,如:声音信息的频率在预设范围内,则麦克风自动将声音信息上传至服务器,从而使得多个麦克风只传送更有效的部分,减少了对传输带宽的要求,减少了服务器的解析处理时间,提高了响应速度。

根据本发明的另一个实施例,如图4所示,获取用户的姿势指令信息,包括:

S111’,采集用户的图像信息和红外信息。

S112’,对图像信息和红外信息进行分析处理以提取用户的姿势信息,并根据姿势信息确定用户的姿势指令信息。

作为一个具体示例,如图2所示,可以在区域A中设置一个摄像机和一个人体红外检测传感器。其中,通过摄像机采集用户的图像信息,并将该图像信息发送至服务器,并通过人体红外检测传感器采集用户的红外信息。然后,服务器对图像信息和红外信息进行分析处理,以提取用户的姿势,可以包括手势和身体其他部位的动作等。服务器在根据图像信息和红外信息提取到用户的姿势信息后,从数据库中获取与该姿势信息相对应的姿势指令信息。

具体地,用户可以预先针对需要发出的指令信息设定相应的动作,通过摄像机拍摄并传输至服务器,然后服务器对其进行解析,并与相应的指令信息对应存储在服务器中,即每个指令信息对应一个特定动作。

例如,可以用表示数字1的手势来代表听音乐,用表示数字2的手势来代表听广播,用表示数字3的手势来代表听新闻等;也可以用双手放在耳朵上且身体左倾或右倾一定角度的姿势来代表听音乐,用双手做出喇叭状放在嘴边且身体前倾一定角度的姿势来代表听广播,用翻阅报纸的姿势来代表听新闻等,具体可由用户根据自身喜好来设定,具体这里不做限定。

在该实施例中,由于通过视觉来获取用户的指令信息,可以进一步提高人性化体验。

S120,获取用户当前的位置信息,并根据用户的当前位置信息确定用户所在区域,以及控制用户所在区域的至少一个扬声器进行播放。

具体地,如图2所示,可以在区域A中设置五个扬声器;在区域B中设置两个扬声器;在区域C中设置两个扬声器。在获取到用户当前的位置信息后,根据用户的当前位置信息确认用户所在的区域,然后控制用户所在区域内的一个或多个扬声器进行播放。

以用户处于区域A为例,当用户发出声音时,区域A中的六个麦克风将收集区域A中的所有声音信息,并将收集到的声音信息传输至服务器,服务器对多个麦克风的声音信息进行回声消除和降噪处理,以提取出用户的语音指令信息,然后根据语音指令信息获取需要播放的内容。同时,服务器还通过区域A中的摄像机或者人体红外检测传感器获取用户当前的位置信息,然后根据用户的当前位置信息确定用户所在区域,并确定用户所在区域对应的扬声器。

如图2所示,当服务器提取到的语音指令信息为“听音乐”时,服务器可以控制环绕用户周围的三个扬声器同时工作以播放音乐,也可以控制区域A中的五个扬声器同时工作,从而不仅可以保证声音质量得到多声道的还原,而且整个空间的其他区域,如区域B和区域C中扬声器均不工作,在一定程度上达到了节能环保的目的,而且区域B和区域C中的用户不会受到干扰,提高了用户体验。

进一步地,当区域A中用户发出“听音乐”的指令信息时,服务器仅控制区域A中的至少一个扬声器工作,当区域B中的用户发出“听广播”的指令信息时,服务器仅控制区域B中的至少一个扬声器工作,当区域C中的用户发出“听新闻”指令信息时,服务器仅控制区域C中的至少一个扬声器工作,从而保证不同区域内的用户之间不会受到干扰,进一步提高了用户体验。

根据本发明实施例的基于多扬声器的播放方法,可以从听觉或者视觉上获取用户的指令信息,然后根据用户的指令信息获取相应的播放内容,同时获取用户当前的位置信息,并根据用户的当前位置信息确定用户所在区域,以及控制用户所在区域的至少一个扬声器进行播放,不仅保证了听觉质量,而且并非整个空间的所有扬声器或某几个扬声器工作,达到了节能环保的目的,而且保证了整个空间内其他区域的用户不受干扰,提高了用户体验。

另外,考虑到实际生活中,用户会经常从一个区域移动至另一个区域,因此,在本发明的实施例中,可以对扬声器进行动态调整。

如图5所示,基于多扬声器的播放方法还包括:

S130,当用户从第一区域移动至第二区域时,控制第二区域的扬声器开始工作,并判断持续预设时间内是否有人进入第一区域。其中,预设时间可以根据实际情况进行设定。

S140,如果持续预设时间内没有人进入第一区域,则控制第一区域的扬声器关闭。

具体地,如图2所示,当用户从区域A移动至区域B时,区域B中的多个扬声器开始工作,此时区域A中发声的扬声器并未停止工作,而是连续监测n分钟内是否有人进入,此时有可能是用户返回至区域A,如果连续n分钟内无人进入区域A,则控制区域A发声的扬声器停止工作。

根据本发明实施例的基于多扬声器的播放方法,当用户从第一区域移动至第二区域时,控制第二区域的扬声器开始工作,并判断持续预设时间内是否有人进入第一区域,如果持续预设时间内没有人进入第一区域,则控制第一区域的扬声器关闭,从而实现扬声器的动态调整,无需用户再次发出控制指令,大大提高了用户体验,而且在切换过程中,采用延时控制,从而可以有效防止用户在两个区域间来回走动,导致切换过于频繁,影响用户体验。

图6是根据本发明一个实施例的基于多扬声器的播放系统的结构示意图。如图6所示,基于多扬声器的播放系统包括:第一获取模块10、第二获取模块20和控制模块30。

具体地,第一获取模块10用于获取用户的指令信息。

在本发明的实施例中,指令信息可包括:语音指令信息和姿势指令信息。

根据本发明的一个实施例,如图7所示,第一获取模块10包括:多个声音收集模块11和第一提取模块12,其中,多个声音收集模块11设置在同一区域不同位置处,用于收集区域内的声音信息,第一提取模块12分别与多个声音收集模块11中的每个声音收集模块11相连,用于对多个声音收集模块11的声音信息进行解析以提取用户的语音指令信息。

具体而言,由于语音识别对环境的要求较高,环境噪声和区域内的回声等会影响语音识别的质量,因此,可以在同一区域内,根据现场情况设置两个以上的声音收集模块11,以抑制干扰噪声,其中,声音收集模块11可以为麦克风。

作为一个具体示例,如图2所示,可以将餐厅和客厅作为同一区域A,根据餐厅和客厅的面积和结构可以设置六个麦克风;将图中右上角的侧卧室作为同一区域B,根据侧卧室的面积可以设置两个麦克风;将图中右下角的主卧室作为同一区域C,根据主卧室的面积可以设置三个麦克风。然后,通过设置在区域内的多个麦克风获取所在区域内的声音信息,其中,声音信息可包括:区域内的环境噪声和回声。

例如,可通过区域A中的六个麦克风收集区域A中的所有声音信息,并将收集到的声音信息以有线方式或无线方式传输至第一提取模块12。第一提取模块12在接收到多个麦克风的声音信息后,通过一系列的算法进行噪声的分离和消除,得到有效的语音指令信息。其中,可以采用现有技术中的算法实现噪声的分离和消除,具体这里不再详述。

在该实施例中,由于通过设置在同一区域的多个声音收集模块(如麦克风)来抑制干扰噪声,即通过设置在同一区域内的多个声音收集模块收集该区域内的所有声音信息,包括环境噪声和墙壁回弹噪声等,然后通过一系列算法进行噪声分离和消除,从而提取出有效的语音指令信息,因此,不仅可以有效提高语音识别率,而且第一提取模块无需根据特定环境设置特定参数,大大降低了后期维护成本。

进一步地,考虑到实际应用中,当多个声音收集模块11同时上传数据到第一提取模块12,可能出现拥堵现象,为此,可以先对每个声音收集模块11收集到的声音信息进行判断,如果声音信息满足一定要求,则再将该声音信息上传至第一提取模块12,以减少因同时上传较多数据导致拥堵现象发生。

具体地,如图2所示,当区域A有声音时,区域A中的六个麦克风会自动检测声音的大小(分贝),并判断该声音是否在人的声音的频率范围内。如果声音比较大,如:声音信息的分贝大于预设分贝,并且该声音在人的声音的频率范围内,如:声音信息的频率在预设范围内,则麦克风自动将声音信息上传至第一提取模块12,从而使得多个麦克风只传送更有效的部分,减少了对传输带宽的要求,减少了第一提取模块的解析处理时间,提高了响应速度。

根据本发明的另一个实施例,如图8所示,第一获取模块10包括:图像采集模块13、红外信息采集模块14和第二提取模块15,其中,图像采集模块13用于采集用户的图像信息,红外信息采集模块14用于采集用户的红外信息,第二提取模块15分别与图像采集模块13和红外信息采集模块14相连,用于对图像信息和红外信息进行分析处理以提取用户的姿势信息,并根据姿势信息确定用户的姿势指令信息。

其中,图像采集模块13可以为摄像机,红外信息采集模块14可以为人体红外检测传感器。

作为一个具体示例,如图2所示,可以在区域A中设置一个摄像机和一个人体红外检测传感器。其中,通过摄像机采集用户的图像信息,并将该图像信息发送至第二提取模块15,并通过人体红外检测传感器采集用户的红外信息。然后,第二提取模块15对图像信息和红外信息进行分析处理,以提取用户的姿势,可以包括手势和身体其他部位的动作等。第二提取模块15在根据图像信息和红外信息提取到用户的姿势信息后,从数据库中获取与该姿势信息相对应的姿势指令信息。

具体地,用户可以预先针对需要发出的指令信息设定相应的动作,通过摄像机拍摄并传输至第二提取模块15,然后第二提取模块15对其进行解析,并与相应的指令信息对应存储在第二提取模块15中,即每个指令信息对应一个特定动作。

例如,可以用表示数字1的手势来代表听音乐,用表示数字2的手势来代表听广播,用表示数字3的手势来代表听新闻等;也可以用双手放在耳朵上且身体左倾或右倾一定角度的姿势来代表听音乐,用双手做出喇叭状放在嘴边且身体前倾一定角度的姿势来代表听广播,用翻阅报纸的姿势来代表听新闻等,具体可由用户根据自身喜好来设定,具体这里不做限定。

在该实施例中,由于通过视觉来获取用户的指令信息,可以进一步提高人性化体验。

第二获取模块20用于获取用户当前的位置信息。第二获取模块20可以为摄像机或者人体红外检测传感器。

控制模块30分别与第一获取模块10和第二获取模块20相连,控制模块30用于根据指令信息获取播放内容,并根据用户的当前位置信息确定用户所在区域,以及控制用户所在区域的至少一个扬声器进行播放。

具体地,如图2所示,可以在区域A中设置五个扬声器;在区域B中设置两个扬声器;在区域C中设置两个扬声器。在第二获取模块20获取到用户当前的位置信息后,控制模块30根据用户的当前位置信息确认用户所在的区域,然后控制用户所在区域内的一个或多个扬声器进行播放。

以用户处于区域A为例,当用户发出声音时,区域A中的六个麦克风将收集区域A中的所有声音信息,并将收集到的声音信息传输至第一提取模块12,第一提取模块12对多个麦克风的声音信息进行回声消除和降噪处理,以提取出用户的语音指令信息,然后控制模块30根据语音指令信息获取需要播放的内容。同时,第二提取模块15还通过区域A中的摄像机或者人体红外检测传感器获取用户当前的位置信息,然后控制模块30根据用户的当前位置信息确定用户所在区域,并确定用户所在区域对应的扬声器。

如图2所示,当第一提取模块12提取到的语音指令信息为“听音乐”时,控制模块30可以控制环绕用户周围的三个扬声器同时工作以播放音乐,也可以控制区域A中的五个扬声器同时工作,从而不仅可以保证声音质量得到多声道的还原,而且整个空间的其他区域,如区域B和区域C中扬声器均不工作,在一定程度上达到了节能环保的目的,而且区域B和区域C中的用户不会受到干扰,提高了用户体验。

进一步地,当区域A中用户发出“听音乐”的指令信息时,控制模块30仅控制区域A中的至少一个扬声器工作,当区域B中的用户发出“听广播”的指令信息时,控制模块30仅控制区域B中的至少一个扬声器工作,当区域C中的用户发出“听新闻”指令信息时,控制模块30仅控制区域C中的至少一个扬声器工作,从而保证不同区域内的用户之间不会受到干扰,进一步提高了用户体验。

根据本发明实施例的基于多扬声器的播放系统,可以从听觉或者视觉上获取用户的指令信息,然后根据用户的指令信息获取相应的播放内容,同时获取用户当前的位置信息,并根据用户的当前位置信息确定用户所在区域,以及控制用户所在区域的至少一个扬声器进行播放,不仅保证了听觉质量,而且并非整个空间的所有扬声器或某几个扬声器工作,达到了节能环保的目的,而且保证了整个空间内其他区域的用户不受干扰,提高了用户体验。

另外,考虑到实际生活中,用户会经常从一个区域移动至另一个区域,因此,在本发明的实施例中,可以对扬声器进行动态调整。

根据本发明的一个实施例,控制模块30还用于:当用户从第一区域移动至第二区域时,控制第二区域的扬声器开始工作,并判断持续预设时间内是否有人进入第一区域;如果持续预设时间内没有人进入第一区域,则控制第一区域的扬声器关闭。

具体地,如图2所示,当用户从区域A移动至区域B时,控制模块30控制区域B中的多个扬声器开始工作,此时区域A中发声的扬声器并未停止工作,而是控制模块30连续监测n分钟内是否有人进入,此时有可能是用户返回至区域A,如果连续n分钟内无人进入区域A,控制模块30则控制区域A发声的扬声器停止工作。

根据本发明实施例的基于多扬声器的播放系统,当用户从第一区域移动至第二区域时,控制第二区域的扬声器开始工作,并判断持续预设时间内是否有人进入第一区域,如果持续预设时间内没有人进入第一区域,则控制第一区域的扬声器关闭,从而实现扬声器的动态调整,无需用户再次发出控制指令,大大提高了用户体验,而且在切换过程中,采用延时控制,从而可以有效防止用户在两个区域间来回走动,导致切换过于频繁,影响用户体验。

在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1