语音识别系统、方法和装置与流程

文档序号:14446173阅读:392来源:国知局
语音识别系统、方法和装置与流程

本发明涉及空调语音控制领域,具体而言,涉及一种语音识别系统、方法和装置。



背景技术:

在相关技术中,对空调进行控制时,控制的方式多种多样,例如,可以直接采用空调控制器进行控制,也可以依据手势进行控制,还可以依据语音进行控制。在空调语音控制中,语音识别系统主要由麦克风阵列、语音模块、扬声器组成,相关技术中在产品上设计时,常把麦克风阵列设计在产品结构中,同时扬声器也内置在产品结构中,受两者安装位置的限制,麦克风阵列和扬声器距离比较近,容易造成语音识别系统中的声学回音消除aec(acousticechochancellor)调试比较困难,同时结构设计与外观设计需求也比较难结合。

针对上述的问题,目前尚未提出有效的解决方案。



技术实现要素:

本发明实施例提供了一种语音识别系统、方法和装置,以至少解决由于麦克风阵列和扬声器安装位置限制造成的声学回音消除aec调试及所在电器结构设计困难的技术问题。

根据本发明实施例的一个方面,提供了一种语音识别系统,包括:麦克风阵列和语音识别设备,其中,麦克风阵列,用于采集语音;所述语音识别设备包括:语音板和扬声器,其中,所述语音板,与所述麦克风阵列通信,用于接收所述麦克风阵列采集的语音,并对接收到的所述语音进行识别,得到识别结果;所述扬声器,与所述语音板通信,用于对所述语音板识别出的识别结果进行播报;其中,所述麦克风阵列外置于所述语音识别设备。

可选的,所述语音板为多个,所述多个语音板分别位于不同的地理位置。

根据本发明实施例的另一方面,还提供了一种语音识别方法,包括:接收麦克风阵列采集的语音;通过语音识别设备中的语音板识别所述麦克风阵列采集的语音,得到识别结果;通过所述语音识别设备中的扬声器播报所述语音板识别出的识别结果进行播报,其中,所述麦克风阵列外置于所述语音识别设备。

可选的,通过语音识别设备中的语音板识别所述麦克风阵列采集的语音,得到所述识别结果包括:确定用于语音识别的语音识别模型,其中,所述语音识别模型为使用多组数据通过机器学习训练得出的,所述多组数据中的每组数据均包括:语音和与该语音对应的识别结果;通过语音识别设备中的语音板采用确定的所述语音识别模型,识别出所述麦克风阵列采集的语音对应的识别结果。

可选的,确定用于语音识别的所述语音识别模型包括:采样不同年龄段,不同音色的用户的语音,以及与采样的语音对应的识别结果;对采样的语音以及与采样的语音对应的识别结果进行训练,得到所述语音识别模型。

可选的,在通过所述语音识别设备中的所述语音板识别所述麦克风阵列采集的语音,得到所述识别结果之前,还包括:在所述语音识别设备中的所述语音板为多个的情况下,接收到唤醒词;根据所述唤醒词唤醒将要进行语音识别的语音板。

可选的,在通过所述语音识别设备中的所述语音板识别所述麦克风阵列采集的语音,得到所述识别结果之后,还包括:从所述识别结果中解析出用于控制预定电器的控制指令;将所述控制指令发送给控制所述预定电器的电器主控。

根据本发明实施例的另一方面,还提供了一种语音识别装置,包括:第一接收模块,用于接收麦克风阵列采集的语音;得到模块,用于通过语音识别设备中的语音板识别所述麦克风阵列采集的语音,得到识别结果;播报模块,用于通过所述语音识别设备中的扬声器播报所述语音板识别出的识别结果进行播报,其中,所述麦克风阵列外置于所述语音识别设备。

可选的,所述得到模块包括:确定单元,用于确定用于语音识别的语音识别模型,其中,所述语音识别模型为使用多组数据通过机器学习训练得出的,所述多组数据中的每组数据均包括:语音和与该语音对应的识别结果;识别单元,用于通过语音识别设备中的语音板采用确定的所述语音识别模型,识别出所述麦克风阵列采集的语音对应的识别结果。

可选的,所述语音识别装置还包括:第二接收模块,用于在通过所述语音识别设备中的所述语音板识别所述麦克风阵列采集的语音,得到所述识别结果之前,在所述语音识别设备中的所述语音板为多个的情况下,接收到唤醒词;唤醒模块,用于根据所述唤醒词唤醒将要进行语音识别的语音板。

可选的,所述语音识别装置还包括:解析模块,用于在通过所述语音识别设备中的所述语音板识别所述麦克风阵列采集的语音,得到所述识别结果之后,从所述识别结果中解析出用于控制预定电器的控制指令;发送模块,用于将所述控制指令发送给控制所述预定电器的电器主控。

在本发明实施例中,采用外置麦克风阵列的方式,提供了一种包括麦克风阵列和语音识别设备的语音识别系统,其中,麦克风阵列,用于采集语音;语音识别设备包括:语音板和扬声器,其中,语音板,与麦克风阵列通信,用于接收麦克风阵列采集的语音,并对接收到的语音进行识别,得到识别结果;扬声器,与麦克风阵列通信,用于对语音板识别出的识别结果进行播报。通过本发明实施例的语音识别系统,达到了实现麦克风阵列与扬声器自由组合的目的,从而实现了提高语音识别降噪性能及满足外观一致性要求的技术效果,进而解决了由于麦克风阵列和扬声器安装位置限制造成的声学回音消除aec调试及所在电器结构设计困难的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是根据本发明实施例的一种语音识别系统10的结构框图;

图2是根据本发明实施例的语音识别方法的流程图;

图3是根据本发明优选实施方案的另一种语音识别系统30的结构示意图;

图4是根据本发明优选实施方案的空调的单链路语音控制示意图;

图5是根据本发明优选实施方案的空调的多链路语音控制示意图;

图6是根据本发明实施例的语音识别装置的结构框图;

图7是根据本发明实施例的语音识别装置的得到模块64的结构框图;

图8是根据本发明实施例的语音识别装置的优选结构框图一;

图9是根据本发明实施例的语音识别装置的优选结构框图二。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本发明实施例中,提供了一种语音识别系统,图1是根据本发明实施例的一种语音识别系统10的结构框图,如图1所示,该系统包括:麦克风阵列12和语音识别设备14,下面对该语音识别系统10进行说明。

麦克风阵列12,用于采集语音;

语音识别设备14,包括:语音板142和扬声器144,其中,语音板142,与麦克风阵列12通信,用于接收麦克风阵列12采集的语音,并对接收到的语音进行识别,得到识别结果;扬声器144,与语音板142通信,用于对语音板142识别出的识别结果进行播报;

其中,麦克风阵列12外置于语音识别设备14。

同时,为了提高多空间中的语音控制便捷性,优选的,语音板142可以为多个,其中,多个语音板可以分别位于不同的地理位置,以使麦克风阵列12接收到的语音可以同时由多个位置的语音板处理识别,进而对各个语音板所处的电器进行语音控制。

在本发明实施例中,采用外置麦克风阵列12的方式,提供了一种包括麦克风阵列12和语音识别设备14的语音识别系统10。通过本发明实施例的语音识别系统,达到了实现麦克风阵列与语音识别设备自由组合的目的,从而实现了提高语音识别降噪性能及满足所在电器外观设计一致性要求的技术效果。

根据本发明实施例,还提供了一种语音识别的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

图2是根据本发明实施例的语音识别方法的流程图,如图2所示,该方法包括如下步骤:

步骤s202,接收麦克风阵列采集的语音;

步骤s204,通过语音识别设备中的语音板识别麦克风阵列采集的语音,得到识别结果;

步骤s206,通过语音识别设备中的扬声器播报语音板识别出的识别结果进行播报,其中,麦克风阵列外置于语音识别设备。

通过上述步骤,可以实现在本发明实施例中,通过麦克风阵列外置于语音识别设备的方式,达到将麦克风阵列与扬声器自由组合的目的,从而实现了提高语音识别降噪性能及满足所在电器外观一致性要求的技术效果,进而解决了由于麦克风阵列和扬声器安装位置限制造成的声学回音消除aec调试及所在电器结构设计困难的技术问题。

优选的,通过语音识别设备中的语音板识别麦克风阵列采集的语音,得到识别结果可以包括:确定用于语音识别的语音识别模型,其中,语音识别模型为使用多组数据通过机器学习训练得出的,多组数据中的每组数据均包括:语音和与该语音对应的识别结果;通过语音识别设备中的语音板采用确定的语音识别模型,识别出麦克风阵列采集的语音对应的识别结果。通过上述语音识别模型的方式对采集的语音进行识别,即采用人工智能的方式对采集的语音进行识别,不仅智能快速而且准确,可以在一定程度上有效地提高用户体验。

需要说明的是,上述每组训练数据可以是通过实验得到的,也可以是大量应用该语音识别设备的电器在使用过程中不断采集积累上报的,通过对已经销售出去的电器进行追踪,从而得到大量的数据均可以用于训练。可选的,在应用该语音识别设备的电器中也可以预先设置通讯模块,多个电器可以将实时采集到的数据上传到服务器中,以供机器训练使用。其中,通讯模块可以包括但不限于:无线网卡、蓝牙等。

针对语音控制中存在的用户类型范围广,由于口音、年龄易发生误操作的问题,确定用于语音识别的语音识别模型可以包括:采样不同年龄段,不同音色的用户的语音,以及与采样的语音对应的识别结果;对采样的语音以及与采样的语音对应的识别结果进行训练,得到语音识别模型。通过上述方法,可以对不同年龄段,不同音色的语音均进行采样训练,使得训练出的语音识别模型更为全面,从而有效提高采用该语音识别模型识别出的识别结果,使其更为准确。

可选地,为对不同的人群实现不同的控制,或者实现对一些不能允许执行控制的人员限制控制电器,可以在通过语音识别设备中的语音板识别麦克风阵列采集的语音,得到识别结果之前,确定采集的语音对应的用户的用户身份;在用户的用户身份为监护人的情况下,通过语音识别设备中的语音板识别麦克风阵列采集的语音。通过对采集的语音的用户的身份,确定该用户是否具备通过语音控制电器的权限。例如,如果采集的语音对应于儿童的情况下,设置不执行采集儿童的语音的控制指令,一方面可以有效避免操作的不安全性,而且在一定程度上有效避免儿童有意或无意的误操作。

需要说明的是,此处确定采集的语音对应的用户的用户身份可以采用多种方式,例如,可以根据采集的述语音的音色,确定采集的语音对应的用户的用户身份;也可以根据采集的述语音的音量,确定采集的语音对应的用户的用户身份;还可以根据采集的述语音的音调,确定采集的语音对应的用户的用户身份。

另外,为了提高多空间中的语音控制便捷性,语音识别设备中的语音板可以为多个,其中,多个语音板可以分别位于不同的地理位置,以使麦克风阵列接收到的语音可以同时由多个位置的语音板处理识别,进而对各个语音板所处的电器进行语音控制。为实现对多个语音板识别语音进行灵活准确控制,优选的,在通过语音识别设备中的语音板识别麦克风阵列采集的语音,得到识别结果之前,还可以包括:在语音识别设备中的语音板为多个的情况下,接收到唤醒词;根据唤醒词唤醒将要进行语音识别的语音板。其中,唤醒词可以为该语音识别设备生产制造时固定设置的,也可以为用户使用时自行设置的。通过对不同的语音板识别语音设置不同的唤醒词,一方面不仅可以有效实现对多个不同位置的语音板的控制,而且可以有效提高控制的准确性,有效地提高用户智能化的体验。

优选的,在通过语音识别设备中的语音板识别麦克风阵列采集的语音,得到识别结果之后,还可以包括:从识别结果中解析出用于控制预定电器的控制指令;将控制指令发送给控制预定电器的电器主控。通过从识别结果中解析出控制指令,以及发送给预定电器的电器主控,实现对电器的完整控制。需要说明的是,此处的电器的种类可以为多种,例如,可以为空调,可以为冰箱,可以为加湿器等。

上述对不同的语音板设置不同的唤醒词,以实现同一麦克风阵列接收到的语音对可以同时识别语音的多个语音板实现精准对接,进而避免发生对语音板所在电器的语音控制错误。

另外,在通过上述人工智能的方式识别出的控制指令对电器进行控制时,也可以兼容通过电器控制器对电器进行控制,例如,当通过人工智能的方式识别出对电器进行控制的控制指令的同时,也接收到电器控制器对电器的控制器指令,通过设置控制指令与控制器指令的优先级的方式来执行不同的控制。例如,当设置人工智能识别出的控制指令的优先级高于控制器指令的优先级的情况下,依据人工智能识别出的控制指令执行对电器的控制;当设置控制器指令的优先级高于人工智能识别出的控制指令的情况下,依据控制器指令执行对电器的控制。

在本发明实施例中,还提供了另一种语音识别系统,图3是根据本发明优选实施方案的另一种语音识别系统30的结构示意图,如图3所示,该系统包括:麦克风阵列32,语音板34,扬声器36,下面对该语音识别系统进行说明。

上述语音识别系统30包括:麦克风阵列32(同上述麦克风阵列12)、语音板34(同上述语音板142)、扬声器36(同上述扬声器144)。其中,上述麦克风阵列32可以外置于语音板34和扬声器36。

该外置的麦克风阵列32中可以集成拾音用的麦克风、信号处理dsp(digitalsignalprocess)芯片和通信模块,其中,上述麦克风可以是驻极体或是硅麦,并可以包含两个、四个或更多的麦克风。上述通信模块用于与语音板34之间进行无线连接,可以是蓝牙、无线通讯zigbee及wifi(wirelessfidelity)等。同时,麦克风阵列32中还内置有电源管理模块,可以通过外接电源供电或是内置充电电池供电。

扬声器36中内置通讯模块和发声单元体,同时还内置有电源管理模块,也可以外接电源供电或是内置充电电池供电。

上述麦克风阵列32通过无线方式与语音板34进行连接,扬声器36与语音板34进行无线连接,其中,语音板34可以被设计在该语音识别系统所在电器中。

可选的,上述麦克风阵列32可以单独做成一个整体,放置在房间任何地方,可以是茶几、或是天花板顶部;扬声器36也可以放置在房间任何地方,可以是空调旁边,或是天花板顶部。

优选的,语音板34与该语音识别系统30的电器主控连接,当用户进行语音识别时,麦克风阵列32接收到正确指令,通过语音板34进行语音指令的解析,解析命令词后发送指令给电器主控,主控接收到控制命令后进而去控制相应的电器负载工作。

通过上述麦克风阵列外置的语音识别系统,拉开了麦克风阵列32与扬声器36的距离,有助于提升声学回音消除aec的优化,进而解决了因麦克风阵列与扬声器近,导致降噪差的问题。

在本发明实施例中,还提供了一种包含上述语音识别系统30的空调,图4是根据本发明优选实施方案的空调的单链路语音控制示意图,图5是根据本发明优选实施方案的空调的多链路语音控制示意图,如图4所示,上述语音识别系统30可以包含1个语音板34,可选的,如图5所示,该语音识别系统30还可以包含多个语音板34,其中,多个语音板34可以分别位于处在不同地理位置的空调中,一个麦克风阵列可以与多个语音板34进行无线通讯连接。例如,在客厅中设置一个麦克风阵列,同时卧室房间和客厅房间均设置带有语音板的空调,用户通过应用程序app(application)设置,把两个语音板同时与此麦克风阵列进行配对连接,并可以在app设置界面中设置1号为卧室空调,同时在app上自定义一个唤醒词,如“卧室卧室”,设置完成后并保存;同样设置2号为客厅空调,并在app上自定义一个唤醒词,如“客厅客厅”,设置完成后并保存。

同时扬声器36可以共用一个配置,如图5所示,也可以与各个语音板34独立连接,此连接方式均可在app上完成设置。当用户在客厅时,若要使用客厅的语音空调,只需说唤醒词“客厅客厅”,唤醒语音识别系统后再进行相应空调控制命令的识别与控制,得到正确识别后,扬声器36会进行播报反馈,同样,要从客厅回去卧室,只要在客厅说唤醒词“卧室卧室”,唤醒语音识别系统后,用相应的空调控制命令进行卧室空调控制即可,扬声器36可以用客厅的扬声器进行结果反馈播报。

需要说明的是,此种语音控制方式可以覆盖所有语音控制的家电类,且该语音识别功能可以包括离线识别、在线识别、离线和在线混合识别。

同时,上述语音识别系统30的设计方式,可以实现麦克风阵列与扬声器的自由组合,进而有效解决提升声学回音消除aec的效果,提高识别率,并实现语音识别系统30所在电器的产品通用化设计,不因麦克风阵列开孔导致外观受影响,满足外观一致性要求。

在本发明实施例中,还提供了一种语音识别装置,图6是根据本发明实施例的语音识别装置的结构框图,如图6所示,该装置包括:第一接收模块62,得到模块64,播报模块66。下面对该语音识别装置进行说明。

第一接收模块62,用于接收麦克风阵列采集的语音;

得到模块64,连接于上述第一接收模块62,用于通过语音识别设备中的语音板识别麦克风阵列采集的语音,得到识别结果;

播报模块66,连接于上述得到模块64,用于通过语音识别设备中的扬声器播报语音板识别出的识别结果进行播报,其中,麦克风阵列外置于语音识别设备。

图7是根据本发明实施例的语音识别装置的得到模块64的结构框图,如图7所示,该得到模块64包括:确定单元72,识别单元74。下面对该得到模块64进行说明。

确定单元72,用于确定用于语音识别的语音识别模型,其中,语音识别模型为使用多组数据通过机器学习训练得出的,多组数据中的每组数据均包括:语音和与该语音对应的识别结果;

识别单元74,连接于上述确定单元72,用于通过语音识别设备中的语音板采用确定的语音识别模型,识别出麦克风阵列采集的语音对应的识别结果。

图8是根据本发明实施例的语音识别装置的优选结构框图一,如图8所示,该语音识别装置除含图6中所有结构外,还包括:第二接收模块82,唤醒模块84。下面对该语音识别装置进行说明。

第二接收模块82,连接于上述第一接收模块62,用于在通过语音识别设备中的语音板识别麦克风阵列采集的语音,得到识别结果之前,在语音识别设备中的语音板为多个的情况下,接收到唤醒词;

唤醒模块84,连接于上述第二接收模块82和得到模块64,用于根据唤醒词唤醒将要进行语音识别的语音板。

图9是根据本发明实施例的语音识别装置的优选结构框图二,如图9所示,该语音识别装置除含图6中所有结构外,还包括:解析模块92,发送模块94。下面对该语音识别装置进行说明。

解析模块92,连接于上述得到模块64,用于在通过语音识别设备中的语音板识别麦克风阵列采集的语音,得到识别结果之后,从识别结果中解析出用于控制预定电器的控制指令;

发送模块94,连接于上述解析模块92,用于将控制指令发送给控制预定电器的电器主控。

根据本发明实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述任意一项的语音识别方法。

根据本发明实施例的另一方面,还提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述任意一项的语音识别方法。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1