分布式语音交互方法和系统与流程

文档序号:17686576发布日期:2019-05-17 20:41阅读:245来源:国知局
分布式语音交互方法和系统与流程

本公开实施例涉及计算机技术领域,特别涉及分布式语音交互方法和系统。



背景技术:

随着科技的日益发展,智能设备的使用越来越普及,种类也越来越多样化,如智能音箱、智能电视、智能洗衣机机、智能手机等,在使用智能设备的过程中,智能设备所具有的与用户之间进行语音交互的功能为用户提供了极大的方便和乐趣。

现有技术中,智能设备与用户进行语音交互的方法为在智能设备中内置麦克风或麦克风阵列,用户可以与智能设备进行近场或具有一定距离的远场交互,但该方法使得用户与智能设备进行语音交互的距离范围受限,即,仅能局限在较小的距离范围内,超过该距离范围,语音交互将无法实现或语音交互准确率较低。



技术实现要素:

本公开实施例提供一种分布式语音交互方法和系统。

第一方面,本公开实施例提供了一种分布式语音交互方法,所述分布式语音交互方法基于分布式语音交互系统,所述分布式语音交互系统包括多个语音输入设备和智能设备,多个所述语音输入设备呈分布式设置,且与所述智能设备共同构成一个通信网络;

所述分布式语音交互方法包括:

多个语音输入设备中的一个作为源语音输入设备,所述源语音输入设备采集语音信号,并根据所述通信网络获取所述源语音输入设备与所述智能设备之间的通信链路,且根据所述通信链路将所述语音信号传递至所述智能设备;

所述智能设备接收所述语音信号,并解析出所述语音信号对应的控制指令,且响应所述控制指令。

在一些实施例中,在所述源语音输入设备确定出通信链路之后,还包括:

所述源语音输入设备根据所述通信链路判断所述语音信号的传递是否为多跳通信,并当判断出所述语音信号的传递为多跳通信时,根据所述通信链路确定出下一跳所对应的语音输入设备;

所述源语音输入设备根据所述通信链路将所述语音信号传递至所述智能设备的步骤具体包括:

所述源语音输入设备将所述语音信号传递至下一跳所对应的语音输入设备。

在一些实施例中,所述智能设备响应所述控制指令的具体步骤包括:

所述智能设备根据所述控制指令执行相应的响应操作;

和/或,所述智能设备根据所述通信网络向所述源语音输入设备反馈响应结果。

在一些实施例中,在所述智能设备根据所述通信网络向所述源语音输入设备反馈响应结果的步骤之后还包括:

所述源语音输入设备播放所述智能设备反馈的响应结果。

在一些实施例中,在所述源语音输入设备采集语音信号之前还包括:

所述源语音输入设备接收预设外部刺激,以激活自身开始采集语音信号。

在一些实施例中,所述通信网络的通信方式为无线通信。

在一些实施例中,所述无线通信方式包括蓝牙通信方式或wifi通信方式。

另一方面,本公开还提供一种分布式语音交互系统,该系统包括多个语音输入设备和智能设备,多个所述语音输入设备呈分布式设置,且与所述智能设备共同构成一个通信网络;

所述语音输入设备包括:语音采集模块、链路获取模块和通信模块;

所述语音采集模块用于采集语音信号;

所述链路获取模块用于根据所述通信网络获取源语音输入设备与所述智能设备之间的通信链路;

所述通信模块用于根据所述通信链路将所述语音信号传递至所述智能设备;

所述智能设备包括:接收模块和解析响应模块;

所述接收模块用于接收所述语音信号;

所述解析响应模块用于解析出所述语音信号对应的控制指令,且响应所述控制指令。

在一些实施例中,所述语音输入设备还包括:判断模块;

所述判断模块用于在所述通信模块确定出通信链路之后,根据所述通信链路判断所述语音信号的传递是否为多跳通信;

所述通信模块具体用于当所述判断模块判断出所述语音信号的传递为多跳通信时,根据所述通信链路确定出下一跳所对应的语音输入设备,并将所述语音信号传递至下一跳所对应的语音输入设备。

在一些实施例中,所述解析响应模块包括:解析单元和响应单元;

所述解析单元用于解析出所述语音信号对应的控制指令;

所述响应单元用于响应所述控制指令。

在一些实施例中,所述响应单元包括:执行子单元和/或反馈子单元;

所述执行子单元用于根据所述控制指令执行相应的响应操作;

所述反馈子单元用于根据所述通信网络向所述源语音输入设备反馈响应结果。

在一些实施例中,当所述响应单元中包括有所述反馈子单元时,所述语音输入设备还包括:语音播放模块;

所述语音播放模块用于语音播放所述智能设备反馈的响应结果。

在一些实施例中,所述语音输入设备还包括:

激活模块,用于在接收到预设外部刺激时激活自身开始采集语音信号。

在一些实施例中,所述语音采集模块包括:一个麦克风或由多个麦克风构成的阵列。

在一些实施例中,所述通信模块为无线通信模块。

在一些实施例中,所述无线通信模块包括蓝牙通信模块或wifi通信模块。

本公开实施例提供的分布式语音交互方法和系统,所述系统包括多个语音输入设备与智能设备分布式设置,且共同构成一个通信网络,语音输入设备采集语音信号,并根据所述通信网络获取该语音输入设备与智能设备之间的通信链路,且根据该通信链路将语音信号传递至智能设备;从而使得用户能够根据实际需求而在空间内任意一个地点输入语音信号,而无需局限在某一个固定的地点或距离范围内,同时,由于语音信号基于语音输入设备与智能设备之间的通信链路进行传输,因而能够实现由多个语音输入设备来中继语音信号,从而能够在保证语音信号传输的准确率的前提下进一步扩大用户与智能设备之间的语音交互范围。

附图说明

附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开,并不构成对本公开的限制。

通过参考附图对详细示例实施例进行描述,以上和其他特征和优点对本领域技术人员将变得更加显而易见,在附图中:

图1为本公开实施例提供的一种分布式语音交互方法的流程图;

图2为本公开实施例提供的另一种分布式语音交互方法的流程图;

图3(a)为本公开实施例提供的一种分布式语音交互系统的结构示意图;

图3(b)为图3(a)中语音输入设备的一种结构示意图;

图3(c)为图3(a)中语音输入设备的另一种结构示意图;

图3(d)为图3(a)中智能设备的一种结构示意图。

附图标识中:

1a1-1ax-语音输入设备;2-智能设备;11-语音采集模块;12-链路获取模块;13-通信模块;14-判断模块;15-语音播放模块;16-激活模块;21-接收模块;22-解析响应模块;221-解析单元;222-响应单元;2221-执行子单元;2222-反馈子单元。

具体实施方式

为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图对本发明提供的分布式语音交互方法和系统进行详细描述。

在下文中将参考附图更充分地描述示例实施例,但是所述示例实施例可以以不同形式来体现且不应当被解释为限于本文阐述的实施例。反之,提供这些实施例的目的在于使本公开透彻和完整,并将使本领域技术人员充分理解本公开的范围。

如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。

本文所使用的术语仅用于描述特定实施例,且不意欲限制本公开。如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的是,当本说明书中使用术语“包括”和/或“由……制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其他特征、整体、步骤、操作、元件、组件和/或其群组。

本文所述实施例可借助本公开的理想示意图而参考平面图和/或截面图进行描述。因此,可根据制造技术和/或容限来修改示例图示。因此,实施例不限于附图中所示的实施例,而是包括基于制造工艺而形成的配置的修改。因此,附图中例示的区具有示意性属性,并且图中所示区的形状例示了元件的区的具体形状,但并不旨在是限制性的。

除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。

本公开实施例提供一种分布式语音交互方法,该方法基于分布式语音交互系统,该分布式语音交互系统包括多个语音输入设备和智能设备,多个语音输入设备呈分布式设置,且与智能设备共同构成一个通信网络。为方便描述,在下述各实施例中,用户当前正使用的一个语音输入设备称为源语音输入设备。

需要说明的是,分布式语音交互系统中的各语音输入设备的整体结构可以相同,也可以不同;在本公开中仅需保证各语音输入设备应至少具备语音采集和数据通信的功能即可,当然也可以根据需要在各语音输入设备中分别配置其他功能。语音输入设备具体可以为智能音箱、智能麦克风、智能遥控器等具备语音采集和数据通信功能的设备或结构。

在上述通信网络中,每个语音输入设备和智能设备均可看作为一个通信节点,该通信网络中任意两个通信节点之间可以直接或间接(由通信网络的拓扑结构所决定)地进行通信。

作为多个语音输入设备呈分布式设置的一种具体应用场景,例如,在家庭环境中,每个房间内均设置有一个语音输入设备,每个语音输入设备可以与其他至少一个语音输入设备基于预设的通信网络直接进行通信;智能设备可以置于房子内的任意位置,智能设备可以与至少一个语音输入设备进行直接通信。

如图1所示,该方法包括:

步骤s101、源语音输入设备采集语音信号,并根据通信网络获取该语音输入设备与智能设备之间的通信链路,且根据通信链路将语音信号传递至智能设备。

步骤s102、智能设备接收语音信号,并解析出语音信号对应的控制指令,且响应控制指令。

在本公开中,当用户需要与智能设备进行交互时,仅需通过最近的一个语音输入设备进行语音输入即可,距离用户最近的语音输入设备作为源语音输入设备,其能够采集用户所输入的语音并生成相应的语音信号,且能够基于由所有语音输入设备和智能设备所构成的通信网络将所采集到的语音信号传递至该智能设备,以实现与智能设备的交互。

本公开实施例提供的分布式语音交互方法,源语音输入设备采集语音信号,并根据通信网络获取源语音输入设备与智能设备之间的通信链路,且根据该通信链路将语音信号传递至智能设备;从而使得用户能够根据实际需求而在空间内任意一个地点输入语音信号,而无需局限在某一个固定的地点或距离范围内,同时,由于语音信号基于语音输入设备与智能设备之间的通信链路进行传输,因而能够实现由多个语音输入设备来中继语音信号,从而能够在保证语音信号传输的准确率的前提下进一步扩大用户与智能设备之间的语音交互范围。

本公开实施例还提供一种分布式语音交互方法,如图2所示,该方法包括:

步骤s201、源语音输入设备接收预设外部刺激,以激活自身开始采集语音信号。

在一般环境下,各语音输入设备内用于实现语音采集功能的模块处于未激活状态。当用户需要与智能设备进行语音交互时,用户可向其距离最近的一个语音输入设备施加预设外部刺激以激活该语音输入设备的语音采集功能。例如,在语音输入设备的特定位置设置“激活区”,用户通过触摸该激活区以激活该语音输入设备的语音采集功能;或者,在语音输入设备的特定位置设置“激活按钮”,用户按压该激活按钮以激活该语音输入设备的语音采集功能;或者,在语音输入设备上设置摄像头,用户在摄像头前做出设定动作(例如,连续眨眼3秒或者进行招手)时可以激活该语音输入设备的语音采集功能。需要说明的是,本公开中的“预设外部刺激”可以为与源语音输入设备直接接触的刺激,也可为与源语音输入设备不直接接触的刺激。本公开的技术方案对“预设外部刺激”的具体形式不作限定,此处也不再一一举例描述。

在本公开中,通过对语音输入设备施加外部刺激以激活语音输入设备进行语音采集,使得语音输入设备在被需求时才进行语音采集,从而避免了由于语音输入设备随意采集语音信号而造成的语音信号传输混乱及智能设备控制混乱的问题。

步骤s202、源语音输入设备采集语音信号,并根据通信网络获取该源语音输入设备与智能设备之间的通信链路。

本实施例中,通信网络的通信方式为无线通信或有线通信;优选地,采用无线通信方式,此时可减少系统内信号线的布置数量,降低系统的成本。进一步地,无线通信方式为蓝牙通信方式或wifi通信方式。

多个语音输入设备与智能设备之间建立有通信网络,即两个语音输入设备之间以及语音输入设备与智能设备之间均能够进行相互通信。该通信网络中,多个语音输入设备与智能设备形成一个拓扑式网络结构,该拓扑式网络结构中,任意一个语音输入设备与智能设备之间具有至少一条通信链路。

作为一种获取源语音输入设备与智能设备之间的通信链路的可选实施方案:在搭建分布式语音交互系统时,通信网络的拓扑结构固定,可以针对每个语音输入设备,生成至少一条由该语音输入设备到智能设备的通信链路,并将该通信链路的链路信息存储于该语音输入设备内。

在步骤s202中,当源语音输入设备完成语音信息采集后,源语音输入设备可直接从自身系统中提取(当预先存储的链路信息为多条时,可以随机提取或者按照一定规则进行提取)出一条预先存储的由其自身至智能设备的通信链路的链路信息。

作为另一种获取源语音输入设备与智能设备之间的通信链路的可选实施方案:每个语音输入设备具备探测该通信网络的拓扑结构的功能(基于网络拓扑结构探测技术来实现),以及实时计算通信链路的功能。

在步骤s202中,当源语音输入设备完成语音信息采集后,源语音输入设备可以探测该通信网络的当前拓扑结构,并基于预设的通信链路计算算法(例如,最短路径算法)来计算出其自身与通信设备之间的通信链路。

在本公开中,基于源语音输入设备当前探测到的网络拓扑结构,并计算出相应的通信链路的计算手段,其可在通信网络的拓扑结构发生变化(例如系统中新增语音输入设备或减少语音输入设备)后,生成与当前拓扑结构相匹配的通信链路,以提升通信网络在进行数据传递过程中的灵活性。

在步骤s202所获取到的通信链路的链路信息中,至少记载有源语音输入设备所对应的节点位置(源节点位置)和智能设备所对应的节点位置(目的节点位置),当然该链路信息中还有可能包含其他语音输入设备所对应的节点位置(中继节点位置)。

步骤s203、源语音输入设备根据通信链路判断语音信号的传递是否为多跳通信。

语音输入设备与智能设备之间的通信链路包括单跳通信和多跳通信,单跳通信指的是语音输入设备将语音信号直接发送至智能设备,此种情况适用于语音输入设备与智能设备之间距离较近的情况;多跳通信指的是语音信号需要先发送至其他语音输入设备进行中继,然后再发送至智能设备,此种情况适用于采集语音信号的语音输入设备距离智能设备较远的情况,例如,复式住宅中的上下层之间的语音交互。

在步骤s203中,可根据步骤s202所获取到的通信链路所包含的节点数量,来判断语音信号的传递为单跳通信或多条通信。

具体地,当步骤s202所获取到的通信链路的链路信息中仅包括源语音输入设备所对应的节点位置和智能设备所对应的节点位置时(仅包括源节点和目的节点),则可判断出语音信号的传递为单跳通信,即源语音输入设备可以与智能设备直接进行数据通信,此时执行步骤s204;当步骤s202所获取到的通信链路的链路信息中不仅包括源语音输入设备所对应的节点位置和智能设备所对应的节点位置,还包括其他语音输入设备所对应的节点位置时(不仅包括源节点和目的节点,还包括中继节点),则可判断出语音信号的传递为多跳通信,即源语音输入设备无法与智能设备直接进行数据通信,此时执行步骤s205。

步骤s204、源语音输入设备将语音信号传递至智能设备。

步骤s205、源语音输入设备根据通信链路确定出下一跳所对应的语音输入设备,并将语音信号传递至该下一跳所对应的语音输入设备,该下一跳所对应的语音输入设备根据通信链路将语音信号传递至智能设备。

在判断出通信链路为多跳通信时,源语音输入设备根据通信链路获取到下一跳所对应的语音输入设备,并将语音信息和通信链路的链路信息一起发送至下一跳所对应的语音输入设备,下一跳语音输入设备根据接收到的通信链路的链路信息再将语音信息和链路信息一起进行再下一跳的转发,重复上述的下一跳转发步骤,直至语音信息和通信链路的链路信息转发至智能设备。

本实施例中,在语音信号基于源语音输入设备与智能设备之间的通信链路进行传输过程中,能够通过多个语音输入设备来传递语音信号,从而能够实现在保证语音信号的传输准确率的前提下,扩大用户与智能设备之间的语音交互范围。

步骤s206、智能设备接收语音信号,并解析出语音信号对应的控制指令,且响应控制指令。

在步骤s206中,智能设备响应控制指令的具体步骤包括:智能设备根据控制指令执行相应的响应操作;和/或智能设备根据通信网络向发送语音信号的源语音输入设备反馈响应结果。即,智能设备在一次响应控制指令的过程中,响应操作与发送反馈响应结果可全部发生,或仅发生其中之一。

在本公开中,智能设备的数量可以为一个或多个,当智能设备为一个时,智能设备直接解析并响应控制指令,自身执行相应的操作,例如,智能设备为智能电视,当控制指令为打开智能电视时,相应的,智能设备(智能电视)执行打开电视机的操作;智能设备为智能音箱,当控制指令为查询天气情况,相应的,智能设备(例如智能音箱)向用户反馈查询结果;智能设备为智能空调,当控制指令为打开空调并查询室内温度,相应的,智能设备(例如智能空调)执行打开空调的操作,同时向用户反馈室内温度查询结果。

当智能设备的数量为多个时,多个智能设备中的一个作为主控设备,主控设备接入上述拓扑式网络中,同时主控设备能够与其他智能设备进行通信,并且,主控设备具有比其他智能设备更高的权限,能够根据控制指令控制其他智能设备执行相应操作。在语音交互过程中,语音输入设备将语音信号经通信链路传输至主控设备,主控设备对语音信号进行解析得到控制指令,进而主控设备根据控制指令控制目标智能设备响应控制指令。

在一些使用场景中,例如家庭住宅中,优选的,主控设备为智能音箱,其他智能设备包括智能电视、智能空调等智能家居,智能音箱可以通过红外线或wifi来控制其他智能家居,住宅中每个房间及其他用户需要的地方布置有语音输入设备,例如麦克风装置,当用户需要对智能家居进行控制时,用户根据需求可选择任意一个麦克风装置并向其输入语音信号,该麦克风装置接收到语音信号后,基于通信链路将语音信号发送至智能音箱,智能音箱对语音信号进行解析,以获得相应的控制指令,进而智能音箱根据控制指令而控制相应的智能家居执行相应操作。

步骤s207、源语音输入设备播放智能设备反馈的响应结果。

当智能设备需要向发送语音信号的源语音输入设备反馈响应结果时,源语音输入设备可语音播放智能设备所反馈的响应结果,例如播报天气预报或与用户进行对话等。

另外,本公开还提供一种分布式语音交互系统,用于执行本公开前述分布式语音交互方法,结合图3(a)-3(c),该系统包括:多个语音输入设备1a1-1ax和智能设备2;其中,多个语音输入设备1a1-1ax呈分布式设置,且与智能设备2共同构成一个通信网络,如图3(a)所示。

具体地,每个语音输入设备包括语音采集模块11、链路获取模块12、以及通信模块13,如图3(b)所示;其中,语音采集模块11用于采集语音信号;链路获取模块12用于根据通信网络获取源语音输入设备与智能设备2之间的通信链路;通信模块13用于根据通信链路将语音信号传递至智能设备2。

智能设备2包括接收模块21和解析响应模块22,如图3(d)所示;其中,接收模块21用于接收语音信号;解析响应模块22用于解析出语音信号对应的控制指令,且响应控制指令。

本公开实施例提供的分布式语音交互系统,包括多个呈分布式设置的语音输入设备,且与智能设备共同构成一个通信网络,语音输入设备采集语音信号,并根据通信网络获取该语音输入设备与智能设备之间的通信链路,且根据该通信链路将语音信号传递至智能设备;从而使得用户能够根据实际需求而在空间内任意一个地点输入语音信号,而无需局限在某一个固定的地点或距离范围内,同时,由于语音信号基于语音输入设备与智能设备之间的通信链路进行传输,因而能够实现由多个语音输入设备来中继语音信号,从而能够在保证语音信号传输的准确率的前提下进一步扩大用户与智能设备之间的语音交互范围。

进一步的,作为链路获取模块12获取源语音输入设备与智能设备之间的通信链路的一种可选实施方案,在搭建分布式语音交互系统时,通信网络的拓扑结构固定,可以针对每个语音输入设备,生成至少一条由该语音输入设备到智能设备的通信链路,并将该通信链路的链路信息存储于该语音输入设备内;该链路信息中,至少记载有源语音输入设备所对应的节点位置(源节点位置)和智能设备所对应的节点位置(目的节点位置),当然该链路信息中还有可能包含其他语音输入设备所对应的节点位置(中继节点位置)。当语音采集模块11完成语音信息采集后,链路获取模块12可直接从自身系统中提取(当预先存储的链路信息为多条时,可以随机提取或者按照一定规则进行提取)出一条预先存储的由其自身至智能设备的通信链路的链路信息,

作为另一种链路获取模块12获取源语音输入设备与智能设备之间的通信链路的可选实施方案:每个语音输入设备具备探测该通信网络的拓扑结构的功能(基于网络拓扑结构探测技术来实现),以及实时计算通信链路的功能。当语音采集模块11完成语音信息采集后,链路获取模块12可以探测该通信网络的当前拓扑结构,并基于预设的通信链路计算算法(例如,最短路径算法)来计算出其自身与通信设备之间的通信链路。

在本公开中,链路获取模块12基于源语音输入设备当前探测到的网络拓扑结构,并计算出相应的通信链路,可在通信网络的拓扑结构发生变化(例如系统中新增语音输入设备或减少语音输入设备)后,生成与当前拓扑结构相匹配的通信链路,以提升通信网络在进行数据传递过程中的灵活性。

本公开中,通信模块13的通信方式为无线通信方式或有线通信方式,优选地,采用无线通信方式,此时可减少系统内信号线的布置数量,降低系统的成本。进一步地,通信模块13为蓝牙通信模块或wifi通信模块。

本实施例中,语音输入设备还包括判断模块14,如图3(b)所示,判断模块14用于在通信模块确定出通信链路之后,根据通信链路判断语音信号的传递是否为多跳通信。

当判断模块14判断出语音信号的传递为多跳通信时,通信模块13具体用于根据通信链路确定出下一跳所对应的语音输入设备,并将语音信号传递至下一跳所对应的语音输入设备。

具体地,语音输入设备与智能设备之间的通信链路包括单跳通信和多跳通信,单跳通信指的是语音输入设备将语音信号直接发送至智能设备,此种情况适用于语音输入设备与智能设备之间距离较近的情况;多跳通信指的是语音信号需要先发送至其他语音输入设备进行中继,然后再发送至智能设备,此种情况适用于采集语音信号的语音输入设备距离智能设备较远的情况,例如,复式住宅中的上下层之间的语音交互。

判断模块14根据通信链路判断语音信号的传递是否为多跳通信可以通过获取通信链路所包含的节点数量来确定。具体地,当所获取的通信链路的链路信息中仅包括源语音输入设备所对应的节点位置和智能设备所对应的节点位置时(仅包括源节点和目的节点),则可判断出语音信号的传递为单跳通信,即源语音输入设备可以与智能设备直接进行数据通信;当获取到的通信链路的链路信息中不仅包括源语音输入设备所对应的节点位置和智能设备所对应的节点位置,还包括其他语音输入设备所对应的节点位置时(不仅包括源节点和目的节点,还包括中继节点),则可判断出语音信号的传递为多跳通信,即源语音输入设备无法与智能设备直接进行数据通信。

在判断模块14判断出通信链路为多跳通信时,指示通信模块13根据通信链路获取到下一跳所对应的语音输入设备,并将语音信息和通信链路的链路信息一起发送至下一跳所对应的语音输入设备,下一跳语音输入设备根据接收到的通信链路的链路信息再将语音信息和链路信息一起进行再下一跳的转发,重复上述的下一跳转发步骤,直至语音信息和通信链路的链路信息转发至智能设备。

本实施例中,在语音信号基于源语音输入设备与智能设备之间的通信链路进行传输过程中,能够通过多个语音输入设备来传递语音信号,从而能够实现在保证语音信号的传输准确率的前提下,扩大用户与智能设备之间的语音交互范围。

本实施例中,语音输入设备还包括激活模块16,用于在接收到预设外部刺激时激活语音采集模块开始采集语音信号。

具体的,激活模块16的具体实现形式包括在语音输入设备的特定位置设置“激活区”,用户通过触摸该激活区以激活该语音输入设备的语音采集功能;或者,在语音输入设备的特定位置设置“激活按钮”,用户按压该激活按钮以激活该语音输入设备的语音采集功能;或者,在语音输入设备上设置摄像头,用户在摄像头前做出设定动作(例如,连续眨眼3秒或者进行招手)时可以激活该语音输入设备的语音采集功能。需要说明的是,本公开中的激活模块的激活方式可以为与源语音输入设备直接接触的方式,也可为与源语音输入设备不直接接触的方式。本公开的技术方案对激活模块的具体形式不作限定,此处也不再一一举例描述。

在本公开中,通过对语音输入设备施加外部刺激以激活语音输入设备进行语音采集,使得语音输入设备在被需求时才进行语音采集,从而避免了由于语音输入设备随意采集语音信号而造成的语音信号传输混乱及智能设备控制混乱的问题。

本公开中,语音采集模块11包括一个麦克风或由多个麦克风构成的阵列,具体可根据不同的场景和需求进行设置,例如,当语音输入设备距离智能设备距离较近时,语音输入设备中的语音采集模块可以为一个麦克风,而当语音输入设备距离智能设备较远时,语音采集模块可以为由多个麦克风构成的麦克风阵列,以提供更强的语音采集功能。

进一步地,本公开实施例提供的分布式语音交互系统中,智能设备的数量可以为一个或多个,当智能设备为一个时,智能设备中的解析响应模块22具体包括解析单元221和响应单元222;如图3(d)所示,其中,解析单元221用于解析出语音信号对应的控制指令,响应单元222用于响应控制指令。

更进一步地,响应单元222具体包括执行子单元2221和/或反馈子单元2222;其中,执行子单元2221用于根据控制指令执行相应的响应操作;反馈子单元2222用于根据通信网络向发送语音信号的源语音输入设备反馈响应结果,根据实际场景需求可使智能设备同时具备响应执行子单元和反馈子单元,或仅具备其中之一。例如,当控制指令为打开智能电视时,相应的,智能设备(智能电视)需具备执行子单元2221以执行打开电视机的操作;当控制指令为查询天气情况时,相应的,智能设备(例如智能音箱)应具备反馈子单元2222以向用户反馈查询结果;当控制指令为打开空调并查询室内温度时,相应的,智能设备(智能空调)应具备执行子单元2221和反馈子单元2222,以分别实现执行打开空调的操作和向用户反馈室内温度查询结果。

当智能设备的数量为多个时,多个智能设备中的一个作为主控设备,主控设备接入上述拓扑式网络中,同时主控设备能够与其他智能设备进行通信,并且,主控设备具有比其他智能设备更高的权限,能够根据控制指令控制其他智能设备执行相应操作。在语音交互过程中,语音输入设备将语音信号经通信链路传输至主控设备,主控设备对语音信号进行解析得到控制指令,进而主控设备根据控制指令控制目标智能设备执行相应的操作。在一些实施例中,优选的,主控设备为智能音箱。主控设备除包含有上述智能设备的结构外,还包括控制模块,用于根据控制指令控制其他的智能设备响应控制指令。

本实施例中,当智能设备2中响应单元222中包括有反馈子单元2222时,语音输入设备还包括语音播放模块15,如图3(c)所示;语音播放模块15用于语音播放智能设备2反馈的响应结果,例如播报天气预报或与用户进行对话等。具体地,语音播放模块可以为喇叭。

需要说明的是,本公开中,系统的多个语音输入设备的结构可以多样化,即根据不同的场景和需求可以设置语音输入设备的结构不同,例如,当语音输入设备距离智能设备距离较近时,语音输入设备中的语音采集模块可以为一个麦克风,而当语音输入设备距离智能设备较远时,语音采集模块可以为由多个麦克风构成的麦克风阵列,以提供更强的语音采集功能;当语音输入设备需要播放智能设备反馈的响应信息时,语音输入设备中设置有语音播放模块以播放智能设备反馈的响应信息。

本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

本文已经公开了示例实施例,并且虽然采用了具体术语,但它们仅用于并仅应当被解释为一般说明性含义,并且不用于限制的目的。在一些实例中,对本领域技术人员显而易见的是,除非另外明确指出,否则可单独使用与特定实施例相结合描述的特征、特性和/或元素,或可与其他实施例相结合描述的特征、特性和/或元件组合使用。因此,本领域技术人员将理解,在不脱离由所附的权利要求阐明的本公开的范围的情况下,可进行各种形式和细节上的改变。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1