一种语音交互方法、系统、电子设备及服务器与流程

文档序号:16979819发布日期:2019-02-26 19:24阅读:169来源:国知局
一种语音交互方法、系统、电子设备及服务器与流程

本发明实施例涉及通信技术领域,特别涉及一种语音交互方法、系统、电子设备及服务器。



背景技术:

随着科技的发展,音箱越来越智能化。人们可以通过音箱进行点播歌曲、上网购物等操作,甚至可以通过智能音箱对智能家电设备进行控制。

然而,发明人发现现有技术中至少存在如下问题:用户只有在智能音箱附近才能与智能音箱交互,触发智能音箱工作。然而,当用户在多个房间之间活动时,若用户需要与智能音箱交互,需要跑到放置智能音箱的房间,极其不方便,降低了用户的体验。

需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。



技术实现要素:

本发明实施方式的目的在于提供一种语音交互方法、系统、电子设备及服务器,使得用户只需在至少两个子设备附近即可与主机进行交互,无需跑到主机所处空间,提高了用户体验。

为解决上述技术问题,本发明的实施方式提供了一种语音交互方法,应用于主机,包括以下步骤:获取与主机连接的至少两个子设备中的至少一个子设备传输的声音信号;根据获取的声音信号,确定对获取的声音信号的第一响应信息;其中,第一响应信息中包括待播放的声音信号的存储位置信息或待播放的声音信号;从至少两个子设备中选择子设备,将第一响应信息传输至选择的子设备。

本发明的实施方式还提供了一种语音交互方法,应用于云端服务器,包括以下步骤:获取主机传输的语音分析请求;其中,语音分析请求中包括主机获取的声音信号,获取的声音信号为与主机连接的至少两个子设备中的至少一个子设备传输的声音信号;根据语音分析请求,确定第二响应信息;其中,第二响应信息中包括待播放的声音信号的存储位置信息或待播放的声音信号;发送第二响应信息至主机。

本发明的实施方式还提供了一种语音交互系统,包括:主机,以及与主机连接的至少两个子设备;至少两个子设备用于:采集环境中的声音,根据采集的声音,生成声音信号,将生成的声音信号传输给主机;获取主机传输的第一响应信息,第一响应信息中包括待播放的声音信号的存储位置信息或待播放的声音信号;根据第一响应信息,确定待播放的声音信号;根据待播放的声音信号,播放声音;主机用于:获取与主机连接的至少两个子设备中的至少一个子设备传输的声音信号;根据获取的声音信号,确定对获取的声音信号的第一响应信息;从至少两个子设备中选择子设备,将第一响应信息传输至选择的子设备。

本发明的实施方式还提供了一种电子设备,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;以及,与至少两个子设备通信连接的通信组件,通信组件在处理器的控制下接收和发送数据;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如上述实施方式提及的应用于主机的语音交互方法。

本发明的实施方式还提供了一种云端服务器,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;以及,与主机通信连接的通信组件,通信组件在处理器的控制下接收和发送数据;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施方式提及的应用于云端服务器的语音交互方法。

本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述实施方式提及的应用于主机的语音交互方法。

本发明的实施方式还提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时实现上述实施方式提及的应用于云端服务器的语音交互方法。

本发明实施方式相对于现有技术而言,多个子设备分别与主机通信连接,使得用户只需在多个子设备中的任意一个子设备附近,即可与主机进行交互,无需跑到主机所处空间,提高了用户体验。除此之外,多个子设备与一个主机通信连接,由同一主机来确定对各个子设备采集的声音信号的响应信息,相对于为每个子设备配置一个主机的方法,或,在不同空间放置多个智能音响的方法,降低了布设成本。除此之外,由于主机需要与云端服务器或外部其他设备通信,以获取待播放的声音信号,多个子设备由同一主机与外部通信,相对于多个主机与外部通信的方法,降低了维护内部网络安全的难度和成本,能够更好的保护用户隐私安全。

另外,根据获取的声音信号,确定对声音信号的第一响应信息,具体包括:根据获取的声音信号,确定语音分析请求;将语音分析请求传输至云端服务器;获取云端服务器返回的第二响应信息,第二响应信息中包括待播放的声音信号的存储位置信息或待播放的声音信号;根据第二响应信息,确定第一响应信息。

另外,从至少两个子设备中选择子设备,具体包括:获取检测设备传输的检测信息;根据检测信息,确定用户的位置信息;根据用户的位置信息,从与用户距离小于预设值的子设备中选择子设备作为选择的子设备;或者,从至少两个子设备中,选择与用于播放待播放的声音信号的子设备的标识信息对应的子设备,其中,用于播放待播放的声音信号的子设备的标识信息,携带在第二响应信息中。

另外,根据获取的声音信号,确定语音分析请求,具体包括:将获取的声音信号转化为符合预设格式的声音信号;根据符合预设格式的声音信号,确定语音分析请求,语音分析请求中包括符合预设格式的声音信号。

另外,语音分析请求中还包括传输获取的声音信号的子设备的标识信息;根据语音分析请求,确定第二响应信息,具体包括:根据传输获取的声音信号的子设备的标识信息,确定传输获取的声音信号的子设备的安装场景;其中,云端服务器中存储有子设备的标识信息与子设备的安装场景的对应关系;根据传输获取的声音信号的子设备的安装场景和获取的声音信号,确定第二响应信息。

另外,语音交互系统还包括云端服务器;主机具体用于:根据获取的声音信号,确定语音分析请求;将语音分析请求传输至云端服务器;获取云端服务器返回的第二响应信息;根据第二响应信息,确定第一响应信息;云端服务器用于:获取主机传输的语音分析请求;根据语音分析请求,确定第二响应信息;发送第二响应信息至主机;其中,第二响应信息中包括待播放的声音信号的存储位置信息或待播放的声音信号。

附图说明

一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。

图1是本发明的第一实施方式的语音交互方法的流程图;

图2是本发明的第二实施方式的语音交互方法的流程图;

图3是本发明的第三实施方式的语音交互方法的流程图;

图4是本发明的第四实施方式的语音交互方法的流程图;

图5是本发明的第五实施方式的语音交互系统的结构示意图;

图6是本发明的第六实施方式的语音交互系统的结构示意图;

图7是本发明的第七实施方式的电子设备的结构示意图;

图8是本发明的第八实施方式的云端服务器的结果示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。

本发明的第一实施方式涉及一种语音交互方法,应用于主机。如图1所示,该语音交互方法包括以下步骤:

步骤101:获取与主机连接的至少两个子设备中的至少一个子设备传输的声音信号。

具体地说,至少两个子设备分别采集环境中的声音,根据采集的声音,生成声音信号,将生成的声音信号传输给主机。

具体实现中,至少两个子设备以分布式的方式,放置在不同空间,例如,不同的房间,以便至少两个子设备能够采集多个空间中的声音信号。其中,子设备的个数可以根据总空间的大小确定。

具体实现中,子设备在检测到采集指令后,对环境中的声音进行采集。例如,子设备在用户按下语音功能按钮后,采集环境中的声音。又如,子设备对环境中的声音进行检测分析,在确定环境中的声音中包括指示开启语音功能的特定词后,对环境中的声音进行采集。

具体实现中,子设备在开始采集声音之前或在采集声音的过程中,通过发出提示声音或点亮提示灯的方式,提示用户已开始录音,避免用户未察觉子设备在录音而泄露用户隐私。

具体实现中,子设备在根据采集的声音,生成声音信号的过程中,先对采集的声音进行降噪处理,将降噪后的声音信号传输至主机。

具体实现中,主机在检测到未建立通信连接的子设备时,与子设备建立通信连接,并通过该通信连接,获取子设备传输的声音信号。

值得一提的是,多个子设备与一个主机通信连接,由同一主机来确定对各个子设备采集的声音信号的响应信息,相对于为每个子设备配置一个主机的方法,或,在不同空间放置多个智能音响的方法,降低了布设成本。除此之外,由于主机需要与云端服务器或外部其他设备通信,以获取待播放的声音信号,多个子设备由同一主机与外部通信,相对于多个主机与外部通信的方法,降低了维护内部网络安全的难度和成本,能够更好的保护用户隐私安全。

具体实现中,主机对与其通信连接的子设备进行监测,确定各个子设备是否在线。

具体实现中,主机统计各个子设备传输声音信号的次数,生成各个子设备的运行信息。便于用户后期根据各个子设备的运行信息,调整子设备的布局,减少不必要的子设备。

步骤102:根据获取的声音信号,确定对获取的声音信号的第一响应信息。

具体地说,第一响应信息中包括待播放的声音信号的存储位置信息或待播放的声音信号。

以下对主机确定第一响应信息的方法进行举例说明。

方法1:主机分析获取的声音信号,根据分析结果,确定待播放的声音信号,或,待播放的声音信号的存储位置信息。主机根据待播放的声音信号,或,待播放的声音信号的存储位置信息,确定第一响应信息。

方法2:主机根据获取的声音信号,确定语音分析请求;将语音分析请求传输至云端服务器;获取云端服务器返回的第二响应信息,第二响应信息中包括待播放的声音信号的存储位置信息或待播放的声音信号;根据第二响应信息,确定第一响应信息。

其中,主机根据获取的声音信号,确定语音分析请求的过程如下:将获取的声音信号转化为符合预设格式的声音信号;根据符合预设格式的声音信号,确定语音分析请求,语音分析请求中包括符合预设格式的声音信号。由于主机与多个子设备连接,多个子设备传输的声音信号的格式可能相同,也可能不同。主机在获取多个子设备传输的声音信号后,先将多个子设备传输的声音信号的格式转化为预设格式,再传输至云端服务器。其中,预设格式可以是常见的音频格式中的任意一种格式。

值得一提的是,主机将多个子设备传输的声音信号的格式转化为预设格式后,再传输至云端服务器,避免了云端服务器不支持子设备的声音信号的格式,导致响应失败的情况。

具体实现中,第二响应信息中包括待播放的声音信号的存储位置信息。主机根据第二响应信息,从待播放的声音信号的存储位置处获取待播放的声音信号,根据获取的待播放的声音信号,确定第一响应信息。或者,主机将第二响应信息作为第一响应信息。

另一具体实现中,第二响应信息中包括待播放的声音信号,主机将第二响应信息作为第一响应信息。

值得一提的是,主机将获取的声音信号传输至云端服务器,由云端服务器对获取的声音信号进行分析,减轻了主机的工作压力,减少了主机的功耗。

步骤103:从至少两个子设备中选择子设备,将第一响应信息传输至选择的子设备。

具体地说,主机可以将第一响应信息传输给所有子设备,也可以有选择的将第一响应信息传输给至少两个子设备中的一个或多个子设备。

需要说明的是,本领域技术人员可以理解,子设备采集声音的功能和播放声音的功能可以有一个或多个模块实现,例如,每个子设备包括一个麦克风和一个扬声器,其中,麦克风和扬声器可以设置在同一位置,也可以设置在同一房间的不同位置。

需要说明的是,以上仅为举例说明,并不对本发明的技术方案构成限定。

与现有技术相比,本实施方式中提供的语音交互方法,多个子设备分别与主机通信连接,使得用户只需在多个子设备中的任意一个子设备附近,即可与主机进行交互,无需跑到主机所处空间,提高了用户体验。除此之外,多个子设备与一个主机通信连接,由同一主机来确定对各个子设备采集的声音信号的响应信息,相对于为每个子设备配置一个主机的方法,或,在不同空间放置多个智能音响的方法,降低了布设成本。除此之外,由于主机需要与云端服务器或外部其他设备通信,以获取待播放的声音信号,多个子设备由同一主机与外部通信,相对于多个主机与外部通信的方法,降低了维护内部网络安全的难度和成本,能够更好的保护用户隐私安全。

本发明的第二实施方式涉及一种语音交互方法,本实施方式是对第一实施方式的进一步细化,具体说明了步骤103。

具体的说,如图2所示,在本实施方式中,包含步骤201至步骤206,其中,步骤201和步骤202分别与第一实施方式中的步骤101和步骤102大致相同,此处不再赘述。下面主要介绍不同之处:

执行步骤201和步骤202。

步骤203:获取检测设备传输的检测信息。

具体地说,检测设备检测用户的位置,根据检测结果确定检测信息,将检测信息传输至主机。

需要说明的是,检测设备可以是红外传感器、距离传感器和光线传感器等设备中的任意一种设备,此处不再一一列举。

需要说明的是,检测设备和子设备可以位于同一装置中,即使用具有采集声音和检测用户的位置的装置。

步骤204:根据检测信息,确定用户的位置信息。

具体地说,用户的位置信息可以是用户的相对位置信息,例如,用户相对于检测设备的距离信息,也可以是用户的绝对位置信息,例如,检测设备通过室内定位技术,确定用户的位置信息,本实施方式不限制用户的位置信息的具体内容。

具体实现中,检测信息为用户与检测设备的距离信息,用户的位置信息为子设备与用户的距离信息。将检测设备设置在子设备附近,使得检测设备与用户之间的距离近似于子设备与用户之间的距离,主机可以将检测信息中检测设备与用户的距离,作为用户与子设备的距离。

另一具体实现中,检测信息为用户与检测设备的距离信息,用户的位置信息为子设备与用户的距离信息。主机中存储有检测设备与子设备的距离信息,主机根据检测信息和检测设备与子设备的距离信息,确定子设备与用户的距离信息。

需要说明的是,本领域技术人员可以理解,实际应用中,还可以根据其他方式确定用户与子设备的位置关系,本实施方式不限制确定用户与子设备的位置关系的具体方法。

步骤205:根据用户的位置信息,从与用户距离小于预设值的子设备中选择子设备作为选择的子设备。

具体地说,主机根据用户的位置信息,从与用户距离小于预设值的子设备中选择子设备作为选择的子设备。例如,主机选择距离最小的子设备作为选择的子设备,或者,主机将与用户距离小于预设值的子设备均作为子设备。

需要说明的是,本领域技术人员可以理解,主机在确定用户的位置信息后,可以根据用户的位置信息,确定待播放的声音信号的播放音量。例如,若用户的位置信息指示用户距离子设备较远,则确定播放音量为第一音量,若用户的位置信息指示用户距离子设备较近,确定播放音量为第二音量,第一音量大于第二音量。主机将确定的播放音量携带在第一响应信息中,选择的子设备在接收到第一响应信息后,确定播放音量和待播放的声音信号,按照确定的播放音量播放待播放的声音信号。

值得一提的是,主机根据用户的位置信息,选择用于播放待播放的声音信号的子设备,避免了用户在发出语音后,移动至其他位置,导致用户无法获知到待播放的声音信号中的信息的问题。

需要说明的是,实际应用中,也可以通过其他方式确定选择的子设备,例如,由云端服务器确定用于播放待播放的声音信号的子设备,将用于播放待播放的声音信号的子设备的标识信息携带在第二响应信息中,主机从至少两个子设备中,选择与用于播放待播放的声音信号的子设备的标识信息对应的子设备。其中,云端服务器可以是采用本实施方式中主机确定播放待播放的声音信号的子设备的方法确定播放待播放的声音信号的子设备,也可以根据分析获取的声音信号得到的分析结果确定播放待播放的声音信号的子设备。本领域技术人员可以理解,本实施方式不限制主机选择子设备的具体方式。

步骤206:将第一响应信息传输至选择的子设备。

其中,接收到第一响应信息的子设备根据第一响应信息,播放声音。

以下结合实际场景说明主机执行本发明的实施方式提供的语音交互方法的过程。

第一种场景,假设用户a的家中有3个房间,分别为房间1、房间2和房间3,在每个房间中设置有1个子设备。在房间1说出指示开启语音功能的特定词,并在确定房间1中的子设备已开始录音时,说出“播放歌曲”。房间1中的子设备在检测到特定词之后,开始录音,生成声音信号,并传输至主机。主机根据获取的声音信号,确定语音分析请求,并将语音分析请求传输至云端服务器。云端服务器分析语音分析请求中的声音信号,确定该声音信号指示用户需要听歌,云端服务器确定本次播放的歌曲,将本次播放的歌曲作为待播放的声音信号,根据待播放的声音信号,确定第二响应信息。其中,本次播放的歌曲可以是用户预先存储的歌曲中的任意一首或任意多首,也可以是云端服务器从互联网临时下载的歌曲。云端服务器将第二响应信号传输至主机,主机接收第二响应信息,根据第二响应信息,确定第一响应信息,第一响应信息中包括待播放的声音信号。主机开启检测设备,获取检测设备传输的检测信息,根据检测信息,确定用户a当前位于房间2。主机将第一响应信息发送至房间2中的子设备,房间2中的子设备根据第一响应信息,确定待播放的声音信号,播放声音。

第二种场景,假设用户a的家中有3个房间,分别为房间1、房间2和房间3,在每个房间中设置有1个子设备。在房间1说出指示开启语音功能的特定词,并在确定房间1中的子设备已开始录音时,说出“告诉用户b吃饭了,用户b在房间2”。房间1中的子设备在检测到特定词之后,开始录音,生成声音信号,并传输至主机。主机根据获取的声音信号,确定语音分析请求,并将语音分析请求传输至云端服务器。云端服务器分析语音分析请求中的声音信号,分析结果显示该声音信号指示通知用户b吃饭且用户b在房间2。云端服务器根据分析结果,确定用于播放待播放的声音信号的子设备的标识信息为房间2的子设备的标识信息,且确定待播放的声音信号,播放该待播放的声音信号得到的声音是“吃饭了”。云端服务器根据房间2的子设备的标识信息和待播放的声音信号,确定第二响应信息,发送第二响应信息至主机。主机接收到第二响应信息后,确定选择的子设备为房间2的子设备,将待播放的声音信号作为第一响应信息,发送至房间2的子设备。房间2的子设备播放待播放的声音信号,使得用户b获得“吃饭了”的信息。

需要说明的是,以上仅为举例说明,并不对本发明的技术方案构成限定。

与现有技术相比,本实施方式中提供的语音交互方法,除此之外,多个子设备分别与主机通信连接,使得用户只需在多个子设备中的任意一个子设备附近,即可与主机进行交互,无需跑到主机所处空间,提高了用户体验。除此之外,多个子设备与一个主机通信连接,由同一主机来确定对各个子设备采集的声音信号的响应信息,相对于为每个子设备配置一个主机的方法,或,在不同空间放置多个智能音响的方法,降低了布设成本。由于主机需要与云端服务器或外部其他设备通信,以获取待播放的声音信号,多个子设备由同一主机与外部通信,相对于多个主机与外部通信的方法,降低了维护内部网络安全的难度和成本,能够更好的保护用户隐私安全。主机根据用户的位置信息,选择用于播放待播放的声音信号的子设备,避免了用户在发出语音后,移动至其他位置,导致用户无法获知到待播放的声音信号中的信息的问题。

本发明第三实施方式涉及一种语音交互方法,应用于云端服务器,如图3所示,包括以下步骤:

步骤301:获取主机传输的语音分析请求。

具体地说,语音分析请求中包括主机获取的声音信号,获取的声音信号为与主机连接的至少两个子设备中的至少一个子设备传输的声音信号。其中,主机根据获取的声音信号,确定语音分析请求,并传输语音分析请求至主机的过程可参考第一实施方式中的相关描述,此处不再赘述。

步骤302:根据语音分析请求,确定第二响应信息。

具体地说,第二响应信息中包括待播放的声音信号的存储位置信息或待播放的声音信号。云端服务器在接收到语音分析请求后,对语音分析请求中的获取的声音信号进行分析,从网络或内部存储中获取与获取的声音信号对应的待播放的声音信号,生成第二响应信息。或者,云端服务器获取与获取的声音信号对应的待播放的声音信号的存储位置信息,根据待播放的声音信号的存储位置信息,生成第二响应信息。

步骤303:发送第二响应信息至主机。

具体地说,主机获取第二响应信息,根据第二响应信息,对获取的声音信号进行响应。其中,主机对获取的声音信号的响应的过程可以参考第一实施方式中主机确定第一响应信息的过程的相关描述,此处不再赘述。

需要说明的是,以上仅为举例说明,并不对本发明的技术方案构成限定。

与现有技术相比,本实施方式提供的语音交互方法,主机获取的声音信号为与主机连接的至少两个子设备中的至少一个子设备传输的声音信号,说明多个子设备分别与主机通信连接,使得用户只需在多个子设备中的任意一个子设备附近,即可与主机进行交互,无需跑到主机所处空间,提高了用户体验。除此之外,多个子设备与一个主机通信连接,由同一主机来确定对各个子设备采集的声音信号的响应信息,相对于为每个子设备配置一个主机的方法,或,在不同空间放置多个智能音响的方法,降低了布设成本。除此之外,由于主机需要与云端服务器或外部其他设备通信,以获取待播放的声音信号,多个子设备由同一主机与外部通信,相对于多个主机与外部通信的方法,降低了维护内部网络安全的难度和成本,能够更好的保护用户隐私安全。

本发明的第四实施方式涉及一种语音交互方法,本实施方式是对第三实施方式的进一步细化,具体说明了步骤302。

具体的说,如图4所示,在本实施方式中,包含步骤401至步骤404,其中,步骤401和步骤404分别与第三实施方式中的步骤301和步骤303大致相同,此处不再赘述。下面主要介绍不同之处:

步骤401:获取主机传输的语音分析请求。

步骤402:根据传输获取的声音信号的子设备的标识信息,确定传输获取的声音信号的子设备的安装场景。

具体地说,语音分析请求中还包括传输获取的声音信号的子设备的标识信息,云端服务器中存储有子设备的标识信息与子设备的安装场景的对应关系。因此,云端服务器可以根据语音分析请求,确定传输获取的声音信号的子设备的安装场景。

步骤403:根据传输获取的声音信号的子设备的安装场景和获取的声音信号,确定第二响应信息。

具体地说,由于同一语句在不同场景中可能具有不同的语义,同一语义的语句在不同场景中,用户希望得到的结果可能也不同。因此,云端服务器结合传输获取的声音信号的子设备的安装场景,对获取的声音信号进行分析,可以提高获取的声音信号的分析结果的准确性。

例如,在获取的声音信号均指示用户需要听歌的情况下,当传输获取的声音信号的子设备的安装场景为卧室时,用户倾向于听助眠歌曲,云端服务器可以从互联网下载助眠歌曲作为待播放的声音信号,根据助眠歌曲确定第二响应信息;当传输获取的声音信号的子设备的安装场景为客厅时,用户倾向于听比较轻快的歌曲,云端服务器可以从互联网下载轻快的歌曲作为待播放的声音信号,根据轻快的歌曲确定第二响应信息。

步骤404:发送第二响应信息至主机。

需要说明的是,以上仅为举例说明,并不对本发明的技术方案构成限定。

与现有技术相比,本实施方式提供的语音交互方法,主机获取的声音信号为与主机连接的至少两个子设备中的至少一个子设备传输的声音信号,说明多个子设备分别与主机通信连接,使得用户只需在多个子设备中的任意一个子设备附近,即可与主机进行交互,无需跑到主机所处空间,提高了用户体验。除此之外,多个子设备与一个主机通信连接,由同一主机来确定对各个子设备采集的声音信号的响应信息,相对于为每个子设备配置一个主机的方法,或,在不同空间放置多个智能音响的方法,降低了布设成本。除此之外,由于主机需要与云端服务器或外部其他设备通信,以获取待播放的声音信号,多个子设备由同一主机与外部通信,相对于多个主机与外部通信的方法,降低了维护内部网络安全的难度和成本,能够更好的保护用户隐私安全。

上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。

本发明的第五实施方式涉及一种语音交互系统,如图5所示,包括:主机501,以及与主机501连接的至少两个子设备502;至少两个子设备502用于:采集环境中的声音,根据采集的声音,生成声音信号,将生成的声音信号传输给主机501;获取主机501传输的第一响应信息,第一响应信息中包括待播放的声音信号的存储位置信息或待播放的声音信号;根据第一响应信息,确定待播放的声音信号;根据待播放的声音信号,播放声音;主机501用于:获取与主机连接的至少两个子设备502中的至少一个子设备502传输的声音信号;根据获取的声音信号,确定对获取的声音信号的第一响应信息;从至少两个子设备502中选择子设备502,将第一响应信息传输至选择的子设备502。

需要说明的是,语音交互系统包括两个或多个子设备,图5中以2个子设备为例,本领域技术人员可以理解,本实施方式不限制子设备502的个数。

不难发现,本实施方式为与第一实施方式和第二实施方式相对应的系统实施例,本实施方式可与第一实施方式和第二实施方式互相配合实施。第一实施方式和第二实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式和第二实施方式中。

本发明的第六实施方式涉及一种语音交互系统,本实施方式是对第五实施方式的进一步改进,具体改进之处为:增加了云端服务器503。

具体地说,如图6所示,本实施方式中,语音交互系统还包括云端服务器503。本实施方式中,主机501具体用于:根据获取的声音信号,确定语音分析请求;将语音分析请求传输至云端服务器;获取云端服务器503返回的第二响应信息;根据第二响应信息,确定第一响应信息。云端服务器503用于:获取主机501传输的语音分析请求;根据语音分析请求,确定第二响应信息;发送第二响应信息至主机501;其中,第二响应信息中包括待播放的声音信号的存储位置信息或待播放的声音信号。

需要说明的是,语音交互系统还可以包括一个或多个检测设备,检测设备检测用户的位置信息,根据检测结果生成检测信息,传输至主机501。

不难发现,本实施方式为与第一实施方式和第二实施方式相对应的系统实施例,本实施方式可与第一实施方式和第二实施方式互相配合实施。第一实施方式和第二实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一实施方式和第二实施方式中。

值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。

本发明的第七实施方式涉及一种电子设备,如图7所示,包括:至少一个处理器601;以及,与至少一个处理器601通信连接的存储器602;以及,与至少两个子设备通信连接的通信组件603,通信组件603在处理器601的控制下接收和发送数据;其中,存储器602存储有可被至少一个处理器601执行的指令,指令被至少一个处理器601执行,以使至少一个处理器601能够执行如上述第一实施方式和第二实施方式提及的应用于主机的语音交互方法。

本发明的第八实施方式涉及一种云端服务器,如图8所示,包括:至少一个处理器701;以及,与至少一个处理器701通信连接的存储器702;以及,与主机通信连接的通信组件703,通信组件703在处理器701的控制下接收和发送数据;其中,存储器702存储有可被至少一个处理器701执行的指令,指令被至少一个处理器701执行,以使至少一个处理器701能够执行上述第三实施方式和第四实施方式提及的应用于云端服务器的语音交互方法。

本发明的第七实施方式和第八实施方式中,主机或云端服务器包括:一个或多个处理器以及存储器,图7和图8中以一个处理器为例。处理器、存储器可以通过总线或者其他方式连接,图7和图8中以通过总线连接为例。存储器作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。处理器通过运行存储在存储器中的非易失性软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述语音交互方法。

存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储选项列表等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至外接设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

一个或者多个模块存储在存储器中,当被一个或者多个处理器执行时,执行上述任意方法实施方式中的语音交互方法。

上述产品可执行本申请实施方式所提供的方法,具备执行方法相应的功能模块和有益效果,未在本实施方式中详尽描述的技术细节,可参见本申请实施方式所提供的方法。

本发明第九实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述第一实施方式和第二实施方式提及的语音交互方法。

本发明第十实施方式涉及一种计算机可读存储介质,存储有计算机程序。计算机程序被处理器执行时实现上述第三实施方式和第四实施方式提及的语音交互方法。

即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1