语音处理方法、设备和计算机可读存储介质与流程

文档序号:15166148发布日期:2018-08-14 17:30阅读:206来源:国知局

本公开的实施例总体上涉及电子设备,并且更具体地涉及用于与语音处理方法、设备和计算机可读存储介质。



背景技术:

目前市场上有很多蓝牙音箱,这些蓝牙音箱可以播放移动设备(例如,移动电话和音频播放设备等)内的音频资源。然而,这些蓝牙音箱不支持与用户的语音交互。另外,也有一些智能音箱产品,这些智能音箱产品可以与用户进行语音交互,并作为独立的控制中枢来使用。然而,这些智能音箱产品不支持与用户常用的移动电话缺乏很好的衔接和交互,降低了对这些智能音箱产品的使用频率。

有鉴于此,需要一种促进终端设备的互操作的电子设备。



技术实现要素:

本公开的实施例提供了一种用于与终端设备配合使用的电子设备和相关方法。

根据本公开的第一方面,提供了一种电子设备。该电子设备包括:麦克风,可操作以接收语音信息;第一通信模块,可操作以与服务器连接,并且被配置为将语音信息发送给服务器,以及从服务器接收基于语音信息而生成的控制指令;第二通信模块,可操作以与终端设备连接,并且被配置为向终端设备发送控制指令,以及从终端设备接收针对控制指令的音频响应;以及扬声器,可操作以播放音频响应。

根据本公开的第二方面,提供了一种在电子设备处实现的语音处理方法。该方法包括:响应于从用户接收到语音信息,将所述语音信息发送给服务器;从所述服务器接收基于所述语音信息而生成的控制指令;将所述控制指令发送给终端设备;从所述终端设备接收针对所述控制指令的音频响应;以及输出所述音频响应。

根据本公开的第三方面,提供了一种计算设备。所述计算设备包括:一个或多个处理器;以及存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现根据第二方面所述的方法。

根据本公开的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现根据第二方面所述的方法。

根据本公开的实施例,提供发明内容部分是为了简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或主要特征,也无意限制本公开的范围。

附图说明

通过结合附图对本公开示例性实施例进行更详细的描述,本公开的上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性实施例中,相同的参考标号通常代表相同部件。

图1示出了其中可以用于实现根据本公开的多个实施例的示例环境的示意图;

图2示出了根据本公开的一些实施例的电子设备的示意性框图;

图3示出了根据本公开的一些实施例的与终端设备进行交互的方法的流程图;以及

图4示出了根据本公开的一些实施例的启动与终端设备的交互的方法的流程图。

具体实施方式

下面将参照附图更详细地描述本公开的优选实施例。虽然附图中显示了本公开的优选实施例,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。

在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例实施例”和“一个实施例”表示“至少一个示例实施例”。术语“另一实施例”表示“至少一个另外的实施例”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其它明确的和隐含的定义。

图1示出了根据其中可以用于实现根据本公开的多个实施例的示例环境100的示意图。如图1所示,电子设备102可以与服务器104连接,以用于从服务器104接收数据,和/或向服务器104发送数据。例如,电子设备102可以通过wi-fi或蜂窝网络等无线连接与服务器104连接。备选地,电子设备102也可以通过有线连接与服务器104连接,以与服务器104进行通信。

如图1所示,电子设备102与终端设备106连接。终端设备106可以是各种移动终端或便携式设备,例如,移动电话、平板电脑、便携式多媒体设备等。例如,电子设备102可以通过蓝牙、低功耗蓝牙等与终端设备106进行连接,以用于从终端设备106接收数据,和/或向终端设备106发送数据。例如,电子设备102可以是音箱,例如智能音箱,并且电子设备102也可以是用于承载终端设备106的基座。在一个实施例中,电子设备102是可以对终端设备106进行无线充电的基座,其可以执行智能音箱的至少部分功能。然而,应当理解,基座、智能音箱等仅仅作为示例提供,电子设备102也可以以其他合适的形态来呈现。

图2示出了根据本公开的一些实施例的电子设备102的示意性框图。应当理解,图2的各个模块仅以示例性的方式给出,并不限制本公开的范围,本领域技术人员可以对图2中的模块进行添加、删除或修改。

如图2所示,电子设备102可以包括麦克风204,麦克风204可以是由多个麦克风形成的麦克风阵列。麦克风阵列可以实现远场拾音功能。例如,用户可能与麦克风的距离较远,并且真实环境存在大量的噪声、多径反射和混响。在这种情况下,麦克风阵列可以更好地拾取语音信息,提高语音识别率。

如图2所示,电子设备102包括第一通信模块208,第一通信模块208可以与服务器104连接。例如,第一通信模块208可以是wi-fi通信模块或蜂窝通信模块。电子设备102可以通过wi-fi或蜂窝网络等无线连接与服务器104连接。备选地,第一通信模块208可以是支持有线通信的通信模块。第一通信模块208可以将麦克风204接收或采集的语音信息发送给服务器104,以及从服务器104接收基于语音信息而生成的控制指令。

如图2所示,电子设备102还包括第二通信模块210,第二通信模块210可以与终端设备106连接,并且向终端设备106发送从服务器106接收的控制指令。第二通信模块210可以从终端设备106接收针对该控制指令的音频响应。扬声器206可以播放或输出该音频响应。在一个具体示例中,第二通信模块210是蓝牙通信模块。

例如,控制指令是针对终端设备106的操作系统的指令。因此,用户可以直接调取终端设备106的各种功能,例如,拨打电话、播放音乐等功能。在这种情况下,用户在进行交互之前无需操作终端设备106打开相应的应用。例如,如果用户希望播放某个音乐,那么用户无需打开终端设备106中的音乐播放器也可以通过控制指令打开音乐播发器来播放该音乐。以这种方式,用户无需持有终端设备106即可实现终端设备106的各种功能。例如,如果电子设备102可以是对终端设备106进行充电的基座,则用户将终端设备106放置在电子设备102处对终端设备106进行充电时,也可以通过电子设备102对终端设备106进行操作。

在一些实施例中,电子设备102可以是无显示器设备,从而具有相对较低的制造成本。另外,如上所述,电子设备102可以是用于承载终端设备106的基座,用于对终端设备106进行充电等。

在一些实施例中,电子设备102还可以包括近场通信模块212,该近场通信模块212被配置为存储第二通信模块210的配置信息。如果确定终端设备在电子设备的预定距离范围内,近场通信模块212将配置信息发送到终端设备106,以使得电子设备102与终端设备106配对。例如,在第二通信模块210是蓝牙通信模块的情况下,电子设备102与终端设备106经由蓝牙配对。

在一些实施例中,电子设备102还可以包括控制器202,控制器202可以是处理器(例如,通用处理器)或控制电路系统。控制电路系统可以是专用集成电路(asic),也可以是现场可编程门阵列(fpga)等可编程电路。例如,控制器202可以控制麦克风204、扬声器206、第一通信模块208、第二通信模块210、近场通信模块212和无线充电模块214中的一个或多个的开启和关闭。在一些实施例中,如果电子设备102与终端设备106配对成功,则控制器202可以开启麦克风204、扬声器206和第一通信模块208。在这种情况下,用户可以通过麦克风204向电子设备102输入语音信息,并且第一通信模块208可以与服务器104进行连接。

在一些实施例中,电子设备102还包括无线充电模块214,无线充电模块214被配置为对终端设备106进行充电。无线充电模块214可以检测终端设备106的电量,并且当检测到的电量达到阈值时,停止充电功能,当检测到的电量小于阈值时,开启充电功能。附加地或备选地,电子设备102也可以有线充电模块(未示出),用于对终端设备106进行充电。电源216可以与无线充电模块214连接,以向无线充电模块214提供电力。

根据本公开的实施例,用户通过与智能音箱等电子设备进行交互,可以方便快捷地接入并接管移动终端的控制系统。例如,在智能音箱具有近场通信功能和无线充电功能的情况下,用户可以在对移动终端进行充电的同时,将移动终端通过蓝牙方便快捷地连接到音箱。音箱通过蓝牙来接管对移动终端的控制,又通过音箱的麦克风阵列和功放麦克风,实现对移动终端的远程语音控制,从而实现智能交互音箱与移动终端方便快捷的组合使用。

图3示出了根据本公开的一些实施例的与终端设备进行交互的方法300的流程图。方法300可以在图1或图2所示的电子设备102处实现。电子设备102可以是无显示器设备。在框302,电子设备102接收语音信息。例如,电子设备102可以通过麦克风204(例如,麦克风阵列)来接收语音信息。例如,语音信息可以是“打电话给爱丽丝”。

在框304,电子设备102将语音信息发送给服务器104。在一个实施例中,电子设备102通过wi-fi或蜂窝网络将语音信息发送给服务器104。例如,电子设备102可以通过第一通信模块208将语音信息发送给服务器104。服务器104可以对语音信息进行识别,并生成与该语音信息相关联的针对终端设备106的控制指令,并将其发送回电子设备102。

在框306,电子设备102从服务器104接收控制指令。在一个实施例中,电子设备102通过wi-fi或蜂窝网络从服务器104接收控制指令。例如,电子设备102可以通过第一通信模块208从服务器104接收控制指令。例如,控制指令可以是针对终端设备106的操作系统的控制指令。

在框308,电子设备102将控制指令发送给终端设备106。例如,电子设备102可以通过第二通信模块210将控制指令发送给终端设备106。如上所述,第二通信模块210可以是蓝牙通信模块。控制指令将对终端设备106进行操作,例如,打开拨号应用,并拨打爱丽丝的电话。在这种情况下,终端设备106可以向电子设备102发送音频响应。例如,在拨打电话的示例中,可以是被叫的彩铃。

在框310,电子设备102从终端设备106接收音频响应。例如,电子设备可以通过第二通信模块210从终端设备106接收音频响应。

在框312,电子设备106输出音频响应。例如,电子设备106可以通过麦克风(例如,麦克风阵列)来播放或输出该音频响应。

在一些实施例中,还可以以无线方式对终端设备106进行充电。例如,电子设备102可以是用于承载终端设备106的基座。

图4示出了根据本公开的一些实施例的用于开启与终端设备的交互的方法400的流程图。方法400可以在电子设备102处实现。在框402,电子设备102检测终端设备是否在预定距离范围内。例如,电子设备102可以利用近场通信模块212来检测终端设备是否在预定距离范围内。如果确定终端设备104在电子设备102的预定距离范围内,则在框404,电子设备102向终端设备104发送第二通信模块210的配置信息。终端设备104在接收到该配置信息之后,可以将电子设备102与其进行配对。在框406,电子设备102判断配对是否成功。如果配对成功,则电子设备102在框408开启麦克风204、扬声器208和第一通信模块208。在这种情况下,用户可以通过电子设备102与终端设备106进行交互,例如,接收语音信息、将语音信息发送给服务器和/或输出音频响应。

本公开的实施例涉及方法、设备、系统和/或计算机可读存储介质,该计算机可读存储介质上载有用于执行本公开的各个方面的计算机可读程序指令。

附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所公开的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文公开的各实施例。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1