语音控制方法、装置及电子设备与流程

文档序号:16236723发布日期:2018-12-11 22:40阅读:238来源:国知局
语音控制方法、装置及电子设备与流程

本申请主要涉及通信技术领域,更具体地说是涉及一种语音控制方法、装置及电子设备。

背景技术

近年来,随着人工智能(artificialintelligence,ai)在语言识别、自然语言处理等领域的研究,使得语音识别系统被广泛应用到如手机、电脑、家居设备等电子设备。如电子设备安装语音助手,用户可以利用语音助手,实现对电子设备的语音控制。

然而,现有电子设备借助语音助手实现的语音控制,在接收到本地用户或其他设备发起的语音控制指令后,将直接执行语音控制指令,实现对电子设备语音控制,若非法用户发起语音控制指令,很容易导致电子设备使用者的个人隐私或重要信息等泄露,降低了电子设备的使用安全性。



技术实现要素:

有鉴于此,本发明提供了一种语音控制方法、装置及电子设备,在双方电子设备通信过程中,将利用ai技术对对方的语音信息进行语义分析,并在必要时提示本用户是否直接响应该语音信息,避免直接响应,影响本用户电子设备的安全性。

为了实现上述目的,本申请提供了以下技术方案:

本发明实施例提供了一种语音控制方法,应用于第一电子设备,所述方法包括:

在与第二电子设备通信过程中,获取第二电子设备使用者的语音信息;

基于对所述语音信息的语义分析结果,输出响应提示信息,所述响应提示信息用于提示所述第一电子设备使用者确定,是否由所述第一电子设备执行所述语义分析结果指示的第一操作指令;

接收到所述第一电子设备使用者对所述响应提示信息的确认指令,执行所述第一操作指令,并输出所述第一电子设备对所述第一操作指令的执行过程。

可选的,所述基于对所述语音信息的语义分析结果,输出响应提示信息,包括:

对所述语音信息进行语义分析,得到语义分析结果;

若所述语义分析结果表明所述语音信息符合预设提示条件,输出响应提示信息;

若所述语义分析结果表明所述语音信息不符合预设提示条件,执行所述语义分析结果指示的第一操作指令。

可选的,所述方法还包括:

接收所述第二电子设备发起的通信请求;

基于对所述通信请求的分析结果,输出通信提示信息,所述通信提示信息用于提示第一电子设备使用者确定是否由所述第一电子设备的语音服务处理所述通信请求;

接收到所述第一电子设备使用者对所述通信提示信息的确认指令,控制所述第一电子设备进入语音服务处理模式,并响应所述通信请求。

可选的,所述方法还包括:

接收所述第二电子设备发起的通信请求;

在预设时间段内未接收到所述第一电子设备使用者对所述通信请求的响应指令,唤醒所述第一电子设备的语音服务,使得所述第一电子设备进入语音服务处理模式,响应所述通信请求。

可选的,在所述方法还包括:

响应控制指令,控制所述第一电子设备由语音服务处理模式切换到人工处理模式,并停止执行所述第一操作指令,所述控制指令是针对输出的所述第一操作指令的执行过程生成的;

接收所述第一电子设备使用者基于所述语音信息输入的第二操作指令,执行所述第二操作指令。

可选的,所述方法还包括:

输出所述第二电子设备发起的通信请求,以及获取的所述第二电子设备使用者的语音信息。

可选的,所述方法还包括:

接收到所述第一电子设备使用者对所述响应提示信息的否定指令,获取与所述语义分析结果关联的预设响应信息;

将所述预设响应信息反馈至所述第二电子设备。

本发明实施例还提供了一种语音控制装置,应用于第一电子设备,所述装置包括:

语音信息获取模块,用于在与第二电子设备通信过程中,获取第二电子设备使用者的语音信息;

提示模块,用于基于对所述语音信息的语义分析结果,输出响应提示信息,所述响应提示信息用于提示所述第一电子设备使用者确定,是否由所述第一电子设备执行所述语义分析结果指示的第一操作指令;

操作指令执行模块,用于接收到所述第一电子设备使用者对所述响应提示信息的确认指令,执行所述第一操作指令,并输出所述第一电子设备对所述第一操作指令的执行过程。

可选的,所述提示模块包括:

语义分析单元,用于对所述语音信息进行语义分析,得到语义分析结果;

提示单元,用于当所述语义分析结果表明所述语音信息符合预设提示条件,输出响应提示信息;

操作指令执行单元,用于当所述语义分析结果表明所述语音信息不符合预设提示条件,执行所述语义分析结果指示的第一操作指令。

本发明实施例还提供了一种电子设备,所述电子设备包括:

通信模块;显示器;

存储器,用于存储实现如上所述的语音控制方法的程序;

处理器,用于加载并执行所述存储器存储的程序,所述程序用于:

在与第二电子设备通信过程中,获取第二电子设备使用者的语音信息;

基于对所述语音信息的语义分析结果,输出响应提示信息,所述响应提示信息用于提示所述第一电子设备使用者确定,是否由所述第一电子设备执行所述语义分析结果指示的第一操作指令;

接收到所述第一电子设备使用者对所述响应提示信息的确认指令,执行所述第一操作指令;

控制所述显示器输出所述第一电子设备对所述第一操作指令的执行过程。

由此可见,与现有技术相比,本申请提供了一种语音控制方法、装置及电子设备,在第一电子设备与第二电子设备通信时,第一电子设备获取第二电子设备使用者的语音信息后,本实施例将基于对该语音信息的语义分析结果,来提示第一电子设备使用者确定是否由第一电子设备执行该语义分析结果指示的操作指令,即提醒第一电子设备使用者是否允许第一电子设备受第二电子设备语音控制,当第一电子设备使用者确认后,才允许第一电子设备执行操作指令,即响应第二电子设备发起的语音控制,相对于现有的电子设备接收到语音控制指令,未输出任何提示直接执行的方法,提高了电子设备使用的安全性。

并且,本实施例第一电子设备还会监控其执行操作指令的过程,一旦第一电子设备使用者发现该执行过程异常,能够随时进行人工干预,进一步提高了对电子设备进行语音控制的安全性及可靠性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种语音控制方法的流程示意图;

图2a为本发明实施例提供的一种实现语音控制方法的语音控制系统结构示意图;

图2b为本发明实施例提供的另一种实现语音控制方法的语音控制系统结构示意图;

图3为本发明实施例提供的另一种语音控制方法的流程示意图;

图4为本发明实施例提供的另一种语音控制方法的流程示意图;

图5为本发明实施例提供的又一种语音控制方法的流程示意图;

图6为本发明实施例提供的一种语音控制方法的信令流程示意图;

图7为本发明实施例提供的一种语音控制方法的场景流程示意图;

图8本发明实施例提供的一种语音控制装置的结构示意图;

图9本发明实施例提供的另一种语音控制装置的结构示意图;

图10本发明实施例提供的另一种语音控制装置的结构示意图;

图11本发明实施例提供的又一种语音控制装置的结构示意图;

图12本发明实施例提供的一种电子设备的硬件结构示意图。

具体实施方式

本发明的发明人发现:对于市场上的具有语音识别功能,能够使用语音助手的电子设备,如目前大部分的智能手机,电子设备接收到语音控制指令,都是直接响应该语音控制指令,并不需要用户进一步确认,降低了电子设备的使用安全性。

为了改善上述问题,本发明的发明人提出电子设备使用语音助手进行控制之前,增加用户确认步骤,如用户a与用户b通话过程中,用户b向用户a的手机或与用户a的手机关联的其他设备发起语音控制指令,用户a的手机并不会直接响应用户b的语音控制指令,而是要提示用户a,当前用户b给我了语音控制指令,是否由用户a手机的语音助手托管自动响应,用户确认由语音助手托管后,用户a的手机才会响应用户b发起的语音控制指令,避免了对用户b发起的语音控制指令不做任何提示,很容易在用户a不注意情况下,用户a的手机直接执行用户b发送的非法控制指令,损害用户a的个人利益等。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参照图1,为本发明实施例提供的一种语音控制方法的流程示意图,该方法可以应用于第一电子设备,如手机、笔记本电脑、平板电脑等能够进行语音交互的用户设备,且该第一电子设备能够安装语音助手(即一种应用程序),通过语音助手识别用户发起的语音控制指令,控制第一电子设备执行相应的操作,本实施例对该语音助手的工作原理不做详述。

如图1所示,本实施例提供的该语音控制方法可以包括但并不局限于以下步骤:

步骤s11,在与第二电子设备通信过程中,获取该第二电子设备使用者的语音信息;

在本实施例中,第一电子设备接收到第二电子设备的通信请求后,可以由第一电子设备使用者手动操作,接受该通信请求,以使得第一电子设备与第二电子设备建立通信连接,第一电子设备使用者与第二电子设备使用者可以通过建立的通信通道进行语音交互。

或者,本发明也可以在第一电子设备的来电界面启动语音助手,用户选择或经过预设时间自动确定,是否由该语音助手处理来电,即选择第一电子设备进入语音服务处理模式,之后,响应第二电子设备发起的通信请求。

需要说明,关于在什么情况下,如何建立第一电子设备和第二电子设备之间的通信连接,以使得这两个电子设备使用者能够进行语音通信的实现方法不做限定,具体可以参照下文相应实施例的描述。

其中,本实施例获取的第二电子设备使用者的语音信息可以是,第二电子设备使用者与第一电子设备使用者语音交流的内容,可以包括针对当前话题的普通交流内容,也可以包括第二电子设备使用者指导第一设备使用者,如何使用第一电子设备完成某操作的操作指令,本发明对上述获取的第二电子设备使用者的语音信息内容不做限定。

步骤s12,基于对该语音信息的语义分析结果,输出响应提示信息;

其中,该响应提示信息可以用于提示第一电子设备使用者确定是否由第一电子设备执行该语义分析结果指示的第一操作指令。

本实施例中,第一电子设备得到第二电子设备使用者的语音信息后,为了避免遗漏第二电子设备使用者发起的语音指令,通常会对该语音信息进行语义分析,以得到相应的语义分析结果,本发明对该语义分析的具体实现方法不做限定,本实施例可以采用人工智能(artificialintelligence,ai)技术中的语音识别技术和自然语言处理技术实现。

可选的,对语音信息的语义分析过程可以包括先利用语音识别技术,识别出语音信息的信息内容,再利用自然语言技术对该信息内容进行语义理解,以便据此给出要回复的内容,或者需要进行的某些操作(如发送照片、查看日历、播放xx视频等),对于回复的内容,通常需要将其合成语音信号后再反馈给对方输出,本发明对上述涉及到的语音识别、语义分析、语音合成等操作的具体实现方法不做详述,可以依据ai技术在智能语音交互方面的应用原理确定。

经过对第二电子设备使用者的语音信息进行语义分析,得到语义分析结果可以包括该语音信息的内容、该内容还可能涵盖的针对第一电子设备或其关联的其他设备的语音控制指令等,本实施例对该语义分析结果包含的内容不做限定。

若上述语义分析结果包含上述语音控制指令,即能够指示第一电子设备执行的第一操作指令,该第一操作指令与该语音控制指令对应,能够被第一电子设备识别并执行,本实施例为了避免第一电子设备直接执行该第一操作指令,造成第一电子设备重要信息的泄露,或者对当前场景造成干扰等,本实施例可以输出响应提示信息,来提醒第一电子设备使用者决定是否由第一电子设备执行第一操作指令。

其中,响应提示信息可以包含第一操作指令或其所执行的操作提示内容,并包含“确认”、“取消”等字样内容,以供用户选择是否响应第二电子设备使用者发起的语音控制指令。本实施例对该响应提示信息的内容不做限定。

步骤s13,接收到第一电子设备使用者对该响应提示信息的确认指令,执行第一操作指令;

结合上文对响应提示信息的分析,第一电子设备使用者可以根据实际需求,选择接受或不接受第二电子设备使用者的语音控制,若选择接受,如用户选择响应提示信息所在提示界面中的“确认”按钮(也可以是表示接受第二电子设备使用者语音控制的其他字样的按钮),可以产生第一电子设备使用者对该响应提示信息的确认指令,第一电子设备接收到确认指令,可以执行第一操作指令,以使第一电子设备完成相应的操作。

如第二电子设备使用者向第一设备发送的语音信息内容为“请第一电子设备使用者发送一张出席某活动的照片”,按照上述分析过程,对该语音信息进行语义分析,得到的语义分析结果可以包括该语音信息的文字内容,也可以包括查找某活动照片指令,以及将查找到的照片反馈至第二电子设备的指令。可见,本实施例上述第一操作指令可以包括至少一个指令,当然,若包含多个指令,这多个指令也可以融合为一个操作指令。

在确定上述语义分析结果指示的操作指令后,得知第二电子设备使用者要求获取的是照片,其涉及到了个人隐私,可以按照上述方式输出响应提示信息。如,是否允许查询并反馈某活动的照片,如果允许,第一电子设备可以响应上述内容的第一操作指令,由第一电子设备的语音助手,从其存储器中查找符合该要求的照片,之后,将该照片发送至第二电子设备输出。

在上文举例中,若不允许查询并反馈某活动照片,第一电子设备语音助手可以从预存的预设响应信息中,查找与该语义分析结果关联的预设响应信息反馈至第二电子设备,如不能发送照片,可以回复“抱歉,由于某活动照片保密,不方便公开”等内容的信息。本实施例对预设响应信息的内容不做限定。

需要说明的,按照图2a和图2b所示的语音控制方法的应用场景示意图,上述第一操作指令可以包括启动第一电子设备的某应用,并控制该应用输出特定信息的指令(如第二电子设备使用者语音控制第一电子设备启动音乐软件,播放某音乐),或查找该应用存储的特定信息,并反馈至第二电子设备的指令(如第二电子设备使用者语音控制第一电子设备查找某个或类照片,并反馈至第二电子设备),或配置特定信息还可以包括调整第一电子设备的配置信息的指令(如第二电子设备使用者语音控制第一电子设备完成闹钟的设定),或下载并按照某应用的指令,还可以包括触发某控制程序,以实现对其他设备控制的指令(如第二电子设备使用者语音控制第一电子设备,实现对第一电子设备关联的智能家居设备的控制,如调解室内灯光亮度,控制智能音箱播放广播等)等。

可见,第一电子设备执行第一操作指令,可以是第一电子设备自身执行某操作,仅作用于第一电子设备自身,也可以进一步实现对与该第一电子设备关联的其他设备,对于后者,第一电子设备相当于一个能够控制至少一个其他设备的控制设备,该控制设备接收到的控制信号来源于第二电子设备使用者的语音信息,当然,其也可以来源于第一电子设备使用者语音信息,本实施例主要对第二电子设备使用者如何在通信过程中,语音控制第一电子设备或其关联的其他设备的方案进行描述。

步骤s14,输出第一电子设备对第一操作指令的执行过程。

在本实施例上文各步骤描述的情况下,是允许第一电子设备的语音助手进行语音控制的托管,即替代第一电子设备使用者亲自手动操作第一电子设备,直接由语音助手响应接收到的语音控制指令,其包括上述第一操作指令以及第一电子设备使用者发出的语音控制指令。

其中,第一电子设备在执行第一操作指令的过程中,第一电子设备显示屏可以随着操作进度输出相应的操作界面或查询结果等,也就是说,第一电子设备执行第一操作指令时,可以同步输出其对第一操作指令的执行过程,即监控第一电子设备的语音助手响应第二电子设备使用者语音控制指令的过程,从而使第一电子设备使用者能够直观得知第二电子设备使用者有什么控制要求,以及第一电子设备执行了什么操作等。

可选的,在用户观看第一电子设备输出对第一操作指令的执行过程中,若操作有误、操作不当或因临时变更需求等原因,需要中断或更改该执行过程,第一电子设备使用者可以随着对第一电子设备进行手动干预,如手动接管第二电子设备的来电,由第一电子设备使用者本人亲自回复,及手动对第一设备进行操作,将第二电子设备使用者要求的某活动的照片发送给第二电子设备。

进一步地,本实施例还可以对上文描述的第一电子设备与第二电子设备进行通信过程中,双方的语音信息、以及双方电子设备对得到的操作指令的执行过程进行记录。可见,这相对于传统来电历史记录,即仅记录来电号码及来电时间的历史通话记录,本实施例的第一电子设备使用者能够根据记录内容,不仅能够得知其不在第一电子设备身边期间,第一电子设备接收到哪些第二电子设备的通信请求,还能够得知各第二电子设备使用者通过语音控制方式,控制第一电子设备执行了哪些操作,以便第一电子设备据此进行后续处理。

综上所述,本实施例中,在第一电子设备与第二电子设备通信过程中,第一电子设备接收到第二电子设备使用者的语音信息后,将会利用ai技术在语音识别和自然语言处理上的应用,对该语音信息进行语义分析,并基于语义分析结果,输出响应提示信息,以使得第一电子设备使用者能够得知第二电子设备使用者,对第一电子设备或其关联设备的控制内容,并据此决定是否允许第一电子设备的语音助手,自动响应语义分析结果指示的第一操作指令,如果第一电子设备使用者允许,说明第二电子设备使用者本次对第一电子设备或其关联设备的控制不存在安全隐患,第一电子设备可以执行第一操作指令,解决了现有技术中第一电子设备得到语音信息包含的操作指令后,不做任何提示,直接按照预先针对该第二电子设备使用者设定的规则,执行该操作指令,很容易造成第一电子设备安全隐患的问题。

且,本实施例的第一电子设备还会同步显示对第一操作指令的执行过程,以使得第一电子设备使用者直观看到该执行过程,若执行过程出现异常,能够及时进行人工干预,保证第一电子设备能够可靠且准确响应第二电子设备使用者的语音信息。

基于上述实施例描述的本发明语音控制方法的核心构思,参照图3,示出了本发明另一实施例提供的语音控制方法的流程图,该方法可以是上述实施例步骤s12的一种具体实现方式,但并不局限于本实施例描述的这一种实现方式,如图3所示,该方法可以包括但并不局限于以下步骤:

步骤s21,在与第二电子设备通信过程中,获取第二电子设备使用者的语音信息;

关于步骤s21的实现过程可以参照上述实施例步骤s11的描述。

步骤s22,对该语音信息进行语义分析,得到语义分析结果;

如上文分析,本实施例对该语义分析可以利用ai技术在语音识别和自然语言处理方面的应用原理实现,关于语音识别及自然语言处理技术的对语音信号的具体处理过程,以及对得到的语义分析结果包含的内容也不作限定。关于语义分析的内容可以参照上述实施例相应部分的描述。

步骤s23,基于该语义分析结果,验证该语音信息是否符合预设提示条件,如果是,进入步骤s24;如果否,执行步骤s26;

其中,预设提示条件可以是指示该语音信息包含安全隐患、骚扰关键字等内容的条件,可以通过检测是否符合预设提示条件,来判断第二电子设备使用的语音信息包含的语音控制指令是否安全,第一电子设备响应该语音控制指令是否存在安全隐患等。

需要说明,本实施例对上述预设提示条件的内容不做限定,可以根据第一电子设备的历史通话记录、第三方获得的通话标记信息、第一电子设备针对不同来源通信请求的处理规则等内容,来确定该预设提示条件的内容。

步骤s24,输出响应提示信息;

如上文分析,确定本次接收到的语音信息符合预设提示条件,说明本次接收到的语音信息存在安全隐患,因此,输出响应提示信息,用于提示第一电子设备使用者确定,是否由第一电子设备执行语义分析结果指示的第一操作指令。

步骤s25,判断是否接收到第一电子设备使用者对响应提示信息的确认指令,如果是,进入步骤s26;如果否,执行步骤s27;

结合上述对响应提示信息的确认指令的分析,本实施例在第一电子设备选择由其语音助手处理通信信息后,才允许第一电子设备语音助手对该语音信息进行处理。

因此,本实施例可以监测是否第一电子设备接收到第一电子设备使用者对响应提示信息的确认指令,具体可以获取第一电子设备使用者对当前显示的响应提示信息的选择操作生成的指令,来判断该指令是否为确认指令,但并不局限于这一种方式。

步骤s26,执行语义分析结果指示的第一操作指令;

本实施例中,第一操作指令实际是从第二电子设备使用者的语音信息中分析得到的,即为第二电子设备使用者对第一电子设备或其关联设备发起的语音控制指令,本实施例对该第一操作指令的获取方式不做限定。

可选的,本实施例还可以输出第一电子设备对该第一操作指令的执行过程,以及获取的第二电子设备使用者的语音信息等内容,以供第一电子设备使用者监控其语音助手的工作内容。

步骤s27,获取与语义分析结果关联的预设响应信息;

步骤s28,将预设响应信息反馈至第二电子设备。

其中,该预设响应信息可以包括针对不同内容类型的语音信息,设定的应答内容,如抱歉,我稍后给您回电话;抱歉,我正在开会;我正在开会,请稍候再给我打电话;我正在路上;非常感谢等等。本实施例对该预设响应信息内容不做限定。

本实施例经过上述对语音信息的语义分析后,可以结合智能语义理解,从存储的多个预设响应信息中,选出与该语义分析结果相匹配的预设响应信息,具体选择过程不做详述。

可选的,本实施例可以从接收到第二电子设备发起的通信请求开始,就记录第一电子设备与第二电子设备之间的语音交互内容,以及第一电子设备响应第二电子设备使用者的语音信息的过程,以供第一电子设备使用者后续进行查询。

需要说明,上述第一电子设备可以是通信请求发起方,也可以是接收方,也就是说,对于通信双发来说,接收到对方的语音信息后,都可以按照上述实施例描述的方法进行处理,即通信双方可以通过语音操作对方设备执行相应操作,同时被操作的设备可以展示其执行对方发送的语音控制指令的过程,即展示对方对本设备的操作,以使本设备用户对操作过程进行监控,根据实际情况,随时进行人工干预。

综上,本实施例中,在第一电子设备使用其语音助手响应第二电子设备发送的语音信息之前,将利用ai技术对该语音信息进行语义分析,并依据语音分析结果,智能提醒第一电子设备使用者是否响应接收到的语音信息,在第一电子设备使用者允许的情况下,才会由语音助手执行语义分析结果指示的第一操作指令,即执行第二电子设备使用者发出的语音控制指令;反之,语音助手将基于语义分析结果,向第二电子设备反馈预设响应信息作为应答回复。

其中,上述实施例提及到的语音助手,实际上可以是利用ai技术实现的智能语音交互应用,其能够通过对通信对方的语音进行实时识别,智能理解,合成应答语音来与对方进行语音交互,本地用户可以不同发声也能够实现与对方的语音通信,本发明对语音助手如何利用ai技术实现双方语音交互的具体实现方法不作详述。

可见,本实施例第一电子设备的语音助手能够替代用户执行第二电子设备使用者发出的语音控制指令,或对第二电子设备使用者的语音信息内容进行应答,这样,即便第一电子设备使用者不方便说话或不在第一电子设备附近的情况下,第一电子设备也能够与第二电子设备使用者进行语音通信,满足第二电子设备使用者的语音通信要求。

而且,第一电子设备会在响应语音信息之前,提醒第一电子设备使用者对方的语音信息内容是什么,是否要响应相应的操作指令,如果允许响应,第一电子设备才会执行该操作指令,避免了不作任何提示,由第一电子设备直接响应通信对方发送的语音信息,导致第一电子设备重要信息泄露,或执行不当操作等情况的发生。也就是说,本实施例在提高电子设备使用便利性的同时,保证了电子设备使用的安全性。

在本发明一可选实施例中,电子设备中的语音助手可以在接收到其他电子设备发起的通信请求中,确定启动或不启动,具体实现过程可以参照图3所述的该可选实施例提供的语音控制方法的流程图,该方法仍可以应用第一电子设备,如图4所示,该方法可以包括但并不局限于以下步骤:

步骤s31,接收第二电子设备发起的通信请求;

在实际应用中,该通信请求可以是来电请求、使用社交应用软件发起的语音通话请求或视频通话请求等等,该通信请求可以包括第二电子设备的属性信息,如第二电子设备使用者的姓名,第二电子设备发起该通信请求使用的电话号码、使用社交软件发起通信请求的账号信息等等,以便第一电子设备将该通信请求中携带的该信息展示在请求通信界面,即来电界面、语音请求界面、视频请求界面等等。

可选的,第一电子设备接收到第二电子设备发起的通信请求后,通常会输出相应的请求界面,通过该请求界面展示第二电子设备及其使用者相关信息,还可以展示第一电子设备使用者对该第二电子设备或其使用者设定的标记信息,如推销、广告、快递等等。

步骤s32,对该通信请求进行分析,得到分析结果;

结合上文对接收到的通信请求的内容及其输出方式的描述,对其进行分析得到的分析结果可以包括:第二电子设备和/或其使用者的属性信息,如标记信息、账户信息、来电号码、备注昵称等等。

可选的,上述分析结果还可以包括对这些内容进行的安全隐患分析,即根据通信请求携带的内容,确定该第二电子设备发起的通信请求是否为骚扰或诈骗请求等等。

步骤s33,基于该分析结果输出通信提示信息;

如上文对通信请求内容及其分析结果的描述,可知本实施例得到的分析结果能够表征第二电子设备发起的通信请求为骚扰/推销类型的客服来电请求,或者为预设的重要用户发起的通信请求,或者为普通朋友发起的通信请求,或者为陌生用户发起的通信请求等等,因此,第一电子设备可以基于该分析结果,输出是否将该通信请求托管给第一电子设备的语音助手的通信提示信息。

可见,本实施例输出的通信提示信息可以用于提示第一电子设备使用者确定,是否由第一电子设备的语音服务(即语音助手提供的服务)处理该通信请求。

进一步地,本实施例还可以结合第一电子设备的通讯录、响应通信请求的历史记录等信息,基于不同类型通信请求的处理规则,给出本次通信请求是否托管给语音助手的建议。如对于上文列举的客服电话,可以建议第一电子设备使用者托管给语音助手应答;对于重要用户的来电,可以建议不托管给语音助手应答,而由第一电子设备使用者亲自手动应答;对于普通用户(如普通朋友、同事等),可以根据第一电子设备使用者以往的响应习惯给出建议,确定第一电子设备采用什么模式应答该通信请求。

可选的,对于上述通信提示信息可以直接显示在第一电子设备的显示屏,也可以采用预设提示音进行展示,或采用语音播放方式输出,本实施例对其输出方式不做限定。

步骤s34,接收到第一电子设备使用者对通信提示信息的确认指令,控制第一电子设备进入语音服务处理模式,并响应该通信请求。

与上文实施例步骤s13描述的确认指令产生过程类似,在输出上述通信提示时,也可以输出供第一电子设备使用者选择的“是”、“否”等字样的按钮,当用户选择“是”这个按钮,即第一电子设备确定将本次通信请求托管给语音助手,可以生成相应的确认指令,以使得第一电子设备接收到该确认指令后,控制第一电子设备进入语音服务处理模式,即启动语音助手,响应本次接收到的第二电子设备发起的通信请求。

需要说明,本实施例对语音助手如何响应该通信请求的实现方法不做限定,语音助手响应该通信请求后,将会使得第一电子设备与第二电子设备进行通信,在此期间,可以由第一电子设备的语音助手对第二电子设备使用者的语音信息进行实时识别,语义理解,并合成应答语音反馈至第二电子设备。

所以说,对于将通信请求托管给语音助手的第一电子设备,即进入语音服务处理模式的第一电子设备,不需要第一电子设备使用者亲自与第二电子设备使用者进行语音交流,这样,当第一电子设备使用者不再第一电子设备附近,或不方便、不愿意等原因,不能亲自手动接受第二电子设备的通信请求的情况下,能够利用第一电子设备的语音助手及时处理该通信请求,避免第二电子设备使用者因无人应答而长时间等待。

且,结合上文实施例对通信过程中语音助手的处理方法的描述,本实施例的第一电子设备还可以实时输出第一电子设备的语音助手对通信请求的应答过程,及其对第二电子设备使用者的语音信息的响应过程,保护其能够及时对本次语音通信进行人工干预。

需要说明,第一电子设备响应第二电子设备发起的通信请求后,会建立该第一电子设备与第二电子设备之间的通信连接,以使两者的使用者通过该通信连接进行语音交互,关于第一电子设备与第二电子设备通信过程中的语音控制方法,可以参照上述实施例的描述。

在本发明提供的另一可选实施例中,与上文实施例描述的确定第一电子设备与第二电子设备进行通信的方法不同,本实施例可以自动确定是否将本次接收到的通信请求托管给语音助手,如图5所示,具体实现步骤如下:

步骤s41,接收第二电子设备发起的通信请求;

其中,步骤s41的实现方法可以与上述步骤s31获取通信请求的实现方法类似,本实施例不再赘述。

步骤s42,在预设时间段内未接收到第一电子设备使用者对通信请求的响应指令,唤醒第一电子设备的语音服务,使得第一电子设备进入语音服务处理模式;

本实施例实际应用中,尤其是在第一电子设备使用者不在第一电子设备附近,无法亲自对第一电子设备进行操作的情况下,本实施例可以预先设定其在接收到第二电子设备发起的通信情况后,第一电子设备使用者预设时间段内未对该通信请求进行操作,如接通/拒绝来电等响应指令,第一电子设备可以直接启动第一电子设备语音助手,来处理本次接收到的通信请求。

其中,启动第一电子设备语音助手即为唤醒第一电子设备的语音服务,使其进入语音服务处理模式,之后,第一电子设备将基于ai技术的语音识别、自然语言处理等功能,对第二电子设备使用者的语音信息进行处理,以使得第二电子设备使用者发起的通信请求能够得到及时处理。

需要说明,本实施例对第一电子设备进入语音服务处理模式后,如何对接收到的语音信息进行处理的实现方法不做限定,可以结合ai技术的语音识别、自然语言处理等功能的工作原理确定。

步骤s43,响应该通信请求,建立与该第二电子设备的通信连接。

可见,第一电子设备接收到第二电子设备发起的通信请求,不方便或不知道如何响应该通信请求时,能够唤醒第一电子设备的语音服务,及时响应该通信请求,从而使得第一电子设备与第二电子设备之间生成通信通道,以使得第一电子设备和第二电子设备进行语音通信,具体可以是第一电子设备的语音助手或其使用者,与第二电子设备的语音助手或其使用者进行语音交互,以便通过交互的语音信息内容,控制对方设备或其关联的设备实现指定功能,满足本次通信要求。

综上所述,相对于传统电子设备的语音助手只能处理其使用者的语音控制指令,本发明能够利用ai技术的语音识别和自然语言处理功能,帮助电子设备使用者智能应答、管理和处理接收到的通信请求的应用,使得电子设备的语音助手功能更加多样化,能够更好地为电子设备使用者服务,提高了具有该语音助手的电子设备推广市场。

可选的,在上述各实施例的基础上,第一电子设备进入语音服务处理模式,由其语音助手自动处理并管理第二电子设备使用者的语音信息过程中,会同步展示该处理及管理过程,第一电子设备使用者看到当前操作不当,可以随时对第一电子设备进行操作,来中断或更改语音助手实现的当前操作,第一电子设备接收到其使用者操作生成的控制指令(即针对输出的第一操作指令的执行过程生成的指令),响应该控制指令,可以控制第一电子设备从语音服务处理模式切换到人工处理模式,并停止执行第一操作指令,接收第一电子设备使用者基于语音信息输入的第二操作指令,执行第二操作指令。

其中,第一电子设备接收到语音信息后,可以将其转换相应的文字内容,并展示在第一电子设备显示屏上,以供第一电子设备使用者阅览,并据此判断当前语音助手执行的操作是否符合该文本内容的要求。

由此可见,在第一电子设备进入语音服务处理模式,使用语音助手对第二电子设备使用者的语音信息进行处理过程中,第一电子设备使用者能够基于展示的操作过程及语音信息的内容,及时发现并制止处理不当的操作,保证第二电子设备使用者的语音控制能够可靠实现。

结合上述各实施例描述的语音控制方法,为了更加清楚说明该方法的核心构思,本实施在此以用户a和用户b通话期间,用户b向用户a所要个人在年后上的照片的场景为例进行说明,具体可以参照图6所示的流程示意图,在该场景下语音控制方法的实现步骤如下:

用户b使用手机b向用户a的手机a发起通话请求,手机a的显示屏可以输出来电界面,来输出当前用户b来电,若用户a提示看到用户b的来电,可以自己选择接听或绝接或启动手机a的语音助手来处理(本实施例将这种模式记为托管),当用户a选择托管模式,可以不用手动接听电话并亲自与用户b进行语音交流。

当然,手机a接收到手机b的来电后,手机a通常能够得知手机b的设备属性信息(如手机型号、非法手机标记信息(如该手机b为被盗手机等)等),手机b的使用者即用户b的用户属性信息(如用户b的手机号码、用户a对用户b的备注名称、陌生号码/人、推销/骚扰号码等等标记信息),这样,手机a可以根据预设规则,输出对手机b的来电是否托管的建议。

其中,该预设规则可以是基于用户a对各类用户/设备来电的历史接听习惯等信息确定。如推销/骚扰等各类客服来电,可以建议用户a托管给手机a的语音助手处理,重要朋友/客户/家人的来电,也可以进一步根据用户a以往接听习惯给出相应建议,本实施例对给出的建议内容以及预设规则的内容不做限定。

在用户a选择由手机a的语音助手来处理手机b的来电,即手机a处理托管模式(即上文实施例的语音服务处理模式),可以接听用户b的来电,并在与用户b的交流过程中,语音助手将利用ai技术,对用户b的语音实时识别,智能语义理解,合成应答语音来与用户b进行智能交互,也就是说,在该过程中,启动语音助手的手机a相当于一个智能机器人,来与使用手机b的用户b进行语音交互。在此期间,用户a可以不参照与该语音交互过程,用户a可以随着立离开或忙碌其他事情,并不会耽误与用户b的语音交互。

当然,为了避免用户b要求手机a执行不合适操作,或手机a语音助手响应用户b的语音信息,所执行操作不当,手机a的显示屏可以实时显示双方语音交互内容,以及手机a执行操作指令的过程,这样,用户a直接观看显示屏显示内容,即便没有亲自接听用户b的来电,也能够得知用户b对手机a的控制内容。这样,当用户a发现手机a的操作过程出现不当操作,能够及时进行人工干预,如用户a手动触发手机a的显示屏,停止语音助手的工作,由用户a手动完成后续操作。

且,当用户b语音控制手机a完成的操作涉及安全隐私问题,如用户b的语音信息为“通过微信给我发几张我在年后上的照片”,按照上述处理过程启动手机a的语音助手后,经对该语音信息的语义分析,确定手机a需要查询照片并发送给手机b,该操作涉及到手机a中预设的安全隐私内容,手机a可以输出响应提示信息,如请确认是否向手机b发送照片,是否查询手机a中用户b的照片并发送给手机b等内容的提示信息,用户a选择确认后,手机a才会执行发送用户b的照片这一操作指令,具体的,手机a会启动微信这一应用,查找到用户b的社交账号,并将用户b的照片发送给用户b。

若用户b选择绝接发送,语音助手可以从预存的预设响应信息中,查找与当前场景相匹配的预设响应信息反馈至手机b输出,如回复“抱歉,现在不方便查找,有时间会尽快发给你”等内容。需要说明,此时手机a的语音助手回复的该内容仍需要利用ai技术,得到相应的语音信息反馈至手机b输出,以使用户b接听到该内容。当然,对于用户b的手机b来说,也可以按照上述手机a的语音控制方法,使用手机b的语音助手进行处理。也就是说,通话双方的手机都可以使用语音助手处理对方发送的语音信息,本发明上述各实施例仅以接收方第一电子设备的处理过程为例进行说明,第二电子设备处理第一电子设备使用者的语音信息的实现方法类似,本发明不再赘述。

另外,对于本实施例中,用户a对响应提示信息的确认,可以直接选择确认按钮,也可以输入密码来触发手机a执行照片发送操作,具体可以根据该响应提示信息的输出方式以及预设的用户确认方式确定,本发明对此不做限定。

由此可见,本实施例中用户a和用户b的通话过程中,即便使用各自手机的语音助手来处理对方的语音信息,也可以对此设置安全防护,具体可以结合用户通讯录、对涉及用户隐私类的信息等,设置语音助手的处理权限,当接收到的语音信息内容在其处理权限内,可以由语音助手直接对其进行处理,不需要用户进行配合;对于超出手机语音助手处理权限的语音信息,可以输出响应提示信息,进一步由用户来确定是否允许该语音助手处理该语音信息,提高了手机使用的安全性,尤其是在手机在用户通话过程中,受通话对方语音控制的应用中,避免了对方通过语音控制进行非法或不当操作,导致手机中用户的重要信息泄露,或对方通过语音控制本用户手机对其他设备进行非法操作等。

需要说明,对应用户a与用户b双方的通话内容,尤其在某一方启动语音助手处理对方语音信息的情况下,可以记录双方通话内容,以及对方对本地用户手机的操作内容等,以供本次用户后续查询,并及时纠正不当操作等。

上图6仅对用户a的手机a对接收到语音信息的通信控制过程进行了详细描述,而用户b的手机b的通信控制过程类似,即用户a语音控制手机b或其关联设备的控制过程类似,图6并未示出。

此外,结合上述语音控制方法各实施例的描述可知,该语音控制方法适用的应用场景并不局限于上文描述的用户双方通话过程,还可以适用于其他语音通信场景,且在双方通话过程中,也并不局限于上文描述的语音控制对方设备反馈照片的具体场景,本发明还可以利用上述语音控制方法,在通信过程中,帮助对方设置对方设备或其关联设备的功。

参照图7所示的场景示意图,如对于老人、儿童等被监护人,其监护人可以在与被监护人的通话过程中,通过语音控制的方式,帮助被监护人设置其手机功能、内容、配置或执行某操作,如帮家里的老人启动其手机的广播软件,播放广播等,或者打开手电筒,或打开定位软件,或按照某软件等等。若老人手机与家里的其他智能家居设备关联,监护人还可以在与被监护通话过程中,通过向被监护人的手机发送的语音信息,启动被监护人的语音助手,从而利用ai技术分析得到相应的操作指令,来启动或调节指定的智能家居设备,如调亮室内灯光亮度等等。本实施例对上文列举的各应用场景下语音控制方法的具体实现过程不再一一详述,且对于该语音控制方法适用的应用场景,也并不局限于上文列举的多个场景。

可见,本实施例提供的这种语音控制方法,能够在双发语音通话过程中,帮助对方(尤其是不懂操作或无法操作的个体)对其设备进行语音控制,使对方设备完成本用户语音要求的操作指令,不需要用户亲自动手给对方设备进行操作,更加方便。

参照图8,为本发明实施例提供的一种语音控制装置的结构示意图,该装置可以应用于第一电子设备,该装置可以包括:

语音信息获取模块11,用于在与第二电子设备通信过程中,获取第二电子设备使用者的语音信息;

提示模块12,用于基于对所述语音信息的语义分析结果,输出响应提示信息;

其中,该响应提示信息用于提示所述第一电子设备使用者确定,是否由所述第一电子设备执行所述语义分析结果指示的第一操作指令。

可选的,如图9所示,该提示模块12可以包括:

语义分析单元121,用于对所述语音信息进行语义分析,得到语义分析结果;

提示单元122,用于当所述语义分析结果表明所述语音信息符合预设提示条件,输出响应提示信息;

操作指令执行单元123,用于当所述语义分析结果表明所述语音信息不符合预设提示条件,执行所述语义分析结果指示的第一操作指令。

本实施例中,预设提示条件可以是表明语音信息包含内容涉及安全隐患,需要提示用户进一步确认是否响应该语音信息的条件,具体内容可以参照上述方法实施例相应部分的描述。

第一操作指令执行模块13,用于接收到所述第一电子设备使用者对所述响应提示信息的确认指令,执行所述第一操作指令,并输出所述第一电子设备对所述第一操作指令的执行过程。

可选的,若接收到所述第一电子设备使用者对所述响应提示信息的否认指令,将返回预设响应信息,基于此,该装置还可以包括:

预设响应信息获取模块,用于接收到所述第一电子设备使用者对所述响应提示信息的否定指令,获取与所述语义分析结果关联的预设响应信息;

预设响应信息反馈模块,用于将所述预设响应信息反馈至所述第二电子设备。

结合上文方法实施例对上述各功能模块实现功能的分析,本实施例在第一电子设备和第二电子设备进行通信过程中,第一电子设备语音助手接收到第二电子设备使用者的语音信息后,能够利用ai技术进行语义分析,并在其涉及到第一电子设备使用者安全隐私的内容时,可以向第一电子设备使用者发送提示,由其自由决定是否仍有语音助手响应语义分析结果指示的操作指令,若确认执行,再触发语音助手控制第一电子设备执行该操作指令。

其中,第一电子设备会同步输出其对操作指令的执行过程,以使其能够在语音助手的操作不当时,及时进行人为干预,保证第一电子设备执行的操作满足实际需求。

可选的,参照图10,在上述实施例的基础上,该装置还可以包括:

第一通信请求接收模块14,用于接收所述第二电子设备发起的通信请求;

通信提示输出模块15,用于基于对所述通信请求的分析结果,输出通信提示信息;

其中,该通信提示信息可以用于提示第一电子设备使用者确定是否由所述第一电子设备的语音服务处理所述通信请求,如上述方法实施例相应部分的描述,其可以包括是否托管给第一电子设备语音助手的建议等。

第一通信请求响应模块16,用于接收到所述第一电子设备使用者对所述通信提示信息的确认指令,控制所述第一电子设备进入语音服务处理模式,并响应所述通信请求。

可见,第二电子设备向第一电子设备发起通信请求后,第一电子设备可以不直接启动语音助手,来响应该通信请求,可以由第一电子设备使用者自主选择是由语音助手托管,还是由自己手动接受该通信请求,提高了电子设备响应通信请求的处理灵活性及多样性。

在本发明另一可选实施例中,区别于上述实施例描述的响应通信请求的处理方式,该装置还可以包括:

第二通信请求接收模块,用于接收所述第二电子设备发起的通信请求;

语音服务唤醒模块,用于在预设时间段内未接收到所述第一电子设备使用者对所述通信请求的响应指令,唤醒所述第一电子设备的语音服务,使得所述第一电子设备进入语音服务处理模式;

第二通信请求响应模块,用于通过第一电子设备的语音服务,响应所述通信请求。

需要说明,关于对第二电子设备发起的通信请求的响应方式,并不局限于上文两个可选实施例记载的方式。

另外,在上述各实施例的基础上,如图11所示,第一电子设备使用者可以随时对语音助手的操作进行人工干预,因此,该装置还可以包括:

处理模式切换模块17,用于响应控制指令,控制所述第一电子设备由语音服务处理模式切换到人工处理模式,并停止执行所述第一操作指令;

其中,该控制指令是针对输出的所述第一操作指令的执行过程生成的;

第二操作指令执行模块18,用于接收所述第一电子设备使用者基于所述语音信息输入的第二操作指令,执行所述第二操作指令。

可见,在第一电子设备的语音助手响应对方发送的语音信息过程中,第一电子设备可以同步输出该语音信息,以及语音助手的操作过程,一旦第一电子设备使用者发现操作不当,可以及时对当前操作进行人工干预,从语音助手的语音服务处理模式切换到人工处理模块,由第一电子设备使用者亲自根据语音信息的内容进行操作。

参照图12,为本发明实施例提供的一种电子设备的硬件结构示意图,该电子设备可以包括但并不局限于以下部件:

通信模块21;

本实施例中,该通信模块21可以包括无线通信模块和/或有线通信模块,具体可以是gprs模块、wifi模块、蓝牙模块、射频模块等等,具体可以根据实际通信需求确定,本实施例对该通信模块21的具体组成结构不作限定。

显示器22;

其中,显示器22可以是液晶显示器或者触摸显示器等。

存储器23,用于存储实现如上实施例描述的语音控制方法的程序;

本实施例中,存储器23可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram),存储器包括至少一个存储芯片。

处理器24,用于加载并执行存储器存储的程序,该程序主要用于:

在与第二电子设备通信过程中,获取第二电子设备使用者的语音信息;

基于对所述语音信息的语义分析结果,输出响应提示信息,所述响应提示信息用于提示所述第一电子设备使用者确定,是否由所述第一电子设备执行所述语义分析结果指示的第一操作指令;

接收到所述第一电子设备使用者对所述响应提示信息的确认指令,执行所述第一操作指令;

控制所述显示器输出所述第一电子设备对所述第一操作指令的执行过程。

需要说明,关于处理器执行程序实现的语音控制方法的各步骤,可以参照上述方法实施例相应部分的描述,本实施例在此不再赘述。

在实际应用中,该电子设备可以作为通信请求发送发,也可以作为通信请求接收方,具体可以是手机、平板电脑等产品类型。

本发明实施例还提供了一种存储介质,其上存储有程序,该程序被处理器执行,实现上述语音控制方法的各步骤。

本发明实施例还提供了一种通信控制系统,参照上图2a、图2b和图7所示的结构,系统可以包括第一电子设备(如手机a)和第二电子设备(如手机b),关于这两个电子设备之间的通信控制过程,可以参照上述方法实施例描述的语音控制方法各步骤,本实施例不再赘述。

其中,由于第一电子设备和第二电子设备的硬件结构类似,且实现的语音控制方法也类似,本发明不再分别描述,具体硬件结构可以参照上述电子设备实施例描述的硬件结构,实现的语音控制方法可以参照上述方法实施例描述的内容。

可选的,该系统还可以包括与第一电子设备和/或第二电子设备关联的其他电子设备,如图2b所示的智能打印机、电脑、智能音箱或其他智能家居设备等等,这样,在双方通信过程中,不仅可以通过语音控制对方设备,还可以进一步通过对方设备控制与其关联的其他设备,提高了语音助手的控制功能。

最后,需要说明的是,关于上述各实施例中,诸如第一、第二等之类的关系术语仅仅用来将一个操作、单元或模块与另一个操作、单元或模块区分开来,而不一定要求或者暗示这些单元、操作或模块之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法或者系统中还存在另外的相同要素。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、电子设备而言,由于其与实施例公开的方法对应,所以描述的比较简单,相关之处参见方法部分说明即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1