语音交互方法及装置、计算机装置及计算机可读存储介质与流程

文档序号:13007528阅读:199来源:国知局
语音交互方法及装置、计算机装置及计算机可读存储介质与流程

本发明涉及语音识别技术领域,尤其涉及一种语音交互方法及装置、计算机装置及计算机可读存储介质。



背景技术:

本部分旨在为权利要求书及具体实施方式中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

当前语音识别技术已经比较成熟,在生活中得到了广泛的应用,例如,目前的语音助手可充当移动终端(例如手机)系统中的“小秘书”身份,语音助手在接收到用户输入的指令后,可自动执行任务来提高使用效率。然而,目前的语音识别技术缺乏用户互联交互的能力,从而限制了它的智能程度,也在一定程度上限制了它的广泛应用,用户体验效果不佳。



技术实现要素:

鉴于此,有必要提供一种语音交互方法及装置、计算机装置及计算机可读存储介质,能够实现当前账户所在的终端与其他多个授权账户所在的其他终端之间的语音助手互联,使语音助手能够跨终端执行指令,给终端用户带来便利,并提高用户的使用体验。

本发明实施例一方面提供一种语音交互方法,应用于第一终端。所述语音交互方法包括:

获取待识别的语音控制信号;

识别所述语音控制信号以获取相应的第一语音控制指令;

解析所述语音控制信号以提取出所述第一语音控制指令的执行主体;

若所述执行主体为预设的第一授权账户所在的第二终端,则将所述第一语音控制指令发送给所述第二终端,以控制所述第二终端执行所述第一语音控制指令对应的操作。

进一步的,本发明实施例提供的上述语音交互方法还包括:

接收第二语音控制指令;

判断所述第二语音控制指令是否来自预设的第二授权账户所在的第三终端;

若所述第二语音控制指令来自预设的第二授权账户所在的第三终端,则控制所述第一终端执行所述第二语音控制指令对应的操作;

其中,所述第二授权账户包括所述第一授权账户以及与所述第一授权账户不同的其他授权账户,所述第三终端包括所述第二终端以及与所述第二终端不同的其他终端。

进一步的,本发明实施例提供的上述语音交互方法还包括:

若所述执行主体为所述第一终端,则控制所述第一终端执行所述第一语音控制指令对应的操作。

进一步的,本发明实施例提供的上述语音交互方法还包括:

预设并保存至少一个授权账户,其中,运行于所述第一终端的当前账户能够与所述授权账户进行通信。

进一步的,本发明实施例提供的上述语音交互方法中,所述账户为具有网络通信功能的账户;

及/或,所述账户包括如下中的至少一种:电话号码、微信号码、qq号码、飞信号码。

本发明实施例另一方面还提供一种语音交互装置,应用于第一终端。所述语音交互装置包括:

获取模块,用于获取待识别的语音信号;

识别模块,用于识别所述语音控制信号以获取相应的第一语音控制指令;

解析模块,用于解析所述语音控制信号以提取出所述第一语音控制指令的执行主体;以及

交互模块,用于在所述执行主体为预设的第一授权账户所在的第二终端时,将所述语音控制指令发送给所述第二终端,以控制所述第二终端执行所述第一语音控制指令对应的操作。

进一步的,在本发明实施例提供的上述语音交互装置中,所述交互模块还用于接收第二语音控制指令;

所述语音交互装置还包括:

判断模块,用于判断所述第二语音控制指令是否来自预设的第二授权账户所在的第三终端;以及

控制模块,用于在所述第二语音控制指令来自预设的第二授权账户所在的第三终端时,控制所述第一终端执行所述第二语音控制指令对应的操作;

其中,所述第二授权账户包括所述第一授权账户以及与所述第一授权账户不同的其他授权账户,所述第三终端包括所述第二终端以及与所述第二终端不同的其他终端。

进一步的,在本发明实施例提供的上述语音交互装置还包括控制模块,所述控制模块用于在所述执行主体为所述第一终端时,控制所述第一终端执行所述第一语音控制指令对应的操作。

进一步的,在本发明实施例提供的上述语音交互装置还包括设置模块,所述设置模块用于预设并保存至少一个授权账户,其中,运行于所述第一终端的当前账户能够与所述授权账户进行通信。

进一步的,本发明实施例提供的上述语音交互装置中,所述账户为具有网络通信功能的账户;

及/或,所述账户包括如下中的至少一种:电话号码、微信号码、qq号码、飞信号码。

本发明实施例再一方面还提供一种计算机装置,所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现上述任一所述语音交互方法的步骤。

本发明实施例又一方面还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述语音交互方法的步骤。

本发明提供的所述语音交互方法能够实现当前账户所在的终端与其他多个授权账户所在的其他终端之间的语音助手互联,使语音助手能够跨终端执行指令,给终端用户带来了便利,提高了用户的使用体验,从而也利于终端的智能化发展以及利于语音交互技术的广泛应用。

附图说明

为了更清楚地说明本发明实施方式的技术方案,下面将对实施方式描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明第一实施方式提供的语音交互方法的流程图。

图2是本发明第二实施方式提供的语音交互方法的流程图。

图3是本发明一实施方式提供的语音交互装置的结构示意图。

图4是本发明一实施方式提供的终端的结构示意图。

主要元件符号说明

第一终端1

语音交互装置10

获取模块11

识别模块12

解析模块13

交互模块14

控制模块15

设置模块16

判断模块17

处理器20

存储器30

计算机程序40

声音采集模块50

如下具体实施方式将结合上述附图进一步说明本发明。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施方式及实施方式中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。

除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施方式的目的,不是旨在于限制本发明。

图1是本发明第一实施方式提供的语音交互方法的流程图,所述语音交互方法应用于第一终端。所述第一终端可以是例如智能手机、笔记本电脑、台式/平板电脑、个人数字助理等具有语音识别及交互功能的计算机设备。应说明的是,本发明实施方式的所述语音交互方法并不限于图1所示的流程图中的步骤及顺序。根据不同的需求,所示流程图中的步骤可以增加、移除、或者改变顺序。

在第一实施方式中,若所述第一终端的语音助手处于启动状态,可通过所述第一终端的声音采集模块采集语音信息。

如图1所示,所述语音交互方法可以包括以下步骤:

步骤101,获取待识别的语音控制信号。

步骤102,识别所述语音控制信号以获取相应的第一语音控制指令。

步骤103,解析所述语音控制信号以提取出所述第一语音控制指令的执行主体。

步骤104,判断所述执行主体的类型,若所述执行主体为预设的第一授权账户所在的第二终端,则执行步骤105;若所述执行主体为所述第一终端,则执行步骤106。

在所述第一实施方式中,所述语音交互方法还包括:

预设并保存至少一个授权账户,其中,运行于所述第一终端的当前账户能够与所述授权账户进行通信。

例如,账户a与账户b互相授权,如加为好友或确定授权互联两者所在的终端上安装的语音助手。在互相授权后,两账户a、b之间可以传输数据,例如语音控制指令。

可以理解的是,所述账户为具有网络通信功能的账户,例如,所述账户包括但不限于电话号码、微信号码、qq号码、飞信号码。

步骤105,将所述第一语音控制指令发送给所述第二终端,以控制所述第二终端执行所述第一语音控制指令对应的操作。

步骤106,控制所述第一终端执行所述第一语音控制指令对应的操作。

在所述第一实施方式中,所述第一语音控制指令对应的操作可以是语音提醒操作。例如,用户希望提醒其母亲吃药时,用户可开启其手机的语音助手并输入语音信息“下午3点提醒我母亲记得吃药”,语音助手在接收到相应的语音控制信号时可识别出相应的语音控制指令:时间(下午3点)、人物(通讯录:母亲)、事件(吃药)。在解析所述语音控制指令后,语音助手可判断此事件是需要互联的事件,因此将所述语音控制指令发送给“母亲”的手机。“母亲”的手机的语音助手接收到所述语音控制指令后,记录此事件,并生成提醒事件,并在下午3点时执行所述提醒事件,例如语音播报“请记得吃药”。

可以理解的是,所述第一语音控制指令对应的操作也可以是系统设置操作,例如通过当前的手机修改另一手机的系统设置,例如给另一手机设置网络、闹钟、逻辑事件(例如当另一手机电量低于10%时,提醒另一手机的用户充电)等。

可以理解的是,所述第一语音控制指令对应的操作也可以是查找另一手机的信息,例如请求另一手机返回地理信息、照片、网络状态、播放声音等。

可以理解的是,所述第一语音控制指令对应的操作也可以是启动或关闭应用程序的操作,例如通过当前的手机控制另一手机播放多媒体。

本实施方式提供的所述语音交互方法能够实现当前账户所在的终端与其他多个授权账户所在的其他终端之间的语音助手互联,使语音助手能够跨终端执行指令,给终端用户带来了便利,提高了用户的使用体验,从而也利于终端的智能化发展以及利于语音交互技术的广泛应用。

图2是本发明第二实施方式提供的语音交互方法的流程图。需要说明的是,在本发明实施例的精神或基本特征的范围内,适用于第一实施方式中的各具体方案也可以相应的适用于第二实施方式中,为节省篇幅及避免重复起见,在此就不再赘述。

图2所示的所述语音交互方法应用于第一终端。如图2所示,所述语音交互方法包括:

步骤201,接收第二语音控制指令。

步骤202,判断所述第二语音控制指令是否来自预设的第二授权账户所在的第三终端。

步骤203,若所述第二语音控制指令来自预设的第二授权账户所在的第三终端,则控制所述第一终端执行所述第二语音控制指令对应的操作。

其中,所述第二授权账户包括所述第一授权账户以及与所述第一授权账户不同的其他授权账户,所述第三终端包括所述第二终端以及与所述第二终端不同的其他终端。

如此,在本发明中,当前账户所在的终端既可以给其他多个授权账户所在的其他终端发送语音控制指令,以控制其他终端执行相应的操作,也可以接收所述其他终端发送的语音控制指令以执行相应的操作,从而真正意义上实现终端之间的语音助手互联,使语音助手能够跨终端执行指令,给终端用户带来了便利,提高了用户的使用体验,从而也利于终端的智能化发展以及利于语音交互技术的广泛应用。

图3是本发明一实施方式提供的语音交互装置的结构示意图,所述语音交互装置应用于第一终端。所述语音交互装置可以包括一个或多个模块,所述一个或多个模块被存储在第一终端的存储器中并被配置成由一个或多个处理器(本实施方式为一个处理器)执行,以完成本发明。例如,参阅图3所示,语音交互装置10可以包括获取模块11、识别模块12、解析模块13、交互模块14、控制模块15、设置模块16以及判断模块17。本发明实施例所称的模块可以是完成一特定功能的程序段,比程序更适合于描述软件在处理器中的执行过程。

可以理解的是,对应于上述语音交互方法中的各实施方式,所述语音交互装置10可以包括图3中所示的各功能模块中的一部分或全部,各模块11~17的功能将在以下具体介绍。需要说明的是,以上语音交互方法的各实施方式中相同的名词相关名词及其具体的解释说明也可以适用于以下对各模块11~17的功能介绍。为节省篇幅及避免重复起见,在此就不再赘述。

在本实施方式中,若所述第一终端的语音助手处于启动状态,可通过所述第一终端的声音采集模块采集语音信息。

所述获取模块11用于获取待识别的语音信号。

所述识别模块12用于识别所述语音控制信号以获取相应的第一语音控制指令。

所述解析模块13用于解析所述语音控制信号以提取出所述第一语音控制指令的执行主体。

所述交互模块14用于在所述执行主体为预设的第一授权账户所在的第二终端时,将所述语音控制指令发送给所述第二终端,以控制所述第二终端执行所述第一语音控制指令对应的操作。

所述控制模块15用于在所述执行主体为所述第一终端时,控制所述第一终端执行所述第一语音控制指令对应的操作。

在本实施方式中,所述设置模块16用于预设并保存至少一个授权账户,其中,运行于所述第一终端的当前账户能够与所述授权账户进行通信。

例如,账户a与账户b互相授权,如加为好友或确定授权互联两者所在的终端上安装的语音助手。在互相授权后,两账户a、b之间可以传输数据,例如语音控制指令。

可以理解的是,所述账户为具有网络通信功能的账户,例如,所述账户包括但不限于电话号码、微信号码、qq号码、飞信号码。

在本实施方式中,所述第一语音控制指令对应的操作可以是语音提醒操作。例如,用户希望提醒其母亲吃药时,用户可开启其手机的语音助手并输入语音信息“下午3点提醒我母亲记得吃药”,语音助手在接收到相应的语音控制信号时可识别出相应的语音控制指令:时间(下午3点)、人物(通讯录:母亲)、事件(吃药)。在解析所述语音控制指令后,语音助手可判断此事件是需要互联的事件,因此将所述语音控制指令发送给“母亲”的手机。“母亲”的手机的语音助手接收到所述语音控制指令后,记录此事件,并生成提醒事件,并在下午3点时执行所述提醒事件,例如语音播报“请记得吃药”。

可以理解的是,所述第一语音控制指令对应的操作也可以是系统设置操作,例如通过当前的手机修改另一手机的系统设置,例如给另一手机设置网络、闹钟、逻辑事件(例如当另一手机电量低于10%时,提醒另一手机的用户充电)等。

可以理解的是,所述第一语音控制指令对应的操作也可以是查找另一手机的信息,例如请求另一手机返回地理信息、照片、网络状态、播放声音等。

可以理解的是,所述第一语音控制指令对应的操作也可以是启动或关闭应用程序的操作,例如通过当前的手机控制另一手机播放多媒体。

本实施方式提供的所述语音交互装置10能够实现当前账户所在的终端与其他多个授权账户所在的其他终端之间的语音助手互联,使语音助手能够跨终端执行指令,给终端用户带来了便利,提高了用户的使用体验,从而也利于终端的智能化发展以及利于语音交互技术的广泛应用。

在本实施方式中,所述交互模块14还用于接收第二语音控制指令。

所述判断模块17用于判断所述第二语音控制指令是否来自预设的第二授权账户所在的第三终端。

所述控制模块15还用于在所述第二语音控制指令来自预设的第二授权账户所在的第三终端时,控制所述第一终端执行所述第二语音控制指令对应的操作。

其中,所述第二授权账户包括所述第一授权账户以及与所述第一授权账户不同的其他授权账户,所述第三终端包括所述第二终端以及与所述第二终端不同的其他终端。

如此,在本发明中,当前账户所在的终端既可以给其他多个授权账户所在的其他终端发送语音控制指令,以控制其他终端执行相应的操作,也可以接收所述其他终端发送的语音控制指令以执行相应的操作,从而真正意义上实现终端之间的语音助手互联,使语音助手能够跨终端执行指令,给终端用户带来了便利,提高了用户的使用体验,从而也利于终端的智能化发展以及利于语音交互技术的广泛应用。

本发明实施例还提供一种计算机装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一实施方式中所述的语音交互方法的步骤。

图4是本发明一实施方式提供的第一终端的示意图。如图4所示,第一终端1包括:处理器20、存储器30、存储在所述存储器30中并可在所述处理器20上运行的计算机程序40(例如语音交互程序、语音助手应用程序)、以及声音采集模块50。所述处理器20执行所述计算机程序40时实现上述各个语音交互方法实施方式中的步骤,例如图1所示的步骤101~106、或者图2所示的步骤201~203。所述处理器20执行所述计算机程序40时实现上述各装置实施方式中各模块/单元,例如模块11~17的功能。

示例性的,所述计算机程序40可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器30中,并由所述处理器20执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,所述指令段用于描述所述计算机程序40在所述第一终端1中的执行过程。例如,所述计算机程序40可以被分割成图3中的获取模块11、识别模块12、解析模块13、交互模块14、控制模块15、设置模块16以及判断模块17,各模块11~17的具体功能请参见前面的具体介绍,为节省篇幅及避免重复起见,在此就不再赘述。

所述声音采集模块50可以是声音传感器、话筒、扬声器等。

所述第一终端1可以是智能手机、笔记本电脑、台式/平板电脑、个人数字助理等具有语音识别及交互功能的计算机设备。本领域技术人员可以理解,所述示意图4仅仅是第一终端1的示例,并不构成对第一终端1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述第一终端1还可以包括输入输出设备、网络接入设备、总线等。

所称处理器20可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者所述处理器20也可以是任何常规的处理器等,所述处理器20是所述语音交互装置10/所述第一终端1的控制中心,利用各种接口和线路连接整个语音交互装置10/第一终端1的各个部分。

所述存储器30用于存储所述计算机程序40和/或模块/单元,所述处理器20通过运行或执行存储在所述存储器30内的计算机程序和/或模块/单元,以及调用存储在所述存储器30内的数据,实现所述语音交互装置10/第一终端1的各种功能。所述存储器30可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据第一终端1的使用所创建的数据(比如音频数据,电话本,应用上述语音交互方法而设置、获取的数据等)等。此外,所述存储器30可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

本发明实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施方式中所述的语音交互方法的步骤。

所述语音交互装置10/第一终端1/计算机装置集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施方式方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,所述计算机程序在被处理器执行时,可实现上述各个方法实施方式的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

在本发明所提供的几个具体实施方式中,应该理解到,所揭露的终端和方法,可以通过其它的方式实现。例如,以上所描述的终端实施方式仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

另外,在本发明各个实施例中的各功能模块可以集成在相同处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在相同模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言,显然本发明实施例不限于上述示范性实施例的细节,而且在不背离本发明实施例的精神或基本特征的情况下,能够以其他的具体形式实现本发明实施例。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明实施例的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明实施例内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统、装置或终端权利要求中陈述的多个单元、模块或装置也可以由同一个单元、模块或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

最后应说明的是,以上实施方式仅用以说明本发明实施例的技术方案而非限制,尽管参照以上较佳实施方式对本发明实施例进行了详细说明,本领域的普通技术人员应当理解,可以对本发明实施例的技术方案进行修改或等同替换都不应脱离本发明实施例的技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1