一种语音提醒方法及装置与流程

文档序号:12801459阅读:179来源:国知局
一种语音提醒方法及装置与流程

本发明涉及语音数据处理技术领域,尤其是涉及一种语音提醒方法及装置。



背景技术:

随着科技的不断发展,用户通过语音与机器交互互动的形式越来越多,无论是pc、平板电脑,或者是手机等智能设备,都希望拥有流畅的人性化的语音交互功能。

但是目前在语音交互识别率不断提高的情况下,语音合成技术产生的话音普遍生硬,缺乏个性化的停顿和语调,交互不够亲切,不能很好的体现人机交互的流畅性,从而限制了用户在多个适合使用语音的场合,降低语音提醒的有效性。

针对现有技术中语音提醒的有效性较低的问题,目前尚未提出有效的解决方案。



技术实现要素:

本发明实施例提供了一种语音提醒方法及装置,能够提高语音提醒的有效性。

一种语音提醒方法,包括:在终端用户与终端进行语音交互时,所述终端获取用户语音信息中携带的第一语音信息;在确定出所述第一语音信息符合第一预定规则时,向用户发送语音提问信息;接收用户发送的第二指定语音信息;并判断所述第二指定语音信息是否符合第二预定规则;若符合,停止向用户发送语音提问信息;若不符合,持续向用户发送不同的语音提问信息。

在所述终端获取用户语音信息之前,还包括:所述终端在设定时间向终端发出的语音提问。

确定所述第一语音信息符合第一预定规则,包括:获得所述第一语音信息中的控制字;比较所述控制字和第一预定规则,若相同,确定所述第一语音信息符合第一预定规则。

一种终端,包括:显示器,存储器,一个或多个处理器;以及一个或多个模块,所述一个或多个模块被存储在所述存储器中,并被配置成由所述一个或多个处理器执行,所述一个或多个模块包括用于执行权利要求1-3中任一所述方法中各个步骤的指令。

所述终端包括机器人。

一种计算机程序产品,所述计算机程序产品包括内嵌于计算机可读的存储介质中的计算机程序,所述计算机程序包括用于使所述电子设备执行任一所述方法中的各个步骤的指令。

一种电子系统,包括终端和服务器;所述终端包括显示器,存储器,一个或多个处理器,以及通信单元;所述服务器包括存储器,一个或多个处理器,以及通信单元;各个通信单元用于实现与外部设备的通信;还包括:一个或多个模块,所述一个或多个模块被存储在用户设备或者服务器的存储器中,并被配置成由相应的处理器执行,所述一个或多个模块包括用于执行所述方法中各个步骤的指令。

一种语音提醒装置,包括:获取模块,用于在与终端用户进行语音交互时,获取用户语音信息中携带的第一语音信息;发送模块,用于在确定出所述第一语音信息符合第一预定规则时,向用户发送语音提问信息;获取模块,还用于接收用户发送的第二指定语音信息;执行模块,用于判断所述第二指定语音信息是否符合第二预定规则;若符合,停止向用户发送语音提问信息;若不符合,持续向用户发送不同的语音提问信息。

所述发送模块,还用于在设定时间向终端用户发出的语音提问。

所述执行模块,具体用于获得所述第一语音信息中的控制字;比较所述控制字和第一预定规则,若相同,确定所述第一语音信息符合第一预定规则。

通过采用上述技术方案,在终端用户与终端进行语音交互时,所述终端获取用户语音信息中携带的第一语音信息;在确定出所述第一语音信息符合第一预定规则时,向用户发送语音提问信息;接收用户发送的第二指定语音信息;并判断所述第二指定语音信息是否符合第二预定规则;若符合,停止向用户发送语音提问信息;若不符合,持续向用户发送不同的语音提问信息,从而提高语音提醒的有效性。

附图说明

图1为本发明实施例一中,提出的语音提醒方法流程图;

图2~图4为本发明实施例三中,提出的终端设备结构组成示意图。

具体实施方式

针对现有技术中存在的音合成技术不能很好的体现人机交互的流畅性的问题,目前尚未提出有效的解决方案的问题,本申请提出一种技术方案,在终端用户与终端进行语音交互时,终端获取用户语音信息中携带的第一语音信息;在确定出第一语音信息符合第一预定规则时,向用户发送语音提问信息,接收用户发送的第二指定语音信息;并判断第二指定语音信息是否符合第二预定规则,若符合,停止向用户发送语音提问信息,若不符合,持续向用户发送不同的语音提问信息,用于解决人机交互的流畅性的问题。

下面将结合各个附图对本发明实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细地阐述。

实施例一

本发明实施例一提出一种语音提醒方法,如图1所示,其具体处理流程如下述:

步骤11,在终端用户与终端进行语音交互时,终端获取用户语音信息中携带的第一语音信息。

需要说明的是,在本申请提出的终端用户,也可以简称为用户,都是作为终端的使用者。

终端用户和终端之间进行语音交互,终端获得用户输入的语音信息。

步骤12,在确定出第一语音信息符合第一预定规则时,向用户发送语音提问信息。

获得第一语音信息中的控制字,比较控制字和第一预定规则,若相同,确定第一语音信息符合第一预定规则。

例如,第一语音信息中的控制字可以是动作、指挥或者方向类动词,也可以是嗯、是的、好的之类语气词,具体地,终端获取的第一语音信息中的控制字可以通过预先设置来实现,在此并不做具体的限定。

步骤13,接收用户发送的第二指定语音信息。

在本申请实施例提出的技术方案中在,终端在获取终端用户的第一语音信息之后,会通过语音提问信息,进一步跟终端用户之间进行沟通,以确保第一语音控制信息的有效性。

步骤14,判断第二指定语音信息是否符合第二预定规则,如果判断结果为是,执行步骤15,如果判断结果为否,执行步骤16。

步骤15,停止向用户发送语音提问信息。

步骤16,持续向用户发送不同的语音提问信息。

可选地,在上述步骤11之前,还可以包括终端在设定时间向终端发出的语音提问。

实施例二

本申请实施例二以用户在终端中设置闹钟为例进行详细阐述,其具体处理流程如下述:

步骤一,用户预先在终端中设置,闹表开启闹铃的时间为7:00。

步骤二,在时间7:00到达时,终端发出语音信息“是否起床,是否起床”。

一种较佳地实现方式,在发出语音信息之后设定时间内,若没接收到终端用户的第一语音信息,即终端用户的回复信息,则终端再次发出语音信息“是否起床,是否起床”,直至接收到终端用户与终端进行语音交互时为止。

步骤三,终端用户回复语音信息。

例如,终端用户回复“嗯”、“是的”“起床了”“马上”等等语音信息。

步骤四,终端获取用户语音信息中携带的第一语音信息。

这里以步骤二和步骤三中的语音信息“起床了”为例进行详细阐述。

步骤五,终端确定获取的“起床了”是否符合第一预定规则。

假设终端中预先设置好第一预定规则为“嗯”、好的、行、起床了的等词语,终端在接收到终端用户输入的语音信息之后,基于语音分析技术,将接收到的用户发送的语音信息进行分析整理,获取关键词或关键字,例如在本步骤中,可以获取关键字起床,将获取的关键字起床和预先存储的起床了相匹配,发现该信息一致。

步骤六,终端向用户发送语音提问信息“请回答今天是周几”的语音提问信息。

步骤七,用户接收到语音提问信息之后,输入答案。

一种较佳地实现方式,在本申请实施例二提出的技术方案中,是以闹钟为例进行详细阐述,正常情况下,用户在早上起床时都会存在一种困态,思维都不是特别清晰,尤其是特别疲乏状态下,而此时又需要按时起床,则本申请即应用在该种场景下的一种具体实施方式。这种情况下,可以单独对终端进行设置,在终端发送语音提问消息时,同时开通语音接收通道,允许用户进行抢答,即语音提问消息未全部发送完毕,用户即输入回答内容。

步骤八,判断第二指定语音信息是否符合第二预定规则。

终端判断用户输入的“周三”等信息是否正确。

一种较佳地实现方式,若预先设置的是抢答模式,则在接收到用户输入第二指定语音信息开始,停止语音提问信息。

步骤九,若正确,停止继续发送语音提问信息。

较佳地,在步骤九之后,还可以包括:

间隔设定时长后,向用户提供天气、路况等信息。或者自动切换为电台、新闻播报,或者打开显示屏等方式。

步骤十,若不正确,持续向用户发送起床之类的语音信息。

或者,若不正确,可以持续向用户发送不同的提问信息等。

较佳地,每次发送的语音音量都可以略大于前一次的语音音量。

需要说明的是,在本申请上述实施例一~实施例二提出的技术方案中,终端可以是不具备处理功能的终端,即该些方法步骤是通过终端的应用的方式展示给用户,具体实施时,终端与服务器之间进行交互,获得相关语音处理结果。在本申请上述实施例一~实施例二提出的技术方案中,终端还可以是具备处理功能的终端,具体实施时,由终端中的处理器处理相关语音指令。这样可以较好地节省网络带宽,不需要通过通信的方式和服务端连接。

实施例三

本申请实施例三提出一种用户设备,包括:

显示器,存储器,一个或多个处理器,以及一个或多个模块,一个或多个模块被存储在存储器中,并被配置成由一个或多个处理器执行,一个或多个模块包括用于执行方法实施例一中各个步骤的指令。在此不做赘述。

在本申请实施例三提出的技术方案中,存储器,存储器可以是易失性存储器(英文:volatilememory),例如随机存取存储器(英文:random-accessmemory,缩写:ram);或者非易失性存储器(英文:non-volatilememory),例如快闪存储器(英文:flashmemory),硬盘(英文:harddiskdrive,缩写:hdd)或固态硬盘(英文:solid-statedrive,缩写:ssd);或者上述种类的存储器的组合。

处理器可以是中央处理器(centralprocessingunit,cpu),或者是cpu和硬件芯片的组合。

处理器还可以是网络处理器(networkprocessor,np)。或者是cpu和np的组合,或者是np和硬件芯片的组合。

上述硬件芯片可以是以下一种或多种的组合:专用集成电路(application-specificintegratedcircuit,asic),现场可编程逻辑门阵列(field-programmablegatearray,fpga),复杂可编程逻辑器件(complexprogrammablelogicdevice,cpld)。

可选地,在本申请实施例三提出的用户设备中的一个或多个模块,该些模块可以是具备上述实施例是中提出的装置模块的相应功能。

进一步地,本申请实施例三提出的技术方案中,以图3为例介绍本申请实施例提供的用户设备的控制方法计算节点的逻辑结构。该计算节点可以是用户设备,该用户设备具体可以为桌面计算机、笔记本电脑、智能手机或平板电脑等。如图3所示,该用户设备的硬件层包括中央处理器(centerprocessingunit,cpu)、图形处理器(graphicprocessingunit,gpu)等,当然还可以包括存储器、输入/输出设备(inputdevice)、网络接口等,输入设备可包括键盘、鼠标、触摸屏等,输出设备可包括显示设备如液晶显示器(liquidcrystaldisplay,lcd)、阴极射线管(cathoderaytube,crt)、全息成像(holographic)、投影(projector)等。在硬件层之上可运行有操作系统(如android等)以及一些应用程序。核心库层是操作系统的核心部分,包括输入/输出服务、核心服务、图形设备接口以及实现cpu、gpu图形处理的图形引擎(graphicsengine)等。图形引擎可包括2d引擎、3d引擎、合成器(composition)、帧缓冲区(framebuffer)等。核心库层还包括输入法服务。其中,输入法服务包括终端自带的输入法服务。除此之外,该终端还包括驱动层、框架层和应用层。驱动层可包括cpu驱动(driver)、gpu驱动、显示控制器驱动、安全区域驱动(trustzonedriver)等。框架层可包括图形服务(graphicservice)、系统服务(systemservice)、网页服务(webservice)和用户服务(customerservice)等;图形服务中,可包括如微件(widget)、画布(canvas)、视图(views)、renderscript等。应用层可包括桌面(launcher)、媒体播放器(mediaplayer)、浏览器(browser)等。

本申请实施例提出的用户设备,如图3所示,该用户设备200包括:至少一个处理器201,至少一个网络接口204或者其他用户接口203,存储器205,至少一个通信总线202。通信总线202用于实现这些组件之间的连接通信。该用户设备200可选的包含用户接口203,包括显示器(例如图2所示的lcd、crt、全息成像(holographic)或者投影(projector)等),键盘或者点击设备(例如,鼠标,轨迹球(trackball),触感板或者触摸屏等)。

存储器205可以包括只读存储器和随机存取存储器,并向处理器201提供存储器205中存储的程序指令和数据。存储器205的一部分还可以包括非易失性随机存取存储器(nvram)。

在一些实施方式中,存储器205存储了如下的元素,可执行模块或者数据结构,或者他们的子集,或者他们的扩展集:

操作系统2051,包含各种系统程序指令,该程序指令可运行在例如图2所示的框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。

应用程序2052,包含各种应用程序,例如图2所示的桌面(launcher)、媒体播放器(mediaplayer)、浏览器(browser)以及输入法应用等,用于实现各种应用业务。

在本申请实施例中,存储器205也可以称之为存储区域,用于存储数据程序,以及存储操作系统。

处理器201通过调用存储器205存储的程序指令,处理器201用于按照获得的程序指令执行上述方法实施例一中各方法步骤,这里不再赘述。

本申请实施例提出的提出控制用户设备的方法所应用的用户设备,该用户设备可以为手机、平板电脑、个人数字助理(personaldigitalassistant,pda)等。参考图4所示,为用户设备300的其中一种结构组成示意图。

该用户设备300主要包括,存储器320、处理器360及输入单元330,该输入单元330用于接收用户在终端上进行操作时的生成的事件。该存储器320用于存储操作系统和各种应用程序的程序指令。

可以理解的,处理器360的具体实现功能可参见上述处理器201的详细阐述,不再赘述。

存储器320可以是用户设备300的内存,该内存可以划分为三个存储空间,分别对应设置在第一运行环境中的安全内存、设置在第二环境中的非安全内存以及第一运行环境和第二运行环境中的应用程序或者硬件都可以访问的共享内存。安全内存、非安全内存以及共享内存的空间划分,可以划分相同的大小,也可以根据存储数据输入事件的不同,划分不同的大小。

用户设备中的输入单元330可用于接收用户输入的数字或字符信息,以及产生与用户设备300的用户设置以及功能控制有关的信号输入。具体地,本申请实施例中,该输入单元330可以包括触控面板331。触控面板331,可收集用户在其上(比如用户使用手指、触笔等任何适合的物体或附件在触控面板331上)的操作,并根据预先设定的程序指令,驱动与触控面板331相应的连接装置。可选的,触控面板331可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给该处理器360,并能接收处理器360发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板331。除了触控面板331,输入单元330还可以包括其他输入设备332,其他输入设备332可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

该用户设备300还可以包括显示单元340,该显示单元340可用于显示由用户输入的信息或提供给用户的信息以及用户设备300的各种菜单界面。该显示单元340可包括显示面板341,可选的,可以采用液晶显示器(liquidcrystaldisplay,lcd)或有机发光二极管(organiclight-emittingdiode,oled)等形式来配置显示面板341。

本申请实施例中,该触摸显示屏包括不同的显示区域。每一个显示区域可以包含至少一个应用程序的图标和/或widget桌面控件等界面元素。

该处理器360是用户设备300的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在该存储器320内的软件程序和/或模块,执行用户设备300的各种功能和处理数据,从而对用户设备300进行整体监控。

可选的该用户设备300还可以包括rf电路310,用于提供无线连接的wifi模块380,以及电源390和用于提供声音输入输出的音频电路370。

实施例四

本申请实施例四提出一种计算机程序产品,所述计算机程序产品包括内嵌于计算机可读的存储介质中的计算机程序,所述计算机程序包括用于使所述电子设备执行执行上述实施例一~实施例三中任一实施例提出的技术方案中的各个步骤的指令。

本发明实施例四还提出一种语音提醒装置,包括:

获取模块,用于在与终端用户进行语音交互时,获取用户语音信息中携带的第一语音信息;

发送模块,用于在确定出所述第一语音信息符合第一预定规则时,向用户发送语音提问信息;

获取模块,还用于接收用户发送的第二指定语音信息;

执行模块,用于判断所述第二指定语音信息是否符合第二预定规则;若符合,停止向用户发送语音提问信息;若不符合,持续向用户发送不同的语音提问信息。

具体地,上述发送模块,还用于在设定时间向终端用户发出的语音提问。

具体地,上述执行模块,具体用于获得所述第一语音信息中的控制字;比较所述控制字和第一预定规则,若相同,确定所述第一语音信息符合第一预定规则。

本领域的技术人员应明白,本发明的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1