语音输入方法、语音输入装置及存储介质与流程

文档序号:17628413发布日期:2019-05-10 23:54阅读:277来源:国知局
语音输入方法、语音输入装置及存储介质与流程

本发明涉及语音输入技术领域,尤其涉及一种语音输入方法、语音输入装置以及计算机可读存储介质。



背景技术:

随着时代的发展,在人们日常生活中越来越需要应用到语音输入技术,如语音输入法、发送语音消息等。语音输入的模式主要分为长按输入和短按输入,长按输入是指用户按下语音键录音,抬起语音键停止录音;短按输入是指用户按下并抬起语音键激活录音状态,然后录音,输入法通过vad语音活动检测(voiceactivitydetection)技术来检测语音和非语音状态,并判断是否需要停止录音。

目前,大多数语音输入应用仅支持长按输入模式和短按输入模式中的一种,而由于不同的用户可能具有不同的语音输入习惯,在用户无法选择适合自身使用习惯的语音输入模式时,就会造成用户对语音输入应用具有不好的使用体验。



技术实现要素:

本发明的主要目的在于提供一种语音输入方法、语音输入装置以及计算机可读存储介质,改善了用户对语音输入的使用体验。

为实现上述目的,本发明提供一种语音输入方法,所述语音输入方法包括以下步骤:

在检测到语音输入按键信号时,获取所述语音输入按键信号的持续时长及/或预设时间间隔内接收到所述语音输入信号的次数;

根据所述持续时长及/或次数确定语音输入模式以及所述语音输入模式的输入完成条件,并开始接收语音数据,所述语音输入模式包括长按输入模式和短按输入模式;

在满足所述语音输入模式对应的输入完成条件时,停止接收所述语音数据,以完成语音输入。

优选地,所述根据所述持续时长确定语音输入模式的步骤包括:

在所述持续时长大于预设阈值时,确定所述语音输入模式为所述长按输入模式;

在所述持续时长小于或者等于预设阈值时,确定所述语音输入模式为所述短按输入模式。

优选地,所述根据所述次数确定语音输入模式的步骤包括:

在所述次数大于预设值时,确定所述语音输入模式为所述长按输入模式;

在所述次数小于或者等于预设值时,确定所述语音输入模式为所述短按输入模式。

优选地,所述长按输入模式的输入完成条件为检测到所述语音输入按键信号断开及/或在预设时长内未接收到语音数据。

优选地,所述短按输入模式的输入完成条件为再次检测到语音输入按键信号及/或在预设时长内未接收到语音数据。

优选地,所述在满足所述语音输入模式对应的输入完成条件时,停止接收所述语音数据的步骤之后,还包括:

在语音输入完成后,将接收到的语音数据转换为文本信息;

显示所述文本信息。

优选地,所述显示所述文本信息的步骤包括:

将所述文本信息输入到显示界面的文本输入框,以在所述文本输入框显示所述文本信息。

优选地,所述在满足所述语音输入模式对应的输入完成条件时,停止接收所述语音数据的步骤之后,还包括:

在语音输入完成后,将接收到的语音数据发送至关联端;

或者,根据接收到的语音数据生成控制指令,并将所述控制指令发送至家电设备。

为实现上述目的,本发明还提供一种语音输入装置,所述语音输入装置包括:

所述语音输入装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音输入程序,所述语音输入程序被所述处理器执行时实现如上述语音输入方法的步骤。

为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有语音输入程序,所述语音输入程序被处理器执行时实现如上述语音输入方法的步骤。

本发明提供的语音输入方法、语音输入装置以及计算机可读存储介质,在检测到语音输入按键信号时,获取所述语音输入按键信号的持续时长及/或预设时间间隔内接收到所述语音输入信号的次数;根据所述持续时长及/或次数确定语音输入模式以及所述语音输入模式的输入完成条件,并开始接收语音数据,所述语音输入模式包括长按输入模式和短按输入模式;在满足所述语音输入模式对应的输入完成条件时,停止接收所述语音数据,以完成语音输入。这样,实现语音输入的长按输入模式和短按输入模式的兼容,使得用户可以结合自身使用语音输入的使用习惯,选择适合自己的语音输入模式,改善了用户使用语音输入的体验。

附图说明

图1为本发明实施例方案涉及的实施例终端的硬件运行环境示意图;

图2为本发明语音输入方法的一实施例的流程示意图;

图3为本发明语音输入方法的另一实施例的流程示意图;

图4为本发明语音输入方法的又一实施例的流程示意图;

图5为本发明语音输入方法的再一实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明提供一种语音输入方法,实现语音输入的长按输入模式和短按输入模式的兼容,使得用户可以结合自身使用语音输入的使用习惯,选择适合自己的语音输入模式,改善了用户使用语音输入的体验。

如图1所示,图1是本发明实施例方案涉及的实施例终端的硬件运行环境示意图;

本发明实施例终端可以是语音输入装置、显示设备,也可以是显示设备的遥控器,也可以是服务器。

如图1所示,该终端可以包括:处理器1001,例如cpu中央处理器(centralprocessingunit),存储器1002,通信总线1003。其中,通信总线1003用于实现该终端中各组成部件之间的连接通信。存储器1002可以是高速ram随机存储器(random-accessmemory),也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1002可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的终端的结构并不构成对本发明实施例终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1002中可以包括语音输入程序。

在图1所示的终端中,处理器1001可以用于调用存储器1002中存储的语音输入程序,并执行以下操作:

在检测到语音输入按键信号时,获取所述语音输入按键信号的持续时长及/或预设时间间隔内接收到所述语音输入信号的次数;

根据所述持续时长及/或次数确定语音输入模式以及所述语音输入模式的输入完成条件,并开始接收语音数据,所述语音输入模式包括长按输入模式和短按输入模式;

在满足所述语音输入模式对应的输入完成条件时,停止接收所述语音数据,以完成语音输入。

进一步地,处理器1001可以调用存储器1002中存储的语音输入程序,还执行以下操作:

在所述持续时长大于预设阈值时,确定所述语音输入模式为所述长按输入模式;

在所述持续时长小于或者等于预设阈值时,确定所述语音输入模式为所述短按输入模式。

进一步地,处理器1001可以调用存储器1002中存储的语音输入程序,还执行以下操作:

在所述次数大于预设值时,确定所述语音输入模式为所述长按输入模式;

在所述次数小于或者等于预设值时,确定所述语音输入模式为所述短按输入模式。

进一步地,处理器1001可以调用存储器1002中存储的语音输入程序,还执行以下操作:

所述长按输入模式的输入完成条件为检测到所述语音输入按键信号断开及/或在预设时长内未接收到语音数据。

进一步地,处理器1001可以调用存储器1002中存储的语音输入程序,还执行以下操作:

所述短按输入模式的输入完成条件为再次检测到语音输入按键信号及/或在预设时长内未接收到语音数据。

进一步地,处理器1001可以调用存储器1002中存储的语音输入程序,还执行以下操作:

在语音输入完成后,将接收到的语音数据转换为文本信息;

显示所述文本信息。

进一步地,处理器1001可以调用存储器1002中存储的语音输入程序,还执行以下操作:

将所述文本信息输入到显示界面的文本输入框,以在所述文本输入框显示所述文本信息。

进一步地,处理器1001可以调用存储器1002中存储的语音输入程序,还执行以下操作:

在语音输入完成后,将接收到的语音数据发送至关联端;

或者,根据接收到的语音数据生成控制指令,并将所述控制指令发送至家电设备。

参照图2,在一实施例中,所述语音输入方法包括:

步骤s10、在检测到语音输入按键信号时,获取所述语音输入按键信号的持续时长及/或预设时间间隔内接收到所述语音输入信号的次数。

本实施例中,实施例终端可以是显示设备,如电视机、手机等;也可以是电视机的外接设备,如电视机的遥控器;也可以是连接有语音输入装置的服务器。以下以实施例终端为电视机为例进行说明。

本实施例中,用户可以通过电视机的遥控器进行语音输入,优选地,在遥控器上设置有语音输入按键。在该语音输入按键被按压时,会产生语音输入按键信号。需要说明的是,在终端为手机、平板等具有触摸显示屏的显示设备时,所述语音输入按键可以是显示界面的虚拟按键。

在用户按压语音输入按键产生语音输入按键信号时,终端即可检测到语音输入按键信号。终端在检测到语音输入信号时,便获取该语音输入信号的持续时长和/或预设时间间隔内接收到所述语音输入信号的次数。

具体地,语音输入信号的持续时长可以是等于语音输入按键的按压时长,在语音输入按键的被按压的时间越长,相对应地,语音输入信号的持续时长越长。

具体地,终端可以检测到遥控器发出的所有的keyevent按键事件,每一个按键事件对应为一次语音输入信号,语音输入信号的次数与语音输入按键被按压的时间成正比。在用户短按一次语音输入按键时,会产生一次keyevent按键事件,该按键事件的repeatcount重复计数属性为0,对应地,终端则会接收到一次语音输入信号;在用户一直按压语音输入按键时,在语音输入按键被按压的时间内,每隔一个与重复计数属性对应的计数时间,便会产生一次按键事件,在用户按压语音输入按键的时间为n个计数时间时,便会n+1次keyevent按键事件,这些按键事件的repeatcount重复计数属性依次为0,1,2,3,...,n,对应地,终端便可以获取到n+1次语音输入信号。需要说明的是,所述预设时间间隔时间大于或等于所述计数时间;产生语音信号的次数等于产生按键事件的次数。

进一步地,所述预设时间间隔设置为2秒。

步骤s20、根据所述持续时长及/或次数确定语音输入模式以及所述语音输入模式的输入完成条件,并开始接收语音数据,所述语音输入模式包括长按输入模式和短按输入模式。

本实施例中,在用户进行语音输入时,可以是通过确定的语音输入模式进行语音输入,其中,所述语音输入模式包括长按输入模式和短按输入模式。在检测到语音输入按键信号时,即可判定用户当前需要进行语音输入。

具体地,在用户按压语音输入按键时,终端可以根据用户按压语音输入按键产生的语音输入按键信号的持续时长及/或预设时间间隔内接收到所述语音信号的次数,确定当前的语音输入模式和与该语音输入模式对应的输入完成条件。

在根据所述持续时长确定语音输入模式时,可以是获取到的语音输入按键信号的持续时长大于预设阈值时,即可确定当前的语音输入模式为长按输入模式;在所述持续时长小于或者等于预设阈值时,即可确定当前的语音输入模式为短按输入模式。可选地,所述预设阈值为2秒。比如,在用户按压语音输入按键的时间大于2秒时,可以判定用户当前是想要应用长按输入模式来进行语音输入。

在预设时间间隔内接收到所述语音信号的次数确定语音输入模式时,可以是在接收到语音信号的次数大于预设值时,确定当前的语音输入模式为长按输入模式;在接收到语音信号的次数小于或者等于预设值时,确定当前的语音输入模式为短按输入模式。可选地,所述预设值为2次。比如,在2秒的时间内,终端接收到的语音信号的次数为1次时,可以判定用户当前是想要应用短按输入模式来进行语音输入。

需要说明的是,由于产生语音信号的次数与按键事件的产生次数对应,而每产生一次按键事件,则会引发一次重复计数属性的计数,因此,也可以是根据重复计数属性确定语音模式,具体地,在重复计数属性大于预设值时,确定当前的语音输入模式为长按输入模式;在重复计数属性小于或者等于预设值时,确定当前的语音输入模式为短按输入模式。所述预设值可以是1,也可以是0。

比如,在产生语音按键事件时,终端可以检查重复计数属性的值,如果等于0,则暂时判定为短按,如果在暂时判定为短按的情况下,在预设时间间隔内未再产生按键事件,重复计数属性的值依然为0,则该次事件一定是短按输入;如果在预设时间间隔内再次产生按键事件,则重复计数属性会大于0,则一定为长按输入。

这样,用户可以是通过长时间按压语音输入按键,以应用长按输入模式,也可以是通过短时间按压音输入按键,以应用短按输入模式。

具体地,长按输入模式的输入完成条件为检测到所述语音输入按键信号断开,及/或在预设时长内未接收到语音数据。

具体地,短按输入模式的输入完成条件为再次检测到语音输入按键信号及/或在预设时长内未接收到语音数据。

在确定当前应用的语音输入模式时,即可开始接收语音数据。当然,电视机可以通过遥控器接收语音数据。

步骤s30、在满足所述语音输入模式对应的输入完成条件时,停止接收所述语音数据,以完成语音输入。

在用户进行语音输入完成后,可以根据与当前应用的语音输入模式对应的输入完成条件退出语音输入。

具体地,在用户应用的是长按输入模式时,用户在语音输入的过程中一直按压语音输入按键,用户可以是通过释放语音输入按键以退出语音输入,这样,在用户释放语音输入按键后,不再产生语音输入按键信号,终端则无法再获取到语音输入按键信号,则判定语音输入按键信号断开,即可停止接收语音数据,并判定语音输入完成。

可选地,在用户应用的是长按输入模式时,终端也可以是通过vad语音活动检测(voiceactivitydetection)技术,在预设时长内未再检测到语音数据的输入时,即可停止接收语音数据,并判定语音输入完成。所述预设时长可以是5秒钟。这样,可以避免在用户误触到语音输入按键,或者在语音输入按键在不可抗力的情况下出现按键被一直按压的情况时,导致相应的语音输入设置一直处在语音输入状态。

具体地,在用户应用的是短按输入模式时,用户是在短时间内按压语音输入按键一下再释放,以应用短按输入模式进行语音输入,在应用短按输入模式的过程中,用户可以是通过再次按压语音输入按键以退出语音输入,这样,在用户再次按压语音输入按键后,终端再次接收到语音输入按键信号,即可停止接收语音数据,并判定语音输入完成。

可选地,在用户应用的是短按输入模式时,终端也可以是通过vad语音活动检测(voiceactivitydetection)技术,在预设时长内未再检测到语音数据的输入时,即可停止接收语音数据,并判定语音输入完成。所述预设时长可以是5秒钟。这样,可以避免在用户误触到语音输入按键,或者在语音输入按键在不可抗力的情况下出现按键被一直按压的情况时,导致相应的语音输入设置一直处在语音输入状态。

在一实施例中,在检测到语音输入按键信号时,获取所述语音输入按键信号的持续时长及/或预设时间间隔内接收到所述语音信号的次数;根据所述持续时长及/或次数确定语音输入模式以及所述语音输入模式的输入完成条件,并开始接收语音数据,所述语音输入模式包括长按输入模式和短按输入模式;在满足所述语音输入模式对应的输入完成条件时,停止接收所述语音数据,以完成语音输入。这样,实现语音输入的长按输入模式和短按输入模式的兼容,使得用户可以结合自身使用语音输入的使用习惯,选择适合自己的语音输入模式,改善了用户使用语音输入的体验。

在另一实施例中,如图3所示,在上述图2所示的实施例基础上,所述在满足所述语音输入模式对应的输入完成条件时,停止接收所述语音数据的步骤之后,还包括:

步骤s40、在语音输入完成后,将接收到的语音数据转换为文本信息。

步骤s50、显示所述文本信息。

步骤s51、将所述文本信息输入到显示界面的文本输入框,以在所述文本输入框显示所述文本信息。

本实施例中,实施例终端可以是显示设备,如电视机、手机、平板等。

在语音输入完成后,可以是将在语音输入过程中接收到的语音数据转换为文本信息,并在显示屏的显示界面显示通过将语音数据转换后得到的文本信息。

进一步地,实施例终端具有语音输入法功能,在终端将语音数据转换后得到的文本信息后,将该文本信息输入到显示界面的文本输入框,以在所述文本输入框显示所述文本信息。

这样,可以实现方便用户在显示设备输入文本信息。需要说明的是,语音输入法是输入字符的一种方式,将语音输入法应用到电视机中,可以解决电视端用户输入字符不方便的问题。

在又一实施例中,如图4所示,在上述图2至图3的实施例基础上,述在满足所述语音输入模式对应的输入完成条件时,停止接收所述语音数据的步骤之后,还包括:

步骤s60、在语音输入完成后,将接收到的语音数据发送至关联端。

本实施例中,实施例终端可以是电视机的遥控器,也可以是手机、平板等显示设备。

在实施例终端为手机时,所述关联端可以是该手机的即时通信端,比如另一台可以与该手机进行通信的手机。在手机接收语音数据完成后,可以是将接收到的语音数据发送到关联端,以进行语音信息的发送。

在实施例终端为电视遥控器时,所述关联端可以是电视机。在电视遥控器接收语音数据完成后,可以是将接收到的语音数据发送到电视机,以供电视机将语音数据转换为文本信息,并将所述文本信息输入到显示界面的文本输入框,以在所述文本输入框显示所述文本信息。这样,利用遥控器的便携性,可以方便用户利用电视机的语音输入法功能,将用户发出的语音转换问文字。

在再一实施例中,如图5所示,在上述图2至图4的实施例基础上,所述在满足所述语音输入模式对应的输入完成条件时,停止接收所述语音数据的步骤之后,还包括:

步骤s70、在语音输入完成后,根据接收到的语音数据生成控制指令,并将所述控制指令发送至家电设备。

本实施例中,实施例终端可以是家电设备的遥控器,也可以是手机、平板等移动设备。需要说明的是,所述移动设备可以用于向家电设备发送控制指令。

在语音输入完成后,终端可以对接收到的语音数据进行语音识别,并根据识别到的语音内容生成对应的控制指令。在生成控制指令后,将该控制指令发送至与控制指令对应的家电设备,以供家电设备执行所述控制指令。

比如,在接收到的语音数据为“开风扇”,则终端可以生成电风扇的开机指令。

在一实施例中,在语音输入完成后,根据接收到的语音数据生成控制指令,并将所述控制指令发送至家电设备。这样,方便用户控制家电设备。

此外,本发明还提出一种语音输入装置,所述语音输入装置包括存储器、处理器及存储在存储器上并可在处理器上运行的语音输入程序,所述处理器执行所述语音输入程序时实现如以上实施例所述的语音输入方法的步骤。

需要说明的是,语音输入转置可以是电视机、手机、平板、电视遥控器等。

此外,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质包括语音输入程序,所述语音输入程序被处理器执行时实现如以上实施例所述的语音输入方法的步骤。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是电视机,手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1