一种语音录入方法及系统的制作方法

文档序号:2827557阅读:448来源:国知局
一种语音录入方法及系统的制作方法
【专利摘要】本发明公开了一种语音录入方法及系统,属于语音录入【技术领域】。该语音录入方法包括:实时接收用户语音录入时的音频信号;对所述音频信号进行端点检测,并根据检测结果确定所述音频信号中的语音是否处于停顿状态;如果是,则按照预设周期计算端点时间,并根据计算结果向用户展示端点提示信息,直到本次停顿结束;所述端点时间包括:当前时刻到当前语音子句自动结束的剩余时间。该语音录入方法及系统,能够有效提高语音录入质量,进而提高语音识别的准确性。
【专利说明】—种语音录入方法及系统

【技术领域】
[0001]本发明涉及语音录入【技术领域】,特别涉及一种语音录入方法及系统。

【背景技术】
[0002]经过多年的技术发展,语音录入作为一种重要的非键盘输入方法在PC、智能手机等便携设备上得到了广泛的应用。通常情况下,语音识别系统在获取用户录入的语音后,对语音信号进行解码得到文本字串,然后反馈给用户。而语音识别的准确率和语音录入的质量有很大关系。通常情况下,录入语音的口音越标准,速率越平稳,停顿越精确,音量越适中,则语音质量越高,相应地语音识别的准确率也越高。
[0003]如图1所示,为现有技术中的语音录入方法的流程图。
[0004]现有技术中的语音录入方法,通常包括以下步骤:
[0005]步骤101:接收到用户的录音启动指令后,开始实时接收用户语音录入时的音频信号。
[0006]其中,录音启动指令通常为用户对录音启动按钮的触发信号,可以通过手动按下启动按钮,开始进行录音。
[0007]步骤102:对音频信号进行语音分析,并向用户展示分析结果。
[0008]其中,对音频信号进行语音分析,主要包括对语音音量或信号幅度(能够指示声音的高低)进行分析,采用指示器上的能量条数目的多少来表示语音音量的高低,从而使用户能够在录入语音时控制音量的高低。
[0009]步骤103:如果接收到用户的录音结束指示,则停止语音录入,否则继续进行语音录入。
[0010]其中,录音结束指令通常为用户对录音结束按钮的触发信号,可以通过手动按下结束按钮,停止语音录入。当然也可以通过预置的端点检测模块对录音是否结束进行自动判断。
[0011]现有技术中的语音录入方法,由于语音分析结果中通常只包含音量相关信息,根据分析结果只能对语音录入音量的高低进行调整,而无法控制语音录入速度,也不知道应该在何时进行停顿,很容易因为语音录入速度不合适而导致语音录入质量低下,从而无法进行语音识别或者识别准确率较低。


【发明内容】

[0012]本发明实施例的目的在于提供一种语音录入方法及系统,能够有效提高语音录入质量,进而提高语音识别的准确性。
[0013]本发明实施例提供的技术方案如下:
[0014]一方面,提供了一种语音录入方法,包括:
[0015]实时接收用户语音录入时的音频信号;
[0016]对所述音频信号进行端点检测,并根据检测结果确定所述音频信号中的语音是否处于停顿状态;
[0017]如果是,则按照预设周期计算端点时间,并根据计算结果向用户展示端点提示信息,直到本次停顿结束;所述端点时间包括:当前时刻到当前语音子句自动结束的剩余时间。
[0018]优选地,所述端点时间还包括:当前时刻到本次语音录入自动结束的剩余时间。
[0019]优选地,所述按照预设周期计算端点时间包括:计算当前时刻到当前语音子句自动结束的剩余时间和当前时刻到本次语音录入自动结束的剩余时间;
[0020]所述计算当前时刻到当前语音子句自动结束的剩余时间,包括:获取第一预设时长和本次语音信号停顿所持续的时长,将所述第一预设时长减去所述本次语音信号停顿所持续的时长得到所述当前时刻到当前语音子句自动结束的剩余时间;
[0021]所述计算当前时刻到本次语音录入自动结束的剩余时间,包括:获取第二预设时长和本次语音信号停顿所持续的时长,将所述第二预设时长减去所述本次语音信号停顿所持续的时长得到所述当前时刻到本次语音录入自动结束的剩余时间;
[0022]所述第一预设时长为语音子句间的最小时间间隔;所述第二预设时长为检测到语音的结束端点到本次语音录入自动结束的时间。
[0023]优选地,所述根据计算结果向用户展示端点提示信息,直到本次停顿结束包括:
[0024]如果所述当前时刻到当前语音子句自动结束的剩余时间和当前时刻到本次语音录入自动结束的剩余时间都大于零,则向用户展示所述当前时刻到当前语音子句自动结束的剩余时间和当前时刻到本次语音录入自动结束的剩余时间;
[0025]如果所述当前时刻到当前语音子句自动结束的剩余时间小于或等于零,且所述当前时刻到本次语音录入自动结束的剩余时间大于零,则向用户展示语音子句结束提示信息,并向用户展示所述当前时刻到本次语音录入自动结束的剩余时间;
[0026]如果所述当前时刻到本次语音录入自动结束的剩余时间小于或等于零,则向用户展示本次语音录入自动结束提示信息。
[0027]优选地,所述向用户展示端点提示信息包括:
[0028]采用数字图示、进度条、提示音这三者中的任一种或多种方式向用户展示端点提不?目息。
[0029]另一方面,提供了一种语音录入系统,包括:
[0030]接收模块,用于实时接收用户语音录入时的音频信号;
[0031]端点检测模块,用于对所述音频信号进行端点检测;
[0032]确定模块,用于根据所述端点检测模块的检测结果确定所述音频信号中的语音是否处于停顿状态;
[0033]计算模块,用于在所述确定模块确定所述音频信号中的语音处于停顿状态后,按照预设周期计算端点时间;所述端点时间包括:当前时刻到当前语音子句自动结束的剩余时间;
[0034]展示模块,用于根据所述计算模块的计算结果向用户展示端点提示信息,直到本次停顿结束。
[0035]优选地,所述端点时间还包括:当前时刻到本次语音录入自动结束的剩余时间。
[0036] 优选地,所述计算模块包括:
[0037]第一计算单元,用于在所述确定模块确定所述音频信号中的语音处于停顿状态后,按照预设周期计算当前时刻到当前语音子句自动结束的剩余时间,包括:获取第一预设时长和本次语音信号停顿所持续的时长,将所述第一预设时长减去所述本次语音信号停顿所持续的时长得到所述当前时刻到当前语音子句自动结束的剩余时间,所述第一预设时长为语音子句间的最小时间间隔;
[0038]第二计算单元,用于在所述确定模块确定所述音频信号中的语音处于停顿状态后,按照预设周期计算当前时刻到本次语音录入自动结束的剩余时间,包括:获取第二预设时长和本次语音信号停顿所持续的时长,将所述第二预设时长减去所述本次语音信号停顿所持续的时长得到所述当前时刻到本次语音录入自动结束的剩余时间,所述第二预设时长为检测到语音的结束端点到本次语音录入自动结束的时间。
[0039]优选地,所述展示模块,具体用于在所述当前时刻到当前语音子句自动结束的剩余时间和当前时刻到本次语音录入自动结束的剩余时间都大于零时,向用户展示所述当前时刻到当前语音子句自动结束的剩余时间和当前时刻到本次语音录入自动结束的剩余时间;在所述当前时刻到当前语音子句自动结束的剩余时间小于或等于零,且所述当前时刻到本次语音录入自动结束的剩余时间大于零时,向用户展示语音子句结束提示信息,并向用户展示所述当前时刻到本次语音录入自动结束的剩余时间;在所述当前时刻到本次语音录入自动结束的剩余时间小于或等于零时,向用户展示本次语音录入自动结束提示信息。
[0040]优选地,所述展示模块,具体用于采用数字图示、进度条、提示音这三者中的任一种或多种方式向用户展示端点提示信息。
[0041]本发明实施例提供的语音录入方法及系统,通过端点检测确定语音信号是否处于停顿状态,当语音信号处于停顿状态时,通过向用户展示端点提示信息,使用户能够知晓当前时刻到当前语音子句自动结束的剩余时间,从而对语音录入速度进行调整,并选择在合适的时刻才进行停顿,能够有效提升语音录入质量,进而提高语音识别的准确率。

【专利附图】

【附图说明】
[0042]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
[0043]图1为现有技术中的语音录入方法的流程图;
[0044]图2为本发明实施例提供的语音录入方法的流程图;
[0045]图3为本发明实施例提供的语音录入系统的一种结构示意图;
[0046]图4为本发明实施例提供的语音录入系统的另一种结构示意图。

【具体实施方式】
[0047]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
[0048]本发明实施例提供一种语音录入方法及系统,通过向用户展示端点提示信息,使用户能够对语音录入速度进行调整,并合理控制语音停顿时刻以及停顿持续时间,从而有效提高语音录入质量,进而使语音识别的准确性得到提高。
[0049]如图2所示,为本发明实施例提供的一种语音录入方法的流程图,包括以下步骤:
[0050]步骤201:实时接收用户语音录入时的音频信号。
[0051]步骤202:对音频信号进行端点检测,并根据检测结果确定音频信号中的语音是否处于停顿状态。
[0052]由于音频信号中的语音信号呈现出短时平稳性特点,可以通过对音频信号做分帧处理,将整音频分割成特定长度的子段,从而保证子段音频的频谱连续性。基于每次所能处理的音频信号的长度有限,还需要对音频信号做加窗处理,从而使每次所处理的音频信号限于窗内的信号。具体可以采用加汉明窗或汉宁窗等加窗处理。优选地,子段音频的每帧长度为25ms,帧移为10ms。对于一段特定长度的音频,经过分帧和加窗处理后,可以得到多个语音帧。其中,语音帧是音频信号中语音和非语音判决的最小单元。
[0053]端点检测实质上通过对所得到的每个语音帧中的特征信息,例如,时域能量、频域能量或过零率等进行计算,从而对语音和非语音进行区分,其中,非语音既可以是静音,还可以是噪音。由于对安静环境下的音频信号,语音段能量通常比非语音段能量高,语音信号的过零率通常比非语音信号的过零率要低,其中,过零率指在单位时间内音频信号采样值通过零点(从正变为负或从负变为正)的次数。通过对以上特征信息的计算,能够有效对语音和非语音进行区分,从而可以判断当前的音频信号是语音信号还是非语音信号。当判定当前的音频信号为非语音信号时,可以认为音频信号中的语音处于停顿状态,因此,通过端点检测能够有效识别音频信号中语音的开始端点和结束端点。
[0054]步骤203:如果是,则按照预设周期计算端点时间,并根据计算结果向用户展示端点提示信息,直到本次停顿结束。
[0055]如果根据端点检测结果,确定音频信号中的语音没有发生停顿,也可以按照预设周期向用户反馈语音信号未停顿提示信息,从而使用户在看到该信息后知道语音信号未发生停顿。
[0056]当检测到语音信号停顿一定时间,结束停顿状态继续进行语音录入时,可以使端点时间恢复默认值(例如清零),当再次检测到语音信号发生停顿时,再按照预设周期计算更新的端点时间。其中,可以通过上述端点检测确定用户是否继续进行语音录入,如果检测结果显示语音信号停顿一段时间后结束停顿状态,可以认为用户继续进行语音录入,否则,可以认为语音信号持续处于停顿状态。
[0057]上述端点时间可以包括:当前时刻到当前语音子句自动结束的剩余时间,以Mms (毫秒)表示。由于数据处理速度固定,可以将每次所能处理的音频信号的数据量折算为时间长度,以Kms表示,则从语音信号发生停顿时刻开始到停顿结束,每间隔K ms计算并反馈一次新的端点时间,同时向用户展示端点提示信息。在本发明实施例中,为便于描述,可以将K称为反馈间隔时间或预设周期。通过计算端点时间M可以知道,从当前时刻开始,语音信号再发生多长时间的停顿,当前语音子句将自动结束。
[0058]上述端点时间还可以包括:当前时刻到本次语音录入自动结束的剩余时间,以Nms表示。通过计算端点时间N可以知道,从当前时刻开始,语音信号再发生多长时间的停顿,本次语音录入将自动结束。优选地,N^M0
[0059]在本发明实施例中,可以预先设置两个时间长度:第一预设时长T1和第二预设时长1~2。其中,第一预设时长T1指语音子句间的最小时间间隔,第二预设时长T2指检测到语音的结束端点到本次语音录入自动结束的时间,则有O≤M≤?\,0≤N≤T2。当语音信号发生停顿后,将停顿所持续的时间长度以Ts表示,则如果停顿所持续的时间长度Ts大于或等于T1,则判决停顿前后的语音信号处于不同的语音子句中;如果停顿所持续的时间长度Ts小于T1,则判决停顿前后的语音信号处于同一个语音子句中;如果停顿所持续的时间长度Ts大于或等于T2,则判决本次语音录入自动结束。优选地,可以将T1设置300~400ms,T2设置为1000~2000ms,K设置为50ms。
[0060]由于语音信号发生停顿后,第一次反馈的停顿所持续的时间长度Ts不会超过反馈间隔时间K,则显然有Ts ( K。由于第一次反馈端点时间时,停顿所持续的时间长度为Ts,那么M的初始反馈值为M0 = T1-Ts, N的初始反馈值为Ntl = T2-Ts,此后,如果语音信号仍然处于停顿状态,则每间隔KmsJi M和N作如下处理=Mi = Mi^1-K, Ni = N^-K。
[0061]上述按照预设周期计算端点时间包括:计算当前时刻到当前语音子句自动结束的剩余时间M和当前时刻到本次语音录入自动结束的剩余时间N ;其中,当前时刻到当前语音子句自动结束的剩余时间M,可以通过第一预设时长T1减去本次语音信号停顿所持续的时长Ts计算得到;当前时刻到本次语音录入自动结束的剩余时间N,可以通过第二预设时长丁2减去本次语音信号停顿所持续的时长Ts计算得到。
[0062]其中,根据端点时间的计算结果向用户展示端点提示信息,直到本次停顿结束主要包括以下几种情况:
[0063](I)Mi > O, Ni > 0,则向用户展示的端点提示信息包括Mi和Ni的值。
[0064]当前时刻到当前语音子句自动结束的剩余时间Mi > 0,可以认为语音信号仍然处于停顿状态,并且没有发生当前语音子句自动结束的判决;当前时刻到本次语音录入自动结束的剩余时间Ni > 0,可以认为语音信号仍然处于停顿状态,并且没有发生本次语音录入自动结束的判决。此时,通过向用户展示Mi和Ni的值,可以使用户直观地看到还剩多少时间当前语音子句将自动结束,以及还剩多少时间本次语音录入将自动结束,从而使用户对语音录入速度、语音停顿时刻和停顿持续时间进行控制。
[0065](2)Mi ( O, Ni > O,则向用户展示的端点提示信息包括语音子句结束提示信息和Ni的值。
[0066]当前时刻到当前语音子句自动结束的剩余时间Mi ( 0,可以认为语音信号仍然处于停顿状态,但停顿持续时间大于或等于语音子句间的最小时间间隔T1,已经发生语音子句结束判决;当前时刻到本次语音录入自动结束的剩余时间Ni > 0,可以认为语音信号仍然处于停顿状态,并且没有发生本次语音录入自动结束的判决。此时,可以向用户展示语音子句结束提示信息,并向用户展示当前时刻到本次语音录入自动结束的剩余时间,可以使用户直观地看到还剩多少时间本次语音录入将自动结束,从而使用户对语音录入速度、语音停顿时刻和停顿持续时间进行控制。
[0067](3)Ni ( O,向用户展示的端点提示信息包括本次语音录入自动结束提示信息。
[0068]如果当前时刻到本次语音录入自动结束的剩余时间Ni ( 0,可以认为语音信号仍然处于停顿状态,并且已经发生本次语音录入自动结束的判决。此时,可以向用户展示本次语音录入自动结束提示信息,从而使用户对语音录入速度、语音停顿时刻和停顿持续时间进行控制。需要说明的是,本次语音录入自动结束后,可以不再按照预设周期计算端点时间,可以在重新开始语音录入后,直到再次检测到语音信号处于停顿状态时,再按照预设周期计算端点时间。
[0069]向用户展示端点提示信息的方式多种多样,可以根据需要进行设置,例如,可以采用数字图示、进度条、提示音这三者中的任一种或多种方式向用户展示端点提示信息,从而使用户能够对录音状态进行直观了解,及时对语音录入速度、语音停顿时刻和停顿持续时间进行调整,从而得到高质量的录音,进而提高语音识别准确率。
[0070]以下通过一个具体的例子,对本发明实施例的技术方案进行详细说明。
[0071]例如,用户所录入的音频信号为:今天//天气很好//我准备去郊游//。其中,“//”位置代表语音信号发生停顿。假设“今天”和“天气”中间停顿所持续的时间为200ms,“很好”和“我”中间停顿所持续的时间为500ms,“郊游”后面用户保持停顿1500ms。那么,在用户刚说完“今天”后,开始发生停顿,此时,M = T1 = 400ms, N = T2 = 1200ms。然后经过200ms的停顿,M减少到200ms,表示还需停顿200ms才会判决“今天”这个语音子句结束,N减少到1000ms,表示还需停顿IOOOms才会判决本次语音录入自动结束。但是,由于用户结束停顿,开始说“天气”,即M和N都没有减少到0,M和N将恢复到原来的默认值(可以将默认值设置为O)直到“很好”说完再次发生停顿,此时,M = T1 = 400ms, N = T2 = 1200ms,然后中间停顿500ms,在停顿到400ms时,M减少为O,发生“今天天气很好”这个语音子句结束判决,但是在500ms停顿结束时N = 700ms,仍然未减少到0,所以,未发生本次语音录入自动结束判决。“我准备去郊游”说完发生停顿1500ms,在停顿到400ms时,M减少为0,发生“我准备去郊游”这个语音子句结束判决,在停顿到1200ms时,N减少为0,发生本次语音录入自动结束判决,即使用户继续说话也无法录入语音。
[0072]本发明实施例提供的语音录入方法,通过端点检测确定语音信号是否处于停顿状态,当语音信号处于停顿状态时,通过向用户展示端点提示信息,使用户能够知晓当前时刻到当前语音子句自动结束的剩余时间,从而对语音录入速度进行调整,并选择在合适的时刻才进行停顿,能够有效提升语音录入质量,进而提高语音识别的准确率。
[0073]相应地,本发明实施例还提供了一种语音录入系统,其结构示意图如图3所示,该语音录入系统包括:
[0074]接收模块301,用于实时接收用户语音录入时的音频信号;
[0075]端点检测模块302,用于对音频信号进行端点检测;
[0076]确定模块303,用于根据端点检测模块的检测结果确定音频信号中的语音是否处于停顿状态;
[0077]计算模块304,用于在确定模块确定音频信号中的语音处于停顿状态后,按照预设周期计算端点时间;其中,端点时间包括:当前时刻到当前语音子句自动结束的剩余时间;
[0078]展示模块305,用于根据计算模块的计算结果向用户展示端点提示信息,直到本次停顿结束。
[0079]进一步地,上述端点时间还可以包括:当前时刻到本次语音录入自动结束的剩余时间。
[0080]如图4所示,上述计算模块304可以包括:
[0081]第一计算单元401,用于在确定模块确定音频信号中的语音处于停顿状态后,按照预设周期计算当前时刻到当前语音子句自动结束的剩余时间,包括:获取第一预设时长和本次语音信号停顿所持续的时长,将第一预设时长减去本次语音信号停顿所持续的时长得到当前时刻到当前语音子句自动结束的剩余时间,第一预设时长为语音子句间的最小时间间隔;
[0082]第二计算单元402,用于在确定模块确定音频信号中的语音处于停顿状态后,按照预设周期计算当前时刻到本次语音录入自动结束的剩余时间,包括:获取第二预设时长和本次语音信号停顿所持续的时长,将第二预设时长减去本次语音信号停顿所持续的时长得到当前时刻到本次语音录入自动结束的剩余时间,第二预设时长为检测到语音的结束端点到本次语音录入自动结束的时间。
[0083]其中,展示模块305,具体用于在当前时刻到当前语音子句自动结束的剩余时间和当前时刻到本次语音录入自动结束的剩余时间都大于零时,向用户展示当前时刻到当前语音子句自动结束的剩余时间和当前时刻到本次语音录入自动结束的剩余时间;在当前时刻到当前语音子句自动结束的剩余时间小于或等于零,且当前时刻到本次语音录入自动结束的剩余时间大于零时,向用户展示语音子句结束提示信息,并向用户展示当前时刻到本次语音录入自动结束的剩余时间;在当前时刻到本次语音录入自动结束的剩余时间小于或等于零时,向用户展示本次语音录入自动结束提示信息。
[0084]上述展示模块305,具体用于采用数字图示、进度条、提示音这三者中的任一种或多种方式向用户展示端点提示信息。
[0085]本发明实施例提供的语音录入系统,通过端点检测确定语音信号是否处于停顿状态,当语音信号处于停顿状态时,通过向用户展示端点提示信息,使用户能够知晓当前时刻到当前语音子句自动结束的剩余时间,从而对语音录入速度进行调整,并选择在合适的时刻才进行停顿,能够有效提升语音录入质量,进而提高语音识别的准确率。
[0086]本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0087]以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【权利要求】
1.一种语音录入方法,其特征在于,包括: 实时接收用户语音录入时的音频信号; 对所述音频信号进行端点检测,并根据检测结果确定所述音频信号中的语音是否处于停顿状态; 如果是,则按照预设周期计算端点时间,并根据计算结果向用户展示端点提示信息,直到本次停顿结束;所述端点时间包括:当前时刻到当前语音子句自动结束的剩余时间。
2.根据权利要求1所述的方法,其特征在于,所述端点时间还包括:当前时刻到本次语音录入自动结束的剩余时间。
3.根据权利要求2所述的方法,其特征在于,所述按照预设周期计算端点时间包括:计算当前时刻到当前语音子句自动结束的剩余时间和当前时刻到本次语音录入自动结束的剩余时间; 所述计算当前时刻到当前语音子句自动结束的剩余时间,包括:获取第一预设时长和本次语音信号停顿所持续的时长,将所述第一预设时长减去所述本次语音信号停顿所持续的时长得到所述当前时刻到当前语音子句自动结束的剩余时间; 所述计算当前时刻到本次语音录入自动结束的剩余时间,包括:获取第二预设时长和本次语音信号停顿所持续的时长,将所述第二预设时长减去所述本次语音信号停顿所持续的时长得到所述当前时刻到本次语音录入自动结束的剩余时间; 所述第一预设时长为语音子句间的最小时间间隔;所述第二预设时长为检测到语音的结束端点到本次语音录入自动结束的时间。
4.根据权利要求3所述的方法,其特征在于,所述根据计算结果向用户展示端点提示信息,直到本次停顿结束包括: 如果所述当前时刻到当前语音子句自动结束的剩余时间和当前时刻到本次语音录入自动结束的剩余时间都大于零,则向用户展示所述当前时刻到当前语音子句自动结束的剩余时间和当前时刻到本次语音录入自动结束的剩余时间; 如果所述当前时刻到当前语音子句自动结束的剩余时间小于或等于零,且所述当前时刻到本次语音录入自动结束的剩余时间大于零,则向用户展示语音子句结束提示信息,并向用户展示所述当前时刻到本次语音录入自动结束的剩余时间; 如果所述当前时刻到本次语音录入自动结束的剩余时间小于或等于零,则向用户展示本次语音录入自动结束提示信息。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述向用户展示端点提示信息包括: 采用数字图示、进度条、提示音这三者中的任一种或多种方式向用户展示端点提示信肩、O
6.一种语音录入系统,其特征在于,包括: 接收模块,用于实时接收用户语音录入时的音频信号; 端点检测模块,用于对所述音频信号进行端点检测; 确定模块,用于根据所述端点检测模块的检测结果确定所述音频信号中的语音是否处于停顿状态; 计算模块,用于在所述确定模块确定所述音频信号中的语音处于停顿状态后,按照预设周期计算端点时间;所述端点时间包括:当前时刻到当前语音子句自动结束的剩余时间; 展示模块,用于根据所述计算模块的计算结果向用户展示端点提示信息,直到本次停顿结束。
7.根据权利要求6所述的系统,其特征在于,所述端点时间还包括:当前时刻到本次语音录入自动结束的剩余时间。
8.根据权利要求7所述的系统,其特征在于,所述计算模块包括: 第一计算单元,用于在所述确定模块确定所述音频信号中的语音处于停顿状态后,按照预设周期计算当前时刻到当前语音子句自动结束的剩余时间,包括:获取第一预设时长和本次语音信号停顿所持续的时长,将所述第一预设时长减去所述本次语音信号停顿所持续的时长得到所述当前时刻到当前语音子句自动结束的剩余时间,所述第一预设时长为语音子句间的最小时间间隔; 第二计算单元,用于在所述确定模块确定所述音频信号中的语音处于停顿状态后,按照预设周期计算当前时刻到本次语音录入自动结束的剩余时间,包括:获取第二预设时长和本次语音信号停顿所持续的时长,将所述第二预设时长减去所述本次语音信号停顿所持续的时长得到所述当前时刻到本次语音录入自动结束的剩余时间,所述第二预设时长为检测到语音的结束端点到本次语音录入自动结束的时间。
9.根据权利要求 8所述的系统,其特征在于: 所述展示模块,具体用于在所述当前时刻到当前语音子句自动结束的剩余时间和当前时刻到本次语音录入自动结束的剩余时间都大于零时,向用户展示所述当前时刻到当前语音子句自动结束的剩余时间和当前时刻到本次语音录入自动结束的剩余时间;在所述当前时刻到当前语音子句自动结束的剩余时间小于或等于零,且所述当前时刻到本次语音录入自动结束的剩余时间大于零时,向用户展示语音子句结束提示信息,并向用户展示所述当前时刻到本次语音录入自动结束的剩余时间;在所述当前时刻到本次语音录入自动结束的剩余时间小于或等于零时,向用户展示本次语音录入自动结束提示信息。
10.根据权利要求6至9任一项所述的系统,其特征在于: 所述展示模块,具体用于采用数字图示、进度条、提示音这三者中的任一种或多种方式向用户展示端点提示信息。
【文档编号】G10L25/87GK104078076SQ201410265393
【公开日】2014年10月1日 申请日期:2014年6月13日 优先权日:2014年6月13日
【发明者】潘青华, 钱柄桦, 何婷婷, 王智国, 胡郁, 刘庆峰 申请人:科大讯飞股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1