一种语音训练方法、装置、计算机设备及其存储介质与流程

文档序号:18239335发布日期:2019-07-24 08:54阅读:150来源:国知局
一种语音训练方法、装置、计算机设备及其存储介质与流程

本发明属于计算机领域,尤其涉及一种语音训练方法、装置、计算机设备及其存储介质。



背景技术:

随着人们生活水平的提高,人们对于各方面的感官体验的要求也越来越高,其中对于声音的感知尤为敏感,尤其是播音、唱歌等方面,具有标准的发音是最基础的标准,并且对于个人的外语、普通话等,都希望能够有一个正确的发音,因此,语音训练器应运而生。

现有的语音训练器较少,而且基本都是让训练者先听标准音的发音,然后训练者根据自己听到的标准音进行发声训练,但是这样练习存在一定的时间差,并且因为人体构造的原因,训练者听到自己的声音和别人听到自己的声音是不同的,所以训练者无法及时发现自己声音与标准音的区别,很难主动去纠正自己的错误,训练效果不佳。

由此可见,现有的语音训练器存在被训练者无法同时听到自己的原声和标准语音,导致纠错不及时,训练效果差的技术问题,急需解决。



技术实现要素:

本发明实施例的目的在于提供一种语音训练方法,旨在解决现有的语音训练器存在被训练者无法同时听到自己的原声和标准语音,导致纠错不及时,训练效果差的技术问题。

本发明实施例是这样实现的,提供一种语音训练方法,所述方法包括:

获取被训练者根据标准语音发出的原声;

将所述原声和所述标准语音进行处理,以使所述原声和所述标准语音的播放同步;

通过第一声道将所述原声反馈至所述被训练者,同时通过第二声道将所述标准语音反馈至所述被训练者,以使所述被训练者及时发现发音错误并纠正。

本发明实施例的另一目的在于提供一种语音训练装置,用于根据上述实施例所述语音训练方法对训练者进行语音发音训练,包括:

要求所述语音训练方法对训练者进行语音发音训练,包括:

声音获取单元,用于获取训练者根据标准语音发出的原声;

声音处理单元,用于将所述原声和所述标准语音进行处理,以使所述原声和所述标准语音的播放同步;以及

声音输出单元,用于通过第一声道将所述原声反馈至所述被训练者,同时通过第二声道将所述标准语音反馈至所述被训练者,以使所述被训练者及时纠正发音。

本发明实施例的另一目的在于提供一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述实施例所述语音训练方法的步骤。

本发明实施例的另一目的在于提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述实施例所述语音训练方法的步骤。

本发明实施例通过获取被训练者根据标准语音发出的原声,并将所述原声和所述标准语音通过不同的声道反馈至被训练者,便于被训练者根据自己听到的自己的原声和标准语音之间的区别,能够实时调整自己的发音,反馈及时;还通过将原声和标准语音进行对比,并输出对比结果,便于被训练者根据所述结果更加准确的调整自己的发音,被训练者能够两次得知自己发音与标准语音的区别并做出调整,语音训练效果高,效率高。

附图说明

图1为本发明实施例提供的语音训练方法的应用环境图;

图2为本发明实施例提供的语音训练方法的流程图;

图3为本发明实施例提供的语音训练方法步骤S202的流程图;

图4为本发明实施例提供的语音训练方法步骤S202的又一种流程图;

图5为本发明实施例提供的标准语音的波形图;

图6为本发明实施例提供的原声的波形图;

图7为本发明实施例提供的语音训练装置结构示意图;

图8为本发明实施例提供的计算机设备的内部结构图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但除非特别说明,这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一时长称为第二时长,且类似地,可将第二时长称为第一时长。

图1为本发明实施例提供的语音训练方法的应用环境图,如图1所示,在该应用环境中,包括终端语音输入设备110、语音输出设备120、处理器130以及结果输出装置140。

语音输入设备110用于接收被训练者发出的原声,可以是驻极体话筒、集声器,可以说是动圈式话筒,也可以是电容话筒,可以是有线话筒,也可以是无线话筒,本发明不做限制。

语音输出设备120用于输出语音输入设备110接收的被训练中发出的原声和所述原声对应的标准语音,一般采用耳机设备,可以是常规的佩戴的耳机,如入耳式、挂耳式、颈挂式耳机等,可以是有线耳机也可以是无线耳机,还可以采用骨传导耳机等,本发明不做限制。

处理器130用于处理所述原声和所述标准语音,可以是一个微处理器,如CPU、MCU等,也可以是单片机、FPGA等集成控制电路,可以对原声和标准语音进行放大处理,还可以对原声和标准语音进行对比,得到对比结果。

结果输出装置140用于输出所述对比结果,可以是音频信息输出装置,如耳机、音响等,也可以是视频信息输出装置,如显示屏等,本发明不做限制。

作为本发明一种实施例,被训练者采用本发明实施例提供的语音训练方法进行训练时,被训练者需要佩戴所述语音输出设备120,并根据自己需要练习的标准语音对着所述语音输入设备110发音,语音输入设备110接受到被训练者的发出的原音后,处理器130会控制所述语音输出设备120通过两个声道同时输出被训练者发出是原音和所述标准语音,被训练者可以根据自己听到的自己的原音和所述标准语音之间的区别,及时更正自己的发音错误,同时所述处理器130会对所述原音和所述标准语音进行对比,并通过所述结果输出装置140输出对比结果,被训练者还可以根据所述结果输出装置输出的对比结果查找自己发音的不足,进一步对自己的发音进行改正。

本发明实施例通过获取被训练者根据标准语音发出的原声,并将所述原声和所述标准语音通过不同的声道反馈至被训练者,便于被训练者根据自己听到的自己的原声和标准语音之间的区别,能够实时调整自己的发音,反馈及时;还通过将原声和标准语音进行对比,并输出对比结果,便于被训练者根据所述结果更加准确的调整自己的发音,被训练者能够两次得知自己发音与标准语音的区别并做出调整,语音训练效果高,效率高。

如图2所示,在一个实施例中,提出了一种语音训练方法,本实施例主要以该方法应用于上述图1中的处理器130来举例说明。一种语音方法,具体可以包括以下步骤:

步骤S202,获取被训练者根据标准语音发出的原声。

在本发明实施例中,获取可以是直接通过话筒接受被训练者发出的声音,也可以是获取提前录制好的被训练者的声音,被训练者是指需要训练自己发音,通过本申请公开的语音训练方法进行语音发音训练的人,标准语音是指被训练者需要训练的语音的标准发音,根据各种语音的标准发音录制,如汉语则根据国家普通话标准的发音进行录制,英语可以根据标准的美式发音或者英式发音标准进行录制;原声是指被训练者发出的声音。

作为本发明一种实施例,获取被训练者根据标准语音发出的原声,被训练者发出的原声的内容与标准语音的内容相同,作为本发明一种优选的实施例,先播放标准语音给被训练者听,然后获取被训练者发出的原声;作为本发明又一个优选的实施例,直接获取被训练者发出的原声,然后根据原声自动匹配出标注语音。

步骤S204,将所述原声和所述标准语音进行处理,以使所述原声和所述标准语音的播放同步。

在本发明实施例中,播放同步是指原声和标准语音同时进行播放时,标准语音和原声中每个字符的播放节奏是相互对应的,处理是指对原声和标准语音的播放时间和播放节奏进行调整,使得在播放所述原声和所述标准语音时,原声与标准语音每个字符相互对应。

作为本发明一个实施例,标准语音为标准普通话版的“吃葡萄不吐葡萄皮”,但是被训练者发出的原音可能会存在一些前面或者后面的空白,在处理原声时,需要对原声进行剪辑,使得原声中也只包含了“吃葡萄不吐葡萄皮”这一段话的内容,前后不会出现留白;作为本发明又一种实施例,原声中只剩下“吃葡萄不吐葡萄皮”,但是原声的语速较快,导致原声与标准语音的播放速度不一致,此时对原声和标准语音进行处理时,可以将原声的播放速度变慢或者将标准语音的播放速度调快,以保证原声与标准语音的同步播放。

本发明实施例通过对原声和标准语音的处理,能够保证原声与标准语音的播放同步,保证被训练者听到的是同步的声音,提升语音训练效果。

步骤S206,通过第一声道将所述原声反馈至所述被训练者,同时通过第二声道将所述标准语音反馈至所述被训练者,以使所述被训练者及时发现发音错误并纠正。

在本发明实施例中,第一声道和第二声道是指用于播放语音的声道,分别对应被训练者的左右两边的听力系统,将原声反馈给被训练者的形式可以是通过气传导的耳机,如有限耳机、无线耳机、耳塞式耳机、耳罩式耳机等,也可以是通过骨传导的方式将原声或者标准语音反馈至被训练者,如采用骨传导耳机等;其中将原声和标准语音反馈至被训练者是,要保证原声与标准语音的播放节奏,保证被训练者同时听到原声和标准语音时,不会出现相互干扰的现象。

作为本发明一种实施例,被训练者佩戴有一组耳塞式的气传导耳机,被训练者的原声通过第一声道传输至被训练者的左边耳朵,标准语音通过第二声道传输至被训练者的右边耳朵,被训练者能够同时听到标准语音和自己的原声。

本发明实施例通过获取被训练者根据标准语音发出的原声,并将所述原声和所述标准语音通过不同的声道反馈至被训练者,便于被训练者根据自己听到的自己的原声和标准语音之间的区别,能够实时调整自己的发音,反馈及时。

在本发明实施例中提供的语音训练方法中,所述获取被训练者根据标准语音发出的原声包括:

向所述被训练者播放所述标准语音,接收所述被训练者根据所述标准语音发出的原声;或

接收所述被训练者发出的原声,并根据所述原声自动匹配所述标准语音。

在一个实施例中,如图3所示,步骤S202具体可以包括以下步骤:

步骤S302,向所述被训练者播放所述标准语音。

作为本发明一个实施例,先向被训练者播放需要训练的标准语音,被训练者需要先选定想要训练的语音,然后通过耳机或者其他播音方式向被训练者播放被训练者选择的标准语音,可以选择通过气传导的方式播放,也可以选择通过骨传导的方式播放,可以是通过一个耳机播放,也可以是通过两个耳机播放。

步骤S304,接收所述被训练者根据所述标准语音发出的原声。

作为本发明一个实施例,在播放完被训练者选定的标准语音之后,开始接收被训练者根据这个标准语音发出的原声。

本发明实施例通过先向被训练者播放选定的标准语音,再接收用户根据标准语音发出的原声,能够保证实时的模仿标准语音的发音,保证训练的有效性。

在一个实施例中,如图4所示,步骤S202具体还可以包括以下步骤:

步骤S402,接收所述被训练者发出的原声,根据所述原声自动匹配所述标准语音。

作为本发明一种实施例,被训练者没有指定需要训练的标准语音时,可以先接收被训练者发出的原声,然后分析原声,找到与该原声相匹配的标准语音,实现标准语音的自动配比。

本发明实施例通过直接根据被训练者发出的原声自动配对标准语音,不需要被训练者去选择需要训练的标准语音,被训练者可以随时训练想要训练的语音,使用更加方便。

在本发明实施例提供的一种语音训练方法中,所述向所述被训练者播放所述标准语音,接收所述被训练者根据所述标准语音发出的原声包括:

向所述被训练者播放所述标准语音的同时接收被训练者根据所述标准语音发出的原声,当检测到所述原声停止时,开始对所述原声和所述标准语音进行处理;

所述接收所述被训练者发出的原声,并根据所述原声自动匹配所述标准语音包括:

当检测到所述原声时,打开语音接收开关,接收所述原声;

当检测到所述原声停止时,关闭所述语音接收开关,并开始对所述原声和所述标准语音进行处理。

在本发明实施例中,语音接收开关用于控制是否接收外界语音,原声是指被训练者发出的声音。

作为本发明一种实施例,在训练被训练者的发音时,播放标准语音的同时,打开原声接收开关,接收被训练者根据标准语音发出的原声,即被训练者可以根据标准语音进行跟读训练,在标准语音播放结束之后,当检测到被训练者的原声停止之后,停止接收标准语音,开始对标准语音和被训练者的原声进行处理,然后将原声和标准语音同步反馈给被训练者,被训练者通过一边跟读,即读完之后,就可以立刻听到自己原声与标准语音的差别,能及时发现问题,便于改正。作为本发明又一个实施例,向被训练者播放标准语音的同时,打开原声接收开关,同时接收被训练者根据标准语音发出的原声,当检测到被训练者发出的原声停止时,自动停止正在播放的标准语音,并对已接收的原声和与这段已接收的原声对应的标准音进行处理,使原声和标准语音同步反馈给被训练者。作为本发明一种优选的实施例,停止播放标准语音的方式还可以是被训练者通过按键开关控制,也可以是通过声音控制,通过声音控制具体可以是通过检测是否存在被训练者发出的原声,当被训练者停止发出原声时,自动停止接收;或者通过检测被训练者发出原声的内容,根据原声中文字的内容控制是否接收原声,如当收到被训练者说出“关闭接收”这个词时,停止接收被训练者发出的原声。

本发明实施例通过一边播放标准语音一边接受被训练者根据标准语音发出的原声,使被训练者能够跟读训练的同时,在被训练者读完标准语音后,自动将标准语音和原声进行处理,并同步反馈给被训练者,便于被训练者及时发现自己的发音错误,及时改正,提高语音训练的效率。

作为本发明一种实施例,处理器在控制语音输入装置接收外界语音时,由语音接收开关控制,语音接收开关是一种声控开关,当语音接收开关检测到被训练者发出的原声时开启,控制语音输入装置开始被训练者发出的原声,当语音接收开关检测到被训练者发出的原声停止时,自动关闭语音接收开关,并开始对原声和标准语音进行处理。

本发明实施例通过自动控制被训练者原声的接收,被训练者在训练语音发音时可以随说随练,不需要手动去按开关,方便快捷,提升用户体验。

在本发明实施例中提供的一种语音训练方法中,所述将所述原声和所述标准语音进行处理,以使所述原声和所述标准语音的播放同步,包括:

根据所述原声形成第一波形图,根据所述标准语音形成第二波形图;

根据所述第一波形图和所述第二波形图的特征调节所述原声和所述标准语音的播放节奏,以使所述原声和所述标准语音的播放同步;其中,所述特征至少包括频率和振幅。

在本发明实施例中,第一波形图是指被训练者发出的原声转换成的波形图,第二波形图是指与所述原声对应的标准语音转换成的波形图,其中第一波形图和第二波形图的特征至少包括波形的频率和振幅,根据这些特征对第一波形图和第二波形图进行调整,保证波形图的播放同步,然后播放,使得被训练者可以听到较为同步的语音。

作为本发明一种实施例,图5为第一波形图,图6为第二波形图,其中第一波形图存在明显的空白区域,在播放第一波形图的语音时,会出现一段时间的空白,导致原声与标准语音的播放不同步,则需要将第一波形图前面的空白区域删除,才能保证原声与标准语音播放分同步。

本发明实施例通过对原声和标准语音的波形进行处理,能够确保原声与标准语音播放的同步性,提升语音训练的效率。

在本发明实施例中提供的一种语音训练方法中,还包括:

根据所述原声形成第三波形图,根据所述标准语音形成第四波形图;

将所述第三波形图的特征和所述第四波形图的特征进行对比,得到对比结果;

通过文字信息输出所述对比结果;和/或

通过视频信息输出所述对比结果;和/或

通过音频信息输出所述对比结果;其中,所述对比结果用于指示所述原声与所述标准语音的相似度。

在本发明实施例中,第三波形图是指被训练者发出的原声转换成的波形图,第四波形图是指与所述原声对应的标准语音转换成的波形图,其中第三波形图和第四波形图的特征至少包括波形的频率和振幅,通过对第三波形图和第四波形图的特征进行对比,得到原声与标准语音的对比结果,并将对比结果展示出来;其中,文字信息输出所述对比结果是指在显示屏上通过文字的方式显示对比结果,视频信息输出所述对比结果是指在显示屏上通过视频的形式显示对比结果,音频信息输出所述对比结果是指通过语音输出对比结果,对比结果用于指示原声和标准语音之间的相似程度。

作为本发明一种实施例,将第三波形图和第四波形图进行对比之后,得到原声与标准语音的对比结果,然后通过文字信息显示对比结果;例如,当原声与标准语音相似度很高时,文字提示信息为“很好”;当原声与标准语音相似度较高时,文字提示信息为“好”;当原声与标准语音相似度较低时,文字提示信息为“一般”,并且还提示哪些地方的发音不够准确;当原声与标准语音相似度很低时,文字提示信息为“差”,同时也会提醒哪些地方的发音不够准确。作为本发明又一个实施例,可以通过视频信息显示对比结果,直接通过视频显示原声与标准语音的相似程度,在相似度不高的情况下,也会直接将发音错误的地方直接通过视频指出,视频可以是通过文字滚动播放的形式显示对比结果;作为本发明有一个实施例,可以通过音频信息输出对比结果,直接通过语音向被训练者播放原声与标准语音的对比结果;作为本发明一种优选的实施例,可以采用上述文字、音频以及视频中的任意两种或者两种以上的方式相互结合后向被训练者播放对比结果。

本发明实施例通过将原声和标准语音的波形图进行对比,能够精确的得知原声与标准语音之间的区别,并且,采用文字、视频或者音频的方式将对比结果输出至被训练者,被训练者能够通过多种渠道及时准确的知道自己的发音与标准语音的区别,便于被训练者及时纠正自己的发音,提高训练效果。

在本发明实施例中提供的一种语音训练方法中,所述将所述原声和所述标准语音进行处理还包括:

根据所述原声形成第五波形图;

根据傅立叶变换处理将所述第五波形图中的波形变换为多次谐波;

根据所述多次谐波识别所述原声中的噪音,并删除所述噪音。

在本发明实施例中,谐波是指对周期性非正弦交流量进行傅里叶级数分解所得到的大于基波频率整数倍的各次分量,所有的波形都是通过多次谐波整合而成,谐波即代表着音色,每个人的音色都不相同,通过识别声音的谐波组成,就可以识别被杯训练者的声音。

作为本发明一种实施例,在获取到被训练者发出的原声后,可能由于被训练者所处环境或者被训练者发音时靠近话筒的距离太近,会导致原声当中存在较多的噪音,导致对原声的评价不准,所有在获取到原声后,根据原声形成第五波形图,然后根据傅立叶变换对第五波形图进行分解,得到多次谐波;作为本发明一个优选的实施例,可以预先在没有噪音的环境中对被训练者的声音进行录制,然后获取到被训练者的音色特征,将其与被训练者训练是发出的原声进行对比,可以将原声中多余的噪音删除。

本发明实施例通过预先收集被训练者的音色特征,在训练被训练者的发音是,将被训练者发出的原声与预先收集的音色特征进行比较,消除被训练者原声中的噪音,保证原声与标准语音对比的准确性,特征语音训练的效果。

在本发明实施例中提供的一种语音训练方法中,所述将所述原声通过第一声道反馈至所述被训练者,将所述标准语音通过第二声道反馈至所述被训练者包括:

控制气传导播放设备的第一声道播放所述原声,同时控制所述气传导播放设备的第二声道播放所述标准语音;或

控制骨传导播放设备的第一声道播放所述原声,同时控制所述骨传导播放设备的第二声道播放所述标准语音。

在本发明实施例中,气传导播放设备可以是气传导耳机,如耳塞式耳机、耳罩式耳机,可以是无线耳机也可以是有线耳机,骨传导播放设备可以是骨传导耳机,其中气传导耳机和骨传导耳机都有两个声道,用于向被训练者播放声音。

作为本发明一种实施例,在向被训练者播发原声和标准语音时,通过气传导设备的第一声道和第二声道播放,在播放原声的同时播放标准语音,保证原声和标准语音的同步播放,其中可以将原声通过第一声道传输至被训练者的左边耳朵,将标准语音通过第二声道传输至被训练者的右边耳朵,也可以相反的输入;作为本发明又一个实施例,通过骨传导设备的第一声道和第二声道播放,在播放原声的同时播放标准语音,保证原声和标准语音的同步播放。作为本发明又一个实施例,可以通过气传导和骨传导相结合的方式,向被训练者播放原声和标准语音,例如,将标准语音通过骨传导的方式传输至被训练者,将原声通过气传导的方式传输给被训练者,让被训练者通过多种方式了解自身发音与标注语音的区别。

本发明实施例通过控制气传导播放设备和骨传导播放设备分别将原声和标准语音传输至被训练者,被训练者能够多层次的了解自身发音与标准语音之间的区别,便于被训练者及时纠正自己的发音错误,提高训练效果。

在本发明实施例中提供的一种语音训练方法中,将所述原声通过所述第一声道反馈至所述被训练者时,对所述原声的响度进行调整,使所述原声的响度与所述标准语音的响度相匹配,以便于所述被训练者对所述原声和所述标准语音进行对比。

在本发明实施例中,响度又称音量,是指人耳感受到的声音强弱,它是人对声音大小的一个主观感觉量,响度的大小决定于声音接收处的波幅,就同一声源来说,波幅传播的愈远,响度愈小;当传播距离一定时,声源振幅愈大,响度愈大。

作为本发明一个实施例,在向被训练者播放原声和标准语音时,先对原声或者标准语音的响度进行调整,以保证原声与标准语音的响度相当,防止因原声和标准语音的声音响度不同对被训练者造成干扰。作为本发明一种实施例,在对原声和标准语音的响度进行调整时,还是先分别形成代表原声和标准语音的波形图,然后对波形图的振幅进行调整,使原声和标准语音的振幅大致相同,然后同时播放原声和标准语音,以保证原声和标准语音传到被训练者耳朵里时的响度相当。

本发明实施例通过调节原声和标准语音的响度,保证原声和标准语音传到被训练者耳朵里时的响度相当,防止因响度不同影响被训练者对标注语音和自己原声发音的对比,保证训练效果。

本发明实施例通过获取被训练者根据标准语音发出的原声,并将所述原声和所述标准语音通过不同的声道反馈至被训练者,便于被训练者根据自己听到的自己的原声和标准语音之间的区别,能够实时调整自己的发音,反馈及时;还通过将原声和标准语音进行对比,并输出对比结果,便于被训练者根据所述结果更加准确的调整自己的发音,被训练者能够两次得知自己发音与标准语音的区别并做出调整,语音训练效果高,效率高;同时通过将原声和标准语音的波形图进行对比,能够精确的得知原声与标准语音之间的区别,并且,采用文字、视频或者音频的方式将对比结果输出至被训练者,被训练者能够通过多种渠道及时准确的知道自己的发音与标准语音的区别,便于被训练者及时纠正自己的发音,提高训练效果。

如图7所示,在一个实施例中,提供了一种语音训练装置,该语音训练装置可以集成于上述的处理器130中,具体可以包括声音获取单元710、声音处理单元720、以及声音输出单元730。

声音获取单元710,用于获取训练者根据标准语音发出的原声。

在本发明实施例中,获取可以是直接通过话筒接受被训练者发出的声音,也可以是获取提前录制好的被训练者的声音,被训练者是指需要训练自己发音,通过本申请公开的语音训练方法进行语音发音训练的人,标准语音是指被训练者需要训练的语音的标准发音,根据各种语音的标准发音录制,如汉语则根据国家普通话标准的发音进行录制,英语可以根据标准的美式发音或者英式发音标准进行录制;原声是指被训练者发出的声音。

作为本发明一种实施例,获取被训练者根据标准语音发出的原声,被训练者发出的原声的内容与标准语音的内容相同,作为本发明一种优选的实施例,先播放标准语音给被训练者听,然后获取被训练者发出的原声;作为本发明又一个优选的实施例,直接获取被训练者发出的原声,然后根据原声自动匹配出标注语音。

声音处理单元720,用于将所述原声和所述标准语音进行处理,以使所述原声和所述标准语音的播放同步。

在本发明实施例中,播放同步是指原声和标准语音同时进行播放时,标准语音和原声中每个字符的播放节奏是相互对应的,处理是指对原声和标准语音的播放时间和播放节奏进行调整,使得在播放所述原声和所述标准语音时,原声与标准语音每个字符相互对应。

作为本发明一个实施例,标准语音为标准普通话版的“吃葡萄不吐葡萄皮”,但是被训练者发出的原音可能会存在一些前面或者后面的空白,在处理原声时,需要对原声进行剪辑,使得原声中也只包含了“吃葡萄不吐葡萄皮”这一段话的内容,前后不会出现留白;作为本发明又一种实施例,原声中只剩下“吃葡萄不吐葡萄皮”,但是原声的语速较快,导致原声与标准语音的播放速度不一致,此时对原声和标准语音进行处理时,可以将原声的播放速度变慢或者将标准语音的播放速度调快,以保证原声与标准语音的同步播放。

本发明实施例通过对原声和标准语音的处理,能够保证原声与标准语音的播放同步,保证被训练者听到的是同步的声音,提升语音训练效果。

声音输出单元730,用于通过第一声道将所述原声反馈至所述被训练者,同时通过第二声道将所述标准语音反馈至所述被训练者,以使所述被训练者及时发现发音错误并纠正。

在本发明实施例中,第一声道和第二声道是指用于播放语音的声道,分别对应被训练者的左右两边的听力系统,将原声反馈给被训练者的形式可以是通过气传导的耳机,如有限耳机、无线耳机、耳塞式耳机、耳罩式耳机等,也可以是通过骨传导的方式将原声或者标准语音反馈至被训练者,如采用骨传导耳机等;其中将原声和标准语音反馈至被训练者是,要保证原声与标准语音的播放节奏,保证被训练者同时听到原声和标准语音时,不会出现相互干扰的现象。

作为本发明一种实施例,被训练者佩戴有一组耳塞式的气传导耳机,被训练者的原声通过第一声道传输至被训练者的左边耳朵,标准语音通过第二声道传输至被训练者的右边耳朵,被训练者能够同时听到标准语音和自己的原声。

本发明实施例通过获取被训练者根据标准语音发出的原声,并将所述原声和所述标准语音通过不同的声道反馈至被训练者,便于被训练者根据自己听到的自己的原声和标准语音之间的区别,能够实时调整自己的发音,反馈及时。

图8示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的处理器130。如图8所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现语音训练方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行语音训练方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,本申请提供的语音训练装置可以实现为一种计算机程序的形式,计算机程序可在如图8所示的计算机设备上运行。计算机设备的存储器中可存储组成该语音训练装置的各个程序模块,比如,图7所示的声音获取单元、声音处理单元和声音输出单元。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的语音训练方法中的步骤。

在一个实施例中,提出了一种计算机设备,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

步骤S202,获取被训练者根据标准语音发出的原声。

在本发明实施例中,获取可以是直接通过话筒接受被训练者发出的声音,也可以是获取提前录制好的被训练者的声音,被训练者是指需要训练自己发音,通过本申请公开的语音训练方法进行语音发音训练的人,标准语音是指被训练者需要训练的语音的标准发音,根据各种语音的标准发音录制,如汉语则根据国家普通话标准的发音进行录制,英语可以根据标准的美式发音或者英式发音标准进行录制;原声是指被训练者发出的声音。

作为本发明一种实施例,获取被训练者根据标准语音发出的原声,被训练者发出的原声的内容与标准语音的内容相同,作为本发明一种优选的实施例,先播放标准语音给被训练者听,然后获取被训练者发出的原声;作为本发明又一个优选的实施例,直接获取被训练者发出的原声,然后根据原声自动匹配出标注语音。

步骤S204,将所述原声和所述标准语音进行处理,以使所述原声和所述标准语音的播放同步。

在本发明实施例中,播放同步是指原声和标准语音同时进行播放时,标准语音和原声中每个字符的播放节奏是相互对应的,处理是指对原声和标准语音的播放时间和播放节奏进行调整,使得在播放所述原声和所述标准语音时,原声与标准语音每个字符相互对应。

作为本发明一个实施例,标准语音为标准普通话版的“吃葡萄不吐葡萄皮”,但是被训练者发出的原音可能会存在一些前面或者后面的空白,在处理原声时,需要对原声进行剪辑,使得原声中也只包含了“吃葡萄不吐葡萄皮”这一段话的内容,前后不会出现留白;作为本发明又一种实施例,原声中只剩下“吃葡萄不吐葡萄皮”,但是原声的语速较快,导致原声与标准语音的播放速度不一致,此时对原声和标准语音进行处理时,可以将原声的播放速度变慢或者将标准语音的播放速度调快,以保证原声与标准语音的同步播放。

本发明实施例通过对原声和标准语音的处理,能够保证原声与标准语音的播放同步,保证被训练者听到的是同步的声音,提升语音训练效果。

步骤S206,通过第一声道将所述原声反馈至所述被训练者,同时通过第二声道将所述标准语音反馈至所述被训练者,以使所述被训练者及时发现发音错误并纠正。

在本发明实施例中,第一声道和第二声道是指用于播放语音的声道,分别对应被训练者的左右两边的听力系统,将原声反馈给被训练者的形式可以是通过气传导的耳机,如有限耳机、无线耳机、耳塞式耳机、耳罩式耳机等,也可以是通过骨传导的方式将原声或者标准语音反馈至被训练者,如采用骨传导耳机等;其中将原声和标准语音反馈至被训练者是,要保证原声与标准语音的播放节奏,保证被训练者同时听到原声和标准语音时,不会出现相互干扰的现象。

作为本发明一种实施例,被训练者佩戴有一组耳塞式的气传导耳机,被训练者的原声通过第一声道传输至被训练者的左边耳朵,标准语音通过第二声道传输至被训练者的右边耳朵,被训练者能够同时听到标准语音和自己的原声。

本发明实施例通过获取被训练者根据标准语音发出的原声,并将所述原声和所述标准语音通过不同的声道反馈至被训练者,便于被训练者根据自己听到的自己的原声和标准语音之间的区别,能够实时调整自己的发音,反馈及时。

在一个实施例中,提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:

步骤S202,获取被训练者根据标准语音发出的原声。

在本发明实施例中,获取可以是直接通过话筒接受被训练者发出的声音,也可以是获取提前录制好的被训练者的声音,被训练者是指需要训练自己发音,通过本申请公开的语音训练方法进行语音发音训练的人,标准语音是指被训练者需要训练的语音的标准发音,根据各种语音的标准发音录制,如汉语则根据国家普通话标准的发音进行录制,英语可以根据标准的美式发音或者英式发音标准进行录制;原声是指被训练者发出的声音。

作为本发明一种实施例,获取被训练者根据标准语音发出的原声,被训练者发出的原声的内容与标准语音的内容相同,作为本发明一种优选的实施例,先播放标准语音给被训练者听,然后获取被训练者发出的原声;作为本发明又一个优选的实施例,直接获取被训练者发出的原声,然后根据原声自动匹配出标注语音。

步骤S204,将所述原声和所述标准语音进行处理,以使所述原声和所述标准语音的播放同步。

在本发明实施例中,播放同步是指原声和标准语音同时进行播放时,标准语音和原声中每个字符的播放节奏是相互对应的,处理是指对原声和标准语音的播放时间和播放节奏进行调整,使得在播放所述原声和所述标准语音时,原声与标准语音每个字符相互对应。

作为本发明一个实施例,标准语音为标准普通话版的“吃葡萄不吐葡萄皮”,但是被训练者发出的原音可能会存在一些前面或者后面的空白,在处理原声时,需要对原声进行剪辑,使得原声中也只包含了“吃葡萄不吐葡萄皮”这一段话的内容,前后不会出现留白;作为本发明又一种实施例,原声中只剩下“吃葡萄不吐葡萄皮”,但是原声的语速较快,导致原声与标准语音的播放速度不一致,此时对原声和标准语音进行处理时,可以将原声的播放速度变慢或者将标准语音的播放速度调快,以保证原声与标准语音的同步播放。

本发明实施例通过对原声和标准语音的处理,能够保证原声与标准语音的播放同步,保证被训练者听到的是同步的声音,提升语音训练效果。

步骤S206,通过第一声道将所述原声反馈至所述被训练者,同时通过第二声道将所述标准语音反馈至所述被训练者,以使所述被训练者及时发现发音错误并纠正。

在本发明实施例中,第一声道和第二声道是指用于播放语音的声道,分别对应被训练者的左右两边的听力系统,将原声反馈给被训练者的形式可以是通过气传导的耳机,如有限耳机、无线耳机、耳塞式耳机、耳罩式耳机等,也可以是通过骨传导的方式将原声或者标准语音反馈至被训练者,如采用骨传导耳机等;其中将原声和标准语音反馈至被训练者是,要保证原声与标准语音的播放节奏,保证被训练者同时听到原声和标准语音时,不会出现相互干扰的现象。

作为本发明一种实施例,被训练者佩戴有一组耳塞式的气传导耳机,被训练者的原声通过第一声道传输至被训练者的左边耳朵,标准语音通过第二声道传输至被训练者的右边耳朵,被训练者能够同时听到标准语音和自己的原声。

本发明实施例通过获取被训练者根据标准语音发出的原声,并将所述原声和所述标准语音通过不同的声道反馈至被训练者,便于被训练者根据自己听到的自己的原声和标准语音之间的区别,能够实时调整自己的发音,反馈及时。

应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1