一种文字发音方法和装置与流程

文档序号:16188325发布日期:2018-12-08 05:26阅读:243来源:国知局
一种文字发音方法和装置与流程

本申请涉及数据处理领域,特别是涉及一种文字发音方法和装置。

背景技术

随着网络词典、网络翻译的普及,用户可以在网上学习外语文字。

学习外语时需要学习该外语文字的发音,传统方式中,可以在文字后示出小喇叭的按钮,用户点击该按钮后可以收听到该文字的发音示例。用户可以通过收听发音示例来学习文字发音。



技术实现要素:

传统方式中针对文字的发音示例主要包括该文字的整体发音,即文字的完整发音,针对较长文字或发音难度较高的文字,完整发音的长度会较长,或完整发音中的发音难点较多,用户即使收听了多遍发音示例后依然难以记住如何发音,针对其中的发音难点仍旧不容易掌握,导致用户体验不高。

为了解决上述技术问题,第一方面,本申请提供了一种文字发音方法,该方法包括:

获取针对第一文字中第一部分的发音请求,所述第一文字包括多个部分,所述第一部分为所述多个部分中的一个,所述发音请求为终端发送的;

从所述第一文字对应的发音中确定出所述第一部分对应的发音片段;

根据所述第一部分对应的发音片段生成所述第一部分对应的发音示例;

向所述终端返回所述第一部分对应的发音示例。

可选的,所述第一文字的多个部分是根据发音音节确定的。

可选的,所述第一文字的多个部分是根据构成所述第一文字的字符确定的。

可选的,在所述从所述第一文字对应的发音中确定出所述第一部分对应的发音片段之前,还包括:

判断所述第一部分是否与第二部分构成第三部分,所述第二部分为所述多个部分中与所述第一部分在所述第一文字中相邻的一个,所述第三部分为所述第一文字中一个发音音节对应的部分;

若判断结果为是,向所述终端返回发音提示,所述发音提示用于指示所述第一部分与所述第三部分的对应关系。

可选的,若判断结果为是,还包括:

从所述第一文字对应的发音中确定出所述第三部分对应的发音片段;

根据所述第三部分对应的发音片段生成对应所述第三部分对应的发音示例;

向所述终端返回所述第三部分对应的发音示例。

可选的,所述发音请求中包括变速参数,所述根据所述第一部分对应的发音片段生成所述第一部分对应的发音示例,包括:

根据所述变速参数调整所述第一部分对应的发音片段的发音速度,得到变速发音片段;

将所述变速发音片段作为所述第一部分对应的发音示例。

可选的,所述变速参数包括降低发音速度的比例或提高发音速度的比例。

可选的,还包括:

根据所述第一部分,确定出第二文字,所述第二文字中具有所述第一部分;

向所述终端返回所述第二文字。

可选的,所述根据所述第一部分,确定出第二文字,包括:

根据所述第一部分和所述第一部分对应的发音片段,确定出第二文字,所述第二文字中具有所述第一部分,且所述第二文字中第一部分对应的发音为所述第一部分对应的发音片段。

第二方面,本申请还提供了一种文字发音装置,该装置包括第一获取单元、第一确认单元、第一生成单元和第一返回单元:

所述第一获取单元,用于获取针对第一文字中第一部分的发音请求,所述第一文字包括多个部分,所述第一部分为所述多个部分中的一个,所述发音请求为终端发送的;

所述第一确认单元,用于从所述第一文字对应的发音中确定出所述第一部分对应的发音片段;

所述第一生成单元,用于根据所述第一部分对应的发音片段生成所述第一部分对应的发音示例;

所述第一返回单元,用于向所述终端返回所述第一部分对应的发音示例。

可选的,所述第一文字的多个部分是根据发音音节确定的。

可选的,所述第一文字的多个部分是根据构成所述第一文字的字符确定的。

可选的,还包括判断单元:

所述判断单元,用于判断所述第一部分是否与第二部分构成第三部分,所述第二部分为所述多个部分中与所述第一部分在所述第一文字中相邻的一个,所述第三部分为所述第一文字中一个发音音节对应的部分;若判断结果为是,则触发第二返回单元;

所述第二返回单元,用于向所述终端返回发音提示,所述发音提示用于指示所述第一部分与所述第三部分的对应关系。

可选的,若判断结果为是,还包括第二确定单元、第二生成单元和第三返回单元:

所述第二确定单元,用于从所述第一文字对应的发音中确定出所述第三部分对应的发音片段;

所述第二生成单元,用于根据所述第三部分对应的发音片段生成对应所述第三部分对应的发音示例;

所述第三返回单元,用于向所述终端返回所述第三部分对应的发音示例。

可选的,所述发音请求中包括变速参数,所述第一生成单元,包括:

调整子单元,用于根据所述变速参数调整所述第一部分对应的发音片段的发音速度;

获得子单元,用于得到变速发音片段,并将所述变速发音片段作为所述第一部分对应的发音示例。

可选的,所述变速参数包括降低发音速度的比例或提高发音速度的比例。

可选的,还包括第三确定单元和第三返回单元:

第三确定单元,用于根据所述第一部分,确定出第二文字,所述第二文字中具有所述第一部分;

第四返回单元,用于向所述终端返回所述第二文字。

可选的,所述第三确定单元,包括:

第四确定子单元,用于根据所述第一部分和所述第一部分对应的发音片段,确定出第二文字,所述第二文字中具有所述第一部分,且所述第二文字中第一部分对应的发音为所述第一部分对应的发音片段。

第三方面,本申请还提供了一种文字发音装置,该装置包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:

获取针对第一文字中第一部分的发音请求,所述第一文字包括多个部分,所述第一部分为所述多个部分中的一个,所述发音请求为终端发送的;

从所述第一文字对应的发音中确定出所述第一部分对应的发音片段;

根据所述第一部分对应的发音片段生成所述第一部分对应的发音示例;

向所述终端返回所述第一部分对应的发音示例。

第四方面,本申请还提供了一种机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行第一方面中所述的方法。

由上述技术方案可以看出,可以根据文字的组成形式将文字分为多个部分,当获取了针对第一文字中第一部分的发音请求时,可以根据第一部分在第一文字中的位置,从第一文字对应的发音中确定出与该第一部分对应的发音片段,并向终端返回由该第一部分对应的发音片段生成的发音示例,以使得在终端上可以播放针对第一部分的发音示例,使用该终端的用户可以收听到仅针对第一文字中第一部分的发音,当第一部分的发音是第一文字中的发音难点时,用户可以通过播放或反复播放第一部分的发音示例进行有针对性的学习,提高了学习第一文字发音的效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种文字发音方法的方法流程图;

图2为本申请实施例提供的一种文字发音装置的装置结构图;

图3为本申请实施例提供的一种文字发音的装置作为终端时的结构框图;

图4为本申请实施例提供的一些实施例中服务器的结构示意图。

具体实施方式

下面结合附图,对本申请的实施例进行描述。

网络上用于学习外语的软件或页面,一般会在外语中的文字后边示出小喇叭的按钮,用户通过点击该按钮,可以收听到该文字的发音示例。本申请实施例中提到的外语是相对于学习者的一种语种概念,即外语是与学习者母语不同的语种,例如相对于中文母语的用户,外语可以是除了汉语以外的其他语种。而文字和外语的语种相关,当外语是英语时,文字可以是英语单词等,当外语是汉语时,文字可以是字、词、成语、短语等。需要说明的是,本申请实施例中所提到的文字可以是各种语言文字,除了上述提到的英语单词、中国汉字以外,还可以是德语单词、韩文等语言文字,在本申请实施例中不对文字的种类进行任何限定。

发明人发现,传统方式中提供的发音示例均是文字的完整发音,在用户学习文字发音的过程中,针对较长文字或者发音难度较高的文字,由于完整发音的长度较长或发音难点较多,用户即使反复收听很多遍文字的发音示例后,也可能还是无法准确掌握发音方法。

例如,在学习英语的过程中,对于音标或者发音规律(比如爆破音等特殊情况)不熟悉的同学,即使反复听了很多遍的单词整体发音,通常还是无法精确掌握该单词的正确发音方法。

为此,本申请实施例提供了一种针对上述关于完整发音情况的解决方式,以希望对于较长文字或者发音难度较高的文字,用户可以通过针对性的学习文字完整发音中的发音难点,从而可以快速地准确掌握正确的发音方法,提高用户的学习体验。

本申请实施例可以应用于服务器中。例如,服务器可以获取发音请求,该发音请求是终端为了从服务器侧获取一文字中的某一部分对应的发音示例而发送的,为了便于描述,将该文字称为第一文字。第一文字可以是用户想要查找、并用于学习发音的文字,第一文字中可以包括多个字符。

为了让用户能够重点反复学习第一文字完整发音中的发音难点部分,提高用户学习第一文字发音的效率,第一文字中的多个字符可以根据第一文字的组成形式进行划分,从而将第一文字分为多个部分,以希望能够通过将第一文字分为多个部分,便于使用终端的用户在希望收听到仅针对第一文字中某一部分发音的需求时,能够选取第一文字中的一部分。由于第一文字可以根据其组成形式分为多个部分,为了便于描述,例如可以分别称这些部分为第一部分、第二部分、第三部分等。

需要说明的是,由于第一文字的完整发音可以根据发音规律划分为多个发音音节,每一个发音音节都对应着第一文字中的某一部分,因此,可以根据发音音节将第一文字分为多个部分,由此方式得到的每个部分都可以对应完整的发音音节,便于之后确定发音片段。

为了便于理解,下面举例来说明本申请实施例中的如何根据发音音节将第一文字分为多个部分:

在外语为英语的情况下,第一文字可以是英文单词,例如“basketball”,由于“basketball”的发音为根据英文单词的发音规律,“basketball”的发音可以依据发音规律划分为多个发音音节,该发音音节分别为:[ba:]、[s]、[kit]、进一步地,可以根据发音音节的划分将“basketball”分为多个部分,一个部分可以与一个发音音节相对应,如可以将“basketball”分为“ba”、“s”、“ket”、“ball”这几个部分。

再例如,外语为汉语的情况下,第一文字可以是汉字成语,例如“柳暗花明”,由于“柳暗花明”的发音为“liǔànhuāmíng”,根据汉字的发音规律,“柳暗花明”的发音可以依据发音规律划分为多个发音音节,该发音音节分别为:liǔ、àn、huā、míng,进一步地,可以根据该发音音节的划分将“柳暗花明”分为多个部分,一个部分可以与一个发音音节相对应,如可以将“柳暗花明”分为“柳”、“暗”、“花”、“明”这几个部分。

由于第一文字是由多个字符组成的,为了便于用户理解和记忆,第一文字也可以是根据构成第一文字的字符分为多个部分,其中,每一部分可以是一个具有独立意义的文字,甚至还可以直接以字符为划分单位,将第一文字分为多个部分,其中,每个部分可以为一个字符,也可以为多个字符。通过这种划分方式,能够更贴合用户需求,用户可以根据自身学习需求或收听目的选择想要收听的部分。

为了便于理解,下面举例来说明本申请实施例中如何根据构成第一文字的字符将第一文字分为多个部分:

同样在外语为英语的情况下,第一文字可以是英文单词,例如“basketball”。在“basketball”中,由于“basket”可以作为一个名词,包含“篮;一篮;(篮球运动的)篮;投篮得分”的意思,“ball”也可以作为一个名词,包含“球”的意思,因此,可以根据构成“basketball”的字符,将“basketball”分为“basket”和“ball”两个部分,每一部分都可以是一个具有独立意义的文字。甚至还可以直接以字符为划分单位,将“basketball”分为十个部分,每个部分为一个字母。

再例如,同样外语为汉语的情况下,第一文字可以是汉字成语,例如“柳暗花明”,由于在“柳暗花明”中,“柳暗”的含义是垂柳浓密,形容柳树成荫,而“花明”的含义是鲜花夺目,形容繁花似锦,因此,可以根据构成“柳暗花明”的字符,将“柳暗花明”分为“柳暗”、“花明”两个部分,每一部分都可以是一个具有独立意义的文字。甚至还可以直接以字符为划分单位,将“柳暗花明”分为四个部分,每个部分为一个汉字。

需要强调的是,第一文字除了上述几种可能的划分方式以外,还可以为其它不同的划分方式,在此不再对第一文字的划分方式一一赘述。

接下来,结合图1来说明本申请实施例如何实现对文字的一部分进行发音。图1为本申请实施例提供的一种文字发音方法的方法流程图,该方法包括:

s101:获取针对第一文字中第一部分的发音请求,所述第一文字包括多个部分,所述第一部分为所述多个部分中的一个,所述发音请求为终端发送的。

举例来说,服务器可以作为本申请实施例的执行主体,即可以由该服务器执行s101-s103。为方便描述,本实施例中将用户侧所使用的设备,即作为发音示例的请求方的用户设备称为终端,该终端可以是移动终端、计算机等具有播放发音示例功能的设备。

本申请实施例中,第一文字可以是包括多个部分的字词,比如英语单词、汉语成语等。第一文字中的第一部分可以是用户想要收听发音的文字部分,以希望通过发送针对第一文字中的第一部分的发音请求,获得该第一部分对应的发音示例。

例如,外语为英语的情况下,用户想要学习英文单词“basketball”的发音方法,用户使用终端查找英文单词“basketball”,第一文字“basketball”可以根据发音音节将“basketball”分为第二部分“ba”、第三部分“s”、第一部分“ket”、第四部分“ball”等多个部分;该用户听了几次“basketball”的完整读音之后,还是无法准确掌握第一部分“ket”的发音方法,便单独点击第一部分“ket”,以希望可以收听到仅针对第一文字“basketball”中第一部分“ket”的发音;该用户选择该第一部分后,终端响应于针对该第一部分的选择,向服务器发送针对第一文字中第一部分的发音请求。

需要说明的,为了使得服务器能够从发音请求中,确定用户想要学习的第一文字,以及用户想要获得的发音示例所对应的第一文字中的第一部分,该发音请求可以包括第一文字和第一文字中的第一部分。

s102:从所述第一文字对应的发音中确定出所述第一部分对应的发音片段。

由于已经保存了第一文字对应的完整发音,故在获取发音请求后,可以根据第一部分在第一文字中的位置,从第一文字对应的完整发音中确定出与第一部分所在第一文字中位置对应的发音片段,这一发音片段可以作为第一部分对应的发音片段。

例如,服务器根据获取的发音请求,确定出第一文字为“basketball”,第一部分为“basketball”中的“ket”,服务器可以从“basketball”对应的发音中,根据该第一文字的发音规律,可知,第一部分“ket”对应的音节的发音为[kit],可以以此作为第一部分“ket”对应的发音片段。

s103:根据所述第一部分对应的发音片段生成所述第一部分对应的发音示例。

其中,第一部分对应的发音示例是根据第一部分对应的发音片段生成的,以便终端在获取该发音示例时可以播放,使得用户能够收听到针对第一部分的发音。

由于有些用户还没有准确掌握第一文字中第一部分的发音,因此,这些用户希望针对第一部分的发音示例的发音速度可以慢一点,以便更好地掌握第一部分在第一文字中的发音方法以及发音的变换规则;而有些用户已经很好地掌握了第一文字中第一部分的发音,只是想通过播放发音示例温习第一部分的发音,为了能够节省时间,希望针对第一部分的发音示例的发音速度可以快一点。

为了满足不同用户对于第一部分对应的发音示例的发音速度要求,在一种可选的实现方式中,针对第一文字中第一片段的发音请求还可以包括变速参数,该变速参数可以标识出所需的发音速度,该发音速度的快慢与用户的收听需求相关。故当获取该发音请求时,可以根据所携带的变速参数确定出需要如何调整第一部分对应的发音片段的发音速度,例如调快或调慢。故在根据第一部分对应的发音片段生成对应所述第一部分对应的发音示例时,可以根据该变速参数调整第一部分对应的发音片段的发音速度,得到变速发音片段。并将该变速发音片段作为第一部分对应的发音示例。其中,该变速发音片段可以是根据变速参数调整了发音速度后的第一部分的发音片段。

为了能够更为精细的体现用户的收听需求,该变速参数可以包括降低发音速度的比例或提高发音的比例,该比例可以表示出所需的变速发音速度与正常发音速度的速度之间的比例关系,例如当变速参数为80%时,可以理解为所需的变速发音速度为正常发音速度的80%,即较慢的发音速度。当变速参数为120%时,可以理解为所需的变速发音速度为正常发音速度的120%,即较快的发音速度。

通过引入变速参数来标识发音速度,以希望用户能够根据自己对于发音速度的需求,来调整用户想要收听发音的第一部分对应的发音片段的发音速度,从而得到符合用户要求的发音示例。也就是说,用户可以根据自己对于不同文字的发音掌握情况,自主地确定第一部分对应的发音示例的发音速度,以便满足不同用户对于第一部分对应的发音示例的不同要求。为了能够让用户自主确定发音速度,可以在终端上展示相应的调整界面或调整模式,例如在展示界面上提高不同档位的发音速度,或者提供针对不同发音速度的变速模式以供用户选择。

为了便于理解,现结合具体场景进行举例说明:

在一种情况中,一个英文单词的发音包括多个音节,以及各种发音变换规则,即使将该英文单词根据组成形式分为多个部分,用户反复播放发音难度较高的第一部分对应的发音示例后,仍有可能还是很难准确掌握该部分的正确发音。因此,该用户可以选择收听第一部分对应的发音示例,该发音示例为用户确定变速参数中的降低发音速度比例为80%的变速发音片段,由于该变速发音片段的发音速度较慢,用户能够更清晰地、准确地收听到第一部分的发音变换规则,从而准确掌握第一部分的正确发音;

在另一种情况中,对于一个英文单词,用户经过之前的学习,已经较为准确掌握了该英文单词的正确发音,但为了更好地巩固之前掌握的发音,该用户会偶尔收听该英文单词的第一部分对应的发音示例。对于该用户而言,更喜欢选择收听第一部分对应的发音示例,该发音示例为用户确定变速参数中的提高发音速度比例为120%的变速发音片段,由于该变速发音片段的发音速度较快,用户能够在巩固第一部分的正确发音方式的前提下,还可以节约复习时间。

s104:向所述终端返回所述第一部分对应的发音示例。

具体地,为了服务器能够准确地将生成的第一部分对应的发音示例返回给相应的终端,发音请求中还可以包括终端标识,该终端标识用于标识发送发音请求的用户设备,可选地,该终端标识可以包括设备身份标识号码(identification,id)和/或网络之间互连的协议(internetprotocol,ip)地址。

由于发音请求中包括终端标识,故在生成了第一部分对应的发音示例后,服务器可以根据发音请求中的终端标识,将生成的第一部分对应的发音示例返回给终端标识对应的终端,以希望用户能够通过该终端播放或反复播放该发音示例,从而对第一文字中第一部分进行有针对性的学习。

可见,本申请实施例中,可以根据文字的组成形式将文字分为多个部分,当获取了针对第一文字中第一部分的发音请求时,可以根据第一部分在第一文字中的位置,从第一文字对应的发音中确定出与该第一部分对应的发音片段,并向终端返回由该第一部分对应的发音片段生成的发音示例,以使得在终端上可以播放针对第一部分的发音示例,从而使用该终端的用户可以收听到仅针对第一文字中第一部分的发音。当第一部分的发音是第一文字中的发音难点时,用户可以通过播放或反复播放第一部分的发音示例进行有针对性的学习,提高了学习第一文字发音的效率。

由于第一文字可以根据构成第一文字的字符分为多个部分,比如可以直接以字符为划分单位,将第一文字分为多个部分,每个部分都为一个字符,例如,英文单词“foot”,其对应的发音为该英文单词可以根据构成其的字符,将该英文单词分为“f”、“o”、“o”、“t”等四个部分。根据“foot”的发音规律可知,只有当两个字母“o”结合在一起构成字母组合“oo”,该字母组合“oo”才能够在发音中有一个对应的发音音节,即英文单词“foot”中的字母组合“oo”在该英文单词的发音中对应的发音音节为:若用户在终端上选择一个字母“o”作为第一文字“foot”的第一部分,那么,由于第一部分“o”在英文单词“foot”的发音中不存在一个对应的发音音节,因此,第一部分“o”没有对应的发音示例。

因此,在上述采用字符划分第一文字的情况下,若用户选择的第一部分实际上并不能对应完整的音节,或者说单独第一部分可能并不能发音的情况下,可能会对确定第一部分的发音片段带来困难,而且,假设将包括了第一部分以及其他部分构成的完整音节的发音片段提供给用户,可能也会对用户带来误导。例如,第一部分“o”没有对应的发音示例,第一部分“o”需要和与其相邻的另一部分“o”相结合构成第三部分“oo”,第三部分“oo”才能够在第一文字“foot”的发音中有一个对应的发音音节在此情况下,如果不向终端返回第一部分“o”对应的发音示例,用户可能认为在第一文字“foot”中,第一部分“o”是不发音的部分;如果向终端返回以为发音片段生成的发音示例,会使得用户错误地认为,在第一文字“foot”中,第一部分“o”对应的音节为

为了用户能够了解第一文字的各个部分与各个发音音节之间的对应关系,本申请实施例针对第一文字是根据构成第一文字的字符分为多个部分,而文字中的第一部分可能需要和与其相邻的另一部分相结合,才能够在该文字的发音中有一个对应的发音音节的情况,可选的,在s102之前,可以先判断第一部分是否与第二部分构成第三部分。若是,向终端返回发音提示,进一步地,还可以从第一文字对应的发音中确定出该第三部分对应的发音片段,以及根据该第三部分对应的发音片段生成对应该第三部分对应的发音示例,接着向终端返回该第三部分对应的发音示例。

具体地,第二部分为第一文字根据构成第一文字的字符分成的多个部分中与第一部分在该第一文字中相邻的一个,第三部分为该第一文字中一个发音音节对应的部分,发音提示用于指示第一部分与第三部分的对应关系。

也就是说,确定用户选择的第一文字中的第一部分可以与第二部分构成第三部分时,可以向终端返回发音提示以及第三部分对应的发音示例,以希望能够提示用户第一部分需要和与其相邻的第二部分相结合构成了第三部分,该第三部分才能够在第一文字的发音中有一个对应的发音音节,并且能够收听到该第三部分的发音示例。为了便于理解,同样以第一文字“foot”来举例说明:确定了用户选择的第一文字“foot”中第一部分“o”没有对应的发音示例,需要和与其相邻的另一部分“o”相结合构成第三部分“oo”,第三部分“oo”才能够在第一文字“foot”的发音中有一个对应的发音音节时,服务器向终端返回内容为“抱歉!您选择的‘o’没有对应的发音,可以选择‘oo’收听对应的发音。”的提示;用户在看到提示后,重新选择了第一文字“foot”中第三部分“oo”,进一步地,服务器响应于用户对于第三部分“oo”的选择,根据第三部分“oo”对应的发音片段生成第三部分“oo”对应的发音示例,接着向终端返回该第三部分“oo”对应的发音示例;用户在终端接收到该发音示例后,便可以通过使用终端播放该发音示例,收听到第三部分“oo”的准确发音。

可见,在本申请实施例中,经过判断,确定了第一文字中的第一部分可以和与其相邻的第二部分构成第三部分,便向终端返回发音提示,以及该第三部分对应的发音示例,即起到了提示用户第一文字的各个部分与各个发音音节之间的对应关系的作用,从而用户对于该第一文字的发音的理解与记忆变得更加容易,也提高了用户学习第一文字发音的效率。

在用户已经准确掌握了第一文字的发音方法之后,可能会希望能够再学习与第一文字中第一部分的发音相似的其他文字,以便于用户多练习相似的发音方法,从而巩固已经掌握的第一部分的发音方法,以及学习更多的相似文字发音方法。

为了给用户提供更多的与第一文字中第一部分的发音相似的其他文字进行发音练习,可选的,本申请实施例中,还可以先根据第一部分,确定出第二文字,其中,该第二文字中具有第一部分,接着,向终端返回所述第二文字。

为了给用户提供的第二文字更加符合用户的学习能力,第二文字与第一文字的发音复杂程度可以是相似的,以希望第二文字能够更加符合用户目前的知识水平,更易于掌握第二文字。需要说明的是,第二文字与第一文字的发音复杂程度可以是相似的,可以理解为,构成第一文字与第二文字的字符数量相似或相同,并且第一文字与第二文字都属于同一类范畴中,比如,第一文字为英语单词,并且属于初中词汇,则第二文字也应当属于初中词汇的范畴中。

为了便于理解,现结合具体场景来举例说明,本申请实施例中如何根据第一部分,确定出第二文字:

在使用终端的用户为小学生,用户学习的外语为英语的情况下,用户在终端选择的第一文字为“foot”,选择的第一文字中第一部分为“oo”,其中,第一文字“foot”中的第一部分“oo”的发音音节为根据第一部分“oo”,在小学英语词汇的范畴中,可以找到第二文字“noon”。显然,第二文字“noon”与第一文字“foot”的发音复杂程度相似,并且同样都具有第一部分“oo”,只不过两者的区别在于,第二文字“noon”中的第一部分“oo”的发音音节为u:而不是因此,第二文字“noon”符合要求,可以将第二文字“noon”返回给终端,从而起到举一反三的效果。

当用户还没有完全准确掌握第一文字的发音方法时,可能会希望能够再学习与第一文字中的第一部分发音音节完全相同的其他文字,以便于用户更多地练习与第一部分发音相同的发音方法,从而更好地学习第一部分的发音方法。为了给用户提供更多的与第一文字中第一部分的发音相同的其他文字进行发音练习,进一步地,本申请实施例中可以根据第一部分和该第一部分对应的发音片段,确定出第二文字,其中,该第二文字中具有第一部分,并且该第二文字中第一部分对应的发音为该第一部分对应的发音片段。

为了给用户提供的第二文字符合用户的学习能力并且能够满足用户的需求,第二文字与第一文字的发音不但复杂程度可以是相似的,而且该第二文字中的第一部分的发音音节与该第一文字中的第一部分是完全相同的,以希望用户能够更加准确地掌握第一部分的发音方法。

为了便于理解,现结合具体场景来举例说明,本申请实施例中如何根据第一部分和该第一部分对应的发音片段,确定出第二文字:

在使用终端的用户为初中生,用户学习的外语为英语的情况下,用户在终端选择的第一文字为“bedroom”,选择的第一文字中第一部分为“oo”,其中,第一文字“bedroom”中的第一部分“oo”的发音音节为u:。根据第一部分“oo”,在初中英语词汇的范畴中,可以找到第二文字“classroom”。显然,第二文字“noon”与第一文字“bedroom”的发音复杂程度相似,同样都具有第一部分“oo”,并且第二文字“classroom”中的第一部分“oo”的发音音节同样均为u:。因此,第二文字“classroom”符合用户的需求,可以将第二文字“noon”返回给终端。

可见,在本申请实施例中,通过向终端返回第二文字,可以为用户提供更多的与第一文字的发音相似的其他文字,以希望用户能够更多地练习相似的发音,同时学习更多的发音方法,以达到举一反三的效果,以便用户能够更好地学习各种文字发音。

参见图2,为本申请实施例提供的一种文字发音装置的组成示意图,该装置包括第一获取单元201、第一确认单元202、第一生成单元203和第一返回单元204:

所述第一获取单元201,用于获取针对第一文字中第一部分的发音请求,所述第一文字包括多个部分,所述第一部分为所述多个部分中的一个,所述发音请求为终端发送的;

所述第一确认单元202,用于从所述第一文字对应的发音中确定出所述第一部分对应的发音片段;

所述第一生成单元203,用于根据所述第一部分对应的发音片段生成所述第一部分对应的发音示例;

所述第一返回单元204,用于向所述终端返回所述第一部分对应的发音示例。

在本申请一种实施方式中,所述第一文字的多个部分是根据发音音节确定的。

在本申请一种实施方式中,所述第一文字的多个部分是根据构成所述第一文字的字符确定的。

在本申请一种实施方式中,还包括判断单元:

所述判断单元,用于判断所述第一部分是否与第二部分构成第三部分,所述第二部分为所述多个部分中与所述第一部分在所述第一文字中相邻的一个,所述第三部分为所述第一文字中一个发音音节对应的部分;若判断结果为是,则触发第二返回单元;

所述第二返回单元,用于向所述终端返回发音提示,所述发音提示用于指示所述第一部分与所述第三部分的对应关系。

在本申请一种实施方式中,若判断结果为是,还包括第二确定单元、第二生成单元和第三返回单元:

所述第二确定单元,用于从所述第一文字对应的发音中确定出所述第三部分对应的发音片段;

所述第二生成单元,用于根据所述第三部分对应的发音片段生成对应所述第三部分对应的发音示例;

所述第三返回单元,用于向所述终端返回所述第三部分对应的发音示例。

在本申请一种实施方式中,所述发音请求中包括变速参数,所述第一生成单元203,包括:

调整子单元,用于根据所述变速参数调整所述第一部分对应的发音片段的发音速度;

获得子单元,用于得到变速发音片段,并将所述变速发音片段作为所述第一部分对应的发音示例。

在本申请一种实施方式中,所述变速参数包括降低发音速度的比例或提高发音速度的比例。

在本申请一种实施方式中,还包括第三确定单元和第三返回单元:

第三确定单元,用于根据所述第一部分,确定出第二文字,所述第二文字中具有所述第一部分;

第四返回单元,用于向所述终端返回所述第二文字。

在本申请一种实施方式中,所述第三确定单元,包括:

第四确定子单元,用于根据所述第一部分和所述第一部分对应的发音片段,确定出第二文字,所述第二文字中具有所述第一部分,且所述第二文字中第一部分对应的发音为所述第一部分对应的发音片段。

本申请实施例所提供的文字发音装置,可以根据文字的组成形式将文字分为多个部分,当获取了针对第一文字中第一部分的发音请求时,可以根据第一部分在第一文字中的位置,从第一文字对应的发音中确定出与该第一部分对应的发音片段,并向终端返回由该第一部分对应的发音片段生成的发音示例,以使得在终端上可以播放针对第一部分的发音示例,从而使用该终端的用户可以收听到仅针对第一文字中第一部分的发音。当第一部分的发音是第一文字中的发音难点时,用户可以通过播放或反复播放第一部分的发音示例进行有针对性的学习,提高了学习第一文字发音的效率。

本申请实施例还提供了一种文字发音的装置,该装置可以包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:

获取针对第一文字中第一部分的发音请求,所述第一文字包括多个部分,所述第一部分为所述多个部分中的一个,所述发音请求为终端发送的;

从所述第一文字对应的发音中确定出所述第一部分对应的发音片段;

根据所述第一部分对应的发音片段生成所述第一部分对应的发音示例;

向所述终端返回所述第一部分对应的发音示例。

在本申请的一种实施方式中,所述处理器还用于调用所述存储器存储的程序指令执行如下操作:

所述第一文字的多个部分是根据发音音节确定的。

在本申请的一种实施方式中,所述处理器还用于调用所述存储器存储的程序指令执行如下操作:

所述第一文字的多个部分是根据构成所述第一文字的字符确定的。

在本申请的一种实施方式中,所述处理器还用于调用所述存储器存储的程序指令执行如下操作:

在所述从所述第一文字对应的发音中确定出所述第一部分对应的发音片段之前,还包括:

判断所述第一部分是否与第二部分构成第三部分,所述第二部分为所述多个部分中与所述第一部分在所述第一文字中相邻的一个,所述第三部分为所述第一文字中一个发音音节对应的部分;

若判断结果为是,向所述终端返回发音提示,所述发音提示用于指示所述第一部分与所述第三部分的对应关系。

在本申请的一种实施方式中,所述处理器还用于调用所述存储器存储的程序指令执行如下操作:

若判断结果为是,还包括:

从所述第一文字对应的发音中确定出所述第三部分对应的发音片段;

根据所述第三部分对应的发音片段生成对应所述第三部分对应的发音示例;

向所述终端返回所述第三部分对应的发音示例。

在本申请的一种实施方式中,所述处理器还用于调用所述存储器存储的程序指令执行如下操作:

所述发音请求中包括变速参数,所述根据所述第一部分对应的发音片段生成所述第一部分对应的发音示例,包括:

根据所述变速参数调整所述第一部分对应的发音片段的发音速度,得到变速发音片段;

将所述变速发音片段作为所述第一部分对应的发音示例。

在本申请的一种实施方式中,所述处理器还用于调用所述存储器存储的程序指令执行如下操作:

所述变速参数包括降低发音速度的比例或提高发音速度的比例。

在本申请的一种实施方式中,所述处理器还用于调用所述存储器存储的程序指令执行如下操作:,还包括:

根据所述第一部分,确定出第二文字,所述第二文字中具有所述第一部分;

向所述终端返回所述第二文字。

在本申请的一种实施方式中,所述处理器还用于调用所述存储器存储的程序指令执行如下操作:

所述根据所述第一部分,确定出第二文字,包括:

根据所述第一部分和所述第一部分对应的发音片段,确定出第二文字,所述第二文字中具有所述第一部分,且所述第二文字中第一部分对应的发音为所述第一部分对应的发音片段。

图3是根据一示例性实施例示出的一种文字发音的装置300作为终端时的框图。例如,装置300可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。

参照图3,装置300可以包括以下一个或多个组件:处理组件302,存储器304,电源组件306,多媒体组件308,音频组件310,输入/输出(i/o)的接口312,传感器组件314,以及通信组件316。

处理组件302通常控制装置300的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件302可以包括一个或多个处理器320来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件302可以包括一个或多个模块,便于处理组件302和其他组件之间的交互。例如,处理组件302可以包括多媒体模块,以方便多媒体组件308和处理组件302之间的交互。

存储器304被配置为存储各种类型的数据以支持在设备300的操作。这些数据的示例包括用于在装置300上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器304可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。

电源组件306为装置300的各种组件提供电力。电源组件306可以包括电源管理系统,一个或多个电源,及其他与为装置300生成、管理和分配电力相关联的组件。

多媒体组件308包括在所述装置300和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动运动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件308包括一个前置摄像头和/或后置摄像头。当设备300处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件310被配置为输出和/或输入音频信号。例如,音频组件310包括一个麦克风(mic),当装置300处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器304或经由通信组件316发送。在一些实施例中,音频组件310还包括一个扬声器,用于输出音频信号。

i/o接口312为处理组件302和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件314包括一个或多个传感器,用于为装置300提供各个方面的状态评估。例如,传感器组件314可以检测到设备300的打开/关闭状态,组件的相对定位,例如所述组件为装置300的显示器和小键盘,传感器组件314还可以检测装置300或装置300一个组件的位置改变,用户与装置300接触的存在或不存在,装置300方位或加速/减速和装置300的温度变化。传感器组件314可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物品的存在。传感器组件314还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件314还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件316被配置为便于装置300和其他设备之间有线或无线方式的通信。装置300可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信部件316经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件316还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。

在示例性实施例中,装置300可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器304,上述指令可由装置300的处理器320执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

图4是本申请的一些实施例中服务器的结构示意图。该服务器400可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(centralprocessingunits,cpu)422(例如,一个或一个以上处理器)和存储器432,一个或一个以上存储应用程序442或数据444的存储介质430(例如一个或一个以上海量存储设备)。其中,存储器432和存储介质430可以是短暂存储或持久存储。存储在存储介质430的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器422可以设置为与存储介质430通信,在服务器400上执行存储介质430中的一系列指令操作。

服务器400还可以包括一个或一个以上电源426,一个或一个以上有线或无线网络接口450,一个或一个以上输入输出接口458,一个或一个以上键盘456,和/或,一个或一个以上操作系统441,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm等等。

一种非临时性计算机可读存储介质,当所述存储介质中的指令由装置(终端或者服务器)的处理器执行时,使得装置能够执行一种视频的生成方法,所述方法包括:

获取针对第一文字中第一部分的发音请求,所述第一文字包括多个部分,所述第一部分为所述多个部分中的一个,所述发音请求为终端发送的;

从所述第一文字对应的发音中确定出所述第一部分对应的发音片段;

根据所述第一部分对应的发音片段生成所述第一部分对应的发音示例;

向所述终端返回所述第一部分对应的发音示例。

本领域技术人员在考虑说明书及实践这里公开的申请后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。

应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制

以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

以上对本申请所提供的一种文字发音装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1