一种文字发音方法和装置与流程

文档序号：16188325发布日期：2018-12-08 05:26阅读：243来源：国知局

本申请涉及数据处理领域，特别是涉及一种文字发音方法和装置。

背景技术

随着网络词典、网络翻译的普及，用户可以在网上学习外语文字。

学习外语时需要学习该外语文字的发音，传统方式中，可以在文字后示出小喇叭的按钮，用户点击该按钮后可以收听到该文字的发音示例。用户可以通过收听发音示例来学习文字发音。

技术实现要素：

传统方式中针对文字的发音示例主要包括该文字的整体发音，即文字的完整发音，针对较长文字或发音难度较高的文字，完整发音的长度会较长，或完整发音中的发音难点较多，用户即使收听了多遍发音示例后依然难以记住如何发音，针对其中的发音难点仍旧不容易掌握，导致用户体验不高。

为了解决上述技术问题，第一方面，本申请提供了一种文字发音方法，该方法包括：

获取针对第一文字中第一部分的发音请求，所述第一文字包括多个部分，所述第一部分为所述多个部分中的一个，所述发音请求为终端发送的；

从所述第一文字对应的发音中确定出所述第一部分对应的发音片段；

根据所述第一部分对应的发音片段生成所述第一部分对应的发音示例；

向所述终端返回所述第一部分对应的发音示例。

可选的，所述第一文字的多个部分是根据发音音节确定的。

可选的，所述第一文字的多个部分是根据构成所述第一文字的字符确定的。

可选的，在所述从所述第一文字对应的发音中确定出所述第一部分对应的发音片段之前，还包括：

判断所述第一部分是否与第二部分构成第三部分，所述第二部分为所述多个部分中与所述第一部分在所述第一文字中相邻的一个，所述第三部分为所述第一文字中一个发音音节对应的部分；

若判断结果为是，向所述终端返回发音提示，所述发音提示用于指示所述第一部分与所述第三部分的对应关系。

可选的，若判断结果为是，还包括：

从所述第一文字对应的发音中确定出所述第三部分对应的发音片段；

根据所述第三部分对应的发音片段生成对应所述第三部分对应的发音示例；

向所述终端返回所述第三部分对应的发音示例。

可选的，所述发音请求中包括变速参数，所述根据所述第一部分对应的发音片段生成所述第一部分对应的发音示例，包括：

根据所述变速参数调整所述第一部分对应的发音片段的发音速度，得到变速发音片段；

将所述变速发音片段作为所述第一部分对应的发音示例。

可选的，所述变速参数包括降低发音速度的比例或提高发音速度的比例。

可选的，还包括：

根据所述第一部分，确定出第二文字，所述第二文字中具有所述第一部分；

向所述终端返回所述第二文字。

可选的，所述根据所述第一部分，确定出第二文字，包括：

根据所述第一部分和所述第一部分对应的发音片段，确定出第二文字，所述第二文字中具有所述第一部分，且所述第二文字中第一部分对应的发音为所述第一部分对应的发音片段。

第二方面，本申请还提供了一种文字发音装置，该装置包括第一获取单元、第一确认单元、第一生成单元和第一返回单元：

所述第一获取单元，用于获取针对第一文字中第一部分的发音请求，所述第一文字包括多个部分，所述第一部分为所述多个部分中的一个，所述发音请求为终端发送的；

所述第一确认单元，用于从所述第一文字对应的发音中确定出所述第一部分对应的发音片段；

所述第一生成单元，用于根据所述第一部分对应的发音片段生成所述第一部分对应的发音示例；

所述第一返回单元，用于向所述终端返回所述第一部分对应的发音示例。

可选的，所述第一文字的多个部分是根据发音音节确定的。

可选的，所述第一文字的多个部分是根据构成所述第一文字的字符确定的。

可选的，还包括判断单元：

所述判断单元，用于判断所述第一部分是否与第二部分构成第三部分，所述第二部分为所述多个部分中与所述第一部分在所述第一文字中相邻的一个，所述第三部分为所述第一文字中一个发音音节对应的部分；若判断结果为是，则触发第二返回单元；

所述第二返回单元，用于向所述终端返回发音提示，所述发音提示用于指示所述第一部分与所述第三部分的对应关系。

可选的，若判断结果为是，还包括第二确定单元、第二生成单元和第三返回单元：

所述第二确定单元，用于从所述第一文字对应的发音中确定出所述第三部分对应的发音片段；

所述第二生成单元，用于根据所述第三部分对应的发音片段生成对应所述第三部分对应的发音示例；

所述第三返回单元，用于向所述终端返回所述第三部分对应的发音示例。

可选的，所述发音请求中包括变速参数，所述第一生成单元，包括：

调整子单元，用于根据所述变速参数调整所述第一部分对应的发音片段的发音速度；

获得子单元，用于得到变速发音片段，并将所述变速发音片段作为所述第一部分对应的发音示例。

可选的，所述变速参数包括降低发音速度的比例或提高发音速度的比例。

可选的，还包括第三确定单元和第三返回单元：

第三确定单元，用于根据所述第一部分，确定出第二文字，所述第二文字中具有所述第一部分；

第四返回单元，用于向所述终端返回所述第二文字。

可选的，所述第三确定单元，包括：

第四确定子单元，用于根据所述第一部分和所述第一部分对应的发音片段，确定出第二文字，所述第二文字中具有所述第一部分，且所述第二文字中第一部分对应的发音为所述第一部分对应的发音片段。

第三方面，本申请还提供了一种文字发音装置，该装置包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

获取针对第一文字中第一部分的发音请求，所述第一文字包括多个部分，所述第一部分为所述多个部分中的一个，所述发音请求为终端发送的；

从所述第一文字对应的发音中确定出所述第一部分对应的发音片段；

根据所述第一部分对应的发音片段生成所述第一部分对应的发音示例；

向所述终端返回所述第一部分对应的发音示例。

第四方面，本申请还提供了一种机器可读介质，其上存储有指令，当由一个或多个处理器执行时，使得装置执行第一方面中所述的方法。

由上述技术方案可以看出，可以根据文字的组成形式将文字分为多个部分，当获取了针对第一文字中第一部分的发音请求时，可以根据第一部分在第一文字中的位置，从第一文字对应的发音中确定出与该第一部分对应的发音片段，并向终端返回由该第一部分对应的发音片段生成的发音示例，以使得在终端上可以播放针对第一部分的发音示例，使用该终端的用户可以收听到仅针对第一文字中第一部分的发音，当第一部分的发音是第一文字中的发音难点时，用户可以通过播放或反复播放第一部分的发音示例进行有针对性的学习，提高了学习第一文字发音的效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种文字发音方法的方法流程图；

图2为本申请实施例提供的一种文字发音装置的装置结构图；

图3为本申请实施例提供的一种文字发音的装置作为终端时的结构框图；

图4为本申请实施例提供的一些实施例中服务器的结构示意图。

具体实施方式

下面结合附图，对本申请的实施例进行描述。

网络上用于学习外语的软件或页面，一般会在外语中的文字后边示出小喇叭的按钮，用户通过点击该按钮，可以收听到该文字的发音示例。本申请实施例中提到的外语是相对于学习者的一种语种概念，即外语是与学习者母语不同的语种，例如相对于中文母语的用户，外语可以是除了汉语以外的其他语种。而文字和外语的语种相关，当外语是英语时，文字可以是英语单词等，当外语是汉语时，文字可以是字、词、成语、短语等。需要说明的是，本申请实施例中所提到的文字可以是各种语言文字，除了上述提到的英语单词、中国汉字以外，还可以是德语单词、韩文等语言文字，在本申请实施例中不对文字的种类进行任何限定。

发明人发现，传统方式中提供的发音示例均是文字的完整发音，在用户学习文字发音的过程中，针对较长文字或者发音难度较高的文字，由于完整发音的长度较长或发音难点较多，用户即使反复收听很多遍文字的发音示例后，也可能还是无法准确掌握发音方法。

例如，在学习英语的过程中，对于音标或者发音规律(比如爆破音等特殊情况)不熟悉的同学，即使反复听了很多遍的单词整体发音，通常还是无法精确掌握该单词的正确发音方法。

为此，本申请实施例提供了一种针对上述关于完整发音情况的解决方式，以希望对于较长文字或者发音难度较高的文字，用户可以通过针对性的学习文字完整发音中的发音难点，从而可以快速地准确掌握正确的发音方法，提高用户的学习体验。

本申请实施例可以应用于服务器中。例如，服务器可以获取发音请求，该发音请求是终端为了从服务器侧获取一文字中的某一部分对应的发音示例而发送的，为了便于描述，将该文字称为第一文字。第一文字可以是用户想要查找、并用于学习发音的文字，第一文字中可以包括多个字符。

为了让用户能够重点反复学习第一文字完整发音中的发音难点部分，提高用户学习第一文字发音的效率，第一文字中的多个字符可以根据第一文字的组成形式进行划分，从而将第一文字分为多个部分，以希望能够通过将第一文字分为多个部分，便于使用终端的用户在希望收听到仅针对第一文字中某一部分发音的需求时，能够选取第一文字中的一部分。由于第一文字可以根据其组成形式分为多个部分，为了便于描述，例如可以分别称这些部分为第一部分、第二部分、第三部分等。

需要说明的是，由于第一文字的完整发音可以根据发音规律划分为多个发音音节，每一个发音音节都对应着第一文字中的某一部分，因此，可以根据发音音节将第一文字分为多个部分，由此方式得到的每个部分都可以对应完整的发音音节，便于之后确定发音片段。

为了便于理解，下面举例来说明本申请实施例中的如何根据发音音节将第一文字分为多个部分：

在外语为英语的情况下，第一文字可以是英文单词，例如“basketball”，由于“basketball”的发音为根据英文单词的发音规律，“basketball”的发音可以依据发音规律划分为多个发音音节，该发音音节分别为：[ba：]、[s]、[kit]、进一步地，可以根据发音音节的划分将“basketball”分为多个部分，一个部分可以与一个发音音节相对应，如可以将“basketball”分为“ba”、“s”、“ket”、“ball”这几个部分。

再例如，外语为汉语的情况下，第一文字可以是汉字成语，例如“柳暗花明”，由于“柳暗花明”的发音为“liǔànhuāmíng”，根据汉字的发音规律，“柳暗花明”的发音可以依据发音规律划分为多个发音音节，该发音音节分别为：liǔ、àn、huā、míng，进一步地，可以根据该发音音节的划分将“柳暗花明”分为多个部分，一个部分可以与一个发音音节相对应，如可以将“柳暗花明”分为“柳”、“暗”、“花”、“明”这几个部分。

由于第一文字是由多个字符组成的，为了便于用户理解和记忆，第一文字也可以是根据构成第一文字的字符分为多个部分，其中，每一部分可以是一个具有独立意义的文字，甚至还可以直接以字符为划分单位，将第一文字分为多个部分，其中，每个部分可以为一个字符，也可以为多个字符。通过这种划分方式，能够更贴合用户需求，用户可以根据自身学习需求或收听目的选择想要收听的部分。

为了便于理解，下面举例来说明本申请实施例中如何根据构成第一文字的字符将第一文字分为多个部分：

同样在外语为英语的情况下，第一文字可以是英文单词，例如“basketball”。在“basketball”中，由于“basket”可以作为一个名词，包含“篮；一篮；(篮球运动的)篮；投篮得分”的意思，“ball”也可以作为一个名词，包含“球”的意思，因此，可以根据构成“basketball”的字符，将“basketball”分为“basket”和“ball”两个部分，每一部分都可以是一个具有独立意义的文字。甚至还可以直接以字符为划分单位，将“basketball”分为十个部分，每个部分为一个字母。

再例如，同样外语为汉语的情况下，第一文字可以是汉字成语，例如“柳暗花明”，由于在“柳暗花明”中，“柳暗”的含义是垂柳浓密，形容柳树成荫，而“花明”的含义是鲜花夺目，形容繁花似锦，因此，可以根据构成“柳暗花明”的字符，将“柳暗花明”分为“柳暗”、“花明”两个部分，每一部分都可以是一个具有独立意义的文字。甚至还可以直接以字符为划分单位，将“柳暗花明”分为四个部分，每个部分为一个汉字。

需要强调的是，第一文字除了上述几种可能的划分方式以外，还可以为其它不同的划分方式，在此不再对第一文字的划分方式一一赘述。

接下来，结合图1来说明本申请实施例如何实现对文字的一部分进行发音。图1为本申请实施例提供的一种文字发音方法的方法流程图，该方法包括：

s101：获取针对第一文字中第一部分的发音请求，所述第一文字包括多个部分，所述第一部分为所述多个部分中的一个，所述发音请求为终端发送的。

举例来说，服务器可以作为本申请实施例的执行主体，即可以由该服务器执行s101-s103。为方便描述，本实施例中将用户侧所使用的设备，即作为发音示例的请求方的用户设备称为终端，该终端可以是移动终端、计算机等具有播放发音示例功能的设备。

本申请实施例中，第一文字可以是包括多个部分的字词，比如英语单词、汉语成语等。第一文字中的第一部分可以是用户想要收听发音的文字部分，以希望通过发送针对第一文字中的第一部分的发音请求，获得该第一部分对应的发音示例。

例如，外语为英语的情况下，用户想要学习英文单词“basketball”的发音方法，用户使用终端查找英文单词“basketball”，第一文字“basketball”可以根据发音音节将“basketball”分为第二部分“ba”、第三部分“s”、第一部分“ket”、第四部分“ball”等多个部分；该用户听了几次“basketball”的完整读音之后，还是无法准确掌握第一部分“ket”的发音方法，便单独点击第一部分“ket”，以希望可以收听到仅针对第一文字“basketball”中第一部分“ket”的发音；该用户选择该第一部分后，终端响应于针对该第一部分的选择，向服务器发送针对第一文字中第一部分的发音请求。

需要说明的，为了使得服务器能够从发音请求中，确定用户想要学习的第一文字，以及用户想要获得的发音示例所对应的第一文字中的第一部分，该发音请求可以包括第一文字和第一文字中的第一部分。

s102：从所述第一文字对应的发音中确定出所述第一部分对应的发音片段。

由于已经保存了第一文字对应的完整发音，故在获取发音请求后，可以根据第一部分在第一文字中的位置，从第一文字对应的完整发音中确定出与第一部分所在第一文字中位置对应的发音片段，这一发音片段可以作为第一部分对应的发音片段。

例如，服务器根据获取的发音请求，确定出第一文字为“basketball”，第一部分为“basketball”中的“ket”，服务器可以从“basketball”对应的发音中，根据该第一文字的发音规律，可知，第一部分“ket”对应的音节的发音为[kit]，可以以此作为第一部分“ket”对应的发音片段。

s103：根据所述第一部分对应的发音片段生成所述第一部分对应的发音示例。

其中，第一部分对应的发音示例是根据第一部分对应的发音片段生成的，以便终端在获取该发音示例时可以播放，使得用户能够收听到针对第一部分的发音。

由于有些用户还没有准确掌握第一文字中第一部分的发音，因此，这些用户希望针对第一部分的发音示例的发音速度可以慢一点，以便更好地掌握第一部分在第一文字中的发音方法以及发音的变换规则；而有些用户已经很好地掌握了第一文字中第一部分的发音，只是想通过播放发音示例温习第一部分的发音，为了能够节省时间，希望针对第一部分的发音示例的发音速度可以快一点。

为了满足不同用户对于第一部分对应的发音示例的发音速度要求，在一种可选的实现方式中，针对第一文字中第一片段的发音请求还可以包括变速参数，该变速参数可以标识出所需的发音速度，该发音速度的快慢与用户的收听需求相关。故当获取该发音请求时，可以根据所携带的变速参数确定出需要如何调整第一部分对应的发音片段的发音速度，例如调快或调慢。故在根据第一部分对应的发音片段生成对应所述第一部分对应的发音示例时，可以根据该变速参数调整第一部分对应的发音片段的发音速度，得到变速发音片段。并将该变速发音片段作为第一部分对应的发音示例。其中，该变速发音片段可以是根据变速参数调整了发音速度后的第一部分的发音片段。

为了能够更为精细的体现用户的收听需求，该变速参数可以包括降低发音速度的比例或提高发音的比例，该比例可以表示出所需的变速发音速度与正常发音速度的速度之间的比例关系，例如当变速参数为80％时，可以理解为所需的变速发音速度为正常发音速度的80％，即较慢的发音速度。当变速参数为120％时，可以理解为所需的变速发音速度为正常发音速度的120％，即较快的发音速度。

通过引入变速参数来标识发音速度，以希望用户能够根据自己对于发音速度的需求，来调整用户想要收听发音的第一部分对应的发音片段的发音速度，从而得到符合用户要求的发音示例。也就是说，用户可以根据自己对于不同文字的发音掌握情况，自主地确定第一部分对应的发音示例的发音速度，以便满足不同用户对于第一部分对应的发音示例的不同要求。为了能够让用户自主确定发音速度，可以在终端上展示相应的调整界面或调整模式，例如在展示界面上提高不同档位的发音速度，或者提供针对不同发音速度的变速模式以供用户选择。

为了便于理解，现结合具体场景进行举例说明：

在一种情况中，一个英文单词的发音包括多个音节，以及各种发音变换规则，即使将该英文单词根据组成形式分为多个部分，用户反复播放发音难度较高的第一部分对应的发音示例后，仍有可能还是很难准确掌握该部分的正确发音。因此，该用户可以选择收听第一部分对应的发音示例，该发音示例为用户确定变速参数中的降低发音速度比例为80％的变速发音片段，由于该变速发音片段的发音速度较慢，用户能够更清晰地、准确地收听到第一部分的发音变换规则，从而准确掌握第一部分的正确发音；

在另一种情况中，对于一个英文单词，用户经过之前的学习，已经较为准确掌握了该英文单词的正确发音，但为了更好地巩固之前掌握的发音，该用户会偶尔收听该英文单词的第一部分对应的发音示例。对于该用户而言，更喜欢选择收听第一部分对应的发音示例，该发音示例为用户确定变速参数中的提高发音速度比例为120％的变速发音片段，由于该变速发音片段的发音速度较快，用户能够在巩固第一部分的正确发音方式的前提下，还可以节约复习时间。

s104：向所述终端返回所述第一部分对应的发音示例。

具体地，为了服务器能够准确地将生成的第一部分对应的发音示例返回给相应的终端，发音请求中还可以包括终端标识，该终端标识用于标识发送发音请求的用户设备，可选地，该终端标识可以包括设备身份标识号码(identification，id)和/或网络之间互连的协议(internetprotocol，ip)地址。

由于发音请求中包括终端标识，故在生成了第一部分对应的发音示例后，服务器可以根据发音请求中的终端标识，将生成的第一部分对应的发音示例返回给终端标识对应的终端，以希望用户能够通过该终端播放或反复播放该发音示例，从而对第一文字中第一部分进行有针对性的学习。

可见，本申请实施例中，可以根据文字的组成形式将文字分为多个部分，当获取了针对第一文字中第一部分的发音请求时，可以根据第一部分在第一文字中的位置，从第一文字对应的发音中确定出与该第一部分对应的发音片段，并向终端返回由该第一部分对应的发音片段生成的发音示例，以使得在终端上可以播放针对第一部分的发音示例，从而使用该终端的用户可以收听到仅针对第一文字中第一部分的发音。当第一部分的发音是第一文字中的发音难点时，用户可以通过播放或反复播放第一部分的发音示例进行有针对性的学习，提高了学习第一文字发音的效率。

由于第一文字可以根据构成第一文字的字符分为多个部分，比如可以直接以字符为划分单位，将第一文字分为多个部分，每个部分都为一个字符，例如，英文单词“foot”，其对应的发音为该英文单词可以根据构成其的字符，将该英文单词分为“f”、“o”、“o”、“t”等四个部分。根据“foot”的发音规律可知，只有当两个字母“o”结合在一起构成字母组合“oo”，该字母组合“oo”才能够在发音中有一个对应的发音音节，即英文单词“foot”中的字母组合“oo”在该英文单词的发音中对应的发音音节为：若用户在终端上选择一个字母“o”作为第一文字“foot”的第一部分，那么，由于第一部分“o”在英文单词“foot”的发音中不存在一个对应的发音音节，因此，第一部分“o”没有对应的发音示例。

因此，在上述采用字符划分第一文字的情况下，若用户选择的第一部分实际上并不能对应完整的音节，或者说单独第一部分可能并不能发音的情况下，可能会对确定第一部分的发音片段带来困难，而且，假设将包括了第一部分以及其他部分构成的完整音节的发音片段提供给用户，可能也会对用户带来误导。例如，第一部分“o”没有对应的发音示例，第一部分“o”需要和与其相邻的另一部分“o”相结合构成第三部分“oo”，第三部分“oo”才能够在第一文字“foot”的发音中有一个对应的发音音节在此情况下，如果不向终端返回第一部分“o”对应的发音示例，用户可能认为在第一文字“foot”中，第一部分“o”是不发音的部分；如果向终端返回以为发音片段生成的发音示例，会使得用户错误地认为，在第一文字“foot”中，第一部分“o”对应的音节为

为了用户能够了解第一文字的各个部分与各个发音音节之间的对应关系，本申请实施例针对第一文字是根据构成第一文字的字符分为多个部分，而文字中的第一部分可能需要和与其相邻的另一部分相结合，才能够在该文字的发音中有一个对应的发音音节的情况，可选的，在s102之前，可以先判断第一部分是否与第二部分构成第三部分。若是，向终端返回发音提示，进一步地，还可以从第一文字对应的发音中确定出该第三部分对应的发音片段，以及根据该第三部分对应的发音片段生成对应该第三部分对应的发音示例，接着向终端返回该第三部分对应的发音示例。

具体地，第二部分为第一文字根据构成第一文字的字符分成的多个部分中与第一部分在该第一文字中相邻的一个，第三部分为该第一文字中一个发音音节对应的部分，发音提示用于指示第一部分与第三部分的对应关系。

也就是说，确定用户选择的第一文字中的第一部分可以与第二部分构成第三部分时，可以向终端返回发音提示以及第三部分对应的发音示例，以希望能够提示用户第一部分需要和与其相邻的第二部分相结合构成了第三部分，该第三部分才能够在第一文字的发音中有一个对应的发音音节，并且能够收听到该第三部分的发音示例。为了便于理解，同样以第一文字“foot”来举例说明：确定了用户选择的第一文字“foot”中第一部分“o”没有对应的发音示例，需要和与其相邻的另一部分“o”相结合构成第三部分“oo”，第三部分“oo”才能够在第一文字“foot”的发音中有一个对应的发音音节时，服务器向终端返回内容为“抱歉！您选择的‘o’没有对应的发音，可以选择‘oo’收听对应的发音。”的提示；用户在看到提示后，重新选择了第一文字“foot”中第三部分“oo”，进一步地，服务器响应于用户对于第三部分“oo”的选择，根据第三部分“oo”对应的发音片段生成第三部分“oo”对应的发音示例，接着向终端返回该第三部分“oo”对应的发音示例；用户在终端接收到该发音示例后，便可以通过使用终端播放该发音示例，收听到第三部分“oo”的准确发音。

可见，在本申请实施例中，经过判断，确定了第一文字中的第一部分可以和与其相邻的第二部分构成第三部分，便向终端返回发音提示，以及该第三部分对应的发音示例，即起到了提示用户第一文字的各个部分与各个发音音节之间的对应关系的作用，从而用户对于该第一文字的发音的理解与记忆变得更加容易，也提高了用户学习第一文字发音的效率。

在用户已经准确掌握了第一文字的发音方法之后，可能会希望能够再学习与第一文字中第一部分的发音相似的其他文字，以便于用户多练习相似的发音方法，从而巩固已经掌握的第一部分的发音方法，以及学习更多的相似文字发音方法。

为了给用户提供更多的与第一文字中第一部分的发音相似的其他文字进行发音练习，可选的，本申请实施例中，还可以先根据第一部分，确定出第二文字，其中，该第二文字中具有第一部分，接着，向终端返回所述第二文字。

为了给用户提供的第二文字更加符合用户的学习能力，第二文字与第一文字的发音复杂程度可以是相似的，以希望第二文字能够更加符合用户目前的知识水平，更易于掌握第二文字。需要说明的是，第二文字与第一文字的发音复杂程度可以是相似的，可以理解为，构成第一文字与第二文字的字符数量相似或相同，并且第一文字与第二文字都属于同一类范畴中，比如，第一文字为英语单词，并且属于初中词汇，则第二文字也应当属于初中词汇的范畴中。

为了便于理解，现结合具体场景来举例说明，本申请实施例中如何根据第一部分，确定出第二文字：

在使用终端的用户为小学生，用户学习的外语为英语的情况下，用户在终端选择的第一文字为“foot”，选择的第一文字中第一部分为“oo”，其中，第一文字“foot”中的第一部分“oo”的发音音节为根据第一部分“oo”，在小学英语词汇的范畴中，可以找到第二文字“noon”。显然，第二文字“noon”与第一文字“foot”的发音复杂程度相似，并且同样都具有第一部分“oo”，只不过两者的区别在于，第二文字“noon”中的第一部分“oo”的发音音节为u:而不是因此，第二文字“noon”符合要求，可以将第二文字“noon”返回给终端，从而起到举一反三的效果。

当用户还没有完全准确掌握第一文字的发音方法时，可能会希望能够再学习与第一文字中的第一部分发音音节完全相同的其他文字，以便于用户更多地练习与第一部分发音相同的发音方法，从而更好地学习第一部分的发音方法。为了给用户提供更多的与第一文字中第一部分的发音相同的其他文字进行发音练习，进一步地，本申请实施例中可以根据第一部分和该第一部分对应的发音片段，确定出第二文字，其中，该第二文字中具有第一部分，并且该第二文字中第一部分对应的发音为该第一部分对应的发音片段。

为了给用户提供的第二文字符合用户的学习能力并且能够满足用户的需求，第二文字与第一文字的发音不但复杂程度可以是相似的，而且该第二文字中的第一部分的发音音节与该第一文字中的第一部分是完全相同的，以希望用户能够更加准确地掌握第一部分的发音方法。

为了便于理解，现结合具体场景来举例说明，本申请实施例中如何根据第一部分和该第一部分对应的发音片段，确定出第二文字：

在使用终端的用户为初中生，用户学习的外语为英语的情况下，用户在终端选择的第一文字为“bedroom”，选择的第一文字中第一部分为“oo”，其中，第一文字“bedroom”中的第一部分“oo”的发音音节为u:。根据第一部分“oo”，在初中英语词汇的范畴中，可以找到第二文字“classroom”。显然，第二文字“noon”与第一文字“bedroom”的发音复杂程度相似，同样都具有第一部分“oo”，并且第二文字“classroom”中的第一部分“oo”的发音音节同样均为u:。因此，第二文字“classroom”符合用户的需求，可以将第二文字“noon”返回给终端。

可见，在本申请实施例中，通过向终端返回第二文字，可以为用户提供更多的与第一文字的发音相似的其他文字，以希望用户能够更多地练习相似的发音，同时学习更多的发音方法，以达到举一反三的效果，以便用户能够更好地学习各种文字发音。

参见图2，为本申请实施例提供的一种文字发音装置的组成示意图，该装置包括第一获取单元201、第一确认单元202、第一生成单元203和第一返回单元204：

所述第一获取单元201，用于获取针对第一文字中第一部分的发音请求，所述第一文字包括多个部分，所述第一部分为所述多个部分中的一个，所述发音请求为终端发送的；

所述第一确认单元202，用于从所述第一文字对应的发音中确定出所述第一部分对应的发音片段；

所述第一生成单元203，用于根据所述第一部分对应的发音片段生成所述第一部分对应的发音示例；

所述第一返回单元204，用于向所述终端返回所述第一部分对应的发音示例。

在本申请一种实施方式中，所述第一文字的多个部分是根据发音音节确定的。

在本申请一种实施方式中，所述第一文字的多个部分是根据构成所述第一文字的字符确定的。

在本申请一种实施方式中，还包括判断单元：

所述第二返回单元，用于向所述终端返回发音提示，所述发音提示用于指示所述第一部分与所述第三部分的对应关系。

在本申请一种实施方式中，若判断结果为是，还包括第二确定单元、第二生成单元和第三返回单元：

所述第二确定单元，用于从所述第一文字对应的发音中确定出所述第三部分对应的发音片段；

所述第二生成单元，用于根据所述第三部分对应的发音片段生成对应所述第三部分对应的发音示例；

所述第三返回单元，用于向所述终端返回所述第三部分对应的发音示例。

在本申请一种实施方式中，所述发音请求中包括变速参数，所述第一生成单元203，包括：

调整子单元，用于根据所述变速参数调整所述第一部分对应的发音片段的发音速度；

获得子单元，用于得到变速发音片段，并将所述变速发音片段作为所述第一部分对应的发音示例。

在本申请一种实施方式中，所述变速参数包括降低发音速度的比例或提高发音速度的比例。

在本申请一种实施方式中，还包括第三确定单元和第三返回单元：

第三确定单元，用于根据所述第一部分，确定出第二文字，所述第二文字中具有所述第一部分；

第四返回单元，用于向所述终端返回所述第二文字。

在本申请一种实施方式中，所述第三确定单元，包括：

本申请实施例所提供的文字发音装置，可以根据文字的组成形式将文字分为多个部分，当获取了针对第一文字中第一部分的发音请求时，可以根据第一部分在第一文字中的位置，从第一文字对应的发音中确定出与该第一部分对应的发音片段，并向终端返回由该第一部分对应的发音片段生成的发音示例，以使得在终端上可以播放针对第一部分的发音示例，从而使用该终端的用户可以收听到仅针对第一文字中第一部分的发音。当第一部分的发音是第一文字中的发音难点时，用户可以通过播放或反复播放第一部分的发音示例进行有针对性的学习，提高了学习第一文字发音的效率。

本申请实施例还提供了一种文字发音的装置，该装置可以包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

获取针对第一文字中第一部分的发音请求，所述第一文字包括多个部分，所述第一部分为所述多个部分中的一个，所述发音请求为终端发送的；

从所述第一文字对应的发音中确定出所述第一部分对应的发音片段；

根据所述第一部分对应的发音片段生成所述第一部分对应的发音示例；

向所述终端返回所述第一部分对应的发音示例。