基于语音信息的教学方法、装置、电子设备及存储介质与流程

文档序号：20153452发布日期：2020-03-24 20:19阅读：126来源：国知局

本申请涉及智能设备技术领域，更具体地，涉及一种基于语音信息的教学方法、装置、电子设备及存储介质。

背景技术：

语言是生活中常见的一种交流工具，在生活和工作中占有非常重要的地位，不论是学生在学校的学习阶段还是人们在工作的阶段，对语言的学习都是非常重要的内容。随着科技的进步，对语言的学习不仅仅局限与在教室中进行通过专门的老师进行教学。用户可以通过专门的教学软件利用网络进行语言的学习，网络授课的方式不受时间和地点的限制，受到广大用户的喜爱。

然而，在网络教学中，通常是机器对用户的语音进行审核测评，难以实现针对性的教学。

技术实现要素：

本申请提出了一种基于语音信息的教学方法、装置、电子设备及存储介质，在教学时具有较强的针对性，从而提升教学效果。

第一方面，本申请实施例提供了一种基于语音信息的教学方法，该方法包括：获取用户输入的语音信息，所述语音信息包括多个文本单元的发音；判断所述语音信息中每个文本单元的发音是否标准，将所述语音信息中发音不标准的文本单元作为目标文本单元；获取所述目标文本单元的标准发音，获取所述目标文本单元的标准发音，根据所述目标文本单元的标准发音生成与所述目标文本单元对应的教学信息；输出所述教学信息。

可选的，在获取用户输入的语音信息之前，显示待阅读文本，所述待阅读文本用于用户阅读以输入所述语音信息。

可选的，预先存储所述待阅读文本中每个文本单元的标准发音，对所述语音信息中的每个文本单元，比对所述文本单元的发音与对应的标准发音得到文本单元的发音准确值；若所述文本单元的发音准确值大于或等于预设准确值，判定所述文本单元的发音标准；若所述文本单元的发音准确值小于预设准确值，判定所述文本单元的发音不标准。

可选的，在输出所述教学信息之前，获取所述目标文本单元的读音标识符号；将所述读音标识符号在所述目标文本单元处进行对应显示。

可选的，根据目标文本单元的发音以及目标文本单元的标准发音确定讲解文本；将所述讲解文本转换为语音信息作为与所述目标文本单元对应的教学信息。

可选的，在获取用户输入的语音信息的过程中，判断所述语音信息中每个文本单元的发音是否标准。

可选的，获取所述获取所述语音信息的发音标准率，所述发音标准率为发音标准的文本单元数量与所述语音信息的文本单元总数的比值；根据所述发音标准率控制进行发音教学的教学机器人的表情和动作，所述教学机器人包括实体机器人或虚拟机器人。

第二方面，本申请实施例提供了一种基于语音信息的教学装置，该装置包括：语音获取模块，用于获取用户输入的语音作为语音信息，所述语音信息包括多个文本单元的发音；发音判断模块，用于判断所述语音信息中每个文本单元的发音是否标准，将所述语音信息中发音不标准的文本单元作为目标文本单元；教学信息获取模块，用于获取所述目标文本单元的标准发音，根据所述目标文本单元的标准发音生成与所述目标文本单元对应的教学信息；输出模块，用于输出所述教学信息。

可选的，所述教学装置还包括显示模块，用于显示待阅读文本，所述待阅读文本用于用户阅读以输入所述语音信息。

可选的，所述发音判断模块还用于，对所述语音信息中的每个文本单元，比对所述文本单元的发音与对应的标准发音得到文本单元的发音准确值；若所述文本单元的发音准确值大于或等于预设准确值，判定所述文本单元的发音标准；若所述文本单元的发音准确值小于预设准确值，判定所述文本单元的发音不标准。

可选的，所述显示模块还用于获取所述目标文本单元的读音标识符号；将所述读音标识符号在所述目标文本单元处进行对应显示。

可选的，所述教学信息获取模块还包括确定单元，用于根据目标文本单元的发音以及目标文本单元的标准发音确定讲解文本；转换单元，用于将所述讲解文本转换为语音信息作为与所述目标文本单元对应的教学信息。

可选的，所述语音获取模块在获取用户输入的语音信息的过程中，所述发音判断模块判断所述语音信息中每个文本单元的发音是否标准。

可选的，所述教学装置还包括：发音标准率获取模块，用于获取所述语音信息的发音标准率，所述发音标准率为发音标准的文本单元数量与所述语音信息的文本单元总数的比值；控制模块，用于根据所述发音标准率控制进行发音教学的教学机器人的表情和动作，所述教学机器人包括实体机器人或虚拟机器人。

第三方面，本申请实施例提供了一种电子设备，该电子设备包括一个或多个处理器；存储器，与所述一个或多个处理器电连接；一个或多个应用程序，其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序配置用于执行如上述应用于电子设备的方法。

第四方面，本申请实施列提供一种计算机可读存储介质，所述计算机可读存储介质中存储有程序代码，其中，在所述程序代码运行时执行上述的方法。

本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。

本申请实施例提供的基于语音信息的教学方法，装置，电子设备及存储介质，获取用户输入的语音信息，其中语音信息包括多个文本单元的发音，通过判断所述语音信息中每个文本单元的发音是否标准，将所述语音信息中发音不标准的文本单元作为目标文本单元；再获取所述目标文本单元的标准发音，根据所述目标文本单元的标准发音生成与所述目标文本单元对应的教学信息；将所述教学信息进行输出。从而可以针对用户发音不标准的文本单元进行教学，从而提升教学效果。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示出了本申请一个实施例提供的基于语音信息的教学方法的流程图。

图2示出了本申请另一个实施例提供的基于语音信息的教学方法的流程图。

图3示出了在电子设备上显示待阅读文本的示意图。

图4示出了本申请再一个实施例提供的基于语音信息的教学方法的流程图。

图5示出了本申请又一个实施例提供的基于语音信息的教学方法的流程图。

图6示出了显示教学机器人的动作和表情的示意图。

图7示出了本申请一个实施例提供的基于语音信息的教学装置的功能模块图。

图8示出了本申请实施例提出的用于执行根据本申请实施例的基于语音信息的教学方法的电子设备的结构框图。

图9示出了本申请实施例提供的用于保存或者携带实现根据本申请实施例的基于语音信息的教学方法的程序代码的存储介质。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

随着科技的发展，和人们生活水平的提高，人们也越来越看重自身的能力，其中，语言是沟通的桥梁，人们在生活和工作中，都需要使用语言来进行交流。然而，世界上的语言众多，包括汉语，英语，德语，法语等，不同的国家所使用的沟通语言不同，那么对语言的学习则成为的生活和工作中的重要任务。

传统的学习方式为寻找对应的语言老师在教室中进行语言的教学，这种教学方式针对性强，可以更加系统化的进行语言的学习，然而这种教学方式成本较高，并且对时间和地方有较高的要求，在繁忙的都市生活中，难以有整块的时间的去进行系统的语言学习。

随着科技的发展，为了利用零碎化的时间来学习语言，可以通过机器审核技术，通过获取用户的语音信息，对语音信息进行审核测评。然而这种教学方式较为单一，仅仅只是对发音进行测评，不能针对用户的发音问题进行教学，用户难以对发音进行纠正，教学效果较差。

发明人在研究中发现，若是通过机器教学的方式可以对用户的发音进行分析，针对用户的发音问题进行教学，则可以提升教学效果，同时也不会受到时间和地点的限制。则可以为用户提供具有针对性的发音教学，从而可以提升教学效果。

由此，发明人提出了本申请实施例中的基于语音信息的教学方法、装置、电子设备及存储介质。获取用户的语音信息，判断所述语音信息中每个文本单元的发音是否标准；若出现发音不标准的文本单元，将不发音标准的文本单元作为目标文本单元；获取目标文本单元的标准发音，根据所述目标文本单元的标准发音生成与所述目标文本单元对应的教学信息。从而可以针对用户发音不标准的文本单元进行教学，从而提升教学效果。

下面将对本申请实施例进行详细的说明。

请参阅图1，本申请实施例提供了一种基于语音信息的教学方法，可应用于电子设备。其中，电子设备可以是具有显示屏、具有拍摄相机、具有音频输出功能且支持数据输入的各种电子设备，包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机和可穿戴式电子设备等。具体的，数据输入可以是基于电子设备上具有的语音模块输入语音、字符输入模块输入字符等。该语音教学方法可以是运行在电子设备上安装的客户端应用程序，可以基于所述应用程序如app、微信小程序进行发音教学。

可以理解的是，该教学方法可以针对多种不同的语言的教学，例如英语，汉语，法语，德语等。用户可以根据自己需要学习的语言进行设置，以实现对应的语言的教学。该方法可以包括：

步骤s110：获取用户输入的语音信息，所述语音信息包括多个文本单元的发音。

本实施例中，可通过电子设备中集成的语音输入模块或与电子设备连接的语音输入装置获取用户输入的语音信息。

作为一种实施方式，可以是在电子设备上运行应用程序，在电子设备上显示应用程序的内容，在所述应用程序内识别用户输入的语音信息。其中所述语音信息可以是在所述应用程序内，用户基于电子设备的语音输入模块输入语音信息。电子设备对所述语音信息进行录制，以便于对用户的发音进行分析。获取用户输入的语音信息，也可以是用户输入预先录制好的语音信息，通过上传到所述应用程序内对所述语音信息进行识别，在识别后可以将所述语音信息转换为文本信息进行显示，以供用户确认输入的语音信息对应的文本是否有误，若有误，则可以接收用户输入的文字信息，进行更改，避免对用户的发音造成误判的现象。例如，用户输入的语音信息为“你好”，由于用户发音不标准，将“你”字发音为“nín”，将识别的语音信息转换为文本信息时，可能是“您好”，则不能检测到用户的对“你”的发音错误。

其中，用户输入的语音信息中可以包括多个文本单元的发音。若用户的语音信息为中文语音，文本单元可以为每个字。例如，用户输入的语音信息为“她躲在门后”，那么该段语音信息对应的文本单元可以为“她”，“躲”，“在”，“门”，“后”，五个文本单元组成。若用户输入的语音信息为英语语音，那么文本单元可以为每个单词。例如，用户输入的语音信息为“todayisfriday”，那么该段语音信息对应的文本单元可以为“today”，“is”，“friday”。

获取到的用户输入的语音信息中，由多个文本单元的发音组成，在获取到语音信息时，可以获取到多个文本单元的发音，从而可以根据获取到的多个文本单元的发音进行发音的分析。

步骤s120：判断所述语音信息每个文本单元的发音是否标准，将所述语音信息中发音不标准的文本单元作为目标文本单元。

在获取到所语音信息时，则可以获取到所述语音信息中每个文本单元的发音，判断所述语音信息中的每个文本单元的发音是否标准。具体的，可以是比对文本单元的发音，与文本单元的标准发音，从而确定每个文本单元的发音是否标准。可以理解的是，用户输入的语音信息中，可能存在某个文本单元的发音不标准，某个文本单元的发音标准，则可以通过所述语音信息中每个文本单元的发音分析，将发音不标准的文本单元作为目标文本单元，以便于后续进行针对性的发音教学，从而提升教学效果。

具体的，可以是采用动态时间规整算法(dynamictimewarping,dtw)衡量文本单元的发音与文本单元的标准发音之间的相似度，将所述相似度作为文本单元的发音准确值，在所述发音准确值大于或等于预设准确值时，则可以认为该文本单元的发音标准，若发音准确值小于预设准确值，则可以认为该文本单元的发音不标准，则可以将该文本单元作为目标文本单元，以便于针对所述目标文本单元进行发音教学。

步骤s130：获取所述目标文本单元的标准发音，根据所述目标文本单元的标准发音生成与所述目标文本单元对应的教学信息。

在获取到所述语音信息时确定所述语音信息中发音不标准的文本单元作为目标文本单元，电子设备内预先设置有发音库，所述发音库内存储有多个文本单元的标准发音，从而可以通过所述发音库获取所述目标文本单元的标准发音，根据所述目标文本单元的标准发音生成与所述目标文本单元对应的教学信息。

其中，所述语音信息中可能存在多个发音不标准的文本单元，即多个目标文本单元，则可以获取所述语音信息中所有的目标文本单元的标准发音。例如，用户输入的语音信息“她躲在门后”，判定“她”，“躲”，“后”为目标文本单元，则可以获取“她”，“躲”，“后”这三个目标文本单元的标准发音；针对“她”，“躲”，“后”这三个目标文本单元生成对应的教学信息。

作为一种实施方式，可以是获取所述目标文本单元的标准发音，结合所述目标文本单元的发音和所述标准发音，确定目标文本单元的发音问题，针对所述发音问题生成对应的教学信息。

作为另一种实施方式，可以获取所述目标文本单元的标准发音，将所述目标文本单元的标准发音作为所述教学信息，对所述目标文本单元进行教学，对所述目标文本单元的标准发音进行反复阅读，以帮助用户掌握所述目标文本的标准发音。

步骤s140：输出所述教学信息。

将生成的教学信息进行输出，以对用户进行发音教学。

作为一种实施方式，可以预先设置预设时间，在获取到用户输入的语音信息后的预设时间内，若没有继续获取到用户输入的语音信息，则输出所述教学信息进行发音教学。

作为另一种实施方式，可以是根据用户的操作输出所述教学信息。具体的，可以显示输出教学信息的输出按钮，在用户点击所述输出按钮时，则可以输出对应的教学信息进行发音教学。

在进行发音教学时，可以是通过教学机器人进行发音教学，其中，所述教学机器人可以是在运行于电子设备上的虚拟机器人，也可以是实体机器人。在所述教学机器人进行发音教学时，还可以根据用户的发音控制所述教学机器人的表情或动作，以增强教学机器人和用户之间的互动。

本申请实施例提出的基于语音信息的教学方法，获取用户输入的语音信息，所述语音信息包括多个文本单元的发音；判断所述语音信息中每个文本单元的发音是否标准，将所述语音信息中发音不标准的文本单元作为目标文本单元；获取所述目标文本单元的标准发音，根据所述目标文本单元的标准发音生成与所述目标文本单元对应的教学信息；输出所述教学信息。从而可以对用户输入的语音信息中的每个文本单元的发音进行判断，对所述语音信息中所有发音不标准的文本单元进行针对性的发音教学，从而可以提升教学效果。

请参阅图2，本申请另一实施例提供了一种基于语音信息的教学方法，本实施例在前述实施例的基础上，重点描述了判断语音信息中的每个文本单元的发音是否标准的过程，该方法可以包括：

步骤s210：显示待阅读文本，所述待阅读文本用于用户阅读以输入语音信息。

其中，电子设备上可以安装有客户端应用程序，用户可以基于客户端应用程序，例如app，微信小程序等进行发音的学习。

在用户输入语音信息后，可以将语音信息识别为对应的文本信息，从而可以根据所述文本信息，确定语音信息中每个文本单元的标准发音。然而，由于用户的发音不一定标准，可能在将语音信息识别为对应的文本信息时，出现错误。例如，用户输入的语音信息为“她给了我十元钱”，文本单元“十”的发音为“shi”，而“四”的发音为“si”，由于用户的发音不标准，可能会将“十”识别为“四”，则会对用户的发音造成误判，影响整体的教学效果。

那么，可以在获取用户输入的语音信息之前，显示待阅读文本，用户阅读后可输入语音信息。也就是说用户输入的语音信息为所述阅读所述待阅读文本所发出的声音。

作为一种实施方式，可以是在所述电子设备上显示待阅读文本，例如，待阅读文本为“她给了我十元”，则直接在所述电子设备上显示“她给我了十元”的文本。

作为一种实施方式，还可以是在所述电子设备上显示待阅读文本的同时，显示所述待阅读文本对应的读音标识符，以辅助用户阅读所述待阅读文本。可以理解的是，读音标识符为记录音素的符号，在中文时，读音标识符则为拼音；在英文时，读音标识符则为音标。具体的，可参阅图3，示出了在电子设备上显示待阅读文本的示意图。其中，211为待阅读文本，212为所述待阅读文本所对应的读音标识符。由此，用户根据所述所述待阅读文本进行阅读，以输入语音信息。

步骤s220：获取用户输入的语音信息，所述语音信息包括多个文本单元的发音。

用户根据电子设备上显示的待阅读文本，对所述待阅读文本进行阅读，则会发出与所述待阅读文本对应的语音信息，从而可以获取到用户输入的语音信息。其中，所述待阅读文本中的每个文本单元都会对应的一个发音，用户通过阅读所述待阅读输入语音信息，在输入的语音信息中则包括了多个文本单元的发音。

步骤s230：对所述语音信息中的每个文本单元，比对文本单元的发音与对应的标准发音得到文本单元的发音准确值。

由于所述语音信息中包括多个文本单元的发音，则可以对每个文本单元的发音与对应的标准发音得到文本单元的发音准确值。其中，电子设备预先存储待阅读文本中的每个文本单元的标准发音，在获取到用户输入的语音信息时，可以获取到每个文本单元的发音，从而可以根据所述文本单元的标准发音与用户的输入的发音进行比对，获取每个文本单元的发音准确值。

作为一种实施方式，电子设备可以在获取所述语音信息的过程中，判断所述语音信中每个文本单元的发音是否标准。例如，待阅读文本为“她给了我十元”，用户在输入语音信息时，按照顺序，电子设备最先接收到“她”的发音，再一次接收到“给”“了”“我”“十”“元”的发音。那么在电子设备接收到“她”的发音时，则获取“她”的标准发音进进行发音判断。具体的，可以是采用动态时间规整算法(dynamictimewarping,dtw)衡量用户的发音与标准发音之间的相似度，将所述相似度作为该文本单元的发音准确值。将每个文本单元的发音与对应的标准发音进行比对，则可以获取到所述语音信息中每个文本单元的发音准确值。其中，发音准确值可以是一个数值，所述数值越大，表明用户对所述文本单元的发音越接近标准发音。

步骤s240：若所述文本单元的发音准确值大于或等于预设准确值，判定所述文本单元的发音标准。

在获取所述语音信息中，每个文本单元的发音准确值时，将每个文本单元的发音准确值与预设准确值进行比对，则可以对文本单元的发音是否标准进行判断。

其中，预设准确值为预先设置的，表示发音准确的发音准确值。可以理解的是，预设准确值的值可根据实际需求进行更改设置，在此不做限定。在所述发音准确值大于或等于预设准确值时，可以认为用户对该文本单元发音与文本单元的标准发音差距不大，则可以判定所述文本单元的发音标准。例如，预设准确值为85，用户在获取到与待阅读文本中“她”的发音时，获取到文本单元“她”的发音准确值为99，发音准确值99大于预设准确值85，则可以判定文本单元“她”发音标准。

步骤s250：若所述文本单元的发音准确值小于预设准确值，判定所述文本单元的发音不标准，并发音不标准的文本单元作为目标文本单元。

若电子设备获取到的语音信息中的文本单元的发音准确值小于预设准确值，表明对所述文本单元的发音与文本单元的标准发音差距较大，可以判定所述文本单元的发音不标准。

例如，预设准确值为85，获取到用户输入的语音信息中文本单元“她”的发音准确值为70，发音准确值70小于预设准确值85，可以判定文本单元“我”发音不标准，则可以将文本单元“我”作为目标文本单元。

步骤s260：获取所述目标文本单元的标准发音，根据所述目标文本单元的标准发音生成与所述目标文本单元对应的教学信息。

步骤s270：输出所述教学信息。

步骤s260至步骤s270可参照前述实施例对应部分，在此不再赘述。

本申请实施例提出基于语音信息的教学方法，显示待阅读文本；获取用户根据所述待阅读文本输入的语音信息，所述语音信息中包括多个文本单元的发音，对于每个文本单元，对比文本单元的发音与标准发音得到文本单元的发音准确值，在所述发音准确值大于或等于预设准确值时，判定所述文本单元的发音标准；在所述发音标准流程小于所述预设准确值时，判定所述文本单元的发音不标准，并将发音不标准的文本单元作为目标文本单元；获取所述目标文本单元的标准发音，根据所述目标文本单元的标准发音生成与所述目标文本单元对应的教学信息；输出所述教学信息。从而可以对用户输入的语音信息中的每一个文本单元的发音进行判断，针对用户发音不标准的文本单元进行发音教学，从而提升教学效果。

请参阅图4，本申请另一实施例提供了一种基于语音信息的教学方法，本实施例在前述实施例的基础上，重点描述了根据目标文本单元的标准发音生成与目标文本单元对应的教学信息的过程，该方法可以包括：

步骤s310：获取用户输入的语音信息，所述语音信息包括多个文本单元的发音。

步骤s310可参照前述实施例部分，在此不再赘述。

步骤s320：判断所述语音信息中每个文本单元的发音是否标准，将所述语音信息中发音不标准的文本单元作为目标文本单元。

在获取到所述语音信息时，可以将判断所述语音信息中每个文本单元的发音是否标准，若有发音不标准的文本单元，则将所述发音不标准的文本单元作为目标文本单元。以便于针对目标文本单元进行发音教学。

步骤s330：获取目标文本单元的读音标识符号，将所述读音标识符号在所述目标文本单元处进行对应显示。

电子设备中预先存储待阅读文本的标准发音，则可以获取到待阅读文本中每个文本单元的读音标识符，对应的，在获取到目标文本单元的读音标识符，可以将读音标识符显示在所述目标文本单元旁。

作为一种实施方式，若在显示待阅读文本时同时显示了待阅读文本对应的读音标识符，可以不显示发音标准的文本单元对应的读音标识符，仅保留目标文本单元的读音标识符。

作为另一种实施方式，若在显示待阅读文本的同时没有显示待阅读文本的读音标识符，即仅显示了待阅读文本，则可以将所述目标文本单元的读音标识符显示在所述目标文本单元处。

例如，用户输入的语音信息为“她给了我十元”，判定“我”，“十”为发音不标准的文本单元，即目标文本单元，则可以显示在“我”，“十”的旁边显示对应读音标识符。作为一种实施方式，在显示所述目标文本单元的读音标识符时，可以对所述目标文本单元进行突出显示，所述突出显示可以是相对于发音标准文本单元的区别显示，例如，发音标准的文本单元的字体颜色为黑色，则可以将所述目标文本单元的颜色设置为不是黑色的其余颜色，如红色，蓝色等，还可以是对目标文本单元进行加粗显示，或斜体显示等。以方便用户区分目标文本单元，将所述目标文本单元的读音标识符显示在所述目标文本单元旁，以便于用户根据所述读音标识符进行发音学习。

步骤s340：在获取所述语音信息后，根据所述目标文本单元的发音以及目标文本的标准发音确定讲解文本。

在用户输入所述语音信息后，根据目标文本单元的发音以及目标文本的标准发音分析用户的发音问题，从而确定讲解文本。

所述讲解文本可以是根据预先设置好的讲解模板、目标文本单元的发音以及目标文本单元的标准发音进行确定。所述讲解模板，可以是针对每一个目标文本单元的讲解模板，若存在多个目标文本单元，可以多次调用所述讲解模板，将得到的讲解模板内容进行拼接，则可以确定讲解文本。

例如，讲解模板为“您对a的发音为b，正确发音应该为c，发音要点为d”，其中“a”表示目标文本单元，“b”为用户对目标文本单元的发音，“c”为目标文本单元的标准发音，“d”为目标文本单元的标准发音的发音要点。如前举例中，确定“我”和“十”为目标文本单元。那么调用所述讲解模板得到的针对“我”的讲解内容可以是“您对我的发音为wó，正确发音应该为wǒ，发音要点为将舌头略向后缩，舌面后部隆起，口微开，唇略圆，声调为三声”。对目标文本单元“十”可再次调用模板得到针对“十”的讲解内容。将对“我”的讲解内容和“十”的讲解内容进行拼接得到最终的讲解文本为“您对我的发音为wó，正确发音应该为wǒ，发音要点为将舌头略向后缩，舌面后部隆起，口微开，唇略圆，声调为三声；您对十的发音为sí，正确发音应该为shí，发音要点为舌端靠近齿龈后部,舌身抬起靠近上鄂,双唇稍收圆并略突出”。

步骤s350：将所述讲解文本转换为语音信息作为与所述目标文本单元对应的教学信息。

确定所述讲解文本后，则将所述讲解文本转换为对应的语音信息作为与目标文本对应的教学信息，以进行发音教学。

作为一种实施方式，将所述讲解文本转换为语音信息时，可以根据用户输入的语音信息的音色进行适应性匹配。可以是对用户输入的语音信息进行分析，分析语音信息的音色，根据所述音色对用户的性别以及年龄阶段进行大致的确认，针对不同的年龄阶段，转换为不同音色的语音信息。

例如，通过分析用户的语音信息确定用户的性别为女性，年龄阶段为10～20岁，则可以采用较为甜美的声音进行发音教学；若通过分析用户的语音信确定用户的性别为男性，年龄阶段为30～40岁，则可以采用较为成熟稳重的声音进行发音教学，以贴近用户的身份形象。

步骤s360：输出所述教学信息。

步骤s360可参照前述实施例对应部分，在此不再赘述。

本申请实施例提出基于语音信息的教学方法，通过获取用户输入的语音细信息，所述语音信息包括多个文本单元的发音；判断所述语音信息中每个文本单元的发音是否标准，将所述语音信息中发音不标准的文本单元作为目标文本单元；获取目标文本单元的读音标识符号，将所述读音标识符号在所述目标文本单元处进行对应显示；在获取语音信息后，根据所述目标文本单元的发音以及目标文本的标准发音确定讲解文本；将所述讲解文本转换为语音信息作为与所述目标文本单元对应的教学信息；输出所述教学信息。从而可以对用户发音不标准的文本单元进行针对性的发音教学，并结合用户的发音和标准发音确定需要教学的内容，使得对用户的教学更加具备针对性，以提升教学效果。

请参阅图5，本申请又一实施例提供了一种基于语音信息的教学方法，本实施例在前述实施例的基础上，重点描述了通过教学机器人进行教学的过程。其中，所述教学机器人可以是虚拟机器人，也可以是实体机器人，本申请实施例中仅以虚拟机器人进行详细的描述。

其中，在电子设备上显示待阅读文本的同时可以显示所述教学机器人，在对用户输入的语音信息中的发音进行判断时，可以获取到整个语音信息的发音标准率，根据所述发音标准率控制教学机器人的表情和动作。具体的该方法可以包括：

步骤s410：获取用户输入语音信息，所述语音信息包括多个文本单元的发音。

在获取用户输入的语音信息之前，可以是在电子设备上显示待阅读文本，在显示待阅读文本的同时可以显示教学机器人的人物形象，以使显示的内容更加丰富，给用户类似于真人教学的体验。例如，在显示待阅读文本的旁边进行教学机器人的人物形象。步骤s140中的其余解释可参照前述实施例中对应部分，在此不再赘述。

步骤s420：判断所述语音信息中每个文本单元的发音是否标准，将所述语音信息中发音不标准的文本单元作为目标文本单元。

步骤s420可参照前述实施例中对应部分，在此不再赘述。

步骤s430：获取所述语音信息的发音标准率，所述发音标准率为发音标准的文本单元的数量与所述语音信息的文本单元总数的比值。

在获取后所述语音后，对用户输入的语音信息中的每个文本单元的发音进行判断，可以获取到所述语音信息的发音标准率，所述发音标准率为发音标准的文本单元的数量与所述语音信息的文本单元总数的比值，由此可以根据所述发音标准率判断整个语音信息发音的情况。可以理解的是，在同一条语音信息中，发音标准率越高，表明用户输入的语音信息中，发音标准的文本单元越多，发音标准率越低，表明用户输入的语音信息中，发音标准的文本单元越少。

在确定用户输入的语音信息中的目标文本单元后，可以获取到目标文本单元的数量，以及待阅读文本中文本单元的总数，以所述待阅读文本中文本单元的总数减去所述目标文本单元的数量，则可以得到发音标准的文本单元的数量，将所述发音标准的文本单元的数量与所述待阅读文本中文本单元的总数做比值，则可以得到发音标准率。

例如，待阅读文本为“她给了我十元”，用户根据所述待阅读文本输入语音信息，从所述语音信息中确定的目标文本单元为“我”和“十”，则可以获知待阅读文本中的文本单元的总数为6，目标文本单元的数量为2，将所述待阅读文本中文本单元的总数与所述目标文本单元的数量作差，得到6-2＝4。那么，在该条语音信息中发音标准的文本单元的数量为4，从而，可以计算得到发音标准率为4/6，即66.67％。

在计算得到所述语音信息的发音标准率时，可以将所述发音标准率在进行发音教学时进行显示，也可以不做显示，可根据实际的需要进行设置，在此不做限定。

步骤s440：根据所述发音标准率控制教学机器人的表情和动作。

电子设备内预先存储有语音信息的预设标准率，若获取到的发音标准率大于或等于预设标准率，则可以认为所述语音信息的整体发音较为准确，可以控制教学机器人的表情变为微笑，并捧花以表示鼓励；若获取到的发音标准率小于所述预设标准率，则可以认为所述语音信息的整体发音不太准确，可以控制教学机器人的表情变为沮丧，并做出敲打的姿势，以表示惩罚。

例如，预设标准率为65％，如前所述的举例中，获取的用户输入的语音信息的发音标准率为66.67％，大于预设标准率65％，则可以认为用户输入的语音信息的整体发音较为准确，则可以控制所述教学机器人的表情为微笑，并作出捧花以示鼓励的动作。在控制所述教学机器人的表情和动作时，可以是在进行发音教学之前，将目标文本的读音标识符号在目标文本处进行显示的界面。

请参阅图6，示出了显示教学机器人的动作和表情的示意图。其中，411则为所述教学机器人微笑并捧花的形象，412为突出显示的目标文本单元，413为目标文本单元所对应的读音标识符号。

可以理解的是，预设标准率可以是多个值所组成的范围，预设标准率为0～20％，20％～60％，60～100％等这一系列的范围，当所述语音信息的发音标准率在对应的区间时，可以控制教学机器人作出不同的表情和动作。具体的，预设标准率组成的范围区间，以及控制教学机器人所作出的表情和动作，可根据实际的需求进行设置，在此不做限定。

步骤s450：获取所述目标文本单元的标准发音，根据所述目标文本单元的标准发音生成与所述目标文本单元对应的教学信息，通过所述教学机器人进行发音教学。

在电子设备确定用户输入的语音信息中的目标文本单元时，可以获取到所述目标文本单元的标准发音，在对所述目标文本进行突出显示并显示对应的读音标识符号时，可以同时显示教学机器人的表情和动作。由此，根据所述目标文本单元的标准发音生成与所述目标文本单元对应的教学信息，在输出所述教学信息进行发音教学时，所述教学机器人可以保持捧花的动作，嘴巴一张一合，作出讲话的样子，模拟真人授课。给用户更加逼真的学习体验。

本申请实施例提出基于语音信息的教学方法，通过获取用户输入的语音信息，所述语音信息包括多个文本单元的发音；判断所述语音信息中每个文本单元的发音是否标准，将所述语音信息中发音不标准的文本单元作为目标文本单元；获取所述语音信息中的发音标准率，所述发音标准率为发音标准的文本单元数量与所述语音信息的文本单元总数的比值；根据所述发音标准率控制进行发音教学的教学机器人的表情和动作；获取所述目标文本单元的标准发音；根据所述目标文本单元的标准发音生成与所述目标文本单元对应的教学信息，通过所述教学机器人进行发音教学。从而可以通过教学机器人对用户的发音情况作出反应，增强与用户的互动，并通过教学机器人模拟真人教学，对用户发音不标准的文本单元进行针对性的发音教学，以提升发音教学的效果。

请参阅图7，其示出了本申请实施例提供的一种基于语音信息的教学装置500，应用于电子设备，所述装置500包括语音获取模块510，发音判断模块520，教学信息获取模块530以及输出模块540。

所述语音获取模块510，用于获取用户输入的语音作为语音信息，所述语音信息包括多个文本单元的发音；所述发音判断模块520，用于判断所述语音信息中每个文本单元的发音是否标准，将所述语音信息中发音不标准的文本单元作为目标文本单元；所述教学信息获取模块530，用于获取所述目标文本单元的标准发音，根据所述目标文本单元的标准发音生成与所述目标文本单元对应的教学信息；输出模块540，用于输出所述教学信息。

进一步的，所述教学装置500还包括显示模块，用于显示待阅读文本，所述待阅读文本用于用户阅读以输入所述语音信息。

进一步的，所述发音判断模块520还用于对所述语音信息中的每个文本单元，比对所述文本单元的发音与对应的标准发音得到文本单元的发音准确值；若所述文本单元的发音准确值大于或等于预设准确值，判定所述文本单元的发音标准；若所述文本单元的发音准确值小于预设准确值，判定所述文本单元的发音不标准。

进一步的，所述显示模块还用于获取所述目标文本单元的读音标识符号；将所述读音标识符号在所述目标文本单元处进行对应显示。

进一步的，所述教学信息获取模块530还包括确定单元，用于用于根据目标文本单元的发音以及目标文本单元的标准发音确定讲解文本；转换单元，用于将所述讲解文本转换为语音信息作为与所述目标文本单元对应的教学信息。

进一步的，所述语音获取模块510在获取用户输入的语音信息的过程中，所述发音判断模块520判断所述语音信息中每个文本单元的发音是否标准.

进一步的，所述教学装置500还包括发音标准率获取模块，用于获取所述语音信息的发音标准率，所述发音标准率为发音标准的文本单元数量与所述语音信息的文本单元总数的比值；控制模块，用于根据所述发音标准率控制进行发音教学的教学机器人的表情和动作，所述教学机器人包括实体机器人或虚拟机器人。

需要说明的是，所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

综上所述，本申请实施例提供的基于语音信息的教学方法，装置，电子设备及存储介质，获取用户输入的语音信息，其中语音信息包括多个文本单元的发音，通过判断所述语音信息中每个文本单元的发音是否标准，将所述语音信息中发音不标准的文本单元作为目标文本单元；获取所述目标文本单元的标准发音，根据所述目标文本单元的标准发音生成与所述目标文本单元对应的教学信息；再输出所述教学信息。从而可以针对用户发音不标准的文本单元进行教学，从而提升教学效果。

在本申请所提供的几个实施例中，所显示或讨论的模块相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

请参考图8，其示出了本申请实施例提供的一种电子设备的结构框图。该电子设备600可以是智能手机、平板电脑、电子书等能够运行应用程序的电子设备。本申请中的电子设备600可以包括一个或多个如下部件：处理器610、存储器620，以及一个或多个应用程序，其中一个或多个应用程序可以被存储在存储器620中并被配置为由一个或多个处理器610执行，一个或多个程序配置用于执行如前述方法实施例所描述的方法。

处理器610可以包括一个或者多个处理核。处理器610利用各种接口和线路连接整个电子设备600内的各个部分，通过运行或执行存储在存储器620内的指令、程序、代码集或指令集，以及调用存储在存储器620内的数据，执行电子设备600的各种功能和处理数据。可选地，处理器610可以采用数字信号处理(digitalsignalprocessing，dsp)、现场可编程门阵列(field－programmablegatearray，fpga)、可编程逻辑阵列(programmablelogicarray，pla)中的至少一种硬件形式来实现。处理器610可集成中央处理器(centralprocessingunit，cpu)、图像处理器(graphicsprocessingunit，gpu)和调制解调器等中的一种或几种的组合。其中，cpu主要处理操作系统、用户界面和应用程序等；gpu用于负责显示内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器610中，单独通过一块通信芯片进行实现。

存储器620可以包括随机存储器(randomaccessmemory，ram)，也可以包括只读存储器(read-onlymemory)。存储器620可用于存储指令、程序、代码、代码集或指令集。存储器620可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储电子设备600在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。

请参考图9，其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读存储介质700中存储有程序代码，所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。

计算机可读存储介质700可以是诸如闪存、eeprom(电可擦除可编程只读存储器)、eprom、硬盘或者rom之类的电子存储器。可选地，计算机可读存储介质700包括非瞬时性计算机可读介质(non-transitorycomputer-readablestoragemedium)。计算机可读存储介质700具有执行上述方法中的任何方法步骤的程序代码710的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码710可以例如以适当形式进行压缩。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨国基
技术所有人：深圳追一科技有限公司
我是此专利的发明人

上一篇：一种自转机构及手术机器人的制作方法
上一篇：一种医疗手术机器人手术器械平移单元的制作方法