一种基于特定语境的口语训练方法与流程

文档序号:36598940发布日期:2024-01-06 23:08阅读:15来源:国知局
一种基于特定语境的口语训练方法与流程

本发明属于数据处理,具体涉及一种基于特定语境的口语训练方法。


背景技术:

1、在口语学习领域,能否运用地道熟练的口语进行沟通表达,一直是学习者在学习过程中面临的挑战之一。口语训练的过程中,如何引导学习者在达成特定教学目标的同时,为学习者提供丰富的个性化训练语境、灵活的对话训练形式、即时反馈与评估,是本领域的技术难题。

2、现有的口语训练方法包括:面对面教学:学生和教师在教室中进行实时的口语练习和交流;语音练习:重点训练学生的发音、语调和语音语调等口语基础技能;角色扮演:学生在特定语境中扮演不同角色,进行实践性的口语对话练习;对话录制:学生进行口语对话,录音后由教师进行评估和指导;口语教材和练习册:提供特定话题的口语练习材料和练习册,供学生自主学习和练习;口语交流社区:学生在线参与口语社区,与其他学习者进行语言交流和练习等。

3、传统口语训练方法存在以下缺点及问题:1、教学目标达成衡量困难:口语是一种即时交流的能力,而其表现受到很多因素的影响,如紧张程度、情绪状态和交流场景等,是否达成预期教学目标,难以准确量化,为教师作为教学的引导者和合作者引导学生提升口语表达能力带来挑战。2、个性化训练语境缺乏:传统口语教学往往难以针对每个学生的个性化需求和水平,学生可能因此无法获得最适合自己的口语训练内容。一些口语教学方法可能提供的练习话题或语境较为固定,缺乏语境多样性,难以全面提高学生的口语应对能力。3、训练形式僵化:口语学习中,如果训练形式过于僵化和枯燥,学习者可能会感到乏味和无趣,缺乏学习动力,从而导致学习兴趣的减退和学习效果的下降。在重复跟读和固定话题的训练下,学习者可能只是机械地模仿,而无法真正理解和掌握口语表达的实质。同时,强调机械练习可能忽略了语言交流的情感和灵活性,使学习者难以应对实际交流场景。此外,学生只能在特定的教室和时间进行口语练习,限制了学习的灵活性和便捷性。4、即时反馈效率有限:在传统教学中,教师可能无法为每个学生提供即时的反馈和纠正,导致学生无法及时改进口语技巧。

4、综合来看,传统口语训练方法虽然有一定的效果,但多采用教师现场教学训练,因此需要不断探索和改进,开发更高效的口语训练方案。


技术实现思路

1、本发明为了解决以上问题,提出了一种基于特定语境的口语训练方法。

2、本发明的技术方案是:一种基于特定语境的口语训练方法包括以下步骤:

3、s1、获取口语训练样本,并获取口语训练样本的语境关键词集合;

4、s2、根据口语训练样本的语境关键词集合,为口语训练样本匹配最佳口语标准样本;

5、s3、将口语训练样本与最佳口语标准样本进行对比,确定口语训练样本是否合格。

6、进一步地,s1包括以下子步骤:

7、s11、获取口语训练样本,并将口语训练样本转换为文本训练样本;

8、s12、在文本训练样本中,以句号作为分隔点,将文本训练样本划分为若干个文本训练子样本;

9、s13、对各个文本训练子样本进行分词处理,得到各个文本训练子样本对应的单词集合;

10、s14、根据各个文本训练子样本的单词集合,提取各个文本训练子样本的语境关键词;

11、s15、将所有文本训练子样本的语境关键词作为口语训练样本的语境关键词集合。

12、上述进一步方案的有益效果是:在本发明中,口语训练样本中的关键词可以表征这段口语训练的主旨,因此提取的口语训练样本的关键词可以与口语标准样本的关键词进行适配,便于后续步骤进行合格对比。在提取关键词集合时,将口语形式转换为文本形式后,以句号作为分隔点,将完整的一句话作为一个训练子样本,根据各个训练子样本的单词词权重和单词词频等参数,为各个训练子样本提取符合关键词提取约束条件的语境关键词,上述过程由于进行了训练样本拆分以及考虑了训练样本的多方面参数,使得生成的语境关键词高度贴近口语训练样本的表达主旨。

13、进一步地,s14包括以下子步骤:

14、s141、将第一个文本训练子样本作为初始文本训练子样本,确定初始文本训练子样本的语境关键词;

15、s142、计算除初始文本训练子样本外所有剩余文本训练子样本的关键词提取阈值;

16、s143、构建关键词提取约束条件;

17、s144、基于各个剩余文本训练子样本的关键词提取阈值,将各个剩余文本训练子样本中满足关键词提取约束条件的单词作为各个剩余文本训练子样本的语境关键词;

18、s145、对初始文本训练子样本的语境关键词和所有剩余文本训练子样本的语境关键词进行去重处理,生成语境关键词集合。

19、上述进一步方案的有益效果是:在本发明中,第一个文本训练子样本作为文本训练样本的开头,通常不能直接指出该文本训练样本的主旨,因此直接词频最高的单词作为第一个文本训练子样本的语境关键词即可。而后续各个文本训练子样本之间往往存在紧密的语境联系和/或语义联系,因此需考虑剩余各个文本训练子样本的前后联系。另外,对所有语境关键词进行了去重处理,保证语境关键词集合无冗余。

20、进一步地,s141中,将初始文本训练子样本中词频最高的单词作为初始文本训练子样本的语境关键词。

21、进一步地,s142中,第i个剩余文本训练子样本的关键词提取阈值γi的计算公式为:

22、

23、式中,i表示剩余文本训练子样本的个数,di_max表示第i个剩余文本训练子样本的最大词频值,di_min表示第i个剩余文本训练子样本的最小词频值。

24、进一步地,s143中,关键词提取约束条件的表达式为:式中,ci_m-1表示第i个剩余文本训练子样本中第m-1个单词的词频,ci_m表示第i个剩余文本训练子样本中第m个单词的词频,ci_m+1表示第i个剩余文本训练子样本中第m+1个单词的词频,m表示第i个剩余文本训练子样本的单词个数,xi_m表示第i个剩余文本训练子样本中第m个单词的词向量,γi-1表示第i-1个剩余文本训练子样本的关键词提取阈值,γi表示第i个剩余文本训练子样本的关键词提取阈值,γi+1表示第i+1个剩余文本训练子样本的关键词提取阈值,i表示剩余文本训练子样本的个数。

25、上述进一步方案的有益效果是:在本发明中,在构建关键词约束条件时,本发明考虑到前后文本训练子样本存在语境联系和/或语义联系,因此充分考虑当前(第i个)剩余文本训练子样本分别与上一个(第i-1个)剩余文本训练子样本和下一个(第i+1个)剩余文本训练子样本之间的关键词提取阈值差值,由此构建的关键词约束条件可以筛选最能体现当前文本训练子样本的主旨,同时又不脱离前后文本训练子样本的语境。

26、进一步地,s2中,最佳口语标准样本的匹配方法具体为:获取各个口语标准样本的关键词集合,根据口语训练样本的语境关键词集合和各个口语标准样本的关键词集合,计算口语训练样本与各个口语训练样本之间的匹配相似度,将匹配相似度最高的口语训练样本作为最佳口语训练样本;

27、其中,匹配相似度sim的计算公式为:

28、

29、

30、

31、式中,k表示口语标准样本的关键词个数,yk表示口语标准样本中第k个关键词的词向量,n表示口语训练样本的语境关键词个数,xn表示口语训练样本中第n个语境关键词的词向量,α1表示口语标准样本的权重,α2表示口语训训练样本的权重。

32、上述进一步方案的有益效果是:在本发明中,口语标准样本由教师等事先录制或从网站获取,并为各个口语标准样本设置关键词,便于与口语训练样本的语境关键词进行对比。根据口语训练样本的语境关键词与口语标准样本的关键词之间的文字分析,确定最佳口语标准样本,便于为口语训练样本挑选最合适的对比样本。

33、将词向量作为对比的关键参数,词向量将口语训练样本的语境关键词和口语标准样本的关键词从一维空间映射至具有更低维度的连续向量,便于计算匹配相似度,匹配相似度最大的口语标准样本与口语训练样本的关键词相似度越高,越可以作为进行对比分析的标准。

34、进一步地,s3包括以下子步骤:

35、s31、将口语训练样本均匀拆分为g个口语训练音频,将最佳口语标准样本均匀拆分为j个口语标准音频,其中,g表示口语训练音频个数,j表示口语标准音频个数;

36、s32、判断口语训练音频个数与口语标准音频个数是否相同,若是则进入s33,否则口语训练样本不合格;

37、s33、分别提取g个口语训练音频的声音强度、有效声压和梅尔倒谱系数,分别提取j个口语标准音频的声音强度、有效声压和梅尔倒谱系数;

38、s34、根据g个口语训练音频的声音强度、有效声压和梅尔倒谱系数,分别计算g个口语训练音频的训练特征参数;根据j个口语标准音频的声音强度、有效声压和梅尔倒谱系数,分别计算j个口语标准音频的标准特征参数;

39、s35、判断是否存在与标准特征参数相同的训练特征参数,若是则进入s36,否则口语训练样本不合格;

40、s36、将剩余g-g个口语训练音频的训练特征参数从小到大排列,生成训练特征序列;将剩余j-j个口语标准音频的标准特征参数从小到大排列,生成标准特征序列;其中,g表示与标准特征参数相同的训练特征参数对应的口语训练音频个数,j表示与训练特征参数相同的标准特征参数对应的口语标准音频个数;

41、s37、计算训练特征序列与标准特征序列之间的相似度,若相似度大于或等于设定相似度阈值,则口语训练样本合格,否则口语训练样本不合格。

42、上述进一步方案的有益效果是:在本发明中,对学生口语训练的基本要求是可以完成一段完整的发音训练。所以在进行口语训练样本合格检验时,先将口语训练样本和最佳口语训练样本进行均分,若均分的音频个数不同,说明该学生的口语训练不完整,不符合最基本的要求,则不用进行后续对比分析,可大幅度简化算法流程。在学生的口语训练样本完整的基础上,提取能够反映语音特征的三个参数,通过对三个参数进行数学运算,得到各段音频对应特征参数。若学生的若干个训练特征参数不存在任何一个与标准特征参数相同的值,说明该学生的口语训练样本的质量较差,与口语标准样本的偏差较大,可直接确定为不合格,上述操作也可以大幅度简化算法流程。在上述操作后,将剩下特征参数进行大小排序,生成特征序列,通过对两个特征序列进行相似度计算,即可确定学生的口语训练样本是否合格。而相似度阈值可根据实际情况人为设定,如发音训练的难度较高,则教师可将相似度阈值的大小降低,如发音训练的难度较低,则教师可将相似度阈值的大小升高。

43、进一步地,s34中,口语训练音频的训练特征参数β1的计算公式为:

44、

45、式中,q1表示口语训练音频的声音强度,s1表示口语训练音频的有效声压,d1表示口语训练音频的梅尔倒谱系数,q0表示所有口语训练音频的声音强度的均值,s0表示所有口语训练音频的有效声压的均值,d0表示所有口语训练音频的梅尔倒谱系数的均值;

46、s34中,口语标准音频的标准特征参数β2的计算公式为:

47、

48、式中,q1表示口语标准音频的声音强度,s1表示口语标准音频的有效声压,d1表示口语标准音频的梅尔倒谱系数,q0表示所有口语标准音频的声音强度的均值,s0表示所有口语标准音频的有效声压的均值,d0表示所有口语标准音频的梅尔倒谱系数的均值。

49、进一步地,s37中,训练特征序列与标准特征序列之间的相似度a的计算公式为:

50、

51、式中,u表示标准特征序列,uh表示标准特征序列中前h个标准特征参数,uf表示标准特征序列中后f个标准特征参数,v表示训练特征序列,vh表示训练特征序列中前h个训练特征参数,vf表示训练特征序列中后f个训练特征参数,c表示常数,e表示指数,uave表示标准特征序列的所有标准特征参数的均值,vave表示训练特征序列的所有标准特征参数的均值。

52、本发明的有益效果是:

53、(1)本发明将口语训练样本与口语标准样本的语音信号匹配问题转换为关键词的文字匹配问题,可以为学生找到最精准的口语标准样本,进行口语对比分析;同时,综合考虑语音信号的多方面参数,通过计算特征参数来构建特征序列,通过特征序列的相似度大小判断即可确定学生的口语训练是否合格;

54、(2)本发明的口语训练方法可以对学生的口语训练样本进行及时反馈与评估,以提高训练者口语水平,更可应用于专业领域人才的口语训练和提升。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1