一种课堂纪要生成方法及系统

文档序号:33559080发布日期:2023-03-22 13:22阅读:来源:国知局

技术特征:
1.一种课堂纪要生成方法,其特征在于,包括:获取课堂音频文件;对所述课堂音频文件进行语音识别和声纹识别,得到包含说话人信息和对应说话内容的课堂记录文本;将所述课堂记录文本输入至课堂纪要生成模型,得到课堂纪要文本;其中,所述课堂纪要生成模型是基于样本课堂记录文本及对应的样本课堂纪要文本训练得到的;所述课堂纪要生成模型用于对所述课堂记录文本进行主题划分和环节划分,并基于划分得到的主题向量和环节向量对所述课堂记录文本进行编码,得到所述课堂记录文本的文本表征向量,对所述文本表征向量进行解码,得到所述课堂纪要文本。2.根据权利要求1所述的课堂纪要生成方法,其特征在于,将所述课堂记录文本输入至课堂纪要生成模型,得到课堂纪要文本,具体为:对所述课堂记录文本中的每一句子进行编码,得到所述每一句子的句子表征向量;基于所述每一句子的句子表征向量分别进行主题划分和环节划分,得到所述每一句子的主题向量和环节向量;对所述课堂记录文本中所有句子的主题向量、环节向量、角色向量和句子表征向量进行编码,得到所述课堂记录文本的文本表征向量;所述所有句子的角色向量基于所述说话人信息确定;基于所述课堂记录文本中所有句子的句子表征向量和所述课堂记录文本的文本表征向量确定课堂记录文本对应的纪要分词,并基于所述纪要分词生成所述课堂纪要文本。3.根据权利要求2所述的课堂纪要生成方法,其特征在于,所述对所述课堂记录文本中的每一句子进行编码,得到所述每一句子的句子表征向量,包括:基于所述课堂记录文本中每一句子的分词进行指代消解,得到所述每一句子的词性标签向量、实体标签向量和指代关系向量;基于所述每一句子的分词、词性标签向量、实体标签向量和指代关系向量进行编码,得到所述每一句子的句子表征向量。4.根据权利要求2所述的课堂纪要生成方法,其特征在于,基于所述每一句子的句子表征向量进行环节划分,得到所述每一句子的环节向量,包括:基于类别预测模型对所述每一句子的句子表征向量进行环节划分,得到所述每一句子的环节向量;所述类别预测模型是基于样本句子的句子表征向量及对应的样本环节向量,对初始类别预测模型进行训练得到的;所述初始类别预测模型是基于课堂场景下各个环节之间的状态转移关系构建的。5.一种课堂纪要生成系统,其特征在于,包括:音频获取模块,用于获取课堂音频文件;语音识别模块,用于对所述课堂音频文件进行语音识别和声纹识别,得到包含说话人信息和对应说话内容的课堂记录文本;纪要生成模块,用于将所述课堂记录文本输入至课堂纪要生成模型,得到课堂纪要文本;其中,所述课堂纪要生成模型是基于样本课堂记录文本及对应的样本课堂纪要文本训练得到的;所述课堂纪要生成模型用于对所述课堂记录文本进行主题划分和环节划分,并
基于划分得到的主题向量和环节向量对所述课堂记录文本进行编码,得到所述课堂记录文本的文本表征向量,对所述文本表征向量进行解码,得到所述课堂纪要文本。6.根据权利要求5所述的课堂纪要生成系统,其特征在于,所述课堂纪要生成模型包括第一编码器、分类网络、第二编码器和解码器;所述第一编码器对所述课堂记录文本中的每一句子进行编码,得到所述每一句子的句子表征向量;所述分类网络基于所述每一句子的句子表征向量分别进行主题划分和环节划分,得到所述每一句子的主题向量和环节向量;所述第二编码器基于所述课堂记录文本中所有句子的主题向量、环节向量、角色向量和句子表征向量进行编码,得到所述课堂记录文本的文本表征向量;所述所有句子的角色向量基于所述说话人信息确定;所述解码器对所述课堂记录文本中所有句子的句子表征向量和所述课堂记录文本的文本表征向量进行解码,得到所述课堂记录文本对应的纪要分词,并基于所述纪要分词生成所述课堂纪要文本。7.根据权利要求5所述的课堂纪要生成系统,其特征在于,所述第一编码器包括指代消解层和编码层;所述指代消解层基于所述课堂记录文本中每一句子的分词进行指代消解,得到所述每一句子的词性标签向量、实体标签向量和指代关系向量;所述编码层基于所述每一句子的分词、词性标签向量、实体标签向量和指代关系向量进行编码,得到所述每一句子的句子表征向量。8.根据权利要求5所述的课堂纪要生成系统,其特征在于,所述分类网络包括类别预测模型;所述类别预测模型基于所述每一句子的句子表征向量进行环节划分,得到所述每一句子的环节向量;所述类别预测模型是基于样本句子的句子表征向量及对应的样本环节向量,对初始类别预测模型进行训练得到的;所述初始类别预测模型是基于课堂场景下各个环节之间的状态转移关系构建的。9.一种课堂纪要生成系统,其特征在于,包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现如权利要求1-4任一项所述的课堂纪要生成方法。10.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如权利要求1-4任一项所述的课堂纪要生成方法。

技术总结
本发明提供一种课堂纪要生成方法及系统,方法包括:获取课堂音频文件;对课堂音频文件进行语音识别和声纹识别,得到包含说话人信息和对应说话内容的课堂记录文本;将课堂记录文本输入至课堂纪要生成模型,得到课堂纪要文本;其中,课堂纪要生成模型是基于样本课堂记录文本及对应的样本课堂纪要文本训练得到的;课堂纪要生成模型用于对课堂记录文本进行主题划分和环节划分,并基于划分得到的主题向量和环节向量对课堂记录文本进行编码,得到课堂记录文本的文本表征向量,对文本表征向量进行解码,得到课堂纪要文本。本发明实现了课堂纪要文本的自动生成,极大地提升了纪要生成的效率,同时提升了课堂纪要文本的准确性、逻辑性和整体的连贯性。和整体的连贯性。和整体的连贯性。


技术研发人员:张浩 黄涛 刘三女牙 李宗霖 王翔宇 李耀鹏 戴志诚
受保护的技术使用者:华中师范大学
技术研发日:2022.11.04
技术公布日:2023/3/21
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1