一种数字人教师多模态大语言模型预训练学科语料库的构建方法

文档序号:36102443发布日期:2023-11-21 19:56阅读:来源:国知局

技术特征:

1.一种数字人教师多模态大语言模型预训练学科语料库的构建方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种数字人教师多模态大语言模型预训练学科语料库的构建方法,其特征在于:步骤(1)数据收集包括如下步骤:

3.根据权利要求1所述的一种数字人教师多模态大语言模型预训练学科语料库的构建方法,其特征在于:步骤(2)数据预处理包含对文本数据、图像数据、音频数据的处理,包括如下步骤:

4.根据权利要求1所述的一种数字人教师多模态大语言模型预训练学科语料库的构建方法,其特征在于:步骤(3)多模态特征提取和表征学习包括如下步骤:

5.根据权利要求1所述的一种数字人教师多模态大语言模型预训练学科语料库的构建方法,其特征在于:步骤(4)模型领域自适应和微调包括如下步骤:

6.根据权利要求1所述的一种数字人教师多模态大语言模型预训练学科语料库的构建方法,其特征在于:步骤(5)语料库组织与管理包括如下步骤:

7.一种电子设备,其特征在于:包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器运行所述计算机程序时,执行如权利要求1-6任一项所述的一种数字人教师多模态大语言模型预训练学科语料库的构建方法的步骤。

8.一种计算机可读存储介质,其存储计算机程序,其特征在于,所述计算机程序使得计算机执行权利要求1-6任一项所述的一种数字人教师多模态大语言模型预训练学科语料库的构建方法的步骤。


技术总结
本发明公开了一种数字人教师多模态大语言模型预训练学科语料库的构建方法,该方法包括以下步骤:1)从各种学科相关的文献、教材、课程资料、学术期刊、网站等来源收集学科相关的多模态数据;2)对收集到的原始语料数据进行预处理;3)基于深度学习的模型对多模态数据进行特征提取和表征学习;4)对预训练模型进行领域自适应和微调;5)根据语料划分的结果,将语料数据组织成一种结构化的语料库形式,以便后续的语料库检索和应用;该方法通过采用自动化的方法进行教育数字人学科语料库的构建,提高了构建效率,减少了人工成本,能够更好地满足该领域的研究和应用需求,同时为教育数字人学科的发展和应用提供了重要的技术支持。

技术研发人员:刘三女牙,周东波,曾超勇,李千千,姚璜,杨宗凯
受保护的技术使用者:华中师范大学
技术研发日:
技术公布日:2024/1/16
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1