基于文本理解模型的知识点生成方法及系统与流程

文档序号:37121676发布日期:2024-02-22 21:27阅读:23来源:国知局
基于文本理解模型的知识点生成方法及系统与流程

本技术涉及人工智能,特别涉及一种基于文本理解模型的知识点生成方法及系统。


背景技术:

1、离线学习app中的电子教材文本是指在手机或平板等移动设备上使用的教育类应用程序中的电子版教材内容。这些电子教材文本提供了具体课程的学习材料,以便用户随时随地通过app进行学习。

2、以下是离线学习app中电子教材文本的一些特点和功能:课程内容:电子教材文本涵盖各个学科领域的知识点和课程内容。它们可以包括教材章节、习题、实例、案例研究、解析和评论等;多媒体支持:电子教材文本通常支持多媒体元素的插入,例如图像、图表、音频和视频等。这样可以丰富课程内容,提供更生动和交互式的学习体验;搜索和导航:用户可以使用app中的搜索功能来查找特定主题或关键词,并快速跳转到相关内容。此外,电子教材文本还提供目录、书签和跳转链接等导航工具,帮助用户方便地浏览和定位所需信息;个性化学习:一些离线学习app提供个性化学习功能,根据用户的学习进度和兴趣推荐相关内容。电子教材文本可以与用户的学习数据相结合,帮助生成适应个体需求的学习计划和建议;离线访问:由于电子教材文本存储在设备本地,用户可以在无网络连接的情况下随时访问和学习。这对于在没有稳定网络的环境中学习非常有用,同时也提供了更大的灵活性和便利性。通过离线学习app中的电子教材文本,学生可以方便地获取和学习各个学科领域的课程内容。这种形式的教材提供了高度可定制和交互式的学习体验,促进了个性化学习和自主学习的发展。

3、在一些应用场景下,需要对一些电子教材文本进行知识点标注和生成以匹配相关的学习需求,但是传统的知识点标注和生成技术存在准确性低下的问题。


技术实现思路

1、为改善相关技术中存在的技术问题,本技术提供了一种基于文本理解模型的知识点生成方法及系统。

2、第一方面,本技术实施例提供了一种基于文本理解模型的知识点生成方法,应用于ai文本分析系统,所述方法包括:

3、获得初始离线教育app课堂文本中若干个课堂文本内容块分别对应的内容块分布数据;

4、依据若干个所述课堂文本内容块对应的内容块分布数据,确定每个所述课堂文本内容块的第一上下文关系语义数据,以得到所述初始离线教育app课堂文本对应的第二上下文关系语义数据;

5、将所述第二上下文关系语义数据和所述初始离线教育app课堂文本在知识结构层面下进行文本语义交叉操作,得到对应的文本语义交叉向量;

6、对所述文本语义交叉向量进行知识点向量挖掘,并依据所述第二上下文关系语义数据对知识点向量挖掘所得到的知识点向量在文本逻辑层面进行知识特征衍生处理,得到衍生知识点向量;

7、基于所述衍生知识点向量生成离线教育知识点标注文本,所述离线教育知识点标注文本的知识点特征识别度高于所述初始离线教育app课堂文本的知识点特征识别度。

8、在一些方案下,所述内容块分布数据包括课堂文本内容块在文本语义分布空间中的空间特征变量;所述依据若干个所述课堂文本内容块对应的内容块分布数据,确定每个所述课堂文本内容块的第一上下文关系语义数据,以得到所述初始离线教育app课堂文本对应的第二上下文关系语义数据,包括:

9、依据若干个所述课堂文本内容块各自对应的空间特征变量,确定各所述课堂文本内容块在内容块关系网的文本行维度和文本列维度上分别对应的内容规模权重;

10、对若干个所述课堂文本内容块在文本行维度和文本列维度上分别对应的内容规模权重进行文本映射变换的反变换,得到若干个所述课堂文本内容块中的每个课堂文本内容块在上下文语义空间中对应的第一上下文关系语义数据,以得到所述初始离线教育app课堂文本对应的第二上下文关系语义数据。

11、在一些方案下,所述依据若干个所述课堂文本内容块各自对应的空间特征变量,确定各所述课堂文本内容块在内容块关系网的文本行维度和文本列维度上分别对应的内容规模权重,包括:确定所述初始离线教育app课堂文本的第一文本框尺寸和第二文本框尺寸;获得第一特征空间迁移因子,基于所述初始离线教育app课堂文本的第一文本框尺寸和第二文本框尺寸、若干个所述课堂文本内容块各自对应的空间特征变量和所述第一特征空间迁移因子,确定各所述课堂文本内容块在内容块关系网的文本行维度和文本列维度上分别对应的内容规模权重;

12、所述对若干个所述课堂文本内容块在文本行维度和文本列维度上分别对应的内容规模权重进行文本映射变换的反变换,得到若干个所述课堂文本内容块中的每个课堂文本内容块在上下文语义空间中对应的第一上下文关系语义数据,以得到所述初始离线教育app课堂文本对应的第二上下文关系语义数据,包括:依据第二特征空间迁移因子和若干个所述课堂文本内容块分别在文本行维度、文本列维度上的内容规模权重进行文本映射变换的反变换,得到若干个所述课堂文本内容块中的每个课堂文本内容块在上下文语义空间中对应的第一上下文关系语义数据;基于每个所述课堂文本内容块的第一上下文关系语义数据,生成所述初始离线教育app课堂文本对应的第二上下文关系语义数据。

13、在一些方案下,所述对所述文本语义交叉向量进行知识点向量挖掘,并依据所述第二上下文关系语义数据对知识点向量挖掘所得到的知识点向量在文本逻辑层面进行知识特征衍生处理,得到衍生知识点向量,包括:

14、依据所述文本语义交叉向量进行不同特征等级的知识点向量挖掘,得到不同特征等级的知识点向量;

15、将所述不同特征等级的知识点向量进行基于文本块的按序交叉,得到文本语义梯度优化交叉向量;

16、依据所述第二上下文关系语义数据,对所述文本语义梯度优化交叉向量在文本逻辑层面进行知识特征衍生处理,得到衍生知识点向量。

17、在一些方案下,所述依据所述第二上下文关系语义数据,对所述文本语义梯度优化交叉向量在文本逻辑层面进行知识特征衍生处理,得到衍生知识点向量,包括:

18、将所述文本语义梯度优化交叉向量在文本逻辑层面进行知识特征衍生处理,得到文本逻辑层面调整后的线性知识向量;

19、对所述第二上下文关系语义数据进行语义细粒度挖掘处理,得到对应的整体细粒度数据;

20、依据所述整体细粒度数据,确定所述第二上下文关系语义数据对应的特征空间扰动数据和语义细粒度调整因子;

21、基于所述特征空间扰动数据和语义细粒度调整因子,对所述文本逻辑层面调整后的线性知识向量进行知识扩展操作,得到衍生知识点向量。

22、在一些方案下,所述依据所述整体细粒度数据,确定所述第二上下文关系语义数据对应的特征空间扰动数据和语义细粒度调整因子,包括:

23、获得扰动权重和语义细粒度调整变量,依据所述扰动权重对所述整体细粒度数据进行分布误差确定,得到所述第二上下文关系语义数据对应的特征空间扰动数据;

24、依据所述语义细粒度调整变量对所述整体细粒度数据进行语义细粒度分析,得到所述第二上下文关系语义数据对应的语义细粒度调整因子。

25、在一些方案下,所述基于所述特征空间扰动数据和语义细粒度调整因子,对所述文本逻辑层面调整后的线性知识向量进行知识扩展操作,得到衍生知识点向量,包括:

26、基于所述特征空间扰动数据和所述文本逻辑层面调整后的线性知识向量中各所述课堂文本内容块的空间特征变量,确定每个所述课堂文本内容块完成更新后的空间特征变量;

27、依据所述语义细粒度调整因子对各所述课堂文本内容块完成更新后的空间特征变量进行滑动平均处理,得到知识扩展处理后的线性知识向量;

28、将所述文本逻辑层面调整后的线性知识向量和所述知识扩展处理后的线性知识向量进行基于文本块的按序交叉,得到衍生知识点向量。

29、在一些方案下,所述方法通过文本理解网络实现,所述文本理解网络包括原始的下采样滑动平均算子和原始的上采样滑动平均算子;所述依据所述语义细粒度调整因子对各所述课堂文本内容块完成更新后的空间特征变量进行滑动平均处理,得到知识扩展处理后的线性知识向量,包括:

30、将所述语义细粒度调整因子分别与所述原始的下采样滑动平均算子、所述原始的上采样滑动平均算子进行特征运算,得到目标下采样滑动平均算子和目标上采样滑动平均算子;

31、通过所述目标下采样滑动平均算子和目标上采样滑动平均算子,对各所述课堂文本内容块完成更新后的空间特征变量进行滑动平均处理,得到知识扩展处理后的线性知识向量。

32、在一些方案下,所述方法通过文本理解网络实现,所述文本理解网络通过调试步骤所得,所述调试步骤包括:

33、获得离线教育app课堂文本调试样例和所述离线教育app课堂文本调试样例对应的知识点标注先验观点;

34、通过待调试的文本理解网络依据所述离线教育app课堂文本调试样例中若干个课堂文本内容块调试样例分别对应的内容块分布数据调试样例,确定每个所述课堂文本内容块调试样例的第一上下文关系语义数据调试样例,以得到所述离线教育app课堂文本调试样例对应的第二上下文关系语义数据调试样例;

35、将所述第二上下文关系语义数据调试样例和所述离线教育app课堂文本调试样例在知识结构层面下进行文本语义交叉操作,得到对应的文本语义交叉向量调试样例;

36、对所述文本语义交叉向量调试样例进行知识点向量挖掘,并依据所述第二上下文关系语义数据调试样例对知识点向量挖掘所得到的知识点向量在文本逻辑层面进行知识特征衍生处理,得到衍生知识点向量调试样例;

37、基于所述衍生知识点向量调试样例生成离线教育知识点标注测试文本,所述离线教育知识点标注测试文本的知识点特征识别度高于所述离线教育app课堂文本调试样例的知识点特征识别度;

38、依据所述离线教育知识点标注测试文本和对应的知识点标注先验观点之间的知识点标注代价,对所述待调试的文本理解网络进行调试,直到符合调试达标要求时终止,得到调试成功的文本理解网络;所述调试成功的文本理解网络用于对初始离线教育app课堂文本进行知识点标注操作。

39、第二方面,本技术还提供了一种ai文本分析系统,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述的方法。

40、第三方面,本技术还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。

41、应用本技术实施的基于文本理解模型的知识点生成方法及系统,通过获得初始离线教育app课堂文本中若干个课堂文本内容块分别对应的内容块分布数据,依据若干个课堂文本内容块对应的内容块分布数据,确定每个课堂文本内容块的第一上下文关系语义数据,以得到初始离线教育app课堂文本对应的第二上下文关系语义数据,从而可以通过上下文关系语义反映课堂文本内容块的分布情况。将第二上下文关系语义数据和初始离线教育app课堂文本在知识结构层面下进行文本语义交叉操作,得到对应的文本语义交叉向量,可以在知识结构维度下进行特征聚合,使得通过知识结构维度的特征聚合为之后的任务输出尽可能丰富的特征。对文本语义交叉向量进行知识点向量挖掘,并依据第二上下文关系语义数据对知识点向量挖掘所得到的知识点向量在文本逻辑层面进行知识特征衍生处理,可以将初始离线教育app课堂文本的各课堂文本内容块的上下文关系语义作为课堂文本内容提取的基准,使得对文本逻辑层面的课堂文本内容提取尽可能合理。基于合理的课堂文本内容提取所得的衍生知识点向量实现准确可靠的知识点生成,从而得到知识点特征识别度高于初始离线教育app课堂文本知识点特征识别度的离线教育知识点标注文本。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1