答案确定方法、模型训练方法、装置及电子设备与流程

文档序号：36512419发布日期：2023-12-29 15:49阅读：31来源：国知局

本技术涉及数据处理领域，具体而言，涉及一种答案确定方法、模型训练方法、装置及电子设备。

背景技术：

1、随着大数据的日益增长和项目目标管理的日益复杂化，在项目目标管理过程中存在大量信息。当工作人员进行项目目标管理时，需要阅读各种长篇的项目资料，从庞大冗杂的项目资料中筛选出需要的信息，耗时耗力，不利于项目的推进和开展。

技术实现思路

1、本技术实施例的目的在于提供一种答案确定方法、模型训练方法、装置及电子设备，用以高效、准确地根据用户输入的问题从文本中确定答案。

2、第一方面，本技术提供一种答案确定方法，包括：获取问题；从知识库中确定所述问题对应的相关段落；将所述问题和所述相关段落输入阅读理解模型，通过所述阅读理解模型从所述相关段落中确定所述问题的答案；其中，所述阅读理解模型是以样本问题、样本相关段落和所述样本相关段落对应的标记结果作为模型训练样本训练得到的，所述标记结果通过根据pdca循环对所述样本相关段落进行标记确定，所述标记结果包括：规划标签、执行标签、检查标签和处理标签。

3、在本技术实施例中，采用的阅读理解模型是以样本问题、样本相关段落和样本相关段落对应的标记结果作为模型训练样本训练得到的，标记结果通过根据pdca循环对样本相关段落进行标记确定，将pdca循环与阅读理解模型相结合，pdca循环可以使得阅读理解模型能更好地学习到样本问题、样本相关段落和标记结果之间的关联关系，从而使得阅读理解模型能更高效、准确地根据用户输入的问题从文本中确定答案。

4、在可选的实施方式中，所述从知识库中确定所述问题对应的相关段落，包括：对所述问题进行编码处理，得到问题向量；将所述问题向量与所述知识库中的知识向量进行匹配，确定知识向量；其中，所述知识向量对应的文本段落为所述相关段落；相应地，所述将所述问题和所述相关段落输入经过训练的阅读理解模型，通过所述阅读理解模型从所述相关段落中确定所述问题的答案，包括：将所述问题向量和所述知识向量输入经过训练的阅读理解模型，通过所述阅读理解模型从所述知识向量中确定所述问题的答案。

5、在本技术实施例中，问题通常是自然语言文本，由于对自然语言文本进行匹配处理的效率较低，通过上述方式，将自然语言文本形式的问题编码转换为问题向量，提高从知识库中确定相关段落的效率。此外，由于阅读理解模型对自然语言文本进行处理的效率较低，将问题向量和知识向量作为阅读理解模型的输入，可以有效提高阅读理解模型的处理效率。

6、在可选的实施方式中，在所述从知识库中确定所述问题对应的相关段落之前，所述方法还包括：获取资料文档；对所述资料文档进行分段处理，确定多个段落；将所述多个段落进行编码处理，得到多个知识向量，并将所述多个知识向量保存在所述知识库中。

7、在本技术实施例中，在用户需要从资料文档中确定信息的情况下，将资料文档通过上述方式配置到知识库中，用户在提出与资料文档相关的问题时，可以从知识库中确定相似度较高的知识向量，以便后续阅读理解模型能根据相似度较高的知识向量生成更准确的答案。

8、在可选的实施方式中，通过以下步骤训练所述阅读理解模型：

9、获取用于训练所述阅读理解模型的第一样本相关段落和所述第一样本相关段落对应的第一标记结果；其中，所述第一标记结果通过根据pdca循环对所述第一样本相关段落进行标记确定；将所述第一样本相关段落和所述第一标记结果输入问题生成模型，通过所述问题生成模型生成与所述第一样本相关段落对应的第一样本问题；根据所述第一样本问题、第一样本相关段落和所述第一标记结果对神经网络模型进行训练，得到所述阅读理解模型。

10、在本技术实施例中，由于训练阅读理解模型需要大量训练数据，第一样本相关段落和第一标记结果可以直接从样本文档中提取，然而第一样本问题通常需要人工根据第一样本相关段落和第一标记结果确定，从而导致准备训练阅读理解模型所需的训练数据时需要耗费大量人力物力。因此，通过训练问题生成模型，由问题生成模型根据输入的第一样本相关段落和第一标记结果，直接输出第一样本问题，提高获取用于训练阅读理解模型的训练数据的效率。

11、在可选的实施方式中，在所述获取用于模型训练的样本相关段落之前，所述方法还包括：获取用于训练问题生成模型的第二样本相关段落、所述第二样本相关段落对应的第二标记结果和所述第二样本相关段落对应的第二样本问题；其中，所述第二标记结果通过根据pdca循环对所述第二样本相关段落进行标记确定；通过所述第二样本相关段落、所述第二标记结果和所述第二样本问题对神经网络模型进行训练，得到所述问题生成模型。

12、在可选的实施方式中，所述阅读理解模型依次包括残差连接层、归一化层、高斯误差线性单元激活函数、单层线性层、预测层和输出层。

13、在本技术实施例中，残差连接层设置在归一化层之前，可以使得信息在神经网络中更好地传递，减少出现梯度消失或爆炸的情况。采用高斯误差线性单元激活函数使得在训练深度神经网络时可以更容易地传播梯度，有助于加速模型的收敛速度，并提高阅读理解模型的表达能力和适应性。

14、第二方面，本技术提供一种模型训练方法，包括：获取用于训练阅读理解模型的第一样本相关段落和所述第一样本相关段落对应的第一标记结果；其中，所述第一标记结果通过根据pdca循环对所述第一样本相关段落进行标记确定；将所述第一样本相关段落和所述第一标记结果输入问题生成模型，通过所述问题生成模型生成与所述第一样本相关段落对应的第一样本问题；根据所述第一样本问题、第一样本相关段落和所述第一标记结果对神经网络模型进行训练，得到所述阅读理解模型；其中，所述阅读理解模型用于根据输入的问题和相关段落从所述相关段落中确定所述问题的答案。

15、在可选的实施方式中，在所述获取用于模型训练的样本相关段落之前，所述方法还包括：获取用于训练问题生成模型的第二样本相关段落、所述第二样本相关段落对应的第二标记结果和所述第二样本相关段落对应的第二样本问题；其中，所述第二标记结果通过根据pdca循环对所述第二样本相关段落进行标记确定；根据所述第二样本相关段落、所述第二标记结果和所述第二样本问题对神经网络模型进行训练，得到所述问题生成模型。

16、在可选的实施方式中，所述阅读理解模型依次包括残差连接层、归一化层、高斯误差线性单元激活函数、单层线性层、预测层和输出层。

17、第三方面，本技术提供一种答案确定装置，包括：问题获取模块，用于获取问题；相关段落确定模块，用于从知识库中确定所述问题对应的相关段落；答案确定模块，用于将所述问题和所述相关段落输入阅读理解模型，通过所述阅读理解模型从所述相关段落中确定所述问题的答案；其中，所述阅读理解模型是以样本问题、样本相关段落和所述样本相关段落对应的标记结果作为模型训练样本训练得到的，所述标记结果通过根据pdca循环对所述样本相关段落进行标记确定，所述标记结果包括：规划标签、执行标签、检查标签和处理标签。

18、在可选的实施方式中，所述相关段落确定模块具体用于对所述问题进行编码处理，得到问题向量；将所述问题向量与所述知识库中的知识向量进行匹配，确定知识向量；其中，所述知识向量对应的文本段落为所述相关段落；相应地，所述答案确定模块具体用于将所述问题向量和所述知识向量输入经过训练的阅读理解模型，通过所述阅读理解模型从所述知识向量中确定所述问题的答案。

19、在可选的实施方式中，所述答案确定装置还包括知识库生成模块，用于获取资料文档；对所述资料文档进行分段处理，确定多个段落；将所述多个段落进行编码处理，得到多个知识向量，并将所述多个知识向量保存在所述知识库中。

20、在可选的实施方式中，所述答案确定装置还包括样本获取模块，用于获取用于训练所述阅读理解模型的第一样本相关段落和所述第一样本相关段落对应的第一标记结果；其中，所述第一标记结果通过根据pdca循环对所述第一样本相关段落进行标记确定；问题生成模块，用于将所述第一样本相关段落和所述第一标记结果输入问题生成模型，通过所述问题生成模型生成与所述第一样本相关段落对应的第一样本问题；训练模块，用于根据所述第一样本问题、第一样本相关段落和所述第一标记结果对神经网络模型进行训练，得到所述阅读理解模型。

21、在可选的实施方式中，所述样本获取模块还用于获取用于训练问题生成模型的第二样本相关段落、所述第二样本相关段落对应的第二标记结果和所述第二样本相关段落对应的第二样本问题；其中，所述第二标记结果通过根据pdca循环对所述第二样本相关段落进行标记确定；所述训练模块还用于根据所述第二样本相关段落、所述第二标记结果和所述第二样本问题对神经网络模型进行训练，得到所述问题生成模型。

22、在可选的实施方式中，所述阅读理解模型依次包括残差连接层、归一化层、高斯误差线性单元激活函数、单层线性层、预测层和输出层。

23、第四方面，本技术提供一种模型训练装置，包括：样本获取模块，用于获取用于训练阅读理解模型的第一样本相关段落和所述第一样本相关段落对应的第一标记结果；其中，所述第一标记结果通过根据pdca循环对所述第一样本相关段落进行标记确定；问题生成模块，用于将所述第一样本相关段落和所述第一标记结果输入问题生成模型，通过所述问题生成模型生成与所述第一样本相关段落对应的第一样本问题；训练模块，用于根据所述第一样本问题、第一样本相关段落和所述第一标记结果对神经网络模型进行训练，得到所述阅读理解模型；其中，所述阅读理解模型用于根据输入的问题和相关段落从所述相关段落中确定所述问题的答案。

24、在可选的实施方式中，所述样本获取模块还用于获取用于训练问题生成模型的第二样本相关段落、所述第二样本相关段落对应的第二标记结果和所述第二样本相关段落对应的第二样本问题；其中，所述第二标记结果通过根据pdca循环对所述第二样本相关段落进行标记确定；所述训练模块还用于根据所述第二样本相关段落、所述第二标记结果和所述第二样本问题对神经网络模型进行训练，得到所述问题生成模型。

25、第五方面，本技术提供一种电子设备，包括：处理器、存储器和总线；所述处理器和所述存储器通过所述总线完成相互间的通信；所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行上述的答案确定方法，或执行上述的模型训练方法。

26、第六方面，本技术提供一种存储介质，所述存储介质上存储有计算机程序指令，所述计算机程序指令被计算机读取并运行时，执行上述的答案确定方法，或执行上述的模型训练方法。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：韩威俊陈兴雷政达石文兵肖雪松
技术所有人：成都明途科技有限公司
我是此专利的发明人

上一篇：一种基于插值和预测算法的车辆轨迹拟合仿真方法与流程
上一篇：微波热解炉及其运行方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。