模型迭代训练方法、样本扩充方法、设备、介质及产品与流程

文档序号：42661559发布日期：2025-08-05 18:47阅读：34来源：国知局

技术简介：
本专利针对深度学习模型在安全合规场景下训练数据稀缺、模型鲁棒性不足的问题，提出通过模型迭代训练与样本自动生成相结合的解决方案。方法利用答复评估模型识别违规内容，再由样本生成模型生成规避违规的合规样本，持续优化训练数据集，提升模型在复杂安全场景下的准确性和合规响应能力。
关键词：模型迭代训练,样本扩充方法

本说明书一个或多个实施例涉及模型，尤其涉及一种模型迭代训练方法、样本扩充方法、电子设备、计算机可读介质及计算机程序产品。

背景技术：

1、随着深度学习和大规模生成式模型在自然语言处理和智能问答领域的快速普及，其在客户服务、内容创作、知识检索等场景中展现出强大潜力。然而，模型在实际应用过程中往往面临内容安全和合规性风险，高质量的安全标注数据集稀缺且获取成本高昂，相关数据往往涉及隐私保护限制，难以大规模流通，导致模型难以充分学习到各种潜在违规或敏感场景，从而导致模型在处理复杂场景时的准确性和鲁棒性不足。

技术实现思路

1、有鉴于此，本说明书一个或多个实施例提供一种模型迭代训练方法、样本扩充方法、电子设备、计算机可读介质及计算机程序产品。

2、为实现上述目的，本说明书一个或多个实施例提供技术方案如下：

3、根据本说明书一个或多个实施例的第一方面，提出了一种模型迭代训练方法，包括：

4、获取目标数据集，并将所述目标数据集拆分为训练集和验证集；所述目标数据集包括多个问题及符合预设安全规范的答复；

5、基于所述训练集对待训练语言模型进行训练，获得训练好的目标语言模型；所述训练集中的问题作为模型输入以及所述问题的答复作为监督标签；

6、利用所述目标语言模型，生成所述验证集中的问题的待评估答复；

7、利用已训练完成的答复评估模型评估所述待评估答复是否符合所述预设安全规范，并在得出不符合结论时，进一步输出用于描述所述待评估答复中的违规内容的分析信息；

8、利用已训练完成的样本生成模型，生成至少一个能够规避所述分析信息描述的违规内容的问答对样本；

9、基于至少一个所述问答对样本更新所述目标数据集，以用于下一次针对所述目标语言模型的迭代训练。

10、可以包括以下有益效果：本实施例提供的模型迭代训练方法，首先将现有的目标数据集拆分为训练集和验证集，利用训练集对待训练语言模型进行初步训练获得目标语言模型，然后让目标语言模型针对现有有限的验证集中的问题输出待评估答复，再由答复评估模型识别并输出待评估答复中存在违规内容的分析信息，接着利用样本生成模型基于这些分析信息自动生成新的、符合安全规范的问答对样本，最后将这些问答对样本与目标训练集合并用于下一轮训练。如此循环往复，有效克服了训练数据稀缺与覆盖不足的问题，目标语言模型不断从自身生成的错误中“学习”，逐步增强对复杂安全场景的理解与响应能力，显著提升最终模型在多样场景下的准确性、鲁棒性和覆盖度。

11、根据本说明书一个或多个实施例的第二方面，提出了一种样本扩充方法，包括：

12、获取目标数据集，并将所述目标数据集拆分为训练集和验证集；所述目标数据集包括多个问题及符合预设安全规范的答复；

13、利用由所述训练集训练好的目标语言模型，生成所述验证集中的问题的待评估答复；

14、利用已训练完成的答复评估模型评估所述待评估答复是否符合所述预设安全规范，并在得出不符合结论时，进一步输出用于描述所述待评估答复中的违规内容的分析信息；

15、利用已训练完成的样本生成模型，生成至少一个能够规避所述分析信息描述的违规内容的问答对样本，以扩充所述目标数据集。

16、可以包括以下有益效果：通过上述样本扩充方法，能够自动发现目标语言模型在处理特定问题时存在的安全性不足，并基于答复评估模型生成具有针对性的分析信息，进而利用样本生成模型参考分析信息合成符合预设安全规范的新问答对样本，有效补充原始数据集中覆盖不足或表达存在风险的问题类型。该方法不仅提升了目标数据集在多样性与安全性维度的覆盖能力，还实现了数据的高质量扩充，从而为后续语言模型训练提供更具代表性与鲁棒性的训练样本，最终促使模型在复杂安全场景下具备更高的准确性与合规响应能力。

17、根据本说明书实施例的第三方面，提供一种电子设备，包括：

18、处理器；

19、用于存储处理器可执行指令的存储器；

20、其中，所述处理器执行所述可执行指令时，用于实现第一方面或第二方面所述的方法。

21、根据本说明书实施例的第四方面，提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现第一方面或第二方面所述方法的步骤。

22、根据本说明书实施例的第五方面，提供一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现第一方面或第二方面所述方法的步骤。

23、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本说明书。

技术特征：

1.一种模型迭代训练方法，包括：

2.根据权利要求1所述的方法，所述基于所述训练集对所述待训练语言模型进行训练，包括：

3.根据权利要求1所述的方法，所述利用已训练完成的答复评估模型评估所述待评估答复是否符合所述预设安全规范，并在得出不符合结论时，进一步输出用于描述所述待评估答复中的违规内容的分析信息，包括：

4.根据权利要求1所述的方法，所述分析信息包括以下至少一种：所述待评估答复中存在的不符合所述预设安全规范的关键词、所述待评估答复所涉及的违规因素、针对所述待评估答复的违规总结内容。

5.根据权利要求1所述的方法，所述利用已训练完成的样本生成模型，生成至少一个能够规避所述分析信息描述的违规内容的问答对样本，包括：

6.根据权利要求5所述的方法，每个所述样本生成提示模板包括：用于指示所述样本生成模型生成问答对样本的、以思维链的方式进行排列的多个推理步骤，和/或，与所述样本生成提示模板对应安全场景相关的负面示例；

7.根据权利要求6所述的方法，所述多个推理步骤包括第一推理步骤、第二推理步骤和解答步骤；

8.根据权利要求1所述的方法，所述基于至少一个所述问答对样本更新所述目标数据集，包括：

9.根据权利要求8所述的方法，所述基于评估结果包含符合结论的问答对样本，更新所述目标数据集，包括：

10.一种样本扩充方法，包括：

11.根据权利要求10所述的方法，所述利用已训练完成的答复评估模型评估所述待评估答复是否符合所述预设安全规范，并在得出不符合结论时，进一步输出用于描述所述待评估答复中的违规内容的分析信息，包括：

12.根据权利要求10所述的方法，所述利用已训练完成的样本生成模型，生成至少一个能够规避所述分析信息描述的违规内容的问答对样本，包括：

13.一种电子设备，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器通过运行所述可执行指令以实现如权利要求1～12中任一项所述方法的步骤。

14.一种计算机可读存储介质，其上存储有计算机指令，该指令被处理器执行时实现如权利要求1～12中任一项所述方法的步骤。

15.一种计算机程序产品，包括计算机程序/指令，该计算机程序/指令被处理器执行时实现如权利要求1～12中任一项所述方法的步骤。

技术总结
本说明书一个或多个实施例提供一种模型迭代训练方法、样本扩充方法、设备、介质及产品。模型迭代训练方法包括：获取目标数据集，并将目标数据集拆分为训练集和验证集；目标数据集包括多个问题及符合预设安全规范的答复；基于训练集对待训练语言模型进行训练，获得训练好的目标语言模型；利用目标语言模型生成验证集中的问题的待评估答复；利用已训练完成的答复评估模型评估待评估答复是否符合预设安全规范，并在得出不符合结论时，输出用于描述待评估答复中的违规内容的分析信息；利用已训练完成的样本生成模型，生成能够规避分析信息描述的违规内容的问答对样本；基于问答对样本更新目标数据集，以用于下一次针对目标语言模型的迭代训练。

技术研发人员：董迹海,郑开元,许小龙,许丽丹,吴垠,赵小柯,李哲
受保护的技术使用者：蚂蚁区块链科技（上海）有限公司
技术研发日：
技术公布日：2025/8/4

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：董迹海,郑开元,许小龙,许丽丹,吴垠,赵小柯,李哲
技术所有人：蚂蚁区块链科技（上海）有限公司
我是此专利的发明人

上一篇：一种膛口火药燃气能量回收装置
下一篇：一种基于数据机房的机器人导航方法、设备及介质与流程

该领域下的技术专家

1、李老师：1.计算力学 2.无损检测

2、毕老师：机构动力学与控制

3、袁老师：1.计算机视觉 2.无线网络及物联网

4、王老师：1.计算机网络安全 2.计算机仿真技术

5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！