代码检测模型训练方法及装置与流程

文档序号:37347665发布日期:2024-03-18 18:24阅读:8来源:国知局
代码检测模型训练方法及装置与流程

本文件涉及代码,尤其涉及一种代码检测模型训练方法及装置。


背景技术:

1、在软件开发过程中,代码缺陷是常见的问题之一,这些缺陷可能导致软件的错误行为、低性能或甚至安全漏洞,因此,及早发现和纠正代码缺陷对于确保软件质量和可靠性至关重要,较为常用的代码缺陷检测方式是利用代码静态分析技术进行检测,但代码静态分析技术通常需要手动配置和调整规则以适应特定的应用和环境,并且对于复杂的代码结构和新兴的编程环境表现不佳,可能会导致代码缺陷的误报或者漏报,同时还会给开发人员带来额外的检查和维护工作。


技术实现思路

1、本说明书一个或多个实施例提供了一种代码检测模型训练方法,包括:通过预训练模型对训练样本中包含的检测关键词进行识别,并根据识别结果在所述训练样本中读取代码片段。对所述代码片段进行特征提取获得代码特征,并针对所述代码特征进行各个异常类型的异常检测处理获得目标异常类型。生成所述代码片段在所述目标异常类型下的异常提示信息,并将所述异常提示信息写入所述代码片段获得输出代码片段。基于所述输出代码片段和所述训练样本的样本标签对所述预训练模型进行参数调整,以获得代码检测模型。

2、本说明书一个或多个实施例提供了一种代码检测模型训练装置,包括:代码片段读取模块,被配置为通过预训练模型对训练样本中包含的检测关键词进行识别,并根据识别结果在所述训练样本中读取代码片段。异常类型检测模块,被配置为对所述代码片段进行特征提取获得代码特征,并针对所述代码特征进行各个异常类型的异常检测处理获得目标异常类型。异常提示处理模块,被配置为生成所述代码片段在所述目标异常类型下的异常提示信息,并将所述异常提示信息写入所述代码片段获得输出代码片段。参数调整模块,被配置为基于所述输出代码片段和所述训练样本的样本标签对所述预训练模型进行参数调整,以获得代码检测模型。

3、本说明书一个或多个实施例提供了一种代码检测模型训练设备,包括:处理器;以及,被配置为存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:通过预训练模型对训练样本中包含的检测关键词进行识别,并根据识别结果在所述训练样本中读取代码片段。对所述代码片段进行特征提取获得代码特征,并针对所述代码特征进行各个异常类型的异常检测处理获得目标异常类型。生成所述代码片段在所述目标异常类型下的异常提示信息,并将所述异常提示信息写入所述代码片段获得输出代码片段。基于所述输出代码片段和所述训练样本的样本标签对所述预训练模型进行参数调整,以获得代码检测模型。

4、本说明书一个或多个实施例提供了一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:通过预训练模型对训练样本中包含的检测关键词进行识别,并根据识别结果在所述训练样本中读取代码片段。对所述代码片段进行特征提取获得代码特征,并针对所述代码特征进行各个异常类型的异常检测处理获得目标异常类型。生成所述代码片段在所述目标异常类型下的异常提示信息,并将所述异常提示信息写入所述代码片段获得输出代码片段。基于所述输出代码片段和所述训练样本的样本标签对所述预训练模型进行参数调整,以获得代码检测模型。



技术特征:

1.一种代码检测模型训练方法,包括:

2.根据权利要求1所述的代码检测模型训练方法,所述预训练模型的训练样本,采用如下方式构建:

3.根据权利要求2所述的代码检测模型训练方法,所述训练样本的样本标签,采用如下方式构建:

4.根据权利要求1所述的代码检测模型训练方法,所述对所述代码片段进行特征提取获得代码特征,包括:

5.根据权利要求1所述的代码检测模型训练方法,所述针对所述代码特征进行各个异常类型的异常检测处理获得目标异常类型,包括:

6.根据权利要求1所述的代码检测模型训练方法,所述生成所述代码片段在所述目标异常类型下的异常提示信息,包括:

7.根据权利要求6所述的代码检测模型训练方法,所述将所述异常提示信息写入所述代码片段获得输出代码片段,包括:

8.根据权利要求1所述的代码检测模型训练方法,所述基于所述输出代码片段和所述训练样本的样本标签对所述预训练模型进行参数调整,包括:

9.根据权利要求8所述的代码检测模型训练方法,所述根据所述输出代码片段和所述样本标签确定所述训练样本的训练损失,包括:

10.根据权利要求1所述的代码检测模型训练方法,所述通过预训练模型对训练样本中包含的检测关键词进行识别,并根据识别结果在所述训练样本中读取代码片段,包括:

11.根据权利要求1所述的代码检测模型训练方法,还包括:

12.根据权利要求1所述的代码检测模型训练方法,所述代码检测模型在训练完成后用于对待检测代码进行异常检测处理,所述异常检测处理包括:

13.一种代码检测模型训练装置,包括:

14.一种代码检测模型训练设备,包括:

15.一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被处理器执行时实现以下流程:


技术总结
本说明书实施例提供了代码检测模型训练方法及装置,其中,一种代码检测模型训练方法包括:在预训练模型的训练过程中,通过预训练模型对训练样本中包含的检测关键词进行识别,根据识别结果在训练样本中读取代码片段并进行特征提取,针对提取的代码特征进行各个异常类型的异常检测处理获得目标异常类型,生成代码片段在目标异常类型下的异常提示信息并写入代码片段获得输出代码片段,基于输出代码片段和训练样本的样本标签对预训练模型进行参数调整,以此通过对预训练模型的训练获得代码检测模型。

技术研发人员:董德俊,周金果,骆朋帅,范刚,狄鹏
受保护的技术使用者:支付宝(杭州)信息技术有限公司
技术研发日:
技术公布日:2024/3/17
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1