知识产权领域大模型训练方法、装置、电子设备及介质与流程

文档序号:37174454发布日期:2024-03-01 12:24阅读:14来源:国知局
知识产权领域大模型训练方法、装置、电子设备及介质与流程

本发明涉及人工智能领域,尤其涉及一种知识产权领域大模型训练方法、装置、电子设备及存储介质。


背景技术:

1、随着大型语言模型(llms)的发展,通用大模型体现出了强大的自然语言理解能力和生成能力。最近的研究表明,经过领域特定数据的有监督微调的大模型在金融、法律、医学和编程等垂直领域取得了不错的效果。

2、然而,通用大模型在知识产权领域的效果并不理想,目前还没有已经公开的知识产权领域的大模型。

3、因此,急需一种能够实现大模型在知识产权领域运行效果好的大模型训练方法。


技术实现思路

1、本发明各实施例提供一种知识产权领域大模型训练方法、装置、电子设备及存储介质,以解决相关技术中大模型在知识产权领域运行效果不好的问题。所述技术方案如下:

2、根据本发明的一个方面,一种知识产权领域大模型训练方法,所述方法包括:获取专利数据集、通用指令集、知识产权领域问答数据集以及基底模型;根据所述专利数据集构建第一训练集,并根据所述第一训练集对所述基底模型进行第一阶段的预训练,得到一级模型;根据所述通用指令集构建第二训练集,并根据所述第二训练集对所述一级模型进行第二阶段的模型参数微调,得到二级模型;根据所述知识产权领域问答数据集构建第三训练集,并根据所述第三训练集对所述二级模型进行第三阶段的模型参数微调,得到目标模型;所述目标模型用于目标任务。

3、在其中一个实施例中,根据所述专利数据集构建第一训练集通过以下步骤实现:对所述专利数据集进行数据清洗和预处理;将所述经过数据清洗和预处理的专利数据转换为适用于所述基地模型的格式,得到第一训练集。

4、在其中一个实施例中,根据所述知识产权领域问答数据集构建第三训练集通过以下步骤实现:对所述知识产权领域问答数据集进行规范化信息抽取,得到微调指令集,并对所述知识产权领域问答数据集进行长序列对话提取,得到单轮指令集;将所述单轮指令集输入对话模型进行多轮对话改写处理,得到多轮对话指令集;以所述微调指令集和所述多轮对话指令集作为所述第三训练集,对所述二级模型进行训练,得到目标模型。

5、在其中一个实施例中,对所述知识产权领域问答数据集进行规范化信息抽取,得到微调指令集通过以下步骤实现:根据所述知识产权领域问答数据集,构建规范化的信息抽取指令数据集;根据所述信息抽取指令数据集中的信息抽取指令数据生成微调指令集。

6、在其中一个实施例中,对所述知识产权领域问答数据集进行长序列对话提取,得到单轮指令集通过以下步骤实现:根据所述知识产权领域问答数据集,构建长序列对话指令数据集;对所述长序列对话指令数据集进行数据拆分,得到单轮指令集。

7、在其中一个实施例中,所述微调指令集包括:模型微调指令集、训练任务微调指令集和超参数微调指令集中的至少一种;所述单轮指令集包括:查询专利信息指令集、专利侵权检测指令集、知识产权法律咨询指令集、专利申请指令集和知识产权策略指令集中的至少一种。

8、在其中一个实施例中,根据所述知识产权领域问答数据集构建第三训练集,并根据所述第三训练集对所述二级模型进行第三阶段的模型参数微调,得到目标模型通过以下步骤实现:获取所述第三训练集中的第三训练数据;根据所述第三训练数据对所述二级模型进行训练,得到所述二级模型的输出;基于所述第三训练数据所关联标签与所述输出之间的差异,对所述二级模型的模型参数进行优化;直至所述差异达到设定阈值,得到目标模型。

9、根据本发明的一个方面,一种模型训练装置,所述装置包括:数据获取模块,用于获取专利数据集、通用指令集、知识产权领域问答数据集以及基底模型;一级训练模块,用于根据所述专利数据集构建第一训练集,并根据所述第一训练集对所述基底模型进行第一阶段的预训练,得到一级模型;二级训练模块,用于根据所述通用指令集构建第二训练集,并根据所述第二训练集对所述一级模型进行第二阶段的模型参数微调,得到二级模型;目标模型获取模块,用于根据所述知识产权领域问答数据集构建第三训练集,并根据所述第三训练集对所述二级模型进行第三阶段的模型参数微调,得到目标模型;所述目标模型用于目标任务。

10、根据本发明的一个方面,一种电子设备,包括至少一个处理器以及至少一个存储器,其中,所述存储器上存储有计算机可读指令;所述计算机可读指令被一个或多个所述处理器执行,使得电子设备实现如上所述的知识产权领域大模型训练方法。

11、根据本发明的一个方面,一种存储介质,其上存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行,以实现如上所述的知识产权领域大模型训练方法。

12、根据本发明的一个方面,一种计算机程序产品,计算机程序产品包括计算机可读指令,计算机可读指令存储在存储介质中,电子设备的一个或多个处理器从存储介质读取计算机可读指令,加载并执行该计算机可读指令,使得电子设备实现如上所述的知识产权领域大模型训练方法。

13、本发明提供的技术方案带来的有益效果是:

14、在上述技术方案中,首先获取专利数据集、通用指令集、知识产权领域问答数据集以及基底模型,然后根据专利数据集构建第一训练集,并根据第一训练集对基底模型进行第一阶段的预训练,得到一级模型,再根据通用指令集构建第二训练集,并根据第二训练集对一级模型进行第二阶段的模型参数微调,得到二级模型,最后根据知识产权领域问答数据集构建第三训练集,并根据第三训练集对二级模型进行第三阶段的模型参数微调,得到目标模型,该目标模型用于目标任务,因此,本发明能够保证模型训练的效果,从而能够有效地解决相关技术中存在的大模型在知识产权领域运行效果不好的问题。



技术特征:

1.一种知识产权领域大模型训练方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述根据所述专利数据集构建第一训练集,包括:

3.如权利要求1所述的方法,其特征在于,所述根据所述知识产权领域问答数据集构建第三训练集,包括:

4.如权利要求3所述的方法,其特征在于,所述对所述知识产权领域问答数据集进行规范化信息抽取,得到微调指令集,包括:

5.如权利要求3所述的方法,其特征在于,所述对所述知识产权领域问答数据集进行长序列对话提取,得到单轮指令集,包括:

6.如权利要求3所述的方法,其特征在于,所述微调指令集包括:模型微调指令集、训练任务微调指令集和超参数微调指令集中的至少一种;

7.如权利要求1至6任一项所述的方法,其特征在于,所述根据所述第三训练集对所述二级模型进行第三阶段的模型参数微调,得到目标模型,包括:

8.一种模型训练装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,包括:至少一个处理器以及至少一个存储器,其中,

10.一种存储介质,其上存储有计算机可读指令,其特征在于,所述计算机可读指令被一个或多个处理器执行,以实现如权利要求1至7中任一项所述的知识产权领域大模型训练方法。


技术总结
本发明实施例公开了一种知识产权领域大模型训练方法、装置、电子设备及介质,涉及人工智能领域,其中,所述方法包括:获取专利数据集、通用指令集、知识产权领域问答数据集以及基底模型;根据专利数据集构建第一训练集,并根据第一训练集对所述基底模型进行第一阶段的预训练,得到一级模型;根据通用指令集构建第二训练集,并根据第二训练集对一级模型进行第二阶段的模型参数微调,得到二级模型;根据知识产权领域问答数据集构建第三训练集,并根据第三训练集对二级模型进行第三阶段的模型参数微调,得到目标模型;目标模型用于知识产权领域中的至少一种目标任务。本发明解决了现有技术中的大模型在知识产权领域运行效果不好的问题。

技术研发人员:倪仕文,杨敏
受保护的技术使用者:深圳先进技术研究院
技术研发日:
技术公布日:2024/2/29
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1