本公开涉及数据处理,具体涉及一种数据生成方法、装置、电子设备及存储介质。
背景技术:
1、地图服务的相关产业在近几年得到了快速的发展,越来越多的用户依赖地图来寻找和评价周边的餐厅、景点、休闲娱乐等场所。用户在做出决策时,往往需要参考详细的兴趣点(point of interest,poi)信息,如标签信息、用户评论和推荐理由等。然而,现有的地图数据中很多兴趣点的信息并不完整,标签不准确,且更新速度滞后,这些问题对用户体验造成了不小的影响,也不利于地图服务质量的提升。
技术实现思路
1、为了解决相关技术中的问题,本公开实施例提供一种数据生成方法、装置、电子设备及存储介质。
2、第一方面,本公开实施例中提供了一种数据生成方法。
3、具体地,所述数据生成方法,包括:
4、获取任务数据,所述任务数据包括已有数据和缺失数据类型;
5、使用预先训练好的第一大规模语言模型,根据所述任务数据,生成数据生成思维链,所述数据生成思维链用于描述基于所述已有数据生成所述缺失数据类型对应的缺失数据的处理链路;
6、使用预先训练好的第二大规模语言模型,根据所述数据生成思维链从所述已有数据中提取关键数据;
7、使用预先训练好的第三大规模语言模型,根据所述关键数据和所述数据生成思维链生成所述缺失数据。
8、第二方面,本公开实施例中提供了一种大规模语言模型的训练方法,包括:
9、获取第一训练数据集,所述第一训练数据集包括第一样本任务数据及其对应的数据生成思维链,所述第一样本任务数据包括第一样本已有数据和第一样本缺失数据类型;
10、使用所述第一训练数据集对初始的大规模语言模型进行预训练,得到预训练的大规模语言模型;
11、获取第二样本任务数据,所述第二样本任务数据包括第二样本已有数据和第二样本缺失数据类型;
12、使用所述预训练的大规模语言模型,根据所述第二样本任务数据生成样本数据生成思维链;
13、将所述第二样本任务数据和所述样本数据生成思维链输入至预先训练的奖励模型,得到所述奖励模型输出的奖励信号;
14、使用强化学习算法根据所述奖励信号对所述预训练的大规模语言模型进行微调,得到训练好的第一大规模语言模型。
15、第三方面,本公开实施例中提供了一种数据生成装置,包括:
16、获取模块,被配置为获取任务数据,所述任务数据包括已有数据和缺失数据类型;
17、思维链生成模块,被配置为使用预先训练好的第一大规模语言模型,根据所述任务数据生成数据生成思维链,所述数据生成思维链用于描述基于所述已有数据生成所述缺失数据类型对应的缺失数据的处理链路;
18、提取模块,被配置为使用预先训练好的第二大规模语言模型,根据所述数据生成思维链从所述已有数据中提取关键数据;
19、缺失数据生成模块,被配置为使用预先训练好的第三大规模语言模型,根据所述关键数据和所述数据生成思维链生成所述缺失数据。
20、第四方面,本公开实施例提供了一种电子设备,包括存储器和处理器,其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现如第一方面中任一项所述的方法。
21、第五方面,本公开实施例中提供了一种计算机可读存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现如第一方面中任一项所述的方法。
22、第六方面,本公开实施例中提供了一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现如第一方面中任一项所述的方法步骤。
23、根据本公开实施例提供的技术方案,在获取到包括已有数据和缺失数据类型的任务数据后,可以使用预先训练好的第一大规模语言模型,根据所述任务数据来生成数据生成思维链,所述数据生成思维链用于描述基于所述已有数据生成所述缺失数据类型对应的缺失数据的处理链路;然后,使用预先训练好的第二大规模语言模型,根据所述数据生成思维链从所述已有数据中提取需要的关键数据;使用预先训练好的第三大规模语言模型,按照所述数据生成思维链提供的处理链路,根据所述关键数据生成所述缺失数据。如此,可以根据已有数据自动生成缺失的标签、短评和推荐理由等缺失数据,减少人工标注成本,提高数据的质量和完整性,从而为用户提供更好的互联网服务。而且本实施方式使用数据生成思维链来模拟数据生成技术人员在面对具体生成任务时的推理过程,利用数据生成思维链这一中间结果来指导第二大规模语言模型的数据提取和第三大规模语言模型的数据生成,可以快速、高质量和准确地生成缺失数据;通过数据生成思维链可以将数据提取和数据生成节点的信息进行整合和传递,实现对数据生成过程的高度抽象和模拟,相比于直接基于已有数据生成缺失数据,本实施方式具有更高的效率和更好的适应性,能够应对更加复杂和多样化的数据生成场景。
24、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
1.一种数据生成方法,包括:
2.根据权利要求1所述的方法,其中,所述方法还包括:
3.根据权利要求2所述的方法,其中,所述方法还包括:
4.根据权利要求1所述的方法,其中,所述使用预先训练好的第二大规模语言模型,根据所述数据生成思维链从所述已有数据中提取关键数据,包括:
5.根据权利要求1所述的方法,其中,所述方法还包括:
6.根据权利要求1所述的方法,其中,所述获取任务数据,包括:
7.一种大规模语言模型的训练方法,包括:
8.一种数据生成装置,包括:
9.一种电子设备,包括存储器和处理器;其中,所述存储器用于存储一条或多条计算机指令,所述一条或多条计算机指令被所述处理器执行以实现权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机指令,其中,该计算机指令被处理器执行时实现权利要求1-7任一项所述的方法。