数据模型的生成方法、调用方法、装置、设备及存储介质与流程

文档序号:25053337发布日期:2021-05-14 13:33阅读:来源:国知局

技术特征:
1.一种数据模型的生成方法,其特征在于,包括:获取多种不同的客户数据;对多种所述客户数据进行数据处理,获得对应的多种样本数据;将多种所述样本数据输入深度神经网络进行训练,获得通用客户数据编码模型;对所述通用客户数据编码模型进行模型后处理;在处理后的所述通用客户数据编码模型上增加分类器,并将相应任务的客户响应数据输入所述通用客户数据编码模型进行模型微调,获得所述相应任务的数据模型。2.根据权利要求1所述的方法,其特征在于,所述对多种所述客户数据进行数据处理,获得对应的多种样本数据之前,包括:调用数据转换器采用对应的数据转换模板,将多种所述客户数据转换为统一的标准存储数据格式;调用标准客户数据存储器将标准存储数据格式的多种所述客户数据按照存储策略进行集中存储;所述对多种所述客户数据进行数据处理包括以下至少一种:数据清洗、数据预处理、数据增广。3.根据权利要求2所述的方法,其特征在于,所述数据增广包括以下至少一种:对所述客户数据中连续变化的字段添加随机噪声;对所述客户数据中相应字段添加字段级随机掩码;对所述客户数据中相应组别的字段添加字段组级随机掩码;将所述客户数据的字段组间的顺序进行随机打乱;采用随机变量对所述客户数据进行随机截断并进行拼接;采用随机变量将不同的所述客户数据进行混合;将添加字段级随机掩码或字段组级随机掩码的所述客户数据输入神经网络,生成数据副本;将同一客户的所述客户数据进行时序打乱后合并;将同一客户的所述客户数据进行时序翻转;将不同客户的所述客户数据进行时序拼接。4.根据权利要求1至3任一项所述的方法,其特征在于,所述客户数据为银行客户数据,多种所述样本数据包括行内客户正样本数据、行内客户负样本数据、行内客户时空正样本数据、行内客户时空负样本数据、跨行客户正样本数据、以及跨行客户负样本数据,所述客户响应数据包括客户标签数据、客户时序标签数据、以及客户空间标签数据。5.根据权利要求4所述的方法,其特征在于,所述行内客户正样本数据是第一锚点与所述第一锚点增广处理后的数据对,其中,所述第一锚点为同一家银行内部某一个时间点的客户数据;所述行内客户负样本数据是所述第一锚点与同一家银行内部同一个时间点不同客户的客户数据对;所述行内客户时空正样本数据是第二锚点与所述第二锚点临近时空的快照数据对,其中,所述第二锚点为同一家银行内部某一个时间段的客户数据;所述行内客户时空负样本数据是所述第二锚点与同一家银行不同客户的客户数据对;
所述跨行客户正样本数据是第三锚点与其他银行内部的同一个客户的客户数据对,其中,所述第三锚点为同一家银行内部某一个时间段的客户数据;所述跨行客户负样本数据是所述第三锚点与其他银行内部的不同客户的客户数据对。6.根据权利要求4所述的方法,其特征在于,所述将多种所述样本数据输入深度神经网络进行训练,获得通用客户数据编码模型,包括:初始化所述深度神经网络的网络参数;将所述行内客户正样本数据以及所述行内客户负样本数据输入所述深度神经网络进行训练,获得所述通用客户数据编码模型;所述对所述通用客户数据编码模型进行模型后处理,包括:将所述通用客户数据编码模型中的投影头丢弃;采用客户标签数据对所述通用客户数据编码模型进行分类任务训练,对所述通用客户数据编码模型进行finetune;对finetune后的所述通用客户数据编码模型进行蒸馏;所述在处理后的所述通用客户数据编码模型上增加分类器,并将相应任务的客户响应数据输入所述通用客户数据编码模型进行模型微调,获得所述相应任务的数据模型,包括;在蒸馏后的所述通用客户数据编码模型上添加两层分类头;将所述客户标签数据输入所述通用客户数据编码模型进行分类任务训练,对所述通用客户数据编码模型进行微调,获得所述相应任务的数据模型。7.根据权利要求4所述的方法,其特征在于,所述将多种所述样本数据输入深度神经网络进行训练,获得通用客户数据编码模型,包括:初始化所述深度神经网络的网络参数;将所述行内客户时空正样本数据以及所述行内客户时空负样本数据输入所述深度神经网络进行训练,获得所述通用客户数据编码模型;所述对所述通用客户数据编码模型进行模型后处理,包括:将所述通用客户数据编码模型中的投影头丢弃;采用客户时序标签数据对所述通用客户数据编码模型进行回归任务训练,对所述通用客户数据编码模型进行finetune;对finetune后的所述通用客户数据编码模型进行蒸馏;所述在处理后的所述通用客户数据编码模型上增加分类器,并将相应任务的客户响应数据输入所述通用客户数据编码模型进行模型微调,获得所述相应任务的数据模型,包括;在蒸馏后的所述通用客户数据编码模型上添加两层分类头;将所述客户相应任务数据输入所述通用客户数据编码模型进行对应任务训练,对所述通用客户数据编码模型进行微调,获得所述相应任务的数据模型。8.根据权利要求4所述的方法,其特征在于,所述将多种所述样本数据输入深度神经网络进行训练,获得通用客户数据编码模型,包括:初始化所述深度神经网络的网络参数;将所述跨行客户正样本数据以及所述跨行客户负样本数据输入所述深度神经网络进行训练,获得所述通用客户数据编码模型;所述对所述通用客户数据编码模型进行模型后处理,包括:
将所述通用客户数据编码模型中的投影头丢弃;采用客户空间标签数据对所述通用客户数据编码模型进行分类任务训练,对所述通用客户数据编码模型进行finetune;对finetune后的所述通用客户数据编码模型进行蒸馏;所述在处理后的所述通用客户数据编码模型上增加分类器,并将相应任务的客户响应数据输入所述通用客户数据编码模型进行模型微调,获得所述相应任务的数据模型,包括;在蒸馏后的所述通用客户数据编码模型上添加两层分类头;将所述客户相应任务数据输入所述通用客户数据编码模型进行对应任务训练,对所述通用客户数据编码模型进行微调,获得所述相应任务的数据模型。9.一种数据模型的调用方法,其特征在于,所述数据模型为根据如权利要求1至8中任一项所述的数据模型的生成方法生成,所述数据模型的调用方法包括:获取待编码客户数据;将所述待编码客户数据转换为统一的标准存储数据格式;将标准存储数据格式的所述待编码客户数据输入数据模型,输出编码后的客户表征数据。10.一种数据模型处理装置,其特征在于,所述数据模型处理装置包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如权利要求1至8中任一项所述的数据模型的生成方法,或实现如权利要求9所述的数据模型的调用方法。11.一种计算机设备,其特征在于,所述计算机设备包括如权利要求10所述的数据模型处理装置。12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至8中任一项所述的数据模型的生成方法,或实现如权利要求9所述的数据模型的调用方法。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1