离线特征分析方法、装置、计算机设备和存储介质与流程

文档序号:36417767发布日期:2023-12-20 00:00阅读:52来源:国知局
离线特征分析方法与流程

本申请涉及数据处理,特别是涉及一种离线特征分析方法、装置、计算机设备和存储介质。


背景技术:

1、随着数字化、大数据、云计算和人工智能的不断发展,在创建数据模型和训练过程中将用到用户多维度的原始业务数据,通过原始业务数据加工而成的信息被称为特征。然而,传统的离线特征分析方法,由于业务人员需要在离线服务平台中手动操作和维护,存在特征分析准确性和时效性较低等问题。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提高特征分析的准确性和时效性的离线特征分析方法、装置、计算机设备和存储介质。

2、第一方面,提供一种离线特征分析方法,上述方法包括:

3、响应于接收到离线任务数据集,对离线服务样本表进行拆分处理,得到对应的拆分样本表;其中,离线任务数据集包括离线任务类型和离线服务样本表;

4、响应于对待查询特征的选择操作,根据待查询特征对各拆分样本表中的离线样本所对应的离线样本数据集进行查询,得到对应的离线样本的特征查询结果;

5、将各特征查询结果输入至预先配置好的离线任务类型对应的特征分析模型,得到对应的特征分析结果;

6、将各特征查询结果和对应的特征分析结果进行合并处理,生成离线特征分析结果统计表。

7、在其中一个实施例中,上述方法还包括:

8、获取离线服务平台输出的初始离线服务样本表、样本数据中心输出的离线样本服务数据和特征分析平台所储存的本地文件;

9、对初始离线服务样本表、离线样本服务数据和本地文件进行数据处理,生成离线服务样本表;其中,数据处理包括数据清洗处理和数据格式转换处理。

10、在其中一个实施例中,对离线服务样本表进行拆分处理,得到对应的拆分样本表,包括:

11、响应于对样本拆分参数的设置操作,根据样本拆分参数生成样本拆分规则;其中,样本拆分参数包括样本切片时间;

12、根据样本拆分规则对离线服务样本表进行拆分处理,得到对应的拆分样本表。

13、在其中一个实施例中,离线任务数据集包括离线任务执行方式;根据待查询特征对各拆分样本表中的离线样本所对应的离线样本数据集进行查询,得到对应的离线样本的特征查询结果,包括:

14、响应于离线任务执行方式为异步任务操作,对各拆分样本表中的离线样本所对应的离线样本数据集进行异步任务等待主动查询,得到对应的离线样本的特征查询结果。

15、在其中一个实施例中,根据待查询特征对各拆分样本表中的离线样本所对应的离线样本数据集进行查询,得到对应的离线样本的特征查询结果,还包括:

16、响应于离线任务执行方式为同步任务操作,对各拆分样本表中的离线样本所对应的离线样本数据集进行同步任务等待主动轮询,得到对应的离线样本的特征查询结果。

17、在其中一个实施例中,特征查询结果包括样本身份识别数据和样本个人特征数据;特征分析结果包括样本行为特征。

18、在其中一个实施例中,上述方法包括:

19、将离线特征分析结果统计表输出至样本数据中心,以使样本数据中心存储离线特征分析结果统计表。

20、第二方面,提供了一种离线特征分析装置,所述装置包括样本拆分模块、特征查询模块、特征分析模块和结果统计模块。

21、其中,样本拆分模块用于响应于接收到离线任务数据集,根据预设切片时间对离线服务样本表进行拆分处理,得到对应的拆分样本表;其中,离线任务数据集包括离线任务类型和离线服务样本表;特征查询模块用于响应于对待查询特征的选择操作,根据待查询特征对各拆分样本表中的离线样本所对应的离线样本数据集进行查询,得到对应的离线样本的特征查询结果;特征分析模块用于将各特征查询结果输入至预先配置好的离线任务类型对应的特征分析模型,得到对应的特征分析结果;结果统计模块用于将各特征查询结果和对应的特征分析结果进行合并处理,生成离线特征分析结果统计表。

22、第三方面,提供了一种计算机设备,该计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行所述计算机程序时实现上述方法实施例中任一方法的步骤。

23、第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中任一方法的步骤。

24、上述离线特征分析方法、装置、计算机设备和存储介质,响应于接收到离线任务数据集,对离线服务样本表进行拆分处理,得到对应的拆分样本表;其中,离线任务数据集包括离线任务类型和离线服务样本表;而后,响应于对待查询特征的选择操作,根据待查询特征对各拆分样本表中的离线样本所对应的离线样本数据集进行查询,得到对应的离线样本的特征查询结果;接着,将各特征查询结果输入至预先配置好的离线任务类型对应的特征分析模型,得到对应的特征分析结果;最后,将各特征查询结果和对应的特征分析结果进行合并处理,生成离线特征分析结果统计表,从而提供了特征口径统一的离线特征分析服务,提高了离线特征分析的准确性和时效性。



技术特征:

1.一种离线特征分析方法,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1所述的方法,其特征在于,所述对离线服务样本表进行拆分处理,得到对应的拆分样本表,包括:

4.根据权利要求1所述的方法,其特征在于,所述离线任务数据集包括离线任务执行方式;所述根据所述待查询特征对各所述拆分样本表中的离线样本所对应的离线样本数据集进行查询,得到对应的所述离线样本的特征查询结果,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据所述待查询特征对各所述拆分样本表中的离线样本所对应的离线样本数据集进行查询,得到对应的所述离线样本的特征查询结果,还包括:

6.根据权利要求1所述的方法,其特征在于,所述特征查询结果包括样本身份识别数据和样本个人特征数据;所述特征分析结果包括样本行为特征。

7.根据权利要求1所述的方法,其特征在于,所述方法包括:

8.一种离线特征分析装置,其特征在于,所述装置包括:

9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。


技术总结
本申请涉及一种离线特征分析方法、装置、计算机设备和存储介质。所述方法包括:响应于接收到离线任务数据集,对离线服务样本表进行拆分处理,得到对应的拆分样本表;其中,离线任务数据集包括离线任务类型和离线服务样本表;响应于对待查询特征的选择操作,根据待查询特征对各拆分样本表中的离线样本所对应的离线样本数据集进行查询,得到对应的离线样本的特征查询结果;将各特征查询结果输入至预先配置好的离线任务类型对应的特征分析模型,得到对应的特征分析结果;将各特征查询结果和对应的特征分析结果进行合并处理,生成离线特征分析结果统计表。采用本方法能够提高特征分析的准确性和时效性。

技术研发人员:王涛涛,朱玮,余以召
受保护的技术使用者:上海数禾信息科技有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1