一种人群分类的标注方法、装置、计算机设备及存储介质与流程

文档序号:35927929发布日期:2023-11-04 21:57阅读:30来源:国知局
一种人群分类的标注方法、装置、计算机设备及存储介质与流程

本发明涉及数据处理领域,尤其涉及一种人群分类的标注方法、装置、计算机设备及存储介质。


背景技术:

1、在进行用户画像分析时,通常会采用标签圈选或者sql(全称为structured querylanguage)语句圈选对不同的人群进行圈选,从而进行人群分类,以便后续依据人群分类分析出不同的用户画像。

2、由于sql语句圈选时,往往需要开发人员编写对应的sql查询语句,进而通过该sql查询语句对数据库中的数据进行查询操作,从而得出sql语句圈选出的人群。因此,sql查询语句执行性能将影响人群分类的效率,从而影响用户画像分析的效率。


技术实现思路

1、本发明实施例提供一种人群分类的标注方法、装置、计算机设备及存储介质,以解决sql查询语句的执行性能影响人群分类效率的问题。

2、一种人群分类的标注方法,包括:

3、获取预期圈选人群的第一查询语句;

4、执行所述第一查询语句,并记录执行时长;

5、当所述执行时长超出预期时长时,则新增所述第一查询语句对应的分类标签和标签筛选条件;

6、在待圈选人群中,筛选出符合所述标签筛选条件的待标注人群;

7、在所述待标注人群上,标注所述分类标签。

8、在一种可能的设计中,所述记录执行时长,包括:

9、记录所述第一查询语句的开始执行时间;

10、记录所述第一查询语句的结束执行时间;

11、将所述结束执行时间与所述开始执行时间相减,得出所述执行时长。

12、在一种可能的设计中,所述执行所述第一查询语句,并记录执行时长之后,所述方法还包括:

13、创建预期时间段对应的存储分区表;

14、在所述预期时间段内执行所述第一查询语句,得出执行结果对应的圈选人群;

15、将所述圈选人群、所述圈选人群对应的执行时长存储在所述存储分区表中。

16、在一种可能的设计中,所述在所述预期时间段内执行所述第一查询语句,得出执行结果对应的圈选人群之后,所述方法还包括:

17、标记所述圈选人群的版本,得到人群版本号。

18、在一种可能的设计中,所述当所述执行时长超出预期时长时,则新增所述第一查询语句对应的分类标签和标签筛选条件中,包括:

19、在所述预期时间段内,获取所述执行时长超出所述预期时长的次数,得到所述第一查询语句的超时次数;

20、若所述超时次数达到预期次数,则新增所述分类标签和标签筛选条件。

21、在一种可能的设计中,所述新增所述第一查询语句对应的分类标签和标签筛选条件之前,所述方法还包括:

22、生成包含所述第一查询语句的预警邮件;

23、向预设邮箱发送所述预警邮件。

24、在一种可能的设计中,所述生成包含所述第一查询语句的预警邮件之前,所述方法还包括:

25、检测所述第一查询语句是否符合预期编写规范;

26、若不符合所述预期编写规范,则获取修改后的第二查询语句,并重新判断所述第二查询语句的执行时长是否超出所述预期时长。

27、一种人群分类的标注装置,包括:

28、获取模块,用于获取预期圈选人群的第一查询语句;

29、执行模块,用于执行所述第一查询语句,并记录执行时长;

30、新增模块,用于当所述执行时长超出预期时长时,则新增所述第一查询语句对应的分类标签和标签筛选条件;

31、筛选模块,用于在待圈选人群中,筛选出符合所述标签筛选条件的待标注人群;

32、标注模块,用于在所述待标注人群上,标注所述分类标签。

33、一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述人群分类的标注方法的步骤。

34、一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述人群分类的标注方法的步骤。

35、上述人群分类的标注方法、装置、计算机设备及存储介质,通过获取预期圈选人群的第一查询语句;执行第一查询语句,并记录执行时长;当执行时长超出预期时长时,则新增第一查询语句对应的分类标签和标签筛选条件;在待圈选人群中,筛选出符合标签筛选条件的待标注人群;在待标注人群上,标注分类标签。该方法将执行时长大于预期时长的第一查询语句对应出分类标签,在后续的人群分类中,可以直接依据分类标签,对待圈选人群进行筛选,然后直接标注该分类标签,有效改善了第一查询语句的执行性能影响人群分类的效率问题,进而提升了用户画像分析的效率。



技术特征:

1.一种人群分类的标注方法,其特征在于,包括:

2.如权利要求1所述人群分类的标注方法,其特征在于,所述记录执行时长,包括:

3.如权利要求1所述人群分类的标注方法,其特征在于,所述执行所述第一查询语句,并记录执行时长之后,所述方法还包括:

4.如权利要求3所述用户画像的分析方法,其特征在于,所述在所述预期时间段内执行所述第一查询语句,得出执行结果对应的圈选人群之后,所述方法还包括:

5.如权利要求3所述用户画像的分析方法,其特征在于,所述当所述执行时长超出预期时长时,则新增所述第一查询语句对应的分类标签和标签筛选条件中,包括:

6.如权利要求1所述用户画像的分析方法,其特征在于,所述新增所述第一查询语句对应的分类标签和标签筛选条件之前,所述方法还包括:

7.如权利要求6所述用户画像的分析方法,其特征在于,所述生成包含所述第一查询语句的预警邮件之前,所述方法还包括:

8.一种人群分类的标注装置,其特征在于,包括:

9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述人群分类的标注方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述人群分类的标注方法的步骤。


技术总结
本发明公开了一种人群分类的标注方法、装置、计算机设备及存储介质,以解决SQL查询语句的执行性能影响人群分类效率的问题。该方法包括:获取预期圈选人群的第一查询语句;执行所述第一查询语句,并记录执行时长;当所述执行时长超出预期时长时,则新增所述第一查询语句对应的分类标签和标签筛选条件;在待圈选人群中,筛选出符合所述标签筛选条件的待标注人群;在所述待标注人群上,标注所述分类标签。

技术研发人员:余辉
受保护的技术使用者:深圳市酷开网络科技股份有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1