数据分析方法、装置、电子设备及可读存储介质与流程

文档序号:18218896发布日期:2019-07-19 22:51阅读:172来源:国知局
数据分析方法、装置、电子设备及可读存储介质与流程

本公开涉及计算机应用技术领域,具体涉及一种数据分析方法、装置、电子设备及可读存储介质。



背景技术:

在互联网快速发展的时代,互联网企业的运营者会开发出各种模型以实现相应的功能,例如:外卖行业的运营者会开发出各种模型用于外卖行业的智能调度、排序或推荐等场景。在提出本发明的过程中,发明人发现,当互联网企业的运营者开发出一个新模型时,往往不经过小流量试验而是直接应用于线上,凭借经验判断该新模型的应用效果。

上述方法存在以下缺陷:首先,新模型直接应用于线上,风险较大,特别是当该新模型是一个失败的模型的时候,会直接导致丢失部分客户;其次,凭借经验判断新模型的应用效果较为主观,容易出现错误且效率低下。因此,将新模型进行线上小流量试验,并对该新模型进行效果分析是亟待解决的问题。



技术实现要素:

为了解决相关技术中的问题,本公开实施例提供一种数据分析方法、装置、电子设备及可读存储介质。

第一方面,本公开实施例中提供了一种数据分析方法。

具体地,所述数据分析方法,包括:

根据多个对象各自的标识信息计算所述对象相应的哈希值,所述对象包括用户或用户设备;

根据所述哈希值将所述多个对象分组;

对各个对象分组应用不同模型;

获取对所述各个对象分组应用相应模型得到的测试结果。

结合第一方面,本公开在第一方面的第一种实现方式中,所述获取对所述各个对象分组应用相应模型得到的测试结果,包括:

针对所述各个对象分组中的对象进行埋点;

在对所述各个对象分组中的对象应用相应模型之后,获取所述各个对象分组中的对象的埋点日志;

根据所述埋点日志确定对所述各个对象分组应用相应模型得到的测试结果。

结合第一方面,本公开在第一方面的第二种实现方式中,所述方法还包括对所述测试结果进行可视化展示。

结合第一方面的第二种实现方式,本公开在第一方面的第三种实现方式中,对所述测试结果进行可视化展示,包括通过以下任意一种或多种方式对所述测试结果进行可视化展示:表格、曲线图、柱形图。

结合第一方面,本公开在第一方面的第四种实现方式中,所述根据所述哈希值将所述多个对象分组,包括:

根据所述哈希值将所述多个对象分为n份,n≥2;

将所述n份分为所述多个对象分组。

结合第一方面的第四种实现方式,本公开在第一方面的第五种实现方式中,所述根据所述哈希值将所述多个对象分为n份,包括根据所述哈希值除以n所得的余数,将所述多个对象分为n份。

结合第一方面,本公开在第一方面的第六种实现方式中,所述对各个对象分组应用不同模型,包括对第一对象分组应用新模型,对第二对象分组应用旧模型,所述第一对象分组的对象数量少于所述第二对象分组的对象数量;

在所述新模型的测试结果优于所述旧模型的测试结果的情况下,对第三对象分组应用所述新模型,所述第三对象分组的对象数量多于所述第一对象分组的对象数量。

结合第一方面的第六种实现方式,本公开在第一方面的第七种实现方式中,所述第一对象分组与所述第三对象分组至少包括部分相同对象;或者所述第一对象分组与所述第三对象分组不包括相同对象。

结合第一方面的第六种实现方式,本公开在第一方面的第八种实现方式中,根据所述新模型的测试结果相比于所述旧模型的测试结果的提升程度,确定所述第三对象分组的对象数量;

所述提升程度越大,所述第三对象分组的对象数量越多。

结合第一方面,本公开在第一方面的第九种实现方式中,所述多个对象基于以下至少一项属性而属于相同类别:城市、年龄、性别、职业、工作地址、居住地址、浏览习惯、消费习惯。

第二方面,本公开实施例中提供了一种数据分析装置。

具体地,所述数据分析装置,包括:

计算模块,被配置为根据多个对象各自的标识信息计算所述对象相应的哈希值,所述对象包括用户或用户设备;

分组模块,被配置为根据所述哈希值将所述多个对象分组;

应用模块,被配置为对各个对象分组应用不同模型;

获取模块,被配置为获取对所述各个对象分组应用相应模型得到的测试结果。

结合第二方面,本公开在第二方面的第一种实现方式中,所述获取对所述各个对象分组应用相应模型得到的测试结果,包括:

针对所述各个对象分组中的对象进行埋点;

在对所述各个对象分组中的对象应用相应模型之后,获取所述各个对象分组中的对象的埋点日志;

根据所述埋点日志确定对所述各个对象分组应用相应模型得到的测试结果。

结合第二方面,本公开在第二方面的第二种实现方式中,还包括展示模块,被配置为:

对所述测试结果进行可视化展示。

结合第二方面的第二种实现方式,本公开在第二方面的第三种实现方式中,对所述测试结果进行可视化展示,包括通过以下任意一种或多种方式对所述测试结果进行可视化展示:表格、曲线图、柱形图。

结合第二方面,本公开在第二方面的第四种实现方式中,所述根据所述哈希值将所述多个对象分组,包括:

根据所述哈希值将所述多个对象分为n份,n≥2;

将所述n份分为所述多个对象分组。

结合第二方面的第四种实现方式,本公开在第二方面的第五种实现方式中,所述根据所述哈希值将所述多个对象分为n份,包括根据所述哈希值除以n所得的余数,将所述多个对象分为n份。

结合第二方面,本公开在第二方面的第六种实现方式中,所述对各个对象分组应用不同模型,包括对第一对象分组应用新模型,对第二对象分组应用旧模型,所述第一对象分组的对象数量少于所述第二对象分组的对象数量;

在所述新模型的测试结果优于所述旧模型的测试结果的情况下,对第三对象分组应用所述新模型,所述第三对象分组的对象数量多于所述第一对象分组的对象数量。

结合第二方面的第六种实现方式,本公开在第二方面的第七种实现方式中,所述第一对象分组与所述第三对象分组至少包括部分相同对象;或者所述第一对象分组与所述第三对象分组不包括相同对象。

结合第二方面的第六种实现方式,本公开在第二方面的第八种实现方式中,根据所述新模型的测试结果相比于所述旧模型的测试结果的提升程度,确定所述第三对象分组的对象数量;

所述提升程度越大,所述第三对象分组的对象数量越多。

结合第二方面,本公开在第二方面的第九种实现方式中,所述多个对象基于以下至少一项属性而属于相同类别:城市、年龄、性别、职业、工作地址、居住地址、浏览习惯、消费习惯。

第三方面,本公开实施例提供了一种电子设备,包括存储器和处理器,其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现以下方法步骤:

根据多个对象各自的标识信息计算所述对象相应的哈希值,所述对象包括用户或用户设备;

根据所述哈希值将所述多个对象分组;

对各个对象分组应用不同模型;

获取对所述各个对象分组应用相应模型得到的测试结果。

结合第三方面,本公开在第三方面的第一种实现方式中,所述获取对所述各个对象分组应用相应模型得到的测试结果,包括:

针对所述各个对象分组中的对象进行埋点;

在对所述各个对象分组中的对象应用相应模型之后,获取所述各个对象分组中的对象的埋点日志;

根据所述埋点日志确定对所述各个对象分组应用相应模型得到的测试结果。

结合第三方面,本公开在第三方面的第二种实现方式中,所述一条或多条计算机指令还被所述处理器执行以实现以下方法步骤:

对所述测试结果进行可视化展示。

结合第三方面的第二种实现方式,本公开在第三方面的第三种实现方式中,对所述测试结果进行可视化展示,包括通过以下任意一种或多种方式对所述测试结果进行可视化展示:表格、曲线图、柱形图。

结合第三方面,本公开在第三方面的第四种实现方式中,所述根据所述哈希值将所述多个对象分组,包括:

根据所述哈希值将所述多个对象分为n份,n≥2;

将所述n份分为所述多个对象分组。

结合第三方面的第四种实现方式,本公开在第三方面的第五种实现方式中,所述根据所述哈希值将所述多个对象分为n份,包括根据所述哈希值除以n所得的余数,将所述多个对象分为n份。

结合第三方面,本公开在第三方面的第六种实现方式中,所述对各个对象分组应用不同模型,包括对第一对象分组应用新模型,对第二对象分组应用旧模型,所述第一对象分组的对象数量少于所述第二对象分组的对象数量;

在所述新模型的测试结果优于所述旧模型的测试结果的情况下,对第三对象分组应用所述新模型,所述第三对象分组的对象数量多于所述第一对象分组的对象数量。

结合第三方面的第六种实现方式,本公开在第三方面的第七种实现方式中,所述第一对象分组与所述第三对象分组至少包括部分相同对象;或者所述第一对象分组与所述第三对象分组不包括相同对象。

结合第三方面的第六种实现方式,本公开在第三方面的第八种实现方式中,根据所述新模型的测试结果相比于所述旧模型的测试结果的提升程度,确定所述第三对象分组的对象数量;

所述提升程度越大,所述第三对象分组的对象数量越多。

结合第三方面,本公开在第三方面的第九种实现方式中,所述多个对象基于以下至少一项属性而属于相同类别:城市、年龄、性别、职业、工作地址、居住地址、浏览习惯、消费习惯。

第四方面,本公开实施例中提供了一种可读存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现如第一方面、第一方面的第一种实现方式至第九种实现方式任一项所述的方法。

本公开实施例提供的技术方案可以包括以下有益效果:

根据本公开实施例提供的技术方案,通过将新模型进行线上小流量实验,避免了将新模型直接应用于线上所产生的较大风险,同时,根据哈希值将多个对象进行自动化分组并对各个对象分组应用不同模型,分配方式更为随机和客观,减少了主观因素对模型效果评价的影响,并且提高了模型的测试效率。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

结合附图,通过以下非限制性实施方式的详细描述,本公开的其它特征、目的和优点将变得更加明显。在附图中:

图1示出根据本公开的实施例的数据分析方法的流程图;

图2示出根据本公开的实施例的获取对各个对象分组应用相应模型得到的测试结果的流程图;

图3a示出根据本公开的实施例的测试结果可视化展示的表格示意图;

图3b示出根据本公开的实施例的测试结果可视化展示的曲线图示意图;

图4示出根据本公开的实施例对多个对象分组的流程图;

图5示出根据本公开的实施例的数据分析装置的结构框图;

图6示出根据本公开的实施例的电子设备的结构框图;

图7示出适于用来实现根据本公开实施例的数据分析方法的计算机系统的结构示意图。

具体实施方式

下文中,将参考附图详细描述本公开的示例性实施例,以使本领域技术人员可容易地实现它们。此外,为了清楚起见,在附图中省略了与描述示例性实施例无关的部分。

在本公开中,应理解,诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不欲排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。

另外还需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。

图1示出根据本公开的实施例的数据分析方法的流程图。如图1所示,所述数据分析方法包括以下步骤s101-s104:

在步骤s101中,根据多个对象各自的标识信息计算所述对象相应的哈希值,所述对象包括用户或用户设备;

在步骤s102中,根据所述哈希值将所述多个对象分组;

在步骤s103中,对各个对象分组应用不同模型;

在步骤s104中,获取对所述各个对象分组应用相应模型得到的测试结果。

根据本公开的实施例,对象包括用户或用户设备,对象各自的标识可以包括用户唯一标识或用户设备唯一标识。对象各自的标识可以包括数字、字母、汉字或特殊符号中的任意一种或其任意组合,在本公开对此不作具体限定。通过对象的标识信息可以唯一地识别该对象。根据多个对象各自的标识信息计算所述对象相应的哈希值,例如可以采用安全哈希算法或使用信息-摘要算法,只要可以实现将对象各自的标识转化为哈希值的哈希算法均可,本公开对计算哈希值的哈希算法不作具体限定。

当确定了待测试的模型后,可以将这些待测试的不同模型应用于多个对象以测试模型的效果。根据本公开的实施例,可以根据待测试模型的个数将多个对象分组。例如,假设待测试模型的数量为5个,则可以将所述多个对象分成5组,以分别测试这5个模型。

根据测试需要,可以设置每个模型的分流比,即应用每个模型的对象数量的比例。例如,对于新模型,可以先设置较小的分流比,根据测试结果调整其分流比。对于测试结果较好的新模型,可以增大其分流比以测试针对更多对象的效果。

根据每个模型的分流比,可以相应地设置每个对象分组中的对象的数量。例如,假设待测试的模型为a1模型和a2模型,且a1模型和a2模型的分流比相同,则可以根据哈希值将所述多个对象平均分成a1组和a2组,对a1组中的多个对象应用a1模型,对a2组中的多个对象应用a2模型,也可以对a2组中的多个对象应用a1模型,对a1组中的多个对象应用a2模型。或者,假设待测试的模型为模型m1和模型m2,且模型m1和模型m2的分流比为9:1,则可以根据哈希值将所述多个对象按照分流比分成m1组和m2组,其中,m1组中对象占比为对象总数的90%,m2组中对象占比为对象总数的10%,可以对m1组中的多个对象应用模型m1,对m2组中的多个对象应用模型m2。

将不同模型应用于相应对象分组之后,可以获取不同模型的测试结果。根据本公开的实施例,针对不同模型,对象的曝光(例如,商品或商家被用户浏览或在用户设备上展示)、点击或下单等行为的操作信息均可以以埋点日志文件的形式保存下来,通过分析不同模型的埋点日志文件,就可以获取相应模型的测试结果。本公开实施例对模型测试结果的评价指标不做具体限定,例如,在外卖行业,评价指标可以包括曝光人数、点击人数、下单人数、单数、点击率、店内转化率、曝光转化率、点击转化率、整体转化率、投资回报率、平均客单价和总流水中的一项或多项,或者可以按照需求对不同评价指标设置不同的权重,例如下单人数和单数的权重高于曝光人数和点击人数的权重。

图2示出根据本公开的实施例的获取对各个对象分组应用相应模型得到的测试结果的流程图。如图2所示,获取对各个对象分组应用相应模型得到的测试结果包括以下步骤s201–s203:

在步骤s201中,针对所述各个对象分组中的对象进行埋点;

在步骤s202中,在对所述各个对象分组中的对象应用相应模型之后,获取所述各个对象分组中的对象的埋点日志;

在步骤s203中,根据所述埋点日志确定对所述各个对象分组应用相应模型得到的测试结果。

根据本公开的实施例,可以针对不同对象分组中的每个对象进行埋点,本公开对埋点的实现方式不作具体限定,例如,埋点可以通过javascript方法收集对象的操作信息,操作信息可以是对象的曝光、点击或下单等行为,当对象执行操作时,服务器记录相应的操作信息,这些操作信息均以埋点日志的形式保存下来。例如,对象打开推荐页面并点击某个被推荐的商家,但是没有下单,则服务器在该对象的埋点日志中记录对象的曝光和点击操作。

在对各个对象分组中的对象应用相应模型之后,可以获取各个对象分组中的对象的埋点日志,通过统计埋点日志确定对各个对象分组应用相应模型得到的测试结果。例如,通过埋点日志可以获取模型e1的曝光人数为12509、点击人数为9007、下单人数为4631、单数为4957,从而计算出点击率为72%(点击人数/曝光人数)和店内转化率为51.42%(下单人数/点击人数)等评价指标;获取模型e2的曝光人数为29026、点击人数为20691、下单人数为10896、单数为11639,从而计算出点击率为71.28%和店内转化率为52.66%等评价指标,通过对比上述评价指标就可以获知模型e1和e2的测试效果。

根据本公开的实施例,所述数据分析方法还包括对所述测试结果进行可视化展示。

为了更直观地展示不同模型的测试结果,例如展示不同模型的测试结果之间的对比结果,在本公开的实施例中,可以对测试结果进行可视化展示,通过可视化展示可以更直观的了解模型的变化趋势及不同模型之间的对比效果。

根据本公开的实施例,对所述测试结果进行可视化展示,包括通过以下任意一种或多种方式对所述测试结果进行可视化展示:表格、曲线图、柱形图。

不同的可视化展示方式具有不同的效果,在本公开实施例中,可以选择其中一种方式对测试结果进行可视化展示,也可以选择多种方式对测试结果进行可视化展示,例如:表格可以了解评价指标的具体数值,曲线图可以了解评价指标随着时间的变化趋势。

下面参考图3a和图3b具体说明根据本公开实施例的测试结果可视化展示的示例性过程。假设有b1模型和b2模型,且b1模型的分流比为30%,b2模型的分流比为70%。

图3a示出根据本公开的实施例的测试结果可视化展示的表格示意图。如图3a所示,以表格方式展示了b1模型和b2模型的测试结果,其中,曝光人数、点击人数、下单人数和单数可以通过埋点日志方式获取,其他评价指标可以通过计算获取,例如,点击率=点击人数/曝光人数、店内转化率=下单人数/点击人数、曝光转化率=单数/曝光人数、点击转化率=单人/点击人数、整体转化率=下单人数/曝光人数,通过表格可以直观了解b1模型和b2模型的测试结果。同时通过计算对比数据,即(b1模型-b2模型)/b2模型,可以了解b1模型和b2模型的测试对比结果。

图3b示出根据本公开的实施例的测试结果可视化展示的曲线图示意图。如图3b所示,横坐标为时间轴,具体是从2019-01-01到2019-01-05,纵坐标为测试结果的评价指标,例如单数,城市是北京,商圈选择全部商圈,从图3b中可以直观看出b1模型和b2模型的测试结果及之间的对比结果。

根据本公开的实施例,也可以使用柱形图来对测试结果进行可视化展示,例如以不同颜色的柱代表不同模型,柱的高度表示测试结果的数值。

图4示出根据本公开的实施例对多个对象分组的流程图。如图4所示,所述根据所述哈希值将所述多个对象分组包括以下步骤s401–s402:

在步骤s401中,根据所述哈希值将所述多个对象分为n份,n≥2;

在步骤s402中,将所述n份分为所述多个对象分组。

根据本公开的实施例,在根据哈希值将多个对象分组时,可以先根据哈希值多个对象分成n份,再将n份分为多个对象分组。根据本公开的实施例,所述n份的对象数量可以相等,也可以不相等。先根据哈希值多个对象分成n份,再将n份分为多个对象分组,便于动态调整各对象分组的对象数量。例如,当要增加某对象分组的对象数量时,可以对该对象分组增加一份或多份,当要减少某对象分组的对象数量时,可以从该对象分组减少一份或多份。以此方式进行分组,不必在每次调整对象分组的对象数量时进行重新分组,减小了运算和处理负担。

本公开实施例对n的具体取值不做限定。例如,假设n为100,则可以先根据哈希值随机将所述多个对象平均分成100份,再将100份分为多个对象分组。例如,假设模型e1的分流为80%,模型e2的分流为20%,则可以先根据哈希值随机将所述多个对象平均分成100份,对其中的80份应用模型e1,对其中的20份应用模型e2。例如,假设n为10,则可以先根据哈希值随机将多个对象平均分成10份,再将10份分为多个对象分组。例如,假设模型f1和模型f2的分流比为7:3,则可以先根据哈希值随机将多个对象平均分成10份,再对其中的7份应用模型f1,对其中的3份应用模型f2。

根据本公开的实施例,所述根据所述哈希值将所述多个对象分为n份,包括根据所述哈希值除以n所得的余数,将所述多个对象分为n份。例如,可以将余数相同的多个对象作为一份,例如,假设哈希值除以n所得的余数分别为:0,1,2,……,n-2,n-1,则将余数为0的多个对象作为第一份,余数为1的多个对象作为第二份,……,余数为n-1的多个对象作为第n份,从而将多个对象分为n份。

以n取100为例,哈希值除以100所得的余数分别为:0,1,2,……,98,99,则将余数为0的多个对象作为第一份,余数为1的多个对象作为第二份,……,余数为99的多个对象作为第100份,从而实现将多个对象分为100份。

根据本公开的实施例,至少两个对象分组中的对象数量不同;或者至少两个对象分组中的对象数量相同。

根据本公开的实施例,待测试模型可以都为新模型,也可以包括一个或多个新模型和一个或多个旧模型(例如,曾经或正在使用的模型)。当待测模型都为新模型时,若对其分流比没有特殊要求,可以设定所有新模型的分流比均相等,根据哈希值将多个对象进行平均分组,此时,至少两个对象分组中的对象数量相同。例如,假设待测试模型为2个新模型,分别为x1模型和x2模型,根据哈希值可以将多个对象平均分成两组,分别为x1组和x2组,即x1组和x2组中的对象数量相同。

或者,当待测模型包括一个或多个新模型和一个或多个旧模型时,可以先将新模型的流量比设置为低于旧模型的流量比,此时,至少两个对象分组中的对象数量不同。例如,假设待测试的模型为2个模型,分别为旧模型p1和新模型p2,且旧模型p1和新模型p2的分流比为8:2,根据哈希值可以将多个对象按照分流比分成两组,其中,p1组中对象数量为所述多个对象的总数量的80%,p2组中对象数量为所述多个对象的总数量的20%,即p1组和p2组中的对象数量不同。

根据本公开的实施例,所述对各个对象分组应用不同模型,包括对第一对象分组应用新模型,对第二对象分组应用旧模型,所述第一对象分组的对象数量少于所述第二对象分组的对象数量。在所述新模型的测试结果优于所述旧模型的测试结果的情况下,对第三对象分组应用所述新模型,所述第三对象分组的对象数量多于所述第一对象分组的对象数量。

当有新模型上线时,由于还无法预知新模型的应用效果,一般可以先针对对象数量较少的第一对象分组应用新模型,对对象数量较多的第二分组应用旧模型,以减小新模型测试对实际运营的影响。

当新模型的测试结果优于旧模型的测试结果时,说明新模型的应用效果可以优于旧模型,可以逐步扩大新模型的测试对象数量,将对象数量多于第一对象分组的第三对象分组应用于新模型,其中,提高对象分组的对象数量可以通过提高分流比来实现。下面将以外卖行业为例进行解释说明,假设第一对象分组、第二对象分组、第三对象分组的分流分别为10%、60%和30%,但是新模型的平均客单价为32元,旧模型的平均客单价为28元,即新模型的测试结果优于旧模型的测试结果,此时,可以将第三对象分组应用于新模型。

若应用于第三对象分组的新模型测试结果仍旧优于旧模型的测试结果,可以进一步提高应用新模型的对象数量,直至对全部对象应用新模型。

根据本公开的实施例,所述第一对象分组与所述第三对象分组至少包括部分相同对象;或者所述第一对象分组与所述第三对象分组不包括相同对象。

可以在第一对象分组与第三对象分组中设置部分相同对象,例如,可以在第一对象分组的全部或部分对象的基础上,增加新的对象,以得到第三对象分组。这样,可以对相同对象进行重复测试,验证新模型效果,从而排除偶然因素的影响。

或者,第三分组的对象可以完全不同于第一对象分组中的对象。这样,不对相同对象进行重复测试,可以提高测试效率并提升测试结果对于对象的普适性。而且,通过增加被测试的对象数量,也可以减小偶然因素的影响。

根据本公开的实施例,根据所述新模型的测试结果相比于所述旧模型的测试结果的提升程度,确定所述第三对象分组的对象数量,所述提升程度越大,所述第三对象分组的对象数量越多。

在对新模型进行测试时,可以以测试结果为导向,逐步增加应用于新模型的对象数量,即可以根据新模型的测试结果相比于旧模型的测试结果的提升程度,来确定第三对象分组的对象数量,具体地,当新模型的测试结果相比于旧模型的测试结果的提升程度越大,就为第三对象分组分配更多数量的对象。例如:当新模型的测试结果相比于旧模型的测试结果提升了10%,可以将第三对象分组的对象数量相比于第一对象分组增加10%,当新模型的测试结果相比于旧模型的测试结果提升了20%,可以将第三对象分组的对象数量相比于第一对象分组增加20%。

根据本公开的实施例,所述多个对象基于以下至少一项属性而属于相同类别:城市、年龄、性别、职业、工作地址、居住地址、浏览习惯、消费习惯。

针对同一类对象进行模型测试,可以使得测试结果更加准确和具有针对性。例如,某模型可能对于某一类的用户特别有效,而对于另一类的用户效果不明显。例如,增大满减力度对于某些年龄的用户可能相比于对其他年龄的用户更有吸引力;或者,提供某种赠品可能对某个城市的用户相比于对其他城市的用户更有吸引力。如果不对对象进行类型区分,则测试得到的模型效果可能因为对象属性不同而被稀释。当针对同一类用户进行模型测试时,可以得到模型针对不同类型对象的效果,做到因城施策或因对象类别施策,提高决策的针对性和准确度。

图5示出根据本公开的实施例的数据分析装置500的结构框图。其中,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。

如图5所示,所述数据分析装置包括计算模块510、分组模块520、应用模块530和获取模块540。

所述计算模块510被配置为根据多个对象各自的标识信息计算所述对象相应的哈希值,所述对象包括用户或用户设备;

所述分组模块520被配置为根据所述哈希值将所述多个对象分组;

所述应用模块530被配置为对各个对象分组应用不同模型;

所述获取模块540被配置为获取对所述各个对象分组应用相应模型得到的测试结果。

根据本公开的实施例,所述获取对所述各个对象分组应用相应模型得到的测试结果,包括:

针对所述各个对象分组中的对象进行埋点;

在对所述各个对象分组中的对象应用相应模型之后,获取所述各个对象分组中的对象的埋点日志;

根据所述埋点日志确定对所述各个对象分组应用相应模型得到的测试结果。

根据本公开的实施例,所述数据分析装置包括展示模块550,被配置为:对所述测试结果进行可视化展示。

根据本公开的实施例,对所述测试结果进行可视化展示,包括通过以下任意一种或多种方式对所述测试结果进行可视化展示:表格、曲线图、柱形图。

根据本公开的实施例,所述根据所述哈希值将所述多个对象分组,包括:

根据所述哈希值将所述多个对象分为n份,n≥2;

将所述n份分为所述多个对象分组。

根据本公开的实施例,所述根据所述哈希值将所述多个对象分为n份,包括根据所述哈希值除以n所得的余数,将所述多个对象分为n份。

根据本公开的实施例,所述对各个对象分组应用不同模型,包括对第一对象分组应用新模型,对第二对象分组应用旧模型,所述第一对象分组的对象数量少于所述第二对象分组的对象数量;

在所述新模型的测试结果优于所述旧模型的测试结果的情况下,对第三对象分组应用所述新模型,所述第三对象分组的对象数量多于所述第一对象分组的对象数量。

根据本公开的实施例,所述第一对象分组与所述第三对象分组至少包括部分相同对象;或者所述第一对象分组与所述第三对象分组不包括相同对象。

根据本公开的实施例,根据所述新模型的测试结果相比于所述旧模型的测试结果的提升程度,确定所述第三对象分组的对象数量;

所述提升程度越大,所述第三对象分组的对象数量越多。

根据本公开的实施例,所述多个对象基于以下至少一项属性而属于相同类别:城市、年龄、性别、职业、工作地址、居住地址、浏览习惯、消费习惯。

本公开还公开了一种电子设备,图6示出根据本公开的实施例的电子设备的结构框图。

如图6所示,所述电子设备600包括存储器601和处理器602;其中,

所述存储器601用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器602执行以实现以下方法步骤:

根据多个对象各自的标识信息计算所述对象相应的哈希值,所述对象包括用户或用户设备;

根据所述哈希值将所述多个对象分组;

对各个对象分组应用不同模型;

获取对所述各个对象分组应用相应模型得到的测试结果。

根据本公开的实施例,所述获取对所述各个对象分组应用相应模型得到的测试结果,包括:

针对所述各个对象分组中的对象进行埋点;

在对所述各个对象分组中的对象应用相应模型之后,获取所述各个对象分组中的对象的埋点日志;

根据所述埋点日志确定对所述各个对象分组应用相应模型得到的测试结果。

根据本公开的实施例,所述一条或多条计算机指令还被所述处理器执行以实现以下方法步骤:

对所述测试结果进行可视化展示。

根据本公开的实施例,对所述测试结果进行可视化展示,包括通过以下任意一种或多种方式对所述测试结果进行可视化展示:表格、曲线图、柱形图。

根据本公开的实施例,所述根据所述哈希值将所述多个对象分组,包括:

根据所述哈希值将所述多个对象分为n份,n≥2;

将所述n份分为所述多个对象分组。

根据本公开的实施例,所述根据所述哈希值将所述多个对象分为n份,包括根据所述哈希值除以n所得的余数,将所述多个对象分为n份。

根据本公开的实施例,所述对各个对象分组应用不同模型,包括对第一对象分组应用新模型,对第二对象分组应用旧模型,所述第一对象分组的对象数量少于所述第二对象分组的对象数量;

在所述新模型的测试结果优于所述旧模型的测试结果的情况下,对第三对象分组应用所述新模型,所述第三对象分组的对象数量多于所述第一对象分组的对象数量。

根据本公开的实施例,所述第一对象分组与所述第三对象分组至少包括部分相同对象;或者所述第一对象分组与所述第三对象分组不包括相同对象。

根据本公开的实施例,根据所述新模型的测试结果相比于所述旧模型的测试结果的提升程度,确定所述第三对象分组的对象数量;

所述提升程度越大,所述第三对象分组的对象数量越多。

根据本公开的实施例,所述多个对象基于以下至少一项属性而属于相同类别:城市、年龄、性别、职业、工作地址、居住地址、浏览习惯、消费习惯。

图7示出适于用来实现根据本公开实施例的数据分析方法的计算机系统的结构示意图。

如图7所示,计算机系统700包括中央处理单元(cpu)701,其可以根据存储在只读存储器(rom)702中的程序或者从存储部分708加载到随机访问存储器(ram)703中的程序而执行上述实施例中的各种处理。在ram703中,还存储有系统700操作所需的各种程序和数据。cpu701、rom702以及ram703通过总线704彼此相连。输入/输出(i/o)接口707也连接至总线704。

以下部件连接至i/o接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至i/o接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。

特别地,根据本公开的实施例,上文描述的方法可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在及其可读介质上的计算机程序,所述计算机程序包含用于执行上述对象类别确定方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。

附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,路程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过可编程硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。

作为另一方面,本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中的电子设备或计算机系统中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本公开的方法。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1