一种判断潜在客户的方法及装置、电子设备和存储介质与流程

文档序号:20965553发布日期:2020-06-02 22:17阅读:189来源:国知局
一种判断潜在客户的方法及装置、电子设备和存储介质与流程

本申请涉及计算机技术领域,特别涉及一种判断潜在客户的方法及装置、电子设备和计算机可读存储介质。



背景技术:

互联网时代的消费情境相比以往更为丰富,用户可通过公众号、购物平台应用(比如:美团、淘宝、饿了么等)、社交网站等渠道向商家购买商品或服务。如今,许多线下商家也开始通过各类线上渠道向用户推送促销信息,从而提高店铺的客流量。

一般,商家会大面积地向渠道上所有人推送促销信息。然而,这种方式难以确定真正有意愿到店的潜在客户,商家很难预测到店的客户量,也就无法灵活调整促销策略。



技术实现要素:

本申请实施例的目的在于提供一种判断潜在客户的方法,用以判断到店几率高的潜在客户,从而提高促销精确性和有效性。

本申请实施例提供一种判断潜在客户的方法,所述方法包括:

获取设备标识集,所述设备标识集包括多个待分类人员的设备标识;

从特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成特征参数;

将每一设备标识对应的所述特征参数输入至已训练的机器学习模型,通过所述机器学习模型计算所述特征参数,获得与每一设备标识对应的人员类别信息;其中,所述人员类别信息包括潜在客户和非潜在客户。

在一实施例中,所述机器学习模型通过以下方式训练得到:

获取多个正样本标识和多个负样本标识;其中,所述正样本标识为历史到店人员的设备标识,所述负样本标识为未到店人员的设备标识;

从所述特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数;

为所述正样本标识对应的特征参数添加正样本标签,为所述负样本标识对应的特征参数添加负样本标签;其中,所述正样本标签表征潜在客户,所述负样本标签表征非潜在客户;

将多个所述特征参数输入至所述机器学习模型,通过所述机器学习模型对每一特征参数计算出的人员类别信息与该特征参数的正样本标签或负样本标签之间的差异,对所述机器学习模型的模型参数进行训练;

重复所述训练过程,直至所述模型参数满足所述机器学习模型的分类精度要求。

在一实施例中,所述方法还包括:

重新获取多个所述正样本标识和多个所述负样本标识;

从所述特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数;

为所述正样本标识对应的特征参数添加正样本标签,为所述负样本标识对应的特征参数添加负样本标签;

将多个所述特征参数输入至所述机器学习模型,通过所述机器学习模型对每一特征参数计算人员类别信息,并判断所述人员类别信息与该特征参数的正样本标签或负样本标签之间的差异是否满足所述分类精度要求;

如果不满足所述分类精度要求,训练所述模型参数,直至所述模型参数满足所述分类精度要求。

在一实施例中,所述特征参数包括动态系数、距职系数、距住系数、兴趣度系数和天气系数中一种或多种的组合;

所述查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数,包括:

从所述特征匹配库中查找每一设备标识对应的兴趣点访问日志;其中,所述兴趣点访问日志包括多条兴趣点访问记录,每一兴趣点访问记录包括时间戳、兴趣点和兴趣点类别;

筛选出时间戳位于指定时间段内的兴趣点访问记录,从所述兴趣点访问记录统计每一设备标识对应的所述兴趣点的数量和所述兴趣点类别的数量;

基于所述兴趣点的数量和所述兴趣点类别的数量,计算所述设备标识对应的动态系数。

在一实施例中,所述查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数,还包括:

从所述特征匹配库查找每一设备标识对应的工作地坐标和居住地坐标;

基于预设目的地的坐标和每一设备标识对应的工作地坐标,计算该设备标识对应的距职系数;

基于所述目的地的坐标和每一设备标识对应的居住地坐标,计算该设备标识对应的距住系数。

在一实施例中,所述查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数,还包括:

确定预设目的地所属的兴趣点类别,并检查每一设备标识的所述兴趣点访问记录中属于该兴趣点类别的兴趣点的数量,将该数量作为该设备标识对应的兴趣度系数。

在一实施例中,所述依据所述特征信息生成特征参数,包括:

依照预定义的数据格式对所述特征参数进行标准化处理。

本申请实施例还提供了一种判断潜在客户的装置,包括:

获取模块,用于获取设备标识集,所述设备标识集包括多个待分类人员的设备标识;

生成模块,用于从特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成特征参数;

判断模块,用于将每一设备标识对应的所述特征参数输入至已训练的机器学习模型,通过所述机器学习模型计算所述特征参数,获得与每一设备标识对应的人员类别信息;其中,所述人员类别信息包括潜在客户和非潜在客户。

进一步的,本申请实施例还提供了一种电子设备,所述电子设备包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为执行上述判断潜在客户的方法。

进一步的,本申请实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序可由处理器执行以完成上述判断潜在客户的方法。

在本申请实施例的技术方案中,获取设备标识后,从特征匹配库中查找每一设备标识对应的特征信息,并依据特征信息生成特征参数,然后通过已训练的机器学习模型计算特征参数,从而获得与每一设备标识对应的人员类别信息;由于已训练的机器学习模型学习了到店客户的特征参数的内在规律,因此可以准确地基于待分类人员对应的特征参数判断出潜在客户。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍。

图1为本申请一示例性实施例示出判断潜在客户的方法的应用场景示意图;

图2为本申请一示例性实施例的电子设备的结构示意图;

图3为本申请实施例示出的一种判断潜在客户的方法的流程示意图;

图4为本申请实施例示出的一种机器学习模型的训练示意图;

图5为本申请实施例示出的一种判断潜在客户的装置的框图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。

相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

图1为本申请一示例性实施例示出判断潜在客户的方法的应用场景示意图。如图1所示,该应用场景包括服务端30和客户端20,服务端30可以是服务器、服务器集群或者云计算中心,服务端30可依据客户端20发送的人员判断指令提供相应的潜在客户判断服务。客户端20可以是计算机、平板电脑、智能手机等智能设备。

如图2所示,本实施例提供一种电子设备1,包括:至少一个处理器11和存储器12,图2中以一个处理器11为例。处理器11、存储器12和显示载体13通过总线10连接,存储器12存储有可被处理器11执行的指令,指令被处理器11执行,以使电子设备1可执行下述的实施例中方法的全部或部分流程。在一实施例中,电子设备1可以是上述服务端30。

存储器12可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(staticrandomaccessmemory,简称sram),电可擦除可编程只读存储器(electricallyerasableprogrammableread-onlymemory,简称eeprom),可擦除可编程只读存储器(erasableprogrammablereadonlymemory,简称eprom),可编程只读存储器(programmablered-onlymemory,简称prom),只读存储器(read-onlymemory,简称rom),磁存储器,快闪存储器,磁盘或光盘。

本申请还提供了一种计算机可读存储介质,存储介质存储有计算机程序,计算机程序可由处理器11执行以完成本申请提供的判断潜在客户的方法。

图3是本申请实施例提供的判断潜在客户的方法的流程示意图,如图3所示,该方法可以包括以下步骤301-步骤303。

步骤301:获取设备标识集,所述设备标识集包括多个待分类人员的设备标识。

在一实施例中,服务端可以接收客户端发送的人员判断指令,从该人员判断指令中获取设备标识集。设备标识集中的设备标识(deviceid)是注册指定的平台应用或社交网站的用户的设备标识,可以包括imei(internationalmobileequipmentidentity,国际移动设备识别码)和meid/esn(mobileequipmentidentifier/electronicserialnumber,移动设备识别码/电子序列号)。比如:如果商家想通过美团app(application,手机软件)向美团的注册用户推送促销信息,可以将待推送的多个注册用户的设备标识交由本方案中执行判断潜在客户的服务端。

步骤302:从特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成特征参数。

这里的特征匹配库可以是一个或多个数据源,基于具体的实现策略,特征匹配库中可以包括单一或复杂的特征信息。

在一实施例中,上述特征参数可以包括动态系数、距职系数、距住系数、兴趣度系数和天气系数中一种或多种的组合。如果要引入更全面的特征信息以判断一个人是否为潜在客户,还可以从此人的其它特征信息(比如:收入信息、受教育水平)中提取特征参数。

在一实施例中,服务端可以从特征匹配库中查找每一设备标识对应的兴趣点(poi,pointofinterest)访问日志。其中,兴趣点访问日志包括多条兴趣点访问记录,每一兴趣点访问记录包括时间戳、兴趣点和兴趣点类别。兴趣点类别通常包括多级类别,大类别包括多个小类别。如下表1所示,为包含多条兴趣点访问记录的兴趣点访问日志。

表1

本实施例中的兴趣点类别指的是最小级的类别,在表1中为poi小类。

为更准确地依据人员短期活动规律判断其是否为潜在客户,可以筛选出时间戳位于指定时间段内的兴趣点访问记录。比如:商家在七月预备推送促销信息,则可以筛选出时间戳位于六月的兴趣点访问记录,以判断潜在客户。

服务端可以从上述兴趣点访问记录统计每一设备标识对应的兴趣点的数量和兴趣点类别的数量,然后基于该兴趣点的数量和兴趣点类别的数量,计算该设备标识对应的动态系数。在一实施例中,可以通过如下公式(1)来计算动态系数:

其中,f为动态系数,a为兴趣点的数量,b为兴趣点类别的数量。

动态系数可以表示一个人的活动意愿,动态系数越高,说明活动意愿越强,反之,说明活动意愿越弱。

在一实施例中,服务端可以从特征匹配库中查找每一设备标识对应的工作地坐标和居住地坐标。

服务端可以基于预设目的地的坐标和每一设备标识对应的工作地坐标,计算该设备标识对应的距职系数,该距职系数表示工作地与目的地的距离。这里,预设目的地为商家的线下店铺。

服务端可以基于上述目的地的坐标和每一设备标识对应的居住地坐标,计算该设备标识对应的距住系数,该距住系数标识居住地与目的地的距离。

在一实施例中,服务端可以确定预设目的地所述的兴趣点类别,并检查每一设备标识的所述兴趣点访问记录中属于该兴趣点类别的兴趣点数量,将该数量作为该设备标识对应的兴趣度系数。兴趣点系数可表征人员对与目的地的同类地点访问兴趣。

比如:目的地为“学院路的麦颂ktv”,兴趣度类别为“ktv”,可以检查每一设备标识的兴趣度访问记录中属于“ktv”的兴趣点数量,从而确定该设备标识对应的兴趣点系数。

在一实施例中,服务端可以基于预设目的地的坐标,从提供天气预报服务的第三方平台(比如:墨迹天气)获取对应的天气系数。天气系数用以评估目的地的天气状况。

在一实施例中,为避免以多个特征数据库的特征信息生成的特征参数的数据格式不同,以及,为便于后续计算,可以依照预定义的数据格式对上述特征参数进行标准化处理。示例性的,如果特征参数为上述五种系数的组合,可以保存为“设备标识(动态系数、距职系数、距住系数、兴趣度系数和天气系数)”。

在生成对应于每一设备标识的特征参数之后,可以将利用已训练的机器学习模型对上述特征参数进行计算。

在此之前,还需要训练机器学习模型。可以通过如下方式训练机器学习模型:

获取多个正样本标识和多个负样本标识。其中,正样本标识为历史到店人员的设备标识,负样本标识为未到店人员的设备标识。商家可以根据客户到店消费的记录中获取正样本标识。

服务端可以从上述特征匹配库中查找每一设备标识对应的特征信息,并依据特征信息生成特征参数,进而为正样本标识对应的特征参数添加正样本标签,为负样本标识对应的特征参数添加负样本标签。其中,正样本标签表征潜在客户,负样本标签表征非潜在客户。

服务端将多个上述特征参数输入至机器学习模型,通过机器学习模型对每一特征参数计算出的人员类别信息与该特征参数的正样本标签或负样本标签之间的差异,对机器学习模型的模型参数进行训练。

重复训练过程,直至模型参数满足机器学习模型的分类精度要求。

在一实施例中,机器学习模型可以是逻辑回归模型,此时机器学习模型通过逻辑回归算法计算特征参数,而模型参数为逻辑回归算法的参数。

在这种情况下,正样本标签可以是1,负样本标签可以是0。机器学习模型对特征参数计算出的人员类别信息实际上是一个介于0和1之间的数字。在针对每一条特征参数进行计算后,确定计算结果与样本标签的差异。依据预先构建的损失函数评估该差异,以梯度下降法多次迭代,从而获得能使损失函数的值趋于最小时的模型参数。在这种情况下,模型参数满足机器学习模型的分类精度要求。

在一实施例中,为避免机器学习模型过拟合,在训练机器学习模型后,可以通过新的样本验证上述机器学习模型。

服务端可以重新获取多个正样本标识和多个负样本标识。重新获取的正样本标识和负样本标识与训练阶段所用到的设备标识不同。

服务端从上述特征匹配库中查找每一设备标识对应的特征信息,并依据特征信息生成特征参数,进而为正样本标识对应的特征参数添加正样本标签,为负样本标识对应的特征参数添加负样本标签。

服务端将多个上述特征参数输入至机器学习模型,通过机器学习模型对每一特征参数计算出的人员类别信息,并判断该人员类别信息与该特征参数的正样本标签或负样本标签之间的差异是否满足分类精度要求。

一方面,如果机器学习模型对新的特征参数的计算结果满足分类精度要求,说明机器学习模型没有过拟合,可以利用该机器学习模型判断潜在客户。

另一方面,如果机器学习模型对新的特征参数的计算结果不满足分类精度要求,可以继续训练模型参数,直至模型参数满足分类精度要求。

服务端可以依据上述损失函数评估计算结果和样本标签的差异,根据梯度下降法多次迭代,从而获得能使损失函数的值趋于最小时的模型参数。

参见图4,为本申请实施例示出的一种机器学习模型的训练示意图。如图4所示,服务端首先获取正样本标识和负样本标识,并针对上述正样本标识和上述负样本标识分别进行特征提取,从特征匹配库中获取每一设备标识对应的特征信息。

服务端对上述特征信息进行特征转化,从而生成对应于每一设备标识的特征参数。在一实施例中,上述特征参数包括动态系数、距职系数、距住系数、兴趣度系数和天气系数。

服务端可以对上述特征参数进行标准化处理,使所有特征参数转化为标准存储格式,并为正样本标识对应的特征参数添加正样本标签,为负样本标识对应的特征参数添加负样本标签。

基于已添加样本标签的特征参数,生成模型训练集和模型验证集。其中,模型训练集和模型验证集中均包括多个添加正样本标签的特征参数和多个添加负样本标签的特征参数。

服务端通过模型训练集中的特征参数对机器学习模型进行训练,然后通过模型验证集中的特征参数对已训练的机器学习模型进行验证,从而获得可以判断潜在客户的机器学习模型。

步骤303:将每一设备标识对应的所述特征参数输入至已训练的机器学习模型,通过所述机器学习模型计算所述特征参数,获得与每一设备标识对应的人员类别信息;其中,所述人员类别信息包括潜在客户和非潜在客户。

服务端将待判断的设备标识对应的特征参数输入至上述机器学习模型,通过机器学习模型计算特征参数,从而获得与每一设备标识对应的人员类别信息。

在一实施例中,上述机器学习模型可以是逻辑回归模型,机器学习模型计算出的人员类别信息为介于0到1之间的数字。如果该数字小于判定边界0.5,说明特征参数对应的人员为非潜在客户;如果该数字大于判定边界0.5,说明特征参数对应的人员为潜在客户。

在本申请实施例的技术方案中,通过机器学习模型学习历史到店人员的特征参数中的内在规律,根据待分类人员的设备标识获取对应的特征信息后生成特征参数,从而可以针对待分类人员对应的特征参数判断出潜在客户,在此基础上对潜在客户推送促销信息,有助于提高促销的精确性和有效性。

图5是本发明一实施例的一种判断潜在客户的装置的框图。如图5所示,该装置可以包括:获取模块510、生成模块520和判断模块530。

获取模块510,用于获取设备标识集,所述设备标识集包括多个待分类人员的设备标识。

生成模块520,用于从特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成特征参数。

判断模块530,用于将每一设备标识对应的所述特征参数输入至已训练的机器学习模型,通过所述机器学习模型计算所述特征参数,获得与每一设备标识对应的人员类别信息;其中,所述人员类别信息包括潜在客户和非潜在客户。

在一实施例中,上述装置还可以包括训练模块(图中未示出),用于:

获取多个正样本标识和多个负样本标识;其中,所述正样本标识为历史到店人员的设备标识,所述负样本标识为未到店人员的设备标识;

从所述特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数;

为所述正样本标识对应的特征参数添加正样本标签,为所述负样本标识对应的特征参数添加负样本标签;其中,所述正样本标签表征潜在客户,所述负样本标签表征非潜在客户;

将多个所述特征参数输入至所述机器学习模型,通过所述机器学习模型对每一特征参数计算出的人员类别信息与该特征参数的正样本标签或负样本标签之间的差异,对所述机器学习模型的模型参数进行训练;

重复所述训练过程,直至所述模型参数满足所述机器学习模型的分类精度要求。

在一实施例中,上述训练模块(图中未示出),进一步用于:

重新获取多个所述正样本标识和多个所述负样本标识;

从所述特征匹配库中查找每一设备标识对应的特征信息,并依据所述特征信息生成所述特征参数;

为所述正样本标识对应的特征参数添加正样本标签,为所述负样本标识对应的特征参数添加负样本标签;

将多个所述特征参数输入至所述机器学习模型,通过所述机器学习模型对每一特征参数计算人员类别信息,并判断所述人员类别信息与该特征参数的正样本标签或负样本标签之间的差异是否满足所述分类精度要求;

如果不满足所述分类精度要求,训练所述模型参数,直至所述模型参数满足所述分类精度要求。

在一实施例中,上述特征参数包括动态系数、距职系数、距住系数、兴趣度系数和天气系数中一种或多种的组合;

上述生成模块520,进一步用于:

从所述特征匹配库中查找每一设备标识对应的兴趣点访问日志;其中,所述兴趣点访问日志包括多条兴趣点访问记录,每一兴趣点访问记录包括时间戳、兴趣点和兴趣点类别;

筛选出时间戳位于指定时间段内的兴趣点访问记录,从所述兴趣点访问记录统计每一设备标识对应的所述兴趣点的数量和所述兴趣点类别的数量;

基于所述兴趣点的数量和所述兴趣点类别的数量,计算所述设备标识对应的动态系数。

上述生成模块520,进一步用于:

从所述特征匹配库查找每一设备标识对应的工作地坐标和居住地坐标;

基于预设目的地的坐标和每一设备标识对应的工作地坐标,计算该设备标识对应的距职系数;

基于所述目的地的坐标和每一设备标识对应的居住地坐标,计算该设备标识对应的距住系数。

上述生成模块520,进一步用于:

确定预设目的地所属的兴趣点类别,并检查每一设备标识的所述兴趣点访问记录中属于该兴趣点类别的兴趣点的数量,将该数量作为该设备标识对应的兴趣度系数。

上述生成模块520,进一步用于:

依照预定义的数据格式对所述特征参数进行标准化处理。

上述装置中各个模块的功能和作用的实现过程具体详见上述判断潜在客户的方法中对应步骤的实现过程,在此不再赘述。

在本申请所提供的几个实施例中,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1