标签映射方法与流程

文档序号:15689787发布日期:2018-10-16 21:50阅读:661来源:国知局

本发明涉及数据处理领域,特别涉及一种标签映射方法。



背景技术:

传统智能用户标签系统根据企业自身数据给用户打标签,但是由于很多的企业数据量小,难以有效获取大量的用户标签。第三方数据公司的用户标签往往是针对用户小部分行为所打的标签,标签存在不能有效利用的情况。而企业获得标签往往依赖于用户的行为,对于用户心理、社交等方面标签无法获取不能很好的刻画用户画像。因此,对于企业来讲,难以对用户的标签进行有效的利用。



技术实现要素:

为解决以上问题,更好的利用用户的标签,需要将用户的行为,尤其是涉及商品消费的行为,与用户的社交标签等进行映射,从而为实现更准确的商品推荐打下数据基础。本发明提供一种标签映射方法,包括步骤:

获取带有标签的用户数据;

设置待映射的标签,所述待映射的标签包括商品标签和场标签;

获取所述带有标签的用户与所述待映射的商品标签所对应的商品的第一关联值,当所述第一关联值大于第一阈值时,将所述商品标签映射到所述带有标签的用户上;

获取所述带有标签的用户与所述待映射的场标签所对应的场的第二关联值,当所述第二关联值大于第二阈值时,将所述场标签映射到所述带有标签的用户上;

其中,第一关联值用于表征用户与商品之间的关联关系,第二关联值用于表征用户与场之间的关联关系。所述场包括线上经营场所和实体经营场所,如淘宝店铺、京东店铺、超市、商场、便利店等,场标签为这些线上经营场所和实体经营场所的标签。

优选的,

所述商品标签,为商品分类标签;

所述场标签,为场分类标签。

优选的,所述获取带有标签的用户数据,实施为:

从数据提供方获取带有标签的用户数据;

对用户数据里的标签进行清洗,得到清洗后的用户数据;

所述对用户数据里的标签进行清洗,实施为:

对每一条用户数据,在用户数据里的标签中寻找商品标签:

当在用户数据里的标签中没有找到商品标签时,保持用户数据里的商品标签不变;

当在用户数据里的标签中找到商品标签,且所找到的商品标签属于待映射的标签时,保持用户数据里的商品标签不变;

当在用户数据里的标签中找到商品标签,且所找到的商品标签不属于待映射的标签时,删除所找到的商品标签;

对每一条用户数据,在用户数据里的标签中寻找场标签:

当在用户数据里的标签中没有找到场标签时,保持用户数据里的场标签不变;

当在用户数据里的标签中找到场标签,且所找到的场标签属于待映射的标签时,保持用户数据里的场标签不变;

当在用户数据里的标签中找到场标签,且所找到的场标签不属于待映射的标签时,删除所找到的场标签。

优选的,所述获取所述带有标签的用户与所述待映射的商品标签所对应的商品的第一关联值,实施为:

获取用户对所述待映射的商品标签所对应的商品的操作信息,所述操作信息包括浏览商品的次数、浏览商品的频率、浏览商品的时长、搜索商品的次数、搜索商品的频率、购买商品的次数、购买商品的频率中的一种或多种;

根据所述第一公式计算所述带有标签的用户与所述待映射的商品标签所对应的商品的第一关联值,所述第一公式为:

其中,r1为第一关联值;n为所能获取到的用户对于所述待映射的商品标签所对应的商品的操作类型的总数;ci为对于所述待映射的商品标签所对应的商品的第i种操作类型的权重,为预设的正值;si为所述用户在预设时间内对于所述待映射的商品标签所对应的商品的第i种操作类型的操作值,sia为所有用户在预设时间对于所述待映射的商品标签所对应的商品的第i种操作类型的操作值的平均值;σi为所有用户在预设时间对于所述待映射的商品标签所对应的商品的第i种操作类型的操作值的标准差。

优选的,所述获取所述带有标签的用户与所述待映射的场标签所对应的场的第二关联值,实施为:

获取用户对所述待映射的场标签所对应的场的关联信息,所述关联信息包括路过场次数、路过场频率、进入场次数、进入场频率、场停留时间、场购物次数、场购物频率、场购物金额中的一种或多种;

根据所述第二公式计算所述带有标签的用户与所述待映射的场标签所对应的场的第二关联值,所述第二公式为:

其中,r2为第二关联值;m为所能获取到的用户对于所述待映射的场标签所对应的场的关联类型的总数;dj为对于所述待映射的场标签所对应的场的第j种关联类型的权重,为预设的正值;qj为所述用户在预设时间内对于所述待映射的场标签所对应的场的第j种关联类型的关联值,qja为所有用户在预设时间对于所述待映射的场标签所对应的场的第j种关联类型的关联值的平均值;为所有用户在预设时间对于所述待映射的场标签所对应的场的第j种关联类型的关联值的标准差。

优选的,所述标签映射方法,还包括:

获取所述带有标签的用户与所述待映射的商品标签所对应的商品的第一关联值,当所述第一关联值大于第三阈值时,将所述带有标签的用户映射到所述商品标签上;

获取所述带有标签的用户与所述待映射的场标签所对应的场的第二关联值,当所述第二关联值大于第四阈值时,将所述带有标签的用户映射到所述场标签上。

优选的,所述标签映射方法,还包括:

对每个场标签,获取映射到所述场标签的带有标签的用户,并获取映射到所述带有标签的用户的商品标签,并将所获取的商品标签映射到所述场标签上;

对每个商品标签,获取映射到所述商品标签的带有标签的用户,并获取映射到所述带有标签的用户的场标签,并将所获取的场标签映射到所述商品标签上。

本发明的一些有益效果可以包括:

本发明提供的方法,根据带有标签的用户的线上、线下的行为,给其映射新的涉及商品和场的标签,从而使用户的标签能够更好的应用于商品推荐、商品零售等方面。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:

图1为本发明实施例中一种标签映射方法的流程图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

图1为本发明实施例中一种标签映射方法的流程图,如图1所示,包括步骤:

步骤s101、获取带有标签的用户数据;

步骤s102、设置待映射的标签,所述待映射的标签包括商品标签和场标签;

步骤s103、获取所述带有标签的用户与所述待映射的商品标签所对应的商品的第一关联值,当所述第一关联值大于第一阈值时,将所述商品标签映射到所述带有标签的用户上;

步骤s104、获取所述带有标签的用户与所述待映射的场标签所对应的场的第二关联值,当所述第二关联值大于第二阈值时,将所述场标签映射到所述带有标签的用户上;

其中,第一关联值用于表征用户与商品之间的关联关系,第二关联值用于表征用户与场之间的关联关系。所述场包括线上经营场所和实体经营场所,如淘宝店铺、京东店铺、超市、商场、便利店等,场标签为这些线上经营场所和实体经营场所的标签。

通过本发明提供的方法,根据带有标签的用户的线上、线下的行为,给其映射新的涉及商品和场的标签,从而使用户的标签能够更好的应用于商品推荐、商品零售等方面。

由于用户在选择偏好的商品或场中时,多数情况下不忠于具体的产品型号,而是偏好一类产品,如日系产品,高性价比产品等待,为了更好的打标签,在本发明的一个实施例中,

所述商品标签,为商品分类标签;

所述场标签,为场分类标签。

由于数据提供方给的用户数据里的标签和设置的待映射的标签有重合或冲突,为了解决这一问题,在本发明的一个实施例中,所述获取带有标签的用户数据,实施为:

从数据提供方获取带有标签的用户数据;

对用户数据里的标签进行清洗,得到清洗后的用户数据;

所述对用户数据里的标签进行清洗,实施为:

对每一条用户数据,在用户数据里的标签中寻找商品标签:

当在用户数据里的标签中没有找到商品标签时,保持用户数据里的商品标签不变;

当在用户数据里的标签中找到商品标签,且所找到的商品标签属于待映射的标签时,保持用户数据里的商品标签不变;

当在用户数据里的标签中找到商品标签,且所找到的商品标签不属于待映射的标签时,删除所找到的商品标签;

对每一条用户数据,在用户数据里的标签中寻找场标签:

当在用户数据里的标签中没有找到场标签时,保持用户数据里的场标签不变;

当在用户数据里的标签中找到场标签,且所找到的场标签属于待映射的标签时,保持用户数据里的场标签不变;

当在用户数据里的标签中找到场标签,且所找到的场标签不属于待映射的标签时,删除所找到的场标签。

由于不同类型商品的操作数据往往有着量级的差异,为了不使这种差异明显影响到关联值的大小,在本发明的一个实施例中,所述获取所述带有标签的用户与所述待映射的商品标签所对应的商品的第一关联值,实施为:

获取用户对所述待映射的商品标签所对应的商品的操作信息,所述操作信息包括浏览商品的次数、浏览商品的频率、浏览商品的时长、搜索商品的次数、搜索商品的频率、购买商品的次数、购买商品的频率中的一种或多种;

根据所述第一公式计算所述带有标签的用户与所述待映射的商品标签所对应的商品的第一关联值,所述第一公式为:

其中,r1为第一关联值;n为所能获取到的用户对于所述待映射的商品标签所对应的商品的操作类型的总数;ci为对于所述待映射的商品标签所对应的商品的第i种操作类型的权重,为预设的正值;si为所述用户在预设时间内对于所述待映射的商品标签所对应的商品的第i种操作类型的操作值,sia为所有用户在预设时间对于所述待映射的商品标签所对应的商品的第i种操作类型的操作值的平均值;σi为所有用户在预设时间对于所述待映射的商品标签所对应的商品的第i种操作类型的操作值的标准差。

由于不同类型场的关联数据往往有着较大的差异,为了不使这种差异明显影响到关联值的大小,在本发明的一个实施例中,所述获取所述带有标签的用户与所述待映射的场标签所对应的场的第二关联值,实施为:

获取用户对所述待映射的场标签所对应的场的关联信息,所述关联信息包括路过场次数、路过场频率、进入场次数、进入场频率、场停留时间、场购物次数、场购物频率、场购物金额中的一种或多种;

根据所述第二公式计算所述带有标签的用户与所述待映射的场标签所对应的场的第二关联值,所述第二公式为:

其中,r2为第二关联值;m为所能获取到的用户对于所述待映射的场标签所对应的场的关联类型的总数;dj为对于所述待映射的场标签所对应的场的第j种关联类型的权重,为预设的正值;qj为所述用户在预设时间内对于所述待映射的场标签所对应的场的第j种关联类型的关联值,qja为所有用户在预设时间对于所述待映射的场标签所对应的场的第j种关联类型的关联值的平均值;为所有用户在预设时间对于所述待映射的场标签所对应的场的第j种关联类型的关联值的标准差。

除了需要对人打商品和场的标签外,还需要对商品和场打上人的标签,从而方便商品或商场等实体场所进行针对性的营销等,在本发明的一个实施例中,所述标签映射方法,还包括:

获取所述带有标签的用户与所述待映射的商品标签所对应的商品的第一关联值,当所述第一关联值大于第三阈值时,将所述带有标签的用户映射到所述商品标签上;

获取所述带有标签的用户与所述待映射的场标签所对应的场的第二关联值,当所述第二关联值大于第四阈值时,将所述带有标签的用户映射到所述场标签上。

除了需要映射人的标签外,还需要对商品打上场的标签以及对场打上商品的标签,从而方便商家铺货和商场等实体场所进货等,在本发明的一个实施例中,所述标签映射方法,还包括:

对每个场标签,获取映射到所述场标签的带有标签的用户,并获取映射到所述带有标签的用户的商品标签,并将所获取的商品标签映射到所述场标签上;

对每个商品标签,获取映射到所述商品标签的带有标签的用户,并获取映射到所述带有标签的用户的场标签,并将所获取的场标签映射到所述商品标签上。

本发明提供的方法,根据带有标签的用户的线上、线下的行为,给其映射新的涉及商品和场的标签,从而使用户的标签能够更好的应用于商品推荐、商品零售等方面。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1