一种用户数据的处理方法和装置与流程

文档序号：18743570发布日期：2019-09-21 02:04阅读：201来源：国知局

本申请涉及数据处理领域，尤其涉及一种用户数据的处理方法和装置。
背景技术：
：现有技术中，在很多应用场景下都需要对用户的行为数据进行分析，以进行决策处理。例如，在风险识别的场景中，可以对高风险用户的行为数据以及待识别用户的行为数据进行分析，以便基于分析结果确定待识别用户是否属于高风险用户。通常，在对用户的行为数据进行分析时，可以对用户是否发生过某些行为，或发生某些行为的次数进行分析。然而，在实际应用中，这种数据分析方法通常较为简单，并不能对用户的行为数据进行充分挖掘，导致无法进行有效地决策处理。技术实现要素：本申请实施例提供一种用户数据的处理方法和装置，用于解决现有技术中由于不能对用户的行为数据进行充分挖掘，导致无法有效地进行决策处理的问题。为解决上述技术问题，本申请实施例是这样实现的：第一方面，提出一种用户数据的处理方法，包括：获取多类用户的行为数据，所述多类用户基于业务标签划分，一个用户的行为数据中包括多个行为事件以及所述多个行为事件的时序标识；基于所述多类用户的行为数据中包括的行为事件以及行为事件的时序标识，确定所述多类用户对应的时序关联规则；基于所述多类用户中目标类用户对应的第一时序关联规则以及非目标类用户对应的第二时序关联规则，确定所述目标类用户的时序行为规则；基于所述目标类用户的时序行为规则，确定待识别用户是否属于所述目标类用户。第二方面，提出一种用户数据的处理装置，包括：获取单元，获取多类用户的行为数据，所述多类用户基于业务标签划分，一个用户的行为数据中包括多个行为事件以及所述多个行为事件的时序标识；处理单元，基于所述多类用户的行为数据中包括的行为事件以及行为事件的时序标识，确定所述多类用户对应的时序关联规则；确定单元，基于所述多类用户中目标类用户对应的第一时序关联规则以及非目标类用户对应的第二时序关联规则，确定所述目标类用户的时序行为规则；识别单元，基于所述目标类用户的时序行为规则，确定待识别用户是否属于所述目标类用户。第三方面，提出一种电子设备，该电子设备包括：处理器；以及被安排成存储计算机可执行指令的存储器，该可执行指令在被执行时使该处理器执行以下操作：获取多类用户的行为数据，所述多类用户基于业务标签划分，一个用户的行为数据中包括多个行为事件以及所述多个行为事件的时序标识；基于所述多类用户的行为数据中包括的行为事件以及行为事件的时序标识，确定所述多类用户对应的时序关联规则；基于所述多类用户中目标类用户对应的第一时序关联规则以及非目标类用户对应的第二时序关联规则，确定所述目标类用户的时序行为规则；基于所述目标类用户的时序行为规则，确定待识别用户是否属于所述目标类用户。第四方面，提出一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下方法：获取多类用户的行为数据，所述多类用户基于业务标签划分，一个用户的行为数据中包括多个行为事件以及所述多个行为事件的时序标识；基于所述多类用户的行为数据中包括的行为事件以及行为事件的时序标识，确定所述多类用户对应的时序关联规则；基于所述多类用户中目标类用户对应的第一时序关联规则以及非目标类用户对应的第二时序关联规则，确定所述目标类用户的时序行为规则；基于所述目标类用户的时序行为规则，确定待识别用户是否属于所述目标类用户。第五方面，提出一种用户数据的处理方法，包括：获取多类用户的行为数据，所述多类用户基于业务标签划分，一个用户的行为数据中包括多个行为事件以及所述多个行为事件的时序标识；基于所述多类用户的行为数据中包括的行为事件以及行为事件的时序标识，确定所述多类用户对应的时序关联规则；基于所述多类用户对应的时序关联规则，确定所述多类用户的时序行为规则；基于所述多类用户的时序行为规则，生成多个时序行为规则特征；基于所述多个时序行为规则特征，确定待处理用户的时序行为特征，以生成包括所述时序行为特征的样本数据进行模型训练。第六方面，提出一种用户数据的处理装置，包括：获取单元，获取多类用户的行为数据，所述多类用户基于业务标签划分，一个用户的行为数据中包括多个行为事件以及所述多个行为事件的时序标识；处理单元，基于所述多类用户的行为数据中包括的行为事件以及行为事件的时序标识，确定所述多类用户对应的时序关联规则；第一确定单元，基于所述多类用户对应的时序关联规则，确定所述多类用户的时序行为规则；生成单元，基于所述多类用户的时序行为规则，生成多个时序行为规则特征；第二确定单元，基于所述多个时序行为规则特征，确定待处理用户的时序行为特征，以生成包括所述时序行为特征的样本数据进行模型训练。第七方面，提出一种电子设备，该电子设备包括：处理器；以及被安排成存储计算机可执行指令的存储器，该可执行指令在被执行时使该处理器执行以下操作：获取多类用户的行为数据，所述多类用户基于业务标签划分，一个用户的行为数据中包括多个行为事件以及所述多个行为事件的时序标识；基于所述多类用户的行为数据中包括的行为事件以及行为事件的时序标识，确定所述多类用户对应的时序关联规则；基于所述多类用户对应的时序关联规则，确定所述多类用户的时序行为规则；基于所述多类用户的时序行为规则，生成多个时序行为规则特征；基于所述多个时序行为规则特征，确定待处理用户的时序行为特征，以生成包括所述时序行为特征的样本数据进行模型训练。第八方面，提出一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被包括多个应用程序的电子设备执行时，使得所述电子设备执行以下方法：获取多类用户的行为数据，所述多类用户基于业务标签划分，一个用户的行为数据中包括多个行为事件以及所述多个行为事件的时序标识；基于所述多类用户的行为数据中包括的行为事件以及行为事件的时序标识，确定所述多类用户对应的时序关联规则；基于所述多类用户对应的时序关联规则，确定所述多类用户的时序行为规则；基于所述多类用户的时序行为规则，生成多个时序行为规则特征；基于所述多个时序行为规则特征，确定待处理用户的时序行为特征，以生成包括所述时序行为特征的样本数据进行模型训练。本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：本申请实施例提供的技术方案，在对用户的行为数据进行分析时，由于充分考虑了行为数据中包括的行为事件的时序标识，因此，可以实现对用户行为数据的充分挖掘；在对多类用户的行为数据进行分析时，由于可以对多类用户的行为数据进行充分挖掘，得到能够反映多类用户行为时序的时序关联规则，进而得到目标类用户的时序行为规则，因此，在基于目标类用户的时序行为规则进行决策处理时，可以进行有效地决策处理。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。图1是本申请的一个实施例用户数据的处理方法的流程示意图；图2是本申请的一个实施例用户数据的处理方法的流程示意图；图3是本申请的一个实施例电子设备的结构示意图；图4是本申请的一个实施例用户数据的处理装置的结构示意图；图5是本申请的一个实施例电子设备的结构示意图；图6是本申请的一个实施例用户数据的处理装置的结构示意图。具体实施方式为了使本
技术领域：
的人员更好地理解本申请中的技术方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。以下结合附图，详细说明本申请各实施例提供的技术方案。图1是本申请的一个实施例用户数据的处理方法的流程示意图。所述用户数据的处理方法如下所述。S102：获取多类用户的行为数据。在S102中，多类用户可以基于业务标签划分得到，业务标签可以基于具体的应用场景确定，例如，在风险识别场景中，业务标签可以包括高风险和低风险，或者可以包括高风险、中风险和低风险；在营销场景中，业务标签可以包括目标用户和非目标用户。多类用户的行为数据可以是多类用户在设定时间段内的行为数据，该设定时间段可以根据实际需要确定，这里不做具体限定。本实施例在获取多类用户的行为数据时，可以包括以下步骤：首先，获取多个具有不同业务标签的用户的行为数据。以一个用户为例，在获取用户的行为数据时，用户的行为数据中可以包括多个行为事件以及该多个行为事件的时序标识，其中，行为事件的时序标识可以表征行为事件发生的先后顺序。例如，用户A在某一时间段内的行为事件包括事件1，事件2，事件3，事件4和事件5，其中，事件1至事件5的时序标识依次为2，4，1，3，5，那么，事件1至事件5发生的先后顺序依次为：事件3，事件1，事件4，事件2，事件5。需要说明的是，获取的多个用户的行为数据中，不同用户的行为数据中包括的行为事件可以相同，也可以不同，相同行为事件在不同用户的行为数据中的时序标识可以相同，也可以不同，同一行为事件在一个用户的行为数据中出现的次数可以是一次，也可以是多次，这里不做具体限定。其次，根据业务标签对多个用户的行为数据进行分组，得到多类用户的行为数据。在分组时，可以将具有相同业务标签的用户的行为数据划分为一组，得到一类用户的行为数据，这样，基于多个不同的业务标签，可以得到多类用户的行为数据。例如，在风险识别的场景中，可以根据业务标签高风险和低风险，将高风险用户的行为数据划分为一组，低风险用户的行为数据划分为一组，得到两类用户的行为数据。在获取到多类用户的行为数据后，可以执行S104。S104：基于所述多类用户的行为数据中包括的行为事件以及行为事件的时序标识，确定所述多类用户对应的时序关联规则。在S104中，在确定多类用户对应的时序关联规则时，以其中一类用户为例，可以包括如下步骤：首先，基于一类用户的行为数据中包括的行为事件，确定频繁项集。本实施例中，频繁项集的个数可以是多个，在确定频繁项集时，可以遵循以下原则：一个行为事件在一个用户的行为数据中出现一次或多次，均计为一次，一个频繁项集中包括至少一个行为事件，该至少一个行为事件至少在一个用户的行为数据中出现。其次，基于频繁项集以及频繁项集中包括的行为事件的时序标识，确定一类用户对应的时序关联规则。具体地，以其中一个频繁项集为例，在确定时序关联规则时，可以确定频繁项集对应的用户，其中，频繁项集对应的用户可以理解为行为数据中包括该频繁项集中的行为事件的用户；在得到频繁项集对应的用户后，可以根据频繁项集中的行为事件在频繁项集对应的用户的行为数据中的时序标识，得到频繁项集对应的时序关联规则。在得到一个频繁项集对应的时序关联规则后，可以基于相同的方法得到多个频繁项集对应的时序关联规则，多个频繁项集对应的时序关联规则即为一类用户对应的时序关联规则。为了便于理解，以下可以以一类用户中包括3个用户为例进行说明。假设一类用户中包括3个用户A、B、C，用户A、B和C的行为数据中包括的行为事件和行为事件的时序标识如表1所示。表1用户行为事件行为事件的时序标识A11A22A33A44B11B22B33B44C11C32C53在确定用户A、B、C对应的时序关联规则时，首先，基于表1中用户A、B、C的行为事件，可以得到如下多个频繁项集：(1)，(2)，(3)，(4)，(5)，(1，2)，(1，3)，(1，4)，(1，5)，(2，3)，(2，4)，(3，4)，(3，5)，(1，2，3)，(1，2，4)，(1，3，4)，(1，3，5)，(2，3，4)，(1，2，3，4)。其次，以其中一个频繁项集(1，2)为例，可以确定该频繁项集对应的用户为用户A和用户B，基于事件1和事件2在用户A和用户B的行为数据中的时序标识，可以得到频繁项集(1，2)对应的时序关联规则1→2(→也可以由其他方式表示)。针对其他的频繁项集，可以基于相同的方法，得到对应的时序关联规则，进而得到用户A、B、C对应的时序关联规则：1，2，3，4，5，1→2，1→3，1→4，1→5，2→3，2→4，3→4，3→5，1→2→3，1→2→4，1→3→4，1→3→5，2→3→4，1→2→3→4。可选地，在上述确定时序关联规则的过程中，在得到多个频繁项集后，还可以对多个频繁项集进行筛选，滤除长度小于或等于预设阈值的频繁项集，其中，频繁项集的长度可以理解为频繁项集中包括的行为事件的个数，预设阈值可以根据实际需要确定。在对多个频繁项集进行筛选后，可以基于筛选后的频繁项集以及筛选后的频繁项集中包括的行为事件的时序标识，得到时序关联规则。仍以上述3个用户A、B、C为例，在得到多个频繁项集后，可以滤除多个频繁项集中长度为1的频繁项集，得到长度等于和大于2的频繁项集，基于这些频繁项集以及这些频繁项集中包括的行为事件的时序标识，可以得到如下时序关联规则：1→2，1→3，1→4，1→5，2→3，2→4，3→4，3→5，1→2→3，1→2→4，1→3→4，1→3→5，2→3→4，1→2→3→4。在基于上述记载的方法得到一类用户对应的时序关联规则后，可以基于相同的方法得到其他类用户对应的时序关联规则。在得到多类用户对应的时序关联规则后，可以执行S106。S106：基于所述多类用户中目标类用户对应的第一时序关联规则以及非目标类用户对应的第二时序关联规则，确定所述目标类用户的时序行为规则。在S106中，目标类用户可以理解为多类用户中待确定时序行为规则的一类用户，非目标类用户可以理解为多类用户中除目标类用户以外的其他类用户。这里为了便于区别不同类用户对应的时序关联规则，可以将目标类用户对应的时序关联规则表示为第一时序关联规则，将非目标类用户对应的时序关联规则表示为第二时序关联规则。本实施例中，目标类用户对应的时序行为规则可以理解为目标类用户发生行为事件满足的时序规则。在确定目标类用户的时序行为规则时，可以包括如下步骤：基于第一时序关联规则以及第二时序关联规则，确定第一时序关联规则中的目标时序关联规则。基于目标时序关联规则，确定目标类用户的时序行为规则。在确定目标时序关联规则时，至少可以采用以下三种方法：第一种方法：将第一时序关联规则中不属于第二时序关联规则的时序关联规则作为目标时序关联规则。例如，假设第一时序关联规则为：1→2，1→3，1→4，1→5，2→3，2→4，3→4，3→5，1→2→3，1→2→4，1→3→4，1→3→5，2→3→4，1→2→3→4，第二时序关联规则为：1→3，1→4，1→5，3→4，3→5，4→5，3→4→5，1→3→4→5，那么，可以将第一时序关联规则中不属于第二时序关联规则的1→2，2→3，2→4，1→2→3，1→2→4，1→3→4，1→3→5，2→3→4，1→2→3→4作为目标时序关联规则。第二种方法：确定第一时序关联规则和第二时序关联规则中相同的时序关联规则；确定该相同的时序关联规则在目标类用户中的第一可信度，以及在非目标类用户中的第二可信度；将该相同的时序关联规则中，第一可信度以及第二可信度的比值不小于设定阈值的时序关联规则确定为目标时序关联规则。本实施例中，第一可信度和第二可信度可以基于相同的方法确定得到。其中，第一可信度可以是时序关联规则对应的行为事件在目标类用户的行为数据中出现的概率，行为事件在目标类用户中出现的概率可以定义为，行为事件在目标类用户的行为数据中出现的次数与目标类用户的用户总数的比值。例如，针对上述记载的用户A、B、C的一个时序关联规则1→2→3，其对应的行为事件为事件1、事件2和事件3，基于表1可知，事件1、事件2和事件3在用户A、B、C的行为数据中出现的次数为2，用户总数为3，因此，事件1、事件2和事件3出现的概率为0.67，0.67可以视为时序关联规则1→2→3的第一可信度。此外，第一可信度也可以是时序关联规则对应的行为事件在目标类用户的行为数据中出现的条件概率。以时序关联规则a→b→c为例，时序关联规则a→b→c对应的行为事件a、b、c在目标类用户的行为数据中出现的条件概率可以定义为，行为事件a、b、c在目标类用户的行为数据中出现的概率与行为事件a、b在目标类用户的行为数据中出现的概率的比值。例如，针对上述记载的用户A、B、C的时序关联规则1→2→3，其对应的行为事件为事件1、事件2和事件3，基于表1可知，事件1、事件2和事件3的出现概率为0.67，事件1和事件2的出现概率为0.67，因此，事件1、事件2和事件3出现的条件概率为1，1可以视为时序关联规则1→2→3的第一可信度。在基于上述记载的方法得到时序关联规则的第一可信度和第二可信度后，可以基于第二种方法确定目标时序关联规则。在确定目标时序关联规则时，为了便于理解，可以举例说明。假设第一时序关联规则和第一可信度为：1→2(0.67)，1→3(1)，1→4(0.67)，1→5(0.33)，2→3(0.67)，2→4(0.67)，3→4(0.67)，3→5(0.33)，1→2→3(0.67)，1→2→4(0.67)，1→3→4(0.67)，1→3→5(0.33)，2→3→4(0.67)，1→2→3→4(0.67)，第二时序关联规则和第二可信度为：1→3(0.5)，1→4(0.5)，1→5(0.5)，3→4(0.5)，3→5(0.5)，4→5(1)，3→4→5(0.5)，1→3→4→5(0.5)。由此可见，目标类用户和非目标类用户中相同的时序关联规则为1→3，1→4，1→5，3→4，3→5，这些时序关联规则的第一可信度和第二可信度的比值依次为2，1.33，0.67，1.33，0.67，假设设定阈值为1，则可以将1→3，1→4，3→4作为目标时序关联规则。第三种方法：将上述记载的第一种方法以及第二种方法得到的目标时序关联规则的组合作为目标时序关联规则。具体体实现方式这里不再详细描述。需要说明的是，针对上述记载的三种方法，在实际应用中，可以选择任一种方法来确定目标时序关联规则，其中，优选地，若第一时序关联规则中存在不属于第二时序关联规则的时序关联规则，则可以选择上述第一种方法或第三种方法确定目标时序关联规则，否则，可以选择上述第二种方法确定目标时序关联规则。在基于上述记载的方法得到目标时序关联规则后，可以基于目标时序关联规则确定目标类用户的时序行为规则。在确定目标类用户的时序行为规则时，一种实现方式可以是，直接将目标时序关联规则作为目标类用户对应的时序行为规则。例如，若目标时序关联为：1→2，2→3，2→4，1→2→3，1→2→4，1→3→4，1→3→5，2→3→4，1→2→3→4，则目标类用户的时序行为规则为：1→2，2→3，2→4，1→2→3，1→2→4，1→3→4，1→3→5，2→3→4，1→2→3→4。另一种实现方式可以是，将可信度不小于设定可信度阈值的目标时序关联规则作为目标类用户的时序行为规则。例如，若目标时序关联为：1→2，2→3，2→4，1→2→3，1→2→4，1→3→4，1→3→5，2→3→4，1→2→3→4，可信度依次为0.67，0.67，0.67，0.67，0.67，0.67，0.33，0.67，0.67，假设设定可信度阈值为0.5，则目标类用户的时序行为规则可以是：1→2，2→3，2→4，1→2→3，1→2→4，1→3→4，2→3→4，1→2→3→4。本实施例中，可以选择上述任一种实现方式确定目标类用户的时序行为规则，这里不做具体限定。在得到目标类用户的时序行为规则后，可以执行S108。S108：基于所述目标类用户的时序行为规则，确定待识别用户是否属于所述目标类用户。待识别用户可以理解为不具有业务标签的用户，在基于所述目标类用户的时序行为规则，确定待识别用户是否属于所述目标类用户时，可以包括以下步骤：首先，获取待识别用户的行为数据。待识别用户的行为数据中可以包括待识别用户在设定时间段内的多个行为事件以及该多个行为事件的时序标识。其次，根据待识别用户的行为数据中包括的行为事件以及行为事件的时序标识，确定待识别用户的时序关联规则。在确定待识别用户的时序关联规则时，具体实现方式可以参见上述记载的确定一类用户对应的时序关联规则的内容，这里不再重复描述。最后，判断待识别用户的时序关联规则是否命中目标类用户的时序行为规则，若是，则可以确定待识别用户属于目标类用户，若否，则可以确定待识别用户属于非目标类用户。例如，已知目标类用户的时序行为规则为：1→2，2→3，2→4，1→2→3，1→2→4，1→3→4，2→3→4，1→2→3→4，那么：假设待识别用户的时序关联规则为：3→4，1→2→3，1→2→4，1→3→4，通过比较可知，待识别用户的时序关联规则1→2→3，1→2→4和1→3→4，命中了目标类用户的时序行为规则1→2→3，1→2→4和1→3→4，因此，可以确定待识别用户属于目标类用户。假设待识别用户时序关联规则为：4→5，2→3→5，2→4→5，3→4→5，通过比较可知，待识别用户的任一时序关联规则没有命中目标类用户的任一时序行为规则，因此，可以确定待识别用户不属于目标类用户。本实施例中，在确定待识别用户属于目标类用户后，还可以基于应用场景，对待识别用户进行进一步处理。例如，在风险识别场景中，若确定待识别的用户A属于高风险用户，则可以直接对用户A进行拦截，不允许用户A访问安全页面或进行网上交易等；若确定用户A属于低风险用户，则可以直接对用户A进行准入，允许用户A访问安全页面或进行网上交易等。这样，在风险识别场景中，由于在基于时序行为规则对待识别用户进行识别后，可以基于识别结果对待识别用户进行拦截或准入，无需进行其他判断，因此，可以降低系统压力，此外，在基于时序行为规则确定待识别用户为低风险用户后，由于无需其他判断处理，就可以对待识别用户进行准入，整个过程耗时较少，因此，可以提升用户体验。再例如，在营销场景中，若确定待识别的用户A属于目标用户，则可以向用户A推送目标商品的商品信息；若确定用户A不属于目标用户，则可以取消向用户A推荐目标商品的商品信息。这样，可以实现精准推送，避免向用户推荐不需要的商品信息，从而提升用户体验。本申请实施例提供的技术方案，在对用户的行为数据进行分析时，由于充分考虑了行为数据中包括的行为事件的时序标识，因此，可以实现对用户行为数据的充分挖掘；在对多类用户的行为数据进行分析时，由于可以对多类用户的行为数据进行充分挖掘，得到能够反映多类用户行为时序的时序关联规则，进而得到目标类用户的时序行为规则，因此，在基于目标类用户的时序行为规则确定待识别用户是否属于目标类用户时，可以进行有效识别。图2为本申请的一个实施例用户数据的处理方法的流程示意图，所述用户数据的处理方法包括如下步骤。S202：获取多类用户的行为数据。其中，多类用户基于业务标签划分，一个用户的行为数据中可以包括多个行为事件以及多个行为事件的时序标识。S204：基于所述多类用户的行为数据中包括的行为事件以及行为事件的时序标识，确定所述多类用户对应的时序关联规则；:上述S202至S204的具体实现可以参见图1所示实施例中相应步骤的具体实现，这里不在重复描述。S206：基于所述多类用户对应的时序关联规则，确定所述多类用户的时序行为规则。在S206中，针对其中一类目标类用户，可以基于图1所示实施例中记载的方法确定目标类用户的时序行为规则，在得到目标类用户的时序行为规则后，可以基于相同的方法确定多类用户中除目标类用户以外的非目标类用户的时序行为规则。S208：基于所述多类用户的时序行为规则，生成多个时序行为规则特征。本实施例中，一个时序行为规则可以生成一个时序行为规则特征，多个时序行为规则特征的个数可以等于多类用户的时序行为规则的总个数。例如，多类用户的时序行为规则包括：1→2，2→3，2→4，1→2→3，1→2→4，1→3→4，1→3→5，2→3→4，1→2→3→4，4→5，3→4→5，1→3→4→5，那么，基于时序行为规则1→2可以生成时序行为规则特征fea1，基于时序行为规则2→3可以生成时序行为规则特征fea2，……，以此类推，可以得到12个时序行为规则特征fea1～fea12。S210：基于所述多个时序行为规则特征，确定待处理用户的时序行为特征，以生成包括所述时序行为特征的样本数据进行模型训练。在S210中，在基于多个时序行为规则特征，确定待处理用户的时序行为特征时，可以包括如下步骤：首先，获取待处理用户的行为数据。待处理用户的行为数据中可以包括待处理用户在设定时间段内的多个行为事件以及多个行为事件的时序标识。其次，基于待处理用户的行为数据中包括的行为事件以及行为事件的时序标识，确定用户的时序关联规则。具体实现方式可以参见上述图1所示实施例中记载的确定一类用户对应的时序关联规则的具体内容，这里不再重复描述。最后，针对其中一个时序行为规则特征，可以判断待处理用户的时序关联规则是否命中时序行为规则特征对应的时序行为规则，其中，时序行为规则特征对应的时序行为规则可以理解为，生成该时序行为规则特征的时序行为规则。例如，上述记载的fea1由时序行为规则1→2生成，则fea1对应的时序行为规则为1→2。若判断结果为是，则可以确定待处理用户具有该时序行为规则特征，否则，可以确定待处理用户不具有该时序行为规则特征。在基于上述记载的方法确定待处理用户是否具有一个时序行为规则特征后，可以基于相同的方法，确定待处理用户是否具有其他时序行为规则特征，这里不再详细描述。本实施例中，待处理用户是否具有多个时序行为规则特征可以由数值表示，数值可以视为待处理用户的时序行为特征。例如，若待处理用户具有某个时序行为规则特征，则可以由数值1表示；若待处理用户不具有某个时序行为规则特征，则可以由数值0表示，数值0和1可以视为待处理用户的时序行为特征。为了便于理解，仍以上述记载的12个时序行为规则特征fea1～fea12为例进行说明，12个时序行为规则特征fea1～fea12对应的时序行为规则为：1→2，2→3，2→4，1→2→3，1→2→4，1→3→4，1→3→5，2→3→4，1→2→3→4，4→5，3→4→5，1→3→4→5。假设待处理用户的时序关联规则包括：1→2，2→4，3→4，1→2→3，1→3→4，1→3→5，1→2→3→4，则可以确定待处理用户具有时序行为规则特征fea1，fea3，fea4，fea6，fea7，fea9，不具有时序行为规则特征fea2，fea5，fea8，fea10，fea11，fea12，由1表示待处理用户具有某个时序行为规则特征，由0表示待处理用户不具有某个时序行为规则特征，则可以得到待处理用户的时序行为特征为：1，0，1，1，0，1，1，0，1，0，0，0。本实施例中，在确定得到待处理用户的时序行为特征后，在已知待处理用户的业务标签的情况下，还可以基于待处理用户的时序行为特征得到样本数据，该样本数据中包括待处理用户的时序行为特征，该样本数据可以用于进行模型训练。例如，在得到目标类用户和非目标类用户的时序行为特征后，可以将这些时序行为特征作为样本数据进行模型训练，得到用于识别用户是否为目标类用户或非目标类用户的模型。在得到模型后，基于模型对待识别用户进行识别时，也可以基于本实施例中记载的方法确定待识别用户的时序行为特征，将待识别用户的时序行为特征作为模型输入，基于模型的输出，可以确定待识别用户是否属于目标类用户或非目标类用户。本申请实施例提供的技术方案，在对用户的行为数据进行分析时，由于充分考虑了行为数据中包括的行为事件的时序标识，因此，可以实现对用户行为数据的充分挖掘；在对多类用户的行为数据进行分析时，由于可以对多类用户的行为数据进行充分挖掘，得到能够反映多类用户行为时序的时序关联规则，进而得到多类用户的时序行为规则，基于多类用户的时序行为规则，生成多个时序行为规则特征，因此，基于多个时序行为规则特征，可以得到更为丰富地用户时序行为特征，以便在基于包括时序行为特征的样本数据进行模型后，可以基于训练得到的模型进行有效地决策处理。上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。图3是本申请的一个实施例电子设备的结构示意图。请参考图3，在硬件层面，该电子设备包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(Random-AccessMemory，RAM)，也可能还包括非易失性存储器(non-volatilememory)，例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他业务所需要的硬件。处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是ISA(IndustryStandardArchitecture，工业标准体系结构)总线、PCI(PeripheralComponentInterconnect，外设部件互连标准)总线或EISA(ExtendedIndustryStandardArchitecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图3中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。存储器，用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器，并向处理器提供指令和数据。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成用户数据的处理装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：获取多类用户的行为数据，所述多类用户基于业务标签划分，一个用户的行为数据中包括多个行为事件以及所述多个行为事件的时序标识；基于所述多类用户的行为数据中包括的行为事件以及行为事件的时序标识，确定所述多类用户对应的时序关联规则；基于所述多类用户中目标类用户对应的第一时序关联规则以及非目标类用户对应的第二时序关联规则，确定所述目标类用户的时序行为规则；基于所述目标类用户的时序行为规则，确定待识别用户是否属于所述目标类用户。上述如本申请图3所示实施例揭示的用户数据的处理装置执行的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(CentralProcessingUnit，CPU)、网络处理器(NetworkProcessor，NP)等；还可以是数字信号处理器(DigitalSignalProcessor，DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit，ASIC)、现场可编程门阵列(Field－ProgrammableGateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。该电子设备还可执行图1的方法，并实现用户数据的处理装置在图1所示实施例中的功能，本申请实施例在此不再赘述。当然，除了软件实现方式之外，本申请的电子设备并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。本申请实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图1所示实施例的方法，并具体用于执行以下操作：获取多类用户的行为数据，所述多类用户基于业务标签划分，一个用户的行为数据中包括多个行为事件以及所述多个行为事件的时序标识；基于所述多类用户的行为数据中包括的行为事件以及行为事件的时序标识，确定所述多类用户对应的时序关联规则；基于所述多类用户中目标类用户对应的第一时序关联规则以及非目标类用户对应的第二时序关联规则，确定所述目标类用户的时序行为规则；基于所述目标类用户的时序行为规则，确定待识别用户是否属于所述目标类用户。图4是本申请的一个实施例用户数据的处理装置40的结构示意图。请参考图4，在一种软件实施方式中，所述用户数据的处理装置40可包括：获取单元41、处理单元42、确定单元43和识别单元44，其中：获取单元41，获取多类用户的行为数据，所述多类用户基于业务标签划分，一个用户的行为数据中包括多个行为事件以及所述多个行为事件的时序标识；处理单元42，基于所述多类用户的行为数据中包括的行为事件以及行为事件的时序标识，确定所述多类用户对应的时序关联规则；确定单元43，基于所述多类用户中目标类用户对应的第一时序关联规则以及非目标类用户对应的第二时序关联规则，确定所述目标类用户的时序行为规则；识别单元44，基于所述目标类用户的时序行为规则，确定待识别用户是否属于所述目标类用户。可选地，所述确定单元43，确定所述目标类用户的时序行为规则，包括：基于所述第一时序关联规则以及所述第二时序关联规则，确定所述第一时序关联规则中的目标时序关联规则；基于所述目标时序关联规则，确定所述目标类用户的时序行为规则。可选地，所述确定单元43，确定所述第一时序关联规则中的目标时序关联规则，包括以下至少一种：将所述第一时序关联规则中，不属于所述第二时序关联规则的时序关联规则确定为所述目标时序关联规则；确定所述第一时序关联规则以及所述第二时序关联规则中相同的时序关联规则；确定所述相同的时序关联规则在所述目标类用户中的第一可信度以及在所述非目标类用户中的第二可信度；将所述第一可信度与所述第二可信度的比值不小于设定阈值的时序关联规则确定为所述目标时序关联规则。可选地，所述第一可信度为时序关联规则对应的行为事件在所述目标类用户的行为数据中出现的概率或条件概率。可选地，所述识别单元44，基于所述目标类用户的时序行为规则，确定待识别用户是否属于所述目标类用户，包括：获取所述待识别用户的行为数据，所述行为数据中包括多个行为事件以及所述多个行为事件的时序标识；基于所述待识别用户的行为数据中包括的行为事件以及行为事件的时序标识，确定所述待识别用户的时序关联规则；判断所述待识别用户的时序关联规则是否命中所述目标类用户的时序行为规则；若是，则确定所述用户属于所述目标类用户；若否，则确定所述用户不属于所述目标类用户。可选地，所述处理单元42，确定所述多类用户对应的时序关联规则，包括：针对其中一类用户，执行以下操作：基于所述一类用户的行为数据中包括的行为事件，确定频繁项集；基于所述频繁项集以及所述频繁项集中包括的行为事件的时序标识，确定所述一类用户对应的时序关联规则。本申请实施例提供的用户数据的处理装置40还可执行图1的方法，并实现用户数据的处理装置在图1所示实施例的功能，本申请实施例在此不再赘述。图5是本申请的一个实施例电子设备的结构示意图。请参考图5，在硬件层面，该电子设备包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(Random-AccessMemory，RAM)，也可能还包括非易失性存储器(non-volatilememory)，例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他业务所需要的硬件。处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是ISA(IndustryStandardArchitecture，工业标准体系结构)总线、PCI(PeripheralComponentInterconnect，外设部件互连标准)总线或EISA(ExtendedIndustryStandardArchitecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图5中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。存储器，用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器，并向处理器提供指令和数据。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成用户数据的处理装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：获取多类用户的行为数据，所述多类用户基于业务标签划分，一个用户的行为数据中包括多个行为事件以及所述多个行为事件的时序标识；基于所述多类用户的行为数据中包括的行为事件以及行为事件的时序标识，确定所述多类用户对应的时序关联规则；基于所述多类用户对应的时序关联规则，确定所述多类用户的时序行为规则；基于所述多类用户的时序行为规则，生成多个时序行为规则特征；基于所述多个时序行为规则特征，确定待处理用户的时序行为特征，以生成包括所述时序行为特征的样本数据进行模型训练。上述如本申请图5所示实施例揭示的用户数据的处理装置执行的方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(CentralProcessingUnit，CPU)、网络处理器(NetworkProcessor，NP)等；还可以是数字信号处理器(DigitalSignalProcessor，DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit，ASIC)、现场可编程门阵列(Field－ProgrammableGateArray，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。该电子设备还可执行图2的方法，并实现用户数据的处理装置在图2所示实施例中的功能，本申请实施例在此不再赘述。当然，除了软件实现方式之外，本申请的电子设备并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。本申请实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图2所示实施例的方法，并具体用于执行以下操作：获取多类用户的行为数据，所述多类用户基于业务标签划分，一个用户的行为数据中包括多个行为事件以及所述多个行为事件的时序标识；基于所述多类用户的行为数据中包括的行为事件以及行为事件的时序标识，确定所述多类用户对应的时序关联规则；基于所述多类用户对应的时序关联规则，确定所述多类用户的时序行为规则；基于所述多类用户的时序行为规则，生成多个时序行为规则特征；基于所述多个时序行为规则特征，确定待处理用户的时序行为特征，以生成包括所述时序行为特征的样本数据进行模型训练。图6是本申请的一个实施例用户数据的处理装置60的结构示意图。请参考图6，在一种软件实施方式中，所述用户数据的处理装置40可包括：获取单元61、处理单元62、第一确定单元63、生成单元64和第二确定单元65，其中：获取单元61，获取多类用户的行为数据，所述多类用户基于业务标签划分，一个用户的行为数据中包括多个行为事件以及所述多个行为事件的时序标识；处理单元62，基于所述多类用户的行为数据中包括的行为事件以及行为事件的时序标识，确定所述多类用户对应的时序关联规则；第一确定单元63，基于所述多类用户对应的时序关联规则，确定所述多类用户的时序行为规则；生成单元64，基于所述多类用户的时序行为规则，生成多个时序行为规则特征；第二确定单元65，基于所述多个时序行为规则特征，确定待处理用户的时序行为特征，以生成包括所述时序行为特征的样本数据进行模型训练。可选地，所述第二确定单元65，基于所述多个时序行为规则特征，确定待处理用户的时序行为特征，包括：获取所述待处理用户的行为数据，所述行为数据中包括多个行为事件以及所述多个行为事件的时序标识；基于所述待处理用户的行为数据中包括的行为事件以及行为事件的时序标识，确定所述待处理用户的时序关联规则；针对其中一个时序行为规则特征，执行以下操作：判断所述待处理用户的时序关联规则是否命中所述时序行为规则特征对应的时序行为规则；若是，则确定所述待处理用户具有所述时序行为规则特征；若否，则确定所述待处理用户不具有所述时序行为规则特征。本申请实施例提供的用户数据的处理装置60还可执行图2的方法，并实现用户数据的处理装置在图2所示实施例的功能，本申请实施例在此不再赘述。总之，以上所述仅为本申请的较佳实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitorymedia)，如调制的数据信号和载波。还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。本申请中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。当前第1页1 2 3

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王凯;何慧梅
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。