一种基于历史交易信息的用户分类管理方法与流程

文档序号:32337188发布日期:2022-11-26 08:26阅读:42来源:国知局
一种基于历史交易信息的用户分类管理方法与流程

1.本发明涉及数据处理技术领域,具体涉及一种基于历史交易信息的用户分类管理方法。


背景技术:

2.通过对电商平台用户的历史交易信息进行用户分类,可以提高对用户推荐商品的精准程度,提高电商平台的商品交易量。
3.但是现有的电商用户分类方法,在基于用户的历史交易信息进行用户分类时,通常采用消费信息匹配的方法对电商用户进行分类,但是由于不同用户消费习惯的多样性,会导致常规分类方法进行消费信息匹配时,无法准确有效的区分用户消费习惯。
4.进而本方案提出了一种基于历史交易信息的用户分类管理方法,通过构建用户的图结构数据,求取不同用户之间的从属程度,完成对上述方法的优化,使得能够的区分用户消费习惯,完成了基于历史交易信息更加准确的用户分类结果。


技术实现要素:

5.为了解决上述技术问题,本发明的目的在于提供一种基于历史交易信息的用户分类管理方法,所采用的技术方案具体如下:一种基于历史交易信息的用户分类管理方法,所述方法包括:采集每个用户的历史交易信息,所述每个用户的历史交易信息包含每个用户购买的商品类型以及对每种类型商品的购买时间,根据每个用户的历史交易信息得到每个用户的第一完全无向图;对每个用户的第一完全无向图进行修建得到每个用户的第二完全无向图,根据所有用户的第二完全无向图得到每个用户的具有多样的消费习惯用户集合;根据每个用户的具有多样的消费习惯用户集合得到用户之间的从属程度;根据用户之间的从属程度构建用户消费关系完全无向图,根据用户消费关系完全无向图得到多个用户类型。
6.优选的,所述根据每个用户的历史交易信息得到每个用户的第一完全无向图的公式,包括:在所有用户历史交易信息集合中获取所有用户购买的商品类型集合,获取每个用户的对每种类型商品的购买时间,将所述商品类型集合中任意两种类型商品的随机组合得到商品类型对,根据每个用户对每个商品类型对中两种类型商品的购买时间得到所述商品类型对的间隔时间值集合,所述间隔时间值集合包含多个间隔时间值,对商品类型对的多个间隔时间值进行统计得到购买间隔时间直方图,根据购买间隔时间直方图得到所述商品类型对的时间间隔值平均值,获取间隔时间值集合中包含间隔时间值的总个数记为商品类型对的第一数量;将商品类型对的第一数量和时间间隔值平均值构成二维向量记为权值向量;
以每种类型商品为节点,以权值向量为变权值构建第一完全无向图。
7.优选的,所述根据每个用户的具有多样的消费习惯用户集合得到用户之间的从属程度的方法,包括:将所述用户第二完全无向图与每个多样的消费习惯用户的第二完全无向图中相同的子图拆分出来得到相同子图集合,将相同子图集合中同一子图构成子图对,得到多个子图对,每个子图对中两个子图的对应边的边权值相减得到差值向量,将差值向量中两个维度的值相乘得到的乘积值作为所述子图对每个对应边的综合差异,将综合差异进行负相关映射得到所述子图对每个对应边的匹配值,将子图对所有对应边的匹配值求均值得到每个子图对的第一匹配值,将相同子图集合中所有子图对的第一匹配值的均值作为所述用户与每个多样的消费习惯用户的从属程度,即用户之间的从属程度。
8.优选的,所述对每个用户的第一完全无向图进行修建得到每个用户的第二完全无向图的方法,包括:将所述用户的第一完全无向图中第一边的边删除得到中间完全无向图,所述第一边是指无向图中边权值其中一个元素为0的边,将中间完全无向图中孤立的节点删除得到第二完全无向图。
9.优选的,所述根据所有用户的第二完全无向图得到每个用户的具有多样的消费习惯用户集合的方法,包括:获取每个用户第二完全无向图的边的个数,根据所有用户的第二完全无向图的边的个数对所有用户从小到大排列得到第一用户序列,将每个用户位置次序大于所述用户的所有用户构成的集合记为每个用户的具有多样的消费习惯用户集合,所述每个用户的具有多样的消费习惯用户集合由多个具有多样的消费习惯用户构成。
10.优选的,所述根据用户之间的从属程度构建用户消费关系完全无向图的公式,包括:以每个用户为节点,以用户之间的从属程度为边权值构建完全无向图,记为用户消费关系完全无向图。
11.优选的,所述根据用户消费关系完全无向图得到多个用户类型的方法,包括:利用最大流对用户消费关系完全无向图进行分割得到多个分割块,将每个分割块的所有节点对应的用户作为一种用户类型,得到多个用户类型。
12.本发明上述的技术方案具有如下有益效果:根据用户的历史交易信息,得到不同用户的购物习惯图结构数据表示,进而根据不同用户的购物习惯图结构数据,得到不同用户在消费习惯的从属程度,提高了在依据用户消费习惯进行用户分类时的分类准确度。
附图说明
13.为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
14.图1为本发明一个实施例所提供的一种基于历史交易信息的用户分类管理方法流程图。
具体实施方式
15.为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种基于历史交易信息的用户分类管理方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构、或特点可由任何合适形式组合。
16.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
17.下面结合附图具体的说明本发明所提供的一种基于历史交易信息的用户分类管理方法的具体方案。
18.请参阅图1,其示出了本发明一个实施例提供的一种基于历史交易信息的用户分类管理方法流程图,该方法包括:步骤s001:采集得到每个用户的历史交易信息。
19.由电商平台可以得到每个用户在不同时间点对不同商品类型的购买时间,采集每个用户购买历史交易信息,所述每个用户的历史交易信息包含每个用户购买的商品类型以及对每种类型商品的购买时间。
20.步骤s002:根据每个用户的历史交易信息得到每个用户的第一完全无向图。
21.具体步骤如下:以单个类型商品为节点建立一个第一完全无向图用于表示当前用户的历史交易信息,所述第一完全无向图的边权值的计算方法如下:两个节点的边权值用于表示用户同时或者短时间内购买两个节点对应商品之间的特征,以此表达该客户的购物习惯。
22.将第个用户第类型的商品的购买时间按时间顺序排列得到每个类型商品的购买时间序列,以购买时间序列中第个元素的元素对获取方法为例来说明,在时间序列中获取处与元素下一个位置的元素,在第个用户某一个非第个类型的商品的购买时间序列中获取与元素之间间隔时间最小的元素作为一个可能元素,所有的非第个类型的商品的购买时间序列得到的所有可能元素构成可能元素集合,需要说明的是可能元素集合中各元素的购买时间均大于元素的购买时间,在可能元素集合中选取处于元素和购买时间之间的且购买时间最小的元素作为元素的第一元素,将元素与该元素的第一元素构成元素对。
23.通过元素对反应购买两个类型的商品之间没有购买其他商品,即购买一种类型商品后紧接着习惯购买另一种类型的商品,通过元素对来反应用户购买商品的购买习惯。
24.获取任意两个节点对应的两个类型的商品构成商品类型对;第个商品类型对中包含第类型商品和第类型商品,根据类型商品的购买时间序列与类型商品的购
买时间序列得到第个商品类型对的元素对集合。
25.根据第个商品类型对的元素对集合中的第个元素对得到一个购买时间间隔,对第个商品类型对的元素对集合所有购买时间间隔进行统计得到第个商品类型对的购买间隔时间直方图,该直方图的横坐标为排序后购买间隔时间值,其直方图的纵坐标为各购买间隔时间值对应的个数值。
26.如果在直方图中购买间隔时间越小处的个数越多,则表示当前客户短时间内购买该两个商品的频率越高。如果在直方图中购买间隔时间越大处的个数越多,则表示当前客户具有间隔较长时间购买该两个商品的频率越高。
27.根据第个商品类型对的购买间隔时间直方图计算得到第个商品类型对的购买时间间隔值的平均值,通过该值反应用户购买第个商品类型对中两种商品的购买时间间隔,即用户购买其中一种商品后,习惯在间隔后再购买另一种对应商品,通过该数据反应用户的购买习惯,获取第个商品类型对的元素对集合中元素对的个数作为购买时间间隔值的总个数值,记为第一数量,该值越大说明用户习惯购买第个商品类型对中的一种商品后购买该商品类型对中的另一种商品,将商品类型对的第一数量和时间间隔值平均值构成二维向量记为权值向量:平均值构成二维向量记为权值向量:表示第个用户的第一完全无向图的第个商品类型对的购买时间间隔值的平均值,其值越大,表示每次购买的间隔时间越长。因反映出的是一种消费习惯。
28.表示第个用户的第一完全无向图的第个商品类型对元素对的总个数值,其值越低,则表达当前用户具有购买两个商品的习惯可能性越低。
29.以权值向量作为第个用户的第一完全无向图的第个商品类型对中两商品类型之间连线的边权值。
30.步骤s003:根据每个用户的具有多样的消费习惯用户集合得到用户之间的从属程度。
31.如果消费类似,则会导致完全无向图中部分边权的关系呈现等比或者近似等比表示消费习惯近似,进而建立用户之间消费关系的从属程度,进而用户分类。
32.1、对每个用户的第一完全无向图进行修剪处理得到第二完全无向图。
33.将每个用户的第一完全无向图中第一边的边删除得到中间完全无向图,所述第一边是指无向图中边权值的购买时间间隔值的总个数值为0的边,将中间完全无向图中孤立的节点删除得到第二完全无向图。
34.2、根据第二完全无向图得到每个用户的从属程度。
35.获取每个用户第二完全无向图的边的个数,根据所有用户的第二完全无向图的边
的个数对所有用户从小到大排列得到第一用户序列,将每个用户位置次序大于该用户的所有用户构成的集合记为每个用户的具有多样的消费习惯用户集合,所述每个用户的具有多样的消费习惯用户集合由多个具有多样的消费习惯用户构成。
36.将所述用户第二完全无向图与每个多样的消费习惯用户的第二完全无向图中相同的子图拆分出来得到相同子图集合,所述相同的子图是指两个第二完全无向图节点相同且连接边相同的部分图结构,需要说明的是连接边相同并不代表连接边的边权值相同,将相同子图集合中同一子图构成子图对,得到多个子图对,每个子图对中两个子图的对应边的边权值相减得到差值向量,将差值向量中两个维度的值相乘得到的乘积值,将乘积值作为所述子图对每个对应边的综合差异,将综合差异进行负相关映射处理得到所述子图对每个对应边的匹配值,负相关处理计算公式为:将子图对所有对应边的匹配值求均值得到每个子图对的第一匹配值,将相同子图集合中所有子图对的第一匹配值的均值作为所述用户与每个多样的消费习惯用户的从属程度,即用户之间的从属程度,从属程度越大说明用户的之间存在较多边权值相近的子图,因而两个用户之间的消费习惯相近。
37.步骤s004:根据用户之间从属程度构建用户消费关系完全无向图,根据用户消费关系完全无向图得到多个用户类型。
38.在完全无向图中,如果两个节点之间的边权值越低,则表示对应两个用户消费习惯差异较大,所以不应当被分为一类,如果两个节点之间的边权值越高,则表示对应两个用户消费习惯差异较小,应当被分为一类。
39.以每个用户为节点,以用户之间的从属程度为边权值构建完全无向图,记为用户消费关系完全无向图。在户消费关系完全无向图中,如果两个节点之间的边权值越低,则表示对应两个用户消费习惯越相近,所以应当被分为一类,如果两个节点之间的边权值越高,则表示对应两个用户消费习惯差异较大,应当不被分为一类。
40.利用最大流的图割方法对用户消费关系完全无向图进行分割得到多个分割块,将每个分割块的所有节点对应的用户作为一种用户类型,得到多个用户类型。
41.综上所述,本发明实施例根据用户的历史交易信息,得构数据表示,进而根据不同用户的购物习惯图结构数据,得到不同用户在消费习惯的从属程度,提高了在依据用户消费习惯进行用户分类时的分类准确度。
42.需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实施例的优劣。在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
43.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
44.以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1