基于图的分析用户的方法和系统的制作方法

文档序号:9911688阅读:323来源:国知局
基于图的分析用户的方法和系统的制作方法
【技术领域】
[0001]本发明的实施例涉及数据分析,并且具体地涉及基于图的分析用户的方法和系统。
【背景技术】
[0002]随着大数据技术的快速发展,面向用户个人的数据分析成为可能。传统的用户分析通过贝叶斯、决策树等方法进行用户的分类和聚类,发现用户之间的关联关系。然而,在大规模数据的情况下,面向用户个体的关联分类算法难以进行有效的处理,其往往花费很长的计算时间。特别是,面向迭代类型的模型算法在处理大规模数据时的效率极其低下。另夕卜,一旦用户信息的被更新,则需要重新计算用户的关联分类,这将极大影响结果数据的效用。

【发明内容】

[0003]根据本发明的一个实施例,公开一种基于图的分析用户的方法,维护以对象为顶点,对象与对象之间的关联信息为边的图,其中,所述对象包括用户和商户,所述边指示用户和商户的关联关系,所述方法包括:A.数据特征解析过程,包括:对用户、商户、以及用户与和商户之间发生的数据记录进行解析,获取关键信息,其中,关键信息包括用户标识、商户标识、在用户与商户之间产生的消费信息;利用获取的关键信息产生该图的顶点信息和边信息,其中将用户标识和商户标识作为顶点信息、将消费信息作为边信息;B.关联分析过程,包括:至少基于与第一用户关联的一个或多个商户,分析该第一用户与其它用户关联。
[0004]根据本发明的一个实施例,公开基于图的分析用户的系统,维护以对象为顶点,对象与对象之间的关联信息为边的图,其中,所述对象包括用户和商户,所述边指示用户和商户的关联关系,所述系统包括:A.数据特征解析模块,被配置成:对用户、商户、以及用户与和商户之间发生的数据记录进行解析,获取关键信息,其中,关键信息包括用户标识、商户标识、在用户与商户之间产生的消费信息;利用获取的关键信息产生该图的顶点信息和边信息,其中将用户标识和商户标识作为顶点信息、将消费信息作为边信息;B.关联分析模块,被配置成:至少基于与第一用户关联的一个或多个商户,分析该第一用户与其它用户关联。
[0005]本发明的技术方案通过缩短数据更新以及数据分析的时间,有效提升数据的时效性,提高大数据环境下海量数据关联分析和分类分析的效率。通过构建用户和商户的关系图、强弱关联分析、边分割分类等方法加快了分析处理的速度。同时,基于可实时更新的图存储架构,可提供准实时的数据分析能力。
[0006]当结合附图阅读以下描述时也将理解本发明的实施例的其它特征和优势,其中附图借助于实例示出了本发明的实施例的原理。
【附图说明】
[0007]图1是根据本发明实施例的基于以对象为顶点,对象与对象之间的关联信息为边的图来分析用户的示意图。
[0008]图2是根据本发明实施例的基于图的分析用户的方法流程图。
[0009]图3是根据本发明实施例的基于图的分析用户的系统示意图。
【具体实施方式】
[0010]在下文中,将结合实施例描述本发明的原理。应当理解的是,给出的实施例只是为了本领域技术人员更好地理解并且实践本发明,而不是限制本发明的范围。例如,本说明书中包含许多具体的实施细节不应被解释为对发明的范围或可能被要求保护的范围的限制,而是应该被视为特定于实施例的描述。例如,在各实施例的上下文描述的特征可被组合在单一实施例中来实施。在单一实施例的上下文中描述的特征可在多个实施例来实施。
[0011]本发明提出基于图存储模型对要处理的数据的进行实时存储和更新。图是一种数据结构,定义为:graph= (V,E) J是一个非空有限集合,代表顶点(节点),E代表边的集合,一般用(Vx,Vy)表示,其中,Vx,Vy属于V。若两个结点U、V之间有一条边连接,则称这两个结点U、V是关联的。可以用带权图表示两个相邻顶点之间的除连接关系以外的其它关系。
[0012]基于这样的概念,本发明提出维护以对象为顶点,对象与对象之间的关联信息为边的图,以便基于图的关联模型和算法进行对象(用户或者商户)之间的关联分析来提高数据分析的性能和效率。在本发明中,用户可以是例如银行卡的用户或者任何使用网络服务(例如,网上购物)的用户,商户可以是提供产品或者服务的任何实体(例如,实体商户或者网络商户)。
[0013]图1是根据本发明实施例的基于以对象为顶点,对象与对象之间的关联信息为边的图来分析用户的示意图。图1示出用户1-7、商户1-4,该11个对象通过用户的消费(购买产品或者服务)行为被联系起来,并且形成图。例如,用户I在商户I消费后,则建立用户I与商户I的连接。图1中的图的顶点代表对象,顶点与顶点之间的边指示这两个顶点之间的关联信息。例如,将用户标识和商户标识作为顶点信息。作为边信息的关联信息可以是用户与商户之间发生的消费的信息。例如,用户在商户的消费事件发生的时间、时段、地点、频率,消费金额,消费商品种类,或者商户标识。本发明提出根据用户的消费行为特征产生以用户和商户为顶点的图,并且根据该图来估计用户和商户、用户和用户之间的关联性。
[0014]在图1示出的示例中,可以根据特定分析的需求,根据商户标识和消费信息来过滤图1中的顶点。
[0015]在一个示例中,当分析用户I时,可以首先过滤具有特定商户标识的商户3(例如,便利店),然后在剩下的与用户I关联的商户中,查找与用户I具有预定数量以上(较强的关联度)的共同关联商户的用户。例如,预定数量可以设置为3,那么在该示例中,用户4与用户I的关联度较强。
[0016]在一个示例中,直接指定分析与商户2相关的用户之间的关系。然后,可以设置过滤条件为在一定时间段之内在商户2消费的金额大于预定值(较强的关联度)。根据该过滤条件,考虑用户1、4、5、7与商户2之间的消费信息(边信息),可以知道用户1、4、5、7中哪些用户关于商户2关联度较强。
[0017]本领域技术人员可以理解的是,还可以基于商户标识和消费信息的一项或多项信息(例如,时间、时段、地点、频率,消费金额,消费商品种类的一个或多个以及它们的各种组合)来分析一个用户与商户、以及该用户与其它用户之间的关联关系。
[0018]通过基于图的关联分析,可以快速地分析用户群体、特定用户的喜好趋势、潜在喜好。为促进对本发明的理解,下文还将描述其它示例。但这些示例不应被视为是限制性的。
[0019]图2是根据本发明实施例的基于图的分析用户的方法流程图。在该方法中,维护以对象为顶点,对象与对象之间的关联信息为边的图,其中,所述对象包括用户和商户,所述边指示用户和商户的关联关系,所述方法包括数据特征解析过程200和关联分析过程300。
[0020]数据特征解析过程200,包括:
[0021]步骤210:对用户、商户、以及用户与和商户之间发生的数据记录进行解析,获取关键信息,其中,关键信息包括用户标识、商户标识、在用户与商户之间产生的消费信息;
[0022]步骤220:利用获取的关键信息产生该图的顶点信息和边信息,其中将用户标识和商户标识作为顶点信息、将消费信息作为边信息;
[0023]关联分析过程300,包括:至少基于与第一用户关联的一个或多个商户,分析该第一用户与其它用户关联。
[0024]在一个实施例中,关联分析过程300包括:
[0025]步骤310:相对于第一用户,根据预定条件过滤商户。
[0026]步骤320:相对于第一用户,根据预定条件过滤其它用户。
[0027]由此,通过为商户标识和消费信息设置过滤条件,可以在图中迅速地第一用户进行分析,找出与第一用户具有较强关联性的商户或者其它用户。
[0028]在一个示例中,在关联分析过程中,根据商户标识过滤与第一用户关联的所述一个或多个商户,得到经过滤的一个或多个商户。例如,通过商户标识,将便利店、特定百货商场、公共事业缴费单位、特定酒店从所述一个或多个商户排除。这些被排除的商户在特定的分析中可以被视为与第一用户具有弱关联度或者分析价值较低的对象。然而,根据分析需求的不同,在其它示例中,可以将这些商户纳入考虑范围。
[0029]在另一个示例中,在关联分析过程中,根据消费信息过滤与第一用户关联的所述一个或多个商户,得到经过滤的一个或多个商户。例如,将消费信息中的单比消费金额的数额小于预定值的商户排除,和/或将消费信息中最后消费事件发生时间在特定时间以前的商户排除。可选的,消费信息中的消费频率、消费产品或者服务的类型也可以被纳入考虑范围。
[0030]可以理解的是,可以结合商户标识和消费信息筛选与第一用户相关联的商户中的商户。如上所述,可以通过为商户标识和消费信息设置过滤条件,可以在图中迅速地第一用户进行分析,找出与第一用户具有较强关联性或者是符合特定关联性的商户。
[0031]在一个实施例中,在关联分析过程中,在图中确定与该经过滤的一个或多个商户关联的其它用户。通过首先确定商户,再将第一用户关联至其它用户,可以大大减少计算量、提高分析效率。
[0032]在一个示例中,在关联分析过程中,进一步根据商户标识,从其它用户中选择与所述第一用户具有强关联性的用户,其中根据以下预置条件确定所述第一用户和另一用户具有强关联性:所述第一用户和另一用户共同关联的商户数量超过预定值。例如,将与所述第一用户共同关联的商户数量超过5家的用户视为满足特定分析目标的群体。
[0033]在另一个示例中,在关联分析过程中,进一步根据消费信息,来判断所述第一用户与其它用户的关联性的强弱。例如,对于同一商户,当判断所述第一用户与另一用户在特定时间段(例如,在两个日期之间,或者一天的某个时段之间)内的消费频率处于相同范围内(例如,一个月消费5至10次)时,将两者视为具有强的关联性。又例如,对于同一商户,当判断所述第一用户与另一用户在特定时间段内的消费金额处于相同范围内(例如,一个月消费5至10次)时,将两者视为具有强的关联性。又例如,对于同一商户,当判断所述第一用户与另一用户的消费的产品或者服务的类型相同时,将两者视为具有强的关联性。可以理解的是,可以结合一个或多个消费因素来判断用户之间的关联性。例如,还可以将消费事件的地点纳入考虑范围。
[0034]以下描述一个根据本发明一个或多
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1