一种消费商户预测方法和装置与流程

文档序号:12470477阅读:113来源:国知局
一种消费商户预测方法和装置与流程
本发明实施例涉及电子商务
技术领域
,尤其涉及一种消费商户预测方法和装置。
背景技术
:目前,消费者在电子支付过程中,产生了大量交易数据,如何利用这些历史交易数据预测和指导消费者购买行为,为后续营销活动提供给支持,是电子商务和传统商务的一个重点研究领域,对商户具有重要意义。现有技术中,在利用历史交易数据进行消费预测时,一般基于消费者偏好的分析,即基于历史交易数据中消费者经常消费的商户进行消费预测,而忽略了商户间存在的关联关系,具有一定的局限性。综上所述,目前在利用历史交易数据进行消费预测时,由于只对消费者的偏好进行分析,而忽略商户间存在的关联关系,降低了预测的准确性。技术实现要素:本发明实施例提供一种消费商户预测方法和装置,用以实现通过在利用历史交易数据进行消费预测,加入商户间存在的关联关系,从而提高预测的准确性。本发明实施例提供一种消费商户预测方法,包括:接收第一用户在第一商户的交易记录;从所述第一用户的历史消费记录中确定所述第一商户的第一关联商户集及第一关联商户集中的各关联商户组的第一关联置信度;从所有用户的历史消费记录中确定所述第一商户的第二关联商户集及第二关联商户集中的各关联商户组的第二关联置信度;针对所述第一关联商户集和所述第二关联商户集中的每个关联商户组,根据该关联商户组的第一关联置信度和/或第二关联置信度,确定该关联商户组的总关联置信度;根据各关联商户组的总关联置信度,确定所述第一商户的预测商户。较佳的,从所述第一用户的历史消费记录中确定所述第一商户的第一关联商户集,包括:从基于所述第一用户的历史消费记录所建立的第一关联商户规则表中查询所述第一商户的第一关联商户集;所述第一关联商户规则表通过以下方式建立:针对所述第一用户在每个周期的历史消费记录,均建立第一商户列表,并将建立的所有第一商户列表,组成第一事务集合;从所述第一商户列表中选取以第二商户为起始节点的商户组,所述第二商户为所述第一用户在历史消费记录中的任一消费商户;针对每个商户组,判断所述商户组的支持度是否大于第一阈值,若是,则将所述商户组加入到所述第二商户的第一关联商户集中,所述商户组的支持度是将所述商户组在所有第一商户列表中出现的次数与所述第一事务集合中所有第一商户列表的总数进行相除所得到的;获取所有商户的第一关联商户集,并确定所有商户的第一关联商户集中各商户组的第一关联置信度;判断所有商户的第一关联商户集中各商户组的第一关联置信度是否大于第二阈值,若是,则根据第一关联置信度大于第二阈值的商户组,构建所述第一关联商户规则表。较佳的,所述从所述第一用户的历史消费记录中确定第一关联商户集中的各关联商户组的第一关联置信度,包括:针对每个以所述第二商户为起始节点的商户组,确定所述商户组在所有第一商户列表中出现的次数,并确定所述第二商户在所有第一商户列表中所出现的次数;根据确定的所述商户组在所有第一商户列表中出现的次数,以及确定的所述第二商户在所有第一商户列表中所出现的次数,确定所述各关联商户的第一关联置信度。较佳的,从所有用户的历史消费记录中确定所述第一商户的第二关联商户集,包括:从基于所有用户的历史消费记录所建立的第二关联商户规则表中查询所述第一商户的第二关联商户集;所述第二关联商户规则表通过以下方式建立:从所有用户的历史消费记录中获取每个用户的第二商户列表,并根据获取的所有第二商户列表,确定第二事务集合;从所述第二商户列表中选取以第三商户为起始节点的商户组,所述第三商户为所述所有用户的第二商户列表中的任一消费商户;针对每个商户组,判断所述商户组的支持度是否大于第三阈值,若是,则将所述商户组加入到所述第三商户的第二关联商户集中,所述商户组的支持度是将所述商户组在所有第二商户列表中出现的次数与所述第二事务集合中所有第二商户列表的总数进行相除所得到的;获取所有商户的第二关联商户集,并确定所有商户的第二关联商户集中各商户组的第二关联置信度;判断所有商户的第二关联商户集中各商户组的第二关联置信度是否大于第四阈值,若是,则根据第二关联置信度大于第四阈值的商户组,构建所述第二关联商户规则表。较佳的,所述针对所述第一关联商户集和所述第二关联商户集中的每个关联商户组,根据该关联商户组的第一关联置信度和/或第二关联置信度,确定该关联商户组的总关联置信度;包括:确定所述第一关联商户规则表的权重值,以及确定第二关联商户规则表的权重值;判断所述第一关联商户规则表中与所述第二关联商户规则表中是否存在相同关联商户组,若存在,则根据该关联商户组的第一关联置信度、所述第一关联商户规则表的权重值、该关联商户组的第二关联置信度以及所述第二关联商户规则表的权重值确定该商户组的总关联置信度,否则,针对所述第一关联商户规则表中的关联商户组,则根据该关联商户组的第一关联置信度确定该关联商户组的总关联置信度,针对所述第二关联商户集中的关联商户组,则根据该关联商户组的第二关联置信度确定该关联商户组的总关联置信度。本发明实施例提供一种消费商户预测装置,包括:接收模块,用于接收第一用户在第一商户的交易记录;确定模块,用于从所述第一用户的历史消费记录中确定所述第一商户的第一关联商户集及第一关联商户集中的各关联商户组的第一关联置信度;还用于从所有用户的历史消费记录中确定所述第一商户的第二关联商户集及第二关联商户集中的各关联商户组的第二关联置信度;还用于针对所述第一关联商户集和所述第二关联商户集中的每个关联商户组,根据该关联商户组的第一关联置信度和/或第二关联置信度,确定该关联商户组的总关联置信度;预测模块,用于根据各关联商户组的总关联置信度,确定所述第一商户的预测商户。较佳的,所述确定模块,具体用于:从基于所述第一用户的历史消费记录所建立的第一关联商户规则表中查询所述第一商户的第一关联商户集;所述第一关联商户规则表通过以下方式建立:针对所述第一用户在每个周期的历史消费记录,均建立第一商户列表,并将建立的所有第一商户列表,组成第一事务集合;从所述第一商户列表中选取以第二商户为起始节点的商户组,所述第二商户为所述第一用户在历史消费记录中的任一消费商户;针对每个商户组,判断所述商户组的支持度是否大于第一阈值,若是,则将所述商户组加入到所述第二商户的第一关联商户集中,所述商户组的支持度是将所述商户组在所有第一商户列表中出现的次数与所述第一事务集合中所有第一商户列表的总数进行相除所得到的;获取所有商户的第一关联商户集,并确定所有商户的第一关联商户集中各商户组的第一关联置信度;判断所有商户的第一关联商户集中各商户组的第一关联置信度是否大于第二阈值,若是,则根据第一关联置信度大于第二阈值的商户组,构建所述第一关联商户规则表。较佳的,所述确定模块,具体用于:针对每个以所述第二商户为起始节点的商户组,确定所述商户组在所有第一商户列表中出现的次数,并确定所述第二商户在所有第一商户列表中所出现的次数;根据确定的所述商户组在所有第一商户列表中出现的次数,以及确定的所述第二商户在所有第一商户列表中所出现的次数,确定所述各关联商户的第一关联置信度。较佳的,所述确定模块,具体用于:从基于所有用户的历史消费记录所建立的第二关联商户规则表中查询所述第一商户的第二关联商户集;所述第二关联商户规则表通过以下方式建立:从所有用户的历史消费记录中获取每个用户的第二商户列表,并根据获取的所有第二商户列表,确定第二事务集合;从所述第二商户列表中选取以第三商户为起始节点的商户组,所述第三商户为所述所有用户的第二商户列表中的任一消费商户;针对每个商户组,判断所述商户组的支持度是否大于第三阈值,若是,则将所述商户组加入到所述第三商户的第二关联商户集中,所述商户组的支持度是将所述商户组在所有第二商户列表中出现的次数与所述第二事务集合中所有第二商户列表的总数进行相除所得到的;获取所有商户的第二关联商户集,并确定所有商户的第二关联商户集中各商户组的第二关联置信度;判断所有商户的第二关联商户集中各商户组的第二关联置信度是否大于第四阈值,若是,则根据第二关联置信度大于第四阈值的商户组,构建所述第二关联商户规则表。较佳的,所述确定模块,具体用于:确定所述第一关联商户规则表的权重值,以及确定第二关联商户规则表的权重值;判断所述第一关联商户规则表中与所述第二关联商户规则表中是否存在相同关联商户组,若存在,则根据该关联商户组的第一关联置信度、所述第一关联商户规则表的权重值、该关联商户组的第二关联置信度以及所述第二关联商户规则表的权重值确定该商户组的总关联置信度,否则,针对所述第一关联商户规则表中的关联商户组,则根据该关联商户组的第一关联置信度确定该关联商户组的总关联置信度,针对所述第二关联商户集中的关联商户组,则根据该关联商户组的第二关联置信度确定该关联商户组的总关联置信度。上述实施例提供的一种消费商户预测方法和装置,包括:接收第一用户在第一商户的交易记录;从所述第一用户的历史消费记录中确定所述第一商户的第一关联商户集及第一关联商户集中的各关联商户组的第一关联置信度;从所有用户的历史消费记录中确定所述第一商户的第二关联商户集及第二关联商户集中的各关联商户组的第二关联置信度;针对所述第一关联商户集和所述第二关联商户集中的每个关联商户组,根据该关联商户组的第一关联置信度和/或第二关联置信度,确定该关联商户组的总关联置信度;根据各关联商户组的总关联置信度,确定所述第一商户的预测商户。可以看出,在利用历史交易数据进行消费预测时,分析和挖掘商户间潜在的关联关系,并结合每个用户的个人历史消费记录,挖掘针对消费者个人的商户关联关系,最后根据获得的关联关系和概率知识,推理和计算消费者在特定商户消费的概率,进而针对该特定商户进行消费预测,从而能够提高预测的准确性。附图说明为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍。图1为本发明实施例提供的一种消费商户预测方法流程示意图;图2为本发明实施例提供的建立第一关联商户规则表的方法流程示意图;图3为本发明实施例提供的建立第二关联商户规则表的方法流程示意图;图4为本发明实施例提供的贝叶斯网络的结构示意图;图5为本发明实施例提供的一种消费商户预测装置的结构示意图。具体实施方式为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。需要说明的是,本发明实施例中在描述商户组时,为了描述简便起见,是以商户组中包含两个商户为例,但在具体实施时,商户组中也可以包含三个商户或者多个商户,即为了描述简便起见所描述的包含的两个商户的商户组不得用于对本发明实施例中的商户组进行限定。图1示例性示出了本发明实施例提供的一种消费商户预测方法流程示意图,如图1所示,该方法可包括:S101、接收第一用户在第一商户的交易记录。S102、从第一用户的历史消费记录中确定第一商户的第一关联商户集及第一关联商户集中的各关联商户组的第一关联置信度。S103、从所有用户的历史消费记录中确定第一商户的第二关联商户集及第二关联商户集中的各关联商户组的第二关联置信度。S104、针对第一关联商户集中和第二关联商户集中的每个关联商户组,根据该关联商户组的第一关联置信度和/或第二关联置信度,确定该关联商户组的总关联置信度。S105、根据各关联商户组的总关联置信度,确定第一商户的预测商户。在上述步骤S102中,在从第一用户的历史消费记录中确定第一商户的第一关联商户集时,可从基于第一用户的历史消费记录所建立的第一关联商户规则表中查询第一商户的第一关联商户集。在上述步骤S103中,在从所有用户的历史消费记录中确定第一商户的第二关联商户集时,可从基于所有用户的的历史消费记录所建立的第二关联商户规则表中查询第一商户的第二关联商户集。基于第一用户的历史消费记录所建立的第一关联商户规则表的建立过程,可参见图2。图2示例性示出了本发明实施例中建立第一关联商户规则表的方法流程示意图,如图2所示,该方法可包括:S201、针对第一用户在每个周期的历史消费记录,均建立第一商户列表,并将建立的所有第一商户列表,组成第一事务集合。S202、从第一商户列表中选取以第二商户为起始节点的商户组,所述第二商户为第一用户在历史消费记录中的任一消费商户。S203、针对每个商户组,判断该商户组的支持度是否大于第一阈值,若是,则转至步骤S205,否则,转至步骤S204。其中,商户组的支持度是将所述商户组在所有第一商户列表中出现的次数与第一事务集合中所有第一商户列表的总数进行相除所得到的。S204、将支持度小于第一阈值的商户组丢弃。S205、将所述商户组加入到第二商户的第一关联商户集中。S206、获取所有商户的第一关联商户集,并确定所有商户的第一关联商户集中各商户组的第一关联置信度。S207、判断所有商户的第一关联商户集中各商户组的第一关联置信度是否大于第二阈值,若是,则转至步骤S208,否则,转至步骤S209。S208、根据第一关联置信度大于第二阈值的商户组,构建第一关联商户规则表中。S209、将第一关联置信度小于第二阈值的商户组丢弃。其中,周期可以以“天”为单位,在周期以“天”为单位时,可将用户每天消费的商户,均建立第一商户列表;周期也可以以“星期”为单位,在周期以“星期”为单位时,可将用户每星期消费的商户,均建立第一商户列表;周期还可以以“月”为单位,在周期以“月”为单位时,可将用户每月消费的商户,均建立第一商户列表。上述步骤S206中,在确定所有商户的第一关联商户集中各商户组的第一关联置信度时,是将各商户组在所有第一商户列表中所出现的次数与各商户组的起始节点商户在所有第一商户列表中所出现的次数进行相除所得到的。例如,针对每个以第二商户为起始节点的商户组,首先确定该商户组在所有第一商户列表中所出现的次数以及第二商户在所有第一商户列表中所出现的次数,然后将该商户组在所有第一商户列表中所出现的次数与第二商户在所有第一商户列表中所出现的次数进行相除,便可得到以第二商户为起始节点的商户组的置信度。下面通过一个具体的例子(例一),对图2所示的方法流程进行详细的解释说明。例一在该例子中,首先假设第一阈值为0.5,第二阈值为0.3,并且假设以“天”为周期,进一步假设用户1在2016年11月16日~2016年11月20日,5天即5个周期的历史消费记录如下:2016年11月16日,用户1消费的商户包括:商户A、商户B、商户C、商户H;2016年11月17日,用户1消费的商户包括:商户A、商户B、商户D;2016年11月18日,用户1消费的商户包括:商户A、商户B、商户E;2016年11月19日,用户1消费的商户包括:商户I、商户F、商户C、商户H;2016年11月20日,用户1消费的商户包括:商户A、商户G、商户C、商户H。将用户1在2016年11月16日消费的商户组成商户列表1,即将“商户A、商户B、商户C、商户H”组成商户列表1;将用户1在2016年11月17日消费的商户组成商户列表2,即将“商户A、商户B、商户D”组成商户列表2;将用户1在2016年11月18日消费的商户组成商户列表3,即将“商户A、商户B、商户C”组成商户列表3;将用户1在2016年11月19日消费的商户组成商户列表4,即将“商户I、商户F、商户C、商户H”组成商户列表4;将用户1在2016年11月20日消费的商户组成商户列表5,即将“商户A、商户G、商户C、商户H”组成商户列表5。然后将商户列表1、商户列表2、商户列表3、商户列表4和商户列表5组成事务集合1。为了便于描述清楚,下面以表格的形式说明事务集合1中每个商户列表所包含的商户,事务集合1中每个商户列表所包含的商户可参见表格一。表格一然后选取以商户A为起始节点的商户组“AB”和商户组“AC”,以商户C为起始节点的商户组“CH”。针对商户组AB,由于商户组AB在商户列表1、商户列表2、商户列表3中均出现过,又由于事务集合1中商户列表的总数为5,因此商户组AB的支持度等于3/5,即商户组AB的支持度为0.6,由于0.6大于第一阈值0.5,因此,可将商户组AB加入到商户A的关联商户集中。同理,针对商户组AC,由于商户组AC在商户列表1、商户列表4、商户列表5中均出现过,又由于事务集合1中商户列表的总数为5,因此商户组AC的支持度等于3/5,即商户组AC的支持度为0.6,由于0.6大于第一阈值0.5,因此,可将商户组AC加入到商户A的关联商户集中。针对商户组CH,由于商户组CH在商户列表1、商户列表4、商户列表5中均出现过,又由于事务集合1中商户列表的总数为5,因此商户组CH的支持度等于3/5,即商户组CH的支持度为0.6,由于0.6大于第一阈值0.5,因此,可将商户组CH加入到商户C的关联商户集中。之后,计算商户组AB、商户组AC和商户组CH的第一关联置信度。针对商户组AB的第一关联置信度,由于商户组AB在商户列表1、商户列表2、商户列表3中均出现过,又由于商户A在商户列表1、商户列表2、商户列表3和商户列表5中均出现过,因此,商户组AB的置信度为3/4,即商户组AB的置信度为0.75,由于0.75大于第二阈值0.3,因此,可将商户组AB加入到第一关联商户规则表中。针对商户组AC的第一关联置信度,由于商户组AC在商户列表1、商户列表3、商户列表5中均出现过,又由于商户A在商户列表1、商户列表2、商户列表3和商户列表5中均出现过,因此,商户组AC的置信度也为3/4,即商户组AC的置信度也为0.75,由于0.75大于第二阈值0.3,因此,可将商户组AC加入到第一关联商户规则表中。针对商户组CH的第一关联置信度,由于商户组CH在商户列表1、商户列表4、商户列表5中均出现过,又由于商户C在商户列表1、商户列表3、商户列表4和商户列表5中均出现过,因此,商户组CH的置信度也为3/4,即商户组CH的置信度也为0.75,由于0.75大于第二阈值0.3,因此,可将商户组CH加入到第一关联商户规则表中。至此,第一关联商户规则表中所包含的商户组为商户组AB、商户组AC和商户组CH,且商户组AB的第一关联置信度为0.75,商户组AC的第一关联置信度也为0.75,商户组CH的第一关联置信度也为0.75。基于所有用户的的历史消费记录所建立的第二关联商户规则表的建立过程,可参见图3。图3示例性示出了本发明实施例中建立第二关联商户规则表的方法流程示意图,如图3所示,该方法可包括:S301、从所有用户的历史消费记录中获取每个用户的第二商户列表,并根据获取的所有第二商户列表,确定第二事务集合。S302、从第二商户列表中选取以第三商户为起始节点的商户组,所述第三商户为所有用户的第二商户列表中的任一消费商户。S303、针对每个商户组,判断该商户组的支持度是否大于第三阈值,若是,则转至步骤S305,否则转至步骤S304。其中,商户组的支持度是将所述商户组在所有第二商户列表中出现的次数与第二事务结合中所有第二商户列表的总数进行相除所得到的。S304、将支持度小于第三阈值的商户组丢弃。S305、将所述商户组加入到第三商户的第二关联商户集中。S306、获取所有商户的第二关联商户集,并确定所有商户的第二关联商户集中各商户组的第二关联置信度。S307、判断所有商户的第二关联商户集中各商户组的第二关联置信度是否大于第四阈值,若是,则转至步骤S308,否则,转至步骤S309。S308、根据第二关联置信度大于第四阈值的商户组,构建第二关联商户规则表中。S309、将第二关联置信度小于第四阈值的商户组丢弃。在上述步骤S301中,在从所有用户的历史消费记录中获取每个用户的第二商户列表时,可基于一段时间内的所有用户的历史消费记录中获取每个用户的第二商户列表,例如,可基于一年内的所有用户的历史消费记录中获取每个用户的第二商户列表,也可基于一个月内的所有用户的历史消费记录中获取每个用户的第二商户列表,还可基于三个月内的所有用户的历史消费记录中获取每个用户的第二商户列表,也可基于六个月内的所有用户的历史消费记录中获取每个用户的第二商户列表。在上述步骤S306中,在确定所有商户的第二关联商户集中各商户组的第二关联置信度时,是将各商户组在所有第二商户列表中所出现的次数与各商户组的起始节点商户在所有第二商户列表中所出现的次数进行相除所得到的。例如,针对每个以第三商户为起始节点的商户组,首先确定该商户组在所有第二商户列表中所出现的次数以及第三商户在所有第二商户列表中所出现的次数,然后将该商户组在所有第二商户列表中所出现的次数与第三商户在所有第二商户列表中所出现的次数进行相除,便可得到以第三商户为起始节点的商户组的置信度。下面通过一个具体的例子(例二),对图3所示的方法流程进行详细的解释说明。例二在该例子中,首先假设第三阈值为0.4,第四阈值为0.5,假设5个用户分别为用户2、用户3、用户4、用户5、用户6,并且假设该5个用户在历史上一年内的历史消费记录如下:用户2消费的商户包括:商户A、商户B、商户M;用户3消费的商户包括:商户A、商户B、商户X;用户4消费的商户包括:商户A、商户B、商户Y;用户5消费的商户包括:商户A、商户I、商户M;用户6消费的商户包括:商户A、商户Q、商户M;将用户2在历史上一年内的消费的商户组组成商户列表6,即将“商户A、商户B、商户M”组成商户列表6;将用户3在历史上一年内的消费的商户组组成商户列表7,即将“商户A、商户B、商户X”组成商户列表7;将用户4在历史上一年内的消费的商户组组成商户列表8,即将“商户A、商户B、商户Y”组成商户列表8;将用户5在历史上一年内的消费的商户组组成商户列表9,即将“商户A、商户I、商户M”组成商户列表9;将用户6在历史上一年内的消费的商户组组成商户列表10,即将“商户A、商户Q、商户M”组成商户列表10。然后将商户列表6、商户列表7、商户列表8、商户列表9和商户列表10组成事务集合2。为了便于描述清楚,下面以表格的形式说明事务集合2中每个商户列表所包含的商户,事务集合2中每个商户列表所包含的商户可参见表格二。表格二事务集合2商户商户列表6A、B、M商户列表7A、B、X商户列表8A、B、Y商户列表9A、I、M商户列表10A、Q、M然后选取以商户A为起始节点的商户组“AB”和商户组“AM”。针对商户组AB,由于商户组AB在商户列表6、商户列表7、商户列表8中均出现过,又由于事务集合2中商户列表的总数为5,因此商户组AB的支持度等于3/5,即商户组AB的支持度为0.6,由于0.6大于第一阈值0.4,因此,可将商户组AB加入到商户A的关联商户集中。同理,针对商户组AM,由于商户组AM在商户列表6、商户列表9、商户列表10中均出现过,又由于事务集合2中商户列表的总数为5,因此商户组AM的支持度等于3/5,即商户组AM的支持度为0.6,由于0.6大于第三阈值0.4,因此,可将商户组AM加入到商户A的关联商户集中。之后,计算商户组AB和商户组AM的第二关联置信度。针对商户组AB的第一关联置信度,由于商户组AB在商户列表6、商户列表7、商户列表8中均出现过,又由于商户A在商户列表6、商户列表7、商户列表8、商户列表9、商户列表10中均出现过,因此,商户组AB的置信度为3/5,即商户组AB的置信度为0.6,由于0.6大于第四阈值0.5,因此,可将商户组AB加入到第二关联商户规则表中。同理,针对商户组AM的第一关联置信度,由于商户组AM在商户列表6、商户列表9、商户列表10中均出现过,又由于商户A在商户列表6、商户列表7、商户列表8、商户列表9、商户列表10中均出现过,因此,商户组AM的置信度为3/5,即商户组AM的置信度为0.6,由于0.6大于第四阈值0.5,因此,可将商户组AM加入到第二关联商户规则表中。至此,第二关联商户规则表中所包含的商户组为商户组AB和商户组AM,且商户组AB的第二关联置信度为0.6,商户组AM的第二关联置信度也为0.6。需要注意的是,在建立第一关联商户规则表的过程中所使用到的第一阈值与在建立第二关联商户规则表的过程中所使用到的第三阈值可以相同也可以不同,同理,在建立第一关联商户规则表的过程中所使用到的第二阈值与在建立第二关联商户规则表的过程中所使用到的第四阈值可以相同也可以不同。而在建立第一关联商户规则表的过程中所使用到的第一阈值与建立第一关联商户规则表的过程中所使用到的第二阈值则没有任何关系;同理,在建立第二关联商户规则表的过程中所使用到的第三阈值与建立第二关联商户规则表的过程中所使用到的第四阈值则没有任何关系。在建立第一关联商户规则表和第二关联商户规则表之后,为了计算第一关联商户规则表和第二关联商户规则表中各商户组的总关联置信度,还需确定第一关联商户规则表的权重值w1和第二关联商户规则表的权重值w2。需要注意的是,在确定第一关联商户规则表的权重值w1和第二关联商户规则表的权重值w2时,需满足w1+w2=1。针对第一用户而言,首先基于第一关联商户规则表中的商户组构建贝叶斯网络,即将第一关联商户规则表中各商户组中的商户作为贝叶斯网络的节点,并将商户组的关联规则作为节点之间的有向边,在将第一关联商户规则表中的商户组加入到贝叶斯网络节点之后,将第二关联商户规则表中满足条件的商户组加入到贝叶斯网络节点,其中,第二关联商户规则表中满足条件的商户组为第二关联商户规则表中的商户组中的起始节点已经出现在贝叶斯网络中,并且该起始节点并未被标记为特殊节点。在构建贝叶斯网络时,判断第一关联商户规则表与第二关联商户规则表中是否存在相同商户组,若存在,则根据该商户组在第一关联商户规则表中的第一关联置信度、第一关联商户规则表的权重值w1、以及该商户组在第二关联商户规则表中的第二关联置信度、第二关联商户规则表的权重值w2共同确定该商户组的总关联置信度。否则,针对第一关联商户规则表中的关联商户组,根据商户组在第一关联商户规则表中的第一关联置信度和第一关联商户规则表的权重值w1确定该商户组的总关联置信度,而针对第二关联商户规则表中的关联商户组,根据商户组在第二关联商户规则表中的第二关联置信度和第二关联商户规则表的权重值w2确定该商户组的总关联置信度。具体的,若第一关联商户规则表与第二关联商户规则表中存在相同商户组,针对该商户组的总关联置信度,可根据下列公式一计算得到。Z=w1Z1+w2Z2(公式一)其中,w1为预先设定的第一关联商户规则表的权重值,Z1为商户组在第一关联商户规则表中的第一关联置信度,w2为预先设定的第二关联商户规则表的权重值,Z2为该商户组在第二关联商户规则表中的第二关联置信度,Z为该商户组的总关联置信度。若第一关联商户规则表与第二关联商户规则表中不存在相同商户组,则针对第一关联商户规则表中的关联商户组的总关联置信度,可根据下列公式二计算得到。P1=w1Z1(公式二)其中,w1为预先设定的第一关联商户规则表的权重值,Z1为商户组在第一关联商户规则表中的第一关联置信度,P为该商户组的总关联置信度。若第一关联商户规则表与第二关联商户规则表中不存在相同商户组,则针对第二关联商户规则表中的关联商户组的总关联置信度,可根据下列公式三计算得到。P2=w2Z2(公式三)其中,w2为预先设定的第二关联商户规则表的权重值,Z2为该商户组在第二关联商户规则表中的第二关联置信度,P2为该商户组的总关联置信度。基于上述例一和例二所得到的第一关联规则表和第二关联规则表的基础上,下面通过一个具体的例子(例三)介绍贝叶斯网络的构建过程。例三在该例子中假设第一关联商户规则表的权重值w1的值为0.6,第二关联商户规则表的权重值w2的值为0.4。通过例一可知,第一关联商户规则表中所包含的商户组为商户组AB、商户组AC和商户组CH,且商户组AB的第一关联置信度为0.75,商户组AC的第一关联置信度也为0.75,商户组CH的第一关联置信度也为0.75。通过例二可知,第二关联商户规则表中所包含的商户组为商户组AB和商户组AM,且商户组AB的第二关联置信度为0.6,商户组AM的第二关联置信度也为0.6。可以看出,第一关联商户规则表和第二关联商户规则表中均存在商户组AB,并且商户组AB的第一关联置信度为0.75,商户组AB的第二关联置信度为0.6,因此,商户组AB的总关联置信度ZAB可根据上述公式一计算得到。即,ZAB=0.75*w1+0.6w2=0.75*0.6+0.6*0.4=0.69而由于商户组AC和商户组CH只存在于第一关联商户规则表中,并且商户组AC的第一关联置信度为0.75,商户组CH的第一关联置信度为0.75,因此,商户组AC和商户组CH的总关联置信度ZAC和ZCH,可根据上述公式二计算得到。即,ZAC=0.75*w1=0.75*0.6=0.45;ZCH=0.75*w1=0.75*0.6=0.45。而由于商户组AM只存在于第二关联商户规则表中,并且商户组AM的第二关联置信度为0.6,因此,商户组AM的总关联置信度ZAM,可根据上述公式二计算得到。即,ZAM=0.6*w2=0.6*0.4=0.24。至此,第一关联商户规则表所包含的商户组AB、商户组AC和商户组CH以及第二关联商户规则表所包含的商户组AB、商户组AM,并且商户组AB的总关联置信度ZAB为0.69、商户组AC的总关联置信度ZAC为0.45、商户组CH的总关联置信度ZCH为0.45、商户组AM的总关联置信度ZAM为0.24。在确定第一关联商户规则表所包含的商户组AB、商户组AC和商户组CH以及第二关联商户规则表所包含的商户组AB、商户组AM,并且商户组AB的总关联置信度ZAB为0.69、商户组AC的总关联置信度ZAC为0.45、商户组CH的总关联置信度ZCH为0.45、商户组AM的总关联置信度ZAM为0.24以后,可通过贝叶斯网络((Bayesiannetwork))的形式,确定预测商户,也可通过建立各商户组中的起始节点的条件概率表的形式,确定预测商户,当然也可通过其它的形式,确定预测商户。具体的,基于第一关联商户规则表所包含的商户组AB、商户组AC和商户组CH以及第二关联商户规则表所包含的商户组AB、商户组AM,并且商户组AB的总关联置信度ZAB为0.69、商户组AC的总关联置信度ZAC为0.45、商户组CH的总关联置信度ZCH为0.45、商户组AM的总关联置信度ZAM为0.24所建立的贝叶斯网络,可如图4所示。从图4所示的贝叶斯网络中可以看出,商户A与商户B之间的关联关系值为0.69,表示用户1在访问了商户A的条件下,用户1访问商户B的概率为0.69;商户A与商户C之间的关联关系值为0.45,表示用户1在访问了商户A的条件下,用户1访问商户C的概率为0.45;商户A与商户M之间的关联关系值为0.24,表示用户1在访问了商户A的条件下,用户1访问商户M的概率为0.24;商户C与商户H之间的关联关系值为0.45,表示用户1在访问了商户C的条件下,用户1访问商户H的概率为0.45。具体的,基于第一关联商户规则表所包含的商户组AB、商户组AC和商户组CH以及第二关联商户规则表所包含的商户组AB、商户组AM,并且商户组AB的总关联置信度ZAB为0.69、商户组AC的总关联置信度ZAC为0.45、商户组CH的总关联置信度ZCH为0.45、商户组AM的总关联置信度ZAM为0.24所建立的条件概率表,可如下列表格三所示。表格三从表格三所示的条件概率表中可以看出,商户A与商户B之间的关联关系值为0.69,表示用户1在访问了商户A的条件下,用户1访问商户B的概率为0.69;商户A与商户C之间的关联关系值为0.45,表示用户1在访问了商户A的条件下,用户1访问商户C的概率为0.45;商户A与商户M之间的关联关系值为0.24,表示用户1在访问了商户A的条件下,用户1访问商户M的概率为0.24;商户C与商户H之间的关联关系值为0.45,表示用户1在访问了商户C的条件下,用户1访问商户H的概率为0.45。可以看出,在用户1访问了商户A的条件下,由于用户1访问商户B的概率为0.69,用户1访问商户C的概率为0.45,用户1访问商户M的概率为0.24,因此,在用户1访问了商户A的条件下,用户1访问商户B的概率(0.69)最大,因此,若知道用户1访问了商户A,可将商户B作为商户A的预测商户。需要注意的是,在基于第一关联商户规则表和第二关联商户规则表,以及第一关联商户规则表和第二关联商户规则表中各关联商户组的总关联置信度构建贝叶斯网络时,如果导致贝叶斯网络中出现环,表明关联商户组中除起始节点商户外的商户已经在贝叶斯网络中出现过,此时,可新建一个特殊节点,令该商户组中的起始节点指向新建节点,并将新建节点标记为特殊节点,并且该新建节点不可后继。例如,若关联商户组XY中的商户Y已经在图中出现,则可新建一个特殊节点Y*,令商户X指向新建节点Y*,并将新建节点Y*标记为特殊节点,并且新建节点Y*不可后继。若贝叶斯网络中存在特殊节点,则后续的满足条件的关联商户组在加入贝叶斯网路时,即使该关联商户组满足条件,也不可再将该关联商户组加入到贝叶斯网络中。从上述内容可以看出,在利用历史交易数据进行消费预测时,分析和挖掘商户间潜在的关联关系,并结合每个用户的个人历史消费记录,挖掘针对消费者个人的商户关联关系,最后根据获得的关联关系和概率知识,推理和计算消费者在特定商户消费的概率,进而针对该特定商户进行消费预测,从而能够提高预测的准确性。另外,还可借助于贝叶斯网络根据获得的关联关系和概率知识,推理和计算消费者在特定商户消费的概率,能够充分利用商户之间的关联关系,有机的将所有用户的历史数据和个人的历史数据进行相结合。基于相同的技术构思,本发明实施例提供一种消费商户预测装置,如图5所示,该装置可包括:接收模块501,用于接收第一用户在第一商户的交易记录;确定模块502,用于从所述第一用户的历史消费记录中确定所述第一商户的第一关联商户集及第一关联商户集中的各关联商户组的第一关联置信度;还用于从所有用户的历史消费记录中确定所述第一商户的第二关联商户集及第二关联商户集中的各关联商户组的第二关联置信度;还用于针对所述第一关联商户集和所述第二关联商户集中的每个关联商户组,根据该关联商户组的第一关联置信度和/或第二关联置信度,确定该关联商户组的总关联置信度;预测模块503,用于根据各关联商户组的总关联置信度,确定所述第一商户的预测商户。较佳的,确定模块502,具体用于:从基于所述第一用户的历史消费记录所建立的第一关联商户规则表中查询所述第一商户的第一关联商户集;所述第一关联商户规则表通过以下方式建立:针对所述第一用户在每个周期的历史消费记录,均建立第一商户列表,并将建立的所有第一商户列表,组成第一事务集合;从所述第一商户列表中选取以第二商户为起始节点的商户组,所述第二商户为所述第一用户在历史消费记录中的任一消费商户;针对每个商户组,判断所述商户组的支持度是否大于第一阈值,若是,则将所述商户组加入到所述第二商户的第一关联商户集中,所述商户组的支持度是将所述商户组在所有第一商户列表中出现的次数与所述第一事务集合中所有第一商户列表的总数进行相除所得到的;获取所有商户的第一关联商户集,并确定所有商户的第一关联商户集中各商户组的第一关联置信度;判断所有商户的第一关联商户集中各商户组的第一关联置信度是否大于第二阈值,若是,则根据第一关联置信度大于第二阈值的商户组,构建所述第一关联商户规则表。较佳的,确定模块502,具体用于:针对每个以所述第二商户为起始节点的商户组,确定所述商户组在所有第一商户列表中出现的次数,并确定所述第二商户在所有第一商户列表中所出现的次数;根据确定的所述商户组在所有第一商户列表中出现的次数,以及确定的所述第二商户在所有第一商户列表中所出现的次数,确定所述各关联商户的第一关联置信度。较佳的,确定模块502,具体用于:从基于所有用户的历史消费记录所建立的第二关联商户规则表中查询所述第一商户的第二关联商户集;所述第二关联商户规则表通过以下方式建立:从所有用户的历史消费记录中获取每个用户的第二商户列表,并根据获取的所有第二商户列表,确定第二事务集合;从所述第二商户列表中选取以第三商户为起始节点的商户组,所述第三商户为所述所有用户的第二商户列表中的任一消费商户;针对每个商户组,判断所述商户组的支持度是否大于第三阈值,若是,则将所述商户组加入到所述第三商户的第二关联商户集中,所述商户组的支持度是将所述商户组在所有第二商户列表中出现的次数与所述第二事务集合中所有第二商户列表的总数进行相除所得到的;获取所有商户的第二关联商户集,并确定所有商户的第二关联商户集中各商户组的第二关联置信度;判断所有商户的第二关联商户集中各商户组的第二关联置信度是否大于第四阈值,若是,则根据第二关联置信度大于第四阈值的商户组,构建所述第二关联商户规则表。较佳的,确定模块502,具体用于:确定所述第一关联商户规则表的权重值,以及确定第二关联商户规则表的权重值;判断所述第一关联商户规则表中与所述第二关联商户规则表中是否存在相同关联商户组,若存在,则根据该关联商户组的第一关联置信度、所述第一关联商户规则表的权重值、该关联商户组的第二关联置信度以及所述第二关联商户规则表的权重值确定该商户组的总关联置信度,否则,针对所述第一关联商户规则表中的关联商户组,则根据该关联商户组的第一关联置信度确定该关联商户组的总关联置信度,针对所述第二关联商户集中的关联商户组,则根据该关联商户组的第二关联置信度确定该关联商户组的总关联置信度。综上,可以看出,在利用历史交易数据进行消费预测时,分析和挖掘商户间潜在的关联关系,并结合每个用户的个人历史消费记录,挖掘针对消费者个人的商户关联关系,最后根据获得的关联关系和概率知识,推理和计算消费者在特定商户消费的概率,进而针对该特定商户进行消费预测,从而能够提高预测的准确性。另外,还可借助于贝叶斯网络根据获得的关联关系和概率知识,推理和计算消费者在特定商户消费的概率,能够充分利用商户之间的关联关系,有机的将所有用户的历史数据和个人的历史数据进行相结合。本领域内的技术人员应明白,本发明的实施例可提供为方法、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1