一种基于统一相似度计算的客户划分方法及装置的制作方法

文档序号:6354272阅读:252来源:国知局
专利名称:一种基于统一相似度计算的客户划分方法及装置的制作方法
技术领域
本发明涉及客户划分方法,尤其是指一种基于统一相似度计算的客户划分方法及
装直。
背景技术
随着互联网的快速发展,用户通过电子商务网站进行网络购物活动越加频繁,这促使服务商需要不断创新来满足用户需求。在多样化的电子商务市场中,客户在价值观、需求、信仰、行为动机等方面区别很大。产品之间的竞争就在于如何满足客户的要求。要充分理解客户行为以及制定个性化销售策略,必须对客户进行划分,然后在不同的客户群中抽取相应的模式理解客户,制定更好的营销策略。客户划分是将客户按照一个或几个特性进行聚类,使每一类具有相似的服务需求。通过划分客户,企业可以更好地了解客户,并由此有效地制定市场目标,同时,企业既不会依赖能够满足所有客户的大众产品,也不会为每一个客户专门制定营销方案而导致高成本,这样企业的经营就可以在两者之间达到平衡。因此,客户划分问题的研究对于企业发展具有极其重要的作用。由于当前客户划分的相关工作主要建立在仅仅考虑了对象间单一关系的基础上通过传统的同构数据挖掘方法进行研究分析,这样做容易损失丰富的信息资源,造成分析结果的片面性。因此,为了得到更加具有解释性的客户划分结果,有效利用网络中丰富的信息,本发明借助统一相似度计算方法,通过对电子商务数据中复杂关系的集成,将异构对象间的复杂关系同构化,得到表示客户、商品的相似度矩阵,从而利用聚类算法对客户进行划分。

发明内容
有鉴于此,本发明提供一种基于统一相似度计算的客户划分方法及装置。为达到上述目的,本发明的技术方案是这样实现的本发明的实施提供了一种基于统一相似度计算的客户划分方法,该方法包括以下步骤Α、利用电子商务市场的客户、商品、评论信息,提取客户特征和商品特征;B、利用基于统一关系矩阵的相似度计算方法表示客户间的相似度;C、使用映射后的相似度矩阵对客户进行聚类;D、从聚类结果中提取关联规则以解释客户群体的行为模式。由上述的技术方案可知,本发明中的客户划分方法,借助统一相似度计算方法对客户进行划分,从聚类结果中提取关联规则以获取用户行为模式。


图I为本发明实施例中一种基于统一相似度计算的客户划分方法的流程图。图2为本发明实施例中利用基于统一关系矩阵的相似度计算方法表示客户间的相似度的流程图。图3为本发明实施例中一种基于统一相似度计算的客户划分装置的结构图。
具体实施例方式为使本发明的目的、技术方案和优点表达得更加清楚明白,下面结合附图及具体实施例对本发明作进一步详细说明。本发明提供了一种基于统一相似度计算的客户划分方法,该方法首先利用电子商务市场的客户、商品、评论信息,从中提取客户特征和商品特征;然后,利用基于统一关系矩阵的相似度计算方法表示客户间的相似度;接着,使用映射后的相似度矩阵对客户进行聚类;最后,从聚类结果中提取关联规则以解释客户群体的行为模式。图I为本发明实施例中一种基于统一相似度计算的客户划分方法的流程图。如图 I所示,本发明实施例中一种基于统一相似度计算的客户划分方法包括如下所述步骤步骤101,利用电子商务市场的客户、商品、评论信息,提取客户特征和商品特征。该步骤的具体方法如下,首先,从电子商务网站上抓取相关联的数据,进行数据整理,保存在本地数据库中。该部分工作主要包括缺失值填充,辅助信息补齐。然后,从这些经过预处理的数据中提取客户和商品信息,本发明参考了文献[N. Jindal, B. Liu. Opinion spam and analysis. WSDM 2008,pp. 219-230]的工作,提取的客户特征主要包括客户购买行为特征、客户评论行为特征和客户属性特征,商品特征主要为商品的一些自然属性,如表 I和表2所示。表I客户特征
特征种类特征客户购买行为特征CFl, 2购买了多少领域的商品,购买数量最多的领域的比重。 CF3, 4购买了多少类别的商品,购买数量最多的类别的比重。 CF5, 6购买了多少类型的商品,购买数量最多的类型的比重。 CF7, 8购买了多少品牌的商品,购买数量最多的品牌的比重。 CF9购买了多少商品。
CF10总花费。
CFlI当前级别。
CF12, 13客户连续购买商品的时间间隔的平均数,标准差。客户评论行为特征CF14, 15评分的平均数,标准差。
CF16, 17是否评价过1-3分,比重。
CF18, 19客户发表评论时间与购买时间间隔的平均数,标准差。 CF20,21是否写过“不足”评论,比重。
CF22, 23评论是否被标记为有用,比重。
CF24, 25评论是否被标记为无用,比重。
CF26,27, 28是否发表过重复的评论内容,重复的标题、重复的 “优点”、重复的“总结”。
CF29, 30在某一条评论中,“优点”和“总结”是否相同,比重。客户属性特征CF31客户所在地区。 CF32客户注册日期。表2商品特征
权利要求
1.一种基于统一相似度计算的客户划分方法及装置,其特征在于,该方法及装置包括以下步骤A、利用电子商务市场的客户、商品、评论信息,提取客户特征和商品特征;B、利用基于统一关系矩阵的相似度计算方法表示客户间的相似度;C、使用映射后的相似度矩阵对客户进行聚类;D、从聚类结果中提取关联规则以解释客户群体的行为模式。
2.根据权利要求I所述的方法,其特征在于,步骤A提取的客户特征包括客户购买行为特征、客户评论行为特征和客户属性特征,商品特征为商品自然属性特征。
3.根据权利要求I所述的方法,其特征在于,步骤B中利用基于统一关系矩阵的相似度计算方法表示客户间的相似度包括BI、统一关系矩阵初始化;B2、子矩阵调整;B3、相似度迭代计算。
4.根据权利要求3所述的方法,其特征在于,步骤BI中统一关系矩阵初始化计算客户间的初始相似度关系矩阵,对象间距离等于所有对应特征距离之和,使用Min-Max标准化方法调整距离。
5.根据权利要求3所述的方法,其特征在于,步骤B2中采用统一转移概率矩阵对每一个子矩阵进行调整。
6.根据权利要求I所述的方法,其特征在于,步骤C中使用k-means算法对映射后的客户表示进行聚类。
7.根据权利要求I所述的方法,其特征在于,步骤D中使用HotSpot算法对客户聚类结果进行关联规则挖掘。
8.一种基于统一相似度计算的客户划分装置,其特征在于,该装置包括预处理模块、 基于统一关系矩阵的相似度计算模块、客户聚类划分模块和客户群体行为模式抽取模块。所述预处理模块用于处理客户事务数据库,以抽取行为特征和属性特征;所述基于统一关系矩阵的相似度计算模块利用所获得的客户和商品特征,基于统一相似度计算方法获取客户间相似度矩阵;所述客户聚类划分模块利用获得的相似度矩阵对客户进行聚类;所述客户群体行为模式抽取模块利用获得的客户聚类划分结果使用关联规则挖掘聚类结果,提取客户行为模式。
9.根据权利要求8所述的装置,其特征在于,所述预处理模块包括数据获取和整理单元、提取客户和商品特征单元。所述数据获取和整理单元用于对从电子商务网站上抓取的相关数据,进行数据整理, 主要包括缺失值填充,辅助信息补齐;所述提取客户和商品特征单元用于提取客户的购买行为特征和评论行为特征,以及客户和商品的自然属性特征。
10.根据权利要求8所述的装置,其特征在于,所述基于统一关系矩阵的相似度计算模块包括统一关系矩阵初始化单元、子矩阵调整单元、相似度迭代计算单元。所述统一关系矩阵初始化单元用于从关系特征中计算客户间的初始相似度关系矩阵;所述子矩阵调整单元用于防止随机游走模型进入死循环;所述相似度迭代计算单元用于对客户相似度进行迭代计算,获得好的结果。
11.根据权利要求8所述的装置,其特征在于,所述客户聚类划分模块使用映射后的统一相似度矩阵对客户进行聚类,以获得客户划分结果。
12.根据权利要求8所述的装置,其特征在于,所述客户群体行为模式抽取模块使用关联规则挖掘算法从聚类结果中提取关联规则以获取客户群体的行为模式。
全文摘要
本发明公开了一种基于统一相似度计算的客户划分方法及装置。本发明的方法包括利用电子商务市场的客户、商品、评论信息,提取客户特征和商品特征;利用基于统一关系矩阵的相似度计算方法表示客户间的相似度;使用映射后的相似度矩阵对客户进行聚类;从聚类结果中提取关联规则以解释客户群体的行为模式。本发明的装置包括预处理模块、基于统一关系矩阵的相似度计算模块、客户聚类划分模块和客户群体行为模式抽取模块。由于本发明基于统一相似度计算方法,通过对电子商务数据中复杂关系的集成,将异构对象间的复杂关系同构化,得到表示客户的相似度矩阵进行客户划分,能够有效利用网络中丰富的信息,所以可获得更准确的客户划分结果。
文档编号G06Q30/02GK102609854SQ20111003480
公开日2012年7月25日 申请日期2011年1月25日 优先权日2011年1月25日
发明者吴舜尧, 王金龙, 高珂 申请人:青岛理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1