本发明是关于一种通信装置,特别是指一种基于话单的关联规则分析系统。
背景技术:
通过分析特定地理区域范围内通讯终端客户的通话行为,可以找出该区域内商家与商家、行业与行业之间的关联规则、量化指标及排序。电信运营商拥有海量用户话单数据,从商家的角度看,与商家接触号码集有通话行为的客户群,和与其他商家有通话行为的客户群,存在一定数量和比例的客户重叠,并且行业之间也存在关联关系。
现有的实现方式尚未从话单所表现的通话行为这个角度对商家或行业进行关联度分析。
技术实现要素:
本发明所要解决的技术问题在于提供一种基于话单的关联规则分析系统,该分析系统从大众通话行为,来找出对特定商家或行业以及与其关联度较大的若干商家或行业,从而指导商家或行业之间的交叉销售或捆绑销售。
本发明是通过以下技术方案解决上述技术问题的:一种基于话单的关联规则分析系统,包括数据库服务器、数据分析集群,以及应用服务器,所述数据分析集群以及应用服务器均连接到数据库服务器。
所述数据分析集群包括至少一台的电脑主机,每个电脑主机均连接到数据库服务器。
本发明基于话单的关联规则分析系统的优点在于:配合数据分析软件,从大众通话行为,来找出对特定商家或行业以及与其关联度较大的若干商家或行业,从而指导商家或行业之间的交叉销售或捆绑销售。且通过特定时间窗口、地理区域内所有客户和商家的通话行为的分析,所获取分析结果数据(客户覆盖面大、商家或行业由运营商采编,数据完整且质量高)涵盖所有入库商家和行业,且质量高。
附图说明
下面参照附图结合实施例对本发明作进一步的描述。
图1是本发明基于话单的关联规则分析系统的组成框图。
具体实施方式
请参阅图1,该基于话单的关联规则分析系统包括数据库服务器10、数据分析集群20,以及应用服务器30。所述数据分析集群20以及应用服务器30均连接到数据库服务器10。
所述数据库服务器10,存储原始数据和分析结果数据,所述话单数据、行业数据、商家数据等原始数据均已加载到数据库服务器10。
所述数据分析集群20从所述数据库服务器10读取原始数据,并执行数据分析逻辑,并将分析结果返回存储到数据库服务器10中。考虑到海量话单,以及商家之间、行业之间的两两关联,数据分析的计算量将需要若干电脑主机完成,因此,该数据分析集群20包括至少一台的电脑主机,每个电脑主机均连接到数据库服务器10。
所述应用服务器30对分析结果数据进行用户界面呈现。
所述数据分析集群20中运行有数据分析软件,该数据分析软件将话单中号码和号码的关联,整理为号码与商家之间的关联、号码与商家所属行业之间的关联;然后将所有与特定商家或行业通话的客户视为一个群体,计算该群体和其他商家或行业的通话联系(包括重叠客户数、重叠客户比例、重叠客户通话次数、重叠客户通话比例四个指标),并依照上述指标数值排序取若干数量商家或行业存储到分析结果表。
所述数据库服务器10中存储的原始数据说明如下:
话单数据:主被叫区号、号码,通话时间,通话时长,主被叫基站识别号;
行业数据:行业编号,行业名称,行业层次关系;
商家数据:商家编号,商家名称,所属行业编号,商家联系电话(集);
其中,话单数据和商家数据中的所有通讯号码应规整为同一格式,方便匹配。
该分析系统结合数据分析软件,针对客户在一定统计时间区间内可与多个商家和行业发生通话的行为特征,引入通话时间、通话区域俄等辅助参数,计算各商家之间的关联系数及关联度排序。
关联系数说明:(在引入其他因数修正后)
在统计时间区间内,数量qa客户和商家a接触(通话次数ta),数量qb客户和商家b接触(通话次数tb),其中与商家a/b均发生接触的客户数量为qab(通话次数tab)。
重叠客户数:qab;
重叠客户比例:商家a=qab/qa;商家b=qab/qb;
重叠客户通话次数:tab;
重叠客户通话比例:商家a=tab/ta;商家b=tab/tb;
各个商家之间为网状关系,可计算针对某个商家以上各指标的排序。
同理可计算行业与行业之间的关联指标及排序。