一种移动通信数据业务的客户统一视图建立方法

文档序号:6459564阅读:138来源:国知局

专利名称::一种移动通信数据业务的客户统一视图建立方法
技术领域
:本发明涉及移动通信数据业务的数据挖掘技术,特别是涉及一种移动通信数据业务的客户统一视图建立方法。
背景技术
:数据库技术是计算机领域应用的最为成功的技术之一,特别是关系数据库的提出和使用,使得对于数据的管理,不再是高端应用的专利,而越来越得到了广泛的基层的使用。由于现代各种高科技手段的应用,每天在不同行业都有着大量的数据产生,利用数据库技术对这些数据进行插入、删除、修改等等基本的管理操作已经非常的成熟。但是,人们越来越发现自己"淹没"在庞大的数据中,不能够从这种海量的数据库中得到自己真正需要的规则或者找到这些数据之间的规律。如何及时的、准确的从这些海量并且不断增长的数据中,提取出我们需要的信息,得到这些数据所蕴涵的潜在的信息,就迫切需要一门新的学科来研究,数据挖掘技术的出现给这一难题提出了解决方案。数据挖掘的定义为从数据集中识别出有效地、新颖的、潜在有用的,以及最终可以理解的模式的非平凡过程。在移动通信行业为了有效的进行客户维系、管理和精确营销,需要描述每个客户全面特征自然属性、活动特征、行为特征、费用特征、营销效果属性等,这就需要客户统一视图的支持。客户统一视图是对单个客户属性全集完整、一致的展现。客户统一视图主要包含客户的基本信息、行为信息、费用信息等。基本信息是客户的基本静态信息,如姓名、性别、证件号、联系地址、联系方式、出生年月、工作行业、爱好等;行为信息是客户使用各种数据业务的记录信息,如上网时长、彩铃下载次数等;费用信息包括用户使用各项业务时产生的计费信息,如GPRS上网费用,彩铃下载费用,语音杂志费用等。目前在移动通信行业数据业务领域,尚未提出对客户统一视图的标准化的建设流程,对如何进行构建,以及利用那些字段进行构建,另外以往的统一客户视图只包含基本信息,行为信息和费用信息,但是没有包含对于用户各个指标的分析,这些指标对于数据挖掘模型起关键作用。
发明内容本发明所要解决的技术问题就是为了克服上述现有技术存在的缺陷而提供一种移动通信数据业务的客户统一视图建立方法。本发明的目的可以通过以下技术方案来实现:一种移动通信数据业务的客户统一视图建立方法,其特征在于,包括以下步骤(1).根据各个数据业务的需求,为每个数据业务建立一个分业务视(2).从各分业务视图中抽取数据,建立初步的客户统一视(3).在初步的客户统一视图中加入衍生字段,构成完整的客户统一视图。所述的分业务视图包括个人基本记录和业务相关记录、费用记录,所述的业务相关记录的一条记录为一个用户的业务相关数据,该数据的时间周期为一个月。所述的步骤(l)进一步包括从数据源中选择各数据业务需要的个人基本记录字段值、业务相关记录字段值以及费用记录字段值;采用数据库语言写存储过程来建立分业务视图,分业务视图以数据表的形式存储于数据库中。所述的初步的客户统一视图包括所有数据业务组成的客户的个人基本记录、各客户在各数据业务维度上的记录以及各客户的费用记录。所述的步骤(2)进一步包括从各分业务视图中选择所有数据业务组成的客户的个人基本记录字段值、业务相关记录字段值以及费用记录字段值;采用数据库语言写存储过程来建立初步的客户统一视图。所述的步骤(3)进一步包括将初步的客户统一视图的业务相关记录字段和费用字段作为基础字段,根据需求确定要添加的衍生字段;计算衍生字段值;验证衍生字段的有效性;将有效的衍生字段加入初步的客户统一视图中。所述的衍生字段的基本类型包括和值变量、计数变量、均值变量、增值变量、极值变量、趋势变量、区间变量。所述的衍生字段包括变化量和变化率,变化量值为当月数值减去上月数值,变化率值为为变化量/当月数值。与现有技术相比,通过本发明的方法,可以完整而高效的建立客户统一视图。图l为本发明的流程图。具体实施例方式下面结合附图对本发明作进一步说明。如图1所示,一种移动通信数据业务的客户统一视图建立方法,包括以下步骤(1).根据各个数据业务的需求,为每个数据业务建立一个分业务视(2).从各分业务视图中抽取数据,建立初步的客户统一视(3).在初步的客户统一视图中加入衍生字段,构成完整的客户统一视图。所述的分业务视图包括个人基本记录和业务相关记录、费用记录,所述的业务相关记录的一条记录为一个用户的业务相关数据,该数据的时间周期为一个月。所述的步骤(l)进一步包括从数据源中选择各数据业务需要的个人基本记录字段值、业务相关记录字段值以及费用记录字段值;采用数据库语言写存储过程来建立分业务视图,分业务视图以数据表的形式存储于数据库中;所述的初步的客户统一视图包括所有数据业务组成的客户的个人基本记录、各客户在各数据业务维度上的记录以及各客户的费用记录;所述的步骤(2)进一步包括从各分业务视图中选择所有数据业务组成的客户的个人基本记录字段值、业务相关记录字段值以及费用记录字段值;采用数据库语言写存储过程来建立初步的客户统一视所述的步骤(3)进一步包括将初步的客户统一视图的业务相关记录字段和费用字段作为基础字段,根据需求确定要添加的衍生字段;计算衍生字段值;验证衍生字段的有效性;将有效的衍生字段加入初步的客户统一视图中;所述的衍生字段的基本类型包括和值变量、计数变量、均值变量、增值变量、极值变量、趋势变量、区间变量;所述的衍生字段包括变化量和变化率,变化量值为当月数值减去上月数值,变化率值为为变化量/当月数值。初步的客户统一视图只包含个人基本信息,行为信息和费用信息,而不涉及其他的衍生变量,从而不能动态反映客户变化。在初步的客户统一视图上加入衍生变量,构成新的完整的客户统一视图,包括根据各数据业务建立衍生变量,用于包含各项数据业务的预测信息,以及趋势信息,从而形成一个完整而高效的客户统一视图。明确建立分业务视图的需求分业务视图包括个人基本信息和业务相关信息。业务相关信息的每一条记录为一个用户的业务相关信息(包含业务一般信息,业务消费跟人信息,业务行为信息),数据时间周期为l个月。数据颗粒度为用户级。所包括业务为点对点短信、梦网短信、彩信、手机上网、彩铃、12580信息服务、来电提醒、语音杂志、飞信、手机报、无线音乐俱乐部(无数据)、中央音乐平台(无数据)、随E行、WLAN业务、号簿管家、呼叫转移、短信回执。分业务视图由用户个人基本信息表字段和分业务表字段合并组成的。从数据源中选择各个数据业务需要的字段信息:确定个人信息表的字段值的选取,以及各个数据业务的字段值的选取,此过程可以看作是移动数据业务建立分业务视图时的标准化的参数选择。个人基本信息表,如表h手机号码使用人归属地品牌套餐年龄性别所属行业职业生曰兴趣爱好地址工作单位名称缴费方式营销渠道类型营销渠道是否当月新增用户是否大客户大客户等级是否拍照用户是否心机客户是否vpmn用户入网时间是否集团客户集团编码集团名称集团类型彩信业务,如表2:彩信包月种类彩信包月费用梦网彩信包月费用免费彩信条数彩信通信费(核实是否是除掉包月费)点对点彩信通信费(核实是否是除掉包月费)(梦网)彩信通信费梦网彩信上行通信费邮箱彩信通信费_点对点彩信通信量点对点彩信上行通信量点对点彩信下行通信量梦网彩信通信量梦网彩信上行通信量梦网彩信下行通信量邮箱彩信通信量邮箱彩信上行通信量邮箱彩信下行通信量表2梦网短信,如表3:包月种类包月费用梦网短信费用短信发送总条数短信接收总条数表3点对点短信,如表4:套餐类型套餐内免费短信条数(核实是否通过包月套餐信息得到)短信包月费用(核实是否可以通过包月信息得到)点对点短信收入(核实是否去除了包月内免费的情况)点对点短信网内收入(核实是否去除了包月内免费的情况)点对点短信网间收入点对点短信网间(联通)收入点对点短信网间(固网)收入国际短信收入点对点短信上行计费量点对点短信网内上行计费量点对点短信网间上行计费量点对点短信网间(联通)上行计费量点对点短信网间(固网)上行计费量国际短信上行计费量点对点短信网间下行计费量点对点短信网间(联通)下行计费量点对点短信网间(固网)下行计费量点对点短信上行通信量点对点短信网内上行通信量点对点短信网间上行通信量点对点短信网间(联通)上行通信量点对点短信网间(固网)上行通信量国际短信上行通信量点对点短信网间下行通信量点对点短信网间(联通)下行通信量点对点短信网间(固网)下行通信量表4手机上网,如表5:包月类型MO手机上网通信费(核査是否去除包月)MO手机上网(overGPRS)通信费(核査是否去除包月)MO手机上网(overCSD)通信费MO手机上网应收信息费GPRS总费用(核査是否去除包月)GPRS流量费GPRS套餐费CSD使用上网时长通信费MO手机上网(overGPRS)流量MO手机上网月使用流量MO手机上网(overCSD)业务量MO手机上网梦网总话单数MO手机上网梦网包月话单数GPRS流量GPRS通信时长PDP激活次数(使用次数)CSD使用上网时长表5彩铃,如表6:包月类型实收包月费用实收包月外费用彩铃应收信息费彩铃短信通信量彩铃上行短信通信量彩铃下行短信通信量彩铃铃音下载次数收费彩铃铃音下载次数12530计费时长彩铃12530通信费表612580信息服务,如表7:12580通话费收入12580信息费收入12580短信通信费收入12580通话时长12580短信条数12580语音拨打次数表7如表8:来电提醒功能费是否来电提醒免费用户表8如表9:语音杂志费用(核实此费用是否是真正的总费用)语音杂志通话费语音杂志应收信息费语音杂志通话时长语音杂志全网业务通话时长语音杂志,地业务通话时长语音杂志短倍通信里表9飞信,如表10:是否飞信活跃用户飞信PC客户端活跃天数飞信手机客户端活跃天数表10手机报,如表ll:手机报订购数目手机报订购类型手机报订购总费用手机报总下载量手机报下载次数表ll无线音乐俱乐部,如表12:所属会员种类高级会员功能费定购产品费用服务总费用10来电提醒,语音杂志,彩信杂志12530接收费本地彩铃次数下载振铃次数点播歌曲次数其它服务次数彩信杂志12530接收次数表12中央音乐平台,如表13:13随E行,如表14:随e行业务收入(核实是否有包月费)随e行漫游收入随e行GPRS流量随e行漫游流量表14WLAN业务,如表15:WLAN通信费WLAN业务包月费WLAN业务计费时长WLAN业务套餐内时长表15号簿管家,如表16:号簿管家通信费号簿管家费用号薄管家短信通信量号薄管家手机同步成功率表16呼叫转移,如表17:呼叫转移通信费呼叫转移通话次数呼叫转移计费时长表17长数表费费费费量量时次户息息话息载载话话用信信l信l^'^'衝箭费铃铃、gg铃铃>g、g计彩提ns彩fesn否l^乐乐乐l乐乐乐是中中中中中中中中语音业务,如表18:通话包月费用每月语音通话费用本地基本费本地长途费国内漫游费国际漫游费国内长途费国际长途费语音通话次数语音通话时长语音呼入次数语音呼入时长语音呼出次数语音呼出时长国际漫游语音呼叫次数国内漫游语音呼叫时长国际漫游语音呼叫次数国际漫游语音呼叫时长网内主叫时长网外主叫时长网内被叫时长网外被叫时长表18建立分业务视图本步骤的目的是要具体的实施建立分业务视图的工程,明确的知道了需求及所需字段后,我们采用数据库语言写存储过程来建立分业务视图,分业务视图的存储结构为数据表的形式存储在数据库中。确定要进行抽取的字段本步骤要确定初步客户统一视图的字段信息,分业务视图反映了用户在单个数据业务维度上的个人基本信息,行为信息,费用信息,分业务视图可以在单个业务维度上对客户进行分群,以及群信息特征描述等操作。但是,此操作只限定在单个业务维度上,如果我们要进行在所有业务维度上的客户分群,以及客户分群特征描述等操作时,就会遇到困难,所以有必要建立全数据业务维度的初步客户统一视图。采用存储过程具体实现客户统一视图本步骤要根据客户需求来建立客户统一视图,客户统一视图由两大部分组成,第一部分为客户的个人基本信息,第二部分为由所有数据业务组成的客户在各数据业务维度上的记录。在初步的客户统一视图当中,包含有个人基本信息,所有数据业务的行为信息及费用信息,但是没有包含任何预测及趋势信息。所以我们提出构造完整的统一客户视图,添加各数据业务建立衍生变量,用于包含各项数据业务的预测信息,以及趋势信息,从而形成一个完整而高效的客户统一视图。根据建模需求确定要添加的衍生字段在实际的建模过程中,对衍生字段的需求通常是不一样的。本发明将客户统一视图的行为字段和费用字段作为基础字段,然后根据需求确定具体的衍生字段。衍生字段基本类型包括和值变量、计数变量、均值变量、增值变量、极值变量、趋势变量、区间变量等。确定衍生字段的计算公式-例如,我们确定衍生字段的信息,分为变化量信息和变化率信息,字段ID分别为-YS—VOLU—基础字段名和YS_RATE—基础字段名,变化量的计算公式为当月数值一上月数值,变化率的计算公式为(当月数值一上月数值)/当月数值。验证上步中的衍生字段是否能满足需求在确定了衍生变量后,我们要在实际的建模中验证该变量的有效性,因为衍生变量公式的确定是需要重复试验的。不满足则改变策略,直到成功设置好衍生变量例如,在2中的变化量和变化率数值较小而不能满足建模的需求时,我们可以采用变化量=当月数值_上上月数值,变化率=(当月数值一上上月数值)/当月数值,来进行验证。实施例以下所示为某省移动的部分初步客户统一视图的字段信息,如表19:<table>tableseeoriginaldocumentpage13</column></row><table><table>tableseeoriginaldocumentpage14</column></row><table><table>tableseeoriginaldocumentpage15</column></row><table>权利要求1.一种移动通信数据业务的客户统一视图建立方法,其特征在于,包括以下步骤(1).根据各个数据业务的需求,为每个数据业务建立一个分业务视图;(2).从各分业务视图中抽取数据,建立初步的客户统一视图;(3).在初步的客户统一视图中加入衍生字段,构成完整的客户统一视图。2.根据权利要求1所述的一种移动通信数据业务的客户统一视图建立方法,其特征在于,所述的分业务视图包括个人基本记录和业务相关记录、费用记录,所述的业务相关记录的一条记录为一个用户的业务相关数据,该数据的时间周期为一个月。3.根据权利要求2所述的一种移动通信数据业务的客户统一视图建立方法,其特征在于,所述的步骤(l)进一步包括-从数据源中选择各数据业务需要的个人基本记录字段值、业务相关记录字段值以及费用记录字段值;采用数据库语言写存储过程来建立分业务视图,分业务视图以数据表的形式存储于数据库中。4.根据权利要求1所述的一种移动通信数据业务的客户统一视图建立方法,其特征在于,所述的初步的客户统一视图包括所有数据业务组成的客户的个人基本记录、各客户在各数据业务维度上的记录以及各客户的费用记录。5.根据权利要求4所述的一种移动通信数据业务的客户统一视图建立方法,其特征在于,所述的步骤(2)进一步包括从各分业务视图中选择所有数据业务组成的客户的个人基本记录字段值、业务相关记录字段值以及费用记录字段值;采用数据库语言写存储过程来建立初步的客户统一视图。6.根据权利要求1所述的一种移动通信数据业务的客户统一视图建立方法,其特征在于,所述的步骤(3)进一步包括将初步的客户统一视图的业务相关记录字段和费用字段作为基础字段,根据需求确定要添加的衍生字段;计算衍生字段值;验证衍生字段的有效性;将有效的衍生字段加入初步的客户统一视图中。7.根据权利要求6所述的一种移动通信数据业务的客户统一视图建立方法,其特征在于,所述的衍生字段的基本类型包括和值变量、计数变量、均值变量、增值变量、极值变量、趋势变量、区间变量。8.根据权利要求6所述的一种移动通信数据业务的客户统一视图建立方法,其特征在于,所述的衍生字段包括变化量和变化率,变化量值为当月数值减去上月数值,变化率值为变化量/当月数值。全文摘要本发明涉及一种移动通信数据业务的客户统一视图建立方法,包括以下步骤根据各个数据业务的需求,为每个数据业务建立一个分业务视图;从各分业务视图中抽取数据,建立初步的客户统一视图;在初步的客户统一视图中加入衍生字段,构成完整的客户统一视图。与现有技术相比,通过本发明的方法,可以完整而高效的建立客户统一视图。文档编号G06F17/30GK101620599SQ200810039890公开日2010年1月6日申请日期2008年6月30日优先权日2008年6月30日发明者谧冯申请人:上海全成通信技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1