一种识别用户群和用户之间关系的系统和方法

文档序号:6339202阅读:532来源:国知局
专利名称:一种识别用户群和用户之间关系的系统和方法
技术领域
本发明涉及一种电信领域采集用户特征数据及使用所采集到的用户特征数据识别用户之间关系的系统和方法。
背景技术
在竞争激烈的电信市场领域,越来越多地通过综合业务的捆绑套餐来拓展增量用户和维系存量用户,准确识别某些用户之间的关系或某些有共同业务或共同兴趣爱好的群体,对融合产品的营销至关重要,例如针对家庭客户,准确识别家庭成员的组成及每个成员的消费需求,就可以在营销接触点,有针对性地推荐适合的综合业务组合产品,既为用户带来优惠,又让运营商减少盲目营销和维系成本。企业不仅要研究客户群,还需要关注客户的圈子,准确定位某些有共同业务或共同兴趣爱好的群体,就可以找到很好的信息定向传播和营销的渠道,利用圈子之间的人际互动来进行营销,或建立圈子营销产业联盟通过联合促销、品牌联盟等方式来共同挖掘圈子用户的价值。因此,需要一种新的方法来识别用户之间的关系或某些特定群体。目前电信运营商的BSS (Business Service System,业务支撑系统)的经营分析系统主要分析用户群体的消费变化情况和市场推广情况,用来提供市场决策用的经营分析报表,CRM (Customer Relationship Management,客户关系管理)系统建立了统一客户视图,提供对客户的服务和营销支撑,另有一种用户指纹技术利用用户特征数据识别单一用户,主要是通过比对两个手机号码之间的交往圈及频繁活动小区的一致性来判断他们是否为同一用户。但现有这些技术都只能分析用户本身的消费行为,无法识别用户之间的关系或拥有共同业务或共同兴趣爱好的用户圈群体。

发明内容
本发明所要解决的技术问题是提供一种采集和利用用户特征数据识别用户群和用户之间关系的系统和方法,通过采集并分析用户的消费行为和用户之间的交往指数、协议关联关系、地理关联关系,并分析符合目标用户的共同特性的特征数据,来识别用户群和用户之间的关系。本发明解决上述技术问题的技术方案如下一种采集和利用用户特征数据识别用户群和用户之间关系的系统,包括用户数据仓库、中间数据采集存储装置、特征数据采集存储装置、特征数据识别分析装置以及展现输出装置;其中,所述用户数据仓库用于存储原始用户数据;所述中间数据采集存储装置用于从用户数据仓库中抽取与用户特征相关的数据,在进行清洗、转换、规约处理后集成存储;特征数据采集存储装置用于采集中间数据采集存储装置处理后的用户数据,转换成用户特征数据并进行分类存储;特征数据识别分析装置用于对特征数据采集存储装置所存储的用户特征数据进行分析处理,识别用户群和用户之间的关系,分析用户的消费行为,识别用户群中消费额度、圈内交往指数高于用户群平均水平和协议关系中为责任方的重点用户;展现输出装置用于输出相应结果。
本发明的有益效果是所述系统通过提取与用户特征相关的数据,并进行分析处理,实现了对用户群和用户之间的关系的识别。在上述技术方案的基础上,本发明还可以做如下改进。进一步,所述中间数据采集存储装置包括
用户注册信息采集单元,用于采集家庭固定电话、个人移动电话和宽带的用户开户注册信息;
移动基站小区信息采集单元,用于采集移动通信基站各小区的位置和覆盖区域信息; 用户通信信息采集单元,用于采集用户通信记录;
用户消费信息采集单元,用于采集用户通信相关的消费行为和服务行为等信息; 用户缴费信息采集单元,用于采集用户缴费记录,包括缴费方式、金额和地点等信息; 用户终端信息采集单元,用于采集用户终端代码信息; 用户套餐信息采集单元,用于采集用户当前的消费套餐名称和属性信息; 互联网信息采集单元,用于采集用户的固网互联网和移动互联网的登录和使用记录信
息;
行业信息采集单元,用于采集各行业单位的相关用户记录信息; 中间数据处理存储单元,用于数据输入、输出及清洗、转换、规约处理,并集成存储与用户特征相关的数据。采用上述进一步方案的有益效果是,实现了对各种与用户特征相关的数据的采集和存储,各种与用户特征相关的数据主要包括了 用户家庭固定电话、个人移动电话、宽带用户开户注册信息,移动通信基站各小区的位置和覆盖区域信息,用户通信记录、用户通信相关的消费行为和服务行为等信息,用户缴费记录包括缴费方式、金额和地点等信息,用户终端代码信息,用户当前消费套餐名称和属性信息,用户的固网互联网和移动互联网的登录和使用记录信息,各行业单位的相关用户记录信息等。进一步,所述特征数据采集存储装置包括
交往参数采集单元,用于从通信信息、消费信息、套餐信息和互联网信息数据中采集用户之间的交往信息;
协议关系参数采集单元,用于从注册信息、消费信息、缴费信息、终端信息、套餐信息、 互联网信息和行业信息数据中采集用户之间的协议关系信息;
地理参数采集单元,用于从注册信息、通信信息、缴费信息、套餐信息、移动基站小区信息、互联网信息和行业信息数据中采集用户的地理信息; 消费参数采集单元,用于采集每个用户的消费行为信息; 特征数据处理存储单元,用于特征数据的输入、输出和存储处理。采用上述进一步方案的有益效果是,实现了对用户特征数据的采集和存储,用户特征数据主要包括了 通信信息、消费信息、套餐信息和互联网信息数据中的用户之间的交往信息,注册信息、消费信息、缴费信息、终端信息、套餐信息、互联网信息和行业信息数据中的用户之间的协议关系信息,注册信息、通信信息、缴费信息、套餐信息、移动基站小区信息、互联网信息和行业信息数据中的用户的地理信息,以及每个用户的消费行为信息等。进一步,所述特征数据识别分析装置包括
交往指数分析识别单元,用于分析识别用户通信、消费、套餐和互联网信息中的交往指数;
协议关联关系分析识别单元,用于分析识别用户注册、消费协议、互联网登记、行业相关信息中姓名、号码之间的关联关系;
地理关联关系分析识别单元,用于分析识别用户注册、通信、缴费、上网、行业记录信息中的地理关联关系;
用户群和用户关系分析识别单元,用于用户群和识别用户之间的关系,分析用户的消费行为,识别用户群中的重点用户。采用上述进一步方案的有益效果是,实现了对用户特征数据的识别分析。进一步,所述用户群和用户关系分析识别单元包括 家庭成员分析识别模块,用于分析识别各家庭的成员组成; 同事圈分析识别模块,用于分析识别工作单位的成员组成; 同学圈分析识别模块,用于分析识别同学圈的成员组成; 朋友圈分析识别模块,用于分析识别朋友圈中的成员组成;
共同业务或兴趣圈分析识别模块,用于分析识别有共同业务或兴趣爱好的群体的成员组成;
其他用户群分析模块,用于分析识别其他存在某些特定共同用户特征的用户群组成。采用上述进一步方案的有益效果是,实现了用户群和用户关系的分析识别。基于上述系统,本发明提供的采集和利用用户特征数据识别用户群和用户之间关系的方法,包括如下步骤
步骤A 从用户数据仓库中采集与用户特征相关的数据,在进行清洗、转换、规约处理后集成存储为用户数据;
步骤B 利用所存储的用户数据,采集用户特征数据分类存储; 步骤C:分析所存储的用户特征数据,识别用户群和用户之间的关系,分析用户的消费行为,判断用户群中的重点用户;
步骤D 把分析结果按照需求展现输出。采用上述方法的有益效果是,实现了对用户群和用户之间的关系的识别。进一步,所述用户特征数据包括用户交往参数、协议关系参数、地理参数和消费参数。进一步,步骤A中所述与用户特征相关的数据采集包括如下步骤 步骤Al 采集用户开户注册信息;
步骤A2 采集移动通信基站各小区的位置和覆盖区域信息; 步骤A3:采集用户通信记录;
步骤A4 采集用户通信相关的消费行为和服务行为等信息;
步骤A5:采集用户缴费记录;
步骤A6 采集用户终端代码信息;
步骤A7 采集用户的消费套餐名称和属性信息;
步骤A8 采集用户的互联网登录和使用记录信息;
步骤A9 采集各行业单位的相关用户记录信息。采用上述进一步方案的有益效果是,实现了用户特征相关的数据的采集,包括用户开户注册信息、移动通信基站各小区的位置和覆盖区域信息、用户通信记录、用户通信相关的消费行为和服务行为信息、用户缴费记录、用户终端代码信息、用户的消费套餐名称和属性信息、用户的互联网登录和使用记录信息、以及各行业单位的相关用户记录信息。进一步,步骤B中所述采集用户特征数据包括如下步骤
步骤Bl 从通信信息、消费信息、套餐信息和互联网信息数据中采集用户之间的交往参数信息;
步骤B2 从注册信息、消费信息、缴费信息、终端信息和套餐信息、互联网信息和行业信息数据中采集用户之间的协议关系参数信息;
步骤B3 从注册信息、通信信息、缴费信息、套餐信息、移动基站小区信息、互联网信息和行业信息数据中采集地理参数信息;
步骤B4 采集每个用户的消费行为参数信息。采用上述进一步方案的有益效果是,实现了用户特征数据的采集,其中包括用户之间的交往参数信息、用户之间的协议关系参数信息、地理参数信息、以及每个用户的消费行为参数信息等。进一步,步骤C中所述识别用户群和用户之间的关系包括如下步骤 步骤Cl 分析识别用户通信、消费、套餐和互联网信息中的用户交往指数;
步骤C2 分析识别用户注册、消费协议、互联网和行业信息中姓名、号码之间的协议关联关系;
步骤C3 分析识别用户注册、通信、缴费、互联网和行业信息中的地理关联关系;
步骤C4 分析识别用户群和识别用户之间的关系;
步骤C5:分析用户群中用户消费行为,识别用户群中的重点用户。采用上述进一步方案的有益效果是,实现了用户群和用户之间关系的分析识别, 其中包括用户交往指数;姓名和号码之间的协议关联关系、地理关联关系、用户群和用户之间的关系、用户群中用户消费行为、以及用户群中的重点用户等。进一步,步骤Cl中识别用户交往指数包括如下步骤 步骤ClO 分时段统计分析用户的频繁交往圈;
步骤Cll 分时段统计分析用户的稳定非频繁交往圈;
步骤C12 统计分析特定时间用户的交往圈;
步骤C13 建立包括步骤ClO至C12所述内容的用户交往指数表。采用上述进一步方案的有益效果是,实现了用户交往指数的识别统计和保存,其中包括统计用户的频繁交往圈、统计用户的稳定非频繁交往圈、以及统计特定时间用户的交往圈等。进一步,所述特定时间包括节假日和重大事件时间。进一步,步骤C2中识别协议关联关系包括如下步骤
步骤C20 识别家庭套餐、集团套餐、校园套餐、小区套餐所包含的用户,标注单独的标
识;
步骤C21 分析识别交叉优惠套餐的用户,标注单独的交叉优惠标识;
步骤C22 分析代缴费用户,标注代缴关系标识;
步骤C23 把套餐中包含的终端序列号转换电话号码的对应关系;步骤C24:分析用户固定电话、移动电话和宽带注册信息和互联网各应用登记注册信息及行业信息中的开户用户、联系人、担保人、单位的名称、号码对应关系,标注关联关系; 步骤C25 建立包括步骤C20至CM所述内容的协议关联关系表。采用上述进一步方案的有益效果是,实现了协议关联关系的识别。进一步,步骤C3中识别地理关联关系包括如下步骤
步骤C30 把行政区划地址、移动基站小区代码、套餐中区域代码、营业店面代码、网吧地址等转换成统一的地理区域代码格式;
步骤C31 把采集到的地理参数信息转换对应成统一的地理区域代码; 步骤C32 分时段统计分析用户活动区域,区分长期稳定频繁活动、阶段性频繁活动、 长期稳定但非频繁活动类别,并区分用户工作、学习、生活活动区域性质; 步骤C33 统计同一区域内活动的用户号码,标注活动区域性质; 步骤C34 分析识别用户活动区域、用户注册区域和联系人、担保人、单位所在区域、套餐包含区域、缴费区域之间的关联关系;
步骤C35 建立包括步骤C30至C34所述内容的地理关联关系表。采用上述进一步方案的有益效果是,实现了地理关联关系的识别。进一步,步骤C4中识别用户群和用户之间的关系包括如下步骤
步骤C40 选择目标用户交往圈范围,利用步骤C13建立的用户交往指数表,分析用户群的各用户的交往指数,判断出拥有共同的交往圈的用户群,分配用户群标识和用户群指数,并根据此用户群内每个用户交往指数的不同对应不同的成员指数;
步骤C41 选择目标用户区域范围,利用步骤C35建立的地理关联关系表,判断区域内符合目标用户特征的用户群;
步骤C42 对比步骤C40、C41识别出的用户群,分析成员组成和交往圈的重合度,根据重合度调整用户群指数和成员指数;
步骤C43 利用步骤C25建立的协议关联关系表,判断用户群内的用户号码之间存在协议关联关系,如果存在,增加存在协议关联关系用户的成员指数;
步骤C44:分析各用户群内的用户的目标特征,按照群体特征的符合程度增加用户群指数,并增加其中符合特征的用户的用户群成员指数;
步骤C45 根据用户群指数判断有某项特定共同特征的用户群符合率,如果符合,建立用户群数据表,并根据用户群成员指数确定成员组成。采用上述进一步方案的有益效果是,实现了用户群和用户之间关系的识别。进一步,步骤C5中用户消费行为和重点用户的分析识别包括如下步骤 步骤C50 分析用户的消费行为,识别用户消费需求,建立用户消费特征表;
步骤C51 对比分析用户群内的用户消费行为,并利用步骤C13建立的用户交往指数表、步骤C25建立的协议关联关系表,分别识别出消费额度、圈内交往指数高于用户群平均水平和协议关系中为责任方的重点用户。采用上述进一步方案的有益效果是,实现了用户消费行为和重点用户的分析识别。


图1是本发明的基本系统结构示意图2是本发明的实施例具体应用中中间数据采集存储装置a02的示意图; 图3是本发明的实施例具体应用中特征数据采集存储装置a03的示意图; 图4是本发明的实施例具体应用中特征数据识别分析装置a04的示意图; 图5是本发明的基本步骤程序的示意图6是本发明的实施例具体应用中用户群和用户之间的关系识别步骤程序的示意图; 图7是本发明的实施例具体应用中家庭成员分析识别步骤程序的示意图; 图8是本发明的实施例具体应用中同事圈分析识别步骤程序的示意图; 图9是本发明的实施例具体应用中同学圈分析识别步骤程序的示意图; 图10是本发明的实施例具体应用中朋友圈分析识别步骤程序的示意图; 图11是本发明的实施例具体应用中有某项共同业务或共同兴趣爱好的群体分析识别步骤程序的示意图。附图中,各标号所代表的部件列表如下
aOl、用户数据仓库,a02、中间数据采集存储装置,a03、特征数据采集存储装置,a04、 特征数据识别分析装置,a05、展现输出装置,bOO、中间数据处理存储单元,bOl、用户注册信息采集单元,b02、移动基站小区信息采集单元,b03、用户通信信息采集单元,b04、用户消费信息采集单元,b05、用户缴费信息采集单元,b06、用户终端信息采集单元,b07、用户套餐信息采集单元,b08、互联网信息采集单元,b09、行业信息采集单元,cOO、特征数据处理存储单元,cO 1、交往参数采集单元,c02、协议关系参数采集单元,c03、地理参数采集单元,c04、消费参数采集单元,d00、用户群和用户关系分析识别单元,d01、交往指数分析识别单元,d02、 协议关联关系分析识别单元,d03、地理关联关系分析识别单元。
具体实施例方式以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。如图1所示,本发明的采集和利用用户特征数据识别用户群和用户之间关系的系统包括用户数据仓库aOl、中间数据采集存储装置a02、特征数据采集存储装置a03、特征数据识别分析装置a04以及展现输出装置a05 ;其中,所述用户数据仓库aOl用于存储原始用户数据;所述中间数据采集存储装置a02用于从用户数据仓库aOl中抽取与用户特征相关的数据,在进行清洗、转换、规约处理后集成存储;特征数据采集存储装置a03用于采集中间数据采集存储装置a02处理后的用户数据,转换成用户特征数据并进行分类存储;特征数据识别分析装置a04用于对特征数据采集存储装置a03所存储的用户特征数据进行分析处理,识别用户群和用户之间的关系,分析用户的消费行为,识别用户群中消费额度、圈内交往指数高于用户群平均水平和协议关系中为责任方的重点用户;展现输出装置a05用于输出相应结果。如图2所示,本发明中的中间数据采集存储装置a02包括用户注册信息采集单元 bOl,用于采集家庭固定电话、个人移动电话和宽带的用户开户注册信息;移动基站小区信息采集单元b02,用于采集移动通信基站各小区的位置和覆盖区域信息;用户通信信息采集单元b03,用于采集用户通信记录;用户消费信息采集单元b04,用于采集用户通信相关的消费行为和服务行为等信息;用户缴费信息采集单元b05,用于采集用户缴费记录,包括缴费方式、金额和地点等信息;用户终端信息采集单元b06,用于采集用户终端代码信息; 用户套餐信息采集单元b07,用于采集用户当前的消费套餐名称和属性信息;互联网信息采集单元b08,用于采集用户的固网互联网和移动互联网的登录和使用记录信息;行业信息采集单元b09,用于采集各行业单位的相关用户记录信息;中间数据处理存储单元b00, 用于数据输入、输出及清洗、转换、规约处理,并集成存储与用户特征相关的数据。如图3所示,本发明中的特征数据采集存储装置a03包括交往参数采集单元 cOl,用于从通信信息、消费信息、套餐信息和互联网信息数据中采集用户之间的交往信息; 协议关系参数采集单元c02,用于从注册信息、消费信息、缴费信息、终端信息、套餐信息、互联网信息和行业信息数据中采集用户之间的协议关系信息;地理参数采集单元c03,用于从注册信息、通信信息、缴费信息、套餐信息、移动基站小区信息、互联网信息和行业信息数据中采集用户的地理信息;消费参数采集单元c04,用于采集每个用户的消费行为信息;特征数据处理存储单元cOO,用于特征数据的输入、输出和存储处理。如图4所示,本发明中的特征数据识别分析装置a04包括交往指数分析识别单元dOl,用于分析识别用户通信、消费、套餐和互联网信息中的交往指数;协议关联关系分析识别单元d02,用于分析识别用户注册、消费协议、互联网登记、行业相关信息中姓名、号码之间的关联关系;地理关联关系分析识别单元d03,用于分析识别用户注册、通信、缴费、 上网、行业记录信息中的地理关联关系;用户群和用户关系分析识别单元d00,用于用户群和识别用户之间的关系,分析用户的消费行为,识别用户群中的重点用户。图4中的用户群和用户关系分析识别单元d00还包括家庭成员分析识别模块,用于分析识别各家庭的成员组成;同事圈分析识别模块,用于分析识别工作单位的成员组成; 同学圈分析识别模块,用于分析识别同学圈的成员组成;朋友圈分析识别模块,用于分析识别朋友圈中的成员组成;共同业务或兴趣圈分析识别模块,用于分析识别有共同业务或兴趣爱好的群体的成员组成;其他用户群分析模块,用于分析识别其他存在某些特定共同用户特征的用户群组成。本发明的采集和利用用户特征数据识别用户群和用户之间关系的方法利用上述系统,如图5所示包括如下步骤
步骤e00:从用户数据仓库中采集与用户特征相关的数据,在进行清洗、转换、规约处理后集成存储为用户数据;
步骤e01 利用所存储的用户数据,采集用户特征数据分类存储; 步骤e02 分析所存储的用户特征数据,识别用户群和用户之间的关系,分析用户的消费行为,判断用户群中的重点用户;
步骤e03 把分析结果按照需求展现输出。其中,用户特征数据包括用户交往参数、协议关系参数、地理参数和消费参数。步骤e00中包括采集用户开户注册信息;采集移动通信基站各小区的位置和覆盖区域信息;采集用户通信记录;采集用户通信相关的消费行为和服务行为等信息;采集用户缴费记录;采集用户终端代码信息;采集用户的消费套餐名称和属性信息;采集用户的互联网登录和使用记录信息;采集各行业单位的相关用户记录信息。步骤e01中包括从通信信息、消费信息、套餐信息和互联网信息数据中采集用户之间的交往参数信息;从注册信息、消费信息、缴费信息、终端信息和套餐信息、互联网信息和行业信息数据中采集用户之间的协议关系参数信息;从注册信息、通信信息、缴费信息、 套餐信息、移动基站小区信息、互联网信息和行业信息数据中采集地理参数信息;采集每个用户的消费行为参数信息。如图6所示,步骤e02中包括
步骤f00 分析识别用户通信、消费、套餐和互联网信息中的用户交往指数; 步骤fOl 分析识别用户注册、消费协议、互联网和行业信息中姓名、号码之间的协议关联关系;
步骤f02 分析识别用户注册、通信、缴费、互联网和行业信息中的地理关联关系;
步骤f03 分析识别用户群和识别用户之间的关系;
步骤f04:分析用户群中用户消费行为,识别用户群中的重点用户。其中步骤f00包括如下步骤
步骤fOO-Ι 分时段统计分析用户的频繁交往圈;
步骤f00-2 分时段统计分析用户的稳定非频繁交往圈;
步骤f00-3 统计分析特定时间(如节假日、重大事件时间等)用户的交往圈;
步骤f00-4 建立包括步骤f00-l至f00-3所述内容的用户交往指数表。步骤fOl包括
步骤f01-l 识别家庭套餐、集团套餐、校园套餐、小区套餐所包含的用户,标注单独的标识;
步骤fOl-2 分析识别交叉优惠套餐的用户,标注单独的交叉优惠标识; 步骤fOl-3 分析代缴费用户,标注代缴关系标识; 步骤f01-4 把套餐中包含的终端序列号转换电话号码的对应关系; 步骤fOl-5:分析用户固定电话、移动电话和宽带注册信息和互联网各应用登记注册信息及行业信息中的开户用户、联系人、担保人、单位的名称、号码对应关系,标注关联关系;
步骤f01-6 建立包括步骤f01-l至f01-5所述内容的协议关联关系表。
步骤f02包括如下步骤
步骤f02-l 把行政区划地址、移动基站小区代码、套餐中区域代码、营业店面代码、网吧地址等转换成统一的地理区域代码格式;
步骤f02-2 把采集到的地理参数信息转换对应成统一的地理区域代码; 步骤 2-3 分时段统计分析用户活动区域,区分长期稳定频繁活动、阶段性频繁活动、长期稳定但非频繁活动类别,并区分用户工作、学习、生活活动区域性质; 步骤f02-4 统计同一区域内活动的用户号码,标注活动区域性质; 步骤 2-5 分析识别用户活动区域、用户注册区域和联系人、担保人、单位所在区域、 套餐包含区域、缴费区域之间的关联关系;
步骤f02-6 建立包括步骤f02-l至f02-5所述内容的地理关联关系表。
步骤 3包括如下步骤
步骤f03-l 选择目标用户交往圈范围,利用步骤f00-4建立的用户交往指数表,分析用户群的各用户的交往指数,判断出拥有共同的交往圈的用户群,分配用户群标识和用户群指数,并根据此用户群内每个用户交往指数的不同对应不同的成员指数;
步骤f03_2 选择目标用户区域范围,利用步骤f02_6建立的地理关联关系表,判断区域内符合目标用户特征的用户群;
步骤f03-3 对比步骤f03-l、 3-2识别出的用户群,分析成员组成和交往圈的重合度,根据重合度调整用户群指数和成员指数;
步骤f03-4 利用步骤f01-6建立的协议关联关系表,判断用户群内的用户号码之间存在协议关联关系,如果存在,增加存在协议关联关系用户的成员指数;
步骤 3-5 分析各用户群内的用户的目标特征,按照群体特征的符合程度增加用户群指数,并增加其中符合特征的用户的用户群成员指数;
步骤 3-6 根据用户群指数判断有某项特定共同特征的用户群符合率,如果符合,建立用户群数据表,并根据用户群成员指数确定成员组成。步骤f04包括如下步骤
步骤 4-1 分析用户的消费行为,识别用户消费需求,建立用户消费特征表; 步骤f04-2:对比分析用户群(圈)内的用户消费行为,并利用步骤f00-4建立的用户交往指数表、步骤f01-6建立的协议关联关系表,分别识别出消费额度、圈内交往指数高于用户群平均水平和协议关系中为责任方的重点用户。以下结合具体实施例对本发明进行进一步说明。1、交往指数
每个人在日常工作生活中,都有相对固定的沟通群体,构成大大小小的交往圈,而一个拥有某种特定关系或拥有某些共同特征的用户群,其交往圈相对固定。在本发明的具体实施例中,利用所述特征数据采集存储装置中的交往参数采集单元采集的用户之间通信信息、消费信息、套餐信息中的用户交往特征数据,转换成某个周期内的两个用户之间的通话交往特征(含通话次数、通话时长、通话费率、通话时段的指标)、信息交往特征(含短信、彩信、邮件次数和时段的指标)、互联网交往特征(网上聊天、同一门户或社区的次数、时长、时段的指标)组成的用户交往参数,通过设定不同的起始点和周期长度来构成时基的两个用户的交往参数组。通话交往特征
Character_Ca1l=F_Cal1(Num_Call, Minute_Call, Fee_Call, Time_Call)
其中,Num_Call 通话次数、通话时长、通话费率、通话时段 Minute_Call 通话平均时长 Fee_Call 通话平均费率 Time_Call 通话时段分布
F_Call 表示 Num_Call、Minute_Call、Fee_Call、Time_Call 加权组合的线性函数。信息交往特征 Character_Info=F_Info(Num_SMS, Time_SMS, Num_MMS, Time_MMS, Num_Mail, Time_Mail)
其中,Num_SMS 短信次数 Time_SMS 短信时段Num_MMS 彩信次数 Time_MMS 彩信时段 Num_Mail 邮件次数 Time_Mail 邮件时段
FJnfo 表示 Num_SMS、Time_SMS、Num_MMS、Time_MMS、Num_Mai 1、Time_Mai 1 加权组合的线性函数。互联网交往特征
Character_Net=F_Net(Num_Chat, Minute_Chat, Time_Chat,
Num_Portal, Minute—Portal,Time—Portal)
其中,Num_Chat :网上聊天次数
Minute_Chat :网上聊天时长
Time_Chat 网上聊天时段分布
Num_Portal 同一门户或社区次数
Minute_Portal 同一门户或社区时长
Time_Portal 同一门户或社区时段分布
F_Net 表不 Num_Chat、Minute_Chat、Time_Chat、Num_Portal、Minute_Portal、Time_ Portal加权组合的线性函数。用户a和用户η之间在某个周期T内的交往参数 Character_Usera_n=F_Usera_n (F_Call, F_Info, F_Net) 其中,F_USera_n 表示与周期T相关的归一化函数。通过设定不同的周期T和起始点T0,以及在函数中对特征数据采取不同的加权值,可以计算出用户之间交往的频繁度、稳定度、重要度和私密度构成的交往指数,体现不同的用户交往关系。把用户a和其交往圈各用户之间在某个周期T内的交往指数存储在所述特征数据处理存储单元中,即构成用户a与其交往圈各用户之间的交往指数表。同样,建立其他用户与其各自交往圈各用户之间的交往指数表,构成如下
权利要求
1.一种采集和利用用户特征数据识别用户群和用户之间关系的系统,其特征在于,包括用户数据仓库、中间数据采集存储装置、特征数据采集存储装置、特征数据识别分析装置以及展现输出装置;其中,所述用户数据仓库用于存储原始用户数据;所述中间数据采集存储装置用于从用户数据仓库中抽取与用户特征相关的数据,在进行清洗、转换、规约处理后集成存储;特征数据采集存储装置用于采集中间数据采集存储装置处理后的用户数据,转换成用户特征数据并进行分类存储;特征数据识别分析装置用于对特征数据采集存储装置所存储的用户特征数据进行分析处理,识别用户群和用户之间的关系,分析用户的消费行为,识别用户群中消费额度、圈内交往指数高于用户群平均水平和协议关系中为责任方的重点用户;展现输出装置用于输出相应结果。
2.根据权利要求1所述的系统,其特征在于,所述中间数据采集存储装置包括 用户注册信息采集单元,用于采集家庭固定电话、个人移动电话和宽带的用户开户注册信息;移动基站小区信息采集单元,用于采集移动通信基站各小区的位置和覆盖区域信息; 用户通信信息采集单元,用于采集用户通信记录;用户消费信息采集单元,用于采集用户通信相关的消费行为和服务行为等信息; 用户缴费信息采集单元,用于采集用户缴费记录,包括缴费方式、金额和地点信息; 用户终端信息采集单元,用于采集用户终端代码信息; 用户套餐信息采集单元,用于采集用户当前的消费套餐名称和属性信息; 互联网信息采集单元,用于采集用户的固网互联网和移动互联网的登录和使用记录信息;行业信息采集单元,用于采集各行业单位的相关用户记录信息; 中间数据处理存储单元,用于数据输入、输出及清洗、转换、规约处理,并集成存储与用户特征相关的数据。
3.根据权利要求1所述的系统,其特征在于,所述特征数据采集存储装置包括交往参数采集单元,用于从通信信息、消费信息、套餐信息和互联网信息数据中采集用户之间的交往信息;协议关系参数采集单元,用于从注册信息、消费信息、缴费信息、终端信息、套餐信息、 互联网信息和行业信息数据中采集用户之间的协议关系信息;地理参数采集单元,用于从注册信息、通信信息、缴费信息、套餐信息、移动基站小区信息、互联网信息和行业信息数据中采集用户的地理信息; 消费参数采集单元,用于采集每个用户的消费行为信息; 特征数据处理存储单元,用于特征数据的输入、输出和存储处理。
4.根据权利要求1所述的系统,其特征在于,所述特征数据识别分析装置包括 交往指数分析识别单元,用于分析识别用户通信、消费、套餐和互联网信息中的交往指数;协议关联关系分析识别单元,用于分析识别用户注册、消费协议、互联网登记、行业相关信息中姓名、号码之间的关联关系;地理关联关系分析识别单元,用于分析识别用户注册、通信、缴费、上网、行业记录信息中的地理关联关系;用户群和用户关系分析识别单元,用于用户群和识别用户之间的关系,分析用户的消费行为,识别用户群中的重点用户。
5.根据权利要求4所述的系统,其特征在于,所述用户群和用户关系分析识别单元包括家庭成员分析识别模块,用于分析识别各家庭的成员组成; 同事圈分析识别模块,用于分析识别工作单位的成员组成; 同学圈分析识别模块,用于分析识别同学圈的成员组成; 朋友圈分析识别模块,用于分析识别朋友圈中的成员组成;共同业务或兴趣圈分析识别模块,用于分析识别有共同业务或兴趣爱好的群体的成员组成;其他用户群分析模块,用于分析识别其他存在特定共同用户特征的用户群组成。
6.一种基于权利要求1至5任一所述系统的采集和利用用户特征数据识别用户群和用户之间关系的方法,包括如下步骤步骤A 从用户数据仓库中采集与用户特征相关的数据,在进行清洗、转换、规约处理后集成存储为用户数据;步骤B 利用所存储的用户数据,采集用户特征数据分类存储; 步骤C:分析所存储的用户特征数据,识别用户群和用户之间的关系,分析用户的消费行为,判断用户群中的重点用户;步骤D 把分析结果按照需求展现输出。
7.根据权利要求6所述的方法,其特征在于,所述用户特征数据包括用户交往参数、协议关系参数、地理参数和消费参数。
8.根据权利要求6所述的方法,其特征在于,步骤A中所述与用户特征相关的数据采集包括如下步骤步骤Al 采集用户开户注册信息;步骤A2 采集移动通信基站各小区的位置和覆盖区域信息; 步骤A3 采集用户通信记录;步骤A4 采集用户通信相关的消费行为和服务行为信息; 步骤A5 采集用户缴费记录; 步骤A6 采集用户终端代码信息; 步骤A7 采集用户的消费套餐名称和属性信息; 步骤A8 采集用户的互联网登录和使用记录信息; 步骤A9 采集各行业单位的相关用户记录信息。
9.根据权利要求6所述的方法,其特征在于,步骤B中所述采集用户特征数据包括如下步骤步骤Bl 从通信信息、消费信息、套餐信息和互联网信息数据中采集用户之间的交往参数信息;步骤B2 从注册信息、消费信息、缴费信息、终端信息和套餐信息、互联网信息和行业信息数据中采集用户之间的协议关系参数信息;步骤B3 从注册信息、通信信息、缴费信息、套餐信息、移动基站小区信息、互联网信息和行业信息数据中采集地理参数信息;步骤B4 采集每个用户的消费行为参数信息。
10.根据权利要求6所述的方法,其特征在于,步骤C中所述识别用户群和用户之间的关系包括如下步骤步骤Cl 分析识别用户通信、消费、套餐和互联网信息中的用户交往指数; 步骤C2 分析识别用户注册、消费协议、互联网和行业信息中姓名、号码之间的协议关联关系;步骤C3 分析识别用户注册、通信、缴费、互联网和行业信息中的地理关联关系;步骤C4 分析识别用户群和识别用户之间的关系;步骤C5 分析用户群中用户消费行为,识别用户群中的重点用户。
11.根据权利要求10所述的方法,其特征在于,步骤Cl中识别用户交往指数包括如下步骤步骤ClO 分时段统计分析用户的频繁交往圈;步骤Cll 分时段统计分析用户的稳定非频繁交往圈;步骤C12 统计分析特定时间用户的交往圈;步骤C13 建立包括步骤ClO至C12所述内容的用户交往指数表。
12.根据权利要求11所述的方法,其特征在于,所述特定时间包括节假日和重大事件时间。
13.根据权利要求11所述的方法,其特征在于,步骤C2中识别协议关联关系包括如下步骤步骤C20:识别家庭套餐、集团套餐、校园套餐、小区套餐所包含的用户,标注单独的标识;步骤C21 分析识别交叉优惠套餐的用户,标注单独的交叉优惠标识; 步骤C22 分析代缴费用户,标注代缴关系标识; 步骤C23 把套餐中包含的终端序列号转换电话号码的对应关系; 步骤C24:分析用户固定电话、移动电话和宽带注册信息和互联网各应用登记注册信息及行业信息中的开户用户、联系人、担保人、单位的名称、号码对应关系,标注关联关系; 步骤C25 建立包括步骤C20至CM所述内容的协议关联关系表。
14.根据权利要求10所述的方法,其特征在于,步骤C3中识别地理关联关系包括如下步骤步骤C30:把行政区划地址、移动基站小区代码、套餐中区域代码、营业店面代码、网吧地址转换成统一的地理区域代码格式;步骤C31 把采集到的地理参数信息转换对应成统一的地理区域代码; 步骤C32 分时段统计分析用户活动区域,区分长期稳定频繁活动、阶段性频繁活动、 长期稳定但非频繁活动类别,并区分用户工作、学习、生活活动区域性质; 步骤C33 统计同一区域内活动的用户号码,标注活动区域性质; 步骤C34 分析识别用户活动区域、用户注册区域和联系人、担保人、单位所在区域、套餐包含区域、缴费区域之间的关联关系;步骤C35 建立包括步骤C30至C34所述内容的地理关联关系表。
15.根据权利要求13所述的方法,其特征在于,步骤C4中识别用户群和用户之间的关系包括如下步骤步骤C40 选择目标用户交往圈范围,利用步骤C13建立的用户交往指数表,分析用户群的各用户的交往指数,判断出拥有共同的交往圈的用户群,分配用户群标识和用户群指数,并根据此用户群内每个用户交往指数的不同对应不同的成员指数;步骤C41 选择目标用户区域范围,利用步骤C35建立的地理关联关系表,判断区域内符合目标用户特征的用户群;步骤C42 对比步骤C40、C41识别出的用户群,分析成员组成和交往圈的重合度,根据重合度调整用户群指数和成员指数;步骤C43 利用步骤C25建立的协议关联关系表,判断用户群内的用户号码之间存在协议关联关系,如果存在,增加存在协议关联关系用户的成员指数;步骤C44:分析各用户群内的用户的目标特征,按照群体特征的符合程度增加用户群指数,并增加其中符合特征的用户的用户群成员指数;步骤C45 根据用户群指数判断有特定共同特征的用户群符合率,如果符合,建立用户群数据表,并根据用户群成员指数确定成员组成。
16.根据权利要求13所述的方法,其特征在于,步骤C5中用户消费行为和重点用户的分析识别包括如下步骤步骤C50 分析用户的消费行为,识别用户消费需求,建立用户消费特征表; 步骤C51 对比分析用户群内的用户消费行为,并利用步骤C13建立的用户交往指数表、步骤C25建立的协议关联关系表,分别识别出消费额度、圈内交往指数高于用户群平均水平和协议关系中为责任方的重点用户。
全文摘要
本发明涉及一种采集和利用用户特征数据识别用户群和用户之间关系的系统,包括用户数据仓库、中间数据采集存储装置、特征数据采集存储装置、特征数据识别分析装置和展现输出装置;其中所述用户数据仓库存储原始用户数据;所述中间数据采集存储装置从用户数据仓库中抽取与用户特征相关的数据;特征数据采集存储装置采集中间数据采集存储装置处理后的用户数据,并转换成用户特征数据;特征数据识别分析装置对特征数据采集存储装置存储的用户特征数据进行分析处理,并对用户群和用户之间关系进行识别;展现输出装置用于输出相应结果。本发明同时公开了一种采集和利用用户特征数据识别用户群和用户之间关系的方法。本发明实现了用户特征和关系的识别。
文档编号G06F17/30GK102541886SQ201010596310
公开日2012年7月4日 申请日期2010年12月20日 优先权日2010年12月20日
发明者郝敬涛, 马惠珠 申请人:郝敬涛, 马惠珠
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1