一种基于标签库的电信用户兴趣度分析方法及系统的制作方法

文档序号:10612806阅读:208来源:国知局
一种基于标签库的电信用户兴趣度分析方法及系统的制作方法
【专利摘要】为解决现有技术电信用户兴趣度分析方法存在的不能够精准分析电信用户对各种电信业务或服务的兴趣度,易引起电信用户的反感或投诉等问题,本发明提出一种基于标签库的电信用户兴趣度分析方法及系统,通过获取全业务环境下的电信业务信息、电信用户上网行为、用户业务使用信息;运用相关分析法对用户标签库和电信业务信息进行分析并形成用户宽表,针对每个用户宽表的字段进行标签定义,并将用户宽表数据库中用户宽表值及与之对应的标签值进行匹配,生成用户标签库;形成“用户?业务”二维兴趣度矩阵和“时间?用户?业务”的三维兴趣度矩阵,实现了电信用户兴趣度的量化分析和精准分析,为电信业务的精准营销奠定了基础。
【专利说明】
一种基于标签库的电信用户兴趣度分析方法及系统
技术领域
[0001] 本发明涉及电信用户兴趣度分析方法技术领域,具体涉及到一种基于标签库的电 信用户兴趣度分析方法及系统。
【背景技术】
[0002] 随着移动互联网的快速发展,电信运营商在传统的语音和信息方面的收入呈明显 的下降趋势,同时,运营商的业务增长空间由于流量价值不断向0ΤΤ服务商转移而受到挤 压,运营商日益呈现出管道化、边缘化、低值化的发展趋势,因此,实现对自身电信业务的精 准营销能够帮助运营商攫取更大的价值。
[0003] 然而,要想实现对自身电信业务的精准营销,其前提条件是对电信用户对各种电 信业务或服务的兴趣度的精准分析,并以此分析为基础向电信用户进行营销,以更精确的 手段进行用户需求挖掘与业务营销推广。现有技术电信用户兴趣度分析方法通常采用基于 电信用户的基本资料、地理位置、通信行为等数据的分析和挖掘,从中发现业务运营规律, 进而开展电信业务推荐。但随着移动互联网的不断发展,以及用户使用终端的多样化,加之 互联网上丰富多彩的内容和非常复杂繁琐的电信用户行为,使得现有技术电信用户兴趣度 分析方法不能精准分析电信用户对各种电信业务或服务的兴趣度,盲目的营销不仅会引起 电信用户的反感,而且极其容易引发电信用户的投诉。显然,现有技术电信用户兴趣度分析 方法存在着不能够精准分析电信用户对各种电信业务或服务的兴趣度,易引起电信用户的 反感或投诉等问题。

【发明内容】

[0004] 为解决现有技术电信用户兴趣度分析方法存在的不能够精准分析电信用户对各 种电信业务或服务的兴趣度,易引起电信用户的反感或投诉等问题,本发明提出一种基于 标签库的电信用户兴趣度分析方法及系统。
[0005] 本发明基于标签库的电信用户兴趣度分析方法,包括以下步骤:
[0006] S1、获取电信业务信息、用户身份信息、用户上网行为信息、信令数据、BOSS数据、 经分数据和頂EI信息,并对获取的数据进行净化处理;所述净化处理包括检查数据一致性, 剔除不一致的数据、无效值和缺失值;
[0007] S2、对采集数据进行解析、整合,对获取的信息进行分类,生成用户宽表并存储到 用户宽表数据库;所述用户宽表包括用户基本属性和上网行为属性,分为地理位置、电信业 务关系、互联网行为-互联网产品、基础信息、用户身份特征、用户业务关系、渠道信息、渠 道与位置、搜索行为、消费行为信息、用量类属性和终端信息共十二个类别;
[0008] S3、针对每个用户宽表的字段进行标签定义,并将用户宽表数据库中用户宽表值 及与之对应的标签值进行匹配,生成用户标签库;
[0009] S4、根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信 业务之间的"用户-业务"二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务 之间的兴趣度;
[0010] S5、在设定时间间隔内运用相关分析法进行分析可生成"时间-用户-业务"的三维 兴趣度矩阵。
[0011] 进一步的,步骤S1中所述电信业务信息包含运营商终端信息、套餐信息和移动增 值业务信息;所述用户身份信息包含性别、年龄、教育背景、职业、所属行业和薪资状况信 息;所述用户上网行为信息包含用户上网轨迹、用户搜索关键字信息和用户内容偏好信息; 所述BOSS信息包含用户资料、业务管理信息、用户订购业务信息和资费信息;所述頂EI信息 即用户终端信息;其中,所述用户上网行为信息主要依靠用户上网日志信息、爬虫技术和 DPI识别获取。
[0012] 进一步的,步骤S2中的用户宽表,包括:
[0013]所述地理位置包含居住地、工作地和行政区域信息;
[0014] 所述电信业务关系包含套餐信息、漫游通话费、短信费、彩信费、当月2/3/4G流量、 增值业务流量和通话时长信息;
[0015] 所述互联网行为-互联网产品信息包含用户是否为运营商自有业务用户信息;
[0016] 所述基础信息包含IMSI、性别、年龄、归属区域和集团用户标识信息;
[0017] 所述用户身份特征包含入网时长、市场类型、所在集团单位行业分类和VIP用户星 级信息;
[0018] 所述用户业务关系包含缴费模式、欠费催收模式和信用等级信息;
[0019] 所述渠道信息包含10086人工/自动业务次数、网厅业务次数和用户渠道偏好Top 信息;
[0020] 所述渠道与位置包含是否跨区域流动和实时漫游出访状态信息;
[0021] 所述搜索行为主要集中在终端信息,包含是否搜索过各大主流手机厂商终端信 息;
[0022] 所述消费行为信息包含是否办理话费捆绑优惠/终端捆绑优惠/实物捆绑优惠信 息;
[0023] 所述用量类属性包含2/3/4G套餐使用率、夜间使用流量、流量敏感程度、漫游长途 费用和套餐外流量溢出值信息;
[0024] 所述终端信息包含终端网络类型、当前手机网络制式、累计关机次数、平均换机生 命周期、换机时长和曾使用的手机个数信息
[0025] 其中,所述运营商自有业务包括来电提醒、咪咕音乐、移动MM、和视频、和阅读及和 游戏。
[0026] 进一步的,步骤S3中针对每个用户宽表的字段进行标签定义,包括,针对步骤S2中 生成的用户宽表字段进行用户标签定义,使得每个宽表字段都能划分为若干个标签表示, 并且,保证标签定义的合理性和完整性。
[0027] 进一步的,步骤S4中根据用户标签库及电信业务信息,运用相关分析法进行分析 生成用户与电信业务之间的"用户-业务"二维兴趣度矩阵,其矩阵中的任一元素均为某用 户与某电信业务之间的兴趣度,包括,
[0028] 所述相关分析矩阵的每一行都用标签表示,每个标签的若干个值按照从低到高的 顺序进行等距归一化表示;所述相关分析矩阵的每一列都用不同的电信业务表示,针对不 同的电信业务,每一行对应的标签权重也不同,标签权重根据不同标签与电信业务之间的 关联程度确定;
[0029] 设某用户有η个标签,每个标签的分级数目为m(i = l,2, ···!〇,每个标签相对于电 信业务j的权重值为Aij(i = 1,2,···!!),每个用户的标签分值为Ci/Bi(i = 1,2,…η;Ci = 1, 2,~m),则某用户与电信业务j的兴趣度的计算公式为:
[0030]
[0031] 对用户标签库中电信用户逐个进行相关矩阵分析,即可得到所有电信用户的"用 户-业务"二维兴趣度矩阵。
[0032] 本发明基于标签库的电信用户兴趣度分析系统,包括,数据和信息采集模块、数据 和信息处理模块、用户标签库模块和相关分析模块;
[0033] 所述数据和信息采集模块用于获取电信业务信息、用户身份信息、用户上网行为 信息、信令数据、BOSS数据、经分数据和頂EI信息,并对获取的数据进行净化处理;所述净化 处理包括检查数据一致性,剔除不一致的数据、无效值和缺失值;
[0034] 所述数据和信息处理模块用于对采集数据进行解析、整合,对获取的信息进行分 类,生成用户宽表并存储到用户宽表数据库;所述用户宽表包括用户基本属性和上网行为 属性,分为地理位置、电信业务关系、互联网行为-互联网产品、基础信息、用户身份特征、用 户业务关系、渠道信息、渠道与位置、搜索行为、消费行为信息、用量类属性和终端信息共十 二个类别;
[0035] 所述用户标签库模块用于针对每个用户宽表的字段进行标签定义,并将用户宽表 数据库中用户宽表值及与之对应的标签值进行匹配,生成用户标签库;
[0036] 所述相关分析模块用于根据用户标签库及电信业务信息,运用相关分析法进行分 析生成用户与电信业务之间的"用户-业务"二维兴趣度矩阵,其矩阵中的任一元素均为某 用户与某电信业务之间的兴趣度;并且,在设定时间间隔内运用相关分析法进行分析可生 成"时间-用户-业务"的三维兴趣度矩阵。
[0037] 进一步的,所述数据和信息采集模块采集的电信业务信息包含运营商终端信息、 套餐信息和移动增值业务信息;所述用户身份信息包含性别、年龄、教育背景、职业、所属行 业和薪资状况信息;所述用户上网行为信息包含用户上网轨迹、用户搜索关键字信息和用 户内容偏好信息;所述BOSS信息包含用户资料、业务管理信息、用户订购业务信息和资费信 息;所述頂EI信息即用户终端信息;其中,所述用户上网行为信息主要依靠用户上网日志信 息、爬虫技术和DPI识别获取。
[0038]进一步的,所述用户宽表分类,包括,
[0039]所述地理位置包含居住地、工作地和行政区域信息;
[0040] 所述电信业务关系包含套餐信息、漫游通话费、短信费、彩信费、当月2/3/4G流量、 增值业务流量和通话时长信息;
[0041] 所述互联网行为-互联网产品信息包含用户是否为运营商自有业务用户信息;
[0042] 所述基础信息包含IMSI、性别、年龄、归属区域和集团用户标识信息;
[0043] 所述用户身份特征包含入网时长、市场类型、所在集团单位行业分类和VIP用户星 级信息;
[0044] 所述用户业务关系包含缴费模式、欠费催收模式和信用等级信息;
[0045] 所述渠道信息包含10086人工/自动业务次数、网厅业务次数和用户渠道偏好Top 信息;
[0046] 所述渠道与位置包含是否跨区域流动和实时漫游出访状态信息;
[0047] 所述搜索行为主要集中在终端信息,包含是否搜索过各大主流手机厂商终端信 息;
[0048]所述消费行为信息包含是否办理话费捆绑优惠/终端捆绑优惠/实物捆绑优惠信 息;
[0049] 所述用量类属性包含2/3/4G套餐使用率、夜间使用流量、流量敏感程度、漫游长途 费用和套餐外流量溢出值信息;
[0050] 所述终端信息包含终端网络类型、当前手机网络制式、累计关机次数、平均换机生 命周期、换机时长和曾使用的手机个数信息
[0051 ]其中,所述运营商自有业务包括来电提醒、咪咕音乐、移动MM、和视频、和阅读及和 游戏。
[0052]进一步的,所述相关分析模块根据用户标签库及电信业务信息,运用相关分析法 进行分析生成用户与电信业务之间的"用户-业务"二维兴趣度矩阵,其矩阵中的任一元素 均为某用户与某电信业务之间的兴趣度,包括,
[0053]所述相关分析矩阵的每一行都用标签表示,每个标签的若干个值按照从低到高的 顺序进行等距归一化表示;所述相关分析矩阵的每一列都用不同的电信业务表示,针对不 同的电信业务,每一行对应的标签权重也不同,标签权重根据不同标签与电信业务之间的 关联程度确定;
[0054] 设某用户有η个标签,每个标签的分级数目为m(i = l,2, ···!〇,每个标签相对于电 信业务j的权重值为Aij(i = 1,2,···!!),每个用户的标签分值为Ci/Bi(i = 1,2,…η;Ci = 1, 2,~m),则某用户与电信业务j的兴趣度的计算公式为:
[0055]
[0056]对用户标签库中电信用户逐个进行相关矩阵分析,即可得到所有电信用户的"用 户-业务"二维兴趣度矩阵。
[0057]本发明基于标签库的电信用户兴趣度分析方法及系统的有益技术效果是获取了 全业务环境下的电信业务信息、电信用户上网行为、用户业务使用信息;运用相关分析法对 用户标签库和电信业务信息进行分析,形成"用户-业务"二维兴趣度矩阵和"时间-用户-业 务"的三维兴趣度矩阵,实现了电信用户兴趣度的量化分析和精准分析,为电信业务的精准 营销奠定了基础。
【附图说明】
[0058]附图1为本发明基于标签库的电信用户兴趣度分析方法的步骤示意图;
[0059]附图2是本发明基于标签库的电信用户兴趣度分析系统的结构示意图。
[0060]下面结合附图对本发明基于标签库的电信用户兴趣度分析方法及系统作进一步 的说明。
【具体实施方式】
[0061] 显而易见地,下面描述中的附图仅仅是本发明的一些实施例,应当理解,此处所描 述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
[0062] 附图1为本发明基于标签库的电信用户兴趣度分析方法的步骤示意图,由图可知, 本发明基于标签库的电信用户兴趣度分析方法,包括以下步骤:
[0063] S1、获取电信业务信息、用户身份信息、用户上网行为信息、信令数据、BOSS数据、 经分数据和頂EI信息,并对获取的数据进行净化处理;所述净化处理包括检查数据一致性, 剔除不一致的数据、无效值和缺失值;
[0064] S2、对采集数据进行解析、整合,对获取的信息进行分类,生成用户宽表并存储到 用户宽表数据库;所述用户宽表包括用户基本属性和上网行为属性,分为地理位置、电信 业务关系、互联网行为-互联网产品、基础信息、用户身份特征、用户业务关系、渠道信息、渠 道与位置、搜索行为、消费行为信息、用量类属性和终端信息共十二个类别;
[0065] S3、针对每个用户宽表的字段进行标签定义,并将用户宽表数据库中用户宽表值 及与之对应的标签值进行匹配,生成用户标签库;
[0066] S4、根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信 业务之间的"用户-业务"二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务 之间的兴趣度;
[0067] S5、在设定时间间隔内运用相关分析法进行分析可生成"时间-用户-业务"的三维 兴趣度矩阵。
[0068]作为基本信息分类,步骤S1中所述电信业务信息包含运营商终端信息、套餐信息 和移动增值业务信息;所述用户身份信息包含性别、年龄、教育背景、职业、所属行业和薪资 状况信息;所述用户上网行为信息包含用户上网轨迹、用户搜索关键字信息和用户内容偏 好信息;所述BOSS信息包含用户资料、业务管理信息、用户订购业务信息和资费信息;所述 頂EI信息即用户终端信息;其中,所述用户上网行为信息主要依靠用户上网日志信息、爬虫 技术和DPI识别获取。
[0069]作为信息统计或分析的基础,步骤S2中的用户宽表,包括:
[0070]所述地理位置包含居住地、工作地和行政区域信息;
[0071]所述电信业务关系包含套餐信息、漫游通话费、短信费、彩信费、当月2/3/4G流量、 增值业务流量和通话时长信息;
[0072]所述互联网行为-互联网产品信息包含用户是否为运营商自有业务用户信息;
[0073] 所述基础信息包含IMSI、性别、年龄、归属区域和集团用户标识信息;
[0074] 所述用户身份特征包含入网时长、市场类型、所在集团单位行业分类和VIP用户星 级信息;
[0075] 所述用户业务关系包含缴费模式、欠费催收模式和信用等级信息;
[0076]所述渠道信息包含10086人工/自动业务次数、网厅业务次数和用户渠道偏好Top 信息;
[0077]所述渠道与位置包含是否跨区域流动和实时漫游出访状态信息;
[0078]所述搜索行为主要集中在终端信息,包含是否搜索过各大主流手机厂商终端信 息;
[0079] 所述消费行为信息包含是否办理话费捆绑优惠/终端捆绑优惠/实物捆绑优惠信 息;
[0080] 所述用量类属性包含2/3/4G套餐使用率、夜间使用流量、流量敏感程度、漫游长途 费用和套餐外流量溢出值信息;
[0081] 所述终端信息包含终端网络类型、当前手机网络制式、累计关机次数、平均换机生 命周期、换机时长和曾使用的手机个数信息
[0082] 其中,所述运营商自有业务包括来电提醒、咪咕音乐、移动MM、和视频、和阅读及和 游戏。
[0083] 标签化处理是本发明基于标签库的电信用户兴趣度分析方法的重要步骤之一,步 骤S3中针对每个用户宽表的字段进行标签定义,包括,针对步骤S2中生成的用户宽表字段 进行用户标签定义,使得每个宽表字段都能划分为若干个标签表示,并且,保证标签定义的 合理性和完整性。
[0084] 采用相关分析法获得各个电信用户对各种电信业务的兴趣度并以矩阵的方式,以 便于进一步的分析或应用。步骤S4中根据用户标签库及电信业务信息,运用相关分析法进 行分析生成用户与电信业务之间的"用户-业务"二维兴趣度矩阵,其矩阵中的任一元素均 为某用户与某电信业务之间的兴趣度,包括,
[0085] 所述相关分析矩阵的每一行都用标签表示,每个标签的若干个值按照从低到高的 顺序进行等距归一化表示;所述相关分析矩阵的每一列都用不同的电信业务表示,针对不 同的电信业务,每一行对应的标签权重也不同,标签权重根据不同标签与电信业务之间的 关联程度确定;
[0086] 设某用户有η个标签,每个标签的分级数目为m(i = l,2, ···!〇,每个标签相对于电 信业务j的权重值为Aij(i = 1,2,···!!),每个用户的标签分值为Ci/Bi(i = 1,2,…η;Ci = 1, 2,~m),则某用户与电信业务j的兴趣度的计算公式为:
[0087]
[0088] 对用户标签库中电信用户逐个进行相关矩阵分析,即可得到所有电信用户的"用 户-业务"二维兴趣度矩阵。
[0089] 附图2是本发明基于标签库的电信用户兴趣度分析系统的结构示意图,由图可知, 本发明基于标签库的电信用户兴趣度分析系统,包括,数据和信息采集模块、数据和信息处 理模块、用户标签库模块和相关分析模块;
[0090] 所述数据和信息采集模块用于获取电信业务信息、用户身份信息、用户上网行为 信息、信令数据、BOSS数据、经分数据和頂EI信息,并对获取的数据进行净化处理;所述净化 处理包括检查数据一致性,剔除不一致的数据、无效值和缺失值;
[0091] 所述电信业务信息包含运营商终端信息、套餐信息和移动增值业务信息;
[0092] 所述用户身份信息包含性别、年龄、教育背景、职业、所属行业和薪资状况信息;
[0093] 所述用户上网行为信息包含用户上网轨迹、用户搜索关键字信息和用户内容偏好 信息;
[0094]所述BOSS信息包含用户资料、业务管理信息、用户订购业务信息和资费信息;
[0095]所述ΠΕΙ信息即用户终端信息;
[0096]其中,所述用户上网行为信息主要依靠用户上网日志信息、爬虫技术和DPI识别获 取。
[0097]所述数据和信息处理模块用于对采集数据进行解析、整合,对获取的信息进行分 类,生成用户宽表并存储到用户宽表数据库;所述用户宽表包括用户基本属性和上网行为 属性,分为地理位置、电信业务关系、互联网行为-互联网产品、基础信息、用户身份特征、用 户业务关系、渠道信息、渠道与位置、搜索行为、消费行为信息、用量类属性和终端信息共十 二个类别;
[0098]所述地理位置包含居住地、工作地和行政区域信息;
[0099]所述电信业务关系包含套餐信息、漫游通话费、短信费、彩信费、当月2/3/4G流量、 增值业务流量和通话时长信息;
[0100]所述互联网行为-互联网产品信息包含用户是否为运营商自有业务用户信息;
[0101] 所述基础信息包含IMSI、性别、年龄、归属区域和集团用户标识信息;
[0102] 所述用户身份特征包含入网时长、市场类型、所在集团单位行业分类和VIP用户星 级信息;
[0103] 所述用户业务关系包含缴费模式、欠费催收模式和信用等级信息;
[0104] 所述渠道信息包含10086人工/自动业务次数、网厅业务次数和用户渠道偏好Top 信息;
[0105] 所述渠道与位置包含是否跨区域流动和实时漫游出访状态信息;
[0106] 所述搜索行为主要集中在终端信息,包含是否搜索过各大主流手机厂商终端信 息;
[0107] 所述消费行为信息包含是否办理话费捆绑优惠/终端捆绑优惠/实物捆绑优惠信 息;
[0108] 所述用量类属性包含2/3/4G套餐使用率、夜间使用流量、流量敏感程度、漫游长途 费用和套餐外流量溢出值信息;
[0109] 所述终端信息包含终端网络类型、当前手机网络制式、累计关机次数、平均换机生 命周期、换机时长和曾使用的手机个数信息
[011 0]其中,所述运营商自有业务包括来电提醒、咪咕音乐、移动MM、和视频、和阅读及和 游戏。 所述用户标签库模块用于针对每个用户宽表的字段进行标签定义,并将用户宽表 数据库中用户宽表值及与之对应的标签值进行匹配,生成用户标签库;
[0112]所述相关分析模块用于根据用户标签库及电信业务信息,运用相关分析法进行分 析生成用户与电信业务之间的"用户-业务"二维兴趣度矩阵,其矩阵中的任一元素均为某 用户与某电信业务之间的兴趣度;包括,所述相关分析矩阵的每一行都用标签表示,每个 标签的若干个值按照从低到高的顺序进行等距归一化表示;所述相关分析矩阵的每一列都 用不同的电信业务表示,针对不同的电信业务,每一行对应的标签权重也不同,标签权重根 据不同标签与电信业务之间的关联程度确定;
[0113]设某用户有η个标签,每个标签的分级数目为m(i = l,2, ···!〇,每个标签相对于电 信业务j的权重值为Aij(i = 1,2,···!!),每个用户的标签分值为Ci/Bi(i = 1,2,…η;Ci = 1, 2,~m),则某用户与电信业务j的兴趣度的计算公式为:
[0114]
[0115] 对用户标签库中电信用户逐个进行相关矩阵分析,即可得到所有电信用户的"用 户-业务"二维兴趣度矩阵。
[0116] 在设定时间间隔内运用相关分析法进行分析可生成"时间-用户-业务"的三维兴 趣度矩阵。
[0117] 显然,本发明基于标签库的电信用户兴趣度分析方法及系统的有益技术效果是获 取了全业务环境下的电信业务信息、电信用户上网行为、用户业务使用信息;运用相关分析 法对用户标签库和电信业务信息进行分析,形成"用户-业务"二维兴趣度矩阵和"时间-用 户-业务"的三维兴趣度矩阵,实现了电信用户兴趣度的量化分析和精准分析,为电信业务 的精准营销奠定了基础。
【主权项】
1. 一种基于标签库的电信用户兴趣度分析方法,其特征在于,该方法包括W下步骤: 51、 获取电信业务信息、用户身份信息、用户上网行为信息、信令数据、BOSS数据、经分 数据和IMEI信息,并对获取的数据进行净化处理;所述净化处理包括检查数据一致性,剔除 不一致的数据、无效值和缺失值; 52、 对采集数据进行解析、整合,对获取的信息进行分类,生成用户宽表并存储到用户 宽表数据库;所述用户宽表包括用户基本属性和上网行为属性,分为地理位置、电信业务关 系、互联网行为-互联网产品、基础信息、用户身份特征、用户业务关系、渠道信息、渠道与位 置、捜索行为、消费行为信息、用量类属性和终端信息共十二个类别; 53、 针对每个用户宽表的字段进行标签定义,并将用户宽表数据库中用户宽表值及与 之对应的标签值进行匹配,生成用户标签库; 54、 根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信业务 之间的"用户-业务"二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务之间 的兴趣度; 55、 在设定时间间隔内运用相关分析法进行分析可生成"时间-用户-业务"的Ξ维兴趣 度矩阵。2. 根据权利要求1所述基于标签库的电信用户兴趣度分析方法,其特征在于,步骤S1中 所述电信业务信息包含运营商终端信息、套餐信息和移动增值业务信息;所述用户身份信 息包含性别、年龄、教育背景、职业、所属行业和薪资状况信息;所述用户上网行为信息包含 用户上网轨迹、用户捜索关键字信息和用户内容偏好信息;所述BOSS信息包含用户资料、业 务管理信息、用户订购业务信息和资费信息;所述IMEI信息即用户终端信息;其中,所述用 户上网行为信息主要依靠用户上网日志信息、爬虫技术和DPI识别获取。3. 根据权利要求1所述基于标签库的电信用户兴趣度分析方法,其特征在于,步骤S2中 的用户宽表,包括: 所述地理位置包含居住地、工作地和行政区域信息; 所述电信业务关系包含套餐信息、漫游通话费、短信费、彩信费、当月2/3/4G流量、增值 业务流量和通话时长信息; 所述互联网行为-互联网产品信息包含用户是否为运营商自有业务用户信息; 所述基础信息包含IMSI、性别、年龄、归属区域和集团用户标识信息; 所述用户身份特征包含入网时长、市场类型、所在集团单位行业分类和VIP用户星级信 息; 所述用户业务关系包含缴费模式、欠费催收模式和信用等级信息; 所述渠道信息包含10086人工/自动业务次数、网厅业务次数和用户渠道偏好Top信息; 所述渠道与位置包含是否跨区域流动和实时漫游出访状态信息; 所述捜索行为主要集中在终端信息,包含是否捜索过各大主流手机厂商终端信息; 所述消费行为信息包含是否办理话费捆绑优惠/终端捆绑优惠/实物捆绑优惠信息; 所述用量类属性包含2/3/4G套餐使用率、夜间使用流量、流量敏感程度、漫游长途费用 和套餐外流量溢出值信息; 所述终端信息包含终端网络类型、当前手机网络制式、累计关机次数、平均换机生命周 期、换机时长和曾使用的手机个数信息 其中,所述运营商自有业务包括来电提醒、咪咕音乐、移动MM、和视频、和阅读及和游 戏。4. 根据权利要求1所述基于标签库的电信用户兴趣度分析方法,其特征在于,步骤S3中 针对每个用户宽表的字段进行标签定义,包括,针对步骤S2中生成的用户宽表字段进行用 户标签定义,使得每个宽表字段都能划分为若干个标签表示,并且,保证标签定义的合理性 和完整性。5. 根据权利要求1所述基于标签库的电信用户兴趣度分析方法,其特征在于,步骤S4中 根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信业务之间的 "用户-业务"二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务之间的兴趣 度,包括, 所述相关分析矩阵的每一行都用标签表示,每个标签的若干个值按照从低到高的顺序 进行等距归一化表示;所述相关分析矩阵的每一列都用不同的电信业务表示,针对不同的 电信业务,每一行对应的标签权重也不同,标签权重根据不同标签与电信业务之间的关联 程度确定; 设某用户有η个标签,每个标签的分级数目为Bi(i = l,2, ···!!),每个标签相对于电信业 务j的权重值为Aij(i = l,2,…n),每个用户的标签分值为Ci/Bi(i = l,2,…n;Ci = l,2,… Bl),则某用户与电信业务j的兴趣度w北勺计算公式为:对用户标签库中电信用户逐个进行相关矩阵分析,即可得到所有电信用户的"用户-业 务"二维兴趣度矩阵。6. -种基于标签库的电信用户兴趣度分析系统,其特征在于,该系统包括,数据和信息 采集模块、数据和信息处理模块、用户标签库模块和相关分析模块; 所述数据和信息采集模块用于获取电信业务信息、用户身份信息、用户上网行为信息、 信令数据、BOSS数据、经分数据和IMEI信息,并对获取的数据进行净化处理;所述净化处理 包括检查数据一致性,剔除不一致的数据、无效值和缺失值; 所述数据和信息处理模块用于对采集数据进行解析、整合,对获取的信息进行分类,生 成用户宽表并存储到用户宽表数据库;所述用户宽表包括用户基本属性和上网行为属性, 分为地理位置、电信业务关系、互联网行为-互联网产品、基础信息、用户身份特征、用户业 务关系、渠道信息、渠道与位置、捜索行为、消费行为信息、用量类属性和终端信息共十二个 类别; 所述用户标签库模块用于针对每个用户宽表的字段进行标签定义,并将用户宽表数据 库中用户宽表值及与之对应的标签值进行匹配,生成用户标签库; 所述相关分析模块用于根据用户标签库及电信业务信息,运用相关分析法进行分析生 成用户与电信业务之间的"用户-业务"二维兴趣度矩阵,其矩阵中的任一元素均为某用户 与某电信业务之间的兴趣度;并且,在设定时间间隔内运用相关分析法进行分析可生成"时 间-用户-业务"的Ξ维兴趣度矩阵。7. 根据权利要求6所述基于标签库的电信用户兴趣度分析系统,其特征在于,所述数据 和信息采集模块采集的电信业务信息包含运营商终端信息、套餐信息和移动增值业务信 息;所述用户身份信息包含性别、年龄、教育背景、职业、所属行业和薪资状况信息;所述用 户上网行为信息包含用户上网轨迹、用户捜索关键字信息和用户内容偏好信息;所述BOSS 信息包含用户资料、业务管理信息、用户订购业务信息和资费信息;所述IMEI信息即用户终 端信息;其中,所述用户上网行为信息主要依靠用户上网日志信息、爬虫技术和DPI识别获 取。8. 根据权利要求6所述基于标签库的电信用户兴趣度分析系统,其特征在于,所述用户 宽表分类,包括, 所述地理位置包含居住地、工作地和行政区域信息; 所述电信业务关系包含套餐信息、漫游通话费、短信费、彩信费、当月2/3/4G流量、增值 业务流量和通话时长信息; 所述互联网行为-互联网产品信息包含用户是否为运营商自有业务用户信息; 所述基础信息包含IMSI、性别、年龄、归属区域和集团用户标识信息; 所述用户身份特征包含入网时长、市场类型、所在集团单位行业分类和VIP用户星级信 息; 所述用户业务关系包含缴费模式、欠费催收模式和信用等级信息; 所述渠道信息包含10086人工/自动业务次数、网厅业务次数和用户渠道偏好Top信息; 所述渠道与位置包含是否跨区域流动和实时漫游出访状态信息; 所述捜索行为主要集中在终端信息,包含是否捜索过各大主流手机厂商终端信息; 所述消费行为信息包含是否办理话费捆绑优惠/终端捆绑优惠/实物捆绑优惠信息; 所述用量类属性包含2/3/4G套餐使用率、夜间使用流量、流量敏感程度、漫游长途费用 和套餐外流量溢出值信息; 所述终端信息包含终端网络类型、当前手机网络制式、累计关机次数、平均换机生命周 期、换机时长和曾使用的手机个数信息 其中,所述运营商自有业务包括来电提醒、咪咕音乐、移动MM、和视频、和阅读及和游 戏。9. 根据权利要求6所述基于标签库的电信用户兴趣度分析系统,其特征在于所述相关 分析模块根据用户标签库及电信业务信息,运用相关分析法进行分析生成用户与电信业务 之间的"用户-业务"二维兴趣度矩阵,其矩阵中的任一元素均为某用户与某电信业务之间 的兴趣度,包括, 所述相关分析矩阵的每一行都用标签表示,每个标签的若干个值按照从低到高的顺序 进行等距归一化表示;所述相关分析矩阵的每一列都用不同的电信业务表示,针对不同的 电信业务,每一行对应的标签权重也不同,标签权重根据不同标签与电信业务之间的关联 程度确定; 设某用户有η个标签,每个标签的分级数目为Bi(i = l,2, ···!!),每个标签相对于电信业 务j的权重值为Aij(i = l,2,…n),每个用户的标签分值为Ci/Bi(i = l,2,…n;Ci = l,2,… Bl),则某用户与电信业务j的兴趣度w北勺计算公式为:对用户标签库中电信用户逐个进行相关矩阵分析,即可得到所有电信用户的"用户-业 务"二维兴趣度矩阵。
【文档编号】G06Q30/02GK105975479SQ201610248727
【公开日】2016年9月28日
【申请日】2016年4月20日
【发明人】程亮, 张治中
【申请人】重庆重邮汇测通信技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1