养卡识别方法及系统的制作方法

文档序号:6584997阅读:181来源:国知局
专利名称:养卡识别方法及系统的制作方法
技术领域
本发明涉及业务支撑技术领域,尤其涉及一种养卡识别方法及系统。
背景技术
所谓“养卡”是指渠道代理商受利益驱使,利用运营商的政策漏洞或管理漏洞,通 过作弊手段制造虚假用户,冒充销售工作成果,达到牟取不正当利益的行为。养卡作弊行为 会造成运营商的巨大损失,因此,需要通过一定的技术手段对该行为进行识别。现有技术中,可以采用半人工半计算机处理的方式识别养卡作弊行为,具体为首 先人工自定义养卡识别规则;然后,根据自定义的养卡识别规则,识别代理商的养卡作弊行 为。上述养卡识别方法存在以下缺点需要根据样本数据人工总结养卡识别规则。即,需要在大量的养卡代理商已牟得 非法利益后,才能采集养卡代理商的样本数据,对该样本数据进行分析,总结出养卡识别规 则,此时,运营商往往已经产生了很大的损失。另外,该样本数据还需要能够充分地反映出 养卡代理商的特征,否则可能无法总结出准确的养卡识别规则。人工处理涉及用户号码隐私。即,在样本数据分析过程中,可能需要人工读取用户 数据,这就涉及到用户的隐私问题。缺乏自适应能力。即,在管理人员总结出一条养卡识别规则后,代理商可能会通过 改变作弊手段来避开这些识别规则,管理人员必须不断总结新的识别规则,从而耗费大量 的人力资源。

发明内容
有鉴于此,本发明提供一种养卡识别方法及系统,能够自动、准确地识别出代理商 的养卡作弊行为。为达到上述目的,本发明提供一种养卡识别方法,包括以下步骤获取用户号码的养卡相关数据;根据所述养卡相关数据,对所述用户号码进行分类,得到具有相似养卡相关数据 的用户号码群;获取所述用户号码群的特征指标信息,根据所述特征指标信息,判断所述用户号 码群是否为养卡用户号码群,得到所述养卡用户号码群;根据所述养卡用户号码群,识别养卡代理商。所述根据所述养卡相关数据,对所述用户号码进行分类,得到具有相似养卡相关 数据的用户号码群,具体为根据预设相似性分析算法,两两判断所述用户号码的养卡相关数据是否相似;采用预设分类算法,将养卡相关数据相似的用户号码组成一用户号码群。所述预设相似性分析算法为余弦相似性分析算法、欧氏距离分析算法或相关系数分析算法,所述预设分类算法为k-means簇聚分类算法。所述获取所述用户号码群的特征指标信息,具体为判断所述用户号码群中的用户号码数量是否超过预设阈值;获取用户号码数量超过预设阈值的用户号码群的特征指标信息。所述特征指标信息包括所述用户号码群中用户号码的养卡相关数据的平均状况 信息和内部差异信息;所述根据所述特征指标信息,判断所述用户号码群是否为养卡用户号码群,具体 为将所述平均状况信息和内部差异信息分别与预设阈值进行比较,得到一比较结 果;根据所述比较结果,判断所述用户号码群是否为养卡用户号码群。所述得到所述养卡用户号码群,之后还包括对所述养卡用户号码群中用户号码的养卡相关数据进行特征分析,得到养卡识别 规则;根据所述养卡识别规则,快速识别养卡用户号码。所述养卡相关数据包括用户号码的用户行为数据。所述养卡相关数据还包括代理商购销数据和/或运营商营销方案信息。本发明还提供一种养卡识别系统,包括第一获取模块,用于获取用户号码的养卡相关数据;分类模块,用于根据所述养卡相关数据,对所述用户号码进行分类,得到具有相似 养卡相关数据的用户号码群;第一判断模块,用于获取所述用户号码群的特征指标信息,根据所述特征指标信 息,判断所述用户号码群是否为养卡用户号码群,得到所述养卡用户号码群;识别模块,用于根据所述养卡用户号码群,识别养卡代理商。所述分类模块包括相似性分析单元,用于根据预设相似性分析算法,两两判断所述用户号码的养卡 相关数据是否相似;组群单元,用于采用预设分类算法,将养卡相关数据相似的用户号码组成一用户 号码群。所述养卡识别系统还包括筛选模块,用于判断所述分类模块中得到的用户号码群中的用户号码数量是否超 过预设阈值,并将用户号码数量超过预设阈值的用户号码群发送给所述第一判断模块。所述特征指标信息包括所述用户群中用户号码的养卡相关数据的平均状况信息 和内部差异信息;所述第一判断模块包括第一获取单元,用于获取所述用户号码群中用户号码的养卡相关数据的平均状况 fn息;第二获取单元,用于获取所述用户号码群中用户号码的养卡相关数据的内部差异 fn息;
比较单元,用于将所述平均状况信息和内部差异信息分别与预设阈值进行比较, 得到一比较结果;执行单元,用于根据所述比较结果,判断所述用户号码群是否为养卡用户号码群。所述养卡识别系统还包括识别规则生成模块,用于对所述养卡用户号码群中用户号码的养卡相关数据进行 特征分析,得到养卡识别规则;快速识别模块,用于根据所述养卡识别规则,快速识别养卡用户号码。本发明具有以下有益效果能够根据用户号码的养卡相关数据,对用户号码进行分类,得到养卡相关数据相 似的用户号码群,并根据用户号码群的特征指标信息,识别出养卡用户号码群,从而自动、 准确地识别出养卡代理商,整个养卡识别过程无需人工参与;另外,由于养卡代理商的养卡行为均体现在用户号码数据上,对用户号码数据进 行分析,无需关注代理商的养卡手段,因此,具有自适应能力,能够不断应对新出现的养卡 手段;在识别出养卡代理商后,还可以对养卡代理商的养卡行为数据进行取证,让作弊 的代理商伏法;能够判断运营商的营销方案被代理商养卡利用的风险,提醒营销管理人员改进营 销方案,避免不法代理商养卡套利。


图1为本发明实施例的养卡识别方法的一流程示意图;图2本发明实施例的养卡识别方法的另一流程示意图;图3本发明实施例的养卡识别系统的一结构示意图;图4本发明实施例的养卡识别系统的另一结构示意图;图5本发明实施例的养卡识别系统的一具体应用场景示意图。
具体实施例方式由于代理商的养卡用户号码通常需要具有规模化和低成本的特性,否则将无利可 图,因此,本发明实施例中,主要基于养卡用户号码的上述两点特性对用户号码数据进行分 析,识别出养卡用户号码,从而自动识别出养卡代理商。所谓养卡用户号码是指养卡代理商 通过作弊手段制造的虚假用户号码。下面结合附图和实施例,对本发明的具体实施方式
作进一步详细描述。如图1所示为本发明实施例的养卡识别方法的一流程示意图,所述养卡识别方法 包括以下步骤步骤101,获取用户号码的养卡相关数据。所述用户号码是指当前处于激活状态的手机号码卡,可以为代理商所销售的所有 已激活的用户号码,当然,为了减小运算量,通常采用代理商已销售的近期激活的用户号 码。所述养卡相关数据可以为用户号码的激活时间(用户买到手机号码卡后,开通服务的 时间)、账单金额(ARPU)、月固定费(月租和功能费等)、余额、主叫次数或被叫次数等数据。该步骤中具体需要获取哪些养卡相关数据以及养卡相关数据的数量,均可以由系统管理人 员自主设置。步骤102,根据所述养卡相关数据,对所述用户号码进行分类,得到具有相似养卡 相关数据的用户号码群。根据上述描述可知,养卡用户号码需要具有规模化和低成本的特性,即,养卡代理 商需要同时拥有多个养卡用户号码,且每个养卡用户号码的养卡相关数据(例如用户号码 的激活时间、充值累计次数、充值累计金额等)具有很大的相似性,才可以有效降低养卡成 本,否则将无利可图。所述养卡成本通常主要包括两方面内容,一方面是指为了制造养卡用 户号码正常使用中的假象,以号码充值等方式向运营商支付的金钱,另一方面是指养卡代 理商从事养卡行为的人力成本。因此,本发明实施例中将具有相似养卡相关数据的用户号码组成一个用户号码 群,该用户号码群则有可能为同一代理商的养卡用户号码群。步骤103,获取所述用户号码群的特征指标信息,根据所述特征指标信息,判断所 述用户号码群是否为养卡用户号码群,得到所述养卡用户号码群。所述特征指标信息用于描述所述用户号码群中所有用户号码的养卡相关数据的 内部特征,所述特征指标信息可以包括用户号码群中用户号码的养卡相关数据的平均状 况信息和内部差异信息。举例来说,所述平均状况信息可以包括用户号码的激活时间的众数(出现最多 的时间)、账单金额的平均数、当月累计消费的平均数等。所述内部差异信息可以包括用 户号码的激活时间的熵、账单金额的标准差、当月累计消费的标准差等。假设判断出用户号码群满足以下预设条件用户号码群中用户号码的激活时间比 较集中、用户号码账单金额的平均数小于预设阈值、用户号码余额的平均数小于预设阈值 等,则可以得出所述用户号码群为养卡用户号码群的判断结果。所述预设条件可以由系统 管理人员自主设置。步骤104,根据所述养卡用户号码群,识别养卡代理商。通过上述实施例提供的养卡识别方法,能够根据用户号码的养卡相关数据,对用 户号码进行分类,得到养卡相关数据相似的用户号码群,并根据用户号码群的特征指标信 息,识别出养卡用户号码群,从而自动、准确地识别出养卡代理商,整个养卡识别过程无需 人工参与。另外,由于养卡代理商的养卡行为均体现在用户号码数据上,对用户号码数据进 行分析,无需关注代理商的养卡手段,因此,具有自适应能力,能够不断应对新出现的养卡 手段。上述实施例中,所述养卡相关数据可以包括用户号码的用户行为数据,所述用户 行为数据即用户号码使用通信业务时产生的数据,例如,用户号码的激活时间、账单金额、 月固定费、余额、主叫次数或被叫次数等数据。另外,为了使得养卡识别的分析结果更加准 确,所述养卡相关数据还可以包括代理商购销数据和/或运营商的营销方案信息。由于需要从一个或多个数据存储系统中获取上述用于养卡识别的养卡相关数据, 因此,在进行养卡识别之前,还需要对上述数据进行采集并整合,以下将获取养卡相关数据 的过程称为实时数据整合操作。所述实时数据整合操作主要包括以下步骤
步骤一,数据采集,数据采集主要包括从通信产品系统中采集用户号码的用户行 为数据;从代理商管理系统中采集代理商购销数据,如代理商的取货记录和销售记录等; 从营销方案管理系统中采集营销方案信息。本发明实施例中,可以通过一FTP(File Transfer Protocol,文件传输协议)服务 器从通信产品系统、代理商管理系统和营销方案管理系统的数据库中采集上述数据。另外, 所述FTP服务器还具有数据预处理功能,FTP服务器在接收到数据后,可以触发一数据检验 程序,对采集到的数据进行检查与修正,例如,对缺失的数据进行回补等,还可以触发一数 据格式转换程序,对采集到的数据按照本系统的数据结构要求进行格式转换,完成转换后, 则可以将转换后的数据加载到数据库之中,以上过程称为ETL(Extract,Transform, Load 抽取、转换、加载)。步骤二,数据整合,数据整合主要包括两个维度的整合一是代理商维度的整合, 将代理商管理系统、代理商购销系统、营销方案管理系统中的代理商购销信息整合起来,合 并成一个代理商信息表;二是用户号码维度的整合,将通信产品系统中的用户号码的用户 行为数据,代理商管理系统、代理商购销系统、营销方案管理系统中的用户号码状态数据 (例如,销售该用户号码的代理商、该用户号码使用的营销方案等)进行整合,合并成一个 用户号码信息表。本发明实施例中,将合并得到的代理商信息表、用户号码信息表称为宽表,在所述 用户号码信息宽表中,每一个用户号码的相关数据汇总成一条记录,在所述代理商信息宽 表中,每一个代理商的相关数据汇总成一条记录。数据整合完成后,则可以根据整合得到的养卡相关数据,执行养卡识别操作,下面 举例对本发明实施例的养卡识别方法进行详细说明。如图2所示为本发明实施例的养卡识别方法的另一流程示意图,所述养卡识别方 法包括以下步骤步骤201,获取用户号码的养卡相关数据。所述养卡相关数据可以包括从通信产品 系统中获取的用户号码的用户行为数据,还可以包括从代理商购销系统中获取的代理商购 销信息,以及从营销方案管理系统中获取的运营商的营销方案信息。表1为本发明实施例 中获取的养卡相关数据的一具体实施例表 权利要求
1.一种养卡识别方法,其特征在于,包括以下步骤 获取用户号码的养卡相关数据;根据所述养卡相关数据,对所述用户号码进行分类,得到具有相似养卡相关数据的用 户号码群;获取所述用户号码群的特征指标信息,根据所述特征指标信息,判断所述用户号码群 是否为养卡用户号码群,得到所述养卡用户号码群; 根据所述养卡用户号码群,识别养卡代理商。
2.根据权利要求1所述的养卡识别方法,其特征在于,所述根据所述养卡相关数据,对 所述用户号码进行分类,得到具有相似养卡相关数据的用户号码群,具体为根据预设相似性分析算法,两两判断所述用户号码的养卡相关数据是否相似; 采用预设分类算法,将养卡相关数据相似的用户号码组成一用户号码群。
3.根据权利要求2所述的养卡识别方法,其特征在于,所述预设相似性分析算法为余 弦相似性分析算法、欧氏距离分析算法或相关系数分析算法,所述预设分类算法为k-means 簇聚分类算法。
4.根据权利要求1所述的养卡识别方法,其特征在于,所述获取所述用户号码群的特 征指标信息,具体为判断所述用户号码群中的用户号码数量是否超过预设阈值; 获取用户号码数量超过预设阈值的用户号码群的特征指标信息。
5.根据权利要求1所述的养卡识别方法,其特征在于,所述特征指标信息包括所述用 户号码群中用户号码的养卡相关数据的平均状况信息和内部差异信息;所述根据所述特征指标信息,判断所述用户号码群是否为养卡用户号码群,具体为 将所述平均状况信息和内部差异信息分别与预设阈值进行比较,得到一比较结果; 根据所述比较结果,判断所述用户号码群是否为养卡用户号码群。
6.根据权利要求1所述的养卡识别方法,其特征在于,所述得到所述养卡用户号码群, 之后还包括对所述养卡用户号码群中用户号码的养卡相关数据进行特征分析,得到养卡识别规则;根据所述养卡识别规则,快速识别养卡用户号码。
7.根据权利要求1所述的养卡识别方法,其特征在于,所述养卡相关数据包括用户号 码的用户行为数据。
8.根据权利要求7所述的养卡识别方法,其特征在于,所述养卡相关数据还包括代理 商购销数据和/或运营商营销方案信息。
9.一种养卡识别系统,其特征在于,包括第一获取模块,用于获取用户号码的养卡相关数据;分类模块,用于根据所述养卡相关数据,对所述用户号码进行分类,得到具有相似养卡 相关数据的用户号码群;第一判断模块,用于获取所述用户号码群的特征指标信息,根据所述特征指标信息,判 断所述用户号码群是否为养卡用户号码群,得到所述养卡用户号码群; 识别模块,用于根据所述养卡用户号码群,识别养卡代理商。
10.根据权利要求9所述的养卡识别系统,其特征在于,所述分类模块包括相似性分析单元,用于根据预设相似性分析算法,两两判断所述用户号码的养卡相关 数据是否相似;组群单元,用于采用预设分类算法,将养卡相关数据相似的用户号码组成一用户号码群。
11.根据权利要求9所述的养卡识别系统,其特征在于,还包括筛选模块,用于判断所述分类模块中得到的用户号码群中的用户号码数量是否超过预 设阈值,并将用户号码数量超过预设阈值的用户号码群发送给所述第一判断模块。
12.根据权利要求9所述的养卡识别系统,其特征在于,所述特征指标信息包括所述用 户群中用户号码的养卡相关数据的平均状况信息和内部差异信息;所述第一判断模块包括第一获取单元,用于获取所述用户号码群中用户号码的养卡相关数据的平均状况信息;第二获取单元,用于获取所述用户号码群中用户号码的养卡相关数据的内部差异信息;比较单元,用于将所述平均状况信息和内部差异信息分别与预设阈值进行比较,得到 一比较结果;执行单元,用于根据所述比较结果,判断所述用户号码群是否为养卡用户号码群。
13.根据权利要求9所述的养卡识别系统,其特征在于,还包括识别规则生成模块,用于对所述养卡用户号码群中用户号码的养卡相关数据进行特征 分析,得到养卡识别规则;快速识别模块,用于根据所述养卡识别规则,快速识别养卡用户号码。
全文摘要
本发明提供一种养卡识别方法及系统,所述养卡识别方法包括以下步骤获取用户号码的养卡相关数据;根据所述养卡相关数据,对所述用户号码进行分类,得到具有相似养卡相关数据的用户号码群;获取所述用户号码群的特征指标信息,根据所述特征指标信息,判断所述用户号码群是否为养卡用户号码群,得到所述养卡用户号码群;根据所述养卡用户号码群,识别养卡代理商。本发明能够自动、准确地识别出代理商的养卡作弊行为。
文档编号G06Q30/00GK102081774SQ20091024156
公开日2011年6月1日 申请日期2009年11月26日 优先权日2009年11月26日
发明者张湛梅, 张红星, 李希婷, 江勇, 王道恒, 白琳, 肖建明, 陶涛, 魏春辉 申请人:中国移动通信集团广东有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1