一种基于手机话费数据挖掘的互联网捐款系统的制作方法

文档序号:6443902阅读:181来源:国知局
专利名称:一种基于手机话费数据挖掘的互联网捐款系统的制作方法
技术领域
本发明涉及一种网络系统,尤其涉及一种基于手机话费数据挖掘的互联网捐款系统。
背景技术
在这个经济高速发展的时代中,贫困问题虽一定程度的得到了缓和,但并未完全解决,依然是困扰各国及全球发展的重要难题之一。传统的捐助模式主要是由捐助者将善款直接提供给慈善机构,由慈善机构去选定贫困对象进行发放,但这种模式一直存在着几个较大的问题。首先,慈善机构的维持需要成本,这就为社会增加了额外的成本损耗,再加上机构中可能存在的挪用、浪费及信息披露不完全等现象,将直接导致这类非营利性公益机构对资金的运用效率相对较低。其次,此类模式由于程序较为复杂,不利于小规模的善款的积累,同时其受地域限制较强,若国际友人想打破限制对别国公民进行捐赠,其复杂性将给捐助者带来高昂的间接成本,这就造成了国际捐助这类同样重要的捐助方式受到了相当大的阻碍。此外,善款发放对象的选择也存在着一定的困难,选择怎样的分发标准、如何验证被捐助者的信息是否属实、发放给被捐助者的资金额度如何控制,这些问题都关乎善款落实的质量。当然,在全球经济发展不断产生贫富差距等社会性问题的同时,也在创造着一些解决此类问题的新方法、新机遇。根据国际电信联盟数据显示,2010年全球手机用户的手机用户达到了 52.8亿。其中中国内陆地区达到7.38亿,占整个国家人口的56.97%。互联网、手机等信息工具的广泛普及,使得世界各地的相互交流变得较为容易,也为我们通过信息手段来改善贫困问题带来了新的机会。针对上述背景,本发明希望能够为捐助者提供一种简便快捷的捐款模式,打破传统的国界及地域的限制,使更多人积极地加入到慈善行业中,这种模式在极大地节约社会成本的同时准确有效地将善款送达至贫困者手中,避免资金的流失与浪费,同时,这种基于互联网的捐款方式还将增强捐款者与被捐款者及其所在地的感情关联,为全球化友好进程的发展起到极大的推动作用。

发明内容
为了克服上述背景技术的不足之处,本发明所提出的一种基于手机话费数据挖掘的互联网捐款系统将通过手机话费的消费数据来识别用户的贫困情况,并进一步通过互联网为捐款者提供便捷而有效的捐款方式,使得捐款能快速且有效地直接充入贫困者的话费余额中,其技术方案包括如下组成部分:(I)数据挖掘模块,该模块主要包含初始处理、聚类处理、贫困类群筛选三个部分。初始处理需要将移动通信运营商提供的以月结算的用户历史话费数据信息进行分次过滤,该数据信息包含用户手机号码、用户实名编号、用户所在地区、用户号码状态、用户月话费金额、用户月套餐业务使用情况及相应费用、用户主叫时长、用户主叫次数、用户接听时长、用户接听次数、用户短信发送数量及用户短信接收数量,首先,剔除前a个月中明显存在错误数据或某些数据残缺的用户;其次,剔除状态通讯服务规定为非正常的用户,即剔除如高额停机、局方停机、停机保号、申请预销停机、申请停机及欠费停机等的用户 ’最后,剔除在前a个月中存在b个月以上月话费金额大于c的用户,从而得到一个初步的数据样本。聚类处理需要将用户进行根据话费的消耗情况利用聚类分析进行分类,提取出用户前a个月的月话费金额数据并对其采用聚类算法,例如应用以欧几里德距离作为聚类测度及数据代数平均作为聚类中心的k-means算法,其k值由贫困类群筛选中所涉及到的筛选参数的个数η确定,即其满足k = n+1,在应用此算法后用户将被分为k个聚类,使得各聚类本身尽可能的紧凑,而各聚类之间尽可能的分开。贫困类群筛选将对上述k个聚类中不符合贫困群体特性的部分进行剔除,从而得到一个最可能为贫困人口的群体,其涉及的非贫困参数主要包含次要或奢侈业务使用较多(指的是如彩信、彩铃、大流量的GPRS服务等)、日常话费优化不足(指的是对于某些每月都存在的固定费用可以采用套餐节省花费的却未采用)、所在区域发展较好、存在一人多号情况、移动电话需求不足(指的是使用手机进行主叫与接听的次数)等。对于聚类的剔除,采用基于参数重要性的由主到次分布剔除法,例如先计算出各个聚类中b个月以上非必要业务使用金额都超过d的用户数量,然后剔除该数量最多的一个聚类;相应地计算出各个聚类中b个月以上都存在未进行日常话费优化的用户数量、所在地为一线城市及二线城市的用户数量、存在一人多号的用户数量、b个月以上接听及主叫次数同时小于e次的用户数量,并依次以其为指标对聚类进行剔除。在剔除结束后将得到唯一的一个聚类,再对其中的满足这五个指标的任意一个的用户进行逐个剔除,则最后得到的用户群即作为系统的潜在捐助对象。(2)话费捐助模块,该模块主要包含信息展示、捐助处理两个部分。信息展示将把上述通过话费信息挖掘出的贫困用户的手机号码及所在地址数据储存在web服务器端并在捐助网站的界面上进行显示。捐助处理将把捐助者来`助金额,并在充值成功后将信息反馈给捐助者。


图1为本发明一种基于手机话费数据挖掘的互联网捐款系统中的互联网捐款系统所包含的各部分模块汇总图。图2为本发明一种基于手机话费数据挖掘的互联网捐款系统中的初始处理步骤图。图3为本发明一种基于手机话费数据挖掘的互联网捐款系统中的聚类处理、贫困类群筛选步骤图。图4为本发明一种基于手机话费数据挖掘的互联网捐款系统中的通过网络所实现的话费捐助流程图。
具体实施例方式下面结合附图与具体实施例来对本发明所述的一种基于手机话费数据挖掘的互联网捐款系统作详细描述。但本发明并不仅限于实施例,其范围由权利要求规定。下面将描述大量的具体细节以提供对本发明的详细理解,但所述细节仅用于例目的,可以在不涉及这些具体细节的一些或全部的情况下根据权利要求实践本发明。以限于国内用户的互联网捐助系统为例,首先需要对全国的话费数据进行采集及汇总,并在整理后将其存入数据库中,但由于国内手机用户太多,从而导致数据量太过庞大,可以采取先分省进行数据初步处理再汇总的方式。如图1所示,本发明所述的一种基于手机话费数据挖掘的互联网捐款系统包含数据挖掘与话费捐助两个基本模块,先由数据挖掘模块筛选出需被捐款的用户信息,再由话费捐助模块基于此信息引导捐款工作的完成。如图2所示,系统将先对话费信息进行初步处理以删除一些无法正常使用的数据,包括剔除前a个月中明显存在错误数据或某些数据残缺、状态通讯服务规定为“非正常”即高额停机、局方停机、停机保号、申请预销停机、申请停机及欠费停机、前a个月中存在b个月以上月话费金额大于c的三大类用户。在此例中,可首先剔除存在前10个月中用户月话费金额、各类套餐及业务使用费、用户主叫时长、用户主叫次数、用户接听时长、用户接听次数、用户短信发送数量及用户短信接收数量为错误类型数据、负值、空值或数值过大的孤立点情况的用户信息,剔除前10个月中存在用户手机号码、用户实名编号为错误类型数据、错误位数格式或空值情况的用户信息,剔除前10个月中用户所在地区错误类型数据或空值情况的用户信息;剔除完上述异常数据后,对状态为高额停机、局方停机、停机保号、申请预销停机、申请停机 及欠费停机的用户信息进行剔除,过滤出号码至今为止仍然正常使用的用户;最后,剔除那些在前10个月中存在3个月及其以上月话费金额大于100的用户信息,将那些明显不属于贫困群体的用户排除在数据样本之外。如图3所示,在经过上述过程得到了初步话费信息样本数据后,即可采用聚类分析对样本数据进行分类处理,这种分类手段基于用户的话费消费行为,使得其同类用户之间联系较强,而不同类的用户之间关联较弱,因消费模式在相当程度上反映了人们的收入情况,此分类也可近似视为根据收入情况所作的分类,即某一个聚类将为收入较低的人群即系统需要的贫困群体。设定K值为6,即将数据样本分为六个类,对于由用户前10个月的月话费金额组成的多维话费流数据,系统采用欧式距离来对数据间的距离进行度量,其公式为 d = [ (A1-B1) 2+ (A2-B2) 2+...+ (A10-B10) 2] 1/2,其中(AnA2, *..,Α10), (BijB2,…,B10)为两个不同的用户在前十个月中的话费流数据;采用数据群的代数平均值来表示一个聚类白勺中心对象,其公式为 m = ((An+A12+…+Aln)/n, (A21+A22+...+A2n)/n,…,(Aml+Am2+...+Amn)/n),其中(Akl,Akl,…,Akn),特别的,整数k属于[1,10]。从数据样本中随机抽取6个数据作为初始聚类中心,计算每个数据与这些中心对象的距离,将数据划分进与其具有最小距离的聚类中;对新生成的6个聚类重新计算其中心对象,同时再重新计算每个数据与这些中心对象的距离,将数据划分进与其具有最小距离的聚类中;不断重复此过程直至前后两次的中心对象重叠为止,至此,将得到包含潜在贫困群体在内的6个最终聚类。如图3所示,由于贫困特征属于较为隐性的特征,系统采用反向排除法进行筛选,即逐步剔除那些比较不具有贫困特性的群体,以得到最终的贫困群体。对于上述6个聚类,本例将按照次要或奢侈业务使用较多、日常话费优化不足、所在区域发展较好、存在一人多号情况、移动电话需求不足5个非贫困参数的顺序对聚类进行依次剔除。首先,计算出各个聚类中所存在的3个月以上的月次要或奢侈业务使用费用超过15元以上的用户数量,其中主要包括彩信彩铃等多媒体娱乐性质的业务、手机报车讯通等商务资讯性质的业务及30M以上的GPRS流量业务,并将具有此类用户最多的一个聚类进行剔除;其次,计算出各个聚类中所存在的3个月以上的日常话费优化不足的用户数量,其中主要包括使用长途、短信、漫游已达到最低套餐标准而又没有申请套餐服务的情况,并将具有此类用户最多的一个聚类进行剔除;再次,计算出各个聚类中包含一线或是二线城市的用户数量,一线城市包括北京、上海、广州、深圳,二线城市包括杭州、济南、南京、天津、重庆、青岛、大连、宁波、厦门、武汉、沈阳、成都、哈尔滨、长春、西安、苏州、无锡、温州、烟台、长沙、福州、郑州、石家庄、太原、合肥、南昌、南宁、昆明,将具有此类用户最多的一个聚类进行剔除;然后,计算出各个聚类中存在一人多号情况的用户数量,一人多号由用户实名编号与该实名编号下所拥有的号码来判定,若后者大于前者,则属于一人多号情况,将具有此类用户最多的一个聚类进行剔除;最后,计算出各个聚类中3个月以上月主叫次数与月接听次数都小于8次的用户,并将具有此类用户最多的一个聚类进行剔除。至此,系统将得到唯一的一个聚类,计算此聚类所包含的用户数量,若其高于或等于初步话费信息样本数据的10%,则需再次使用上述的5个非贫困参数对此聚类中的用户进行进一步的剔除,即将任意满足以上五个条件之一的用户从该聚类中剔除,进而得到最终的潜在贫困群体数据;若其低于于初步话费信息样本数据的10%,则可不进行此步骤,直接将此聚类作为最终潜在贫困群体数据。如图4所示,当最终潜在贫困群体数据挖掘完成后,将被储存至信息展示网站的服务器端并在网站前台显示出来,其中显示的内容仅包括贫困用户的手机及所处地区。当捐助者访问本站时,即可在这些贫困用户中选择其想资助的对象,可一次捐助一个或多个,当捐助者输入捐赠金额并通过网银、支付宝、Paypal或是其它网络支付形式进行支付后,系统将立即为该贫困用户充值相应金额的话费,并在充值成功后将成功信息反馈给捐助者。任意小的金额都可以进行捐助,若捐助金额未达到充值最低标准,则系统将暂时保管此金额,一旦累积到满足标准系统将立即为该贫困用户进行充值,并将充值结果同时反馈给为此次充值进行过捐助的各个捐助者。同时,为丰富用户体验,增进捐款者与被捐款者及其所在地的感情关联,信息将以三维地球站点的形式进行展示,将用户的地址对应到三维地球的相应位置,捐助者可通过将地球进行缩放、滚动等操作更加直观地与贫困用户的信息进行接触,同时,在捐助者捐款成功后,系统还将提供更详细的关于被捐助者的相关信息,但并不涉及该用户的个人隐私,主要包括其所在地的自然地理、历史人文、实时新闻、趣闻轶事等,在丰富文化知识的同时,并以此为基础与被捐助地区建立更深层次的精神情感纽带,促进全球化友好进程的加速发展。这种通过手机话费挖掘贫困用户并通过手机话费充值进行捐赠的方式不仅解决了传统捐赠模式中对人力及其他资源的无谓消耗问题,在极大简化用户的捐赠及受赠过程的同时又保证了捐赠的精准性,更重要的在于它提供了一种资金的全球化流动机制,通过积少成多,促使资源从高收入国家向低收入国家流入,从高收入地区向低收入地区流动。并且,在捐助活动中,存在一些敏感的心理学因素,捐助者若与被捐助者建立起直白而完全的联系,那么必然会一定程度上对双方造成生活、心里上的影响,而本发明通过建立起二者之间较为间接的感情关联,实质上是建立了两个地区乃至两个国家之间的联系,从而利用这种巧妙而有弹性的关系促进捐赠事业的持续发展。
权利要求
1.一种基于手机话费数据挖掘的互联网捐款系统,其特征在于该方法包括如下步骤: 1)数据挖掘模块,该模块主要包含初始处理、聚类处理、贫困类群筛选三个部分。
2)初始处理需要将移动通信运营商提供的以月结算的用户历史话费数据信息进行分次过滤,对不属于挖掘范畴的用户的相应信息进行剔除,该数据信息包含用户手机号码、用户实名编号、用户所在地区、用户号码状态、用户月话费金额、用户月套餐业务使用情况及相应费用、用户主叫时长、用户主叫次数、用户接听时长、用户接听次数、用户短信发送数量及用户短信接收数量及其他所可能涉及到的话费相关信息。
3)聚类处理需要将用户进行根据话费的消耗情况利用聚类分析进行分类,提取出用户前a个月的月话费金额数据,应用聚类分析算法将其进行分类,进而得到群内用户话费消费行为相关、而群间用户话费消费行为存在较大差异的几个群类。
4)贫困类群筛选将对上述k个聚类中不符合贫困群体特性的部分进行剔除,从而得到一个最可能为贫困人口的群体,根据涉及的非贫困指标的重要性由主要次地对聚类采取逐步剔除,以求得到一个最接近贫困群体的用户聚类,同时,再对该聚类将不满足上述指标的用户进行进一步的剔除。
5)话费捐助模块,该模块主要包含信息展示、捐助处理两个部分。
6)信息展示将把上述通过话费信息挖掘出的贫困用户的手机号码及所在地址数据储存在web服务器端并在捐助网站的界面上进行显示。
7)捐助处理将把捐助者来自互联网的捐助请求转化为对贫困用户的话费充值请求,为贫困用户的手机充值相应的捐助金额,并在充值成功后将信息反馈给捐助者。
2.根据权利要求1所述的一种基于手机话费数据挖掘的互联网捐款系统,其特征在于:步骤(2)所述不属于挖掘范畴的用户的相应信息的具体内容包括前a个月中明显存在错误数据或某些数据残缺的用户,状态通讯服务规定为非正常即高额停机、局方停机、停机保号、申请预销停机、申请停机及欠费停机等的用户及前a个月中存在b个月以上月话费金额大于c的用户的相应信息。
3.根据权利要求1所述的一种基于手机话费数据挖掘的互联网捐款系统,其特征在于:步骤(3)中所述的聚类分析算法的具体内容包括K-MEANS算法、K-MEDOIDS算法、Clara算法、Clarans算法。
4.根据权利要求1所述的一种基于手机话费数据挖掘的互联网捐款系统,其特征在于:步骤(4)所述的非贫困参数的具体内容包括次要或奢侈业务使用较多(指的是如彩信、彩铃、大流量的GPRS服务等)、日常话费优化不足(指的是对于某些每月都存在的固定费用可以采用套餐节省花费的却未采用)、所在区域发展较好、存在一人多号情况、移动电话需求不足(指的是使用手机进行主叫与接听的次数较少)。
全文摘要
本发明公开了一种基于手机话费数据挖掘的互联网捐款系统,该系统结合聚类分析以及双层筛选等方法基于用户的话费消费模式对用户话费数据进行挖掘,以快捷有效的方式找到需要接收捐助的贫困用户,主要包含初步处理、聚类处理、贫困类群筛选三个部分,同时,本系统还将通过互联网为这部分用户及潜在捐款者提供了一种有助于捐助过程快速精准进行的以话费充值实现捐助目的的平台,在极大地提高传统捐款模式中存在的资源运行效率较低问题的同时,打破传统的国界及地域对于慈善行为的较大限制,以最宽松的条件让更多的用户投身到捐助事业中,促进慈善事业的持续发展。此外,这种捐款者与被捐款者所在地之间感情关联的不断建立使得全球化进程得到加速。
文档编号G06Q20/32GK103186854SQ201110448968
公开日2013年7月3日 申请日期2011年12月28日 优先权日2011年12月28日
发明者蔡恒进, 羊志伦, 徐恒, 吴云, 杨善媛 申请人:武汉元宝创意科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1