用于预测流失客户的方法和系统的制作方法

文档序号:6484971阅读:138来源:国知局
专利名称:用于预测流失客户的方法和系统的制作方法
技术领域
本发明通常涉及一种用于预测将在未来流失的账户或者客户的方法和系统。更具体地,涉及一种基于历史账户信息或者客户数据生成分类规则并将该分类规则应用于预测一账户或者客户是否将在未来所选择的时期内流失的预测方法和系统。
背景技术
流失客户或者账户是指已经流失的公司或组织的客户或账户,即在预定的时期内不活动的或者参与非实质性或有限的活动的客户或账户。例如,如果某个账户在过去三个月都不活动,则该账户可被认为是这个月的流失账户。一旦客户或账户流失的,该客户或账户作为公司或组织的收入来源就实际上丢失了。因此,对于公司或组织来说,例如,能够预测其客户或账户的哪一个或一些将很快变成流失客户/账户是非常重要的,这样公司和组织可以这些账户/客户为目标采取措施,诸如提供特别的好处或折扣、更新的宣传、电话呼叫等,以保持这些账户/客户。
因此,需要一种系统和技术以预测客户和账户是否将很快流失。还需要确定流失账户或客户是否是理想账户/客户,诸如那些为公司产生可观利润的账户/客户,使得公司可集中努力保持这些有利润的客户或账户。还需要生成用于应用于现有的客户或账户以确定流失账户/客户的合适的分类规则。

发明内容
本发明提出一种用于基于预定的分类规则和与客户/账户相关的客户数据/账户信息预测有可能流失的客户/账户的方法和系统。分类规则通过解析历史客户数据/账户信息以确定流失客户/账户及其相关的属性生成。独特的算法用于确定客户或账户的流失状态。在生成分类规则之后,该规则被应用于新的客户数据或账户信息以预测有可能流失的客户或账户。
用于预测流失账户的示例性方法使用独特的训练过程生成分类器,诸如分类规则或者决策树,用于基于账户各自的账户信息预测哪些账户有可能流失。在训练过程中,确定目标时期,并确定在与目标时期有关的账户池中的第一组账户的每一个的流失状态。流失状态基于预定的流失定义确定。还选择在目标时期之前的基本训练时期。检索在基本训练时期内每一个账户的账户信息。将确定的基本训练时期内每一个账户的流失状态及其各自的账户信息输入到决策树生成器作为一组训练实例。基于这些训练实例,决策树生成器产生决策树分类器,其基于未见过的实例各自的账户信息相对于各自的流失状态对未见过的实例进行分类。
在一个实施例中,该方法确定用于确定可能在预测时期内流失的账户的预测时期。确定在预测时期之前的基本时期,并且检索与之相关的账户信息。然后,决策树分类器基于与基本时期相关的账户各自的账户信息对账户分类。根据另一个实施例,在训练过程中,确定多个早于目标时期预定时期的不同基本训练时间,预定时期诸如一个、两个或者三个月,并检索对应的账户信息。训练过程使用账户信息以允许决策树生成器分别生成预测未来一个、两个或三个月的账户的流失状态的决策树而重复。
根据另一个实施例,示例性的预测方法还访问每一个账户的收益性数据,并通过将收益性数据与收益性阈值相比较确定每个账户的收益性状态。然后,收益性状态可用作目标分类。用于流失状态训练的方法同样可用于生成一个、两个或三个月决策树,用于预测客户收益性。
一种数据处理系统,诸如计算机,可用于实现在此描述的方法和系统。数据处理系统可以包括用于处理数据的处理器、耦合到处理器的数据存储装置以及数据传输接口。数据存储装置具有指令,以使数据处理系统在处理其执行指令时执行在此描述的功能。这些指令可以嵌入机器可读介质中以控制数据处理系统执行在此所述的计算和功能。机器可读介质可以包括各种存储介质中的任意一种,例如包括诸如CD-ROM、DVD等的光存储介质、包括软盘或磁带的磁性存储介质和/或诸如存储卡、闪存等的固态存储装置。这些指令还可以使用载波类型的机器可读介质传递和传输。
根据下面详细的说明,当前公开的方法和系统的其他优点将变得非常明显,这些说明仅仅是示例而不是限制。正如将认识到的,活动导向的客户收益性计算方法和系统能够有其他和不同的实施例,并且其几个细节能够在各个显而易见的方面修改,所有这些都没有脱离本发明。因此,附图和描述将被认为是说明性的,而非限制性的。


结合在说明书中并成为说明书的一部分的

示例性的实施例。
图1是说明用语预测流失账户的示例性系统100的操作的示意性功能框图;
图2示出了用于生成决策树的示例性训练过程;图3a和3b是显示用于通过如图2所示的决策树生成器生成使用的训练数据的例子的流程图;图4描述了说明用于预测账户的流失状态的示例性过程的流程图;图5示出了数据处理系统的示意性框图,基于该系统可以实现用于预测流失客户的示例性系统。
具体实施例方式
在以下描述中,出于解释的目的,描述了很多特定的细节以提供对本发明的彻底理解。然而很显然,对于本领域的技术人员,本方法和系统可以无需这些特定的细节实现。在其它情况下,公知的结构和装置以框图的形式显示并以通用的功能性术语描述,以避免不必要的遮蔽本发明。
为了说明的目的,以下的说明讨论在经纪公司中使用以确定有可能很快流失的客户/账户的示例性的方法和系统。可以理解,客户可以与一个或多个和经纪公司建立的账户相关。当客户只有一个账户时,术语“账户”和“客户”可以互换使用。也可以理解,这里所公开的方法和系统可以应用于许多其他类型的企业或公司,并可以有不同的变形,这些变形都包括在本申请的范围内。
在整个描述中可以使用以下术语,通常给这些术语以下的含义,除非其他在此进行的描述有矛盾或阐述。
活动客户/账户在限定的时期内已经是活动的或者参与实质的活动的账户或客户。预先定义的条件可用于确定账户或客户是否是活动的。
流失客户/账户在限定的时期内已经不活动的或者参与有限的或非实质的活动的账户或客户。预先定义的条件可用于确定账户或客户是否流失。通常,流失客户/账户被定义为非活动的客户/账户。相反地,活动的客户/账户被定义为非流失客户/账户。
账户信息与账户有关的信息,包括但不限于账户标识、账户所有者、活动历史、收益性状态、由账户产生的或与账户相关的收入、与账户相关的资产水平、所有者的人口信息等。
流失月证明流失客户或账户是活动客户或账户的的最后一个月。
基本时期所选择的时期,诸如三个月,检索这一时期的客户数据或账户信息以用于和分类规则一起预测在预测时期内的流失客户/账户。
基本训练时期所选择的时期,诸如三个月,检索这一时期已知的客户数据或账户信息,以在训练过程中提供给决策树生成器用于生成分类规则以确定流失客户/账户。
客户数据与客户相关的信息,包括但不限于一个或多个与客户相关的账户的信息、客户标识、活动历史、客户的收益性状态、由客户产生的或与客户相关的收入、与客户相关的资产水平、客户的人口信息等。特定客户的客户数据可以与由该特定客户所有的一个或多个账户的账户信息联系或有关。
预测时期特定时期,诸如在基本时期之后的数个月,用于确定客户或账户是否在该时期内会流失。
收益性数据表明对应于客户或账户的收益性状态的数据,即亏损或者利润及相应的数额。
目标时期特定时期,确定这一时期的每一个客户或账户的流失状态,以在训练过程中向决策树生成器提供客户或账户的流失状态以生成分类规则用于确定流失客户/账户。
示例性的用于预测流失客户/账户的方法和系统提供使用已知的客户数据或者账户信息以生成用于预测可能流失的客户或账户的分类规则的独特的训练过程。训练过程解析历史客户数据/账户信息以确定流失客户/账户及其相关属性,并生成分类规则,诸如用于专家系统的决策树,用于基于客户/账户的各自的客户数据/账户信息预测现有的客户/账户池中的流失客户/账户。图1是说明用于预测流失账户的示例性系统100的操作的示意性功能框图。系统100包括流失预测引擎102,可访问账户信息数据库104和决策树106。账户信息数据库102存储与多个账户有关的各种类型的数据。信息可以包括但不限于账户ID、账户所有者的标识、所有者的人口信息、资产水平、活动历史、收入数据、收益性状态和交易历史等。账户信息数据库104提供数据字段,用于存储收益性数据以表明反映账户在特定时期内(诸如一个月、一个季度或者自账户开户起到现在)产生的支出和收入的每个账户的收益性状态,诸如利润或亏损及其各自的数额。确定和更新收益性状态和收益数据的详细描述在美国专利申请号为__(代理标记为67389-038)的名称为“客户收入预测方法和系统”和同时申请的美国专利申请号为__(代理标记为67389-039)的名称为“活动导向的客户收益性计算系统”的美国专利申请中讨论,这两件专利申请与本申请同时申请并在此并入作为参考。
决策树106是一组由流失预测引擎102使用的分类规则或算法,以解析现有账户的账户信息以生成预测哪个账户将在特定的时期内流失或者保持活动的流失预测报告108(用于生成决策树的详细过程将很快讨论)。决策树106可以由系统100生成或者在系统100开始执行有关账户或客户的预测之前由其他数据处理系统传递。流失预测报告108可以采用由其他数据处理系统访问的机器可读格式实现。
系统100可以在一个或多个数据处理系统上实现,诸如单个计算机或者包括多个具有网络连接的计算机的分布式计算系统。账户信息数据库104和决策树106可以存储在同一个数据处理系统中的数据存储装置和/或由数据处理系统可访问的任何其他数据存储装置中,并可以通过网络通信经由载波传送。
正如之前讨论的,决策树106基于历史账户信息生成。图2说明用于生成决策树106的示例性过程。决策树生成器203用于基于训练数据201生成决策树106。训练数据201包括两种类型的数据已知账户信息255和分类数据256。分类数据256包括通过解析已知账户信息255建立的现有账户的分类规则,以将与账户信息255相关的账户分类为活动账户和流失账户。基于账户的分类及各自的账户信息,决策树生成器203生成用于系统100的决策树106。
决策树生成器203是输入原始数据及其分类规则并生成用于分类未来原始数据的分类规则的自动工具。数据挖掘工具,诸如免费软件应用程序、罗斯奎兰(Ross Quinlan)的C4.5和诸如一个或多个计算机的一个或多个数据处理系统,可以用于实现决策树生成器203。C4.5是用于从一组给定例子中获得采用决策树形式的分类规则的程序。决策树可用于将新的、未见过类的例子分类为肯定的或者否定的,并作为未来进行决策的辅助预测未来情况的结果。
在操作中,现有账户信息被解析和分类成两组账户流失账户和活动账户(分类的详细过程将很快讨论),结果被提供到决策树生成器203。每一个账户的账户信息中的数据字段,诸如流失状态,可以用于表明账户是否是活动的或流失的。如果账户是活动的,则相应的流失状态可被确定为0;如果账户是流失的,则相应的流失状态可被确定为1。与每一个账户相关的账户信息255也被提供给决策树生成器203。账户信息255可以包括但不限于交易的数量、收益性状态、由账户产生的收入、与账户相关的资产水平、所有者的人口数据、交易历史等。账户的资产水平被定义为与账户相关的全部资产的总和(只要数据是可得的)。在经纪公司的例子中,可以与账户相关的可能资产包括但不限于普通股、优先股、权利/担保、单位、期权、公司债务、CMO/MBS/ABS、货币市场、市政债券、共同基金、付佣共同基金、UIT和/或其他任何类型的与账户相关的票据或资产。
人口数据被定义为与有关账户的所有者的属性和/或特性有关的或者可以用于识别账户的所有者的信息。例如,人口数据可以包括但不限于与经纪公司的持续时间、城市大小、年龄、性别、教育、婚姻状况、收入、地址、房屋所有权状况、所拥有的车辆的数量和/或类型、家庭收入、家庭成员的数量、孩子的数量、孩子的年龄、在外进餐的频率、爱好等。该列表并不意味着穷举。
与交易历史有关的数据被定义为与用户在过去已经进行的任何交易有关的每种类型的信息。交易历史数据可以包括交易日期、交易类型、交易数量、交易频率、平均交易数量、每月交易数量、每月平均交易量、在特定时期内的总交易、每次交易的股票数量、12个月每月移动平均总交易数量等。交易历史数据还可以包括从收入或利润中得到的实际收入或者利润数据或者度量,例如经纪佣金金额或者实际或平均百分比的佣金。
还可以包括其他类型的账户信息。例如,对于经纪公司,也可以使用下述类型的账户信息最近三个月的平均长期市场价值、最近三个月的平均短期市场价值、最近三个月的平均总资产、最近十二个月的平均总资产、最近三个月的佣金、最近三个月的利息和其他费用、最近三个月中的交易数量、最近三个月的基金存款、最近三个月的基金取回、账户类型的数量和/或存款宽限期等。
除了可以输入到决策树生成器203的不同类型的账户信息,为了生成决策树106,在各种时期内的不同账户信息和分类结果也可被输入到决策树生成器203。例如,在特定时期内的同一组账户信息(诸如从2002年4月到2002年7月的账户信息)和几组不同时期的分类结果(诸如,同一账户2002年10、11和12月的流失状态)可以输入到决策树生成器203以生成一个或多个决策树106,用于基于三个月时期的账户信息预测不同的三个月的账户的流失状态。
在训练过程以后,决策树生成器203生成决策树106,其可以是算法的形式以基于进入的账户的各自的账户信息,诸如交易的数量、收益性状态、由账户产生的收入、与账户相关的资产水平、所有者的人口信息等,对进入的账户分类。然后,系统100使用决策树106以应用于输入到预测引擎102的账户信息以预测对应于输入账户信息的账户在未来的流失状态。
图3a是显示用于生成由如图2所示的决策树生成器203使用的训练数据201的示例性过程的流程图。在步骤S301,从现有账户池中确定流失账户和活动账户。为了确定账户是活动的还是流失的,使用预先定义的活动账户或流失账户的条件。例如,为了确定现有账户池中的账户是活动账户还是流失账户,使用以下的定义和条件整个账户池=活动账户+流失账户;如果账户满足以下条件,则该账户是在所选择的目标时期内,诸如这个月,的流失账户1.在最近三个月的每一个月,总资产<=USD 120;并且2.在最近三个月的每一个月,交易数量<=0;并且3.在最近三个月的每一个月,佣金<=USD 0;或者4.在最近一个月,总资产<=USD 0.0;活动账户是不是流失账户的账户。
虽然上述定义使用总资产、交易数量和佣金定义流失或活动账户,但是,应当理解,上述定义只是为了说明的目的。其他值和/或不同类型的账户信息可以用于定义流失账户和/或活动账户。因此,在步骤S301中,系统100解析账户池,确定满足条件1-4的账户为流失账户,而不满足条件1-4的账户作为活动账户。
在步骤S302,确定或选择基本训练时期以提供时间范围,诸如三个月,用于系统100件所在基本训练时期内的账户信息,诸如交易的数量、收益性状态、由账户产生的收入、与账户相关的资产水平、所有者的人口信息等,以提供给如图2所示的决策树生成器203。在这个例子中,基本训练时期被设置为过去三个月。也可以使用其他基本时期。在选择或检索了基本训练时期后,检索账户信息,诸如交易的数量、收益性状态、由账户产生的收入、与账户相关的资产水平、所有者的人口信息等(步骤S303),并提供给如关于图2描述的决策树生成器203(步骤S304)。
根据一个实施例,提供用于准备训练数据201的修正过程。除了步骤S302以外,修正过程与上述关于图3a讨论的过程实质上类似。在上述实施例中,一旦确定了在目标时期(诸如今天)时的流失状态,就将基本训练时期设置为过去三个月(相对于今天)。在修正过程中,活动账户的基本训练时期保持相同(即过去三个月),但是不将流失账户的基本训练时期设置为相对于确定流失账户的流失状态的目标时期。相反,基本时期被设置为在流失账户变为流失前的预定时期。例如,被确定为今天的流失账户的账户可能已经在一年前流失。因此,如果将在过去三个月内的流失账户的信息用于训练决策树生成器203,则可对训练数据发生不精确。为了解决这个顾虑,对于每一个流失账户,修正过程确定账户保持活动的最后一天,或者账户变为流失的第一天。在本实施例中,流失账户的基本时期被设置为在账户保持活动的最后一天或者帐户变为流失的第一天之前的三个月。该修正过程确保提供到决策树生成器203的流失账户的账户信息与账户变为流失之前的账户活动密切相关,使得可以进行更加精确的训练过程。
在图3b中说明准备训练数据201的另一个实施例。在步骤311,确定任意的或预定的基本训练时期。例如,基本训练时期可以选择为在2003年3月到2003年5月之间,并且检索在基本训练期间的各自的帐户信息,包括交易的数量、收益性状态、由账户产生的收入、与账户相关的资产水平、所有者的人口信息等(步骤S312)。在步骤S313,选择或检索在步骤S311确定的基本时期后的预定的或任意的目标时期。例如,目标时期可被设置为2003年6月或者2003年5月之后的任何时间。在步骤S314,确定在目标时期内的每一个账户的流失状态。在步骤S315,江每个账户的流失状态及其各自的账户信息提供到如前所述的决策树生成器203,以训练决策树生成器203生成决策树106。
正如之前所讨论的,在训练过程中,在特定时期中的同一组账户信息(诸如,从2002年4月到2002年7月的账户信息)和几组不同时期的分类结果(诸如,同一个账户在2002年10、11和12月的流失状态)可以输入到决策树生成器203以生成一个或多个决策树106,用于基于三个月时期的账户信息预测不同的三个月的账户的流失状态。
在如上面所述的训练过程之后,生成决策树106。系统100使用决策树106预测账户的流失状态。继续上面使用的流失和活动账户的定义,因为这些定义使用过去3个月的账户属性作为定义的一部分,所以下一个月的流失状态可以完全通过过去的活动确定。例如,如果账户在这个月执行交易,那么已经知道该账户不会在接下来的两个月被定义为流失账户。如果知道账户在7月已经进行了某些活动,则系统100能够确定该账户接下来的两个月(8月和9月)的流失状态为非流失的。因此,通过在基本月中与账户有关的最后的已知活动,系统100能够基于从4月到7月的账户信息预测在预测月的账户的流失状态=基本月+k+2,其中,对于1个月预测,k=1;对于2个月预测,k=2;对于3个月预测,k=3。因此,基于用于定义流失账户的不同定义,可以提供有效的流失状态的预测。
图4描述了说明用于预测账户的流失状态的示例性过程的流程图。在步骤S401,流失预测引擎102访问账户的账户信息,基于这些账户信息可以执行预测。在步骤S402,流失预测引擎102访问决策树106,并将在步骤S401中获得的账户信息应用于决策树106以生成账户的流失状态的预测。流失预测引擎102还可以访问账户信息数据库104中的每个账户的收益性状态,以确定对经纪公司理想的但将很快流失的账户(步骤S403)。账户的理想性可以通过比较收益性状态与预定阈值确定。例如,如果账户对经纪公司产生每月多于50美元的利润,则确定这个账户是理想的。可生成包括这样的信息的报告(步骤S404),使得经纪公司可以采取适当的措施以保持这些理想的账户,诸如通过提供折扣、额外的服务、进行电话呼叫等。
虽然上述例子都与预测流失账户有关,但是应当理解,与这里描述的相同的系统和方法还可用于确定客户的流失状态,而只需要很少的修改。因为客户可以具有与经纪公司的一个或多个账户,可执行准备过程以修正系统以在客户级而不是账户级执行预测。例如,准备过程可以解析账户信息以确定属于同一个客户的账户,并汇集与客户有关的账户信息。相同的流失和活动账户的定义可用于基于与一个或多个与每个客户相关的账户有关的活动确定流失和活动客户。相同的用于生成账户的决策106的确定和处理可用于训练决策树生成器203以生成预测客户级的流失状态的决策106。
图5显示了示例性的数据处理系统500的示意性框图,基于该系统可以实现活动导向的客户收益性计算系统。正如之前描述的,系统100可以用单个数据处理系统500或者多个通过数据传输网络连接的数据处理系统500实现。数据处理系统500包括总线502或者其他用于传送信息的通信机制和耦合到总线502的用于处理数据的数据处理器504。数据处理系统500还包括耦合到总线502的用于存储信息和由处理器504执行的指令的主存储器506,诸如随机存储器(RAM)或者其他动态存储装置。主存储器506还可用于在执行由数据处理器504执行的指令期间存储临时变量或者其它中间信息。数据处理系统500还包括耦合到总线502的用于存储处理器504的静态信息和指令的只读存储器(ROM)508或者其他静态存储装置。提供耦合到总线502的用于存储信息和指令的存储装置510,例如磁盘或光盘。
数据处理系统500还可以具有用于将数据从一种格式转换为另一种格式的适当的软件和/或硬件。这种转换操作的一个例子是将系统500上可用的数据的格式转换为另一种格式,诸如,方便数据传输的格式。数据处理系统500可以通过总线502耦合到用于向操作者显示信息的显示器512,诸如阴极射线管(CRT)、等离子显示面板或液晶显示器(LCD)。包括文字数字键和其他键的输入装置514被耦合到总线502,用于向处理器504传送信息和命令选择。另一种类型的用户输入装置是光标控制(未示出),诸如鼠标、触摸板、轨迹球或者光标方向键和其他用于向处理器504传送方向信息和命令选择并控制光标在显示器512上的移动的类似装置。
控制数据处理系统500以响应处理器504执行一个或多个包含在主存储器506中的一个或多个指令的序列。这些指令可以从另一个诸如存储装置510或者经由通信接口510接收的载波的机器可读介质中读取到主存储器506中。执行包括在主存储器506中的指令的序列使处理器504执行这里所描述的处理步骤。
在一个实施例中,活动导向的客户收益性计算系统100的收益性计算引擎102通过受存储在存储装置510中的适当的指令控制处理器504实现。例如,在预存指令的控制下,数据处理器504访问存储在数据存储装置510和/或其他耦合到数据处理系统的数据处理装置中的账户信息数据和决策树,并执行流失状态的预测。在可选的实施例中,硬连线电路可以用于代替软件指令或者与软件指令相结合以实现上述公开的计算。因此,这里公开的实施例并不限于硬件电路和软件的特定结合。
这里使用的术语“机器可读介质”是指任何参与向处理器504提供用于执行的指令或者向处理器504提供用于处理的数据的介质。这样的介质可以采用多种形式,包括但不限于非易失性介质、易失性介质和传输介质。非易失性介质包括例如光盘或磁盘,诸如存储装置510。易失性介质包括动态存储器,诸如主存储器506。传输介质包括同轴电缆、铜线和光纤,包括包含总线502或者外部网络的线路。传输介质也可以采用声波或光波的形式,诸如那些在无线电波和红外数据传输中产生的,其可以在总线或者外部网络的链路上传送。
机器可读介质的通常形式包括例如软盘、软磁盘、硬盘、磁带或任何其他磁性介质、CD-ROM、任何其他光介质、穿孔卡片、纸带、任何其他具有孔状式样的物理介质、RAM、PROM、EPROM、闪存、任何其他存储芯片或盒、如下文描述的载波或者任何其他数据处理系统可以读取的介质。
机器可读介质的各种形式可以参与将一个或多个指令的一个或多个序列传送到处理器504用于执行。例如,指令最初可以在诸如服务器的远程数据处理系统的磁盘上传送指令。远程数据处理系统可以将指令装载到自己的动态存储器中,并使用调制解调器通过电话线发送指令。数据处理系统500本地的调制解调器可通过电话线接收数据,并使用红外发射器将数据转换成红外信号。红外探测器可以接收在红外信号中传送的数据,并且适当的电路可以将数据放在总线502上。当然,各种宽带通信技术/装置可以用于这些链路的任意一种。总线502将数据传送到主存储器506,处理器504从主存储器506中检索并执行指令和/和处理数据。由主存储器506接收的指令和/或数据可以选择性地在处理器504的执行或其他处理之前或之后存储在存储装置510中。
数据处理系统500还包括耦合到总线502的通信接口518。通信接口518提供双向数据通信,耦合到连接到本地网的网络链路520。例如,通信接口518可以是综合业务数字网(ISDN)卡或者调制解调器,以向对应类型的电话线提供数据通信连接。作为另一个例子,通信接口518可以是有线或者无线局域网(LAN)卡,以向兼容的LAN提供数据通信连接。在任意一个这样的实施例中,通信接口518发送和接收载有代表各种类型的信息的数字数据流的电信号、电磁信号或者光信号。
网络链路520通常通过一个或者多个网络向其他数据设备提供数据通信。例如,网络链路520可以通过本地网络向由因特网服务提供商(ISP)526操作的数据设备提供连接。ISP 526接着通过当前被称作因特网527的全球分组数据通信网络提供数据通信服务。本地ISP网络526和因特网527都使用载有数字数据流的电信号、电磁信号或光信号。通过不同网络的信号和在网络链路520上并通过通信接口518的信号向和从数据处理系统500传送数字数据,并且都是传输信息的载波的示例性形式。
数据处理系统500可通过网络、网络链路520和通信接口518发送消息和接收数据,包括程序代码。在因特网的例子中,服务器530可以通过因特网527、ISP 526、本地网和通信接口518发送被请求的应用程序代码。该程序例如可以实现生成决策树和预测流失状态。通信能力还允许将相关数据装载到系统中,用于根据本发明进行处理。
数据处理系统500还具有各种信号输入/输出端口,用于连接到诸如打印机、显示器等的外围设备并与其通信。输入/输出端口可以包括USB端口、PS/2端口、串行端口、并行端口、IEEE-1394端口、红外线通信端口等和/和其他专有端口。数据处理系统500可以通过这些信号输入/输出端口与其他数据处理系统通信。
这里所述的系统和方法可以使用诸如单个PC的单个数据处理系统,或者多个不同类型的数据处理系统的组合实现。例如,客户机-服务器结构或者分布式数据处理体系结构可用于实现这里所述的系统,其中,多个数据处理系统被耦合到网络上以相互进行通信。一些数据处理系统可以用作服务器,处理数据流,提供计算服务或者访问客户数据,和/或更新驻留在其它耦合到网络的数据处理系统中的软件。
需要指出,包含在上述描述中并在附图中示出的全部内容都应被解释为是说明性的,而非限制性的。也应当理解,以下权利要求意图覆盖这里描述的所有一般的和特定的特征以及各种发明思想的范围的全部叙述,这些发明思想从语言上可以说落入其中。
权利要求
1.一种用于预测流失账户的方法,包括以下步骤定义基本训练时期;访问与所述基本训练时期有关的第一组账户的每一个的账户信息;确定在所述基本训练时期之后的目标时期;确定与所述目标时期有关的所述第一组账户的每一个的流失状态;基于与所述目标时期有关的所述第一组账户的每一个的流失状态,对所述第一组账户分类;以及基于与所述基本训练时期有关的所述第一组账户的每一个的账户信息和上述分类步骤的结果,生成分类规则。
2.根据权利要求1所述的方法,还包括以下步骤确定预测时期;确定在所述预测时期之前的基本时期;访问与所述基本时期有关的第二组账户的每一个的账户信息;以及通过将所述分类规则应用于所访问的与所述基本时期有关的所述第二组账户的每一个的账户信息,对所述第二组账户分类。
3.根据权利要求2所述的方法,还包括基于上述分类步骤的结果生成流失预测报告的步骤,其中所述报告包括所述第二组账户的每一个的流失状态的预测。
4.根据权利要求3所述的方法,还包括生成所述第二组账户中的至少一个的警告消息的步骤,所述警告消息具有表明所述账户将在所述预测时期内变为流失账户的预测流失状态。
5.根据权利要求3所述的方法,还包括以下步骤访问所述第二组账户的每一个或者至少一个将变为流失账户的账户的每一个的收益性数据;将所述第二组账户的每一个或者至少一个将变为流失账户的账户的每一个的收益性数据与预定收益性阈值进行比较;以及基于上述比较步骤的结果,生成所述第二组账户的每一个或者至少一个将变为流失账户的账户的每一个的收益性状态。
6.根据权利要求5所述的方法,还包括基于所述第二组账户的每一个的预测流失状态和收益性状态对所述第二组账户分类的步骤。
7.根据权利要求6所述的方法,还包括确定至少一个具有表明所述账户将在所述预测时期内变为流失账户的预测流失状态和超过所述预定收益性阈值的收益性状态的账户的步骤。
8.根据权利要求2所述的方法,其中,所述基本训练时期的长度与所述基本时期的长度实质上相等。
9.根据权利要求1所述的方法,其中,所述账户信息包括所述账户的总资产、与所述账户有关的总交易数量和与所述账户有关的总收入中的至少一个。
10.根据权利要求2所述的方法,其中,与所述基本时期有关的所述第二组账户的每一个的账户信息包括所述账户的总资产、与所述账户有关的总交易数量和与所述账户有关的总收入中的至少一个。
11.一种用于预测流失客户的方法,包括以下步骤定义基本训练时期;访问与所述基本训练时期有关的第一组客户的每一个的客户数据,其中所述客户数据包括与所述第一组客户的每一个相关的一个或多个账户的账户信息;确定在所述基本训练时期之后的目标时期;基于一个或多个与每一个与所述目标时期有关的客户有关的账户的账户活动,确定所述第一组客户的每一个的流失状态;基于与所述目标时期有关的所述第一组客户的每一个的流失状态,对所述第一组客户分类;以及基于与所述基本训练时期有关的所述第一组客户的每一个的客户数据和上述分类步骤的结果,生成分类规则。
12.根据权利要求11所述的方法,还包括以下步骤确定预测时期;确定在所述预测时期之前的基本时期;访问与所述基本时期有关的第二组客户的每一个的客户数据,其中所述客户数据包括与所述第二组客户的每一个相关的一个或多个账户的账户信息;以及通过将所述分类规则应用于所访问的与所述基本时期有关的所述第二组客户的每一个的客户数据,对所述第二组客户分类。
13.根据权利要求12所述的方法,还包括基于上述分类步骤的结果生成流失预测报告的步骤,其中,所述报告包括所述第二组客户的每一个的流失状态的预测。
14.根据权利要求13所述的方法,还包括生成所述第二组客户中的至少一个的警告消息的步骤,所述警告消息具有表明所述客户将在所述预测时期内变为流失客户的预测流失状态。
15.根据权利要求13所述的方法,还包括以下步骤访问所述第二组客户的每一个或者至少一个将变为流失客户的客户的每一个的收益性数据;将所述第二组客户的每一个或者至少一个将变为流失客户的客户的每一个的收益性数据与预定收益性阈值进行比较;以及基于上述比较步骤的结果,生成所述第二组客户的每一个或者至少一个将变为流失客户的客户的每一个的收益性状态。
16.根据权利要求15所述的方法,还包括基于所述第二组客户的每一个的预测流失状态和收益性状态,对所述第二组客户分类的步骤。
17.根据权利要求16所述的方法,还包括确定至少一个具有表明所述客户将在所述预测时期内变为流失客户的预测流失状态和超过所述预定收益性阈值的收益性状态的客户的步骤。
18.根据权利要求12所述的方法,其中,所述基本训练时期的长度与所述基本时期的长度实质上相等。
19.根据权利要求11所述的方法,其中,所述客户数据包括与客户相关的一个或多个账户的总资产、与一个或多个与客户相关的账户有关的总交易数量以及与一个或多个与客户相关的账户相关的总收入中的至少一个。
20.根据权利要求12所述的方法,其中,与所述基本时期有关的所述第二组客户的每一个的客户数据包括与客户相关的一个或多个账户的总资产、与一个或多个与客户相关的账户有关的总交易数量以及与一个或多个与客户相关的账户相关的总收入中的至少一个。
21.一种用于预测流失账户的方法,包括以下步骤定义目标时期;确定与所述目标时期有关的第一组账户的每一个的流失状态;基于与所述目标时期有关的所述第一组账户的每一个的流失状态,对所述第一组账户分类;选择在所述目标时期之前的基本训练时期;访问与所述基本训练时期有关的所述第一组账户的每一个的账户信息;以及基于与所述基本训练时期有关的所述第一组账户的每一个的账户信息和上述分类步骤的结果,生成分类规则。
22.根据权利要求21所述的方法,还包括以下步骤确定预测时期;确定在所述预测时期之前的基本时期;访问与所述基本时期有关的第二组账户的每一个的账户信息;通过将所述分类规则应用于所访问的与所述基本时期有关的所述第二组账户的每一个的的账户信息,对所述第二组账户分类。
23.根据权利要求22所述的方法,还包括基于上述分类步骤的结果生成流失预测报告的步骤,其中,所述报告包括所述第二组账户的每一个的流失状态的预测。
24.根据权利要求23所述的方法,还包括生成所述第二组账户中的至少一个的警告消息的步骤,其中所述警告消息具有表明所述账户将在所述预测时期内变为流失账户的预测流失状态。
25.根据权利要求23所述的方法,还包括以下步骤访问所述第二组账户的每一个或者至少一个将变为流失账户的账户的每一个的收益性数据;将所述第二组账户的每一个或者至少一个将变为流失账户的账户的每一个的收益性数据与预定收益性阈值进行比较;以及基于上述比较步骤的结果,生成所述第二组账户的每一个或者至少一个将变为流失账户的账户的每一个的收益性状态。
26.根据权利要求25所述的方法,还包括基于所述第二组账户的每一个的预测流失状态和收益性状态对所述第二组账户分类的步骤。
27.根据权利要求26所述的方法,还包括确定至少一个具有表明所述账户将在所述预测时期内变为流失账户的预测流失状态和超过所述预定收益性阈值的收益性状态的账户的步骤。
28.根据权利要求22所述的方法,其中,所述基本训练时期的长度与所述基本时期的长度实质上相等。
29.根据权利要求21所述的方法,其中,所述账户信息包括所述账户的总资产、与所述账户有关的总交易数量以及与所述账户相关的总收入中的至少一个。
30.根据权利要求22所述的方法,其中,与所述基本时期有关的所述第二组账户的每一个的账户信息包括所述账户的总资产、与所述账户有关的总交易数量以及与所述账户相关的总收入中的至少一个。
31.根据权利要求21所述的方法,其中,所述基本时期基于每一个账户的流失状态选择。
32.根据权利要求31所述的方法,其中对于流失账户,所述基本时期被选择为在所述账户变为流失之前的预定时期;对于非流失账户,所述基本时期被选择为在所述目标时期之前的预定时期。
33.一种用于预测流失客户的方法,包括以下步骤定义目标时期;基于与每一个与所述目标时期有关的客户有关的一个或多个账户的账户活动,确定与所述目标时期有关的第一组客户的每一个的流失状态;基于与所述目标时期有关的所述第一组客户的每一个的流失状态,对所述第一组客户分类;选择在所述目标时期之前的基本训练时期;访问与所述基本训练时期有关的所述第一组客户的每一个的客户数据,其中所述客户数据包括与所述第一组客户每一个相关的一个或多个账户的账户信息;以及基于与所述基本训练时期有关的所述第一组客户的每一个的客户数据和上述分类步骤的结果,生成分类规则。
34.根据权利要求33所述的方法,还包括以下步骤确定预测时期;确定在所述预测时期之前的基本时期;访问与所述基本时期有关的第二组客户的每一个的客户数据,其中所述客户数据包括与所述第二组客户的每一个相关的一个或多个账户的账户信息;通过将所述分类规则应用于所访问的与所述基本时期有关的所述第二组客户的每一个的客户数据,对所述第二组客户分类。
35.根据权利要求34所述的方法,还包括基于上述分类步骤的结果生成流失预测报告的步骤,其中,所述报告包括所述第二组客户的每一个的流失状态的预测。
36.根据权利要求35所述的方法,还包括生成所述第二组客户中的至少一个的警告消息的步骤,所述警告消息具有表明所述客户将在所述预测时期内变为流失客户的预测流失状态。
37.根据权利要求35所述的方法,还包括以下步骤访问所述第二组客户的每一个的收益性数据;将所述第二组客户的每一个的收益性数据与预定收益性阈值进行比较;以及基于上述比较步骤的结果,生成所述第二组客户的每一个的收益性状态。
38.根据权利要求37所述的方法,还包括基于所述第二组客户的每一个的预测流失状态和收益性状态对所述第二组客户分类的步骤。
39.根据权利要求38所述的方法,还包括确定至少一个具有表明所述客户将在所述预测时期内变为流失客户的预测流失状态和超过所述预定收益性阈值的收益性状态的客户的步骤。
40.根据权利要求34所述的方法,其中,所述基本训练时期的长度与所述基本时期的长度实质上相等。
41.根据权利要求33所述的方法,其中,所述客户数据包括与客户相关的一个或多个账户的总资产、与一个或多个与客户相关的账户有关的总交易数量以及与一个或多个与客户相关的账户相关的总收入中的至少一个。
42.根据权利要求34所述的方法,其中,与所述基本时期有关的所述第二组客户中的每一个的客户数据包括与客户相关的一个或多个账户的总资产、与一个或多个与客户相关的账户有关的总交易数量以及与一个或多个与客户相关的账户相关的总收入中的至少一个。
43.根据权利要求33所述的方法,其中,所述基本时期基于每一个客户的流失状态选择。
44.根据权利要求43所述的方法,其中对于流失客户,所述基本时期被选择为在客户变为流失之前的预定时期;对于非流失客户,所述基本时期被选择为在所述目标时期之前的预定时期。
45.一种用于计算账户的收益性的数据处理系统,包括用于处理数据的处理器;以及耦合到所述处理器的数据存储装置;其中,所述数据存储装置具有使所述数据处理系统执行如权利要求1所述的方法的步骤的指令。
46.一种用于计算账户的收益性的数据处理系统,包括用于处理数据的处理器;以及耦合到所述处理器的数据存储装置;其中,所述数据存储装置具有使所述数据处理系统执行如权利要求11所述的方法的步骤的指令。
47.一种用于计算账户的收益性的数据处理系统,包括用于处理数据的处理器;以及耦合到所述处理器的数据存储装置;其中,所述数据存储装置具有使所述数据处理系统执行如权利要求21所述的方法的步骤的指令。
48.一种用于计算账户的收益性的数据处理系统,包括用于处理数据的处理器;耦合到所述处理器的数据存储装置;其中,所述数据存储装置具有使所述数据处理系统执行如权利要求33所述的方法的步骤的指令。
49.一种包括指令的计算机程序,可以包含在机器可读介质中,用于控制数据处理系统计算账户的收益性,所述指令在由所述数据处理系统执行时使所述数据处理系统执行如权利要求1所述的的方法的步骤。
50.一种包括指令的计算机程序,可以包含在机器可读介质中,用于控制数据处理系统计算账户的收益性,所述指令在由所述数据处理系统执行时使所述数据处理系统执行如权利要求11所述的方法的步骤。
51.一种包括指令的计算机程序,可以包含在机器可读介质中,用于控制数据处理系统计算账户的收益性,所述指令在由所述数据处理系统执行时使所述数据处理系统执行如权利要求21所述的方法的步骤。
52.一种包括指令的计算机程序,可以包含在机器可读介质中,用于控制数据处理系统计算账户的收益性,所述指令在由所述数据处理系统执行时使所述数据处理系统执行如权利要求33所述的方法的步骤。
全文摘要
一种方法和系统基于预定的分类规则和与客户/账户相关的客户数据/账户信息预测有可能流失的客户/账户。分类规则通过解析历史客户数据/账户信息以确定流失客户/账户及其相关属性产生。独特的算法用于确定客户或账户的流失状态。在生成分类规则之后,将该分类规则应用于新的客户数据或账户信息以预测有可能流失的客户或账户。
文档编号G06Q40/00GK1795462SQ200480014177
公开日2006年6月28日 申请日期2004年5月24日 优先权日2003年5月22日
发明者P·义, P·雷迪, L·瓦塔纳贝 申请人:珀欣投资有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1