一种数据特征库建立方法和系统与流程

文档序号:11216353阅读:556来源:国知局
一种数据特征库建立方法和系统与流程

本发明涉及数据处理领域,更为具体而言,涉及一种数据特征库建立方法和系统。



背景技术:

随着银行数据管理的不断发展,银行crm系统(对公客户关系管理系统),在贯彻落实业务发展战略、客户战略的基础上,运用信息技术,整合客户关系管理、经营活动管理、管理决策支持三大模块,满足客户识别与评价、经营活动全过程管理与考核、管理层决策辅助支持需要,实现“以客户驱动”为核心的业务经营管理模式。但当前的客户关系管理系统存在几个问题:首先,缺少管理和决策工具,缺乏对经营活动过程控制,造成管理者很多管理手段都无法应用;其次,为客户经理提供的参考消息不足,客户分析筛选能力不够,对客户产业链条上的商机挖掘不够,都制约了我行业务的发展;最后,对客户经理营销评价“定量少”,缺乏营销过程的数据积累,对服务团队评价“凭感觉”等问题。



技术实现要素:

鉴于现有技术的上述缺陷,本发明实施方式提供了一种数据特征库建立方法和系统,能够有效解决当前客户关系管理系统的多项管理问题。

具体地,本发明实施方式提供了一种数据特征库建立方法,其包括:

根据对公信息项和同业经验分析得到对公客户的特征指标项,再根据所述特征指标项的业务含义和加工规则,对所述特征指标项进行主题和维度划分,确定每个指标的使用需求;

根据所述每个指标的使用需求和所述加工规则,构建所述对公客户的特征库数据集市;

基于所述特征库数据集市,对所述对公客户进行分析和模型训练,并根据所述模型训练后的数据转换规则和参数配置,并根据所述数据转换规则进行模型固化和投产。

相应地,本发明实施方式还提供了一种数据特征库建立系统,其中,所述系统包括:

特征指标分析模块,用于根据对公信息项和同业经验分析得到对公客户的特征指标项,再根据所述特征指标项的业务含义和加工规则,对所述特征指标项进行主题和维度划分,确定每个指标的使用需求;

数据集市构建模块,用于根据所述每个指标的使用需求和所述加工规则,构建所述对公客户的特征库数据集市;

分析训练模块,用于基于所述特征库数据集市,对所述对公客户进行分析和模型训练;

模型固化模块,用于根据所述模型训练后的数据转换规则和参数配置,并根据所述数据转换规则进行模型固化和投产。

通过采用本发明实施方式具有下述有益效果:实现基于客户的针对性管理方案,提升专业化服务,以及提供更完善的数据支持。

附图说明

图1是根据本发明实施方式的一种数据特征库建立方法的流程示意图;

图2是根据本发明实施方式中表结构示意图;

图3是根据本发明实施方式中宽窄表的关系图;

图4是根据本发明实施方式的一种数据特征库建立系统的架构图。

具体实施方式

为了便于理解本发明技术方案的各个方面、特征以及优点,下面结合附图对本发明进行具体描述。应当理解,下述的各种实施方式只用于举例说明,而非用于限制本发明的保护范围。

首先对根据本发明可能涉及到的名称或术语进行解释。

etl:extract-transform-load用来描述从来源端经抽取、转换、加载的数据处理过程;

sas:statisticsanalysissystem一个用于处理处理与统计分析的软件。

实施例1:

图1是根据本发明实施方式的一种数据特征库建立方法的流程示意图。参照图1,具体实施例如下:

所述方法包括:

步骤s1,根据对公信息项和同业经验分析得到对公客户的特征指标项,再根据所述特征指标项的业务含义和加工规则,对所述特征指标项进行主题和维度划分,确定每个指标的使用需求;

步骤s2,根据所述每个指标的使用需求和所述加工规则,构建所述对公客户的特征库数据集市;以及

步骤s3,基于所述特征库数据集市,对所述对公客户进行分析和模型训练,并根据所述模型训练后的数据转换规则和参数配置,并根据所述数据转换规则进行模型固化和投产。

本发明基于企业级数据仓库建立特征库,分析师能够通过对客户的细分与群分改善我行公司客户基础薄弱,推进客户结构优化提升基于客户细分的差别化、专业化服务;通过挖掘营销商机库增加商机来源渠道并提升商机获取效率,为客户经理提供完善的单一客户分析数据;提升商机销售的过程管理;为管理层决策支持提供数据分析基础。因此,本发明通过构建对公客户的特征库数据集市,从而解决当前客户关系管理系统的多项管理问题,实现基于客户的针对性管理方案,提升专业化服务,以及提供更完善的数据支持。

实施例2:

所述步骤s1中,对所述特征指标项进行主题和维度划分包括:对所述特征指标项进行数据大类、业务类别和信息项的多层次划分。具体而言,以银行数据仓库经典十大模型主题域(团体、地域、协议、事件、产品、资产、营销活动、渠道、财务、申请、模型)作为数据准备基础;以推进基于细分的精细化客户管理、推进商机与客户重大事件全过程管理作为搭建数据集市的业务需求驱动,分析特征库集市需要的数据项包括:

1、客户基本信息:账户信息、客户签约信息、企业关联关系、财务信息、交易信息、产品信息;

2、客户特征信息:渠道交易特征、上下游特征、进出口贸易特征、利润贡献特征、客户群体细分特征、现金流特。

(1)以此分析满足客户特征分析的数据需求业务大类:

(2)定义出数据需求业务大类后,根据需求大类分析从行内系统的取数的业务规则,进一步细化指标分类:

3、最后需求分析师

将细化后的需求指标分类中描述的各种具体信息项进行进一步的分解、衍生、迭代。

例如,将公司存量客户基本信息的指标类别细分为客户的组织成立日期、注册资金、注册地址、组织性质等;将账户存贷款的实时交易流水统计出以月、季、年等不同时间段的累计金额及进行分析比较等,以此确定特征库指标项。

此时特征库指标项已是业务需求中所需的各种基础数据的完备的描述,且各指标项都能最精确的、无二意的描述解释某一特定业务含义,为后续对数据的加工应用提供了稳定支持。指标项分析结果举例如下:

实施例3:

在本发明的另一种实施方式中,所述方法除了上述处理方式外,其中,步骤s2中所述构建所述对公客户的特征库数据集市包括:根据后续数据挖掘场景和实际应用,所述特征数据集市采用宽窄表方式。

具体而言,客户特征库数据集市存放经过深度提炼加工客户特征数据,主要是面向分析模型提供分析挖掘所需的全面客户特征数据。按照客户特征类别包括:存量公司客户特征库、潜在公司客户特征库、标准分析维度数据。以特征库指标项、客户特征类别为基础,综合考虑指标项实际落地维护、查询使用、分析挖掘等场景,搭建出可物理化的概念模型。概念模型定义了每个实体表其应该包含的特征库指标项清单、加工频率、保存策略、各指标项数据加工路径、实体间逻辑关系等信息。

数据加工人员收到需求分析师分析设计的特征指标项需求与概念模型,根据需求分析每个特征指标的加工数据路径并转换物理模型。根据概念模型定义好的实体表规则,将概念模型实际拆分或整合成可创建,可使用的物理模型,为后续数据挖掘提供了数据来源。数据集市模型有星型模型,雪花模型等。在本发明中,根据对后续数据挖掘场景的考量,以及实际使用中对效率、存储、速度、易用程度等的综合考虑,数据集市模型结构采用宽窄表方式。

数据集市中按数据内容分为:存量客户特征库、潜在客户特征库、客户分析挖掘结果回写;按指标时间统计范围和存储周期分为当前表、月累计表、年累计表(表结构如图2所示)。

其中宽窄表的关系如图3所示,其中:宽表的数据来源于窄表,是窄表数据的汇总、总结;窄表是宽表数据必要的补充。宽表:方便、迅速、易使用,但加工逻辑复杂。窄表:数据信息丰富、易加工,但数据量大、处理速度慢。宽表与窄表的选择是效率、存储、速度、易用程度等的综合考虑。

在图3中,对公客户特征主表、对公客户特征月累计、对公客户特征年累计为宽表;受托支付明细、客户和对公参与人关系、客户和对私参与人关系、客户签约明细、客户合约明细、月末合约明细、月末签约明细、现金流月累计、资金流月累计、渠道交易月累计、持有产品盈利信息、现金流年累计、资金流年累计、渠道交易年累计为窄表。

窄表是宽表相应数据项的明细扩展与补充。例如,在对公客户特征主表中,存在“关联关系”的若干数据项,而宽表存放的只会是当前状态下该对公客户关联的企业数量(和对公参与人关系)及法人代表信息(和对私参与人关系),若想分析挖掘此关联企业的明细信息及法人代表的历史变化情况,需向更细粒度的窄表钻取分析。

实施例4:

在本发明的另一种实施方式中,所述方法除了上述处理方式外,其中,所述对所述对公客户进行分析和模型训练包括:利用sas工具对所述公客户进行即席查询和专题模型训练。

具体而言,基于特征库数据集市,分析师利用sas工具进行对公客户的分析挖掘,分析挖掘应用场景可分两大类:即席查询、专题模型训练。即席查询通常是针对行领导和对公条线经营管理层提出的热点业务问题、客户群策略研究任务,对公客户分析师采用量化分析的方式,基于我行真实数据,利用数据挖掘工具(如sas):1、开展即席分析活动,并利用挖掘成果撰写专题报告,以支持管理层精细化客户群策略制定。2、基于总结的挖掘成果构建临时形态的营销模型,并输出临时性专题营销名单,以支持开展精准营销。专题模型训练包括但不仅限于:1、对公客户分析师基于一线营销专家访谈、分行反馈,经过一定时间的营销经验积淀,定期归纳典型的对公客户营销模式和规律,并形成专题营销业务说明书。2、对公客户分析师使用量化分析的方式,基于真实的客户数据,对专题营销活动客户的产品覆盖、利润贡献等表现进行趋势分析,评估专题营销的效果,定期进行模型优化,以不断提升专题营销的精度。

即席查询的产出一般为撰写分析报告,专题模型训练产出为模型规则。以下是分别对两种应用场景的举例说明:

(a)情景名称:即席分析挖掘(客户群策略分析)

情景定义:通常是针对行领导和对公条线经营管理层提出的热点业务问题、客户群策略研究任务,对公客户分析师采用量化分析的方式,基于我行真实数据,利用数据挖掘工具(如saseg),开展即席分析活动,并利用挖掘成果撰写专题报告,以支持管理层精细化客户群策略制定。业务流程:

step1.管理层交办热点业务问题或客户群策略研究分析任务:行领导和对公条线经营管理在客户管理和政策制定过程中,提出热点业务问题和策略研究任务,线下或通过其他日常工作平台下达至对公客户分析师。产出:对公客户群策略研究任务说明书。

step2.分析师开展分析活动:对公客户分析师针对管理层交办的分析任务,基于我行当前最新的真实数据,利用数据挖掘工具(如sas),分析数据表现,总结规律,并将模型产出的关键性图表输出到本地,以支撑后续的报告撰写。产出:1、模型产出的图表、2、即席分析模型。

step3.分析师撰写和提交管理层报告:对公客户分析师依据分析挖掘成果和模型输出的图表素材,利用ppt/word等office工具撰写分析师报告,通过其他日常工作平台上交至管理层。产出:分析师报告(word/ppt等形式)

(b)情景名称:专题营销建模

情景定义:对公客户分析师基于一线营销专家访谈、分行反馈,经过一定时间的营销经验积淀,定期归纳典型的对公客户营销模式和规律,并形成专题营销业务说明书;在此基础上,采用数据量化的方式,构建相应营销模型,同时模型库管理人员(技术)将固化且经过审核的模型采用一定方式(sascode或sql)部署到投产环境进行应用。业务流程如下:

step1.分析师基于一线访谈和分行反馈,总结和撰写专题营销业务说明书:分析师基于一线访谈结果和分行反馈,定期梳理典型的对公客户营销模式和规律,在本地撰写专题营销业务说明书(excel或ppt等格式)。产出:专题营销业务说明书。

step2.分析师构建专题营销模型并撰写模型使用说明书:分析师基于专题营销业务说明书,使用我行真实的数据和数据挖掘工具(如saseg),对营销模型的客户筛选规则进行分析和总结,并在sas训练模型库中构建基于sas的专题营销模型,同时按照统一的模型发布流程规范,撰写专题营销模型使用说明书(和模型开发需求说明书),并将模型和相关提交件一并提交至建模环境下的模型库管理工具。产出:1、专题营销模型、2、专题营销模型使用说明书、3、专题营销模型开发需求说明书。

step3.模型库管理人员对模型和使用说明书进行审核确认,并在模型库管理工具中进行发布,形成审核通过的模型版本。针对分析师提交的专题营销模型,按照相应的流程规范进行审核,审核通过即可发布至模型库管理工具,形成审核通过的模型版本;审核不通过则通过线下或其他日常工作平台向分析师提出反馈意见,并在模型库管理工具中对该模型进行修改或删除。产出:无。

step4.模型库管理人员(技术)进行专题营销模型部署和投产:

(1)专题营销模型部署到sas投产模型库;

(2)若sas投产模型库采用sascode形式,则模型库管理人员(技术)将step3提交的sascode模型部署到投产环境进行投产应用;

(3)若sas投产模型库采用sql等其他形式,则模型库管理人员(技术)基于stp3发布的专题营销模型开发需求说明书,转化成sql等形式,并部署到投产环境进行应用。产出:模型相对应的sql等。

step5.模型投产运行监控人员对模型运行情况进行监控:投产后模型管理人员(监控)对投产环境模型的运行过程,进行监控和管理。产出:投产环境模型运行报告。

实施例5:

在本发明的另一种实施方式中,所述方法除了上述处理方式外,其中,

基于所述特征库数据集市,对所述对公客户进行分析和模型训练,在具体实施方式中,另外,分析师经反复训练后模型,如要在生产环境部署该模型进一步检验模型效果,需经投产模型固化步骤。分析师把训练后的模型转换为可实施的加工规则,并提供规则所需的参数配置阀值;数据加工人员针对接收的加工需求,转换为可落地的批处理作业,其中参数要采用可配置化方式,支持投产后修改。固化是一种将挖掘动作产生的分析挖掘类模型与事件类模型包含的详细设计要素进一步规则优化、数据加工路径确定为可重复实现的规则模型的过程,为后续通过技术方式(sascode或sql)将模型落地部署到投产环境进行结果产出与应用提供加工依据。其中,分析挖掘类模型包含:忠诚度-价值细分模型、自定义客户细分模型、客户群分布特征分析模型、产品覆盖度与持有产品分布特征分析模型、资金链条上下游特征分析模型、交易行为与渠道偏好特征分析模型、现金流特征分析模型、客户群产品持有相关联分析模型、交易行为与持有产品关联分析模型、利润贡献特征分析模型、客户细分群体总体监控管理模型、客户细分群体规模变动分析模型、客户细分群体产品覆盖度变动分析模型、客户细分群体迁移与流失分析模型和客户群分群体利润贡献变动分析模型。

事件类模型包含:营销类事件模型,其中,ce1:结算账户资金大幅波动、ce2:我行进出口贸易商上下游潜在客户的拓展、ce3:客户办理银行承兑汇票收款人为潜在客户的拓展、ce4:客户申请受托支付、ce5:我行核心企业上下游客户挖掘、客户提醒类事件模型、ce6:定期存款提前支取、ce7:客户持有理财产品到期、ce8:客户大额资金转出至他行同名账户、ce9:活跃账户数持续减少、ce10:账户使用频率显著下降。

详细设计要素包含:1、模型数据输入、输出特征字段数据源预评估;2、相关分析设计(分析路径/规则);3、模型输出与其他模型或功能页面耦合方式设计;4、模型运行方式(人工、自动调度等)。

另外,所述方法还包括:对所述模型固化后投产模型的产出结果经数据传输后流转给前台应用功能。举例如下:

应用一:客户忠诚度-价值细分

基于选定的某一类客户群,按照忠诚度-价值组合维度进行分析,形成相应的客户细分群体。在识别和挖掘高价值目标客户群体中,形成针对目标客户群体的战略建议,支持决策层深入了解银行公司客户构成特征,为制定和完善客户价值提升战略支持。

应用二:公司客户现金流特征分析

分析客户与客户间的资金往来交易,挖掘客户在银行资金流特征以及按结算产品分布的客户资金流特征,为对公各条线营销团队提供目标客群在银行的现金流特征参考和说明。

应用三:产品覆盖度与持有产品分布

基于存量客户分层分类模型和各细分模型输出的各细分群体,进一步分析该群体客户在银行的产品分布特征,包括产品覆盖度、持有产品类型、产品数量、产品交易频率和金额等,以支持总、分行公司金融业务管理团队深入了解各高价值细分群体客户的产品需求规律,精确制定针对目标客户细分市场的产品组合策略。

目前已经实现的投产模型5个,投产模型产出与应用关系如下表所示:

图4是根据本发明实施方式的一种数据特征库建立系统的架构图,如图所示,所述系统包括:

特征指标分析模块100,用于根据对公信息项和同业经验分析得到对公客户的特征指标项,再根据所述特征指标项的业务含义和加工规则,对所述特征指标项进行主题和维度划分,确定每个指标的使用需求;

数据集市构建模块200,用于根据所述每个指标的使用需求和所述加工规则,构建所述对公客户的特征库数据集市;

分析训练模块300,用于基于所述特征库数据集市,对所述对公客户进行分析和模型训练;

模型固化模块400,用于根据所述模型训练后的数据转换规则和参数配置,并根据所述数据转换规则进行模型固化和投产。

本发明通过构建对公客户的特征库数据集市,从而解决当前客户关系管理系统的多项管理问题,实现基于客户的针对性管理方案,提升专业化服务,以及提供更完善的数据支持。

在本发明的另一实施方式中,所述对所述特征指标项进行主题和维度划分包括:对所述特征指标项进行数据大类、业务类别和信息项的多层次划分。

在本发明的又一实施方式中,所述构建所述对公客户的特征库数据集市包括:根据后续数据挖掘场景和实际应用,所述特征数据集市采用宽窄表方式。

在本发明的再一实施方式中,所述对所述对公客户进行分析和模型训练包括:利用sas工具对所述公客户进行即席查询和专题模型训练。

在本发明的最后一个实施方式中,所述系统还包括:模型产出模块,用于对所述模型固化后投产模型的产出结果经数据传输后流转给前台应用功能。

需要说明的是,上述数据特征库建立系统的各个实施方式与所述数据特征库建立方法的对应技术内容完全一致,为了避免重复,在此不再冗述。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本领域技术人员应当理解,以上所公开的仅为本发明的实施方式而已,当然不能以此来限定本发明之权利范围,依本发明实施方式所作的等同变化,仍属本发明权利要求所涵盖的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1