企业生命周期的分析方法、装置及存储介质与流程

文档序号:20515067发布日期:2020-04-24 18:59阅读:282来源:国知局
企业生命周期的分析方法、装置及存储介质与流程

本申请涉及数据处理技术领域,具体涉及一种企业生命周期的分析方法、装置及存储介质。



背景技术:

企业生命周期是企业发展与成长的动态运动轨迹,包括“初创期、成长期、成熟期”三个阶段每个阶段中都有凋亡的可能。通过发票数据分析企业生命周期的目的在于试图将企业经营现状与企业相应生命周期相匹配,使投资机构及企业清晰了解自身所处生命周期的那一阶段及风险,投资机构及企业通过生命周期分析找到与其特点相适应经营及组织形式,通过微调延长成长期,帮助企业实现自身的高速可持续发展。

企业生命周期理论源自20世纪50-60年代,早期企业生命周期理论主要从生物学中的“生命周期”观点来看待企业。在70年代学者们开始系统的研究企业生命周期并发现企业成长过程中的s形曲线。70年代末至80,研究的重心开始通过模型来进行企业的生命周期分析。

传统的企业生命周期分析主要从企业商业经营发展角度,通过工商企业管理层面来观察企业的不同成长发展阶段所具有的经营特征,如邱吉尔和刘易斯(churchilln.c和lewisv.l,1983)从企业规模和管理因素两个维度描述了企业各个发展阶段的特征,伊查克·爱迪思(ichakadizes)通过组织变革来分析企业生命周期。现有技术的这些分析方法作为理论研究有一定历史意义,面对众多中小微企业的生命周期分析操作过程过于复杂,不具备时序性、实时性特征,不能客观、真实地反映企业经营活动情况。



技术实现要素:

本申请的目的是提供一种企业生命周期的分析方法、装置及存储介质。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。

根据本申请实施例的一个方面,提供一种企业生命周期的分析方法,包括:

抽取数据;

分析生命周期。

进一步地,所述方法还包括:在分析生命周期之前,对所述数据进行预处理。

进一步地,所述抽取数据,包括:抽取企业的开票行为数据,进行etl处理后储存到数据仓库。

进一步地,所述开票行为数据包括:发票数据中的开票总金额、开票频数、最后开票时间距离当前时间的时间长度。

进一步地,所述分析生命周期,包括:

对所述开票行为数据进行聚类分析,根据聚类分析的结果,划分所述企业所处的生命周期阶段;所述聚类分析所依据的指标包括:衡量销售规模的开票总金额指标、衡量销售活跃度的开票频数指标、作为观察期的最后开票时间距离当前时间的时间长度。

进一步地,所述分析生命周期,包括:

利用开票金额总额和开票数量总额构成矩阵的横纵坐标,将企业一一对应到矩阵中,建立一根趋势线;

将趋势线周围预设范围内的客户定义为目标客户群;

趋势线的两端分别为初创期和成熟期,中间部分为成长期,通过最后一次开票距离现在的时间为处于每个周期阶段的企业建立预警,最后一次开票距离现在时间越远其凋亡的可能性越大;

建立坐标图,把凋亡发生可能性的高低及生命周期的不同阶段绘制成坐标系,通过坐标系对相关企业凋亡发生可能性的高低进行定量计量。

进一步地,所述方法还包括:将模型计算的风险评分作为新增字段存储在数据仓库中。

进一步地,所述方法还包括:通过web或app页面可调用数据仓库中动态存储的企业生命周期,生成时间序列图或以其他数据可视化的方式将信用得分展示在前台。

根据本申请实施例的另一个方面,提供一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现所述的企业生命周期的分析方法。

根据本申请实施例的另一个方面,提供一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以实现所述的企业生命周期的分析方法。

本申请实施例的其中一个方面提供的技术方案可以包括以下有益效果:

本申请实施例提供的企业生命周期的分析方法,通过对企业经营活动中开票总金额、开票频数、最后开票时间距离当前时间的差等因子进行聚类分析,将处于不同生命周期的企业进行分群进而发现企业所处生命周期阶段,操作简单方便,且分析结果符合真实业务的应用场景,具有较好的时序性、实时性特征,可以客观、真实地反映企业经营活动情况。

本申请的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者,部分特征和优点可以从说明书中推知或毫无疑义地确定,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出了本申请的一个实施例的企业生命周期的分析方法流程图;

图2示出了本申请的一个实施例的企业生命周期的分析方法的详细流程图;

图3示出了本申请的一个实施例的数据抽取及存储过程示意图;

图4示出了本申请的一个实施例的企业生命周期分析过程示意图;

图5示出了本申请的另一实施例的企业生命周期的分析方法流程图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,下面结合附图和具体实施例对本申请做进一步说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。

本申请的一个实施例提供了一种企业生命周期的分析方法,包括以下步骤:

抽取数据;

分析生命周期。

在某些实施方式中,所述方法还包括:在分析生命周期之前,对所述数据进行预处理。

在某些实施方式中,所述抽取数据,包括:从业务系统抽取企业的开票行为数据,进行etl处理后储存到数据仓库。etl,是英文extract-transform-load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。

在某些实施方式中,所述开票行为数据包括:发票数据中的开票总金额、开票频数、最后开票时间距离当前时间的时间长度。

在某些实施方式中,所述分析生命周期,包括;

对所述开票行为数据进行聚类分析,根据聚类分析的结果,划分所述企业所处的生命周期阶段;所述聚类分析所依据的指标包括:衡量销售规模的开票总金额指标、衡量销售活跃度的开票频数指标、作为观察期的最后开票时间距离当前时间的时间长度。

在某些实施方式中,所述分析生命周期,包括:

利用开票金额总额和开票数量总额构成矩阵的横纵坐标,将企业一一对应到矩阵中,建立一根趋势线;

将趋势线周围预设范围内的客户定义为目标客户群;

趋势线的两端分别为初创期和成熟期,中间部分为成长期,通过最后一次开票距离现在的时间为处于每个周期阶段的企业建立预警,最后一次开票距离现在时间越远其凋亡的可能性越大;

建立坐标图,把凋亡发生可能性的高低及生命周期的不同阶段绘制成坐标系,通过坐标系对相关企业凋亡发生可能性的高低进行定量计量。

在某些实施方式中,所述方法还包括:将模型计算的风险评分作为新增字段存储在数据仓库中。

在某些实施方式中,所述方法还包括:通过web或app页面可调用数据仓库中动态存储的企业生命周期,生成时间序列图或以其他数据可视化的方式将信用得分展示在前台。

本实施例还提供一种电子装置,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序,以实现所述的企业生命周期的分析方法。

本实施例还提供一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以实现所述的企业生命周期的分析方法。

如图1至图4所示,本申请的另一个实施例提供了一种企业生命周期的分析方法,包括以下步骤:

步骤01、抽取数据

从业务系统抽取开票企业开票行为数据,进行etl处理后储存到数据仓库;开票行为数据的数据项主要包括发票数据中的开票总金额、开票频数、最后开票时间距离当前时间的时间长度等数据。

针对实际应用中大量的企业发票数据,实例中采用数据仓库的方式,利用etl过程对业务系统中的发票数据进行抽取、转换、装载,通过建立一张以客户为中心的包含多属性的宽表储存到数据仓库,再供以后建模分析使用。所述数据抽取指从源系统中提取数据,同时按照分析需要转换为相应数据结构后汇总,在完成转换和汇总后加载到目标数据仓库。

发票数据包括发票主表及发票明细表,如果直接频繁调取业务集群中的发票数据信息回增加系统负载,我们定时抽取同生命周期分析相关字段进行指标加工及新增数据存储。

步骤02、数据预处理

基于专家意见通过穷举的方式分析可能影响生命周期的因素,然后对数据仓库中的数据进行预处理,加工成相应指标,使其符合业务场景的需求,供给下一步建模使用。本实例中进行生命周期的数据都来源于企业的发票信息,影响因素主要包括开票总金额、开票频数、最后开票时间距离当前时间的差,同时也不限定发票数据中其它影响生命周期的因素。在数据预处理过程中还要充分考虑相应指标的缺失值,以及指标间的业务逻辑关系。

步骤03、分析生命周期

生命周期模型通过对企业经营活动中开票总金额、开票频数、最后开票时间距离当前时间的差等因子进行聚类分析,将处于不同生命周期的企业进行分群进而发现企业所处生命周期阶段。分析过程中同样遵循业务理解、数据理解、数据准备、挖掘建模、模型评估、模型部署这六个阶段,同时本申请不限定采用其它可行的数据挖掘算法。

其业务逻辑为一定时期内的开票金额总额和开票数量总额构成矩阵的横纵坐标,将企业一一对应到矩阵中,建立一根趋势线,观察其分布,会发现大部分企业分布在趋势线的周围,可将趋势线一定范围内的客户定义为目标客户群。趋势线的两端为“初创期、成熟期”中间部分为“成长期”,通过最后一次开票距离现在的时间为处于每个阶段的企业建立“凋亡”预警,最后一次开票距离现在时间越远其凋亡的可能性越大。

在系统中通过建立坐标图的方法实现以上业务逻辑。坐标图把凋亡发生可能性的高低及生命周期的不同阶段绘制成坐标系,通过坐标系对相关企业凋亡发生可能性的高低进行定量计量。

步骤04、存储数据

将模型计算的风险评分作为新增字段存储在数据仓库中,供给业务场景调用。

步骤05、业务调用

用户通过web或app页面可调用数据仓库中动态存储的企业生命周期,生成时间序列图或以其他数据可视化的方式将信用得分展示在前台。

本申请的另一个实施例提供了一种企业生命周期的分析方法,包括以下步骤:

从数据系统中抽取用户发票开具数据,建立新数据表存储;

通过发票行为数据分析影响生命周期的因素设计数据模型;

利用数据模型对数据进行分析;

将分析结果换算成初创期、成长期、成熟期、凋亡期四个阶段。

在某些实施方式中,所述方法还包括对发票行为数据的预处理,包括提取开票总金额、开票频数、最后开票时间距离当前时间的时间长度等数据。

所述方法还包括对预处理后增量数据的存储及使用;

所述方法还包括通过发票行为数据建立影响生命周期的因素;

通过聚类的方法对企业进行分群,分群所依据的指标体系包括:衡量销售规模的开票总金额指标、衡量销售活跃度的开票频数指标、作为观察期的最后开票时间距离当前时间的差。

所述方法还包括记录企业生命周期变化的趋势及对变化趋势进行的分析及可视化;

一种企业生命周期的分析系统,包括:

数据单元,用于从业务系统抽取开票企业开票行为数据,进行etl处理后储存到数据仓库;

模型单元,用于分析并确定影响生命周期的因素,在从数据单元获取相关数据后,利用所诉影响因素建立生命周期模型;

评估单元,用于运用生命周期模型计算企业当下所处的生命周期。

所述系统还包括:数据单元,用于抽取和存储原始数据及增量数据;

所述系统还包括:模型单元,用于对影响因素数据进行数据探索,通过反复实验逐步发现影响因素。

所述系统还包括:评估单元,用于通过聚类的方法对企业进行分群,指标体系包括:衡量销售规模的开票总金额指标、衡量销售活跃度的开票频数指标、作为观察期的最后开票时间距离当前时间的差。及记录企业生命周期变化的趋势及对变化趋势进行的分析及可视化。

所述系统还包括:对发票行为数据的预处理,包括开票总金额、开票频数、最后开票时间距离当前时间的差。

发票作为记录企业经营性现金流的凭证贯穿于企业生命周期始终,生命周期的不同阶段发票行为数据也呈现不同的变化特征,本申请正是基于发票数据的周期性变化,分析企业所处的不同生命周期,辅助企业生产经营活动。

本申请公开了一种企业生命周期的分析方法,利用发票数据进行企业生命周期分析,用以解决企业生命周期分析的问题,企业的生命期是借鉴人的生命周期的概念,即,企业开始生产经营的时间定义为客户生命周期的开始。通过持续追踪和分析企业的经营行为,识别出商业机会和问题。在企业生命周期的分析中,将企业停止经营活动视为生命周期的结束。对于已进入或将进入凋亡期的企业,通过建立预警模型提前对客户生命期的结束进行预警,提前发现经营风险。一种基于发票数据分析企业生命周期的方法和系统,基于企业发票数据对企业生命周期进行分析。

如图5所示,该方法包括:从业务系统抽取开票企业开票行为数据,进行etl处理后储存到数据仓库;通过发票行为数据分析影响生命周期的因素,从数据仓库获取分析影响因素所需数据;利用所诉风险因素建立生命周期模型;利用模型计算企业生命周期。

本申请进行分析的数据来源于企业经营活动业务系统中的发票行为数据,具有时序性、实时性特征,可以客观、真实地反映企业经营活动情况。本申请通过对企业经营活动实时监控,解决企业对企业生命周期分析问题。

本申请实施例充分利用企业间商业往来的开票行为数据,在进行etl处理后储存到数据仓库;通过对开票总金额、开票频数、最后开票时间距离当前时间的差发现影响生命周期的因子,通过对记录企业生命周期变化的趋势二次分析,建立企业“初创期、成长期、成熟期、凋亡期”四阶生命周期体系。

所述生命周期体系能够客观地评估企业经营活动的情况,因为该体系的数据源于企业经营活动中的发票数据,具有实时性和时序性。本申请实例中建立的生命周期模型采用的是通过对企业经营活动中开票总金额、开票频数、最后开票时间距离当前时间的差等因子进行聚类分析,将处于不同生命周期的企业进行分群进而发现企业所处生命周期阶段,符合真实业务的应用场景。

需要说明的是:

术语“模块”并非意图受限于特定物理形式。取决于具体应用,模块可以实现为硬件、固件、软件和/或其组合。此外,不同的模块可以共享公共组件或甚至由相同组件实现。不同模块之间可以存在或不存在清楚的界限。

在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本申请的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本申请实施例的虚拟机的创建装置中的一些或者全部部件的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本申请进行说明而不是对本申请进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上所述实施例仅表达了本申请的实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1