一种基于电力营销数据的中小企业成长性评估方法及系统与流程

文档序号:28709472发布日期:2022-01-29 13:56阅读:98来源:国知局
一种基于电力营销数据的中小企业成长性评估方法及系统与流程

1.本发明属于电力大数据处理技术领域,更具体地,涉及一种基于电力营销数据的中小企业成长性评估方法及系统,尤其涉及企业业务画像,企业用电稳定性/增长趋势/行业分位计算、大数据算法,大数据模型开发等。


背景技术:

2.目前业界主要基于行业专家的行业经验和企业的经营及财务数据来构建企业成长分,上述成长分模型的数据源和建构方法存在以下不足:一是企业经营和财务数据往往按季度或者年度披露,在判断企业运营状况和成长性方面存在时滞;二是评估企业成长性时,因为数据的可得性问题,无法进行同行比较;三是普遍基于专家的行业经验或通过专家打分形成企业成长分时,其结果的主观性比较强。


技术实现要素:

3.为解决现有企业成长分模型的不足,本发明的目的在于,提供一种基于电力营销数据的中小企业成长性评估方法及系统,基于企业用电数据和工商数据,运用nlp和时间序列模型等方法,生成企业运营稳定性、趋势和同行分位等得分,综合后形成企业电力成长分模型。首先,基于电力营销数据中的企业行业分类和工商数据中的企业经营范围,运用nlp算法对企业的业务属性进行画像,基于业务画像使用聚类算法对企业进行分类,为后续的同业比较提供参照集。其次,基于企业的用电数据,提取企业的用电特征,按照周、月、季度、年等可调周期,通过离散系数表征企业用电的稳定性;第三,基于改进的arima方法,将企业用电量时间序列区分为趋势序列、周期序列和随机序列,从而更精准的预测企业用电成长性;第四,基于用电稳定性和增长趋势的二维比较框架,在同业中标定设定企业的坐标,得到一个二维的企业电力成长分。
4.本发明采用如下的技术方案。本发明的第一方面提供了一种基于电力营销数据的中小企业成长性评估方法,包括以下步骤:
5.步骤1,建立企业业务属性画像模型,得到业务可比的企业集;
6.步骤2,建立电力大数据处理模块,得到企业实际用电量的时间序列;
7.步骤3,建立企业用电稳定性模型;
8.步骤4,建立企业用电趋势模型;
9.步骤5,建立企业用电同业分位模型,基于企业用电的稳定性和增长趋势,以同类企业为样本,形成二维的严格可比的企业成长分。
10.优选地,步骤1具体包括:
11.步骤1.1,采集数据,获取电力营销数据、工商数据中的企业基本信息、行业分类和经营范围;
12.步骤1.2,基于企业工商数据中的经营范围文本,通过神经网络分词算法,提取企业的业务关键词;
13.步骤1.3,对于一个行业下所有企业,确定任意两家企业之间业务可比的程度。
14.优选地,步骤1.3具体包括:
15.步骤1.3.1,一个行业下所有企业的业务关键词集合构成一个由二元变量构成的向量空间,每一个企业都是这个空间中的一个具体映射;
16.步骤1.3.2,对这个空间中的两两企业建立列联表,通过列联表计算两家企业之间的业务距离d;
17.步骤1.3.3,d值越小表示两家企业之间的业务距离越小,从而可通过d值的取值范围确定两家企业之间业务可比的程度。
18.优选地,步骤1.3中,以a表示x、y两家企业均有某个业务,b、c表示x、y在某个业务上均只出现一次,d表示某个业务x、y两家企业均无,建立下表,
[0019][0020]
以如下公式表示两家企业之间的业务距离d,
[0021][0022]
其中,d(x,y)表示x、y两家企业之间的业务距离。
[0023]
优选地,步骤1.3中,当d(x,y)《0.2时两家企业之间越可被视为严格可比的企业。
[0024]
优选地,步骤3具体包括:
[0025]
使用离散系数计算设定企业不同容量下日实际用电量在不同周期下的离散情况,在计算σ时分别计算全部历时数据的离散系数和均值以下数据的离散系数。具体地,以如下公式进行计算,
[0026][0027]
式中:
[0028]vs
表示设定周期内企业实际用电的离散系数,
[0029]
σ表示设定周期内企业实际用电量的方差,
[0030]
表示设定周期内企业实际用电量的均值。
[0031]
优选地,步骤4具体包括:
[0032]
步骤4.1,基于企业的不同用电容量下的月实际用电量时间序列,构建预测企业月用电量的模型,
[0033]
步骤4.2,对上述模型中的参数进行参数估计和参数检验。
[0034]
优选地,步骤4.1中,基于企业的不同用电容量下的月实际用电量时间序列,构建预测企业月用电量的u=u_q
×
u_x
×
u_s模型,该模型的形式表达如下:
[0035]
u=u_q
×
u_x
×
u_s
[0036]
式中:
[0037]
u为企业月用电量序列;
[0038]
u_q、u_x、u_s分别为y的趋势分量、季节周期分量序列和随机分量序列。
[0039]
优选地,步骤5中,以步骤1获得的“企业业务属性画像模型”得到的业务严格可比的企业集为样本,以企业用电稳定性以及企业用电增长趋势为x轴和y轴,以步骤3中获得的“企业用电稳定性模型”、步骤4中获得的“企业用电趋势模型”得到的具体企业的用电稳定性得分和用电增长预测值在上述坐标中标定企业的坐标,该坐标即为企业的电力成长分。
[0040]
本发明的第二方面提供了一种基于电力营销数据的中小企业成长性评估系统,运行所述的一种基于电力营销数据的中小企业成长性评估方法,包括:企业业务属性画像模块、电力大数据处理模块、企业用电稳定性模块、企业用电趋势模块和企业用电同业分位模块,其中:
[0041]
企业业务属性画像模块用于得到的业务可比的企业集;
[0042]
电力大数据处理模块用于得到企业实际用电量的时间序列;
[0043]
企业用电稳定性模块用于得到的具体企业的用电稳定性得分;
[0044]
企业用电趋势模块用于获得用电增长预测值;
[0045]
企业用电同业分位模块用于基于企业用电的稳定性和增长趋势,以同类企业为样本,形成二维的严格可比的企业成长分。
[0046]
本发明的有益效果在于,与现有技术相比,本发明的系统基于电力营销数据和工商数据,运用大数据处理技术和统计方法,对现有的用电量增长模型进行改进,提供了一种生成企业成长分的解决算法,以真实、实时地反映企业的成长性,克服了当前企业成长分模型存在的主观、有时滞等问题。首先,本方法的主要数据源是企业用电数据,相对于企业运营数据和财务数据,真实性和实时性更强,有利于真实、动态反映企业的成长性;其次,综合电力营销数据中的行业分类和基于nlp处理后的企业业务画像,通过聚类算法对企业进行分类,确保企业之间相关数据的严格可比;第三,本方法从用电的稳定性和用电的增长趋势两个方面去综合反映企业用电的成长性,克服了之前主要依靠专家经验的企业成长分模型过于主观的问题。
附图说明
[0047]
图1为企业成长分生成流程图。
具体实施方式
[0048]
下面结合附图对本技术作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本技术的保护范围。
[0049]
如图1所示,本发明的实施例1提供了一种基于电力营销数据的中小企业成长性评估方法,包括以下步骤:
[0050]
步骤1,建立企业业务属性画像模型,得到业务可比的企业集。在本发明进一步优选但非限制性的实施方式中,步骤1具体包括:
[0051]
步骤1.1,采集数据:获取电力营销数据、工商数据中的企业基本信息、行业分类和经营范围,具体包括如下字段:企业名称、经营地址、企业纳税人识别号、企业主名称、企业
主身份证、注册资本、经营年限、所在行业、经营范围等;其中行业包括:门类、大类、中类。
[0052]
步骤1.2,基于企业工商数据中的经营范围文本,通过神经网络分词算法,提取企业的业务关键词。例如但不限于,nlp和聚类等方法。
[0053]
步骤1.3,对于一个行业下所有企业,确定任意两家企业之间业务可比的程度。在本发明进一步优选但非限制性的实施方式中,步骤1.3具体包括:
[0054]
步骤1.3.1,一个行业下所有企业的业务关键词集合构成一个由二元变量构成的向量空间,每一个企业都是这个空间中的一个具体映射。具体地,以a表示x、y两家企业均有某个业务,b、c表示x、y在某个业务上均只出现一次,d表示某个业务x、y两家企业均无,建立下表,
[0055][0056]
步骤1.3.2,对这个空间中的两两企业建立列联表,通过列联表计算两家企业之间的业务距离d。具体地,以如下公式表示两家企业之间的业务距离d,
[0057][0058]
其中,d(x,y)表示x、y两家企业之间的业务距离。
[0059]
步骤1.3.3,d值越小表示两家企业之间的业务距离越小,从而可通过d值的取值范围确定两家企业之间业务可比的程度。当d(x,y)《0.2时两家企业之间越可被视为严格可比的企业。
[0060]
步骤2,建立电力大数据处理模块。汇总企业用电数据形成企业月用电时间序列。在本发明进一步优选但非限制性的实施方式中,步骤2具体包括:
[0061]
根据企业证件号及与之关联的企业用电账户及与之关联的计量点,汇总企业的日实际用电量,在此基础上形成企业的月实际用电量时间序列。
[0062]
步骤3,建立企业用电稳定性模型。在本发明进一步优选但非限制性的实施方式中,步骤3具体包括:
[0063]
使用离散系数计算设定企业不同容量下日实际用电量在不同周期下的离散情况,在计算σ时分别计算全部历时数据的离散系数和均值以下数据的离散系数。具体地,以如下公式进行计算,
[0064][0065]
式中:
[0066]vs
表示设定周期内企业实际用电的离散系数,
[0067]
σ表示设定周期内企业实际用电量的方差,
[0068]
表示设定周期内企业实际用电量的均值。
[0069]
步骤4,建立企业用电趋势模型。考虑到企业用电的趋势性、周期性和随机性,改进基础的arima,得到u=u_q
×
u_x
×
u_s企业月用电量预测模型来企业的月用电增长时序函数。在本发明进一步优选但非限制性的实施方式中,步骤4具体包括:
[0070]
步骤4.1,基于企业的不同用电容量下的月实际用电量时间序列,构建预测企业月用电量的u=u_q
×
u_x
×
u_s模型,该模型的形式表达如下:
[0071]
u=u_q
×
u_x
×
u_s
[0072]
式中:
[0073]
u为企业月用电量序列;
[0074]
u_q、u_x、u_s分别为u的趋势分量、季节周期分量序列和随机分量序列。
[0075]
其中,趋势分量部分的形式表达如下:
[0076][0077]
u_q
t
为月用电量趋势分量序列,
[0078]
d为差分次数,
[0079]
b为滞后算子,即bk×
u_q
t
=u_q
t-k

[0080]
ω
t
为月用电量趋势分量经d次差分后形成的平稳序列,
[0081]
c为常数,
[0082]
为自回归系数,p为自回归阶数,
[0083]
θ1,θ2,

,θq为移动平均系数,q为移动平均阶数,
[0084]
ε
t
为均值为0、方差为σ2的白噪声序列。
[0085]
其中,季节周期分量的形式表达如下:
[0086][0087]
为第i年第j月的月用电量季节周期分量;
[0088]
其中,随机分量的形式表达如下:
[0089][0090]
式中:
[0091]
u_s
i,j
为第i年第j月的企业月用电量随机分量。
[0092]
步骤4.2,对上述模型中的参数进行参数估计和参数检验。进一步地,步骤4.2包括
[0093]
步骤4.2.1,对趋势分量模型进行参数估计和检验的步骤如下:
[0094]
平稳性检验。用adf检验法对u_q中的d阶差分序列依次进行平稳性检验,直到序列平稳,确定此时对应的差分次数d;
[0095]
模型定阶(确定阶数p和q)。根据p和q的截尾和拖尾性质确定arima模型的阶数p和q;
[0096]
参数估计。用最小二乘法估计模型中除了p,d,q以外的其它参数;
[0097]
模型检验。检验所建模型的残差序列ε是否为白噪声序列。这一过程仍以自相关系数和偏自相关系数为基础,若在k期滞后的自相关和偏自相关系数均趋于0,表明残差序列为白噪声序列,转步骤5;否则,为非白噪声序列,返回步骤2重新建构模型;
[0098]
预测。得到合适模型后,应用模型预测未来一期的企业月用电量趋势分量步骤4.2.2,对季节周期分量模型进行参数估计和检验的步骤如下:
[0099]
按照“远小近大”的原则对历史季节周期同期值赋予一定的权重并求和,其计算值作为当期月用电量的季节周期分量。α为加权系数,该系数的取值当季节周期分量波动不大时,在0.1-0.5之间取值,否则在0.6-0.8之间取值。
[0100]
步骤4.2.3,对随机分量模型进行参数估计和检验的步骤如下:本发明对历史随机分量同期值取平均,其值作为当期月售电量的随机分量。
[0101]
步骤5,建立企业用电同业分位模型,基于企业用电的稳定性和增长趋势,以同类企业为样本,形成二维的严格可比的企业成长分。具体地,以步骤1获得的“企业业务属性画像模型”得到的业务严格可比的企业集为样本,以企业用电稳定性以及企业用电增长趋势为x轴和y轴,以步骤3中获得的“企业用电稳定性模型”、步骤4中获得的“企业用电趋势模型”得到的具体企业的用电稳定性得分和用电增长预测值在上述坐标中标定企业的坐标,该坐标即为企业的电力成长分。
[0102]
本发明的实施例2提供了一种基于电力营销数据的中小企业成长性评估系统,运行所述的一种基于电力营销数据的中小企业成长性评估方法,包括:企业业务属性画像模块、电力大数据处理模块、企业用电稳定性模块、企业用电趋势模块和企业用电同业分位模块,其中:
[0103]
企业业务属性画像模块用于得到的业务可比的企业集;
[0104]
电力大数据处理模块用于以多维度电力数据划分评估指标体系;
[0105]
企业用电稳定性模块用于得到的具体企业的用电稳定性得分;
[0106]
企业用电趋势模块用于获得用电增长预测值;
[0107]
企业用电同业分位模块用于基于企业用电的稳定性和增长趋势,以同类企业为样本,形成二维的严格可比的企业成长分。
[0108]
在此本发明提供一个预测企业月用电量的算例,以证实其在预测企业月用电量上的优越性。
[0109]
一个企业的近10年月用电量如下:
[0110][0111]
基于上述数据,使用eviews软件,利用三种模型(基础的arima模型-方案1、季节性arima模型-方案2、本发明提供的模型-方案3),得到的2020年该企业月度用电量的预测结果如下:
[0112][0113]
从结果可以看出,本发明提供的模型比当前的模型有更好的预测效果。
[0114]
本发明的有益效果在于,与现有技术相比,本发明的系统基于电力营销数据和工商数据,运用大数据处理技术和统计方法,对现有的用电量增长模型进行改进,提供了一种生成企业成长分的解决算法,以真实、实时地反映企业的成长性,克服了当前企业成长分模型存在的主观、有时滞等问题。首先,本方法的主要数据源是企业用电数据,相对于企业运营数据和财务数据,真实性和实时性更强,有利于真实、动态反映企业的成长性;其次,综合电力营销数据中的行业分类和基于nlp处理后的企业业务画像,通过聚类算法对企业进行分类,确保企业之间相关数据的严格可比;第三,本方法从用电的稳定性和用电的增长趋势两个方面去综合反映企业用电的成长性,克服了之前主要依靠专家经验的企业成长分模型过于主观的问题。
[0115]
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1