基于神经网络算法的企业特性分类计算方法及系统与流程

文档序号:15637090发布日期:2018-10-12 21:36阅读:165来源:国知局

本发明涉及企业特性分类方法,更具体地说是指基于神经网络算法的企业特性分类计算方法及系统。



背景技术:

企业发展是指企业面对未来未知环境的适应,使企业得以进一步运行,实现企业目标。对于企业发展过程中,需要对企业的发展进行评价,以增大投资者的投资力度。

现有的企业发展评价一般是由人为根据经验对企业资源以及特性数据进行区分归类,根据归类后的结果进行评价,但是当前的这种评价方式存在以下问题:一是仅考虑基于企业资源对于企业发展的影响,静态且缺乏系统性;二是仅限于对企业发展的定性考虑,没有量化,且过于泛泛缺乏逻辑性;三是对企业的评价特性太多,无法正确区分并且归类;工作量太大,且准确率也比较低,从而造成企业发展评价不准确。

因此,有必要设计一种新的企业特性分类计算方法,实现综合考虑企业静态资源和企业动态能力,评价结果更全面和可信,应用方便,效率高,分类的颗粒度精细,描绘和评价的准确性增加。



技术实现要素:

本发明的目的在于克服现有技术的缺陷,提供基于神经网络算法的企业特性分类计算方法及系统。

为实现上述目的,本发明采用以下技术方案:基于神经网络算法的企业特性分类计算方法,所述方法包括:

获取目标企业的动态信息;

从动态信息中拆分出企业资源和企业能力,形成企业相关特性数据;

使用机器学习技术以及神经网络算法对企业相关特性数据进行挖掘、分类;

建立基础数据数据库;

存储分类后的企业相关特性数据。

其进一步技术方案为:从动态信息中拆分出企业资源和企业能力,形成企业相关特性数据的步骤,所述企业资源包括有形资源、无形资源以及人力资源,所述企业能力包括研发能力、营销能力、财务能力、组织管理能力以及生产管理能力中至少一个。

其进一步技术方案为:使用机器学习技术以及神经网络算法对企业相关特性数据进行挖掘、分类的步骤,包括以下具体步骤:

使用机器学习技术对企业相关特性数据进行挖掘;

对挖掘后的企业相关特性数据进行神经网络算法的分类。

其进一步技术方案为:对挖掘后的企业相关特性数据进行神经网络算法的分类的步骤,包括以下具体步骤:

针对挖掘后的每一个企业相关特性数据获取神经元节点的输入值;

根据神经元节点的输入值获取挖掘后的每一个企业相关特性数据的误差值以及系统误差值;

判断误差值以及系统误差值是否满足设定条件;

若是,则获取神经元节点的输出值,形成分类结果;

若否,则计算挖掘后的每一个企业相关特性数据的各层节点输出偏差,进行误差反向传播,修改网络连接权值和阈值,并返回所述针对挖掘后的每一个企业相关特性数据获取神经元节点的输入值的步骤。

其进一步技术方案为:存储分类后的企业相关特性数据的步骤,具体是使用大数据hdfs技术分布式将分类后的企业相关特性数据存储于基础数据库内。

本发明还提供了基于神经网络算法的企业特性分类计算系统,包括信息获取单元、拆分单元、处理单元、建立单元以及存储单元;

所述信息获取单元,用于获取目标企业的动态信息;

所述拆分单元,用于从动态信息中拆分出企业资源和企业能力,形成企业相关特性数据;

所述处理单元,用于使用机器学习技术以及神经网络算法对企业相关特性数据进行挖掘、分类;

所述建立单元,用于建立基础数据数据库;

所述存储单元,用于存储分类后的企业相关特性数据。

其进一步技术方案为:所述处理单元包括挖掘模块以及分类模块;

所述挖掘模块,用于使用机器学习技术对企业相关特性数据进行挖掘;

所述分类模块,用于对挖掘后的企业相关特性数据进行神经网络算法的分类。

其进一步技术方案为:所述分类模块包括输入值获取子模块、误差值获取子模块、判断子模块、输出值获取子模块以及调整子模块;

所述输入值获取子模块,用于针对挖掘后的每一个企业相关特性数据获取神经元节点的输入值;

所述误差值获取子模块,用于根据神经元节点的输入值获取挖掘后的每一个企业相关特性数据的误差值以及系统误差值;

所述判断子模块,用于判断误差值以及系统误差值是否满足设定条件;

所述输出值获取子模块,用于若是,则获取神经元节点的输出值,形成分类结果;

所述调整子模块,用于若否,则计算挖掘后的每一个企业相关特性数据的各层节点输出偏差,进行误差反向传播,修改网络连接权值和阈值。

本发明与现有技术相比的有益效果是:本发明的基于神经网络算法的企业特性分类计算方法,通过对获取的目标企业动态信息进行拆分,再对拆分后的数据进行挖掘和分类,拆分过程中会从企业资源和企业能力入手,则综合考虑企业静态资源和企业动态能力,评价结果更全面和可信,采用神经网络分类方式,应用方便,效率高,拆分的颗粒越精细,分类的颗粒度精细,描绘和评价的准确性增加。

下面结合附图和具体实施例对本发明作进一步描述。

附图说明

图1为本发明具体实施例提供的基于神经网络算法的企业特性分类计算方法的流程图;

图2为本发明具体实施例提供的使用机器学习技术以及神经网络算法对企业相关特性数据进行挖掘、分类的流程图;

图3为本发明具体实施例提供的对挖掘后的企业相关特性数据进行神经网络算法的分类的流程图;

图4为本发明具体实施例提供的神经网络算法的模型示意图;

图5为本发明具体实施例提供的分类计算企业特性的表格;

图6为本发明具体实施例提供的基于神经网络算法的企业特性分类计算系统的结构框图;

图7为本发明具体实施例提供的处理单元的结构框图;

图8为本发明具体实施例提供的分类模块的结构框图。

具体实施方式

为了更充分理解本发明的技术内容,下面结合具体实施例对本发明的技术方案进一步介绍和说明,但不局限于此。

如图1~8所示的具体实施例,本实施例提供的基于神经网络算法的企业特性分类计算方法,可以运用在企业特性的归类和分析过程中,实现综合考虑企业静态资源和企业动态能力,评价结果更全面和可信,应用方便,效率高,分类的颗粒度精细,描绘和评价的准确性增加。

如图1所示,本实施例提供了基于神经网络算法的企业特性分类计算方法,该方法包括:

s1、获取目标企业的动态信息;

s2、从动态信息中拆分出企业资源和企业能力,形成企业相关特性数据;

s3、使用机器学习技术以及神经网络算法对企业相关特性数据进行挖掘、分类;

s4、建立基础数据数据库;

s5、存储分类后的企业相关特性数据。

对于上述的s1步骤,具体是采用网络爬虫的技术,对于目标企业,在互联网上收集所有动态信息,包括但不限于各类新闻报道、公司公告等,覆盖企业各个阶段的所有方面的网络信息。

对于上述的s2步骤,从动态信息中拆分出企业资源和企业能力,形成企业相关特性数据的步骤,所述企业资源包括有形资源、无形资源以及人力资源,所述企业能力包括研发能力、营销能力、财务能力、组织管理能力以及生产管理能力中至少一个。具体地,上述的有形资源包括物质和财务等,无形资源包括品牌、技术、商标、企业文化等,人力资源包括成员背景和决策活动等。企业能力主要体现配置资源的能力,比如研发能力、营销能力、财务能力、组织管理能力、生产管理能力等维度。

综合考虑企业静态资源和企业动态能力,评价结果更全面和可信。随着对于资源和能力拆分的颗粒度越来越精细,描绘和评价的准确性会指数型增加。

更进一步地,对于上述的s3步骤,使用机器学习技术以及神经网络算法对企业相关特性数据进行挖掘、分类的步骤,包括以下具体步骤:

s31、使用机器学习技术对企业相关特性数据进行挖掘;

s32、对挖掘后的企业相关特性数据进行神经网络算法的分类。

对于上述的s31步骤,主要是对企业相关特性数据进行训练,建立训练集,使用训练集进行机器学习,保证训练集指标的可靠性和准确性,从而挖掘企业相关特性数据,去除无关数据。

优选地,对于上述的s32步骤,对挖掘后的企业相关特性数据进行神经网络算法的分类的步骤,包括以下具体步骤:

s321、针对挖掘后的每一个企业相关特性数据获取神经元节点的输入值;

s322、根据神经元节点的输入值获取挖掘后的每一个企业相关特性数据的误差值以及系统误差值;

s323、判断误差值以及系统误差值是否满足设定条件;

若是,则s324、获取神经元节点的输出值,形成分类结果;

若否,则s325、计算挖掘后的每一个企业相关特性数据的各层节点输出偏差,进行误差反向传播,修改网络连接权值和阈值,并返回所述s321步骤。

上述的神经网络算法大多为bp网络(backpropagationnetwork,bp),即反向传播学习算法[14、30]。它通常是由三层相同的一系列神经元构成的层状网络,底层为输入层,中间为隐含层,顶层为输出层,如图5所示,信号在相邻各层间逐层传递,不相邻的各层间无联系。

对于上述的s321步骤至s325步骤而言,设有k个学习样本(学习样本为企业相关特性数据),第p(p=1,2,…,k)个样本有输入(xp1,xp2,xp3,…,xpn)和输出(tp1,tp2,tp3,…,tpn),神经元节点j的输入为:对于第一隐含层,qpi=xpj,神经元节点j的输出为:其中,wji为节点i与j之间的连接权值,θj为节点j的阈值,f为非线性转移函数(激活函数),一般选择为sigmoid函数,其中,计算一个神经元的输出的方法和计算一个感知器的输出是一样的,该采用平方型误差函数计算单个样本误差ep和系统误差e,其中,其中,ypj为第p个样本在输出层节点j的网络输出值,tpj为第p个样本在输出层节点j的教师值;若和e都小于允许的误差,则学习过程结束,否则计算各层节点的输出偏差,进行误差反向传播,修改网络连接权值和阈值。

对于输出层节点,其偏差为:δpj=ypj(1-ypj)(tpj-ypj);对于隐含层节点,其偏差为:权值和阈值修正量分别为:δwji(t+1)=ηδpjopj+αδwji(t)和δθj(t+1)=ηδpj+αδθj(t),其中,η为学习速率,取值为0.01至0.99,α为惯性因子,取值为0.6左右,t为网络迭代步数;网络连接权值和节点阈值,经过上述过程的反复修正,逐渐趋于稳定的值。神经网络算法能够明显的提高分类精度。

对于上述的s5步骤,存储分类后的企业相关特性数据的步骤,具体是使用大数据hdfs技术分布式将分类后的企业相关特性数据存储于基础数据库内。

举个例子,如图5所示,使用的基础数据是企业特性数据,假如企业特性数据集包含150种企业特性的信息,每50种取自三个企业特性分类之一:研发、营销、财务、组织管理、生产管理;每个企业特性的特征用9种属性描述:(1)生命周期、(2)市场、(3)计算、(4)产品、(5)客户、(6)组织、(7)资金、(8)服务、(9)管理文化。

r的nnet包中的nnet函数隐层只含一个感知器,激活函数有多种。在企业特性的分类中,激活函数使用的是线性函数,在隐层感知器的人工神经元分别设size=1,2,3,4时,分类结果为如下表所示:

size=1:

size=2,3,4:

以下为r中神经网络计算程序,人工神经网络的包为nnet。

#ir是只含有生命周期、市场、客户、组织、资金、服务、管理文化的数据,用于分类;

将神经网络算法集成在一个分类器内,输入需要分类的企业特性,则可获取分类结果,应用方便,获得结果较快较好。

上述的基于神经网络算法的企业特性分类计算方法,通过对获取的目标企业动态信息进行拆分,再对拆分后的数据进行挖掘和分类,拆分过程中会从企业资源和企业能力入手,则综合考虑企业静态资源和企业动态能力,评价结果更全面和可信,采用神经网络分类方式,应用方便,效率高,拆分的颗粒越精细,分类的颗粒度精细,描绘和评价的准确性增加。

如图6所示,本实施例还提供了基于神经网络算法的企业特性分类计算系统,其包括信息获取单元1、拆分单元2、处理单元3、建立单元4以及存储单元5。

信息获取单元1,用于获取目标企业的动态信息。具体是采用网络爬虫的技术,对于目标企业,在互联网上收集所有动态信息,包括但不限于各类新闻报道、公司公告等,覆盖企业各个阶段的所有方面的网络信息。

拆分单元2,用于从动态信息中拆分出企业资源和企业能力,形成企业相关特性数据。所述企业资源包括有形资源、无形资源以及人力资源,所述企业能力包括研发能力、营销能力、财务能力、组织管理能力以及生产管理能力中至少一个。具体地,上述的有形资源包括物质和财务等,无形资源包括品牌、技术、商标、企业文化等,人力资源包括成员背景和决策活动等。企业能力主要体现配置资源的能力,比如研发能力、营销能力、财务能力、组织管理能力、生产管理能力等维度。

综合考虑企业静态资源和企业动态能力,评价结果更全面和可信。随着对于资源和能力拆分的颗粒度越来越精细,描绘和评价的准确性会指数型增加。

处理单元3,用于使用机器学习技术以及神经网络算法对企业相关特性数据进行挖掘、分类。

建立单元4,用于建立基础数据数据库。

存储单元5,用于存储分类后的企业相关特性数据。

更进一步地,上述的处理单元3包括挖掘模块31以及分类模块32。

挖掘模块31,用于使用机器学习技术对企业相关特性数据进行挖掘。主要是对企业相关特性数据进行训练,建立训练集,使用训练集进行机器学习,保证训练集指标的可靠性和准确性,从而挖掘企业相关特性数据,去除无关数据。

分类模块32,用于对挖掘后的企业相关特性数据进行神经网络算法的分类。

优选地,对于上述的分类模块32包括输入值获取子模块321、误差值获取子模块322、判断子模块323、输出值获取子模块324以及调整子模块325。

输入值获取子模块321,用于针对挖掘后的每一个企业相关特性数据获取神经元节点的输入值。

误差值获取子模块322,用于根据神经元节点的输入值获取挖掘后的每一个企业相关特性数据的误差值以及系统误差值。

判断子模块323,用于判断误差值以及系统误差值是否满足设定条件。

输出值获取子模块324,用于若是,则获取神经元节点的输出值,形成分类结果。

调整子模块325,用于若否,则计算挖掘后的每一个企业相关特性数据的各层节点输出偏差,进行误差反向传播,修改网络连接权值和阈值。

上述的神经网络算法大多为bp网络(backpropagationnetwork,bp),即反向传播学习算法[14、30]。它通常是由三层相同的一系列神经元构成的层状网络,底层为输入层,中间为隐含层,顶层为输出层,如图5所示,信号在相邻各层间逐层传递,不相邻的各层间无联系。

设有k个学习样本(学习样本为企业相关特性数据),第p(p=1,2,…,k)个样本有输入(xp1,xp2,xp3,…,xpn)和输出(tp1,tp2,tp3,…,tpn),神经元节点j的输入为:对于第一隐含层,qpi=xpj,神经元节点j的输出为:其中,wji为节点i与j之间的连接权值,θj为节点j的阈值,f为非线性转移函数(激活函数),一般选择为sigmoid函数,其中,计算一个神经元的输出的方法和计算一个感知器的输出是一样的,该采用平方型误差函数计算单个样本误差ep和系统误差e,其中,其中,ypj为第p个样本在输出层节点j的网络输出值,tpj为第p个样本在输出层节点j的教师值;若和e都小于允许的误差,则学习过程结束,否则计算各层节点的输出偏差,进行误差反向传播,修改网络连接权值和阈值。

对于输出层节点,其偏差为:δpj=ypj(1-ypj)(tpj-ypj);对于隐含层节点,其偏差为:权值和阈值修正量分别为:δwji(t+1)=ηδpjopj+αδwji(t)和δθj(t+1)=ηδpj+αδθj(t),其中,η为学习速率,取值为0.01至0.99,α为惯性因子,取值为0.6左右,t为网络迭代步数;网络连接权值和节点阈值,经过上述过程的反复修正,逐渐趋于稳定的值。神经网络算法能够明显的提高分类精度。

对于上述的存储单元5具体是使用大数据hdfs技术分布式将分类后的企业相关特性数据存储于基础数据库内。

举个例子,如图5所示,使用的基础数据是企业特性数据,假如企业特性数据集包含150种企业特性的信息,每50种取自三个企业特性分类之一:研发、营销、财务、组织管理、生产管理;每个企业特性的特征用9种属性描述:(1)生命周期、(2)市场、(3)计算、(4)产品、(5)客户、(6)组织、(7)资金、(8)服务、(9)管理文化。

r的nnet包中的nnet函数隐层只含一个感知器,激活函数有多种。在企业特性的分类中,激活函数使用的是线性函数,在隐层感知器的人工神经元分别设size=1,2,3,4时,分类结果为如下表所示:

size=1:

size=2,3,4:

以下为r中神经网络计算程序,人工神经网络的包为nnet。

#ir是只含有生命周期、市场、客户、组织、资金、服务、管理文化的数据,用于分类;

将神经网络算法集成在一个分类器内,输入需要分类的企业特性,则可获取分类结果,应用方便,获得结果较快较好。

上述的基于神经网络算法的企业特性分类计算系统,通过对获取的目标企业动态信息进行拆分,再对拆分后的数据进行挖掘和分类,拆分过程中会从企业资源和企业能力入手,则综合考虑企业静态资源和企业动态能力,评价结果更全面和可信,采用神经网络分类方式,应用方便,效率高,拆分的颗粒越精细,分类的颗粒度精细,描绘和评价的准确性增加。

上述仅以实施例来进一步说明本发明的技术内容,以便于读者更容易理解,但不代表本发明的实施方式仅限于此,任何依本发明所做的技术延伸或再创造,均受本发明的保护。本发明的保护范围以权利要求书为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1