基于全媒体大数据技术的海外投资风险评估方法及系统与流程

文档序号:16790931发布日期:2019-02-01 19:37阅读:415来源:国知局
基于全媒体大数据技术的海外投资风险评估方法及系统与流程

本发明涉及境外投资风险评估及预警领域,特别是涉及一种基于全媒体大数据技术的海外投资风险评估方法及系统。



背景技术:

统计数据显示,截至2016年末,中国大陆2.44万家境内投资者在全球190个国家设立境外企业3.72万家,境外企业资产总额5万亿美元,当年对外直接投资流量1961.5亿美元,同比增长34.7%。但我国企业的境外投资决策具有很强的盲目性,往往只看到境外国家的市场商机和优惠政策,而对该国的政治经济、社会文化、自然生态、法律法规、金融税务等投资环境缺乏全面深入的调研和分析,对其中蕴含的复杂风险因素缺乏理性认识和有效防范,加之战争动乱、恐怖活动、反华势力等不利影响,使近年来我国海外投资项目遭受重大损失的案例时有发生。

海外投资风险衍生途径多种多样,各种情报信息纷繁复杂,海外投资风险的量化评估难度呈几何级数增长。“大数据”作为一种新兴的数据处理技术与认知思维,被认为是决策支持的有力工具。因此迫切需要利用大数据、云计算、智能识别等技术手段,整合各类数据资源,打造一个海外投资风险智能检测、识别、预测、预警平台,快速、准确、全面地感知境外国家投资风险,强化企业境外投资的风险防控能力,减少因信息不对称和决策不科学造成的经济损失。



技术实现要素:

为了解决现有技术中的上述问题,即为了解决风险投资信息不全面,提高投资准确性,本发明提供了一种基于全媒体大数据技术的海外投资风险评估方法及系统。

一种基于全媒体大数据技术的海外投资风险评估方法,所述评估方法包括:

通过云计算和网络爬虫方法,获取海外投资国家的历史投资数据,作为训练样本;

对所述训练样本进行归一化处理,得到历史风险量化指标;

根据所述历史风险量化指标,建立风险预测模型;

监测待投资国家的当前风险投资数据;

对所述当前风险投资数据进行归一化处理,得到当前风险量化指标;

基于所述风险预测模型及所述当前风险量化指标,确定对所述待投资国家的投资风险情况。

可选的,所述对所述训练样本进行归一化处理,得到历史风险量化指标,具体包括:

将训练样本划分成8个维度和54个二级指标;

将各二级指标的数据进行归一化,得到[0,1]之间的无量纲数值。

可选的,根据以下公式进行归一化处理:

其中,xi为训练样本中第i个二级指标数值,为训练样本中该指标出现的最小值,为训练样本中该指标出现的最大值,x′i为归一化后的指标值,i=1,2,…54。

可选的,所述风险预测模型包括输入层、隐藏层及输出层;其中,

所述输入层用于接收历史风险量化指标或当前风险量化指标;

所述隐藏层用于基于深度神经网络构建,所述隐藏层包括a层,a≥1,每一层为卷积层、激活函数层、池化层、长短期记忆网络lstm层及全连接层中任意一者;

所述输出层用于输出风险来源及风险评估等级。

可选的,所述风险来源分为8个,分别为社会政治、经济金融、商业环境、法律政策、产业、自然环境、自然资源及生态;

风险评估等级分为5级,分别为无风险、轻度风险、中度风险、重度风险、极度风险。

可选的,所述评估方法还包括:

分析所述风险预测模型,确定所述风险预测模型是否符合要求,如果不符合要求,则修正所述风险预测模型。

可选的,所述分析所述风险预测模型,确定所述风险预测模型是否符合要求,具体包括:

随机选取第k个训练样本x(k)、对应期望输出d(k)及实际输出y(k);其中,

x(k)=(x1(k),x2(k),x3(k),...,xn(k));

d(k)=(d1(k),d2(k),d3(k),...,dn(k));

n=1,2,…,i,xn(k)表示第k个训练样本中第n个指标值;dn(k)表示xn(k)对应的期望输出;

基于计算全局误差e,其中,m表示训练样本数量;

比较所述全局误差e与预设的误差阈值的大小,确定所述风险预测模型是否符合要求。

可选的,所述修正所述风险预测模型,具体包括:

利用隐藏层到输出层的连接权值、输出层的δo(k)和隐藏层的输出,计算误差函数对隐藏层的各神经元的偏导数δh(k);

利用输出层的各神经元的δo(k)和隐含层各神经元的输出,修正连接权值ωho(k);

利用输出层各神经元的δo(k)和隐含层各神经元的输出来,修正输出层阈值to(k);

提取第(k+1)个训练样本、对应期望输出及实际输出,重新分析所述风险预测模型,直至全局误差小于预设的误差阈值或学习次数大于预设的学习次数最大值,则结束修正。

可选的,所述修正所述风险预测模型,还包括:

预先设定各隐藏层的连接权值及偏置,并分别赋一个区间(-1,1)内的随机数,设定误差函数e,误差阈值和学习次数最大值m。

为解决上述技术问题,本发明还提供了如下方案:

一种基于全媒体大数据技术的海外投资风险评估系统,所述评估系统包括:

获取单元,用于通过云计算和网络爬虫方法,获取海外投资国家的历史投资数据,作为训练样本;

第一处理单元,用于对所述训练样本进行归一化处理,得到历史风险量化指标;

建模单元,用于根据所述历史风险量化指标,建立风险预测模型;

监测单元,用于监测待投资国家的当前风险投资数据;

第二处理单元,用于对所述当前风险投资数据进行归一化处理,得到当前风险量化指标;所述建模单元还用于基于所述风险预测模型及所述当前风险量化指标,确定对所述待投资国家的投资风险情况。

根据本发明的实施例,本发明公开了以下技术效果

本发明通过云计算和网络爬虫方法,全面获取海外投资国家的历史投资数据,并进行归一化处理,得到历史风险量化指标,进而建立风险预测模,实时监测待投资国家的当前风险投资数据,基于所述风险预测模型,确定对所述待投资国家的投资风险情况,提高投资的准确性。

附图说明

图1是本发明基于全媒体大数据技术的海外投资风险评估方法的流程图;

图2是风险预测模型的模型结构示意图;

图3是本发明基于全媒体大数据技术的海外投资风险评估方法的具体实施例示意图;

图4是本发明基于全媒体大数据技术的海外投资风险评估系统的模块结构示意图。

符号说明:

获取单元—1,第一处理单元—2,建模单元—3,监测单元—4,第二处理单元—5。

具体实施方式

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是,这些实施方式仅仅用于解释本发明的技术原理,并非旨在限制本发明的保护范围。

本发明的目的是提供一种基于全媒体大数据技术的海外投资风险评估方法,通过云计算和网络爬虫方法,全面获取海外投资国家的历史投资数据,并进行归一化处理,得到历史风险量化指标,进而建立风险预测模,实时监测待投资国家的当前风险投资数据,基于所述风险预测模型,确定对所述待投资国家的投资风险情况,提高投资的准确性。

如图1所示,本发明基于全媒体大数据技术的海外投资风险评估方法包括:

步骤100:通过云计算和网络爬虫方法,获取海外投资国家的历史投资数据,作为训练样本;

步骤200:对所述训练样本进行归一化处理,得到历史风险量化指标;

步骤300:根据所述历史风险量化指标,建立风险预测模型;

步骤400:监测待投资国家的当前风险投资数据;

步骤500:对所述当前风险投资数据进行归一化处理,得到当前风险量化指标;

步骤600:基于所述风险预测模型及所述当前风险量化指标,确定对所述待投资国家的投资风险情况。

其中,在步骤200中,所述对所述训练样本进行归一化处理,得到历史风险量化指标,具体包括:

步骤201:将训练样本划分成8个维度和54个二级指标(如表1所示);

步骤202:将各二级指标的数据进行归一化,得到[0,1]之间的无量纲数值。

表1

可根据公式(1)进行归一化处理:

其中,xi为训练样本中第i个二级指标数值,为训练样本中该指标出现的最小值,为训练样本中该指标出现的最大值,x′i为归一化后的指标值,i=1,2,…54。

进一步地,所述风险预测模型包括输入层、隐藏层及输出层(如图2所示)。

其中,所述输入层用于接收历史风险量化指标或当前风险量化指标;所述隐藏层用于基于深度神经网络构建,所述隐藏层包括a层,a≥1,每一层为卷积层、激活函数层、池化层、长短期记忆网络lstm层及全连接层中任意一者;所述输出层用于输出风险来源及风险评估等级。

(1)卷积层:

卷积层是将输入与指定的模板滤波器进行卷积,从而得到对于输入矩阵的全面性表征。具体公式如下:

其中,g(i,j)为卷积后对应输出的一个点的值,f(i,j)为输入数据中对应元素,h(i,j)为卷积模板滤波器对应位置的元素。

(2)激活函数层:

在卷积层中,每一层输出都是上层输入的线性函数。因此,为了实现非线性变换,引入非线性函数作为激活函数层的基础,这样深层神经网络就具备了更好的拟合和表达能力。通常的激活函数为relu函数,sigmoid函数或者双曲函数。

relu函数:

relu函数是激活函数的一种,也是目前使用较为常见的一种激活函数,通过relu函数,可以完成数据转换,得到的数据结构大小不变,只需要一个阈值就可以得到激活值,而不用去算一大堆复杂的运算,其公式如下:

f(x)=max(0,x)(3)。

sigmoid函数:

sigmoid函数将一个实数输入映射到[0,1]范围内,故其在表征概率分布式时具有很好的性能,然而其参数收敛速度很慢,也会影响训练的效率,其公式如下:

双曲函数:

双曲函数将一个实数输入映射到[-1,1]范围内。当输入为0时,tanh函数输出为0,符合我们激活函数的基本要求。然而,tanh函数也可能存在梯度饱和问题。

(3)池化层:

池化层的主要作用是对数据进行压缩,一方面使数据的维数变小,简化神经网络计算复杂度;一方面进行特征压缩,提取主要特征。

(4)lstm层:

lstm是对于rnn(循环神经网络)的升级变体,这一方法使先前的信息与当前的任务得以联系,并使计算机可以处理输入和输出是不同长度序列这一类问题。对于t时刻的输入xt,可以通过以下的公式基于ht-1和xt连续地计算以下的变量:

其中,σ是元素级别的逻辑sigmoid函数,tanh是反三角函数,⊙是元素对应项乘法。wxf、whf、wxi、whi、wxg、whg分别表示门的权值矩阵中对应行列的元素,bf表示门的权值矩阵的第f列对应的斜率,bi表示门的权值矩阵的第i列对应的斜率,bg表示门的权值矩阵的第g列对应的斜率,ft,it和ot分别是遗忘门,输入门和输出门的输出。ct是细胞元状态值,ht是隐藏状态值,gt是计算新的ct的候选值。

(5)全连接层:

其作用为连接所有的特征,将输出值送给分类器。全连接层的目标函数选择softmax函数。softmax分类器是处理多类别分类任务的一种有效方法。与支持将输出f(xi,w)作为每个类别的(未校准且可能难以解释的)分数的svm不同,softmax分类器能够给出更为直观的输出,即归一化类别概率,可以用于描述样本属于对某个类别的概率,对样本进行模型化解释。在softmax分类器中,函数映射f(xi;w)=wxi保持不变,但将这些分数解释为对每个类别的非归一化对数概率,并使用具有以下形式的交叉熵来定义损失函数:

fj表示某一类分数f的第j个元素向量。如前所述,数据集的全部损失是li在所有训练样例上的均值以及正则化项r(w)。函数被称为softmax函数:它将一个任意实值分数的向量(在z中)压缩成一个介于0和1之间的向量值并满足总和为1。

所述风险来源分为8个,分别为社会政治、经济金融、商业环境、法律政策、产业、自然环境、自然资源及生态;

风险评估等级分为5级,分别为无风险、轻度风险、中度风险、重度风险、极度风险。

其中,变量y0、y1、y2、y3、y4、y5、y6、y7用来显示风险来源,输出编码与评估结果的对应关系如表2所示。当yi=0时,表示无对应的相关风险因素;当yi=1时,表示存在对应的相关风险因素。

表2

本发明将海外投资国家风险划分成五个等级,分别为无风险、轻度风险、中度风险、重度风险、极度风险。变量y8、y9、y10、y11用来显示风险预警等级,输出编码与评估结果的对应关系如表3所示:

表3

优选地,本发明基于全媒体大数据技术的海外投资风险评估方法,还包括:

分析所述风险预测模型,确定所述风险预测模型是否符合要求,如果不符合要求,则修正所述风险预测模型。

进一步地,所述分析所述风险预测模型,确定所述风险预测模型是否符合要求,具体包括:

随机选取第k个训练样本x(k)、对应期望输出d(k)及实际输出y(k);其中,

x(k)=(x1(k),x2(k),x3(k),...,xn(k));

d(k)=(d1(k),d2(k),d3(k),...,dn(k));

n=1,2,...,i,xn(k)表示第k个训练样本中第n个指标值;dn(k)表示xn(k)对应的期望输出;

基于计算全局误差e,其中,m表示训练样本数量;

比较所述全局误差e与预设的误差阈值的大小,确定所述风险预测模型是否符合要求。

可选的,所述修正所述风险预测模型,具体包括:

利用隐藏层到输出层的连接权值、输出层的δo(k)和隐藏层的输出,计算误差函数对隐藏层的各神经元的偏导数δh(k);

利用输出层的各神经元的δo(k)和隐含层各神经元的输出,修正连接权值ωho(k);

利用输出层各神经元的δo(k)和隐含层各神经元的输出来,修正输出层阈值to(k);

提取第(k+1)个训练样本、对应期望输出及实际输出,重新分析所述风险预测模型,直至全局误差小于预设的误差阈值或学习次数大于预设的学习次数最大值,则结束修正。

其中,所述修正所述风险预测模型,还包括:

预先设定各隐藏层的连接权值及偏置,并分别赋一个区间(-1,1)内的随机数,设定误差函数e,误差阈值和学习次数最大值m。

与现有技术相比,本发明采用定性分析与定量分析相结合的方法,在原有国家风险评估模型4个一级指标和18个二级指标的基础上,新增了4个一级指标和37个二级指标,使国家风险评估与预测更加完整精确。此外,本发明本研究综合运用了对外直接投资理论、国家风险相关理论以及风险投资预警相关理论,构建了一个基于深度神经网络的国家风险预警模型,并将此模型应用于我国海外直接投资国家风险评估和预测(如图3所示)。

如图4所示,本发明基于全媒体大数据技术的海外投资风险评估系统,包括获取单元1、第一处理单元2、建模单元3、监测单元4及第二处理单元5。

其中,所述获取单元1用于通过云计算和网络爬虫方法,获取海外投资国家的历史投资数据,作为训练样本。

所述第一处理单元2用于对所述训练样本进行归一化处理,得到历史风险量化指标。

所述建模单元3用于根据所述历史风险量化指标,建立风险预测模型。

所述监测单元4用于监测待投资国家的当前风险投资数据。

所述第二处理单元5用于对所述当前风险投资数据进行归一化处理,得到当前风险量化指标;所述建模单元还用于基于所述风险预测模型及所述当前风险量化指标,确定对所述待投资国家的投资风险情况。

相对于现有技术,本发明基于全媒体大数据技术的海外投资风险评估系统与上述基于全媒体大数据技术的海外投资风险评估方法的有益效果相同,在此不再赘述。

至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1