一种国际投资指数数据处理分析方法和系统的制作方法

文档序号:8544125阅读:424来源:国知局
一种国际投资指数数据处理分析方法和系统的制作方法
【技术领域】
[0001]本发明涉及计算机应用技术领域,特别涉及一种国际投资指数数据处理分析方法和系统。
【背景技术】
[0002]应用计算机技术对投资数据进行处理运算,以衡量投资可实施性,是目前计算机技术领域的一个重要分支。
[0003]而如何根据复杂多变的投资原始数据,得到较为准确的投资可实施性的预测结果,也是该领域研宄的一个重要课题。目前,对于投资数据进行量化处理并得到量化指标的工具较少,其中有的仅能在很小的领域范围内进行测算,应用范围较狭窄。

【发明内容】

[0004]本发明提供一种国际投资指数数据处理分析方法,以解决上述问题。
[0005]本发明实施例提供了一种国际投资指数数据处理分析方法,包括步骤:
[0006]步骤A,获取全局变量,读取待分析的包含各模块信息的文件;
[0007]步骤B,基于主成分分析法计算各模块主成分值并输出显示;
[0008]步骤C,将各模块中的变量传递给1git模型,求解各模块赋值结果并输出显示;
[0009]步骤D,根据所述主成分值和各模块赋值结果综合计算得出投资指数。
[0010]其中,所述步骤B包括步骤:
[0011]写入标准化数据;
[0012]计算相关系数矩阵以及特征值和特征向量;
[0013]计算载荷矩阵并归类,通过累计贡献率计算主成分值并输出显示。
[0014]其中,所述步骤B之后步骤C之前还包括步骤:
[0015]计算归约结果;
[0016]通过载荷矩阵对变量进行归类总结。
[0017]其中,所述步骤C包括步骤:
[0018]获取用户定义的每个模块的变量;
[0019]计算每个模块中传递给1git模型的变量;
[0020]求解1git模型,计算增长率得出赋值结果并输出显示。
[0021]其中,所述步骤A之前还包括步骤:
[0022]提示用户定义运算规则参数,包括定义EVA_Strategy为均值+/- —个标准差或者是否大于等于O ;定义Probit-1ogit模型分析时引入的变量个数Variable Number ;以及定义PCA Strategy为累计贡献度大于等于85%或者特征值大于I。
[0023]本发明还提供一种国际投资指数数据处理分析系统,包括读取数据模块、主成分分析模块、1git模型测算模块和结果输出模块;
[0024]读取数据模块,用于获取全局变量,读取待分析的包含各模块信息的文件;
[0025]主成分分析模块,用于基于主成分分析法计算各模块主成分值并输出显示;
[0026]1git模型测算模块,用于将各模块中的变量传递给1git模型,求解各模块赋值结果并输出显示;
[0027]结果输出模块,用于根据主成分值和各模块赋值结果综合计算得出投资指数。
[0028]其中主成分分析模块,用于:
[0029]写入标准化数据;计算相关系数矩阵以及特征值和特征向量;计算载荷矩阵并归类,通过累计贡献率计算主成分值并输出显示。
[0030]其中1git模型测算模块,用于:
[0031]计算归约结果;通过载荷矩阵对变量进行归类总结;获取用户定义的每个模块的变量;计算每个模块中传递给1git模型的变量;求解1git模型,计算增长率得出赋值结果并输出显不。
[0032]其中,还包括预定义模块;
[0033]所述预定义模块,用于提示用户定义运算规则参数,包括定义EVA_Strategy为均值+/_ —个标准差或者是否大于等于O ;定义Probit-1ogit模型分析时引入的变量个数Variable Number ;以及定义PCA Strategy为累计贡献度大于等于85%或者特征值大于I。
[0034]本发明实施例提供的一种国际投资指数数据处理分析方法,主要基于主成分分析和Probit-1ogit方法测算不同国家和地区国际投资的绩效估值,其适应性较强,应用范围广,且测算准确度相对较高。
【附图说明】
[0035]图1为本发明提供的国际投资指数数据处理分析方法的一个实施例的流程图;
[0036]图2为本发明实施例提供的国际投资指数数据处理分析系统的结构示意图;
[0037]图3为本发明实施例提供的启动程序后准备计算的操作界面;
[0038]图4为程序标准化数据的写入后的界面;
[0039]图5为显示政治模块和宏观经济模块的计算数值的界面;
[0040]图6为显示主成分分析法的各个模块的主成分值的概率结果之一的界面;
[0041]图7为显示概率法的模块I和模块2的赋值结果的界面;
[0042]图8为显示最终运算结果的界面。
【具体实施方式】
[0043]本发明实施例提供了一种国际投资指数数据处理分析方法,利用蒙特卡洛模拟和几何布朗运动理论推断国际投资数据中要素的波动率与投资收益和市场趋势正相关的原理,通过主成分分析和Probit-1ogit方法来测算各映射因子的权重和概率。
[0044]蒙特卡罗(Monte Carlo)方法,又称随机抽样或统计试验方法,传统的经验方法由于不能逼近真实的物理过程,很难得到满意的结果,而蒙特卡罗方法由于能够真实地模拟实际物理过程,故解决问题与实际非常符合,可以得到很圆满的结果。
[0045]其基本原理与思考:当所要求解的问题是某种事件出现的概率,或者是某个随机变量的期望值时,它们可以通过某种“试验”的方法,得到这种事件出现的频率,或者这个随机变数的平均值,并用它们作为问题的解。这就是蒙特卡罗方法的基本思想。蒙特卡罗方法通过抓住事物运动的几何数量和几何特征,利用数学方法来加以模拟,即进行一种数字模拟实验。它是以一个概率模型为基础,按照这个模型所描绘的过程,通过模拟实验的结果,作为问题的近似解。可以把蒙特卡罗解题归结为三个主要步骤:构造或描述概率过程;实现从已知概率分布抽样;建立各种估计量。
[0046]解题步骤:
[0047]I)构造或描述概率过程
[0048]对于本身就具有随机性质的问题,主要是正确描述和模拟这个概率过程,对于本来不是随机性质的确定性问题,比如计算定积分,就必须事先构造一个人为的概率过程,它的某些参量正好是所要求问题的解。即要将不具有随机性质的问题转化为随机性质的问题。
[0049]2)实现从已知概率分布抽样
[0050]构造了概率模型以后,由于各种概率模型都可以看作是由各种各样的概率分布构成的,因此产生已知概率分布的随机变量(或随机向量),就成为实现蒙特卡罗方法模拟实验的基本手段,这也是蒙特卡罗方法被称为随机抽样的原因。最简单、最基本、最重要的一个概率分布是(0,1)上的均匀分布(或称矩形分布)。随机数就是具有这种均匀分布的随机变量。随机数序列就是具有这种分布的总体的一个简单子样,也就是一个具有这种分布的相互独立的随机变数序列。产生随机数的问题,就是从这个分布的抽样问题。在计算机上,可以用物理方法产生随机数,但价格昂贵,不能重复,使用不便。另一种方法是用数学递推公式产生。这样产生的序列,与真正的随机数序列不同,所以称为伪随机数,或伪随机数序列。不过,经过多种统计检验表明,它与真正的随机数,或随机数序列具有相近的性质,因此可把它作为真正的随机数来使用。由已知分布随机抽样有各种方法,与从(0,1)上均匀分布抽样不同,这些方法都是借助于随机序列来实现的,也就是说,都是以产生随机数为前提的。由此可见,随机数是实现蒙特卡罗模拟的基本工具。
[0051]3)建立各种估计量
[0052]一般说来,构造了概率模型并能从中抽样后,即实现模拟实验后,就要确定一个随机变量,作为所要求的问题的解,称它为无偏估计。建立各种估计量,相当于对模拟实验的结果进行考察和登记,从中得到问题的解。
[0053]本发明实施例通过主成分分析和Probit-1ogit方法来测算各映射因子的权重和概率。
[0054]主成分分析方法(PrincipalComponent Analysis,PCA),
[0055]它是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。
[0056]主成分分析是设法将原来众多具有一定相关性(比如P个指标),重新组合成一组新的互相无关的综合指标来代替原来的指标。
[0057]主成分分析,是考察多个变量间相关性一种多元统计方法,研宄如何通过少数几个主成分来揭示多个变量间的内部结构,即从原始变量中导出少数几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间互不相关,通常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。
[0058]具体做法就是用Fl (选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(Fl)越大,表示Fl包含的信息越多。因此在所有的线性组合中选取的Fl应该是方差最大的,故称Fl为第一主成分。如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,Fl已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov (Fl,F2) = 0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。
[0059]具体步骤:Fp= ali*ZXl+a2i*ZX2+......+api*ZXp
[0060]其中ali,a2i,……,api (i = 1,……,m)为X的协方差阵Σ的特征值所对应的特征向量,ZXl, ZX2,……,ZXp是原始变量经过标准化处理的值,因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化,本发明实施例所采用的数据就存在量纲影响。
[0061]主成分分析法的计算步骤:
[0062]A= (ai j)pXm = (al,a2,...am,),
[0063]Rai = λ i ai,
[0064]R为相关系数矩阵,λ 1、ai是相应的特征值和单位特征向量,λ?彡λ2彡…^ λ P 多 O。
[0065]一般地,进行主成分分析主要步骤如下:指标数据标准化;指标之间的相关性判定;确定主成分个数m ;主成分Fi表达式;主成分Fi命名。
[0066]Logit模型(Logit model,也译作“评定模型”,“分类评定模型”,又作Logisticregress1n,“逻辑回归”)是离散选择法模型之一,Logit模型是最早的离散选择模型,也是目前应用最广的模型。是社会学、生物统计学、临床、数量心理学、计量经济学、市场营销等统计实证分析的常用方法。
[0067]其逻辑分布(Logisticdistribut1n)公式如下:
[0068]P (Y = 11X = X) = exp (χ,β ) / (1+exp (x,β ))
[0069]其中参数β常用极大似然估计。
[0070]应用Logit模型的原
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1