敏感性分析方法及装置、设备与流程

文档序号:33360561发布日期:2023-03-07 20:40阅读:48来源:国知局
敏感性分析方法及装置、设备与流程

1.本发明涉及数据处理领域,尤其涉及一种敏感性分析方法及装置、设备。


背景技术:

2.分析两个变量之间的敏感性在实际应用中是十分重要的。敏感性分析是判断第i个输入x{i}对输出值y的影响程度,即敏感性指数。敏感性指数越大,则该输入对输出影响越大。敏感性分析的应用主要包括以下几个方面:确定哪些输入对输出的影响最大、以及确定哪些输入变量不是敏感的输入从而在进一步建模前将其剔除。
3.在实际中,包括多个元素值的向量作为输入,确定一个输出数值的场景比较常见,例如,使用历史24小时的输出值构成的向量,预测下一个小时的输出值。
4.而目前的敏感性分析方法,仅能针对一个数值对另一个数值的敏感性进行分析,而不适用于输入为向量输出为数值的场景下的敏感性分析。


技术实现要素:

5.鉴于上述问题,本发明提供一种克服上述问题或者至少部分地解决上述问题的一种敏感性分析方法及装置、设备。
6.一种敏感性分析方法,包括:
7.获取作为第一参数的向量,所述向量包括多个元素;
8.依据所述各个元素的历史值,确定变量,使得所述元素均表征为以所述变量为自变量的因变量,所述自变量与所述因变量之间存在映射关系;
9.依据所述映射关系,在所述第一参数的取值空间,进行空间填补,得到所述向量的预测值,所述取值空间由所述各个元素的取值范围、以及所述变量的取值范围限定;
10.分别获得所述向量的多个取值对应的第二参数的值,所述取值包括所述预测值;
11.依据所述向量的多个取值和对应的所述第二参数的值,确定所述第一参数对所述第二参数的敏感性分析结果。
12.可选的,所述变量包括时间。
13.可选的,所述向量的长度依据所述第一参数对所述第二参数的预测规则确定。
14.可选的,所述分别获得所述向量的多个取值对应的第二参数的值,包括:
15.依次将所述向量的各个取值输入预设的模型,分别得到所述模型输出的所述第二参数的值,其中,所述模型依据训练数据训练得到,所述训练数据包括所述各个元素的历史值和对应的所述第二参数的历史值。
16.可选的,所述训练数据还包括:
17.周期性特征,所述周期性特征指示所述向量的变化周期,所述周期性特征依据不同时间粒度下的所述向量的频谱图得到。
18.可选的,所述模型包括:循环神经网络模型。
19.可选的,所述第一参数的取值空间的获取过程包括:
20.依据所述各个元素的历史值确定所述各个元素的取值范围,作为第一范围;
21.依据所述变量的取值确定所述变量的取值范围,作为第二范围;
22.将取值空间中的数据点按照所述第一范围的单位取值以及所述第二范围的单位取值划分维度。
23.一种敏感性分析装置,包括:
24.第一参数获取单元,用于获取作为第一参数的向量;所述向量包括多个元素;
25.变量获取单元,用于依据所述各个元素的历史值,确定变量,使得所述元素均表征为以所述变量为自变量的因变量,所述自变量与所述因变量之间存在映射关系;
26.预测值获取单元,用于依据所述映射关系,在所述第一参数的取值空间,以所述变量为依据进行空间填补,得到所述向量的预测值;
27.第二参数获取单元,用于分别获得所述向量的多个取值对应的第二参数的值;所述取值包括所述预测值;
28.结果获取单元,用于依据所述向量的多个取值和对应的所述第二参数的值,确定所述第一参数对所述第二参数的敏感性分析结果。
29.一种电子设备,包括:存储器和处理器;
30.所述存储器,用于存储程序;
31.所述处理器,用于执行所述程序,实现上述的敏感性分析方法的各个步骤。
32.一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现上述的敏感性分析方法的各个步骤。
33.借由上述技术方案,本发明提供的敏感性分析方法及装置、设备,获取作为第一参数的包括多个元素的向量,依据各个元素的历史值,确定变量,使得元素均表征为以变量为自变量的因变量,从而实现将多个元素统一为同一变量的因变量,在第一参数的取值空间,以变量为依据进行空间填补,得到向量的预测值,并依据映射关系,分别获得向量的多个取值对应的第二参数的值,从而得到足够用于敏感性分析的数据,依据向量的多个取值和对应的第二参数的值,确定第一参数对所述第二参数的敏感性分析结果,实现输入为向量输出为数值的场景下的敏感性分析。
34.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
35.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
36.图1示出了本技术实施例公开的一种敏感性分析方法的流程示意图;
37.图2示出了本技术实施例公开的模型的训练过程示意图;
38.图3示出了本技术实施例公开的又一种敏感性分析方法的流程示意图;
39.图4示出了本技术实施例公开的一种敏感性分析装置的结构示意图;
40.图5示出了本技术实施例公开的一种电子设备的结构示意图。
具体实施方式
41.下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
42.本技术的以下实施例公开的敏感性分析方法的应用场景为:
43.在预测业务中,使用历史7天的销售额预测3天后的销售额。假设需要对预测业务的输入和输出进行敏感性分析,即对历史7天的销售额对于3天后的销售额的敏感性进行分析。
44.基于上述场景,第一参数为历史7天的销售额,第二参数为3天后的销售额。
45.图1为本技术实施例公开的一种敏感性分析方法,包括以下步骤:
46.s11、获取作为第一参数的向量。
47.可以理解的是,任意一个向量可以包括至少一个元素。如前所述,第一参数为,历史7天的销售额:第1天的销售额、第2天的销售额
……
第7天的销售额。历史7天,可以为但不限于周一至周日。
48.向量的一组取值可以为已知的7天的销售额。
49.s12、依据各个元素的历史值,确定变量,使得元素均表征为以变量为自变量的因变量。
50.可以理解的是,自变量与因变量之间存在映射关系。
51.也就是说,向量的历史数值包括向量中的元素的历史数值,因此,对于任意一个元素,使用该元素的历史数值,找出该元素的变化规律,从而确定决定该元素变化的自变量。将所有元素共同的自变量,作为变量。
52.接上例,以任一个向量中的第一天的销售额为例,根据不同向量(即其它历史7天的销售额组成的向量)中的第一天的销售额的历史数值,能够确定出“第1天的销售额”这一元素的变化规律,从而确定“第1天的销售额”这一元素的自变量。类似的,依次确定“第2天的销售额
”…“
第7天的销售额”的自变量,将共同的自变量作为变量。
53.这里假设各个元素均以时间为变量,所以向量的变量为时间。
54.可以理解的是,各个元素与自变量之间的映射关系可以相同,也可以不同。确定任意一个元素的变化规律的方式,不限定于不同向量中的对应元素(例如都是第1天的销售额)的历史值。
55.s13、依据映射关系,在第一参数的取值空间,进行空间填补,得到向量的预测值。
56.因为第一参数为由各个元素构成的向量,而各个元素均与上述变量存在映射关系,所以第一参数的取值空间为:各个元素的取值范围、以及变量的取值范围限定的多维取值空间。
57.多维取值空间包括多个数据点,数据点被以两个维度划分,一个维度为变量(或元素)的取值范围中的单位取值,另一个维度为元素(或变量)的取值范围中单位取值划分。
58.还以7天的销售额组成的向量为例,向量的变量为时间,假设时间的取值范围假设为30天,单位取值为“1天”,则取值空间的一个维度以“天”划分,即取值空间包括30列(或行)。
59.假设每天的销售额的取值范围均为1-1000(元),另一个维度以“元”划分,单位取值为“1元”,即每列(或行)包括1000个数据点。
60.可以理解的是,在取值空间中,对于两个维度的数值均已知的数据点,具有确定的数值。而有至少一个维度的数值未知的数据点,在取值空间中为需要填补的数据点。
61.例如假设向量由一个月的第一周每天的销售额构成,已知向量中的第1天的销售额为500(元),因为在取值空间中,该月第一周的第一天对应第一列,所以第一列中第500个数据点的值为500。
62.空间填补是指依据取值空间中已存在的数值,预测取值空间中的其它数值。本实施例中,具体的空间填补算法可以为fast,具体实现方式可以参见现有技术,这里不再赘述。
63.可见,在已知一个向量的元素值的基础上,可以通过空间填补技术,获得其它向量中的元素的数值,既可以得到向量的预测值。为了便于区分,本实施例中,将预测得到的向量称为第二向量。
64.需要说明的是,在针对向量进行敏感性分析的需求下,因为向量包括多个元素,所以难点之一在于,多个向量的元素值的获取。本步骤用于解决这一难点。
65.s14、分别获得向量的多个取值对应的第二参数的值。
66.其中,取值为上述得到的预测值,可选的,取值也可以为历史值和预测值。
67.可选的,可以使用预先训练的模型,获得向量的多个取值对应的第二参数的值。具体的,将向量的各个取值作为输入,输入预先训练的模型,得到模型输出的数值,作为第二参数的值。模型的训练过程如图2所示的流程。
68.除了使用模型之外,还可以使用现有的其它方式,例如使用预先配置的计算规则,得到向量的多个取值对应的第二参数的值。
69.s15、依据向量的多个取值和对应的第二参数的值,确定第一参数对第二参数的敏感性分析结果。
70.可以理解的是,具体的,可以将向量的一个取值以及该取值对应的第二参数的值,作为一对数值,依据这一对数值,确定第一参数对第二参数的敏感性分析结果,即一对数值确定一个敏感性分析结果。再依据多对向量值和第二参数值分别确定的敏感性分析结果,即多个敏感性分析结果,综合分析得到一个敏感性分析结果,作为最终的结果。
71.图1所示的流程中,将向量中的各个元素均转换为相同自变量的因变量,所以,一个自变量的取值即可得到向量中各个元素的取值,因此实现了向量的降维。在此基础上,使用空间填补技术可以得到向量在取值空间中的多个取值作为预测值,再依据预测值得到第二参数的对应值,从而能够获得足够的用于敏感性分析的数据,最终得到向量对数值的敏感性分析结果。
72.图2为本技术实施例公开的模型的训练过程,包括以下步骤:
73.s21、将样本输入数据输入预设的模型,得到模型输出的数据。
74.其中,样本输入数据包括向量的历史值。可以理解的是,向量的历史值由各个元素的历史值构成。同上,向量的一组取值可以为已知的7天的销售额。
75.可选的,本实施例中,样本输入数据还可以包括周期性特征。周期性特征为表征向量的周期性变化的特征。
76.具体的,周期性特征可以指示向量的变化周期。周期性特征可以依据不同时间粒度下的向量的频谱图得到。具体实现方式将在以下实施例进行举例说明。
77.可选的,本实施例中,模型可以为循环神经网络模型,例如lstm模型。
78.需要说明的是,因为lstm模型可以提取到特征之前的时间相关性,所以更适用于本实施例所述的场景,所以,在输入样本数据不包括周期性特征的情况下,可以使用lstm模型,以增强对于数据之间的时间关联性的利用。当然,也可以在输入样本数据包括周期性特征的情况下,使用lstm模型,以进一步增强对于数据之间的时间关联性的利用。
79.s22、依据模型输出的数据和各个向量的历史值对应的第二参数的历史值,得到模型的参数。
80.本步骤的具体实现方式可以参见现有技术,这里不再赘述。
81.本实施例所述的模型的训练方式,强调了周期性特征的利用,从而使得模型学习到周期性特征,所以预测值更加准确。
82.图3为本技术实施例公开的又一种敏感性分析方法,基于上述场景,包括以下步骤:
83.s31、依据第一参数对第二参数的预测规则,确定作为第一参数的向量的长度。
84.时序性数据为各个时间点的数值构成的向量,本实施例中,第一参数为第1天的销售额、第2天的销售额
……
第7天的销售额。
85.本实施例中,预测规则为使用历史7天的销售额预测3天后的销售额,所以,第一参数的时间窗口即向量的长度为7天。
86.历史值可以从现有的预测系统中获取。
87.s32、依据各个元素的历史值,确定时间为变量。
88.因为向量由时序性数据构成,所以各个元素均以时间为变量。可以理解的是,每个第一参数中的第1天的销售额与时间之间的映射关系,与每个第一参数中的第2天的销售额与时间之间的映射关系,可以相同,例如均为y=x+1,也可以不同,例如前者为y1=x+1,后者为y2=2x。
89.s33、使用第一参数中各个元素的历史值,确定第一参数的取值空间。
90.如前所述,取值空间由所述各个元素的取值范围、以及所述变量的取值范围限定。因此,确定取值空间的具体方式可以为:依据各个元素的历史值确定各个元素的取值范围,作为第一范围。依据变量的取值确定变量的取值范围,作为第二范围。将取值空间中的数据点按照第一范围的单位取值以及第二范围的单位取值划分维度。具体示例如前所述,这里不再赘述。
91.s34、依据映射关系,在第一参数的取值空间,进行空间填补,得到向量的预测值。
92.s35、依据频谱图确定周期性特征。
93.具体的,将第一参数的历史值,转换为不同的时间粒度包括小时、天、周等下的频谱图,将振幅最大的时间粒度作为目标时间粒度,将目标时间粒度下的销售额作为周期性特征。例如,目标时间粒度为周,则获取每周的销售额作为周期性特征。
94.s36、将向量的预测值和周期性特征作为循环神经网络模型的输入,得到循环神经网络模型输出的第二参数的数值。
95.基于上述场景,本实施例中,向量的一个预测值,得到一个输出值,作为该预测值
对应的后3天的销售额。
96.s37、依据第一参数的多个取值和对应的第二参数的值,确定第一参数对所述第二参数的敏感性分析结果。
97.图3所示的流程,有效解决了时序数据场景下,对输入输出的敏感性分析。并通过使用空间填补手段,确保每个序列的输入内单个时间点的数据都是向着某一固定方向推进的,因此敏感性计算结果可行度较高,能有效凸显不同输入间的敏感性系数差异,无需人为引入敏感性参照物。
98.图4为本技术实施例公开的一种敏感性分析装置,包括:
99.第一参数获取单元401,用于获取作为第一参数的向量;所述向量包括多个元素;
100.变量获取单元402,用于依据所述各个元素的历史值,确定变量,使得所述元素均表征为以所述变量为自变量的因变量,所述自变量与所述因变量之间存在映射关系;
101.预测值获取单元403,用于依据所述映射关系,在所述第一参数的取值空间,以所述变量为依据进行空间填补,得到所述向量的预测值;
102.第二参数获取单元404,用于分别获得所述向量的多个取值对应的第二参数的值;所述取值包括所述预测值;
103.结果获取单元405,用于依据所述向量的多个取值和对应的所述第二参数的值,确定所述第一参数对所述第二参数的敏感性分析结果。
104.可选的,所述变量包括时间。
105.可选的,所述向量的长度依据所述第一参数对所述第二参数的预测规则确定。
106.可选的,第二参数获取单元404分别获得所述向量的多个取值对应的第二参数的值的具体实现方式为:依次将所述向量的各个取值输入预设的模型,分别得到所述模型输出的所述第二参数的值,其中,所述模型依据训练数据训练得到,所述训练数据包括所述各个元素的历史值和对应的所述第二参数的历史值。
107.可选的,所述训练数据还包括:周期性特征,所述周期性特征指示所述向量的变化周期,所述周期性特征依据不同时间粒度下的所述向量的频谱图得到。
108.可选的,所述模型包括:循环神经网络模型。
109.可选的,预测值获取单元403还用于:依据所述各个元素的历史值确定所述各个元素的取值范围,作为第一范围;依据所述变量的取值确定所述变量的取值范围,作为第二范围;将取值空间中的数据点按照所述第一范围的单位取值以及所述第二范围的单位取值划分维度,得到所述第一参数的取值空间。
110.所述敏感性分析装置包括处理器和存储器,上述第一参数获取单元、变量获取单元、预测值获取单元、第二参数获取单元和结果获取单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
111.处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现输入为向量输出为数值的场景下的敏感性分析。
112.本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述敏感性分析方法。
113.本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述敏感性分析方法。
114.图5为本发明实施例提供的一种电子设备,电子设备(50)包括至少一个处理器(501)、以及与处理器连接的至少一个存储器(502)、总线(503);其中,处理器、存储器通过总线完成相互间的通信;处理器用于调用存储器中的程序指令,以执行上述的敏感性分析方法。本文中的电子设备可以是服务器、pc、pad、手机等。
115.本技术还提供了一种计算机程序产品,当在电子设备上执行时,适于执行初始化有如下方法步骤的程序:
116.一种敏感性分析方法,包括:
117.获取作为第一参数的向量,所述向量包括多个元素;
118.依据所述各个元素的历史值,确定变量,使得所述元素均表征为以所述变量为自变量的因变量,所述自变量与所述因变量之间存在映射关系;
119.依据所述映射关系,在所述第一参数的取值空间,进行空间填补,得到所述向量的预测值,所述取值空间由所述各个元素的取值范围、以及所述变量的取值范围限定;
120.分别获得所述向量的多个取值对应的第二参数的值,所述取值包括所述预测值;
121.依据所述向量的多个取值和对应的所述第二参数的值,确定所述第一参数对所述第二参数的敏感性分析结果。
122.可选的,所述变量包括时间。
123.可选的,所述向量的长度依据所述第一参数对所述第二参数的预测规则确定。
124.可选的,所述分别获得所述向量的多个取值对应的第二参数的值,包括:
125.依次将所述向量的各个取值输入预设的模型,分别得到所述模型输出的所述第二参数的值,其中,所述模型依据训练数据训练得到,所述训练数据包括所述各个元素的历史值和对应的所述第二参数的历史值。
126.可选的,所述训练数据还包括:
127.周期性特征,所述周期性特征指示所述向量的变化周期,所述周期性特征依据不同时间粒度下的所述向量的频谱图得到。
128.可选的,所述模型包括:循环神经网络模型。
129.可选的,所述第一参数的取值空间的获取过程包括:
130.依据所述各个元素的历史值确定所述各个元素的取值范围,作为第一范围;
131.依据所述变量的取值确定所述变量的取值范围,作为第二范围;
132.将取值空间中的数据点按照所述第一范围的单位取值以及所述第二范围的单位取值划分维度。
133.本技术是参照根据本技术实施例的方法、装置、电子设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程设备的处理器以产生一个机器,使得通过计算机或其他可编程设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
134.在一个典型的配置中,电子设备包括一个或多个处理器(cpu)、存储器和总线。电子设备还可以包括输入/输出接口、网络接口等。
135.存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/
或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
136.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
137.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
138.本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
139.以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1