一种模拟数据的生成方法及装置与流程

文档序号：14571828发布日期：2018-06-01 22:40阅读：304来源：国知局

本发明涉及数据处理技术领域，尤其是一种模拟数据的生成方法及装置。

背景技术：

随着用户体验的重要性越来越高，加大了前端和后端的配合工作，目前在前端开发过程中我们需要一些后台返回的数据来完成交互效果，但是后台返回的数据量通常无法满足前端所需的数据量，进而影响软件开发进度。

现有技术可以通过在前端进行数据模拟，进而生成的模拟数据，以供系统性能测试和压力测试，用以支撑缺少真实数据生产环境下的软件产品开发、测试和产品演示，以及其他生产活动。然而由于上述生成的模拟数据具有较高的随机性，使得用户无法根据实际需求设置数据变化范围，进而使得模拟数据的可控性较差。

技术实现要素：

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种模拟数据的生成方法及装置，能够保证生成的模拟数据在可控的范围内变化。

一方面，本发明提供了一种模拟数据的生成方法，包括：

获取至少一组样本数据；

为所述样本数据配置偏差区间；

根据所述偏差区间生成与所述样本数据相匹配的模拟数据。

进一步地，所述获取至少一组样本数据包括：

从预置数据库中获取至少一组样本数据，所述预置数据库中保存有不同领域的样本数据；或

在页面部署采集样本数据信息的脚本，通过所述脚本采集至少一组样本数据。

进一步地，所述样本数据为一组，所述样本数据包括多个数据节点，所述偏差区间为偏差百分比区间，所述为所述样本数据配置偏差区间包括：

接收用户输入的每个数据节点的偏差百分比上限值与偏差百分比下限值，为所述样本数据中每个数据节点分别配置偏差百分比区间，得到样本数据的偏差百分比区间；或

接收用户输入的偏差百分比上限值与偏差百分比下限值，将所述用户输入的偏差百分比上限值与偏差百分比下限值之间的区间，作为样本数据的偏差百分比区间。

进一步地，所述样本数据为多组，每组所述样本数据包括多个数据节点，所述偏差区间为偏差百分比区间，所述为所述样本数据配置偏差百分比区间包括：

计算所述多组样本数据中对应位置的数据节点的平均值，得到平均样本数据；

将所述平均样本数据与每组样本数据中对应位置的数据节点做差值；

根据所述差值与每组样本数据中对应位置的数据节点的比值为所述样本数据配置偏差百分比区间；或

根据用户输入的每组样本数据的百分比上限值与百分比下限值，为所述每组样本数据分别配置偏差百分比区间，得到所述样本数据的偏差百分比区间。

进一步地，所述根据所述偏差区间生成与所述样本数据相匹配的模拟数据包括：

获取样本数据中每个数据节点的偏差区间的上限值与下限值；

根据所述偏差区间的上限值与下限值，生成模拟数据中每个数据节点的上限值与下限值；

从所述模拟数据中数据节点的上限值与下限值之间随机选取的数值作为模拟数据节点值；

根据所述模拟数据节点值，生成与样本数据相匹配的模拟数据。

另一方面，本发明提供一种模拟数据的生成装置，包括：

获取单元，用于获取至少一组样本数据；

配置单元，用于为所述样本数据配置偏差区间；

生成单元，用于根据所述偏差区间生成与所述样本数据相匹配的模拟数据。

进一步地，所述获取单元，具体用于从预置数据库中获取至少一组样本数据，所述预置数据库中保存有不同领域的样本数据；或者

所述获取单元，具体还用于在页面部署采集样本数据信息的脚本，通过所述脚本采集至少一组样本数据。

进一步地，所述样本数据为一组，所述样本数据包括多个数据节点，所述偏差区间为偏差百分比区间，

所述配置单元，具体用于接收用户输入的每个数据节点的偏差百分比上限值与偏差百分比下限值，为所述样本数据中每个数据节点分别配置偏差百分比区间，得到样本数据的偏差百分比区间；或者

所述配置单元，具体还用于接收用户输入的偏差百分比上限值与偏差百分比下限值，将所述用户输入的偏差百分比上限值与偏差百分比下限值之间的区间，作为样本数据的偏差百分比区间。

进一步地，所述样本数据为多组，每组所述样本数据包括多个数据节点，所述偏差区间为偏差百分比区间，所述配置单元包括：

计算模块，用于计算所述多组样本数据中对应位置的数据节点的平均值，得到平均样本数据；

差值模块，用于将所述平均样本数据与每组样本数据中对应位置的数据节点做差值；

配置模块，用于根据所述差值与每组样本数据中对应位置的数据节点的比值为所述样本数据配置偏差百分比区间；或

所述配置单元，还用于根据用户输入的每组样本数据的百分比上限值与百分比下限值，为所述每组样本数据分别配置偏差百分比区间，得到所述样本数据的偏差百分比区间。

进一步地，所述生成单元包括：

获取模块，用于获取样本数据中每个数据节点的偏差区间的上限值与下限值；

第一生成模块，用于根据所述偏差区间的上限值与下限值，生成模拟数据中每个数据节点的上限值与下限值；

选取模块，用于从所述模拟数据中数据节点的上限值与下限值之间随机选取的数值作为模拟数据节点值；

第二生成模块，用于根据所述模拟数据节点值，生成与样本数据相匹配的模拟数据获取模块。

借由上述技术方案，本发明提供的一种模拟数据的生成方法及装置，首先获取至少一组样本数据，这里的样本数据为真实数据，可以为一组样本数据，也可以为多组样本数据，然后根据样本数据的不同组数为样本数据配置偏差区间，针对样本数据的不同组数为样本数据配置不同的偏差区间，进一步根据偏差区间生成与样本数据相匹配的模拟数据。与现有的模拟数据的生成方法相比，本发明能够利用一组或多组样本数据生成任意数量的模拟数据，并且通过为样本数据配置偏差区间，可以控制生成的模拟数据与真实数据的偏差范围，提高了生成的模拟数据的可控性，使得用户可以根据实际需求设置生成的模拟数据的变化范围，在保证了生成模拟数据的准确性的同时，满足用户的需求。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本发明实施例提供的一种模拟数据的生成方法流程示意图；

图2示出了本发明实施例提供的另一种模拟数据的生成方法流程示意图；

图3示出了本发明实施例提供的另一种模拟数据的生成方法流程示意图；

图4示出了本发明实施例提供的一种模拟数据的生成装置结构示意图；

图5示出了本发明实施例提供的另一种模拟数据的生成装置结构示意图；

图6示出了本发明实施例提供的另一种模拟数据的生成装置结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明实施例提供了一种模拟数据的生成方法，如图1所示，该方法主要用于利用样本数据生成变化范围可控的模拟数据，具体步骤包括：

101、获取至少一组样本数据。

其中，样本数据为真实数据，如实验数据、统计数据或者其他类型数据，本发明实施例对样本数据的类型不做限定。

对于本发明实施例可以通过从预置数据库中获取至少一组样本数据，该预置数据库中保存有不同领域的样本数据，举例来说，若需要获取的样本数据为某一视频网站的浏览次数数据，在预置数据库中保存有用户访问不同视频网站记录的数据，该数据可以包括用户浏览视频网站的时间、浏览视频网站的视频和浏览视频网站的次数等等，进一步通过从预置数据库中获取该视频网站的浏览次数数据。

对于本发明实施例还可以通过在页面部署采集样本数据信息的脚本，通过脚本采集至少一组样本数据，这里的脚本是一种特定的描述性语言，依据一定的格式编写的可执行文件，通常可以由应用程序临时调用并执行，举例来说，若需要获取的样本数据为用户浏览网页的时间数据，在浏览器页面部署记录用户在网站内浏览页面的行为数据，该行为数据可以包括用户浏览网页的时间、浏览网页的内容和浏览网页的次数等等，进一步通过获取用户浏览网页的时间数据。

需要说明的是，本发明实施例对上述获取样本数据的方法不做限定，还可以根据实际情况选取其他的获取方法。

102、为所述样本数据配置偏差区间。

这里可以通过用户对样本数据的精度、样本数据的组数或者样本数据的浮动范围等为样本数据配置偏差区间，还可以系统根据样本数据的组数为样本数据配置偏差区间，本发明实施例对配置偏差区间的方式不做限定，举例来说，若用户要求样本数据的精度较高，则可为样本数据配置较低的偏差区间，如[-2％，2％]，若用户要求样本数据的组数较多，则可根据多组样本数据的平均值来进一步为样本数据配置偏差区间，若用户要求样本数据的浮动范围较高，则可为样本数据配置较大的偏差区间，如[-8％，8％]。

其中，偏差区间通常为偏差百分比区间，用于控制样本数据生成的模拟数据的范围，如需要生成的模拟数据与样本数据差距不大，可将偏差百分比区间配置为10％以内，如需要生成的模拟数据与样本数据差距较大，可将偏差百分比区间配置为10％以上或者更大，具体可根据实际情况进行配置。

示例性的，当样本数据为一组时，这里的样本数据包括多个数据节点，对于样本数据例如可以采用一组难以枚举的可变的数据{k₁、k₂、k₃，…}来表示，其中k表示样本数据中每个数据节点，进一步为该样本数据中每个数据节点配置偏差百分比{(m₁,n₁)、(m₂,n₂)、(m₃,n₃)，…}，其中m、n分别表示为样本数据中每个数据节点配置的偏差百分比的上限值和下限值，从而容易得到偏差百分比区间，生成的模拟数据为{k’₁、k’₂、k’₃，…}，其中k’表示模拟数据中每个数据节点，则m<100％*(k’-k)/k<n，并且生成的模拟数据与样本数据的相似度较高，能够在一定程度上模仿样本数据来使用。

示例性的，当样本数据为多组时，同样的每组样本数据中也包括多个数据节点，对于本发明实施例可以为每组样本数据均配置相同的偏差百分比区间，也可以根据每组样本数据与样本数据平均值的差值来确定每组样本数据的偏差百分比区间，本发明实施例对多组样本数据中每组样本数据的偏差百分比区间的配置不做限定。

103、根据所述偏差区间生成与所述样本数据相匹配的模拟数据。

由于偏差区间能够根据用户实际需求进行配置，保证了生成的模拟数据的变化范围是可控的，进一步调控生成的模拟数据与真实数据之间的偏差范围，从而可以模拟真实数据以供仿真者和测试者所使用。

结合上述的实现方式可以看出，本发明实施例提供的一种模拟数据的生成方法，首先获取至少一组样本数据，这里的样本数据为真实数据，可以为一组样本数据，也可以为多组样本数据，然后为样本数据配置偏差区间，针对样本数据的不同组数为样本数据配置不同的偏差区间，进一步根据偏差区间生成与样本数据相匹配的模拟数据。与现有的模拟数据的生成方法相比，本发明能够利用一组或多组样本数据生成任意数量的模拟数据，并且通过为样本数据配置偏差区间，可以控制生成的模拟数据与真实数据的偏差范围，提高了生成的模拟数据的可控性，使得用户可以根据实际需求设置生成的模拟数据的变化范围，在保证了生成模拟数据的准确性的同时，满足用户的需求。

本发明实施例还提供了另一种模拟数据的生成方法，如图2所示，该方法的具体步骤包括：

201、从预置数据库中获取一组样本数据。

这里的预置数据库中保存有不同领域的样本数据，若预置数据库为网站数据库，则该数据库中可以存放很多用户的行为数据，如用户注册信息、登录时间、在网站上操作记录等，进一步通过从网站数据库中获取所需要的样本数据，可以为用户的登录时间数据或者用户在网站上操作的其他行为数据。

应说明的是，这里的样本数据通常为数据节点的形式，每个数据节点可以表示一个数值，如访问量值、统计量值或者实验数据值等其他真实的数据值。

202、接收用户输入的每个数据节点的偏差百分比上限值与偏差百分比下限值，为所述样本数据中每个数据节点分别配置偏差百分比区间，得到样本数据的偏差百分比区间。

这里的样本数据中包括多个数据节点，并且每个数据节点配置有偏差百分比区间，以保证样本数据中每个数据节点的变化范围均为可控制的，进一步使得生成的模拟数据满足用户的实际需求。

由于样本数据可以为一组时，数据节点较少，用户可以为样本数据中每个数据节点配置偏差百分比区间，例如对于第一个数据节点配置偏差百分比为[-10％，12％]，第二个数据节点的偏差百分比为[-8％，11％]，对于样本数据中每个数据节点诸如此类。

需要说明的是，若样本数据中的数据节点较多时，为了方便用户操作，本发明实施例可以接收用户输入的偏差百分比上限值与偏差百分比下限值，将用户输入的偏差百分比上限值与偏差百分比下限值之间，作为样本数据的偏差百分比区间，从而将所有数据节点的偏差百分比区间设置为相同的区间，例如对于所有数据节点均配置偏差百分比为[-10％，10％]。

203、根据所述偏差百分比区间生成与所述样本数据相匹配的模拟数据。

对于本发明实施例，首先获取样本数据中每个数据节点的偏差百分比的上限值与下限值，将偏差百分比区间的上限值与下限值与样本数据做乘积运算能够得到模拟数据中每个数据节点的上限值与下限值，例如将所有节点的偏差百分比区间均为[-5％ 5％]，样本数据为[8 10 15 12 20]，则计算得到的模拟数据中每个数据节点的取值区间分别为[-0.4 0.4]、[-0.5 0.5]、[-0.75 0.75]、[-0.6 0.6]、[-1 1]，由于每个数据节点的上限值与下限值之间可以包括无穷多个偏差值，这里需要从偏差值区间随机选取一个偏差值作为模拟数据节点值，进而根据每个模拟数据节点值生成与样本数据相匹配的模拟数据。

需要说明的是，由于在计算样本数据的偏差区间的时候可能出现不同数值形式的数值，通常可以在生成模拟数据后会根据样本数据的数值形式将模拟数据的数值形式进行统一，例如若样本数据的数值形式为整数形式，生成的模拟数据由于在计算过程中出现小数部分，则将模拟数据小数部分四舍五入进位至整数形式，若样本数据的数值形式为分数形式，则将生成的模拟数据统一为分数形式，以保证生成的模拟数据与样本数据的数值形式保持一致，进而保证生成的模拟数据在应用过程中即使没有真实数据支撑也能够下能够实现产品开发以及软件测试等活动。

本发明实施例提供的另一种模拟数据的生成方法，当模拟数据为一组时，通过对每个数据节点配置偏差百分比，进而根据配置的偏差百分比生成模拟数据中每个数据节点的上限值与下限值，使得该模拟数据的变化范围可以通过配置偏差百分比区间进行调节，通过从模拟数据中数据节点的上限值与下限值之间随机选取的数值作为模拟数据节点值，保证了该模拟数据与真实数据之间的变化范围控制在预期之内。

本发明实施例还提供了另一种模拟数据的生成方法，如图3所示，该方法的具体步骤包括：

301、在页面部署采集样本数据信息的脚本，通过所述脚本采集多组样本数据。

这里的脚本是一种特定的描述性语言，依据一定的格式编写的可执行文件，通常可以由应用程序临时调用并执行，举例来说，若需要获取的样本数据为用户浏览网页的时间数据，在浏览器页面部署采集用户在网站内浏览页面的行为数据，该行为数据可以包括用户浏览网页的时间、浏览网页的内容和浏览网页的次数等等，进一步通过采集用户浏览网页的时间数据来获取样本数据。

302、计算所述多组样本数据中对应位置的数据节点的平均值，得到平均样本数据。

其中，每组样本数据中包括多个数据节点，由于每组样本数据中对应位置的数据节点通常表示为相同意义的数据节点，如每天同一时刻的收视率，每天同一时间段内的用户访问量等，因此，将多组样本数据中对应位置的数据节点进行平均后的样本数据更具有参考价值。

303、将所述平均样本数据与每组样本数据中对应位置的数据节点做差值。

当步骤302计算出平均后的样本数据后，将平均后的样本数据与每组样本数据中对应位置的样本数据做差值，所得到的差值能够说明样本数据中每个数据节点与平均值之间的差距，若差距较小则说明该数据节点处的数值比较稳定，若差距较大则说明该数据节点处的数值波动较大。

304、根据所述差值与每组样本数据中对应位置的数据节点的比值为所述样本数据配置偏差百分比区间。

为了能够为样本数据配置更合理的偏差百分比区间，本发明实施例根据实际的每组样本数据与平均后的样本数据对应节点数据的偏差比，为样本数据配置偏差百分比，使得根据计算后的偏差百分比生成的模拟数据更合理，更能够反映出真实数据的波动性。

需要说明的是，除了采用计算的方式为多组样本数据配置偏差百分比还可以接收用户输入的每组样本数据的百分比上限值与百分比下限值，为每组样本数据分别配置偏差百分比区间，得到样本数据的偏差百分比区间，例如对于第一组样本数据中的数据节点配置偏差百分比为[-6％，6％]，第二组样本数据中的数据节点配置偏差百分比区间为[-5％，8％]，对于样本数据中每组样本数据诸如此类。

对于上述步骤302至步骤304的配置偏差百分比区间的具体实现方式可以包括但不限制如下方式：现有多组样本数据A1、A2、A3、A4、A5，并且每组样本数据中包括有相同数量的节点数据，计算多组样本数据平均后的样本数据为A*，则根据每组数据与平均后的样本数据的差值为A1-A*、A2-A*、A3-A*、A4-A*、A5-A*，进一步得到差值与样本数据的比值为(A1-A*)/A1、(A2-A*)/A2、(A3-A*)/A3、(A4-A*)/A4、(A5-A*)/A5，然后根据该比值每组数据配置偏差百分比区间，通常若比值为负数，则将该负数定为区间的下限值，该负数的相反数为区间的上限值，同理，若比值为正数，该正数为区间的上限值，该正数的相反数为区间的下限值。

305、根据所述偏差区间生成与所述样本数据相匹配的模拟数据。

本步骤中生成模拟数据的具体步骤同步骤203中生成模拟数据的方式相同，本发明实施例在此不做赘述。

本发明实施例的具体应用场景可以包括但不限制于下述实现方式：首先通过从网站数据库获取电视台某频道的两组分钟级收视率数据，每组数据共有1440个数据节点，由于需要30组的分钟级收视率数据才能实对收视率数据进行分析，然后对两组分钟级收视率数据计算平均后的收视率数据，根据平均后的收视率数据与每组收视率数据确定每组收视率数据的偏差百分比区间，若求得其中一组分钟级收视率数据的偏差百分比区间为[-6％ 6％]，求得其中另一组分钟级收视率数据的偏差百分比区间为[-8％ 8％]进一步获取收视率数据中每个节点数据的偏差区间的上限值与下限值，根据偏差区间的上限值与下限值，生成模拟数据中每个数据节点的上限值与下限值，从模拟数据中数据节点的上限值与下限值之间中随机选取的数值作为模拟数据节点值，生成与收视率数据相匹配的模拟数据，若当前收视率数据的数值形式为整数，为了保证模拟数据与收视率数据的数值形式相统一，进一步根据收视率数据的数值形式对生成的模拟数据进行四舍五入，得到与收视率数据的数值形式相一致的模拟数据，这里根据每组分钟级收视率数据能够分别生成1组分钟级收视率的模拟数据，若需要生成多组收视率数据，则同样采用上述的生成方式，进而满足实际需要分析收视率数据所需的数据组数，并且得到的模拟数据符合目前观众观看此频道的收视规律。

本发明实施例提供的另一种模拟数据的生成方法，当模拟数据为多组时，通过对每组样本数据配置偏差百分比，进而根据配置的偏差百分比生成模拟数据中每个数据节点的上限值与下限值，使得该模拟数据的变化范围可以通过配置偏差百分比区间进行调节，通过从模拟数据中数据节点的上限值与下限值之间随机选取的数值作为模拟数据节点值，保证了该模拟数据与真实数据之间的变化范围控制在预期之内。

进一步地，作为图1所示方法的具体实现，本发明实施例提供一种模拟数据的生成装置，该装置实施例与前述方法实施例对应，为便于阅读，本装置不在对前述方法实施例中的细节内容进行逐一赘述，但应当明确，本实施例中的装置能够对应实现前述方法实施例中的全部内容，如图4所示，所述装置包括：

获取单元41，可以用于获取至少一组样本数据，所述获取单元41为本装置中获取样本数据的主要功能模块，具体可以从预置数据库中获取至少一组样本数据，所述预置数据库中保存有不同领域的样本数据，还可以在页面部署采集样本数据信息的脚本，通过所述脚本采集至少一组样本数据；

配置单元42，可以用于为所述样本数据配置偏差区间，所述配置单元42为本装置中配置偏差区间的主要功能模块，具体可以针对不同组数的样本数据进行不同的配置，还可以根据计算样本数据的均值进行配置；

生成单元43，可以用于根据所述偏差百分比区间生成与所述样本数据相匹配的模拟数据，所述生成单元43为本装置中生成模拟数据的主要功能模块，具体通过配置单元42配置的偏差比生成模拟数据。

本发明实施例提供的一种模拟数据的生成装置，首先获取至少一组样本数据，这里的样本数据为真实数据，可以为一组样本数据，也可以为多组样本数据，然后根据样本数据的不同组数为样本数据配置偏差区间，针对样本数据的不同组数为样本数据配置不同的偏差区间，进一步根据偏差区间生成与样本数据相匹配的模拟数据。与现有的模拟数据的生成方法相比，本发明能够利用一组或多组样本数据生成任意数量的模拟数据，并且通过为样本数据配置偏差区间，可以控制生成的模拟数据与真实数据的偏差范围，提高了生成的模拟数据的可控性，使得用户可以根据实际需求设置生成的模拟数据的变化范围，在保证了生成模拟数据的准确性的同时，满足用户的需求。

进一步地，作为图2所示方法的具体实现，如图5所示，当样本数据为一组时，所述样本数据包括多个数据节点，所述偏差区间为偏差百分比区间，所述获取单元41，具体可以用于从预置数据库中获取至少一组样本数据，所述预置数据库中保存有不同领域的样本数据；

所述获取单元41，具体还可以用于在页面部署采集样本数据信息的脚本，通过所述脚本采集至少一组样本数据。

进一步地，所述配置单元42，具体可以用于接收用户输入的每个数据节点的偏差百分比上限值与偏差百分比下限值，为所述样本数据中每个数据节点分别配置偏差百分比区间，得到样本数据的偏差百分比区间；或者

所述配置单元42，具体还可以用于接收用户输入的偏差百分比上限值与偏差百分比下限值，将所述用户输入的偏差百分比上限值与偏差百分比下限值之间的区间，作为样本数据的偏差百分比区间。

进一步地，所述生成单元43包括：

获取模块431，用于获取样本数据中每个数据节点的偏差区间的上限值与下限值；

第一生成模块432，用于根据所述偏差区间的上限值与下限值，生成模拟数据中每个数据节点的上限值与下限值；

选取模块433，用于从所述模拟数据中数据节点的上限值与下限值之间随机选取的数值作为模拟数据节点值；

第二生成模块434，用于根据所述模拟数据节点值，生成与样本数据相匹配的模拟数据获取模块。

本发明实施例提供的另一种模拟数据的生成装置，当模拟数据为一组时，通过对每个数据节点配置偏差百分比，进而根据配置的偏差百分比生成模拟数据中每个数据节点的上限值与下限值，使得该模拟数据的变化范围可以通过配置偏差百分比区间进行调节，通过从模拟数据中数据节点的上限值与下限值之间随机选取的数值作为模拟数据节点值，保证了该模拟数据与真实数据之间的变化范围控制在预期之内。

进一步地，作为图3所示方法的具体实现，如图6所示，当样本数据为多组时，所述样本数据包括多个数据节点，所述偏差区间为偏差百分比区间，所述获取单元41，具体可以用于从预置数据库中获取至少一组样本数据，所述预置数据库中保存有不同领域的样本数据；

所述获取单元41，具体还可以用于在页面部署采集样本数据信息的脚本，通过所述脚本采集至少一组样本数据。

进一步地，所述配置单元42包括：

计算模块421，可以用于计算所述多组样本数据中对应位置的数据节点的平均值，得到平均样本数据；

差值模块422，可以用于将所述平均样本数据与每组样本数据中对应位置的数据节点做差值；

配置模块423，可以用于根据所述差值与每组样本数据中对应位置的数据节点的比值为所述样本数据配置偏差百分比区间；或者

所述配置单元42，还可以用于根据用户输入的每组样本数据的百分比上限值与百分比下限值，为所述每组样本数据分别配置偏差百分比区间，得到所述样本数据的偏差百分比区间。

进一步地，所述生成单元43包括：

获取模块431，用于获取样本数据中每个数据节点的偏差区间的上限值与下限值；

第一生成模块432，用于根据所述偏差区间的上限值与下限值，生成模拟数据中每个数据节点的上限值与下限值；

选取模块433，用于从所述模拟数据中数据节点的上限值与下限值之间随机选取的数值作为模拟数据节点值；

第二生成模块434，用于根据所述模拟数据节点值，生成与样本数据相匹配的模拟数据获取模块。

本发明实施例提供的另一种模拟数据的生成装置，当模拟数据为多组时，通过对每组样本数据配置偏差百分比，进而根据配置的偏差百分比生成模拟数据中每个数据节点的上限值与下限值，使得该模拟数据的变化范围可以通过配置偏差百分比区间进行调节，通过从模拟数据中数据节点的上限值与下限值之间随机选取的数值作为模拟数据节点值，保证了该模拟数据与真实数据之间的变化范围控制在预期之内。

所述模拟数据的生成装置包括处理器和存储器，上述获取单元41、配置单元42和生成单元43等均作为程序单元存储在存储器中，由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核，由内核去存储器中调取相应的程序单元。内核可以设置一个或以上，通过调整内核参数来节省人力，保证生成的模拟数据在可控的范围内变化。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)，存储器包括至少一个存储芯片。

本申请还提供了一种计算机程序产品，当在数据处理设备上执行时，适于执行初始化有如下方法步骤的程序代码：获取至少一组样本数据；为所述样本数据配置偏差区间；根据所述偏差区间生成与所述样本数据相匹配的模拟数据。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张硕
技术所有人：北京国双科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。