数据合成方法及装置、计算机存储介质、电子设备与流程

文档序号：35908730发布日期：2023-10-29 07:44阅读：31来源：国知局

所属的技术人员能够理解，本公开的各个方面可以实现为系统、方法或程序产品。因此，本公开的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。下面参照图16来描述根据本公开的这种实施方式的电子设备1600。图16显示的电子设备1600仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。如图16所示，电子设备1600以通用计算设备的形式表现。电子设备1600的组件可以包括但不限于：上述至少一个处理单元1610、上述至少一个存储单元1620、连接不同系统组件(包括存储单元1620和处理单元1610)的总线1630以及显示单元1640。其中，所述存储单元存储有程序代码，所述程序代码可以被所述处理单元1610执行，使得所述处理单元1610执行本说明书上述“示例性方法”部分中描述的根据本公开各种示例性实施方式的步骤。例如，所述处理单元1610可以执行如图2中所示的：步骤s210，将原始时序数据输入训练好的数据合成模型中，所述数据合成模型包括编码网络和解码网络，所述解码网络包含至少两个分支解码网络和权重分配网络，不同的所述分支解码网络对应不同的解码策略；步骤s220，通过所述编码网络对所述原始时序数据进行编码处理，获得编码特征向量；步骤s230，通过所述至少两个分支解码网络对所述编码特征向量进行解码处理，获得至少两个解码特征向量；步骤s240，通过所述权重分配网络对所述至少两个解码特征向量进行融合处理，获得所述原始时序数据对应的合成数据。存储单元1620可以包括易失性存储单元形式的可读介质，例如随机存取存储单元(ram)16201和/或高速缓存存储单元16202，还可以进一步包括只读存储单元(rom)16203。存储单元1620还可以包括具有一组(至少一个)程序模块16205的程序/实用工具16204，这样的程序模块16205包括但不限于：操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。总线1630可以为表示几类总线结构中的一种或多种，包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。电子设备1600也可以与一个或多个外部设备1700(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或者多个使得用户能与该电子设备1600交互的设备通信，和/或与使得该电子设备1600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口1650进行。并且，电子设备1600还可以通过网络适配器1660与一个或者多个网络(例如局域网(lan)，广域网(wan)和/或公共网络，例如因特网)通信。如图所示，网络适配器1660通过总线1630与电子设备1600的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备1600使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其他实施例。本技术旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由权利要求指出。

背景技术：

1、在运营商智能化运维的实际生产活动中，数据往往是宝贵的资源，但随着ai(artificial intelligence，人工智能)大模型的崛起，完成深度学习模型的训练通常需要大量的真实数据进行训练。然而，在运维平台建立初期，往往因为数据量匮乏导致深度学习模型的训练难以取得较好的效果，智能化运维难以开展。

2、相关技术中，一般是通过生成对抗模型或自编码器生成合成数据，然而，上述方案无法解释原始数据和合成数据之间的关联性。

3、鉴于此，本领域亟需开发一种新的数据合成方法及装置。

4、需要说明的是，上述背景技术部分公开的信息仅用于加强对本公开的背景的理解。

技术实现思路

1、本公开的目的在于提供一种数据合成方法、数据合成装置、计算机存储介质及电子设备，进而至少在一定程度上克服由于相关技术的限制而导致的无法解释原始数据和合成数据之间的关联性的技术问题。

2、本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。

3、根据本公开的第一方面，提供一种数据合成方法，包括：将原始时序数据输入训练好的数据合成模型中，所述数据合成模型包括编码网络和解码网络，所述解码网络包含至少两个分支解码网络和权重分配网络，不同的所述分支解码网络对应不同的解码策略；通过所述编码网络对所述原始时序数据进行编码处理，获得编码特征向量；通过所述至少两个分支解码网络对所述编码特征向量进行解码处理，获得至少两个解码特征向量；通过所述权重分配网络对所述至少两个解码特征向量进行融合处理，获得所述原始时序数据对应的合成数据。

4、在本公开的示例性实施例中，通过所述编码网络对所述原始时序数据进行编码处理，获得编码特征向量，包括：通过所述编码网络对所述原始时序数据进行编码，以提取所述原始时序数据对应的均值向量和标准差向量；对基于所述均值向量和标准差向量确定的标准正态分布进行随机采样，获得所述编码特征向量。

5、在本公开的示例性实施例中，所述至少两个分支解码网络包括趋势项分解网络和至少一个季节项分解网络；所述通过所述至少两个分支解码网络对所述编码特征向量进行解码处理，获得至少两个解码特征向量，包括：通过所述趋势项分解网络对所述编码特征向量进行分解，获得趋势项分量；通过所述至少一个季节项分解网络对所述编码特征向量进行分解，获得至少一个季节项分量。

6、在本公开的示例性实施例中，所述至少两个分支解码网络包括趋势项分解网络和残差网络；所述通过所述至少两个分支解码网络对所述编码特征向量进行解码处理，获得至少两个解码特征向量，包括：通过所述趋势项分解网络对所述编码特征向量进行分解，获得趋势项分量；通过所述残差网络对所述编码特征向量进行分解，获得残差项分量。

7、在本公开的示例性实施例中，所述至少两个分支解码网络包括至少一个季节项分解网络和残差网络；所述通过所述至少两个分支解码网络对所述编码特征向量进行解码处理，获得至少两个解码特征向量，包括：通过所述至少一个季节项分解网络对所述编码特征向量进行分解，获得至少一个季节项分量；通过所述残差网络对所述编码特征向量进行分解，获得残差项分量。

8、在本公开的示例性实施例中，所述至少两个分支解码网络包括趋势项分解网络、至少一个季节项分解网络和残差网络；所述通过所述至少两个分支解码网络对所述编码特征向量进行解码处理，获得至少两个解码特征向量，包括：通过所述趋势项分解网络对所述编码特征向量进行分解，获得趋势项分量；通过所述至少一个季节项分解网络对所述编码特征向量进行分解，获得至少一个季节项分量；通过所述残差网络对所述编码特征向量进行分解，获得残差项分量。

9、在本公开的示例性实施例中，所述趋势项分解网络包含全连接层、维度转换层和元素置换层；所述通过所述趋势项分解网络对所述编码特征向量进行分解，获得趋势项分量，包括：通过所述全连接层对所述编码特征向量进行分类处理，得到第一特征向量；通过所述维度转换层对所述第一特征向量进行维度转换，得到所述编码特征向量对应的趋势因子；所述趋势因子用于描述所述原始时序数据的变化趋势；根据所述原始时序数据的序列长度和预设的多项式矩阵的最大度数，构造目标向量；根据所述趋势因子与所述目标向量之间的向量乘积，确定第二特征向量；通过所述元素置换层对所述第二特征向量的至少两个指定维度的元素进行置换，得到所述趋势项分量。

10、在本公开的示例性实施例中，每个所述季节项分解网络包括全连接层和维度转换层；所述通过所述至少一个季节项分解网络对所述编码特征向量进行分解，获得至少一个季节项分量，包括：通过每个所述季节项分解网络的全连接层对所述编码特征向量进行分类处理，得到第三特征向量；通过每个所述季节项分解网络的维度转换层对所述第三特征向量进行维度转换，得到所述编码特征向量对应的季节因子；所述季节因子用于描述所述原始时序数据的变化周期；根据预先设置的季节索引向量，对所述季节因子再次进行维度转换，得到多个第四特征向量；对所述多个第四特征向量进行合并，获得每个所述季节项分量，以获得所述至少一个季节项分量。

11、在本公开的示例性实施例中，所述残差网络包括维度转换层、多层卷积层和全连接层；所述通过所述残差网络对所述编码特征向量进行分解，获得残差项分量，包括：通过所述维度转换层对所述编码特征向量进行维度转换，得到第五特征向量；通过所述多层卷积层对所述第三特征向量进行特征提取，获得第六特征向量；通过所述全连接层对所述第四特征向量进行分类处理，获得所述残差项分量。

12、在本公开的示例性实施例中，所述通过所述权重分配网络对所述至少两个解码特征向量进行融合处理，获得所述原始时序数据对应的合成数据，包括：通过所述权重分配网络输出至少三个权重系数；按照所述至少三个权重系数，对所述趋势项分量、所述至少一个季节项分量、所述残差项分量进行加权融合，得到所述原始时序数据对应的合成数据。

13、根据本公开的第二方面，提供一种数据合成装置，包括：数据输入模块，用于将原始时序数据输入训练好的数据合成模型中，所述数据合成模型包括编码网络和解码网络，所述解码网络包含至少两个分支解码网络和权重分配网络，不同的所述分支解码网络对应不同的解码策略；编码模块，用于通过所述编码网络对所述原始时序数据进行编码处理，获得编码特征向量；解码模块，用于通过所述至少两个分支解码网络对所述编码特征向量进行解码处理，获得至少两个解码特征向量；数据合成模块，用于通过所述权重分配网络对所述至少两个解码特征向量进行融合处理，获得所述原始时序数据对应的合成数据。

14、根据本公开的第三方面，提供一种计算机存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面所述的数据合成方法。

15、根据本公开的第四方面，提供一种电子设备，包括：处理器；以及存储器，用于存储所述处理器的可执行指令；其中，所述处理器配置为经由执行所述可执行指令来执行上述第一方面所述的数据合成方法。

16、由上述技术方案可知，本公开示例性实施例中的数据合成方法、数据合成装置、计算机存储介质及电子设备至少具备以下优点和积极效果：

17、在本公开的一些实施例所提供的技术方案中，通过将原始时序数据输入训练好的数据合成模型中，通过编码网络对原始时序数据进行编码处理，获得编码特征向量，通过至少两个分支解码网络对编码特征向量进行解码处理，获得至少两个解码特征向量，通过权重分配网络对至少两个解码特征向量进行融合处理，获得原始时序数据对应的合成数据，一方面，能够实现基于原始时序数据生成新的合成数据，实现数据量的扩充，从而便于在运维平台建立初期，能够基于上述原始时序数据和合成数据共同实现深度学习模型的训练，实现智能化运维；另一方面，鉴于本公开中的合成数据是先根据至少两种解码策略对编码特征向量进行解码，再对至少两个解码特征向量进行融合得到的，从而，能够合理解释原始数据和合成数据之间的关联性，为合成数据提供解释，增强数据可用性；再一方面，鉴于模型的参数可控，从而，本公开还能够通过参数的调节实现合成数据的灵活可控，使得合成数据在预想范围内随机生成，增强数据合成的灵活性。

18、本公开应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陆顺
技术所有人：中国电信股份有限公司
我是此专利的发明人

上一篇：一种样本处理装置及样本处理方法与流程
上一篇：基于容器的网络功能部署方法及装置、介质和电子设备与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。