一种测试数据源配置方法及装置与流程

文档序号：17587026发布日期：2019-05-03 21:25阅读：288来源：国知局

本申请涉及工业模型领域，具体而言，涉及一种测试数据源配置方法及装置。

背景技术：

随着工业互联网的飞速发展，工业领域的知识库和模型库、机理模型、工艺流程等企业的数字化资产在成指数级增长。当前在企业中，主要靠各个孤立的信息化系统去管理这是数字化资产，但是没有统一的体系就统一管理，各个业务系统数据彼此分离，更为关键的是，这些复杂的的数据很难通过一种特定的方式进行组合，也无法形成特定企业模型直接使用的测试数据，更无法形成有效的企业知识和工业经验，为企业提供相应的数据化服务。

在这一领域中，现有技术没有根据工业模型训练的实际需要进行动态匹配合适的数据源和数据类型的技术，如果人工进行数据源和数据类型的修改，工业模型的训练效率往往很低，并且训练的准确性不能得到保障。

技术实现要素：

有鉴于此，本申请的目的在于提供一种测试数据源配置方法及装置，用于解决现有技术中数据源无法进行自适应数据自匹配的问题。可以根据工业模型训练的实际需要和训练结果进行动态匹配更合适的数据源和数据类型，提高了工业模型训练的效率，并且提高了工业模型的算法准确度。

第一方面，本申请实施例提供了一种测试数据源配置方法，该方法包括：

可视化配置数据源，根据所述数据源对应的元数据映射关系，生成元数据表，根据所述元数据表，将目标端的数据进行组合；

根据工业知识库中的目标参数，对工业模型进行初步的参数配置；

根据所述组合后的目标端的数据，构建数据模型；

将所述数据模型输入到所述工业模型中进行模型训练，根据所述模型训练的准确度和综合效率动态匹配元数据库中的数据源和数据格式。

结合第一方面，本申请实施例提供了第一方面的第一种可能的实施方案，其中，所述可视化配置数据源，根据所述数据源对应的元数据映射关系，生成元数据表，根据所述元数据表，将目标端的数据进行组合，包括：当所述数据源为复杂异构数据源时，

将所述复杂异构数据源中的多种数据源根据各自的连接方式和读取方式进行整合，得到复杂异构数据源配置方案；

根据所述复杂异构数据源配置方案，配置所述复杂异构数据源；

根据所述复杂异构数据源中的多种数据源，生成数据源组合体；

将所述数据源组合体和辅助数据源特征结合，生成所述数据源组合体对应的元数据；

根据所述数据源组合体对应的元数据映射关系，生成组合体元数据表；

根据所述组合体元数据表，将目标端的数据进行组合。

结合第一方面，本申请实施例提供了第一方面的第二种可能的实施方案，其中，所述根据所述元数据表，将目标端的数据进行组合之后，包括：

将所述目标端的数据的数据特征参数组同步到工业元数据库中，更新所述工业元数据库中的数据特征参数组。

结合第一方面，本申请实施例提供了第一方面的第三种可能的实施方案，其中，所述将所述数据模型输入到所述工业模型中进行模型训练之后，还包括：当所述数据模型对应的元数据的数据源和数据格式无需进行动态匹配时，

当用户对所述数据源的数据进行修改时，数据源采集所述修改后的数据，并进行数据归档得到归档数据，然后将所述归档数据传送至目标端，目标端对归档数据进行解析，对目标端的数据进行相应的更新；

所述更新完成后，目标端向数据源的管理服务器发送执行结果，所述管理服务器收到执行结果后，确认同步成功后，对归档数据进行清除。

结合第一方面，本申请实施例提供了第一方面的第四种可能的实施方案，所述将所述数据模型输入到所述工业模型中进行模型训练，根据所述模型训练的准确度和综合效率动态匹配元数据库中的数据源和数据格式之后，包括：

将所述模型训练的训练数据加入所述工业知识库，更新工业知识库的训练经验数据。

第二方面，本申请实施例提供了一种测试数据源配置装置，其特征在于，包括：

元数据处理模块，用于可视化配置数据源，根据所述数据源对应的元数据映射关系，生成元数据表，根据所述元数据表，将目标端的数据进行组合；

工业模型初始化模块，用于根据工业知识库中的目标参数，对工业模型进行初步的参数配置；

数据模型模块，用于根据所述组合后的目标端的数据，构建数据模型；

训练模块，用于将所述数据模型输入到所述工业模型中进行模型训练，根据所述模型训练的准确度和综合效率动态匹配元数据库中的数据源和数据格式。

结合第二方面，本申请实施例提供了第二方面的第一种可能的实施方案，其中，所述元数据处理模块，包括：复杂异构数据处理模块，用于当所述数据源为复杂异构数据源时，将所述复杂异构数据源中的多种数据源根据各自的连接方式和读取方式进行整合，得到复杂异构数据源配置方案；

根据所述复杂异构数据源配置方案，配置所述复杂异构数据源；

根据所述复杂异构数据源中的多种数据源，生成数据源组合体；

将所述数据源组合体和辅助数据源特征结合，生成所述数据源组合体对应的元数据；

根据所述数据源组合体对应的元数据映射关系，生成组合体元数据表；

根据所述组合体元数据表，将目标端的数据进行组合。

结合第二方面，本申请实施例提供了第二方面的第二种可能的实施方案，其中，所述训练模块，还包括：数据同步模块，用于当所述数据模型对应的元数据的数据源和数据格式无需进行动态匹配时，当用户对所述数据源的数据进行修改时，数据源采集所述修改后的数据，并进行数据归档得到归档数据，然后将所述归档数据传送至目标端，目标端对归档数据进行解析，对目标端的数据进行相应的更新；

所述更新完成后，目标端向数据源的管理服务器发送执行结果，所述管理服务器收到执行结果后，确认同步成功后，对归档数据进行清除。

第三方面，本申请实施例提供了一种计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述第一方面至第一方面的第四种可能的实施方案中的任一项所述的方法的步骤。

第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，其特征在于，所述计算机程序被处理器运行时执行上述第一方面至第一方面的第四种可能的实施方案中任一项所述的方法的步骤。

本申请实施例提出的一种测试数据源配置方法及装置，通过可视化配置数据源，并根据该数据源对应的元数据的映射关系对目标端的数据进行组合，然后根据组合后的目标端的数据构建数据模型，并放入工业模型中进行训练，在训练的过程中，参考魔性训练的准确度和综合效率动态匹配数据源和数据格式，以完成工业模型训练。本申请实施例所提出的测试数据源配置方法根据工业模型训练的实际需要和训练结果进行动态匹配更合适的数据源和数据类型，提高了工业模型训练的效率，并且提高了工业模型的算法准确度。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的一种测试数据源配置方法的流程示意图；

图2为本申请实施例提供的又一种测试数据源配置方法的流程示意图；

图3为本申请实施例提供的又一种测试数据源配置方法的流程示意图；

图4为本申请实施例提供的一种测试数据源配置装置的结构示意图；

图5为本申请实施例提供的又一种测试数据源配置装置的结构示意图；

图6为本申请实施例提供的又一种测试数据源配置装置的结构示意图；

图7为本申请实施例提供的又一种测试数据源配置装置的结构示意图；

图8为本申请实施例提供的又一种测试数据源配置装置的结构示意图；

图9为本申请实施例提供的一种计算机设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供了一种测试数据源配置方法，如图1所示，包括以下步骤s100-s103：

s100,可视化配置数据源，根据上述数据源对应的元数据映射关系，生成元数据表，根据上述元数据表，将目标端的数据进行组合。

其中，元数据内包含数据源、连接属性、目标数据、数据特征等。

具体地，在工业模型管理后台通过拖拽的方式，配置数据源，根据元数据的映射关系，将该数据源对应的元数据进行映射，将映射结果整理后得到元数据表，在目标端需要将元数据对应的目标端的数据进行组合和配置的时候，可通过上述元数据表进行快速灵活的映射。

其中，在配置数据源时，如果数据源为某一信息系统、知识库或ftp服务器等，那么就要配置相应的连接属性，如url地址等，来建立源端到目标端的数据连接。

s101,根据工业知识库中的目标参数，对工业模型进行初步的参数配置。

具体地，工业知识库中存储了训练参数，在模型训练前会根据目标参数对工业模型进行初步的配置。

s102,根据上述组合后的目标端的数据，构建数据模型。

具体地，经过映射组合后得到的目标端的数据，根据工业模型的对数据的要求构建相应的数据模型。

s103,将上述数据模型输入到上述工业模型中进行模型训练，根据上述模型训练的准确度和综合效率动态匹配元数据库中的数据源和数据格式。

具体地，将上述构建好的数据模型放入工业模型中开始训练，训练过程中，在用户不了解该工业模型对应的数据模型的数据特征时，根据上述工业知识库配置的标准，不断得出的模型准确度和综合效率，并根据该准确度和综合效率自适应数据自匹配更适合数据源，以提高准确度和综合效率，直到模型训练结果达到目标要求的准确度和综合效率。

在一可选的实施例中，上述步骤s100：可视化配置数据源，根据上述数据源对应的元数据映射关系，生成元数据表，根据上述元数据表，将目标端的数据进行组合，包括：当上述数据源为复杂异构数据源时，将上述复杂异构数据源中的多种数据源根据各自的连接方式和读取方式进行整合，得到复杂异构数据源配置方案。

具体地，在上述数据源由多种不同数据特征的数据源组合而成的时候，需要先获取每一种数据源对应的处理方法，即连接方式和读取方式。并将所有的处理方法整合成一种针对该数据源的配置方案。

根据上述复杂异构数据源配置方案，配置上述复杂异构数据源。

具体地，根据上述配置方案对数据源进行相应的连接属性的配置。

根据上述复杂异构数据源中的多种数据源，生成数据源组合体。

具体地，将上述复杂异构数据源中的多种数据源通过元数据映射的方式映射成同种数据源，然后再合并成数据源组合体。

将上述数据源组合体和辅助数据源特征结合，生成所述数据源组合体对应的元数据。

具体地，将数据源组合体和辅助数据源特征进行结合后，生成数据源组合体的元数据。

根据所述数据源组合体对应的元数据映射关系，生成组合体元数据表。

具体地，针对上述数据源组合体的元数据进行映射，将结果整理成组合体元数据表。

根据所述组合体元数据表，将目标端的数据进行组合。

具体地，在目标端需要将上述数据源组合体对应的元数据对应的目标端的数据进行组合和配置的时候，可通过上述元数据表进行快速灵活的映射。

在一可选的实施例中，如图2所示，所述根据所述元数据表，将目标端的数据进行组合之后，包括步骤s104：

s104，将上述目标端的数据的数据特征参数组同步到工业元数据库中，更新上述工业元数据库中的数据特征参数组。

具体地，工业元数据库需要不断获取新的元数据的特征参数来更新和完善工业元数据库中的数据特征参数组，也可说成经验参数，并且用户可以通过系统在工业元数据库中对元数据进行增加、删除、修改、查询等业务操作，以此来扩充和完善工业元数据库，实现工业元数据的基本管理。

在一可选的实施例中，上述步骤s103将上述数据模型输入到上述工业模型中进行模型训练之后，还包括：当上述数据模型对应的元数据的数据源和数据格式无需进行动态匹配时，

当用户对上述数据源的数据进行修改时，数据源采集上述修改后的数据，并进行数据归档得到归档数据，然后将上述归档数据传送至目标端，目标端对归档数据进行解析，对目标端的数据进行相应的更新。

具体地，当用户了解该工业模型对应的数据模型的数据特征，用户选择自行调整数据源而非自适应数据自匹配数据源时，系统开启数据源的同步管理服务，包括数据自动采集服务、数据自动归档服务和数据自动传送服务，通过数据自动采集服务对修改后的数据源中的数据变化进行采集，然后通过数据自动归档服务，对采集到的数据变化进行归档数据缓存备份，然后将归档数据传送给目标端，目标端自动解析归档数据，对目标端的数据进行更新状态还原。

上述更新完成后，目标端向数据源的管理服务器发送执行结果，上述管理服务器收到执行结果后，确认同步成功后，对归档数据进行清除。

具体地，当目标端的数据的更新状态还原结束后，目标端生成执行结果，发送给数据源的管理服务器，该管理服务器对该执行结果进行信息确认，如果确认同步完成，则删除归档数据的缓存备份。

这是由于缓存备份数据累计多了会占用本地的存储空间，尤其是系统的存储，长时间的数据库积累会增加系统开销，影响系统性能，因此确认同步成功或超过暂存时间后就会自动清除；也可以通过设置，永久保留归档数据，但是系统不推荐这样做。

在一可选的实施例中，如图3所示，上述步骤s103将上述数据模型输入到上述工业模型中进行模型训练，根据上述模型训练的准确度和综合效率动态匹配元数据库中的数据源和数据格式之后，包括步骤s105：

s105，将上述模型训练的训练数据加入上述工业知识库，更新工业知识库的训练经验数据。

具体地，在工业模型训练完成后，将工业模型训练过程中的训练数据传送到工业知识库中该工业模型的知识库中，丰富优化该工业模型的知识库，在下次使用该工业模型进行训练之前，就可使用更新优化过的数据来进行配置该工业模型的训练参数，以及一些需要定义的数值的预设，例如：准确度用什么数据来表示以及达到多少数值合格，模型的综合效率用什么数据来表示以及达到多少数值合格等。

也可通过系统对工业知识库进行可视化的管理，包括知识库中数据的可视化处理等。

本申请实施例提供了一种测试数据源配置装置，如图4所示，包括：

元数据处理模块40，用于可视化配置数据源，根据上述数据源对应的元数据映射关系，生成元数据表，根据上述元数据表，将目标端的数据进行组合。

其中，元数据内包含数据源、连接属性、目标数据、数据特征等。

工业模型初始化模块41，用于根据工业知识库中的目标参数，对工业模型进行初步的参数配置。

具体地，工业知识库中存储了训练参数，在模型训练前会根据目标参数对工业模型进行初步的配置。

数据模型模块42，用于根据上述组合后的目标端的数据，构建数据模型。

具体地，经过映射组合后得到的目标端的数据，根据工业模型的对数据的要求构建相应的数据模型。

训练模块43，用于将上述数据模型输入到上述工业模型中进行模型训练，根据上述模型训练的准确度和综合效率动态匹配元数据库中的数据源和数据格式。

在一可选的实施例中，如图5所示，上述元数据处理模块40，包括：复杂异构数据处理模块401，用于当上述数据源为复杂异构数据源时，将上述复杂异构数据源中的多种数据源根据各自的连接方式和读取方式进行整合，得到复杂异构数据源配置方案；

根据上述复杂异构数据源配置方案，配置上述复杂异构数据源；

根据上述复杂异构数据源中的多种数据源，生成数据源组合体；

将上述数据源组合体和辅助数据源特征结合，生成上述数据源组合体对应的元数据；

根据上述数据源组合体对应的元数据映射关系，生成组合体元数据表；

根据上述组合体元数据表，将目标端的数据进行组合。

在一可选的实施例中，如图6所示，所述上述装置还包括：工业元数据库模块402，用于将上述目标端的数据的数据特征参数组同步到工业元数据库中，更新上述工业元数据库中的数据特征参数组。

在一可选的实施例中，如图7所示，上述训练模块43，包括：数据同步模块431，用于当上述数据模型对应的元数据的数据源和数据格式无需进行动态匹配时，当用户对上述数据源的数据进行修改时，数据源采集上述修改后的数据，并进行数据归档得到归档数据，然后将上述归档数据传送至目标端，目标端对归档数据进行解析，对目标端的数据进行相应的更新；

上述更新完成后，目标端向数据源的管理服务器发送执行结果，上述管理服务器收到执行结果后，确认同步成功后，对归档数据进行清除。

在一可选的实施例中，如图8所示，上述训练模块43，还包括：工业知识库模块432，用于将所述模型训练的训练数据加入所述工业知识库，更新工业知识库的训练经验数据。

也可通过系统对工业知识库进行可视化的管理，包括知识库中数据的可视化处理等。

对应于图1中的测试数据源配置方法，本申请实施例还提供了一种计算机设备500，如图9所示，该设备包括存储器501、处理器502及存储在该存储器501上并可在该处理器502上运行的计算机程序，其中，上述处理器502执行上述计算机程序时实现上述测试数据源配置方法。

具体地，上述存储器501和处理器502能够为通用的存储器和处理器，这里不做具体限定，当处理器502运行存储器501存储的计算机程序时，能够执行上述测试数据源配置方法，解决了现有技术数据源无法进行自适应数据自匹配的问题。

对应于图1中的测试数据源配置方法，本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述测试数据源配置方法的步骤。

具体地，该存储介质能够为通用的存储介质，如移动磁盘、硬盘等，该存储介质上的计算机程序被运行时，能够执行上述测试数据源配置方法，解决了现有技术中数据源无法进行自适应数据自匹配的问题本申请实施例提出的一种测试数据源配置方法及装置，通过可视化配置数据源，并根据该数据源对应的元数据的映射关系对目标端的数据进行组合，然后根据组合后的目标端的数据构建数据模型，并放入工业模型中进行训练，在训练的过程中，参考魔性训练的准确度和综合效率动态匹配数据源和数据格式，以完成工业模型训练。本申请实施例所提出的测试数据源配置方法根据工业模型训练的实际需要和训练结果进行动态匹配更合适的数据源和数据类型，提高了工业模型训练的效率，并且提高了工业模型的算法准确度。

在本申请所提供的实施例中，应该理解到，所揭露方法和装置，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请提供的实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释，此外，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

最后应说明的是：以上所述实施例，仅为本申请的具体实施方式，用以说明本申请的技术方案，而非对其限制，本申请的保护范围并不局限于此，尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围。都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应所述以权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：贾彦江;赵宏宇;胡渊;陈海林;刘勇进;王晓;高华杰
技术所有人：北京航天数据股份有限公司
我是此专利的发明人

上一篇：sll0528基因在提高集胞藻PCC6803乙醇耐受性中的应用的制作方法
上一篇：一种麦克风旋转关节机构的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。