用于生成和执行数据处理流水线的方法与流程

文档序号:37482450发布日期:2024-04-01 13:51阅读:7来源:国知局
用于生成和执行数据处理流水线的方法与流程

本发明涉及一种用于生成云计算系统的数据处理流水线的方法,特别是计算机实施的方法,其中数据处理流水线包括至少一个软件模块。本发明还涉及数据处理流水线、用于执行数据处理流水线的方法、系统和计算机程序产品。


背景技术:

1、医疗机构、例如医院等越来越多地使用基于云的软件解决方案。为了实施诸如图像数据的诊断和/或评估的复杂任务,使用数据处理流水线,数据处理流水线可以包括在云计算系统的各种系统元件上执行的多个软件模块。软件解决方案需要在参与的系统元件之间的数据连接。数据、特别是医疗数据的交换受到严格的数据保护要求的约束,数据保护要求也需要由类似的数据处理流水线遵守。特别地,在不同的国家中适用国家特定的数据保护法规和/或对于不同的数据适用不同的数据保护法规。因此,为了交换数据,事先通过数据最小化(例如匿名化或假名化)处理所述数据。在此,不保证可以由软件模块进一步处理数据最小化的数据。

2、数据、算法和学习模型对于临床决策支持所必需的。数据处理流水线(工作流)日益兴起,数据处理流水线包括但不限于结合来自不同系统的数据、预处理(异构)数据并经由各种算法和模型计算相应的信息。在此,通常存在相关性,即例如数据集必须首先转换为对应的格式,借助算法处理,以便最后借助模型得出结论。从来自不同系统元件(例如不同临床系统或诊所和云)的数据直至算法或模型的结果的端到端工作流越来越需要多个传输步骤,并且通常需要手动工作,以便满足数据保护和硬件要求。

3、到目前为止,数据处理流水线都通过软件开发人员针对每种情况手动编程,其中需要对编程和要自动化的流程或工作流、数据保护和所参与的系统有深入了解。

4、数据通常通过匿名化或假名化来最小化。例如,在科学环境中,已知用于假名化和重新鉴别hl7消息的方法。此外,市场上也有商业应用程序,例如:shs teamplay receiver&image hub(在传输到云中之前基于隐私配置文件对dicom数据进行假名化)和shssyngo.via(假名化dicom导出)。它们的共同之处是一组固定的(学习的)规则,以便统一地最小化数据。


技术实现思路

1、本发明的目的是:实现数据处理流水线的简化的生成和/或执行,其中如此生成和/或执行的数据处理流水线确保数据保护并满足参与的软件模块和执行环境的技术要求。

2、根据本发明,提出了一种用于生成用于云计算系统的数据处理流水线的方法。数据处理流水线包括用于在至少一个执行环境中执行的至少一个软件模块,其中执行环境具有相关联的执行环境信息数据。该方法包括以下步骤:

3、-接收用户对于要生成的数据处理流水线的至少一个软件模块选择,其中软件模块选择包括从模块源中选择至少一个软件模块,其中软件模块分别具有相关联的模块要求数据,

4、-接收用户对于要生成的数据处理流水线的至少一个输入数据选择,其中输入数据选择包括用于要生成的数据处理流水线的输入数据的选择,其中输入数据分别具有相关联的数据合同数据,

5、-接收至少一个用户计划输入,其中用户计划输入包括:对要生成的数据处理流水线的架构的描述、对要生成的数据处理流水线的多个软件模块之间的数据连接的描述、和/或对所选择的软件模块在执行环境上的分布的描述,

6、-基于所选择的输入数据的数据合同数据、所选择的软件模块的模块要求数据、用户计划输入和/或执行环境信息数据,检查要生成的数据处理流水线的数据保护要求和/或技术要求的遵守,其中基于检查确定检查信息,

7、-基于所选择的输入数据、所选择的软件模块和用户计划输入生成数据处理流水线,

8、-提供所生成的数据处理流水线和/或所确定的检查信息。

9、生成数据处理流水线特别是被理解为创建数据处理流水线。数据处理流水线的生成和/或创建例如被设计为以数据包、文件和/或可执行程序的形式生成和/或创建数据处理流水线,或者由其包括数据处理流水线。数据包例如形成用于在计算机、特别是云计算系统上执行的安装包,其中执行安装包促使在计算机或云计算系统中实施数据处理流水线。文件例如是可执行文件,特别是可通过计算机或云计算系统执行的文件,其中执行该文件优选地引起在计算机或云计算系统上执行和/或应用数据处理流水线。该可执行程序被设计用于在计算机和/或云计算系统上执行,该可执行计算机程序、文件和/或数据包可以存储或者存储在机器可读存储介质上。

10、云计算系统优选地包括至少一个云。云被设计用于存储数据,例如由外部系统元件提供的数据。此外,云被设计用于执行和/或使用算法、应用和/或数据处理装置,特别是以软件模块的形式。例如,应用、算法和/或软件模块被外包到云和/或设置用于由于高系统要求而由外部系统元件使用的用途。云计算系统包括至少一个系统元件,特别是外部系统元件,其中该外部系统元件也称为客户端。系统元件可以被设计为与云连接的本地计算机、计算机网络和/或装置(例如医院或诊所)。系统元件可以彼此数据连接或是可彼此数据连接的和/或系统元件可以与云数据连接和/或是可与其连接的。例如,医院可以使用可以在云上执行和/或现有的应用作为系统元件或客户端来评估自身的或本地存储的数据。云计算系统特别优选地被设计为由多个系统元件(计算机、本地网络、装置)和至少一个云构成的网络。

11、数据处理流水线被设计用于通过云计算系统和/或计算机执行和/或应用。数据处理流水线,也称为工作流,被设计用于处理和/或评估数据,特别是输入数据,其中创建输出数据。数据处理流水线尤其描述包括多个处理步骤的数据处理。

12、数据处理流水线包括至少一个软件模块,优选地至少两个并且特别是至少十个软件模块。软件模块被设计用于在执行环境中执行。特别地,软件模块被设计用于通过云或系统元件执行和/或使用。换言之,软件模块尤其表示计算机程序、算法或进程。软件模块可以被设计用于:实施通过数据处理流水线表示的数据处理的方法步骤。数据处理流水线的软件模块彼此数据连接。数据处理流水线的软件模块可以并行地布置和/或执行,使得通过并行软件模块进行同时和/或并行的数据处理。替代地和/或附加地,数据处理流水线的软件模块可以串联地布置和/或连接,其中数据处理串行地和/或依次地进行。换言之,数据处理流水线尤其描述软件模块的架构、布置和/或连接,其中一个软件模块的输出数据可以用作另一软件模块的输入数据。

13、特别地,将云、系统元件、计算机和/或数据处理设备理解为执行环境。替代地和/或附加地,云、系统元件、计算机和/或数据处理装置包括执行环境。例如,云形成和/或包括第一执行环境,第一执行环境尤其被设计用于执行复杂的软件模块和/或具有高系统要求的软件模块。系统元件、特别是装置(医院和/或诊所)形成其他的执行环境,该其他的执行环境被设计用于提供数据,特别是输入数据,并且通常具有较低的系统性能。执行环境分别包括相关联的执行环境信息数据,特别是呈数据集的形式。执行环境信息数据尤其是机器可读数据,尤其是可以由云计算系统可读的数据。执行环境信息数据优选地形成和/或包括执行环境的技术和/或数据保护特性的描述。例如,执行环境信息数据包括执行环境的地理位置、加密、防火墙和/或性能。接收至少一个软件模块选择的步骤特别地基于用户输入,特别地以用户选择的形式。用户例如借助于人机接口(hmi)进行用户选择和/或进行用户输入。人机接口例如被设计用于用户输入的光学和/或图形选择、输入和/或确定和/或用户选择。例如,用户可以借助于人机接口来显示可选择的软件模块,例如模块源的软件模块,并且例如通过标记、点击或拖放来从显示的软件模块中进行选择。特别地,通过人机接口为用户可以例如基于文本的方式来搜索软件模块,使得用户可以从搜索结果中进行选择。例如,用户可以搜索形成数据处理的已知或基本处理步骤的功能和/或任务,其中显示和可以执行软件模块作为搜索结果,所述软件模块可以试试搜索到的功能或任务。特别地,可以借助于软件模块选择来选择多个软件模块。模块源例如被设计为应用商店或软件模块的存储位置。特别地,云和/或系统元件可以从模块源获取软件模块。例如,软件模块由模块源提供给云计算系统,例如用于下载和/或作为安装包。

14、软件模块分别包括相关联的模块要求数据。模块要求数据形成机器可读的、特别是计算机可读的数据,例如以数据集的形式。模块要求数据可以作为元数据由相应的软件模块包括。替代地,模块要求数据可以被中央地存储、存放和/或可调用,例如在云或模块源中。模块要求数据例如包括关于相应软件模块的技术要求的信息,例如所需的资源、性能、执行环境、输入数据和/或部件。模块要求数据还可以包含关于需要哪些输入数据、软件模块具有和/或需要哪些用于模块输入数据和/或模块输出数据的接口的信息。特别地,模块要求数据包括关于输入数据和/或模块输入数据所需的格式、大小、文件格式和/或要求的信息。此外,模块要求数据可以包括关于软件模块的受保证的数据保护的信息。

15、接收至少一个输入数据选择的步骤特别地基于用户输入,特别地以用户选择的形式。用户例如借助于人机接口(hmi)做出用户选择和/或进行用户输入。在此,输入数据选择例如由人机接口提供。人机接口可以与用于输入、提供和/或选择软件模块选择和/或用户计划输入的人机接口相同。人机接口例如被设计用于光学和/或图形选择、输入和/或确定用户输入和/或用户选择。例如,用户可以借助于人机接口来显示可选择的、可行的和/或可用的输入数据和/或数据源,并且例如通过标记、点击或拖动来从所显示的输入数据和/或数据源中进行选择。特别地,通过人机接口为用户可以例如基于文本的方式来搜索输入数据和/或数据源,使得用户可以从搜索结果中进行选择。例如,用户可以搜索形成数据处理的已知或基本处理步骤的功能和/或任务,其中显示和可选择对于所搜索的功能或任务所需的或可以处理的输入数据和/或数据源作为搜索结果。特别地,可以借助于输入数据选择来选择多个输入数据和/或数据源。输入数据例如由系统元件、客户端、云和/或装置提供。输入数据特别地包括和/或形成医学数据、患者数据和/或医学图像数据。输入数据尤其包括和/或形成受数据保护的和/或不可自由访问的或必须以受保护的方式处理、传输和/或存储的数据。数据源尤其够为提供输入数据。例如,云、系统元件、数据存储器、装置和/或客户端形成数据源。

16、输入数据、模块输入数据和/或模块输出数据分别包括相关联的数据合同数据。数据合同数据形成机器可读数据,特别是计算机可读数据,例如以数据集的形式。数据合同数据可以作为元数据由相应的输入数据、模块输入数据和/或模块输出数据所包括。替代地,数据合同数据可以被中央地存储、存放和/或可调用,例如在云或数据源中。数据合同数据例如包括关于数据保护、安全级别和/或内容的信息。特别地,数据合同数据形成或包括所属的数据(输入数据、模块输入数据、模块输出数据)的机器可读的分类。例如,输入数据、模块输入数据和/或模块输出数据包括个人相关的和/或敏感的数据,其中所属的数据合同数据提供用于鉴别所属数据中的敏感和/或个人相关的数据的信息。此外,数据合同数据可以包含有关关于数据转发和/或必要的最小化、加密、假名化、匿名化、允许的国家、软件模块和/或评估的法律规定的信息。特别地,数据合同数据包括有关数据负责方、数据来源、法律基础(例如协作合同)、引用要求、包含的敏感数据、数据转发法规(例如允许的第三国)、访问授权和/或保留期限的信息。

17、接收至少一个用户计划输入的步骤尤其基于用户输入,特别地以用户选择的形式。用户输入例如包括数据处理流水线的架构、软件模块的连接和/或布置的图形输入。用户例如借助于人机接口(hmi)做出用户选择和/或进行用户输入。用户计划输入在此例如由人机接口提供。人机接口例如被设计用于光学和/或图形选择、输入和/或确定软件模块和/或用户输入的架构、连接、布置。例如,用户可以借助于人机接口来显示所选择的软件模块和/或所选择的输入数据、待生成的数据处理流水线的模块输入数据和/或模块输出数据,其中用户可以借助于人机接口根据其想法布置和/或连接软件模块,特别是可以确定和/或限定软件模块和/或执行环境之间的数据连接。例如,数据处理流水线的计划和/或架构由用户作为用户计划输入来提供,其中该计划和/或架构包括和/或描述软件模块的布置、软件模块之间的数据连接、软件模块与执行环境的关联和/或数据流。

18、检查数据保护要求和/或技术要求的遵守的步骤(下文中称为检查步骤)尤其以计算机来实施。此外,检查步骤特别是自动地和/或自动化地进行。检查步骤也可以理解为验证在数据保护和/或技术要求方面的一致性。换言之,检查步骤被设计用于:检查是否可以特别是通过云计算系统在考虑用户计划输入的情况下执行包括所选择的软件模块和输入数据的数据处理流水线,或者是否诸如执行环境和/或性能的技术要求环境是否无法满足。此外,检查步骤可以被设计用于:检查和/或确定包括所选择的软件模块和输入数据以及考虑用户计划输入的数据处理流水线是否遵守数据保护,特别是对于输入数据、模块输入数据、模块输出数据和/或中间结果所需的数据保护。该检查基于所选择的输入数据的数据合同数据、所包含的软件模块的模块输入数据和输出数据、所选择的软件模块的模块要求数据、执行环境信息数据和/或用户计划输入。例如,检查包括将数据合同数据与执行环境信息数据和/或模块要求数据进行比较和/或调准。替代地和/或附加地,检查包括模块要求数据与执行信息数据、用户计划输入和/或数据合同数据的比较和/或调准。作为检查步骤的结果,确定检查信息。检查信息是机器可读的信息。检查信息尤其包括关于是否遵守要生成的数据处理流水线的数据保护要求和/或技术要求的结果。例如,检查信息包括是否遵守数据保护要求的结果和是否遵守技术要求的结果。另外,在不遵守数据保护要求和/或技术要求的情况下,检查信息可以包括检查信息元数据,其中检查信息元数据可以包括关于不遵守的信息,例如为什么不遵守所述要求和/或不遵守源自哪个软件模块或数据。该检查尤其可以基于机器学习算法、神经网络和/或深度学习。

19、生成数据处理流水线的步骤特别地以计算机的方式实施和/或自动地进行。生成例如包括例如以机器可读形式创建数据处理流水线,例如作为数据集或文件。生成数据处理流水线基于所选择的软件模块、所选择的输入数据、用户计划输入、模块输入数据、模块输出数据和/或检查信息。特别地,该生成被设计为对应于和/或基于用户计划输入的架构、布置和/或连接的数据处理流水线的生成。

20、在提供生成的数据处理流水线和/或所确定的检查信息的步骤中,为用户和/或云计算系统提供数据处理流水线和/或检查信息,特别是以数据的方式提供和/或显示。例如,将生成的数据处理流水线作为数据或数据包提供给云计算系统、控制模块、客户端、云或用户,特别是用以通过云计算系统安装和/或执行数据处理流水线。除了所生产的数据处理流水线之外,可以输出所确定的检查信息。替代地,如果无法遵守数据保护要求和/或技术要求和/或无法生成数据处理流水线,则可以示出检查信息。在此,输出的检查信息可以被理解为没有生成数据处理流水线的指示符和/或提供对此的原因。

21、本发明还允许为非程序员和/或对于数据保护要求和/或技术要求具有很少或没有经验的用户生成数据处理流水线。

22、借助于机器可读数据合同数据对每个数据集(输入数据、模块输入数据、模块输出数据)进行分类,对机器可读模块要求数据中的软件模块技术要求进行分类,以及对执行环境信息数据中的执行环境进行分类,运行以更简单且自动化的方式进行处理和更简单的生成。处理用户输入并基于其进行检查在创建数据处理流水线时允许自动化。特别地,本发明允许对技术和数据保护相关方面进行抽象,使得非技术系统操作员具有构建混合数据处理流水线的选项。

23、根据本发明的一个方面提出:基于检查信息,在不遵守数据保护要求和/或技术要求的情况下,确定对于满足而可行的和/或所需的至少一个软件模块,其中为所述用户提供所确定的、可行的和/或所需的至少一个软件模块作为用于集成到要生成的数据处理流水线中的模块建议。换言之提出:基于检查数据保护要求和/或技术要求遵守的步骤,在确定不遵守的情况下,求出和/或确定至少一个软件模块,该软件模块确保、实现满足遵守数据保护要求和/或技术要求,和/或为此需要所述软件模块。例如,检查信息包括得出关于是否满足数据保护要求和/或技术要求的信息,特别地未满足和/或不遵守的原因。基于所述信息和/或检查信息,自动搜索至少一个需要的和/或可以使用的软件模块,以便在现有架构、数据连接和/或所选择的软件模块中满足数据保护要求和/或满足技术要求。换言之,在此提出:自动地、特别是以计算机实施和/或基于机器学习、深度学习或神经网络的算法,自动地确定需要的和/或可以使用的软件模块。因此,对于要生成的数据处理流水线的最初不遵守可以通过添加如此确定的软件模块来满足数据保护要求和/或技术要求。如此确定的软件模块被提供为用于集成到要生成的数据处理流水线中的模块建议。

24、例如,模块建议为用户提供、显示、特别是借助于人机接口选择以显示。然后,用户可以决定:其是否希望在要生成的数据处理流水线中补充模块建议的所提出的一个或多个软件模块,使得满足数据保护和/或技术要求。可选地提出:基于检查信息在不遵守数据保护要求和/或技术要求的情况下,确定对于满足而可行的和/或所需的至少一个软件模块,其中在生成数据处理流水线的步骤中,数据处理流水线基于所选择的输入数据、所选择的软件模块、用户计划数据和所确定的可行的和/或所需的至少一个软件模块。在此优选地提出:在生成数据处理流水线的步骤中,数据处理流水线基于所选择的输入数据、所选择的软件模块、用户计划输入以及所确定的可能和/或所需的至少一个软件模块。换言之,除了通过用户做出的选择和确定之外,所述设计方案还被设计用于补充和/或添加为了遵守数据保护要求和/或技术要求所需的软件模块。换言之,自动地确定:为了创建数据保护法允许的和/或满足技术要求的数据处理流水线所需的内容是什么,并自动补充和添加。特别提出:在生成数据处理流水线的步骤中,所确定的可能和/或需要的软件模块被布置和/或安置在架构和/或数据连接中,使得它们满足其目的。为此,所需和/或所确定的软件模块包括例如元数据和/或布置,基于检查信息和/或检查信息包括的元数据进行数据连接。在生成时的添加优选地基于算法和/或机器学习方法、计划网络和/或神经网络。

25、本发明的一个设计方案提出:软件模块分别包括用于接收模块输入数据的至少一个输入接口和用于接收模块输出数据的至少一个输出接口,其中模块输入数据和/或模块输出数据具有相关联的数据合同数据,其中在检查数据保护要求和/或技术要求的遵守的步骤中,基于模块输出数据的数据合同数据和/或模块输入数据的数据合同数据与其他的所选择的软件模块的模块要求数据、与用户计划输入和/或与执行环境信息数据的比较,来检查数据保护要求的满足。

26、特别优选的是:软件模块分别包括至少一个输入接口,用于接收例如输入数据形式的模块输入数据。此外,软件模块包括至少一个用于传输和/或输出模块输出数据的输出接口。模块输出数据尤其可以作为输入数据或模块输入数据提供给随后的和/或另外的软件模块。模块输出数据尤其形成通过软件模块处理的、分析的和/或编辑的模块输入数据。输入接口和输出接口也简称为接口。输入接口和/或输出接口尤其是虚拟接口或软件模块的接口。将数据合同数据指派给模块输入数据和/或模块输出数据和/或其具有这种数据合同数据。特别地,软件模块构成用于将数据合同数据指配给其模块输出数据和/或为所述模块输出数据提供和/或存储。模块输出数据和/或模块输入数据包括例如敏感数据、患者信息和/或要保护的数据,其中数据合同数据具有关于所包括的哪些数据要受到保护的信息、加密类型、数据保护要求和/或接收者必须拥有哪些权限。

27、优选地,在检查数据保护要求和/或技术要求的遵守的步骤中,提出:基于模块输入数据的数据合同数据与作为模块输入数据接收的软件模块的模块要求数据的比较来满足数据保护要求。此外可以提出:检查步骤基于模块输入数据和/或模块输出数据的数据合同数据与用户计划任务和/或与执行环境信息数据的比较。例如,模块输出数据的数据合同数据包括其中包含的特定数据只能匿名地提供给第三方(例如云)的信息,使得将所述软件模块的数据合同状态与云的执行环境信息数据的比较得出不满足。

28、特别地提出:确定具有输入数据和/或模块输入数据的最小数据处理、最小数据最小化、最小匿名化和/或最小假名化的软件模块,作为对于满足而可行的和/或所需的软件模块。例如,多个软件模块适合作为可行的和/或所需的软件模块,和/或可从模块源获得,其中根据所述设计方案,从所选择的适合的软件模块中,仅最低限度地处理、最小化、匿名和/或假名化要由软件模块处理的输入数据和/或模块输入数据,或者与其他适合的软件模块相比,更少量地处理、最小化、匿名和/或假名化要由软件模块处理的输入数据和/或模块输入数据。所述设计方案实现:生成特别精简、资源节约且有效的数据处理流水线。

29、本发明的一个设计方案提出:在检查数据保护要求和/或技术要求的遵守的步骤中,对于在数据处理流水线中执行相应的软件模块、对于该软件模块结合其他件模块、尤其沿着数据处理路径的先前的和/或后续的软件模块的执行和/或对于在执行环境中执行软件模块,分别检查要生成的数据处理流水线的软件模块关于相应软件模块在数据处理流水线中的执行方面的技术要求的满足。在此,特别地,在检查数据保护要求和/或技术要求的遵守的步骤中,确定相应的软件模块的模块要求数据与执行环境信息数据、特别是它们要在其上根据用户计划输入和/或架构执行的执行环境的执行环境信息数据和/或与其他软件模块、特别是先前和/或后续的软件模块的软件模块要求数据的比较。基于该比较,检查和/或确定数据保护要求和/或技术要求的遵守与否。例如,对于软件模块确定:所述软件模块无法再计划的执行环境中执行,因为该执行环境不具有足够的性能,其中这基于模块要求数据与执行信息数据的比较来确定。基于所述比较,然后确定:没有遵守对于所述软件模块或要生成的数据处理流水线的技术要求。特别地提出:在检查数据保护要求和/或技术要求的遵守的步骤中,基于输入数据和/或模块输入数据的数据合同数据与所选择的软件模块和/或为其提供所述数据的软件模块的模块要求数据的比较来提供数据保护要求的满足。此外,该比较可以基于数据合同数据与用户计划输入和/或执行环境信息数据的比较。例如,设置为用于在云上运行的软件模块的模块输入数据的输入数据和/或模块输出数据不允许在国家或机构之外进行处理,使得通过将数据合同数据与云的执行环境信息数据进行比较确定:在这种情况下不遵守数据保护信息。

30、特别地提出:在生成数据处理流水线的步骤中,生成和/或创建混合数据处理流水线。在至少两个不同的执行环境中执行由数据处理流水线所包括的软件模块理解为混合数据处理流水线。例如,混合数据处理流水线提出:软件模块与不同的或至少两个不同的执行环境相关联以进行执行。

31、本发明的另一主题是一种数据处理流水线。数据处理流水线例如作为机器可读文件、机器可读数据包或软件提供。特别地,数据处理流水线作为计算机程序产品提供和/或存储在存储介质上。数据处理流水线构成用于在云计算系统上执行。数据处理流水线基于根据本发明的方法和/或通过执行根据本发明的方法来生成和/或获得。用于在云计算系统上执行的数据处理流水线包括多个软件模块,所述软件模块数据连接并且尤其根据组织结构来构建、布置和/或连接。

32、本发明的另一主题是一种用于在云计算系统上、尤其是在计算机和/或计算机网络上执行数据处理流水线的方法。该方法尤其提出将数据处理流水线安装在云计算系统上或在其上实施。数据处理流水线尤其基于根据本发明的方法和/或基于根据本发明的方法创建和/或生成。

33、云计算系统包括至少一个执行环境,尤其至少两个执行环境。此外,云计算系统包括至少一个模块源,例如应用商店形式的模块源。云计算系统还包括用于输入数据的源,也称为输入数据源,特别是用于附加数据的源。云计算系统包括控制模块,所述控制模块可以以硬件或软件的方式构成。控制模块特别优选地是软件应用。该方法提出:接收流水线数据集。例如,流水线数据集以机器可读存储介质和/或文件和/或数据集的形式提供。该流水线数据集包括和/或基于数据处理流水线,其中该数据处理流水线基于根据本发明的方法生成。换言之,提供数据处理流水线,特别是以机器可读的方式提供。控制模块基于接收到的数据处理流水线和/或流水线数据集来在云计算系统上实施和/或安装由数据处理流水线所包括的软件模块。例如,控制模块触发和/或促使集执行环境、云和/或系统元件,以根据数据处理流水线和/或流水线数据组安装设置用于在那里执行的软件模块,例如以从模块源获得和/或要求软件模块。然后,如此相关联的和/或分布的软件模块由相应的执行环境使用以执行或进行数据处理流水线。所述设计方案基于以下思想:即控制模块中央地编排云计算系统的参与者或参与执行数据处理流水线的参与者,例如部署相应的软件模块。

34、特别优选的是:在一个方法步骤中生成数据信道。数据信道形成至少两个软件模块之间、输入数据源和/或输出接口和软件模块的输入接口之间的数据连接。控制模块被设计用于:在参与方之间生成和/或构建数据信道。软件模块基于流水线数据集、架构和/或数据处理流水线来生成数据信道。特别地,控制模块被设计用于:基于要通过连接传输的数据的数据合同数据与执行信息数据和/或模块要求数据的比较来生成数据信道。例如,基于比较确定:数据要从装置或系统元件传输给云,其中要传输的数据根据数据合同数据具有高的数据保护要求,并且不允许未加密或匿名地传输,使得控制模块基于所述比较构建数据连接,所述数据连接被加密和/或匿名地传输数据。

35、特别优选的是:控制模块在软件模块之间生成数据信道,其中数据信道的生成或数据信道的类型基于要传输的数据或其数据合同数据与模块要求数据的比较。

36、特别地提出:软件模块和/或系统元件和云之间的数据信道形成保护的和/或加密的数据信道。换言之,控制模块被设计用于:生成和/或构建受保护的和/或加密的数据信道。本发明的另一主题形成一种用于在计算机、特别是云计算系统上执行的计算机程序。

37、本发明的另一主题是计算机程序,特别是计算机程序产品。计算机程序被设计用于:在其执行时,执行和/或应用用于生成和/或执行数据处理流水线的方法。

38、本发明的另一主题是一种系统,特别是云计算系统,包括至少一个执行环境、输入数据源和控制模块。特别地,云计算系统数据与模块源数据连接。云计算系统被设计和/或设置用于:应用和/或实施用于执行和/或使用根据本发明的数据处理流水线的方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1