确定数据集的评价的制作方法

文档序号:35679181发布日期:2023-10-08 14:21阅读:68来源:国知局
确定数据集的评价的制作方法

本发明涉及确定数据包的数据集的评价,尤其基于该数据集的一个或多个特征。


背景技术:

1、随着例如在“物联网(internet-of-things,iot)”领域中设备的连通性增加,在公司之内进行数据和/或价值转移。数据和连接越过物理边界以及部分地越过国界被发送或建立,使得可以完全自动化地并且在此也在其他地点本地提供基于数据的活动和服务。尽管对所传输的数据的评估或其他继续使用并不罕见地遵循预先给定的和/或本身已经被证明的过程,但是这种基于数据的动作仍然经常以复杂的方式手动地并且部分地以并非不变的方式和方法被执行。这导致不大有效的以及几乎不可再现的并且因此不大可靠的过程执行。


技术实现思路

1、因此,本发明的任务是提出一种方法以及一种相对应的系统,利用其能够自动化地确定由数据源提供的数据集的评价,使得最终能够基于这样确定的评价启动继续的措施。

2、为此,本发明描述一种呈计算机实施的方法形式的技术解决方案,借助该方法能够可再现地确定数据的评价bew。与此相应地,该方法用于确定数据包d的由数据源提供给客户端的数据集ds的这种评价bew。在此,在第一方法步骤vi中由客户端如下分析该数据包d:确定包括至少一个特征的对于该数据集ds而言典型的特征char_i的组gchar,其中i=l、...、n且其中n≥1。在第二方法步骤v2中,基于至少一个所确定的特征借助过去的相对应的已经存在的信息确定该数据集ds的评价bew。

3、在第一方法步骤v1中要确定的特征char1中的至少一个是数据模式dsmus。在第一方法步骤v1中,由客户端、即例如由在客户端计算机上实施的相对应的软件在第一方法步骤v1的模式辨识方法步骤v1_mus中关于在多个先前已知的数据模式gdmus中确定的数据模式dmus_m的存在分析数据集ds,其目的是在所提供的数据集ds中辨识出先前已知的数据模式之一dmus_m,因此导致所辨识出的数据模式dsmus=dmus_m。数据模式例如可以是错误代码或确定的时间窗口之内的确定的时间行为。

4、数据包d包括要评价的数据集ds以及数据源的至少一个输出参数da。在第一方法步骤v1中要确定的特征中的至少一个特征char2基于数据集ds的上下文dskxt,其中该上下文dskxt在第一方法步骤v1的选择方法步骤v1_sel的步骤v1_sel_kxt中基于数据源的至少一个输出参数来确定。数据集ds的评价bew以此在第二方法步骤v2中基于所辨识出的数据模式dsmus和所确定的上下文dskxt进行,并且在此例如也可以被确定为在传递上下文dskxt和数据模式dsmus时由相对应地被训练的人工神经网络输出的那个评价bew。

5、针对数据包d包括要评价的数据集ds以及数据源的至少一个输出参数da的情况,在第一方法步骤中要确定的特征中的至少一个特征char2可以代表用于确定评价bew的合适的信息源info_kxt,该信息源被配置为将评价bew分配给数据模式dmus_m,其中合适的信息源info_kxt在第一方法步骤v1的选择方法步骤v1_sel的步骤v1_sel_info中基于该数据源的至少一个输出参数来确定。数据集ds的评价bew然后在第二方法步骤v2中基于先前所辨识出的数据模式dsmus和所确定的合适的信息源info_kxt进行并且在此被确定为通过合适的信息源info_kxt被分配给所辨识出的数据模式dsmus的那个评价bew。在此原则上可以设想的是,选择多个信息源,使得多于一个的信息源进入评价确定中。

6、在第一方法步骤vi的选择方法步骤v1_sel中,在此首先在步骤v1_sel_kxt中根据数据源的至少一个输出参数da确定数据集ds的上下文dskxt。紧接着,在步骤v1_sel_info中,根据所确定的上下文dskxt确定至少一个合适的信息源info_kxt。

7、合适的信息源info_kxt可以在步骤v1_sel_info中基于至少一个输出参数并且在此可能基于先前所确定的上下文dskxt要么从信息源info_q的预先给定的组ginfo中选择,其中该组ginfo的相应的信息源info_q分别将预先确定的评价bew分配给先前已知的数据模式dmus_m中的一个或多个,要么根据人工神经网络knn25来确定,该人工神经网络被配置和训练为基于被输送给网络knn25的上下文dskxt或输出参数da输出合适的信息源info_kxt。

8、不同的信息源info_q例如可以是存放或存储在服务器等等上的相对应的数据存储器中的不同文件,或者是存放在不同的数据存储器上的这种不同文件。不同的数据存储器在此可以由不同的运营商提供。

9、输出参数da之一例如可以是数据源的身份id10,其中数据源的身份id10通过如下方式来确定:首先检查数据源是否可信,尤其根据借助数字证书、例如x.509的身份检查。在可信的数据源的情况下,即针对检查已得出数据源可信的情况,基于集中地、例如在云环境中被存储的信息和/或基于由数据源传送的信息规定数据源的身份id10。

10、替代地或附加地,输出参数da之一可以是数据集的空间原点loc10,即例如数据源的位置,其中数据集的原点loc10基于集中地被存储的信息和/或基于由数据源传送的信息、尤其地理标记信息来确定。

11、替代地或附加地,输出参数da之一可以是数据集的预先给定的使用或数据集的具体的预先给定的上下文dskxt,使得在步骤v1_sel_kxt中上下文的确定被简化为预先给定的上下文的读出并且因此存在评价确定的更高的安全性或可靠性。

12、换言之,因此涉及一种计算机实施的用于确定由数据源连同数据源的至少一个输出参数da提供给客户端的数据集ds的评价的方法。在一种可能的构造方案中,在第一方法步骤v1中,由客户端在该方法本身的模式辨识方法步骤v1_mus中首先关于在多个先前已知的数据模式中数据模式dsmus的存在对数据集ds进行分析,以便在所提供的数据集ds中辨识出先前已知的数据模式之一。在选择方法步骤v1_sel中,此外根据数据源的一个或多个输出参数da确定数据集ds的上下文dskxt。根据所确定的上下文dskxt,从信息源的预先给定的组中选择至少一个合适的信息源info_kxt,其中该组的相应的信息源分别将预先确定的评价bew分配给先前已知的数据模式中的一个或多个。数据集ds的实际的评价bew最后基于所辨识出的数据模式dsmus从所选择的信息源info_kxt被确定为在那里被分配给所辨识出的数据模式dsmus的那个评价bew。

13、用于确定数据包的由数据源提供给系统的客户端的数据集的评估bew的相对应的系统具有数据分析器,该数据分析器被配置为执行所描述的方法,该方法包括第一方法步骤v1和第二方法步骤。

14、该数据分析器可以具有人工神经网络,该人工神经网络被配置和预先训练为基于所确定的数据模式dsmus和所确定的上下文dskxt确定数据集的评估bew。

15、利用该系统在使用该方法的情况下所确定的评价bew例如可以提供关于数据包d中的数据集ds能够被信任到何种程度并且该数据集是否可靠的说明,使得因此可以做出可靠的决策。

16、数据集ds的评价bew可以根据上下文dskxt是不同的性质或包括不同的方面。最终,所确定的该数据集ds的评价bew例如可以被理解为对在所评价的数据集ds的确定的计划使用、例如用于通过该评价bew被配置为对用于训练该网络的数据ds进行加权来训练人工神经网络、或者用于确定工业设备的状态以及也在完全不同的领域中诸如用于计算在转移所评价的数据集时的价格、成本或税收时该价值的相关性的度量。

17、又在用于训练knn的应用的情况下,数据集ds的评价bew可以通过如下方式来确定:数据集ds对于该knn的以后的应用而言如何有代表性。该knn被设置用于确定的应用,例如用于识别图像中的确定的对象。在这种情况下,有价值的数据集ds可以包括被标记的图像,这些图像显示至少一些对于应用而言感兴趣的对象。然而,如果图像只包括不感兴趣的对象,则这对于该knn的训练不是完全无价值的,然而评价bew比在具有首次提到的图像的数据集ds的情况下更低。因此,数据集ds可以根据所确定的评价bew在训练该knn时不同地被加权。

18、在应用该评价bew来确定工业设备的状态的情况下,对该数据集ds进行分析并根据分析的结果、即根据所确定的该数据集ds的评价推断出设备的状态、例如“正常”或“有缺陷”。这里,工业设备例如也可能已经是作为iot架构的部件工作的单个机器。

19、在继续的应用中,公司例如可以形成以数字方式提供的活动和服务的税基并且因此使现有的税收风险最小化。在数据集ds的评价bew作为财务价值的这种应用中,该价值bew例如可以用于规定将数据集ds从第一用户传输给第二用户的价格,即一种购买价格,或确定可能与传输相联系的税收负担等。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1