用于训练分类器的方法和用于对块进行分类的系统与流程

文档序号：36825662发布日期：2024-01-26 16:36阅读：15来源：国知局

背景技术：

1、监督机器学习解决方案正在针对跨行业的用例而构建。我们可以在预测性维护、交通控制、医学图像诊断和跨部门和学科的许多其他领域中找到这样的示例。

2、在工业环境中设计和部署定制机器学习解决方案的主要原因是某些任务的自动化。这些解决方案背后的机器学习算法通过揭示训练数据中的模式来学习，所述模式向它们显示领域专家如何解决手头的任务(先验)，即，训练数据隐含地编码了领域专家的知识。

3、因此，任何监督机器学习解决方案的一个关键因素是存在适量的高质量训练数据。当没有足够的训练数据时，即使是设计完美的机器学习算法也将无法发现任何有意义的模式来作为其输出的基础。并且当训练数据的质量有问题时(例如，它包含重复、不一致、错误，或者统计分布与现实相比是偏斜的)，经训练的模型可能偏向错误的方向。

4、通常情况下，训练机器学习算法所需的数据并不容易获得。原因可能包括技术限制或在收集训练数据时缺乏远见。在后一种情况下，为了生成训练数据，领域专家需要参与。这是昂贵且耗时的。首先，专门系统的领域专家是昂贵的，而且不容易找到。第二，需要准备的数据量通常很大，因为训练示例需要覆盖自动化的任务的所有可能情况。

5、面临训练数据收集问题的工业应用的一个具体示例是现代日志文件诊断系统。在基于机器学习的解决方案之前，复杂工业系统中的错误是由服务工程师来诊断的，所述服务工程师人工分析大量日志文件，以便找到底层系统中的事故(例如，错误)。在最一般的意义上，被分析的日志文件由包含时间戳和消息的日志条目组成。

6、为了自动化此任务，需要成对的事故标识符和在该事故时发出的相关日志条目的对应序列。然后，训练数据可用于训练模型，该模型使用机器学习或其他方法来执行所述任务。

7、然而，服务工程师的人工工作不会发出这样的训练数据。首先，因为这项工作不是在一个指定的诊断工具中发生的，而是涉及不同的步骤，如拿起电话并且与受影响系统的所有者交谈或在互联网上查找解决方案。此外，在找到解决方案后，领域专家不会返回到日志文件并将解决方案与事故时发出的日志条目的序列进行匹配。

8、因此，有目的地收集高质量的训练数据是一个非常昂贵和耗时的过程，其可能会阻碍许多机器学习解决方案的实施。因此，使该过程更高效的任何发展都是值得的。

技术实现思路

1、本发明的一个目的是提供一种用于训练分类器的方法和一种用于对块进行分类的系统，这为现有技术提供了一种替代方案。

2、本发明的目的由独立权利要求解决。在相应的从属权利要求中阐述了本发明的进一步有利的布置和实施例。

3、根据用于训练分类器的计算机实现的方法，以下操作由一个或多个处理器执行：

4、-由所述处理器中的一个或多个处理块，其中每个块包含文本和/或图像形式的空间结构化信息，

5、-由执行使用注意力机制的分类器的所述处理器中的一个或多个对每个块进行分类，其中分类器的输出包含每个分类块的预测标签和注意力图，

6、-如果相应块的分类器的输出满足选择准则，由所述处理器中的一个或多个从分类块中选择块，

7、-由用户接口输出每个选择的块，其中每个选择的块与分类器已经输出的预测标签和注意力图的视觉表示一起显示，

8、-由所述处理器中的一个或多个检测与用户接口的用户交互，从而由所述处理器中的一个或多个基于用户交互针对至少一个选择的块接收用户选择的标签和用户选择的注意力图，以及

9、-由所述处理器中的一个或多个利用至少一个用户选择的标签和至少一个用户选择的注意力图来训练分类器。

10、所述分类器被训练成基于从技术系统的组件接收的日志条目来执行自动日志文件诊断，其中所述技术系统特别地是复杂工业系统。每个块由日志条目的序列组成，其中每个日志条目包含至少一个时间戳和至少一个消息，其中每个块(b)的内容被处理为文本令牌。对于每个选择的块，注意力图的视觉表示突出显示选择的块的一些文本令牌。分类器包含具有注意力机制的一个或多个卷积神经网络。注意力机制是自注意生成对抗网络自注意模块。

11、用于对块进行分类的系统包括：接口，被配置为接收块，其中每个块包含文本和/或图像形式的空间结构化信息；以及一个或多个处理器，被配置为执行使用注意力机制的分类器，其中所述分类器包含一个或多个卷积神经网络，其中所述注意力机制是自注意生成对抗网络自注意模块，并且其中所述分类器已经用所述方法训练和/或可用所述方法训练。此外，所述一个或多个处理器被配置为通过处理从技术系统的组件接收的日志条目来进行日志文件诊断，其中所述技术系统特别是复杂工业系统，其中每个块包含那些日志条目的序列，其中每个日志条目包含至少一个时间戳和至少一个消息，并且其中每个块的内容被处理为文本令牌。

12、以下优点和解释不一定是独立权利要求的目标的结果。相反，它们可能是仅适用于某些实施例或变型的优点和解释。

13、该方法为专家知识收集和训练数据标注提供基于注意力的主动学习，同时帮助用户进行标注工作，从而允许高效的训练数据收集。每个注意力图中的变化作为视觉标签被反馈到训练循环中。

14、分类器使用注意力来处理训练示例——一种用于分类器(诸如神经网络)的输入处理技术，允许分类器专注于复杂输入的特定方面——从而产生更好的结果，并允许传递领域专业的直观、可视的方式。

15、经训练的分类器可以用于不同的应用，例如从日志文件或由各种系统生成的其他半结构化数据集中提取数据。由于较早地检测到问题，这可能潜在地导致增加的系统正常运行时间和降低的维护成本。分类器可用于生成或处理空间结构化信息(诸如日志消息或图像)的任何计算机系统。

16、该方法允许自动、智能地选择需要由领域专家标记的少量数据点。该方法还为标签提供了自动建议，从而减少了领域专家的工作。通过突出显示这些部分，它为领域专家提供了一种直观和可视的方式来表达他/她在查看块时会注意什么。

17、该方法允许在训练数据收集过程中同时收集视觉和离散标签，以提高准确性。此外，领域专家不需要标记每个可用的样本。

18、用于训练数据标注的现有工具根本不使用主动学习技术，或者使用简单的主动学习技术来选择将哪些数据点呈现给用户以用于标注。例如，通过跟踪其他用户做出的标注，现有系统选择不向给定用户显示已经被其他人以一致的方式标注的那些数据点。这可以通过简单的统计分析来完成，并且不会帮助用户进行标注——它只会减少不必要的工作。

19、该方法和系统，或者它们的至少一些实施例，使用基于注意力的主动学习来改进专家知识收集过程。

20、注意力机制是处理复杂文本和图像输入的神经网络的强大补充。它们允许网络在进行其预测时专注于输入的某些部分。自注意生成对抗网络自注意模块是提供自注意的模块。给定一个输入，它决定在输入中注意什么。虽然自注意模块被认为是自注意生成对抗网络的架构的一部分，但是它可以被用作分类器的一部分。自注意生成对抗网络的其他部分不用于分类器。

21、该方法和系统或它们的至少一些实施例可以通过在事故时自动标记日志文件中的事件，来提供日志文件诊断和日志条目中事件的自动检测。

22、在该方法的一个实施例中，每个预测标签是技术系统中发生的事件的严重性水平。

23、根据该实施例，在训练之后，分类器可以用于在事故时由复杂工业系统的组件发出的日志条目中的事件的自动标记。该实施例在复杂事件分类/标记的环境中使用主动学习。

24、在该方法的另一个实施例中，每个注意力图是包含在相应块中的文本令牌上的概率分布，并且对于每个选择的块，如果每个文本令牌在注意力图中的概率值超过给定阈值，则在视觉表示中突出显示每个文本令牌。

25、在该方法的另一个实施例中，分类、选择、输出、检测、接收和训练的步骤在训练循环中迭代执行。

26、根据该实施例，领域专家不需要先验地收集训练数据，而是系统地和迭代地被要求训练示例，所述训练示例然后被机器学习算法直接用于学习。这种所谓的主动学习机制允许减少人工参与，并且仅选择性地请求干预。

27、因此，收集训练数据的过程被简化和精简，减少了所涉及的领域专家的负担。此外，通过迭代地仅请求所需的训练样本，提高了所收集的训练数据的质量。

28、该实施例还支持仅在稍后的时间才变得可用的流数据或附加数据的迭代标记。

29、分类器随着每次迭代而改进。

30、在该方法的另一个实施例中，选择准则是最小置信度、边缘采样和/或熵采样。

31、在系统的实施例中，至少一些块包含传感器测量。系统配置为实时处理日志条目。它还被配置为如果预测标签之一满足给定准则，则触发自动动作，特别是发出警报信号或关闭技术系统的一部分。

32、计算机可读存储介质上存储有可由计算机系统的一个或多个处理器执行的指令，其中指令的执行使得计算机系统执行该方法。

33、该计算机程序由计算机系统的一个或多个处理器执行，并执行该方法。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：G·O·布里克斯,S·莫戈雷亚努
技术所有人：西门子股份公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。