背景技术:
1、为了使计算机能够做出明智的决定(又名人工智能),它们必须使用某种形式的“世界模型”将原始传感器数据转换为可操作的信息。“传统”算法使用人为工程化的模型,针对手头特定的问题量身定制。这些算法在设计/训练期间通常只需要有限量的数据样本,因为适用范围窄且自由参数数量有限。
2、随着用于计算机视觉应用中的神经网络的兴起,2012年见证了计算机科学的转折点。与传统算法相比,人工算法不依赖于僵硬的、工程化的模型,而是有很多自由参数,它们可以从给定的数据样本中自己推断出模型。
3、这种途径有两个主要缺点:
4、1.这些算法需要大量的数据样本用来防止过拟合;
5、2.必须教算法如何解释每个单独的数据样本。
6、对于后一点,有两种主要策略:
7、1.无监督学习;
8、2.监督学习。
9、(非常)粗略地说,在监督学习中,每一个数据样本都被明确地标注了期望的输出。例如,一组图像被手动标记为“猫”或“攀爬”,以便算法能够区分这二者。
10、对于无监督学习,算法只被给出具有一些额外约束的抽象目标,比如:“将数据集划分为20个不同的组,并最大化组间的kl散度。”在本发明公开的上下文中,这还包括基于策略的学习方法。尽管在这个场景中,分组是在没有任何人为监督的情况下完成的,但仍然需要人类通过观察示例来标记每个组从而来提供语义。
11、文献us2006/0251292 a1可能代表了最接近的现有技术,所述文献公开了一种用于从图像中识别物体并认出图像与信息之间的相关性的系统和方法。
12、在一个实施例中,首先执行无监督学习步骤,然后由用户检查未被标记的类中的候选对象,以便在提供照片时或在他看到图像之后,将人与电子邮件地址或其他个人标识符相匹配。更进一步地,图像中识别出的人与他们的身份之间的关联可以通过无监督聚类与监督识别的组合来建立。如上所述,无监督聚类可以将人脸分组到聚类中。接下来,结果会展示给用户。用户带着纠正任何错误的分组与错误,以及将两组图像组合在一起(如果每组图像包含一样的身份)的目的来扫描结果。根据这份文献,这个算法以最小的用户工作量获得了监督学习的准确性。
技术实现思路
1、根据本发明,提出了一种具有权利要求1的特征的用于训练第一人工神经网络结构的过程或方法、一种适于实施所述过程的具有权利要求12的特征的计算机系统、一种具有权利要求13的特征的计算机程序和一种具有权利要求14的特征的计算机可读介质。本发明的优选或有利实施例由从属权利要求、说明书和附图公开。
2、本发明的主题是一种用于训练第一人工神经网络结构的过程。第一人工神经网络结构优选地实施为人工神经网络。
3、人工神经网络结构适于将来自第一人工神经网络结构的输入端的数据样本在第一人工神经网络结构的输出端处分类为不同的类。至少其中一些类是通过第一人工神经网络结构由无监督学习生成和/或供给(filled)。这些类将在说明书中被称为无监督类。无监督学习应该优选地被理解为这样一种机器学习:所述机器学习在具有很少或根本没有人为监督的情况下,在不具有预先存在的标记的数据集中寻找先前未检测到的模式。
4、至少对于其中一个无监督类,训练第二人工神经网络结构用来生成人工候选对象,所述人工候选对象属于所述无监督类,尤其是看起来属于所述无监督类。换句话说,第二人工神经网络结构生成假的数据样本。
5、生成的人工候选对象在监督学习中被标记和/或标注,用于标记和/或标注所述无监督类。根据本发明,只有人工候选对象被标注/标记、由人类操作者检查,因此相应的无监督类也被标注/标记。
6、本发明因此提出了一种实现用于无监督类的半监督标记或标注的方法。本发明的优点是,无监督类的数据样本不向人类操作者公开,也根本不离开相应的计算机系统。例如,在数据集或数据样本优选地不应离开本地(premise)/装置的场景中,这个过程能够应用于分布式/边缘/在线学习。
7、在本发明的改进中,第一人工网络结构是用已标记的和/或已标注的人工候选对象训练的,以便标记和/或标注所述无监督类。通过这种改进,不仅将标记/标注转移到监督类,而且还用已标注的/已标记的人工候选对象训练第一人工神经网络结构,以便提供半监督类。换句话说,第二人工神经网络结构提供假的数据样本,这些样本能够由人类操作者标记和/或标注,并能够由第一人工神经网络结构使用。
8、通过仅联合训练概率函数而不是完整算法,敏感数据能够保存在本地,而输出能够全局使用。因此,优选是只将人工候选对象展示给人类操作者,而无监督类中的原始数据样本受限和/或保密。
9、在一个优选实施例中,第一人工神经网络结构实施为卷积人工神经网络和/或数据样本是图像。所述卷积人工神经网络包括至少一个或多个卷积层、至少一个或多个池化层和至少一个或多个全连接层。卷积神经网络(cnn或convnet)是一类深度神经网络,优选地应用于分析视觉图像。另外地和/或可替代地,数据样本是图像,例如rgb图像。第一人工神经网络结构的目的是对图像进行分类。
10、进一步优选的是,一部分类是由监督学习生成和/或填充的监督类。监督类基于由人类操作者标记和/或标注的训练数据。第一人工神经网络结构包括一部分监督类和一部分无监督类。进一步优选的是,主要部分是监督类,次要部分是无监督类。例如,超过80%的类是监督类。在这个优选实施例中,无监督类只是整个类的一小的剩余部分而使得大多数数据样本以监督方式分类。
11、在一个优选实施例中,第二人工神经网络结构通过改进相应的无监督类的概率密度函数来训练。简单地说,通过改进,尤其是与相应的实时的无监督类的概率密度函数相比减少或最小化第二神经网络结构的损失函数,第二人工神经网络结构得到改进,因此人工候选对象以改进的方式代表所述无监督类的成员。尤其地,损失函数是基于相应的无监督类的概率密度函数计算第二人工神经网络结构的当前输出与预期输出之间的距离的函数。
12、在本发明的一个优选实施方式中,第二人工神经网络结构包括生成式人工神经网络。尤其地,所述生成式人工神经网络实施了生成式模型。所述生成式人工神经网络具有生成人工候选对象的功能并且能够被训练以提供改进的人工候选对象。
13、在第一个可能的实施方式中,第二人工神经网络结构另外包括判别式人工神经网络,其中,生成式和判别式人工神经网络形成生成对抗网络,其也被称为gan。简单地说,gan通过将生成器与判别器配对来实现它的功能,其中,所述生成器学习产生人工候选对象,所述判别器学习将相应的无监督类的数据样本与生成器的输出区别开。生成器试图欺骗判别器,而判别器则试图避免被欺骗。通过生成器和判别器的这种合作,产生改进的人工候选对象。
14、在第二个实施方式中,第一人工神经网络结构被实施为判别式人工神经网络,其中,所述生成式和这个判别式人工神经网络形成如上所定义的生成对抗网络(gan)。
15、在第一个实施方式中,gan能够专注于生成和改进人工候选对象,以便将功能简化为它的核心功能,从而降低gan的复杂性。在第二个实施方式中,gan包括第一人工神经网络结构,因此gan的判别器部分与第一人工神经网络结构中实施的判别器相同。因此,在训练gan时,判别器部分能够保持不变,只有生成器能够被优化以改进人工候选对象。
16、在另一个实施方式中,生成式人工神经网络是变分自编码器。例如,这种变分自编码器在kingma,diederik p and welling,max.auto-encoding variational bayes.arxivpreprint arxiv:1312.6114,2013中描述。进一步的变分自编码器和gan在larsmescheder,sebastian nowozin,andreas geiger:adversarial variational bayes:unifying variational autoencoders and generative adversarial networks arxiv:1701.04722v4/proceedings of the 34th international conference on machinelearning,sydney,australia,pmlr 70,2017中描述。通过引用将所述文件公开的内容并入当前的说明书中。
17、就无监督类或所有无监督类而论,优选地是只有人工候选对象由人类操作者标记和/或标注。
18、本发明的进一步主题涉及一种计算机系统,据此,所述计算机系统适于实施如上所述的过程。本发明的进一步主题涉及一种具有权利要求13特征的计算机程序和一种具有权利要求14特征的计算机可读介质。