用于分析观测对象的类别的方法和装置与流程

文档序号:12468712阅读:218来源:国知局
用于分析观测对象的类别的方法和装置与流程
本发明的示例性实施例一般地涉及数据分析和处理技术,并且特别涉及用于分析观测对象的类别的方法和装置。
背景技术
:颗粒分析在众多行业和领域(例如包括汽车业、化工业、矿业、林业、农业、营养业、制药业、能源业、综合产业等)中都具有相当的重要性。以汽车业为例,可以针对从汽车的组件或零部件上落下的颗粒来进行计数,也可以测量这些颗粒的大小。举例来说,可以使用显微镜(诸如扫描型电子显微镜)来获取有关这些颗粒的数量和大小的信息。如果颗粒的尺寸过大,那么可以认为该组件或零部件的质量不好。另外,还可以根据颗粒的大小来对这些颗粒进行分类。但是,仅根据颗粒的大小无法跟踪颗粒的来源,也不知道颗粒是从什么组件落下来的。因此,提供一种能够对诸如颗粒这样的观测对象进行分类的有效方案是值得期待的。技术实现要素:根据本发明示例性实施例的第一方面,一种用于分析观测对象的类别的方法可以包括:获取一个或多个观测对象的特征信息;根据所述一个或多个观测对象的特征信息,利用基于神经网络的分类策略来实施对所述一个或多个观测对象的分类预测;以及至少部分地基于所述分类预测的结果,确定所述一个或多个观测对象的相应类别。根据本发明示例性实施例的第二方面,一种用于分析观测对象的类别的装置可以包括:信息获取模块,用于获取一个或多个观测对象的特征信息;分类预测模块,用于根据所述一个或多个观测对象的特征信息,利用基于神经网络的分类策略来实施对所述一个或多个观测对象的分类预测;以及类别确定模块,用于至少部分地基于所述分类预测的结果,确定所述一个或多个观测对象的相应类别。根据本发明示例性实施例的第三方面,一种用于分析观测对象的类别的装置可以包括:至少一个处理器和存储了计算机程序代码的至少一个存储器。所述至少一个存储器和所述计算机程序代码可被配置为与所述至少一个处理器一起促使所述装置至少实施以下操作:获取一个或多个观测对象的特征信息;根据所述一个或多个观测对象的特征信息,利用基于神经网络的分类策略来实施对所述一个或多个观测对象的分类预测;以及至少部分地基于所述分类预测的结果,确定所述一个或多个观测对象的相应类别。根据本发明示例性实施例的前述任意方面,所述一个或多个观测对象的特征信息可以包括所述一个或多个观测对象的能谱信息。举例来说,所述能谱信息可以是归一化的能谱信息。在示例性实施例中,所述能谱信息可以是能量色散谱仪(EnergyDispersiveSpectrometer,EDS)能谱信息。根据本发明示例性实施例的前述任意方面,所述获取一个或多个观测对象的特征信息可以包括:收集所述一个或多个观测对象的位置信息,其中,所述位置信息指示了所述一个或多个观测对象的位置;以及根据所述位置信息来提取所述一个或多个观测对象的特征信息。根据本发明示例性实施例的前述任意方面,所述一个或多个观测对象的相应类别可以指示以下至少一项:所述一个或多个观测对象的来源、所述一个或多个观测对象的材质、所述一个或多个观测对象的大小,以及所述一个或多个观测对象的组成部分。根据本发明示例性实施例的前述任意方面,所述基于神经网络的分类策略可以包括基于支持向量机(SupportVectorMachine,SVM)的算法。根据本发明示例性实施例的前述任意方面,所述基于神经网络的分类策略可以通过网络训练过程来定义特征信息与对象类别之间的映射关系。根据本发明示例性实施例的前述任意方面,所述网络训练过程可以包括:获取一个或多个训练对象的特征信息,其中,所述一个或多个训练对象的相应类别是已知的;至少部分地基于所述一个或多个训练对象的特征信息和相应类别,计算与所述映射关系相关联的训练网络的一个或多个参数;以及将具有所计算出的一个或多个参数的所述训练网络确定为所述神经网络,用于预测所述一个或多个观测对象的分类结果。根据本发明示例性实施例的前述任意方面,可以至少部分地基于序列最小优化(SequentialMinimumOptimization,SMO)原理来计算所述一个或多个参数。举例来说,可以通过显微镜的至少一部分(诸如显微镜的一个或多个部件)来实施根据本发明示例性实施例的第一方面的方法。类似地,根据本发明示例性实施例的第二和/或第三方面的装置可以是显微镜的至少一部分或者可以在通信上耦合于所述显微镜。所述显微镜可以是带电粒子显微镜或电子显微镜(诸如扫描型电子显微镜)。通过采用依照本发明示例性实施例所提供的方法和装置,能够以便捷、高效和准确的方式来实现对诸如颗粒等的观测对象的自动分类。附图说明为了更清楚地说明本发明示例性实施例的技术方案,下面将对示例性实施例的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是示例性和说明性,而不意味着对本发明进行任何限制。对于本领域普通技术人员来讲,还可以根据这些附图获得其它附图。当结合附图阅读时,通过参照以下对说明性实施例的详细描述,将更好地理解本发明示例性实施例的各个方面及其进一步的目的和优点,在附图中:图1依照本发明的示例性实施例示出了用于分析观测对象的类别的方法的流程图;图2依照本发明的示例性实施例示出了神经网络训练过程;图3依照本发明的示例性实施例示出了神经网络预测过程;图4依照本发明的一示例性实施例示出了用于分析观测对象的类别的装置的示意图;以及图5依照本发明的另一示例性实施例示出了用于分析观测对象的类别的装置的示意图。具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将参照附图来详细描述本发明的实施例。显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。贯穿本说明书全文,谈及特征、优点或类似的措辞并非意味着可以利用本发明而实现的所有特征与优点应当在或者是在本发明的任何单个的实施例中。相反,要理解涉及特征与优点的措辞意味着结合实施例所描述的具体特征、优点或特性包括在本发明的至少一个实施例中。因而,贯穿本说明书全文,对特征和优点的讨论以及类似的措辞可以指同一实施例,但却不一定指同一实施例。此外,所描述的本发明的特征、优点以及特性可以用任何合适的方式合并在一个或多个实施例中。相关领域的技术人员将会认识到,可以在没有特定实施例的一个或多个具体特征或优点的情况下实践本发明。在其它的示例中,可以在某些实施例中实现附加的特征和优点,其不一定出现于本发明的所有实施例之中。根据本发明的示例性实施例,术语“样本”、“样品”、“待测物”和类似术语可互换地用于表示依照本发明示例性实施例而提出的技术方案适用的对象。进一步地,当在文中进行描述时,各种信息、数据、图像、消息或其它通信可以被从一个部件或装置发送或传送到另一部件或装置。应当理解,传送信息、数据、图像、消息或其它通信可以不仅包括对所述信息、数据、图像、消息或其它通信的传送,而且还可以包括对所述信息、数据、图像、消息或其它通信的准备。因此,对任何此类术语的使用都不应认为是限制本发明实施例的精神和范围。通过颗粒分析可以获知颗粒的成分,对颗粒进行分类,追溯颗粒的来源,并且由此判断相关部件或产品的质量和性能。举例来说,可以利用光学显微镜技术和电子显微镜技术来进行颗粒分析。在使用光学显微镜的情形中,通过比较明场、偏光下颗粒图像的不同,并且结合颗粒的形状,可以将颗粒分为金属颗粒、非金属颗粒和纤维。此外,根据颗粒的大小,可以将不同类型的颗粒分级。然而,该方案只能将颗粒笼统地分为三类,并按照大小来评级,却无法知道颗粒的成分,进而无法追溯颗粒的来源。在使用电子显微镜的情形中,通过电子显微镜的图像或照片,可以获取颗粒的位置、大小等信息,再利用颗粒的能谱信息,可以对颗粒进行分类和评级。如果分类的原则是基于颗粒的来源,那么还可以追踪颗粒的来源。然而,该方案需要建立用于颗粒分类的数据库。建立该数据库的过程需要结合颗粒本身的材料成分和研究人员的经验,而由于材料本身的复杂性,很难建立一个良好的数据库来对颗粒进行分类。举例来说,一种采用能量色散谱仪(EnergyDispersiveSpectrometer,EDS)信息来实现颗粒分类的方案是根据化学成分来对颗粒进行分类并跟踪颗粒的来源。在获得了每个颗粒的EDS结果的情况下,可以使用EDS数据库把它们分为不同的类型。具体而言,可以使用EDS来获得每个颗粒的元素组成。例如,已知颗粒是由90%的铁(Fe)和10%的硫(S)组成。由于不同的材料具有不同的元素组成,可以基于EDS信息将这些颗粒分为不同的材料,进而可以跟踪颗粒的来源。由此可见,基于EDS信息的分类方法需要设定各种颗粒类型中每个颗粒的元素范围,而具体的分类规则便取决于对该范围的设定。设置EDS数据库的常规方法是基于特定元素百分含量的范围。例如,如果要对FeMnCr颗粒进行分类,则需要手动地对数据库进行如下设置:{铁(Fe):90-98%;锰(Mn):1-2%;铬(Cr):0.1-2%}。然而,这种颗粒分类方法的可行性和准确度是有限的。一方面,颗粒及其类型的数量总是过大,因而难以实现有效的人工分类。另一方面,每种颗粒类型的EDS结果变化较多。由于这种限制,很难找到一种明确的规则或标准来利用颗粒的化学组成对颗粒进行分类。实际上,如果颗粒只含有特定的元素,诸如FeMnCr,那么为每个元素设置合理的比例是可行的。然而,当颗粒类型的数量增加时,这就变得不可行了,因为没办法顾及所有类型的颗粒。此外,考虑到一些材料之间的成分差异很小,其颗粒可能含有大量类似的元素,诸如CuZn16,CuZn33,CuZn16Si,这会使颗粒分类处理的情况变得更糟。即便是相同材料的颗粒,由于材料天然的不均匀性,这些颗粒的主要成分之间的百分含量也存在差异,甚至一些颗粒的成分含量误差大于20%。由此可见,由于颗粒本身的复杂性,人工很难对较多种类或类别的颗粒建立一个精确的标准分类数据库。根据本发明的示例性实施例,提供了一种用于分析观测对象的类别的方案,其通过利用基于神经网络的分类策略来实现对诸如颗粒、微粒、样品等待测物或观测对象的自动分类。这种分类方案的实施无需人工参与,用户也不需要知道观测对象本身的具体材料或元素构成,因而在提供较高分类精确度的同时还降低了操作的复杂度。图1依照本发明的示例性实施例示出了用于分析观测对象的类别的方法的流程图。可以通过各种设备或装置来实现图1所示的方法。所述设备或装置可以是任何类型的电子设备或装置,包括但不限于数据处理设备、数据分析仪、计算设备、观测仪、显微镜、能谱仪、测量仪、个人数字助理、数字记录仪、监测器、传感器、多媒体设备和/或控制台等。根据图1所示的方法,在步骤102中,可以获取一个或多个观测对象的特征信息。举例来说,所述一个或多个观测对象的特征信息可以包括所述一个或多个观测对象的能谱信息。可选地或附加地,所述特征信息也可以包括与观测对象的来源、类别、成分和/或材料等相关联的任何其它信息。利用各种适当的设备或装置(诸如扫描型电子显微镜和能谱仪),通过扫描一个或多个观测对象,可以获得所述一个或多个观测对象的能谱数据或信息。根据本发明的示例性实施例,所述一个或多个观测对象可以包括一个或多个颗粒,例如来自相同或不同材料/物品的颗粒。需要通过观测所述颗粒来分析其相应的类别。可以理解,除了颗粒之外,如图1所示的方法还可应用于需要分析或确定类别的任何其它待测物。根据本发明的示例性实施例,获取一个或多个观测对象的特征信息的步骤102可以具体包括:收集所述一个或多个观测对象的位置信息,其中,所述位置信息指示了所述一个或多个观测对象的位置;以及根据所述位置信息来提取所述一个或多个观测对象的特征信息。举例来说,可以利用电子显微镜来扫描观测对象(诸如待测样品颗粒)并得到相应的图像。通过适当的图像处理方法,可以得到观测对象的位置信息(诸如绝对坐标和/或相对坐标),并由此确定观测对象的位置。通过利用能谱仪,可得到位于不同位置的观测对象的原始特征数据(例如能谱数据)。可选地或附加地,可以对所得到的原始特征数据进行适当的处理,例如归一化处理或者按照预设的规则所进行的任何其它处理。视情况,可以将原始特征数据或者经处理的特征数据作为特征信息用于后续进行的类别分析过程。根据本发明的示例性实施例,可以在无需收集一个或多个观测对象的位置信息的情况下,从已经采集或存储了观测对象的特征信息的其它装置或设备(例如能谱仪、传感器和/或数据库等)直接或间接地(例如通过接收、检索和/或读取等)获得所述一个或多个观测对象的特征信息。可选地,可以结合使用通过这种方式获得的特征信息与根据位置信息提取的特征信息。在步骤104中,根据所述一个或多个观测对象的特征信息,可以利用基于神经网络的分类策略来实施对所述一个或多个观测对象的分类预测。根据本发明的示例性实施例,所述基于神经网络的分类策略可以通过网络训练过程来定义特征信息与对象类别之间的映射关系。换句话说,所定义的映射关系可以指示或表明观测对象的特征信息与类别之间的关联性,并且能够从某种程度上体现出针对观测对象的分类规则。举例来说,所述网络训练过程可以包括:获取一个或多个训练对象的特征信息,其中,所述一个或多个训练对象的相应类别是已知的;至少部分地基于所述一个或多个训练对象的特征信息和相应类别,计算与所述映射关系相关联的训练网络的一个或多个参数;以及将具有所计算出的一个或多个参数的所述训练网络确定为所述神经网络,用于预测所述一个或多个观测对象的分类结果。所述一个或多个训练对象可以包括与所述一个或多个观测对象来自相同或不同物品/样品的颗粒。在实践中,可以同时或者按照先后顺序来采集训练对象和观测对象的特征信息。换句话说,在分析观测对象的类别时,可以利用预先构建和存储的训练网络;或者在不具有可用的训练网络,但却具有一些已知种类的标准样品的情况下,也可以利用这些标准样品来临时构建训练网络。举例来说,可以利用电子显微镜来扫描训练对象(诸如标准样品颗粒)并得到相应的图像。通过适当的图像处理方法,可以得到训练对象的位置信息(诸如绝对坐标和/或相对坐标),并由此确定训练对象的位置。通过利用能谱仪,可得到位于不同位置的训练对象的原始特征数据(例如能谱数据),并且视情况将原始特征数据或者经处理的特征数据作为训练对象的特征信息用于网络训练过程。由此可见,神经网络的训练过程利用了已知类别或种类的训练对象的特征信息与对象类别之间的关联性,并通过构建训练模型或训练网络等方式,将这样的关联性用于对未知类别或种类的观测对象的分类预测。特别地,为了提高分类预测的准确性,训练过程可以包括对训练网络的参数配置和取值的优化过程。举例来说,可以至少部分地基于SMO原理来计算训练网络的一个或多个参数。此外,由于不同的分类算法可具有不同的参数设置,因此,可以根据不同的应用场景和测试对象来选择适合的分类算法,以便反映不同的分类规则。根据本发明的示例性实施例,所述基于神经网络的分类策略可以包括基于SVM的算法。按照基于SVM的算法,给定一组训练对象,每个训练对象被标记为属于一个类别,通过SVM训练过程,可以构建出能够对观测对象进行分类的SVM模型或神经网络。例如,SVM模型或神经网络可以将各个对象映射成空间中的多个点,以便使得不同类别的对象由尽可能宽的间隔带划分开来。于是,通过将观测对象映射到同一空间,可以基于观测对象落在了间隔带的哪一侧来预测该观测对象的类别。举例来说,SVM神经网络可具有两个参数,分别表示所输入的对象的坐标和类别,并且该神经网络可以自动地为两个不同类别的对象找到合适的界限来分隔彼此。如此,当输入观测对象的坐标时,SVM神经网络可以输出观测对象的类别。观测对象的坐标可以与观测对象的特征相关联,而如果观测对象的特征与多个参量相关,那么观测对象的坐标可由多维向量来表示,相应地,SVM神经网络会利用多维平面或超平面来实现对象类别的划分。在训练SVM神经网络时,仅需要针对每种对象类型提供少量的训练对象即可。经训练的SVM神经网络能够自动地对观测对象进行分类(例如,仅需输入观测对象的特征信息),而无需人为地寻找分类规则。此外,SVM神经网络还能够提供较高的分类准确性,例如分类精度可达到90%以上。可以理解,根据本发明示例性实施例的分类策略还可以包括其它基于神经网络的分类规则或算法,或者可以将SVM算法与其它分类规则或算法进行结合来实现根据本发明示例性实施例的分类策略。在步骤106中,至少部分地基于所述分类预测的结果,可以确定所述一个或多个观测对象的相应类别。举例来说,可以直接利用通过实施步骤104所获得的分类预测结果来指示观测对象的类别,例如分类预测结果可以包括指示了对象类别的特定标识符。可选地或附加地,可以综合考虑通过实施步骤104所获得的分类预测结果以及各种情境信息(例如操作环境、计算条件和/或数据精度等),以便确定观测对象的相应类别。所述一个或多个观测对象的相应类别可以指示以下至少一项:所述一个或多个观测对象的来源、所述一个或多个观测对象的材质、所述一个或多个观测对象的大小,以及所述一个或多个观测对象的组成部分。根据本发明示例性实施例的用于分析观测对象的类别的方案有利于用户更轻松地建立各种样品或颗粒的特征信息(例如EDS信息)数据库,并且无需手动设定元素含量范围,而是可以通过自动分类来确定颗粒的类别,进而追踪其来源。根据本发明示例性实施例的方案所涉及的网络训练过程也易于实现,仅通过少量的标准样品数据(例如颗粒的组成元素及含量),便可以训练出合适的神经网络来对颗粒进行自动分类。该方案可以避免设置复杂但却不那么精确的分类规则,从而降低了实现复杂度并且节省了操作时间。可以通过显微镜的至少一部分(诸如显微镜的一个或多个部件)来实施根据本发明示例性实施例的方法。举例来说,如图1所示的根据本发明示例性实施例的方法可以通过电子显微镜来分析颗粒的特征信息(诸如能谱数据),通过标准颗粒的能谱数据来训练神经网络,并且利用经训练的神经网络,根据待测颗粒的能谱数据来自动地对颗粒进行分类,从而得到准确的颗粒分类结果。下面将结合图2和图3来详细描述根据本发明示例性实施例的神经网络训练过程和神经网络预测过程。图2依照本发明的示例性实施例示出了神经网络训练过程。如图2所示,在步骤202中获得训练集数据。举例来说,利用扫描型电子显微镜和能谱仪,通过扫描m种类型的标准样品,每种类型的标准样品扫描t个(例如60个)颗粒,可以得到m*t个颗粒的能谱数据。表1示例性地给出了第i个颗粒的一组能谱数据。CuZnSiPbFeSAlPMgBrCrMnSn003.944095.2470000000.8090表1在表1中,第一行的符号代表相应的元素名称,第二行的数字代表该元素在颗粒i中的百分比含量。由于扫描的是标准样品颗粒,因此每组能谱数据对应的颗粒类型是已知的。可以将这些标准样品颗粒的能谱数据及其对应的颗粒类型作为训练集数据。在步骤204中,实施对训练集数据的预处理。例如,可以对所有的能谱数据进行归一化处理。假设训练集数据中总共包括P种主要元素(在该示例中,如表1所示P=13)。这里可以根据预设的规则来确定主要元素,例如,可以认为百分比含量>0.1%以上的才是主要元素。对于第p种元素(p=1,2,…,P),通过找到训练集数据中所有样品颗粒的该元素原始含量的最大值xp,max和最小值xp,min,可以利用公式(1)来实现元素含量的归一化处理。其中,xi,p,orignal表示颗粒i中的第p种元素的原始含量,xi,p,norm表示颗粒i中的第p种元素的归一化含量,并且i=1,2,…,m*t。对于颗粒i而言,可以通过向量xi来表示其所有主要元素的含量,并且向量xi的维度P取决于所有颗粒的主要元素的个数(例如13个)。在步骤206中,对训练集进行划分。例如,将归一化的m*t组能谱数据随机划分为q个(例如3个)训练集,并且每个训练集含有组能谱数据及其对应的颗粒类型。特别地,在经划分的每个训练集中仍然含有m种颗粒类型,因此,每个训练集的能谱数据依旧能够体现所有相关的颗粒类型。在步骤208中,为训练网络选择适当的核函数。考虑到当前的能谱数据线性不可分,因此可以利用核函数,将线性不可分的数据映射到高维从而线性可分。举例来说,可以使用如公式(2)中所示的高斯函数作为核函数。其中,核函数k(z1,z2)是作为输入参数的两个向量z1和z2在隐式映射过后的空间中的内积函数表示,σ是核函数的控制参数。可以将归一化的能谱数据(例如向量xi)作为核函数的输入参数,通过核函数来简化映射空间中的内积运算,从而避开直接在高维空间中的运算。换句话说,可以认为核函数是支持向量的内积的表达形式。在步骤210中,选择核函数的相关参数。根据前面结合图1的描述可知,SVM分类的过程涉及找到分类超平面f=wTxi+b,该分类超平面离数据点的间隔越大,则确信度越高,因而需要寻找几何间隔最大的超平面。通过数学变换,SVM分类算法可变为通过对公式(3)进行求解来实现对输入数据的分类。s.t.yi(wTxi+b)≥1-εi,i=1...n(3)其中,εi是为了处理数据中的噪声而引入的松弛变量,其控制数据或数据点偏离超平面的程度对分类的影响;i是样本标号;n是样本总数;C是权重因子;向量w和常量b是与分类超平面相关的参数(例如,在二维空间中,w是斜率,b是截距),wT表示向量w的转置,||w||表示范数;向量xi是待分类对象的已知数据(例如第i个颗粒的能谱数据);而yi是分类结果。这样,对于SVM神经网络,需要确定两个变量:核函数变量σ和松弛变量εi。在步骤212中,引入高维拉格朗日表达式,以便确定训练网络的参数。举例来说,对于每个(σ,εi)的组合,都可以通过拉格朗日分解,将公式(3)转换为公式(4)。其中,L(w,b,αi)是拉格朗日表达式;αi是表达式的系数;γi是几何间隔,其表示数据离超平面的距离。这样,SVM神经网络的训练过程便可以理解为将训练数据带入拉格朗日表达式求解出系数αi的过程。举例来说,通过计算可以将公式(4)转换为如公式(5)所示的目标函数。其中,<xi,xj>表示向量xi和xj的内积;i和j表示同一训练集中的不同样本标号(诸如第i个颗粒和第j个颗粒)。在步骤214中,进行SMO求解过程。举例来说,通过迭代的方式,选取一对αi和αj(例如按照启发式的选取方式),再固定除了αi和αj之外的其它参数,确定w极值条件下的αi,然后αj由αi表示。如果满足所有约束条件,则结束SMO求解过程,否则,更新αi,继续进行迭代计算。在步骤216中,为了达到训练网络的更好的准确性,可以通过交叉验证来得到最优的(σ,εi)的组合。例如,可以将3个训练集的训练数据带入拉格朗日表达式。针对每个(σ,εi)的组合,当带入训练数据后,可得到一组αi,并由此确定相应的SVM训练网络。因此,对于3个训练集的交叉验证,首先将第1、2组数据合并为训练集,计算得到αi,再将第3组数据作为验证集,带入具有该αi值的训练网络,得到预测结果,通过将预测结果与实际结果(即已知的分类结果)进行比较,可以得到第一个准确率。保持(σ,εi)不变,再分别将第2、3组数据,第1、3组数据作为训练集,余下一组作为验证集,得到另外两个准确率。可以选取这三个准确率的平均值作为该组(σ,εi)的准确率。可以尝试不同的(σ,εi)组合(例如随机选取(σ,εi)组合),通过重复步骤210-216,直到得到最优(即预测准确率最高)的(σ,εi)组合,或者直到得到预测准确率超过指定门限(例如准确率>90%)的一组(σ,εi),作为最终确定的最优(σ,εi)组合。在步骤218中,将所有训练集数据带入拉格朗日表达式,从而确定经优化的训练网络的参数。举例来说,根据在步骤216中确定的最优(σ,εi)组合,并且在步骤218中将所有训练集数据(例如每种颗粒类型的60个颗粒样本)全部带入拉格朗日表达式,那么在步骤220中,通过SMO方法,可以计算得到αi的系数,并在步骤222中将其保存为训练网络的参数。实际上,在SVM算法中,只有所谓的“支持向量”的对应αi才有意义,大部分的αi等于0。利用如图2所示的训练过程以及相应的步骤,可以确定用于对观测对象进行分类的神经网络。可以理解,经训练的神经网络及其相关参数可被保存到预先确定的存储位置,并且可选地,可以根据需要对其进行相应的更新(例如,更新与神经网络相关的一个或多个参数、分类准则和/或算法),从而使得分类预测更为便捷和准确。图3依照本发明的示例性实施例示出了神经网络预测过程。利用如图2所示的过程训练得到的神经网络(例如SVM神经网络),可以分析和确定观测对象的相应类别。为了获得与观测对象(诸如颗粒)有关的信息,在步骤302中,扫描整张滤膜图像。例如,通过扫描型电子显微镜,可以得到整张滤膜的图像,该图像含有滤膜和滤膜上的颗粒的相关信息。在步骤304中,提取颗粒位置信息。通过适当的图像处理方法,例如根据灰度值和梯度值,可以自动提取出滤膜上颗粒的轮廓,从而得到颗粒在图像上的位置。举例来说,在扫描滤膜图像时,可以记录载物台的位置信息(例如与图像有关的坐标和缩放比例),这样就可以结合图像而得到每个颗粒在载物台上的坐标。在步骤306中,获取颗粒能谱信息。根据在步骤304中获得的颗粒位置信息,将颗粒移动到电子显微镜电子枪的焦点处,利用能谱仪,可以得到颗粒的能谱信息(例如,颗粒中每种元素所占的比例)。在步骤308中,将能谱信息输入神经网络(诸如SVM神经网络)。举例来说,输入SVM神经网络的能谱信息可以是经归一化处理后的颗粒的元素比例。这里采用的归一化方法与训练神经网络时所采用的归一化方法相同。在步骤310中,实施神经网络预测。对于训练好的神经网络,其所采用的分类预测算法的相关参数是已经确定的,因而可以根据合适的输入数据来输出相应的分类预测结果。举例来说,在SVM神经网络中,可以利用诸如这样的涉及分类预测的表达式。由于已经在网络训练过程中确定了系数αi和核函数k(xi,x)中的变量σ,而b是已知的参数,xi和yi是训练集数据,因此,将待测颗粒的能谱数据x带入该表达式进行计算,并结合预先确定的分类判定准则(例如,利用SVM分类算法中的超平面),可以得到对该颗粒的分类预测结果。通过重复步骤304-310,可以对逐个扫描的所有颗粒实施相应的神经网络分类预测。在步骤312中,输出预测结果。根据针对所有颗粒的预测结果,可以得到所有颗粒的分类数据。结合图1-图3的描述可以看出,根据本发明示例性实施例所提出的方案通过利用基于神经网络的分类策略(例如SVM神经网络算法),可以简化用于观测对象的分类数据库建立的过程,并且能够达到较高(例如大于90%)的分类准确性。根据本发明的示例性实施例,在制备训练集数据和/或测试集数据的过程中,可以将样品放入电子显微镜依次扫描。可选地,通过适当的图像处理方法,可以将样品划分成位于不同区域的颗粒。通过能谱仪可以得到不同颗粒的能谱信息。举例来说,针对每种样品,可以扫描大约500-1000个颗粒。从每个样品/区域获得的数据中,可以随机选择例如50个颗粒的能谱数据作为训练集,余下颗粒的能谱数据作为测试集。这样,对于训练集和测试集,均可以得到相应的能谱数据及其对应的正确颗粒分类。可以利用训练集的对应的正确颗粒分类来训练神经网络,并且可以利用测试集的对应的正确颗粒分类来验证经训练的神经网络的分类准确性。通过将训练集和测试集的能谱数据进行归一化处理,可以利用训练集数据来训练神经网络(例如根据图2所示的过程来训练SVM网络)。表2示例性地给出了两种类型(样品1和样品2)的样品颗粒的能谱数据(无数值表示含量为0),其中每种类型包括5个样品颗粒。CuZnSiPbFeSAlPMgBrCrMnSn样品3.94495.2470.80913.87895.2490.87313.72494.5370.4130.4460.8813.28795.6121.10113.6495.4190.94178.47617.3212.8081.1250.271278.78317.6462.4240.860.286279.3317.442.830.2860.1279.36217.4582.5730.360.248279.36617.5472.8130.2742表2按照本发明示例性实施例所描述的神经网络训练方法(例如SVM网络训练方法),可以选定高斯函数作为核函数,利用训练集数据来训练神经网络,通过交叉验证的方式得到最优的网络参数(例如核函数变量σ和松弛变量εi),并保存完成训练的神经网络。将测试集数据输入训练好的神经网络,可以自动获得相应的分类预测结果。在该示例中,对于测试集的颗粒,由于其对应的正确分类也是已知的,因此,将正确的分类与经由神经网络预测的分类进行比较,可以得到基于神经网络的分类预测的准确性。表3示例性地给出了对于神经网络分类预测的评估结果,其中针对不同材料列出了相应的主要元素、每组材料测试集的样本个数(例如颗粒总数)、错误数量、主要错误分类(例如误判类别)以及分类准确率。表3从表3中示出的评估结果可以看出,根据本发明示例性实施例所提出的基于神经网络的分类策略的准确率大部分都在95%左右,达到了相当高的准确性。此外,在实现根据本发明示例性实施例的分类方案时,无需人工参与或干涉,也无需知道观测对象或待测样品本身的材料构成,便可以根据观测对象(诸如颗粒)的能谱信息来自动地对该观测对象进行分类。这不仅避免了对繁琐和复杂的分类规则及数据库的建立,而且还以高效省时的方式提供了良好的分类性能。图4依照本发明的一示例性实施例示出了用于分析观测对象的类别的装置400的示意图。举例来说,可以将装置400部署或设计成独立的分析设备,或者将装置400部署或集成到显微镜和/或能谱仪等设备,以便实现依照本发明示例性实施例的方案。在示例性实施例中,装置400可以是显微镜的至少一部分或者在通信上耦合于显微镜。如图4所示,装置400可以包括信息获取模块401、分类预测模块402和类别确定模块403。根据本发明的示例性实施例,信息获取模块401可用于获取一个或多个观测对象的特征信息。分类预测模块402可用于根据所述一个或多个观测对象的特征信息,利用基于神经网络的分类策略来实施对所述一个或多个观测对象的分类预测。类别确定模块403可用于至少部分地基于所述分类预测的结果,确定所述一个或多个观测对象的相应类别。可以理解,可对图4中所示的装置400的模块进行添加、删除、替换、合并和/或拆分,以便实现如结合图1-3所示的方法步骤和/或功能。举例来说,信息获取模块401可以独立地或者借助于一个或多个子模块来收集所述一个或多个观测对象的位置信息,其中,所述位置信息指示了所述一个或多个观测对象的位置;以及根据所述位置信息来提取所述一个或多个观测对象的特征信息。分类预测模块402可以独立地或者借助于一个或多个子模块,通过网络训练过程来定义特征信息与对象类别之间的映射关系。可选地或附加地,类别确定模块403可以独立地或者借助于一个或多个子模块,利用所确定的一个或多个观测对象的相应类别来指示以下至少一项:所述一个或多个观测对象的来源、所述一个或多个观测对象的材质,以及所述一个或多个观测对象的组成部分。图5依照本发明的另一示例性实施例示出了用于分析观测对象的类别的装置500的示意图。举例来说,可以将装置500部署或设计成独立的分析设备,或者将装置500部署或集成到显微镜和/或能谱仪等设备,以便实现依照本发明示例性实施例的方案。在示例性实施例中,装置500可以是显微镜的至少一部分或者在通信上耦合于显微镜。如图5所示,装置500可以包括至少一个处理器501,以及包括计算机程序代码502的至少一个存储器503。所述至少一个存储器503和所述计算机程序代码502可配置为与所述至少一个处理器501一起使得装置500执行结合图1-3所描述的方法步骤和/或功能。举例来说,处理器501可以经由用于在装置500的组件之间传递信息的总线来与存储器503进行通信。存储器503例如可以包括易失性和/或非易失性存储器。存储器503可以被配置为存储信息、数据、内容、应用、指令等,用于使装置500能够根据本发明的示例性实施例执行各种功能。处理器501可以通过多种不同的方式来体现。例如,处理器可被体现为各种硬件处理构件中的一个或多个,所述硬件处理构件例如是协处理器、微处理器、控制器、数字信号处理器(DSP)、具有或不具有随附DSP的处理元件,或者各种其它处理电路,所述其它处理电路包括例如像专用集成电路(ASIC)、现场可编程门阵列(FPGA)、微控制器单元(MCU)、硬件加速器或专用计算机芯片等这样的集成电路。如此,在某些实施例中,所述处理器可以包括一个或多个被配置为独立地执行的处理核心。多核处理器可以在单个物理封装内实现多处理。附加地或可选地,所述处理器可以包括一个或多个被配置为经由总线串联的处理器,以便实现指令、流水线和/或多线程的独立执行。在示例性实施例中,处理器501可被配置为执行存储在存储器503中或以别的方式对所述处理器501来说可访问的指令。可选地或附加地,所述处理器可被配置为执行硬编码功能。如此,不论通过硬件或软件方法还是通过其组合进行了配置,所述处理器均可以表示当进行了相应的配置时能够实施根据本发明示例性实施例的操作的实体(例如在物理上体现于电路中)。因而,例如,当所述处理器被体现为ASIC或FPGA等时,所述处理器可以是被专门配置用于引导在本文中描述的操作的硬件。可选地,作为另一示例,当所述处理器被体现为软件指令的执行器时,所述指令可以将处理器专门配置为当所述指令被执行时实施在本文中描述的方法和/或操作。所述处理器特别可以包括被配置为支持所述处理器的操作的时钟、算术逻辑单元(ALU)和逻辑门。将会理解的是,流程图的每个方框以及流程图中的方框组合可以由各种装置(例如硬件、固件、处理器、电路和/或与执行包括一个或多个计算机程序指令的软件相关联的其它设备)来实现。例如,上述一个或多个过程可通过计算机程序指令来体现。就此而言,体现了上述过程的计算机程序指令可由采用本发明示例性实施例的装置500的存储器503进行存储,并由装置500的处理器501来执行。如可以理解的,任何这样的计算机程序指令均可以被加载到计算机或其它可编程装置(例如,硬件)以产生机器,从而使得所得到的计算机或其它可编程装置实现在流程图方框中所指定的功能。这些计算机程序指令也可以被存储于计算机可读存储器,其可引导计算机或其它可编程装置以特定方式运作,从而使得存储在计算机可读存储器中的指令产生制品,执行该制品实现了流程图方框中所指定的功能。计算机程序指令也可以被加载到计算机或其它可编程装置上以便使得一系列操作在所述计算机或其它可编程装置上实施,从而产生计算机实现的过程,由此使得在计算机或其它可编程装置上执行的指令提供用于实现流程图方框中所指定的功能的操作。因此,流程图的方框支持对用于实施指定功能的装置的组合以及对用于实施指定功能的操作的组合。还可以理解,流程图的一个或多个方框以及流程图中方框的组合可以由实施指定功能的基于专用硬件的计算机系统或者专用硬件和计算机指令的组合来实现。在一些示例性实施例中,上述的某些操作可被修改或进一步增强。此外,在一些示例性实施例中,可以包括附加的可选操作。上述操作的修改、添加或增强可以按照任何顺序和按照任何组合来实施。受益于在前述描述和关联附图中所呈现的教导的本发明所属领域的技术人员将想到在此阐述的本发明的很多修改和其它实施例。因此,应当理解,本发明将不限于所公开的具体实施例,并且旨在将所述修改和其它实施例包括在所附权利要求的范围之内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1