物质成分检测方法、装置和检测设备与流程

文档序号:14480349阅读:437来源:国知局

本发明实施例涉及物质成分检测领域,例如涉及一种物质成分检测方法、装置和检测设备。



背景技术:

近年来,物质检测设备应用日趋广泛,包括安检中检测可疑物品、药监局检测药品成分、防化部队进行爆炸现场勘查等专业领域,也包括检测农药残留、检测是否存在三聚氰胺、检测地沟油和真假酒等民用领域,尤其在食品安全领域得到广泛应用。目前的检测设备,例如拉曼检测终端,采用拉曼光谱分析的方法,能够比较快速和准确的检测出物质分子成分。

在实现本发明过程中,发明人发现相关技术中至少存在如下问题:在使用拉曼检测终端进行混合物的检测时,限于算法本身和设备计算能力的问题,检测过程较慢,效率低下。



技术实现要素:

本发明实施例的一个目的是提供一种新的物质成分检测方法、装置和检测设备,在用于检测混合物的成分时,能快速检测出混合物的成分。

第一方面,本发明实施例提供了一种物质成分检测方法,所述检测方法应用于检测设备,所述方法包括:

获取待检测物质的光谱信息;

将所述光谱信息匹配预先获取的基于机器学习算法的预测模型,获取所述待检测物质的组成成分,所述基于机器学习算法的预测模型,通过输入多种物质的光谱信息和所述物质的组成成分训练形成。

第二方面,本发明实施例还提供了一种物质成分检测装置,所述检测装置应用于检测设备,所述装置包括:

光谱测量模块,用于获取待检测物质的光谱信息;

物质成分获取模块,用于将所述光谱信息匹配预先获取的基于机器学习算法的预测模型,获取所述待检测物质的组成成分,所述基于机器学习算法的预测模型,通过输入多种物质的光谱信息和所述物质的组成成分训练形成。

第三方面,本发明实施例还提供了一种检测设备,包括:

至少一个处理器;以及,

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的方法。

本发明实施例提供的物质成分检测方法、装置和检测设备,通过获取待检测物质的光谱信息,然后将该光谱信息匹配基于机器学习算法的预测模型,由于基于机器学习算法的预测模型通过输入多种物质的光谱信息和所述物质的组成成分训练而成,因此将待检测物质的光谱信息匹配基于机器学习算法的预测模型,就能获得对待检测物质的组成成分的预测结果。本发明实施例将机器学习算法与光谱识别相结合,摒弃了传统的算法,提高了识别速度,使物质检测的效率得以大幅提升。

附图说明

一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。

图1a是本发明方法和装置的应用场景示意图;

图1b是本发明方法和装置的应用场景示意图;

图2是本发明检测方法的一个实施例的流程图;

图3是本发明检测方法的一个实施例中预先获取基于机器学习算法的预测模型步骤的流程图;

图4是物质的拉曼光谱示意图;

图5是本发明检测方法的一个实施例中获取语音命令步骤的流程图;

图5是本发明检测方法的一个实施例的流程图;

图6是本发明检测装置的一个实施例的结构示意图;

图7是本发明检测装置的一个实施例的结构示意图;

图8是本发明检测装置的一个实施例的结构示意图;以及

图9是本发明实施例提供的检测设备的硬件结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例提供了一种基于机器学习算法检测物质成分的检测方案,适用于图1a和图1b所示的应用场景。在图1a所示的应用场景中,包括待检测物质10、检测终端21和检测设备20,其中,检测终端21用于获得待检测物质10的光谱信息,然后将待检测物质10的光谱信息传送给检测设备20。检测设备20用于根据待检测物质10的光谱信息进行组成成分识别。检测终端21与检测设备20之间可以通过网络30互相通信,其中,网络30可以是例如家庭或公司的局域网,或一个特定网络等。检测终端21和检测设备20具有至少一个网络接口,与网络30建立通信连接。检测设备20可以是与检测终端21通过网络相连的云端服务器或者其他服务器。如图1b所示,检测设备20也可以将检测终端的功能集成在检测设备20中,由检测设备20单独完成从待检测物质10获取待检测物质10的光谱信息,并通过该光谱信息获取待检测物质的成分。

检测设备20预先将预设的单物质光谱库(预设的单物质光谱库为大数据库,包含多种单物质及其对应的光谱信息)中的单物质按照不同组成和不同占比获取大量的混合物以及混合物对应的光谱信息,然后将大量混合物的组成成分和混合物的光谱信息作为输入,基于机器学习算法进行模型训练,获取基于机器学习算法的预测模型。该预测模型基于机器学习算法和大量混合物光谱信息和组成成分的数据,因此当获取待检测物质的光谱信息后,将该光谱信息匹配该预测模型就能获得待检测物质的组成成分预测结果。本方案将机器学习算法与光谱识别相结合,摒弃了传统的算法,使物质检测的效率得以大幅提升。

需要说明的是,在实际应用过程中,该应用场景还可以包括更多的待检测物质10和检测设备20以及检测终端21。

本发明实施例提供了一种物质成分检测方法,所述物质成分检测方法可由图1a和图1b中的检测设备20执行,如图2所示,所述物质成分检测方法包括:

步骤101:获取待检测物质的光谱信息;

本发明实施例中的光谱识别方法可以采用拉曼光谱识别方法、红外光谱识别方法或者其他任何一种光谱识别方法,即所述光谱信息可以为拉曼光谱、红外光谱等。

步骤102:将所述光谱信息匹配预先获取的基于机器学习算法的预测模型,获取所述待检测物质的组成成分,所述基于机器学习算法的预测模型,通过输入多种物质的光谱信息和所述物质的组成成分训练形成。

机器学习算法具有自学习功能,把大量不同物质的光谱信息和组成成分作为输入,训练预测模型,预测模型就会通过自学习功能,学会根据物质的光谱信息识别物质的组成成分。

因此将待检测物质的光谱信息匹配基于机器学习算法的预测模型,就能获得对待检测物质的组成成分的预测结果。其中,作为输入的多种物质可以是单物质也可以是混合物。考虑到现实生活中的物品基本都是以混合物的形式存在,所以也可以只将混合物的光谱信息和混合物的组成成分作为输入进行模型训练。

在实际应用中,返回的对所述待检测物质的组成成分的预测结果有可能为一个,也有可能为多个。预测结果为多个时,需要确认每个预测结果所占的概率。如果某个预测结果的概率最大且超过预设阈值,则确认该预测结果为待检测物质的成分;否则,将各预测结果中预设数量的概率相对较大的预测结果的共有成分作为所述待检测物质的成分。

例如,返回的预测结果为:y+a、y+b、y+c+d、…,如果y+a的概率最大且概率超过预设阈值,则可以直接将预测结果y+a作为最终结果,即作为待检测物质的成分。

如果y+a的概率最大但是概率没有超过预设阈值,如果预设数量为3,且y+a、y+b、y+c+d的概率相对其他预测结果大,则将y+a、y+b、y+c+d的共有成分y作为最终结果。

本发明实施例将机器学习算法与光谱识别相结合,摒弃了传统的算法,提高了识别速度,使物质检测的效率得以大幅提升。

为了提高模型预测的准确性,该模型训练需要基于大量数据进行训练。因此应用中,可以预设一个包含大量单物质和其对应的光谱信息的单物质光谱库,从该单物质光谱库中选取单物质,按照不同组成和不同比例组成混合物作为输入,进行模型训练。请参照图3,检测设备预先获取基于机器学习算法的预测模型时,执行以下步骤:

步骤201:从预设的单物质光谱库中获取各单物质的光谱信息;

如图4所示,为两种粉末状物质的拉曼光谱示意图,而实际应用中,检测设备实际获取的光谱信息是与光谱曲线对应的一组数据,示例如下:

00.002010

20.001219

……

12080.012633

12100.003053

12120.000525

……

19980.001028

20000.001232

每一组的第一个数字对应横坐标,第二个数字对应纵坐标。以拉曼物质检测设备为例,横坐标的步进一般来说为2,横坐标一般取1000-2000个点。

步骤202:将各单物质按照不同组成和不同占比进行混合,获得各混合物的光谱信息;

不同组成即混合物中包含单物质的种类,不同占比即混合物中各单物质的相对含量,也即每种单物质占混合物的比例。不同占比针对的是组成成分相同的混合物,即针对包含相同种类单物质的组合,按照每种单物质的占比不同,获得一组混合物。这样针对组成成分相同的混合物,有大量占比不同的数据作为输入进行模型训练,提高了组成成分识别的准确性。

步骤203:将各混合物的光谱信息和组成成分作为输入,基于机器学习算法进行模型训练,获得基于机器学习算法的预测模型。

即将步骤202中获取的混合物作为输入,基于机器模型算法,进行模型训练。其中,机器学习算法可以采用人工神经网络算法。人工神经网络是根据人的认识过程而开发出的一种算法,假如我们现在只有一些输入和相应的输出,而对如何由输入得到输出的机理并不清楚,那么我们可以把输入与输出之间的未知过程看成是一个“网络”,通过不断地给这个网络输入和相应的输出来“训练”这个网络,网络根据输入和输出不断地调节自己的各节点之间的权值来满足输入和输出。这样,当训练结束后,我们给定一个输入,网络便会根据自己已调节好的权值计算出一个输出。这就是神经网络的简单原理。

在本发明实施例中为了根据混合物的光谱信息(输入)识别混合物的组成成分(输出),先把大量不同混合物的光谱信息和组成成分输入人工神经网络,网络就会通过自学习功能,学会根据混合物的光谱信息识别混合物的组成成分。

具体的,在所述方法的某些实施例的步骤202中,可以列出各单物质的所有可能组合再基于不同比例获得混合物,如下:

步骤2021:获取预设单物质光谱库中各单物质的可能组合,或者,获取预设单物质光谱库中单物质组合种类不超过预设阀值的各单物质的可能组合;

获取单物质的所有可能组合的混合物,例如,假设单物质光谱库中有n种物质,则单物质的所有可能组合的混合物种类为其中,x为混合物中单物质的种类。在实际应用中,过多种物质的混合情况并不多见,或者说,即使真的是很多种物质混合,使用者一般仅关心含量多的前若干种,含量很少的成分对使用者并不一定有意义,因此可以设置混合种类的上限xmax,即预设阀值。那么,单物质的所有可能组合的混合物种类为预设阀值xmax的值可以根据实际需要设定。

步骤2022:根据每个组合中单物质的种类数量,按照预设的步进值,获取每个组合的多个混合比例;

即将步骤2021中每个种类的混合物按其所含单物质的不同含量获得一组成分相同含量不同的混合物。假设x种单物质分别为j1,j2…jx,将其占比按照一定的预设步进值以排列组合方式分别置为z1%,z2%…zx%。假设x为3,则此处初始z1,z2,z3可分别设置为99.98、0.01、0.01,99.97、0.02、0.01,…,99.97、0.01、0.02,以此类推做所有可能排列组合,直到z1,z2,z3的值变为0.01,0.01,99.98。该例中预设步进值为0.01,预设步进制也可以为其他值,本发明对此不做限制,步进值越小,则训练的样本越多,整个训练时间也就越长。

步骤2023:根据各单物质的可能组合和每个组合的多个混合比例,获取多个混合物;

步骤2024:将每个混合物的各个组成成分的光谱信息按照混合比例进行线性叠加,获得混合物的光谱信息。

仍以步骤2022中x种单物质分别为j1,j2…jx为例,j1,j2…jx的占比分别为z1%,z2%…zx%,分别获得单物质j1,j2…jx的光谱信息中某一相同横坐标对应的纵坐标分量值(即光谱强度值),将该纵坐标分量值按照混合比例(即占比)相加得到混合物质在该横坐标点的纵坐标值。例如,假设在横坐标a1处,j1,j2…jx的光谱强度值分别为b11,b12…b1x,则此混合物在横坐标a1处的光谱强度值为b11*z1%+b12*z2%+…+b1x*zx%。例如单物质1和单物质2混合,单物质1在横坐标950处的纵坐标为0.4,单物质2在横坐标950处的纵坐标为0.2,单物质1和单物质2的占比为3:7,则可以得出该混合物在横坐标950处的纵坐标为0.4*30%+0.2*70%=0.26。通过对横坐标上的每一个点求混合物的纵坐标光谱强度值,即可得到该混合物的拉曼光谱信息。

进一步的,在所述方法的其他实施例中,还可以根据待检测物质的组成成分获取待检测物质中各组成成分的占比,包括以下步骤:

如果检测结果只包含一种组成成分,则该组成成分的占比为100%。

如果检测结果判定所述待检测物质包括至少两种组成成分,则从预设的单物质光谱库中获取所述待检测物质中各组成成分的光谱信息;根据待检测物质的光谱信息和待检测物质中各组成成分的光谱信息,获取各组成成分在待检测物质中的占比。

即如果所述待检测物质为包括多个单物质的混合物,则从单物质光谱库中获取各单物质的光谱数据,并对该混合物的光谱数据进行拟合,得到各单物质在混合物中的占比。实际计算时,如果该混合物包括x种单物质,则只要取该混合物光谱数据的x–1个特征较明显的横坐标点(有波的横坐标点),即可通过求解(x-1)元一次方程得到各单物质的占比。

如图5所示,为所述方法的一个实施例的流程示意图,在该实施例中,所述方法包括:

步骤301:从预设的单物质光谱库中获取各单物质的光谱信息;

步骤302:获取预设单物质光谱库中各单物质的可能组合,或者,获取预设单物质光谱库中单物质组合种类不超过预设阀值的各单物质的可能组合;

步骤303:根据每个组合中单物质的种类数量,按照预设的步进值,获取每个组合的多个混合比例;

步骤304:根据各单物质的可能组合和每个组合的多个混合比例,获取多个混合物;

步骤305:将每个混合物的各个组成成分的光谱信息按照混合比例进行线性叠加,获得混合物的光谱信息。

步骤306:将各混合物的光谱信息和组成成分作为输入,基于机器学习算法进行模型训练,获得基于机器学习算法的预测模型。

步骤307:获取待检测物质的光谱信息;

步骤308:将所述光谱信息匹配预先获取的基于机器学习算法的预测模型,获取所述待检测物质的组成成分。

步骤309:根据待检测物质的组成成分获取待检测物质中各组成成分的占比。

相应的,本发明实施例还提供了一种物质成分检测装置,所述检测装置用于图1a或者图1b所示的检测设备,如图6所示,所述检测装置400包括:

光谱测量模块401,用于获取待检测物质的光谱信息;

物质成分获取模块402,用于将所述光谱信息匹配预先获取的基于机器学习算法的预测模型,获取所述待检测物质的组成成分,所述基于机器学习算法的预测模型,通过输入多种物质的光谱信息和所述物质的组成成分训练形成。

本发明实施例通过获取待检测物质的光谱信息,然后将该光谱信息匹配基于机器学习算法的预测模型,由于基于机器学习算法的预测模型通过输入多种物质的光谱信息和所述物质的组成成分训练而成,因此将待检测物质的光谱信息匹配基于机器学习算法的预测模型,就能获得对待检测物质的组成成分的预测结果。本发明实施例将机器学习算法与光谱识别相结合,摒弃了传统的算法,提高了识别速度,使物质检测的效率得以大幅提升。

可选的,在所述装置的其他实施例中,所述物质成分获取模块具体用于:

将所述光谱信息匹配预先获取的基于机器学习算法的预测模型,获取各针对待检测物质成分的预测结果及预测结果对应的概率;

如果预测结果的概率最大且超过预设阈值,则确认所述预测结果为待检测物质的成分;

否则,将各预测结果中预设数量的概率相对较大的预测结果的共有成分作为所述待检测物质的成分。

可选的,如图7所示,在所述装置的其他实施例中,所述检测装置500除了光谱测量模块502和物质成分获取模块503之外还包括:

预测模型获取模块501,用于预先获取基于机器学习算法的预测模型;

所述预测模型获取模块501具体用于:

从预设的单物质光谱库中获取各单物质的光谱信息;

将各单物质按照不同组成和不同占比进行混合,获得各混合物的光谱信息;

将各混合物的光谱信息和组成成分作为输入,基于机器学习算法进行模型训练,获得基于机器学习算法的预测模型。

可选的,在所述装置的某些实施例中,所述预测模型获取模块还用于:

获取预设单物质光谱库中各单物质的可能组合,或者,获取预设单物质光谱库中单物质组合种类不超过预设阀值的各单物质的可能组合;

根据每个组合中单物质的种类数量,按照预设的步进值,获取每个组合的多个混合比例;

根据各单物质的可能组合和每个组合的多个混合比例,获取多个混合物;

将每个混合物的各个组成成分的光谱信息按照混合比例进行线性叠加,获得混合物的光谱信息。

可选的,如图8所示,在所述装置的其他实施例中,所述检测装置600除了包括预测模型获取模块601、光谱测量模块602和物质成分获取模块603之外还包括:

成分含量获取模块604,用于根据待检测物质的组成成分获取待检测物质中各组成成分的占比;

所述成分含量获取模块604具体用于:

如果所述待检测物质包括至少两种组成成分,则从预设的单物质光谱库中获取所述待检测物质中各组成成分的光谱信息;

根据待检测物质的光谱信息和待检测物质中各组成成分的光谱信息,获取各组成成分在待检测物质中的占比。

可选的,在所述装置的某些实施例中,所述机器学习算法为人工神经网络学习算法。

需要说明的是,上述检测装置可执行本发明实施例所提供的检测方法,具备执行方法相应的功能模块和有益效果。未在检测装置实施例中详尽描述的技术细节,可参见本发明实施例所提供的检测方法。

图9是本发明实施例提供的检测设备20的硬件结构示意图,如图9所示,该检测设备20包括:

一个或多个处理器22以及存储器23,图9中以一个处理器22为例。

处理器22和存储器23可以通过总线或者其他方式连接,图9中以通过总线连接为例。

存储器23作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本发明实施例中的检测方法对应的程序指令/模块(例如,附图6所示的光谱测量模块401和物质成分获取模块402)。处理器22通过运行存储在存储器23中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的检测方法。

存储器23可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据检测装置的使用所创建的数据等。此外,存储器23可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器23可选包括相对于处理器22远程设置的存储器,这些远程存储器可以通过网络连接至检测装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

所述一个或者多个模块存储在所述存储器23中,当被所述一个或者多个处理器22执行时,执行上述任意方法实施例中的检测方法,例如,执行以上描述的图2中的方法步骤101至步骤102,图3中的方法步骤201至步骤203,图5中的方法步骤301至步骤309;实现图6中的模块401-402、图7中模块501-503,图8中模块601-604的功能。

上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。

本发明实施例提供了一种非易失性计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个处理器执行,例如图9中的一个处理器22,可使得上述一个或多个处理器可执行上述任意方法实施例中的检测方法,例如,执行以上描述的图2中的方法步骤101至步骤102,图3中的方法步骤201至步骤203,图5中的方法步骤301至步骤309;实现图6中的模块401-402、图7中模块501-503,图8中模块601-604的功能。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

通过以上的实施方式的描述,本领域普通技术人员可以清楚地了解到各实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬件。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明,它们没有在细节中提供;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1