本说明书广泛但非排他地涉及用于物质的异常检测的方法、装置和计 算机可读介质。
背景技术:
1、食品掺假对于公共健康来说有重大风险。遭遇食品掺假的一些常见食 品包括橄榄油、牛奶、蜂蜜、藏红花、橙汁、咖啡、苹果汁、葡萄酒、香 草精和枫糖浆。以牛奶为例,2008年婴儿配方奶粉被三聚氰胺污染的事件 表明由于食品掺假而造成的不良影响有多严重。通过依赖蛋白质的规范, 欺诈者在牛奶蛋白质中掺入富含氮的化合物,以使蛋白质值看起来是真实 的。其他重大事件包括2013年在英国、爱尔兰和欧洲发生的马肉丑闻,其 中宣传为含有牛肉的食品被发现为含有未声明的马肉,以及2009年在意 大利发生的销售假冒橄榄油。因此,期望一个有效的协议来检测以前未遇 到的掺杂物。
2、尽管有全球合作,但是目前的检测方法实际上是如各个地方法律部门 所规定的目标导向的。例如,中国在gb 19301-2010中定义了来自奶牛的 原料乳的国家标准。由于所有分析都在寻求特定的化学物质和浓度,因此 新设计的和以前未知的掺杂物可以规避现有目标导向的(或有针对性的, 如在本申请中可互换使用的)检验方法,从而构成严重威胁。然而,不可 能利用所有可用的检验方法来检验产品,更不用说目前食品工业中使用的质量评估方法通常很昂贵、需要专门的基础设施、而且是劳动密集型的。
3、因此,期望一种有效的非目标导向(或非针对性的,如在本申请中可 互换使用的)协议来检测以前未遇到的掺杂物(即物质中的异常)。
技术实现思路
1、根据一个方面,提供了一种用于物质的异常检测的方法。该方法包括: 获得第一组化学指纹,其中第一组化学指纹的每个化学指纹均指示该物质 的一组正常样品中的每个样品的多个物理化学特性;将第一组化学指纹转 换为多维主成分分析(pca)图中的数据点群集,其中多维pca图的每个 维度均基于主成分(pc),每个pc均对应于多个物理化学特性中的一个物 理化学特性;将数据点群集的轮廓图案构建为预测模型,该预测模型被配置为将具有落在轮廓图案的外部的化学指纹的新样品识别为异常;以及使 用第二组化学指纹优化预测模型,其中第二组化学指纹指示包括物质的多 个正常检验样品和多个异常检验样品的一组检验样品的多个物理化学特 性。
2、根据另一方面,提供了一种用于物质的异常检测的装置。该装置包括: 至少一个处理器;以及存储器,该存储器包括用于由至少一个处理器执行 的计算机程序代码,计算机程序代码指示该至少一个处理器来:获得第一 组化学指纹,其中第一组化学指纹的每个化学指纹均指示该物质的一组正 常样品中的每个样品的多个物理化学特性;将第一组化学指纹转换为多维 主成分分析(pca)图中的数据点群集,其中多维pca图的每个维度均基于主成分(pc),每个pc均对应于多个物理化学特性中的一个物理化学特 性;将数据点群集的轮廓图案构建为预测模型,该预测模型被配置为将具 有落在轮廓图案的外部的化学指纹的新样品识别为异常;以及使用第二组 化学指纹优化预测模型,其中第二组化学指纹指示包括该物质的多个正常 检验样品和多个异常检验样品的一组检验样品的多个物理化学特性。
1.一种用于物质的异常检测的方法,该方法包括:
2.根据权利要求1所述的方法,其特征在于,所述轮廓图案的构建包括:
3.根据权利要求2所述的方法,其特征在于,间隔的预定数量为20,数据点的预定数量为1000。
4.根据权利要求1所述的方法,其特征在于,所述预测模型的优化包括:
5.根据权利要求4所述的方法,其特征在于,确定所述阈值平方md分数包括:
6.根据权利要求5所述的方法,其特征在于,所述灵敏度值是基于以下等式计算的:
7.根据权利要求5所述的方法,其特征在于,所述总体准确度是基于以下等式计算的:
8.根据权利要求5所述的方法,其特征在于,还包括:
9.根据权利要求5所述的方法,其特征在于,还包括:
10.根据权利要求1所述的方法,其特征在于,所述物质是牛奶。
11.一种用于物质的异常检测的装置,该装置包括:
12.根据权利要求11所述的装置,其特征在于,在构建所述轮廓图案期间,所述计算机程序代码进一步指示所述至少一个处理器,以:
13.根据权利要求12所述的装置,其特征在于,间隔的预定数量为20,数据点的预定数量为1000。
14.根据权利要求11所述的装置,其特征在于,在所述预测模型的优化期间,所述计算机程序代码进一步指示所述至少一个处理器,以:
15.根据权利要求14所述的装置,其特征在于,在确定所述阈值平方md分数期间,所述计算机程序代码进一步指示所述至少一个处理器,以:
16.根据权利要求15所述的装置,其特征在于,所述灵敏度值是基于以下等式计算的:
17.根据权利要求15所述的装置,其特征在于,所述总体准确度是基于以下等式计算的:
18.根据权利要求15所述的装置,其特征在于,所述计算机程序代码进一步指示所述至少一个处理器,以:
19.根据权利要求11所述的装置,其特征在于,所述物质是牛奶。
20.一种其上编码有指令的非暂时性计算机可读存储介质,当所述指令由处理器执行时,使所述处理器执行根据权利要求1所述的用于物质的异常检测的方法中的一个或多个步骤。