无监督降维密度聚类的农作物供应链危害物风险判断方法及系统

文档序号：26010143发布日期：2021-07-23 21:30阅读：来源：国知局

技术特征：

1.一种无监督降维密度聚类的农作物供应链危害物风险判断方法，其特征在于，所述方法包括：

获取数据样本集合，所述数据样本集合中包含有风险指标；

对所述数据样本集合中的风险指标进行向量编码化及标准归一化预处理获得包含有标准化数据向量的数据样本集合；

对所述包含有标准化数据向量的数据样本集合进行特征降维，获得包含有高维度特征向量的数据样本集合；

对所述包含有高维度特征向量的数据样本集合进行聚类计算筛选获得风险等级聚类中心；

对所述风险等级聚类中心周边数据进行邻域搜索，获得风险判断结果。

2.根据权利要求1所述的方法，其特征在于，所述对所述数据样本集合中的风险指标进行向量编码化及标准归一化预处理获得包含有标准化数据向量的数据样本集合的过程包括：

对所述数据样本集合中的每列风险指标的不同类型的特征值进行二值化处理；

对二值化处理后输出的数据进行权重嵌入获得向量特征；

对所述向量特征中的数值型属性特征进行线性变换获得归一化数据；

对所述归一化数据进行正态分布标准化处理，将数值型属性特征聚合到均值为0、方差为1的近似正态分布状态，获得包含有标准化数据向量的数据样本集合。

3.根据权利要求1所述的方法，其特征在于，所述对所述包含有标准化数据向量的数据样本集合进行特征降维，获得包含有高维度特征向量的数据样本集合的过程包括：

将所述包含有标准化数据向量的数据样本集合中线性不可分的标准化数据向量映射至高维非线性特征空间中；

通过核函数对映射至高维非线性特征空间中的标准化数据向量的主成成分分量进行分析获得隶属度；

根据所述隶属度获得每个标准化数据向量距离正类和负类的类中心，根据所述标准化数据向量在高维非线性特征空间中的样本点到正类和负类之间的欧氏距离获得所述标准化数据向量的隶属情况；

根据所述标准化数据向量的隶属情况提取出所述标准化数据向量的主成分与核心风险因数，并对所述标准化数据向量的主成分与核心风险因数进行整理后获得包含有高维度特征向量的数据样本集合。

4.根据权利要求1所述的方法，其特征在于，所述对所述包含有高维度特征向量的数据样本集合进行聚类计算筛选获得风险等级聚类中心的过程包括：

对所述包含有高维度特征向量的数据样本集合中的高维度特征向量的各分量进行距离标准化处理，并根据密度峰值聚类计算所述高维度特征向量的各分量的局部密度和较高密度距离差值，获得所述高维度特征向量的局部密度值和高密度距离最小值；

根据所述高维度特征向量的局部密度值和高密度距离最小值构建综合评价函数，根据所述综合评价函数获得风险等级聚类中心。

5.根据权利要求4所述的方法，其特征在于，所述对所述风险等级聚类中心周边数据进行邻域搜索，获得风险判断结果的过程包括：

对所述风险等级聚类中心周边数据进行领域搜索，将所述风险等级聚类中心周边的所述高维度特征向量的局部密度值和高密度距离最小值进行排序，获得排序结果；

根据所述排序结果对噪音点进行剔除，获得风险判断结果。

6.一种无监督降维密度聚类的农作物供应链危害物风险判断系统，其特征在于，所述系统包括处理器，所述处理器，其被配置有处理器可执行的操作指令，以执行如下操作：

获取数据样本集合，所述数据样本集合中包含有风险指标；

对所述数据样本集合中的风险指标进行向量编码化及标准归一化预处理获得包含有标准化数据向量的数据样本集合；

对所述包含有标准化数据向量的数据样本集合进行特征降维，获得包含有高维度特征向量的数据样本集合；

对所述包含有高维度特征向量的数据样本集合进行聚类计算筛选获得风险等级聚类中心；

对所述风险等级聚类中心周边数据进行邻域搜索，获得风险判断结果。

7.根据权利要求6所述的系统，其特征在于，所述处理器，其被配置有处理器可执行的操作指令，以执行如下操作：

对所述数据样本集合中的每列风险指标的不同类型的特征值进行二值化处理；

对二值化处理后输出的数据进行权重嵌入获得向量特征；

对所述向量特征中的数值型属性特征进行线性变换获得归一化数据；

8.根据权利要求6所述的系统，其特征在于，所述处理器，其被配置有处理器可执行的操作指令，以执行如下操作：

将所述包含有标准化数据向量的数据样本集合中线性不可分的标准化数据向量映射至高维非线性特征空间中；

通过核函数对映射至高维非线性特征空间中的标准化数据向量的主成成分分量进行分析获得隶属度；

9.根据权利要求6所述的系统，其特征在于，所述处理器，其被配置有处理器可执行的操作指令，以执行如下操作：

根据所述高维度特征向量的局部密度值和高密度距离最小值构建综合评价函数，根据所述综合评价函数获得风险等级聚类中心。

10.根据权利要求9所述的系统，其特征在于，所述处理器，其被配置有处理器可执行的操作指令，以执行如下操作：

根据所述排序结果对噪音点进行剔除，获得风险判断结果。

技术总结
本发明提出了一种无监督降维密度聚类的农作物供应链危害物风险判断方法，所述方法包括：获取数据样本集合，所述数据样本集合中包含有风险指标；对所述数据样本集合中的风险指标进行向量编码化及标准归一化预处理获得包含有标准化数据向量的数据样本集合；对所述包含有标准化数据向量的数据样本集合进行特征降维，获得包含有高维度特征向量的数据样本集合；对所述包含有高维度特征向量的数据样本集合进行聚类计算筛选获得风险等级聚类中心；对所述风险等级聚类中心周边数据进行邻域搜索，获得风险判断结果。本发明能够对不同农作物及食品的风险情况进行分级评估。

技术研发人员：孔建磊;杨成才;王小艺;金学波;王建利;李柳生
受保护的技术使用者：北京工商大学
技术研发日：2021.04.12
技术公布日：2021.07.23

完整全部详细技术资料下载

当前第2页1 2