一种基于自学习的煤岩识别方法与流程

文档序号:14774538发布日期:2018-06-23 02:44阅读:254来源:国知局

本发明涉及一种基于自学习的煤岩识别方法,属于煤岩识别领域。



背景技术:

煤岩识别即是用一种方法自动识别出煤或岩石,在煤炭生产过程中,煤岩识别技术可广泛应用于滚筒采煤、掘进、放顶煤开采、原煤选矸石等生产环节,对于减少采掘工作面作业人员、减轻工人劳动强度、改善作业环境、实现煤矿安全高效生产具有重要意义。

实际应用中已经有多种煤岩识别方法,包括自然γ射线探测法、雷达探测法、应力截齿法、红外探测法、有功功率监测法、振动检测法、声音检测法、粉尘检测法、记忆截割法等,但这些方法在实际应用中存在着如下问题:

1、需要在现有设备上加装各类传感器获取信息,导致装置结构复杂,成本高;

2、采煤机滚筒、掘进机等设备在生产过程中受力复杂、振动剧烈、磨损严重、粉尘大,传感器部署比较困难,容易导致机械构件、传感器和电气线路受到损坏,装置可靠性差;

3、对于不同类型机械设备,传感器的最佳类型和信号拾取点的选择存在较大区别,需要进行个性化定制,系统的适应性差。

为了解决上述问题,基于图像技术的煤岩识别方法不断被重视和研究,并取得了一定的成果,包括基于小波变换的煤岩识别方法,利用小波基提取煤岩图像特征进行分类识别;一种基于字典学习的煤岩识别方法,利用字典学习的方法提取煤岩图像的特征,它可以通过学习的方式得到基函数,适用性强;一种基于小波域非对称广义高斯模型的煤岩识别方法,利用改进的相对熵相似性测度实现煤岩特征的提取等,在这些煤岩识别技术中煤岩图像特征的提取是能否获得满意的识别率的关键因素,而高质量表达需要训练过程中有足量的样本,训练样本数量太少,一方面不能真实地反映出煤岩样本数据集的特征分布,因此训练得到的煤岩图像特征表达能力弱,不能达到理想的识别效果;另一方面训练样本太少,识别模型的训练容易过拟合致使泛化性能低,而在实际应用中获取大量的带标签煤岩图像样本费时费力。现有的半监督学习中,当现有的带标签训练样本数量不足时,需要在有类标签的训练样本数据集的基础上,加入大量同类的无标签样本图像辅助训练,节省了标记样本的开销,但对于煤岩这种难以获取的样本图像来说,半监督学习仍然有一定的局限性;而迁移学习中,要求源域样本与目标域存在一定的共有特征,在实际操作中存在一定的困难。

需要一种解决或至少改善现有技术中固有的一个或多个问题的煤岩识别方法,以提高煤岩识别率和识别稳定性。



技术实现要素:

因此,本发明的目的在于提供一种基于自学习的煤岩识别方法,该方法首先通过离线方式从辅助数据集获得图像的高层结构特征D=[d(1),d(2),…,d(j),…,d(p)]∈Rn×p,辅助数据集中的样本是无标签的非煤岩自然图像,与煤岩图像的特征分布完全无关,然后将煤岩图像表征为若干个高层特征原子di∈Rn的线性组合,线性组合的系数组成一个新的特征向量a(i)∈Rp作为煤岩图像的特征向量,实现了对煤岩图像的特征提取。该煤岩识别方法无需大量标记的煤岩图像样本,节省了获取、标记煤岩图像的开销,得到的煤岩特征向量具有很高的鉴别性和鲁棒性,得到了很好的识别效果,可为自动化采掘,自动化放煤,自动化选矸等生产过程提供可靠的煤岩识别信息。

根据一种实施例形式,提供一种基于自学习的煤岩识别方法,包括以下步骤:

S1.任意选取无标签的非煤岩自然图像共K张,组成辅助数据集同时采集带有标签的煤岩图像共M张,组成带有标记y(i)∈{0,1}的煤岩样本数据集

S2.利用辅助数据集F通过求解如下的优化问题从辅助数据集中获得图像的高层结构特征矩阵D=[d(1),d(2),…,d(j),…,d(p)]∈Rn×p,优化问题如下:

其中c(i)∈Rp表示第i个辅助数据样本的特征向量的权重系数,λ为正则化因子;

S3.利用步骤S2中得到的高层结构特征矩阵D,通过求解如下优化函数获取煤岩样本数据集T中每一个样本的特征向量a(i)∈Rp,由此得到一个新的带标记的煤岩图像样本集函数如下:

其中p(i)=[p(i1),p(i2),…,p(ip)],⊙代表向量对应元素相乘的运算;

S4.用样本集训练分类器;

S5.对于一张未知类别的煤岩图像x通过步骤S3得到它的特征向量a∈Rp,并将特征向量输入到步骤S4中训练好的分类器中,输出图像的类别(煤或岩)。

附图说明

通过以下说明,附图实施例变得显而易见,其仅以结合附图描述的至少一种优选但非限制性实施例的示例方式给出。

图1是本发明所述的煤岩识别方法的基本流程图。

具体实施方式

本发明公开了一种基于自学习局部约束线性编码的煤岩识别方法,图1是基于自学习局部约束线性编码的煤岩识别方法的流程图,参照图1进行具体描述:

S1.辅助数据集和煤岩样本数据集的获取和处理

A.从公共数据集微软人体姿态数据库MSRC Dataset中任意选取无标签的非煤岩自然图像K=300张,进行灰度化处理后,在每幅图像的中心截取大小为128×128像素的图像块,并拉伸为向量,为了提高训练效率,采用PCA降维算法降至64维向量,组成辅助数据集R∈R64×300

B.从煤岩识别任务的现场如采煤工作面采集不同照度,不同视点的煤岩图像M=200张,并经过灰度化处理,其中煤和岩各100张,在每张煤岩图像的中心截取60×60像素的子图像,并将每张子图像拉伸为3600维的列向量,再通过PCA算法降维到64维,将这些列向量组成煤岩样本数据集T∈R64×200

S2.利用辅助数据集R求解如下的优化问题,从辅助数据集中获得图像的高层结构特征矩阵D=[d(1),d(2),…,d(j),…,d(p)]∈Rn×p,优化问题如下:

其中||·||2代表L2范数,||·||1代表L1范数,λ表示正则化因子,用于平衡重构误差和稀疏度(特征向量中非零元素的个数),||c(i)||1为稀疏约束项。

求解上述优化问题分为两步:第一步固定高层结构特征矩阵D,利用最小角回归算法求解得到权重系数c(i),第二步固定权重系数,更新特征原子,迭代多次之后得到图像高层结构特征矩阵D∈R64×p(本发明实施例中选择的特征原子数p=134)。

S3.利用S2.中得到的高层结构特征矩阵D∈R64×134,通过局部约束线性编码的方式,提取煤岩样本数据集T中每个样本的特征向量,构造函数如下:

其中代表局部稀疏约束项,p(i)=[p(i1),p(i2),…,p(ip)],其中表示的是煤岩样本矩阵T中第i个样本与高层结构特征矩阵D第j个特征原子的欧氏距离。上述构造函数存在解析解,通过上述构造函数和已经得到的高层结构特征矩阵D组建拉格朗日方程如下:

求解方程得到每个煤岩样本的稀疏特征向量其中,稀疏特征向量得到的这些稀疏向量,作为新的特征表征煤岩图像,由此得到一个新的带标记的煤岩图像样本集

S4.SVM分类器的训练与测试

从新的煤岩图像样本集中随机抽取100张煤岩图像作为训练集,其中煤岩各50张,训练SVM分类器,剩余部分作为测试集测试识别效果,得出识别率。

在SVM分类器中核函数的种类主要有线性核函数、多项式核函数、高斯核函数(RBF径向基核函数),在本发明中选用的为高斯核函数,即x1,x2代表任意两个煤岩图像的稀疏特征向量,σ是尺度参数。在训练SVM分类器时,为了得到最优的参数σ和C,设定尺度参数σ的取值范围为[2-15,22],惩罚因子C的取值范围为[2-3,220],本发明中采用5折交叉验证网格搜索的方法寻找最优的参数组合,得到最优的识别效果。

S5.对于一幅未知类别的煤岩图像x经过步骤S1的预处理之后,再通过步骤S3得到它的稀疏特征向量a∈R134,并将稀疏特征向量输入到步骤S4中训练好的分类器中,输出图像的类别(煤或岩)。

以上所述为本发明的基本原理和实施过程,但本发明的保护范围并不局限于此,但凡熟悉本领域的技术人员在本发明揭露的技术范围内,所作的等效修饰或变换,都应涵盖在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1