一种基于LDA文档主题生成模型的车辆二级维护管理方法与流程

文档序号:12468840阅读:360来源:国知局
一种基于LDA文档主题生成模型的车辆二级维护管理方法与流程

本发明涉及车辆维护管理技术领域,更具体地,涉及一种基于LDA文档主题生成模型的车辆二级维护管理方法。



背景技术:

目前,在车辆二级维护领域,车辆维修是以强制维护、定期检测为前提和基础,以视情修理为手段,根据车辆实际状况确定修理作业深度的。这与以往的老制度的根本区别是加强二级维护前后的检测诊断,视情附加修理项目,保障车辆经常处于良好技术状况.因此,二级维护质量的提高是执行新保修制度的关键,而对二级维护过程中所产生的图片的分类与分析,是二级维护系统中重要设计内容,因此若仅仅只是对图片进行采集存储,并未充分利用二级维护系统的优势。

现有技术主要是对二级维护所产生的图片进行采集与存储,并未对图片进行甄别处理。如果仅讨论图像分类技术,常用的主题模型有LDA与PLSA模型,而在图像特征提取过程中通常采用sift特征提取或者sift特征结合其他特征。特征聚类的技术有KMeans聚类技术等等。



技术实现要素:

本发明为克服上述问题或者至少部分地解决上述问题,提供一种基于LDA文档主题生成模型的车辆二级维护管理方法。

根据本发明的一个方面,提供一种车辆二级维护管理方法,其特征在于,包括:

步骤1,基于车辆二级维护图像各主题图像样本进行LDA模型训练,获得各主题图像样本中各主题的特征向量;利用局部敏感哈希算法识别待处理车辆二级维护图像中各主题的统计直方图;

步骤2,基于所述各主题图像样本视觉单词的特征向量和待处理车辆二级维护图像中各主题的统计直方图,对所述待处理车辆二级维护图像进行分类。

本申请提出一种基于LDA文档主题生成模型的车辆二级维护管理方法,步骤1,基于车辆二级维护图像各主题图像样本进行LDA模型训练,获得各主题图像样本中各主题的特征向量;利用局部敏感哈希算法识别待处理车辆二级维护图像中各主题的统计直方图;步骤2,基于所述各主题图像样本视觉单词的特征向量和待处理车辆二级维护图像中各主题的统计直方图,对所述待处理车辆二级维护图像进行分类。本发明技术方案能够快速精确对车辆二级维护系统中的待处理图像进行分类。

附图说明

图1为根据本发明实施例一种车辆二级维护管理方法的整体流程示意图;

图2为根据本发明实施例一种车辆二级维护管理方法中空间金字塔形式的图像进行分类示意图。

具体实施方式

下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。

本发明目的是解决车辆二级维护管理系统中二级维护图片分类问题,主要对待处理的车辆二级维护图片进行鉴别与分类,确保所拍摄的图片的有效性,以提高车辆二级维护质量。

本发明我们采用了基于LDA的图像分类技术,对二级维护过程中产生的图像进行分类。针对二级维护图片的特性,本发明对二级维护图片的主题构建了分类树,在分类树中划分了多个子类别,并认为同一个图像中可能存在多个主题,主题之间可能存在分类树的层级结构关系,由此本发明提出了基于主题特征空间的分类方法,结合SPM模型,采用多尺度分块的方法对图像块的主题特征进行统计与匹配。同时由于二级维护图片在颜色集合上具备较为独特特征表示,我们采用了颜色直方图的方法表达图像的颜色分布,其优点是不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响。此外由于特征维度较大,如果采用线性计算的方式会非常耗时,为实现图像的快速分类,我们采用了局部敏感哈希(LSH,Locality-Sensitive Hashing),实现特征的快速聚类,减少计算时间。

在二级行业领域,目前,车辆维修是以强制维护、定期检测为前提和基础,以视情修理为手段,根据车辆实际状况确定修理作业深度的.这与以往的老制度的根本区别是加强二级维护前后的检测诊断,视情附加修理项目,保障车辆经常处于良好技术状况.因此,二级维护质量的提高是执行新保修制度的关键,而对二级维护过程中所产生的图片的分类与分析,是二级维护系统中重要设计内容,因此若仅仅只是对图片进行采集存储,并未充分利用二级维护系统的优势。

而主题模型两种主要方法为LDA、pLSA,pLSA模型中参数P(z|d)与训练数据的图像数量呈线性相关,当图像数量增多时计算复杂度增大且容易发生过拟合现象。而LDA模型中的参数θ维数只与主题数有关,与图像数目无关。因此LDA相比于pLSA更适用于对大量图像数据建模,并且分类效果要稍好些。因此本发明采用了LDA模型。同时本发明考虑到图像主题具备层级特性,因此结合了SPM模型,对图像的主题特征进行空间金字塔匹配。此外对于目前基于LDA的图像分类方法,在特征提取阶段通常采用的单一的sift特征或sift特征结合其他特征如纹理特征等等,其所形成的特征并未考虑到二级维护图片的行业特性,及在图片颜色方面具备行业特性,因此本发明采用了sift特征与颜色直方图特征结合。此外在特征聚类方面,由于KMeans聚类对于大量、高维度的数据聚类时间较长,本发明采用了LSH技术进行特征映射变换,将原有的高维特征集划分为多个子集,以实现聚类。

同时本发明中对二级维护图片构建了相关的分类树,采用多尺度的分块方式,获取图像块的主题特征进行空间金字塔匹配。在特征提取方面,针对二级维护图片中所常出现的颜色集,采用了颜色直方图特征与sift特征结合,构建特征集,充分考虑到二级维护图片所具备的领域行业特性。此外为减少计算时间,本发明中采用了LSH对特征向量进行聚类。

本发明采用了基于LDA主题模型的图像分类技术,处理车辆二级维护系统中用户上传的图片,进行类别判断,筛选出不合格照片,确保整个二级维护过程的有效性。在自然语言处理领域,假定对于一个文本,忽略其词序和语法、句法,仅仅将其看做是一些词汇的集合,而文本中的每个词汇都是独立的,则我们可将文本表示为词汇的特征向量,这样的的一个模型称为BOW模型。在图像处理领域根据BOW(Bag Of Model,词包)模型,图片可视为视觉词汇的集合,LDA模型则是结合BOW模型,获取图片的主题分布。由于二级维护系统中的图片具备领域特性,在图像分类领域来看,意味着二级维护系统中的图片所包含的特定的领域主题,如图片的主要内容包含:车辆、车牌等等内容,也就是图片内容中的主题。采用LDA主题模型可以识别大规模图片集中潜在的主题信息,同时结合BOW模型以及传统的图像分类模型如SPM模型可有效的实现二级维护系统中的图片分类处理。

如图1,本发明一个具体实施例中,示出一种车辆二级维护管理方法整体流程示意图。总的来说,包括:步骤1,基于车辆二级维护图像各主题图像样本进行LDA模型训练,获得各主题图像样本中各主题的特征向量;利用局部敏感哈希算法识别待处理车辆二级维护图像中各主题的统计直方图;步骤2,基于所述各主题图像样本视觉单词的特征向量和待处理车辆二级维护图像中各主题的统计直方图,对所述待处理车辆二级维护图像进行分类。

本发明另一个具体实施例,一种车辆二级维护管理方法,所述步骤1中基于车辆二级维护图像各主题图像样本进行LDA模型训练,获得各主题图像样本视觉单词的特征向量还包括:基于车辆二级维护图像各主题图像样本进行LDA模型训练,获得所述样本所视觉单词的所属主题和主题分布情况,从而形成图像样本中各主题的特征向量。

本发明另一个具体实施例,一种车辆二级维护管理方法,所述步骤1中利用局部敏感哈希算法识别待处理车辆二级维护图像中各主题的统计直方图还包括:步骤101,采用多尺度分块方法对所述待处理车辆二级维护图像进行分块,并对所有图像分块进行特征描述;步骤102,利用局部敏感哈希算法将所述得到的图像块特征表述信息进行聚类,从而得到视觉词典;步骤103,对所述图像块进行视觉词典映射,获得图像块的视觉单词统计直方图。

本发明另一个具体实施例,一种车辆二级维护管理方法,所述步骤2还包括:利用SPM模型对所述待处理车辆二级维护图像进行分类。这里可以理解为,不限于利用SPM模型,可以为任意传统的图像分类模型进行图像的分类处理。

本发明另一个具体实施例,一种车辆二级维护管理方法,所述步骤2还包括:以空间金字塔形式对所述待处理车辆二级维护图像进行分类。如图2所示,为本具体实施例中,一个具体空间金字塔形图像分类树。

本发明另一个具体实施例,一种车辆二级维护管理方法,所述步骤101中对所有图像分块进行特征描述还包括:提取所有图像块SIFT特征及颜色直方图特征。

本发明另一个具体实施例,一种车辆二级维护管理方法,所述步骤102还包括:利用局部敏感哈希算法进行映射变换将所述得到的图像块特征表述信息划分为多个子集实现聚类,形成视觉词典Dict;用ωk表示其中一个基本单词,V表示单词总数,则视觉词典可表示为:{ωkk∈H,k=1,2...,V}。

本发明另一个具体实施例,一种车辆二级维护管理方法,所述步骤103还包括:对所述图像块进行视觉词典映射,并获取图像块的视觉单词统计直方图;映射的过程即对使用相对距离最小的视觉单词代替原特征向量X,如果距离计算采用欧式距离表示,则映射的过程可表示如下:

本发明另一个具体实施例,一种车辆二级维护管理方法,所述各主题图像样本视觉单词的特征向量和待处理车辆二级维护图像中各主题的统计直方图,利用SPM模型对所述待处理车辆二级维护图像进行分类还包括:基于所述各主题图像样本视觉单词的特征向量和待处理车辆二级维护图像中各主题的统计直方图,利用SPM模型得图像主题特征空间的匹配程度函数表示为:

其中L为尺度数,Il为尺度为l时匹配总数即主题直方图相交。

本发明另一个具体实施例,一种车辆二级维护管理方法,所述步骤2后还包括:利用所述匹配程度函数,训练SVM分类器参数。

最后,本申请的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1