一种基于svm的食物分类识别方法

文档序号:8488137阅读:265来源:国知局
一种基于svm的食物分类识别方法
【技术领域】
[0001] 本发明属于物联网技术领域,涉及一种基于支持向量机(SVM)的食物分类识别方 法,本发明的目的在于使用该技术解决现实生活中食物摄入量测量的问题。
【背景技术】
[0002] 随着生活质量和水平的不断提升,年轻人中肥胖病患者的数量逐步增长是一个巨 大的问题。不幸的是,这种持续的增长趋势导致2型糖尿病病人的数量也持续增长。在2008 年,肥胖症患者占世界成人人口的十分之一,而在2012年这个数字已增长到六分之一,并 且还在以惊人的速度增长。最近的研宄表明,肥胖的人更可能产生严重的健康疾病,如高血 压、心脏病、2型糖尿病、高血脂、乳腺癌、结肠癌和呼吸疾病等。肥胖症的主要原因是食物和 能量的摄入与消耗之间的不平衡。所以,为了用健康的方式减肥并且维持正常人的健康体 重,必须每天测量食物摄取量。事实上,所有现有的肥胖症治疗技术要求病人每天记录食物 的摄入量来对比能量的摄入和消耗。
[0003] 膳食摄入量,即定义某人每天吃什么。膳食摄入量可以为增加干预方案提供宝贵 意见,从而能够预防许多疾病。在营养和健康领域,精确测量膳食摄入量是开放的研宄课 题。通过引入一个新的半自动膳食评估装置,它有助于营养师监测每日营养摄入量。要做 到这一点,在食物识别装置的不同步骤中已经采用了各种图像处理技术。在肥胖症患者的 移动设备上使用这种食物识别装置,任何人都可以监控他/她的食物的摄入量。

【发明内容】

[0004] 本发明的目的是提供涉及一种基于SVM的食物分类识别方法。
[0005] 上述的目的通过以下的技术方案实现: 考虑到在年轻人群中移动设备(例如智能手机和平板电脑)的普及,并且这些通信设备 普遍存在,它们可以加载饮食相关的应用模块,例如我们的食物识别模块。本发明的目的在 于使用该技术解决现实生活中食物摄入量测量的问题。当前这一领域的研宄可以分为三 类,即临床研宄、辅助研宄和半自动化方法研宄。在如24小时膳食回顾(24HR)和食物频率 问卷这类临床研宄中,其数据是由患者手工记录,之后再计算卡路里摄入量。由于这些方法 的数据是手工记录,因此在整个记录过程中可能产生大量的错误。这些方法的另一个缺点 是病人很难将记录应用于治疗。最近,一些研宄人员研宄半自动化的方法。本发明将设计开 发一个简单而实用的半自动化的应用模块,人们可以使用应用模块进行交互。此外,在这种 情况下,通过使用模块化的方法来增加如智能手机这类移动设备的使用机会。使用移动设 备作为用户接口,并且通过网络将自己的食物图像数据发送给专家来计算卡路里摄入量。 移动应用模块提供了一个独特的机制来收集饮食信息,由此可降低饮食记录者的负担。
[0006] 在早期阶段,用户用移动设备拍摄图像,随后进行预处理步骤。然后,在分割步骤 中对每个图像进行分析并提取出各个食物部分。众所周知,若非具有良好的图像分割机制, 该装置则不能够适当地处理图像。因此,本发明将这个步骤分解成了更多的步骤。为此, 我们使用了颜色分割、K均值聚类和纹理分割工具。对于每个检测到的食品部分,特征提取 过程必须被执行。对于每个检测到的食物图像,必须执行特征提取步骤。在这一步骤中将 会提取出食物的各种属性,如大小、形状、颜色和纹理。所提取的特征将被发送到分类步骤, 分类步骤使用SVM方案将食物识别出来。最后,通过估计食物部分的面积,并参照营养表, 计算出食物中卡路里的含量。其中,食物分类识别,本发明采用了SVM方法,具体如下: 1、 特征的提取和分类 通过使用四种特征的框架,包括颜色、纹理、尺寸和形状。对于颜色特征,使用了边缘检 测和颜色K-均值聚类。对于纹理特征,使用伽柏滤波器。为了尺寸和形状特征,使用了的 边缘检测技术和图像的感兴趣区域像素计算技术。下一步骤是对提取出的特征进行分类, 以便于识别每种食物。SVM算法它是用于数据分类的流行技术之一。一个分类任务通常包 括训练数据和测试数据,数据由一些实例组成。训练数据中的每个实例都包含一个类标签 和几个特征。SVM的目标是构架一个模型,该模型能够仅通过测试数据中数据实例的属性预 测出该实例的目标值。
[0007] 为了提高准确性,在SVM模块已确定每种食物类型后,该装置与用户进行交互来 验证食物种类。装置可以对用户显示出食物的图像并注解出装置认为的食物类型,如鸡 肉、肉、蔬菜等。然后,用户可以确认或改变食物的类型。虽然这种改变使装置从自动化 变为半自动化,然而它会增加装置的准确度。
[0008] 本模型中使用RBF核,它以非线形方式在更高维度空间映射样本。与线性核不同, RBF核非常适合于类标记和属性是非线性的情况。
[0009] 在本发明中,SVM的特征向量包含五个纹理特征、十个颜色特征、三个形状特征和 六个大小特征。在分割阶段提取出各种食物的特征向量,然后成为SVM的训练向量。 2、 支持向量机训练阶段 在使用本食物识别系统的SVM之前,要进行一次训练阶段,这是为了产生SVM模型。图 1为实现的训练阶段的框图。如该图所示,每种食物的一系列不同的特征是这个阶段的输 入。应注意的是,为了提供系统最好的输出,食物的名称应作为输入传入系统。这个阶段 的输出是SVM模型。
[0010] 3、分类 当对食物图像完成分割和提取特征操作,下一个步骤是使用统计模式识别技术确定食 物种类。分类器被用于各种模式识别和机器学习方面,应用范围从自动语音识别到人脸识 另IJ。识别过程主要包括两个步骤。在训练阶段,模型被当作训练数据学习。该模型是分类 器未使用过的数据,从而在测试阶段可以对模型的精度进行评估。通过训练,分类器学习 如何将特征映射到各种类别或标记。但是,训练是不完美的,分类器在实际操作中会出错, 将一个错误的标记分配给观察到的特征矢量。
[0011] 训练分类器有两个目标。一个目标是定义如何给观察到的特征矢量分配标记,而 另一个是估计其性能误差或分类精度。支持向量机是一组用于分类和回归的可管理的学习 方法。它们属于一个系列的球状线性分类器。换句话说,支持向量机是一种分类和回归装 置,它使用机器学习理论来最大化预测精度,可以自动整合数据到最佳的类别。支持向量机 可以被定义为在一个高维度特征空间中使用线性函数假设空间的系统。
[0012] SVM给出相同的任务中与神经网络方法相比更准确的结果。它也被用于许多应 用,如人脸分析和语音识别,特别是基于模式分类和回归的应用。支持向量机过去用于解决 分类问题,但最近,它们也已经扩展到应用于解决回归问题。
[0013] 4、支持向量机解释 神经网络技术是用于监督和无监督的学习应用识别方法之一,它具有良好的效果。一 种神经网络算法是多层感知器(MLP)算法。MLP采用前馈网络和循环网络。该算法包括连 续非线性函数的泛逼近能力和输入输出模式学习。
[0014] 图2为简单神经网络和多层感知器的行为图。
[0015] 但MLP也有一些问题,因此鼓励人们发现并使用其他方法。首先,神经网络有许多 局部极小值并且很难得到神经元的数目,因此需要测试其他的学习方法。此外,即使使用 的神经网络解决方案有一种倾向性和收敛性,但它不是一个唯一的解决方案。在神经网络 的方法中,通过尝试和测试以找出最佳的解决方案,所以实时性不够好。
[0016] 许多线性分类器(超平面)可以对数据进行分离。如果用一个线性超平面去分类数 据,可能最终得出一组局部最小值而不是全局最小值的数据集。因此,可以推出最大间隔分 类器。
[0017] 图3为最大间隔分类器线性SVM图。
[0018] 在线性SVM中,最大间隔会被用到。在这里可能会出现的一个问题是为什么要用 最大间隔?其中一个原因是,即使在边界的位置产生了一个小的误差,使用最大间隔也可 以将错误分类的几率降到最小。另一个原因是避免了局部极小并最终得到一个更好的分 类。
[0019]SVM的目标是用超平面来分离数据以及使用核技巧延伸到非线性界限。计算SVM 的目标是要对所有的数据进行正确的分类。对于数学计算,我们有如下公式。
【主权项】
1. 一种基于SVM的食物分类识别方法,其组成包括:摄像头,装载识别和分析算法的 DSP芯片,无线传输模块,USB接口设备组成,设计实现了一种基于SVM的食物分类识别方 法。
2. 根据权利要求1所述,一种基于SVM的食物分类识别方法,通过使用四种特征的框 架,包括颜色、纹理、尺寸和形状;对于颜色特征,使用了边缘检测和颜色K-均值聚类;对于 纹理特征,使用伽柏滤波器;为了尺寸和形状特征,使用了的边缘检测技术和图像的感兴趣 区域像素计算技术;下一步骤是对提取出的特征进行分类,以便于识别每种食物;一个分 类任务通常包括训练数据和测试数据,数据由一些实例组成;SVM的目标是构架一个模型, 该模型能够仅通过测试数据中数据实例的属性预测出该实例的目标值。
3. 根据权利要求1和2所述,为了提高准确性,在SVM模块已确定每种食物类型后,该 装置与用户进行交互来验证食物种类;装置可以对用户显示出食物的图像并注解出装置认 为的食物类型,如鸡肉、肉、蔬菜等;然后,用户可以确认或改变食物的类型;虽然这种改变 使装置从自动化变为半自动化,然而它会增加装置的准确度。
4. 根据权利要求1和2、3所述,本模型中使用RBF核,它以非线形方式在更高维度空 间映射样本;与线性核不同,RBF核非常适合于类标记和属性是非线性的情况;RBF核有 C和两个参数;这一步的目标是找到C和,?/的最佳值,以使分类器能够准确预测未知的 数据(即测试数据);分类器的一个常见的策略是将数据集分成两部分,其中一部分被认为 是未知的;从未知组获得的预测精度能够更精确的反映出分类器对一个独立的数据集进行 分类的性能;此过程的一个改进版本被称为交叉验证;使用交叉验证的优点在于防止过拟 合问题;一个找到C和7的很好的方式是使用"网格搜索";在本发明中,SVM的特征向量包 含五个纹理特征、十个颜色特征、三个形状特征和六个大小特征;在分割阶段提取出各种食 物的特征向量,然后成为SVM的训练向量。
【专利摘要】用户启动移动终端自带的摄像机将要吃的食物进行录制,吃完食物后,对剩余食物还要进行去除,通过内部算法芯片模块对使用者的食物进行分析,再通过设备的显示终端显示出来,并可智能选择和专家判断的模式对吃掉的卡路里进行综合测评。通过采用改进的SVM,提高了复杂条件下的食物识别效果。移动应用模块提供了一个独特的机制来收集饮食信息,由此可降低饮食记录者的负担。对糖尿病患者也可以起到辅助和提醒的作用。设备小巧,易于携带,方便使用,随时随地都可用。未来社会,将是一个智慧化城市时代,很多劳作都可以用智能机器去取代。该产品的研发,将引起一场新的变革。
【IPC分类】G06K9-62
【公开号】CN104809472
【申请号】CN201510217604
【发明人】王燕清, 王一璞, 石朝侠
【申请人】哈尔滨理工大学
【公开日】2015年7月29日
【申请日】2015年5月4日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1