基于稀疏编码的唇语特征身份认证方法与流程

文档序号：13211157阅读：来源：国知局

技术特征：
1.一种基于稀疏编码的唇语特征身份认证方法，其特征在于，包括如下步骤：步骤1：依据嘴唇位置，从输入视频中提取嘴唇图像块；步骤2：建立稀疏编码特征字典群，并对嘴唇图像块进行重构，计算重构误差；步骤3：根据重构误差对输入视频中讲话用户进行身份识别和认证。2.根据权利要求1所述的基于稀疏编码的唇语特征身份认证方法，其特征在于，所述步骤1包括：步骤1.1：识别输入视频某一帧面部图片的嘴唇区域图像；步骤1.2：以步骤1.1中的输入视频的该帧为起始帧，提取一段时间内输入视频所有帧的嘴唇区域图像；步骤1.3：将该段时间内提取的所有帧的嘴唇区域图像按照时间顺序进行堆叠获得具有时空维度的嘴唇图像块。3.根据权利要求1所述的基于稀疏编码的唇语特征身份认证方法，其特征在于，所述步骤2包括：步骤2.1：建立用户稀疏编码特征字典群；具体地，包括如下步骤：步骤2.1.1：将训练集中所有用户讲述提示语的视频片段作为训练样本总体，并从每一段视频片段中提取出具有相应用户特征的嘴唇图像块；步骤i：将用户对应的所有嘴唇图像块作为输入信号，采用K-奇异值分解，即K-SingularValueDecomposition，简称为K-SVD算法构建稀疏编码字典；所述稀疏编码字典中包含若干用户独特的嘴唇图像块基础信号，能够作为与用户的特征字典；步骤2.1.2：对训练集中每一个用户的嘴唇图像块执行步骤i，获得所有用户的特征字典，所有用户的特征字典构成稀疏编码特征字典群；步骤2.2：使用正交匹配追踪OrthogonalMatchingPursuit，简称为OMP算法，以给定特征字典中的基础信号为基底，对待识别视频提取的嘴唇图像块进行变换；步骤2.2.1：选取变换向量中特征值最大的S个元素，将其他元素置为0，其中S称为稀疏编码的稀疏度；步骤2.2.2：将部分置0后的变换向量进行逆变换，得到重构的嘴唇图像块；步骤2.2.3：将重构的嘴唇图像块与初始嘴唇图像块进行比较，计算每一帧每一像素点的差值的绝对值，并求和，得到重构误差。4.根据权利要求3所述的基于稀疏编码的唇语特征身份认证方法，其特征在于，所述步骤2.2.3中重构误差的计算公式如下：Δ=Σx,y,t|Mo(x,y,t)-Mr(x,y,t)|]]>式中：△表示重构误差，Mo(x,y,t)表示初始嘴唇图像块，Mr(x,y,t)表示重构后的嘴唇图像块，其中嘴唇图像块中坐标(x,y,t)位置的取值为输入视频第t帧所提取的嘴唇区域图像的行列坐标(x,y)位置的像素RGB值。5.根据权利要求3所述的基于稀疏编码的唇语特征身份认证方法，其特征在于，在步骤2中，使用用户稀疏编码特征字典群中的每一个特征字典，依次对嘴唇图像块进行重构并计算重构误差；所述步骤3包括：确定最小的重构误差所对应的特征字典，则讲话人被识别为该特征字典对应的用户。6.根据权利要求5所述的基于稀疏编码的唇语特征身份认证方法，其特征在于，在所述步骤2中，从用户稀疏编码特征字典群中选取申明身份对应的特征字典，对所提取的嘴唇图像块进行重构，并计算重构误差；所述步骤3还包括：将该重构误差与设定的阈值进行比较，若重构误差小于设定阈值，则认为识别出的讲话用户与该用户申明的身份相符，若重构误差大于等于设定阈值，则认为识别出的讲话用户与该用户申明的身份不相符。7.根据权利要求1所述的基于稀疏编码的唇语特征身份认证方法，其特征在于，还包括：训练步骤，即学习待识别用户唇语特征的过程，通过对用户预先输入的唇语特征进行学习，获得后续用于识别和认证的特征字典，具体包括如下步骤：步骤E1：采集用户讲述提示语视频片段；对待识别的用户，分别采集若干讲述提示语的视频片段，将采集的视频片段以对应用户的身份识别符进行标识，并分别存储；所述标识符包括：名字、工号或身份证号；步骤E2：对于每一位待识别的用户，将步骤E1中采集的讲述提示语的所有视频片段进行嘴唇图像块提取，获得若干嘴唇图像块，所述嘴唇图像块反映了该用户唇语的生理结构和行为习惯特征；步骤E3：对于步骤E2中获得的若干嘴唇图像块，使用K-奇异值分解算法，构建稀疏编码字典，所述编码字典中包含若干基础信号，每一个基础信号为一个三维矩阵，该三维矩阵的尺寸与输入的嘴唇图像块一致，所述基础信号是输入嘴唇图像块的奇异值，表达了对应用户的唇语特征的一致性信息与独特性信息，称为对应用户的特征字典；步骤E4：对所有待识别用户执行步骤E2和步骤E3，获得等同于用户数量的特征字典，将每一个特征字典以对应用户的身份标识符进行标识，所有用户的特征字典的集合称为用户稀疏编码特征字典群。

完整全部详细技术资料下载

当前第2页1 2 3