本发明属于模式识别领域,涉及一种基于分区思想和logistic回归法进行颅骨性别分类的方法。主要用于刑侦、考古、法医人类学等领域。
背景技术:
目前现有的颅骨性别鉴定方法,主要有形态判别法和测量判别法两种。形态判别法主要是由人类学家按照其对颅骨形态特征的差异的理解进行鉴定,比如男性颅骨颅骨较大,眉弓与与鼻骨较明显,颧骨高而且粗壮,女性颧骨低而细弱,额结节较男性突出等等。形态判别法严重地依赖专家对形态特征理解的主观性,主观依赖性强,不同专家的理解有一定的差异。测量判别法通常是在颅骨实物、颅骨的x光照片和三维数字模型上标定一些测量点,依据人类学家研究定义一些测量指标,根据这些测量指标,通过统计学方法构造判别函数。与形态判别法相比,测量判别法对专家知识的要求相对较低,但是对测量项的测量精度要求高,还可能存在一些性别差异明显的特征无法测量。有研究表明,对大多数特征不同观察者之间的测量误差达10%以上。而且现有的测量判别法都是只针对完整颅骨进行性别鉴定,但在实际中,经常会遇到一些残缺颅骨,这样使得现有的测量法的适用范围有限、不能推广使用;并且现有的测量判别法选择的特征指标都是通过测量得到的,但由于颅骨复杂,一些具有性别差异的特征不能通过测量得到,会导致颅骨性别鉴定的正确率不高。
技术实现要素:
本发明的目的是提供一种破损颅骨性别鉴定的有效方法,以现有技术中存在的依赖专家主观经验程度高、只选择具有性别差异的可测量特征作为特征子集而导致鉴定准确率不高和适用范围窄的问题。
首先,本发明提供了颅骨性别鉴定模型构建方法,方法包括:
步骤一,对颅骨训练样本集中的多个颅骨进行坐标统一,然后将每个颅骨划分为i个颅骨分区,i≥2;得i个颅骨分区集;
步骤二,对每个颅骨的各分区进行特征点标注;
步骤三,在步骤二标注的特征点中提取多项特征指标,得各颅骨分区集的特征指标集;
步骤四,构建鉴定模型:
当p(yi=1|x)>p(yi=0|x)时,未知颅骨为男性;当p(yi=1|x)<p(yi=0|x)时,未知颅骨为女性;
xi表示未知颅骨分区i的特征指标集,i∈i;
进一步,本发明步骤四构建鉴定模型:
式(3)和(4)中,n取值为1,2,3,....和i中的一个或两个以上的值,
当p(ym|x)>p(yf|x)时,未知颅骨为男性;当p(ym|x)<p(yf|x)时,未知颅骨为女性;
xn表示未知颅骨分区n的特征指标集,n∈i;
anm表示采用
anf表示采用
有些方案中,本发明步骤三中利用最大似然估计的前向逐步回归法对多项特征指标进行选择,得各颅骨分区的特征指标集。
优选的,本发明i=7。
本发明提供的一种破损颅骨性别鉴定方法包括:
步骤1,对未知破损颅骨进行分区划分,得未知破损颅骨分区n,n取值为1,2,3,....和i中的一个或两个以上的值;
步骤2,对各分区进行特征点标注;
步骤3,在步骤2标注的特征点中提取多项特征指标,得各分区的特征指标集;
步骤4,依据各分区的特征指标集,采用权利要求1或2构建的模型鉴定未知破损颅骨的性别。
本发明的有益效果是:
(1)本发明所采用的方法,克服了现有技术中需要具有专业知识的专家参与和只能对完整颅骨的性别进行鉴定的缺点;
(2)本发明所采取的方法,克服了现有技术只选择具有性别差异的可测量特征作为特征子集而导致鉴定准确率不高等问题;
(3)本发明所采取的方法,具有操作方便,客观程度高,适用范围广泛,正确率较高。
附图说明
图1为三维颅骨模型特征点参考图,图中从左至右依次是正面、侧面和后面示意图;
图2为颅骨的七个分区的参考示意图;
图3为实施例3中只有下颌骨和额骨的破损颅骨。
具体实施方式
本发明方法中对颅骨进行划分,划分为多个分区,其划分依据可根据需要确定,例如可将颅骨划分为七个分区,这七个分区具体是:眶部、额骨部、颧骨部、上颌部、顶骨部、枕骨部和下颌部,如图2所示。
本发明方法中所标注的特征点为本领域技术人员所理解的特征点,例如,目前现有技术中《计算机辅助三维颅骨性别鉴定方法研究》中所公开的颅骨三维模型的获取及预处理,在各分区进行特征点标注,每个颅骨标定62个特征点,其中包括16个正中矢状面特征点和46个颅侧特征点,如图1所示。
本发明方法中的特征指标是指多个特征点中特征点之间的直线距离或曲线距离或特征点连线的夹角;分区中每一项特征指标都是由该指标所在的分区内的特征点决定的;例如根据现有技术《计算机辅助三维颅骨性别鉴定方法研究》中公开的颅骨三维模型的获取及预处理的内容,提取颅骨的32项特征指标,包括可测量特征指标和不可测量特征指标,其中可测量特征指标测量可以得到,不可测量特征通过数学方法量化计算得到。
例如针对颅骨性别鉴定问题,定义62个颅骨特征点,其中包括16个正中矢状面特征点和46个颅侧特征点。特征点分布在整个颅骨,能够表示颅骨五官特征和轮廓特征。这62个颅骨特征点中可提取32项特征指标,包括直线距离、角度、曲线距离以及数量化指标等。
本发明的颅骨样本是三维网格数据或其他他任何方式构建的3d模型,如激光扫描、3d相机等。
在特征指标数量过多的情况下,本发明采用最大似然估计的前向逐步回归法对各分区中的特征指标选取最优特征子集。例如七个分区、62个特征点、32项特征指标的情况下,选取的特征指标集表2所示。
本发明所述应用logistic回归模型,可以采用最大似然估计方法来估计模型的参数:
假设第i个颅骨样本被判定为男性的概率为p(yi=1|xi)=π(xi),因此被判定为女性的概率为p(yi=0|xi)=1-π(xi),似然函数为:
对数似然函数为:
对l(αi,βi)求极大值,即可得到αi和βi的估计值。这样问题就变成以对数似然函数为目标的最优化问题,可采用拟牛顿法进行求解。假设α和β的极大似然函数估计值分别为
实施例1:
该实施例的颅骨数据为三维网格数据,下面针对所述的颅骨数据为三维网格数据进行描述。所采用的三维网格数据是通过对头部ct扫描,得到符合dicom标准的头部断面图像数据,对ct数据进行去噪去冗余,利用marchingcubes方法重构得到颅骨的三维网格数据,每个三维网格数据包含大约100000个顶点和200000个三角面片。假设有267个训练样本,其中116个男性,151个女性,方法包括:
步骤一:把训练样本集中的颅骨的三维网格数据统一到法兰克福坐标系下使其姿态一致,然后将每个颅骨划分为7个颅骨分区,得7个颅骨分区集,参见图2;
步骤二:对分区后的训练样本集中的每个颅骨数据,标定62个特征点,其中包括16个正中矢状面特征点和46个颅侧特征点,参见图1;
步骤三:提取训练集中颅骨的32项特征指标,参见表1和表2,包括可测量特征指标和不可测量特征指标,利用最大似然估计的前向逐步回归法对多项特征指标进行选择得到各颅骨分区集的特征指标集,如表3所示;
表1颅骨32项特征指标
32项特征指标的结果,如表3所示。
表232项特征指标统计结果
表3最优特征子集
步骤五:对优选的特征指标子集利用logistic回归建立破损颅骨性别判别模型为:
xi表示未知颅骨分区i的特征指标集,i∈n;
各个分区的分类模型、男女鉴定准确率和参数估计值
眶部:
额骨部:
颧骨部:
上颌部:
顶骨部:
枕骨部:
下颌部:
实施例2:
该实施例根据实施例1建立的分类模型鉴定颅骨各个分区的性别,参见图2,对颅骨样本进行留一交叉检验,得到单个分区判别准确率。
眶部:
额骨部:
颧骨部:
上颌部:
顶骨部:
枕骨部:
下颌部:
该实施例根据实施例1建立的破损颅骨的性别鉴定模型
当p(ym|x)<p(yf|x)时,未知颅骨为女性;xn表示未知颅骨分区n的特征指标集。
实施例3:
假设破损颅骨只有下颌骨和额骨两部分,如图3所示,可建立包含下颌和额骨的logistic回归分类模型:
对未知破损颅骨的几项指标值进行测量,分别为:x7=113.5,x8=108.4,x9=96.8,x10=117.2,x24=26.7,x29=14.6,x32=111.4,代入上述分类模型可得到:p(ym|x)=1.6354,p(yf|x)=0.016,由于p(ym|x)>p(yf|x),未知的破损颅骨为男性,与人类学家鉴定结果一致。
本发明的实施例公布的是其较好的实施方式,但并不限于此。本领域的技术人员能够容易地根据上述实施例,理解本发明的核心思想,只要不脱离本发明的技术方案的基础的变形或替换,都在本发明的保护范围之内。