样本训练方法、分类方法、识别方法、装置、介质及系统与流程

文档序号:16631219发布日期:2019-01-16 06:35阅读:321来源:国知局
样本训练方法、分类方法、识别方法、装置、介质及系统与流程

本发明属于计算机技术领域,尤其涉及一种样本训练方法、分类方法、下背痛症状识别方法、计算装置、计算机可读存储介质及下背痛症状识别系统。



背景技术:

由于信息资源分布的不均衡,对于属于同一类别的信息而言,其中有些类别的信息数量明显匮乏但与另一参考类别信息特征存在显著差异,而有些类别的信息数量明显充裕而与参考类别信息特征不存在显著差异,使得明显匮乏的稀有类别信息从数量上无法与明显充裕的普通类别信息相比较,在现有的分类过程中,不会因为稀有类别信息特征的特别而与普通类别信息相区别对待,导致训练所得分类器中涉及稀有类别信息因素相对被弱化,待测样本的分类准确性无法得到有效保障。



技术实现要素:

本发明的目的在于提供一种样本训练方法、分类方法、下背痛症状识别方法、计算装置、计算机可读存储介质及下背痛症状识别系统,旨在解决由于现有技术无法有效保障待测样本分类准确性的问题。

一方面,本发明提供了一种样本训练方法,所述方法包括下述步骤:

获得由属于第一类别的待训练样本构成的第一样本集合,所述第一样本集合包含:由相较于属于第二类别的参考样本、特征变化不具有显著差异的待训练样本构成的第二样本集合,以及,由相较于所述参考样本的特征变化、与所述第二样本集合中待训练样本相较于所述参考样本的特征变化之间具有显著差异的待训练样本构成的第三样本集合;

对所述第一样本集合中待训练样本的特征、所述第三样本集合中待训练样本的特征进行机器学习分类方法的训练,分别对应得到第一分类器、第二分类器。

另一方面,本发明提供了一种分类方法,所述分类方法包括下述步骤:

将待测样本的特征输入第一分类器进行第一次判断,若所得第一判断结果指示所述待测样本属于所述第一类别,则以所述第一判断结果作为分类结果,

若所述第一判断结果指示所述待测样本不属于所述第一类别,则将所述待测样本的特征输入第二分类器进行第二次判断,若所得第二判断结果指示所述待测样本属于所述第一类别,则以所述第二判断结果作为分类结果,

其中,所述第一分类器对应的第一样本集合中的已分类样本以及所述第二分类器对应的第三样本集合中的已分类样本均属于第一类别,所述第一样本集合包含:由相较于属于第二类别的参考样本、特征变化不具有显著差异的已分类样本构成的第二样本集合,以及,由相较于所述参考样本的特征变化、与所述第二样本集合中已分类样本相较于所述参考样本的特征变化之间具有显著差异的已分类样本构成的所述第三样本集合。

另一方面,本发明还提供了一种下背痛症状识别方法,所述下背痛症状识别方法包括下述步骤:

获得待测者的腰部局部肌肉肌电信号;

对所述腰部局部肌肉肌电信号进行预处理,得到待测样本;

对所述待测样本进行处理,得到所述待测样本的特征;

将所述待测样本的特征输入第一分类器进行第一次判断,若所得第一判断结果指示所述待测样本属于所述第一类别,则以所述第一判断结果作为分类结果,若所述第一判断结果指示所述待测样本不属于所述第一类别,则将所述待测样本的特征输入第二分类器进行第二次判断,若所得第二判断结果指示所述待测样本属于所述第一类别,则以所述第二判断结果作为分类结果,其中,所述第一分类器对应的第一样本集合中的已分类样本以及所述第二分类器对应的第三样本集合中的已分类样本均属于第一类别,所述第一样本集合包含:由相较于属于第二类别的参考样本、特征变化不具有显著差异的已分类样本构成的第二样本集合,以及,由相较于所述参考样本的特征变化、与所述第二样本集合中已分类样本相较所述参考样本的特征变化之间具有显著差异的已分类样本构成的所述第三样本集合,所述第一类别为下背痛症状类别,所述第二类别为无下背痛症状类别。

另一方面,本发明还提供了一种计算装置,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述方法中的步骤。

另一方面,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述方法中的步骤。

另一方面,本发明还提供了一种下背痛症状识别系统,所述下背痛症状识别系统包括:

采集模块,用于获得待测者的腰部局部肌肉肌电信号;

预处理模块,用于对所述腰部局部肌肉肌电信号进行预处理,得到待测样本;

特征提取模块,用于对所述待测样本进行处理,得到所述待测样本的特征;以及,

分类模块,用于将所述待测样本的特征输入第一分类器进行第一次判断,若所得第一判断结果指示所述待测样本属于所述第一类别,则以所述第一判断结果作为分类结果,若所述第一判断结果指示所述待测样本不属于所述第一类别,则将所述待测样本的特征输入第二分类器进行第二次判断,若所得第二判断结果指示所述待测样本属于所述第一类别,则以所述第二判断结果作为分类结果,其中,所述第一分类器对应的第一样本集合中的已分类样本以及所述第二分类器对应的第三样本集合中的已分类样本均属于第一类别,所述第一样本集合包含:由相较于属于第二类别的参考样本、特征变化不具有显著差异的已分类样本构成的第二样本集合,以及,由相较于所述参考样本的特征变化、与所述第二样本集合中已分类样本相较于所述参考样本的特征变化之间具有显著差异的已分类样本构成的所述第三样本集合,所述第一类别为下背痛症状类别,所述第二类别为无下背痛症状类别。

本发明将待测样本的特征输入第一分类器进行第一次判断,若所得第一判断结果指示所述待测样本属于所述第一类别,则以所述第一判断结果作为分类结果,若否,则将所述待测样本的特征输入第二分类器进行第二次判断,若所得第二判断结果指示所述待测样本属于所述第一类别,则以所述第二判断结果作为分类结果,其中,所述第一分类器对应的第一样本集合中的已分类样本以及所述第二分类器对应的第三样本集合中的已分类样本均属于第一类别,所述第一样本集合包含:由相较于第二类别的参考样本、特征变化不具有显著差异的已分类样本构成的第二样本集合,以及,由相较于所述参考样本的特征变化、与所述第二样本集合中已分类样本相较于所述参考样本的特征变化之间具有显著差异的已分类样本构成的所述第三样本集合。这样,第一分类器既考虑了属于第一类别的第二样本集合中样本特征相较于第二类别参考样本特征变化的普通性,也考虑了属于第一类别的第三样本集合中样本特征相较于第二类别参考样本特征变化的相对稀有性,从而能快速、较为准确地进行分类,而第二分类器重点考虑了属于第一类别的第三样本集合中样本特征相较于第二类别参考样本特征变化的稀有性,从而能在第一分类器的分类错误时对其进行修正性地再次分类,进而有效保证了待测样本分类的准确性。

附图说明

图1是本发明实施例一提供的样本训练方法的实现流程图;

图2是本发明实施例二提供的分类方法的实现流程图;

图3是本发明实施例三提供的下背痛症状识别方法的实现流程图;

图4是本发明实施例三中当患者位于不同运动状态下的分类识别准确率实验结果示意图;

图5是本发明实施例四提供的计算装置的结构示意图;

图6是本发明实施例六提供的下背痛症状识别系统的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

以下结合具体实施例对本发明的具体实现进行详细描述:

实施例一:

图1示出了本发明实施例一提供的样本训练方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:

在步骤s101中,获得由属于第一类别的待训练样本构成的第一样本集合,第一样本集合包含:由相较于属于第二类别的参考样本、特征变化不具有显著差异的待训练样本构成的第二样本集合,以及,由相较于所述参考样本的特征变化、与第二样本集合中待训练样本相较于所述参考样本的特征变化之间具有显著差异的待训练样本构成的第三样本集合。

在本发明实施例中,第一样本集合中的待训练样本与第三样本集合中的待训练样本具有相同数量的指标参数,样本特征之间的差异可以通过计算所得距离进行指示。下面通过几个应用例进行说明。

例如:采集的待训练样本均属于下背痛症状类别,相对则存在无下背痛症状类别(或为健康类别),这些待训练样本构成第一样本集合,该第一样本集合中包含有第二样本集合以及第三样本集合,其中,第二样本集合中的待训练样本类似:即相较于无下背痛症状类别参考样本(无下背痛症状样本或健康样本),特征变化不具有显著差异,可能是第二样本集合对应的下背痛患者的腰部局部肌肉肌电信号处理所得的平均肌电值(averageelectromyography,aemg)等相较于正常无下背痛症状者或健康者的aemg等均发生同向变化,而第三样本集合中的待训练样本相较于上述参考样本的特征变化、与第二样本集合中的待训练样本相较于上述参考样本的特征变化之间具有显著差异,可能是第二样本集合对应的下背痛患者的aemg等相较于正常无下背痛症状者或健康者的aemg等发生同向变化,而第三样本集合对应的下背痛患者的aemg等相较于正常无下背痛症状者或健康者的aemg等变化方向,与第二样本集合对应的下背痛患者的aemg等相较于正常无下背痛症状者或健康者的aemg等变化方向相反,特征变化是否具有显著差异也可能会反映在相关指标参数的变化幅度上,而第二样本集合中待训练样本为多数而属于普通类别,第三样本集合中待训练样本为少数而属于稀有类别,但无论是第二样本集合中的待训练样本,还是第三样本集合中的待训练样本,都是属于下背痛症状类别。

又例如:采集的待训练样本均属于情绪低落类别,相对则存在非情绪低落类别,这些待训练样本构成第一样本集合,该第一样本集合中包含有第二样本集合以及第三样本集合,其中,第二样本集合中的待训练样本类似:即相较于非情绪低落类别参考样本(情绪平和样本或情绪激动样本),特征变化不具有显著差异,可能是第二样本集合对应的情绪低落者的面部图像处理所得的眼部形态指示值等相较于情绪平和者的眼部形态指示值等均发生同向变化,而第三样本集合中的待训练样本相较于上述参考样本的特征变化、与第二样本集合中的待训练样本相较于上述参考样本的特征变化之间具有显著差异,可能是第二样本集合对应的情绪低落者的眼部形态指示值等相较于情绪平和者的眼部形态指示值等发生同向变化,而第三样本集合对应的情绪低落者的眼部形态指示值等相较于情绪平和者的眼部形态指示值等变化方向,与第二样本集合对应的情绪低落者的眼部形态指示值等相较于情绪平和者的眼部形态指示值等变化方向相反,而第二样本集合中待训练样本为多数而属于普通类别,第三样本集合中待训练样本为少数而属于稀有类别,但无论是第二样本集合中的待训练样本,还是第三样本集合中的待训练样本,都是属于情绪低落类别。

在步骤s102中,对第一样本集合中待训练样本的特征、第三样本集合中待训练样本的特征进行机器学习分类方法的训练,分别对应得到第一分类器、第二分类器。在本发明实施例中,在进行样本训练时,不仅需要待训练样本,也需要参考样本,从而训练得到分类器。由于训练所针对的样本集合不同,得到的第一分类器和第二分类器也不同。

在本发明实施例中,由于第一分类器既考虑了属于第一类别的第二样本集合中样本特征相较于第二类别参考样本特征变化的普通性,也考虑了属于第一类别的第三样本集合中样本特征相较于第二类别参考样本特征变化的稀有性,从而能为快速、较为准确地进行分类提供保障,而第二分类器重点考虑了属于第一类别的第三样本集合相较于第二类别参考样本特征变化的稀有性,从而能为在第一分类器的分类错误时对其进行修正性地再次分类而进一步提供保障,进而有效保证了待测样本分类准确性。

实施例二:

图2示出了本发明实施例二提供的分类方法的实现流程,该分类方法基于实施例一所实现的第一分类器及第二分类器,第一分类器与第二分类器可进行级联,得到支持向量机(supportvectormachine,svm)分类器。为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:

在步骤s201中,获得待测样本。

在步骤s202中,对待测样本进行处理,得到待测样本的特征。

在步骤s203中,将待测样本的特征输入第一分类器进行第一次判断,若所得第一判断结果指示待测样本属于第一类别,则执行步骤s204,否则,执行步骤s205。

在步骤s204中,以第一判断结果作为分类结果。

在步骤s205中,将待测样本的特征输入第二分类器进行第二次判断,若所得第二判断结果指示待测样本属于第一类别,则执行步骤s206。

在步骤s206中,以第二判断结果作为分类结果。

在本发明实施例中,由于第一分类器既考虑了属于第一类别的第二样本集合中样本特征相较于第二类别参考样本特征变化的普通性,也考虑了属于第一类别的第三样本集合中样本特征相较于第二类别参考样本特征变化的相对稀有性,从而能快速、较为准确地进行分类,而第二分类器重点考虑了属于第一类别的第三样本集合中样本特征相较于第二类别参考样本特征变化的稀有性,从而能在第一分类器的分类错误时对其进行修正性地再次分类,进而有效保证了待测样本分类准确性。

另外,如果在上述流程输入的是已知属于第一类别的测试样本,那么,如果通过第一分类器所得第一判断结果指示测试样本不属于第一类别,则第一分类器判断错误,说明该测试样本可能属于第三样本集合对应的类别,后续则需要进一步使用第二分类器对该测试样本进行判断,若通过第二分类器所得第二判断结果指示测试样本属于第一类别,则第二分类器判断正确,否则判断错误,如果累积判断错误所针对的测试样本数量较多时,则需要将这些测试样本作为上述第三样本集合中的待训练样本,重新进行训练,更新得到新的第一分类器和第二分类器。

实施例三:

图3示出了本发明实施例三提供的下背痛症状识别方法的实现流程,为了便于说明,仅示出了与本发明实施例相关的部分,详述如下:

在步骤s301中,获得待测者的腰部局部肌肉肌电信号。

在本发明实施例中,可通过在待测者的腰部肌肉表面粘贴电极片,电极片会记录神经肌肉活动时释放的生物电信号,即上述腰部局部肌肉肌电信号。

在步骤s302中,对腰部局部肌肉肌电信号进行预处理,得到待测样本。

在本发明实施例中,预处理涉及对腰部局部肌肉肌电信号的滤波、去噪及标准化处理。肌电信号的有效频段为10-500赫兹,因此,所采集的原始信号要通过10-500赫兹带通滤波器进行处理。采集设备和我国电压220伏所产生工频干扰50赫兹通常会对肌电信号造成干扰,因此,需要对信号进行50赫兹的工频去噪。由于不同个体之间存在差异性,为了消除这种差异性,使个体处于一致标准水平进行判断,滤波、去噪后的信号需要进行标准化处理,采用最大值归一化标准化算法,对每一次获得的肌电信号进行标准化处理,最终得到待测样本。

在步骤s303中,对待测样本进行处理,得到待测样本的特征。

在本发明实施例中,可对待测样本进行时域和频域的、表现肌肉功能状态的指标参数进行筛选,得到时域指标参数:aemg、肌电均方根(rootmeansquare,rms)、肌肉共同收缩率(co-contractionratio,ccr)以及样本熵(sampleentropy,samen),以及频域指标参数:平均功率频率(meanspectralfrequency,mpf)以及中位频率(medianfrequency,mdf)。其中,aemg很大程度上表现所选肌肉在给定任务或给定动作下表面肌电的支配输出;rms与肌电信号的能量直接联系,常常被用于体现产生肌电的能量;ccr体现特定任务下各肌肉的协调能力;samen体现了在特定任务下,肌肉运动模式的复杂性;mpf代表了肌电信号频谱的重心频率;mdf代表了其小于mpf部分的总功率与大于mpf部分的总功率相等,这两个指标反映了肌肉的疲劳程度。

各指标参数计算如下:

公式(1-1)中,n代表肌电信号的样本点数,data[i]表示一段时间长度的原始肌电信号,具体指一段时间长度的时间序列信号,一个时间点对应一个电压值,如i取10,则指10个点的连续电压值;公式(1-2)中分子部分表示拮抗肌肌肉信号平均肌电值,分母部分表示所有测试的拮抗肌和主动肌的平均肌电值,平均肌电值也是指所有时间点的电压值求和再平均所得的瞬时电压值。

samen是将原始数据x(1),x(2),x(3),.......,x(k)共k个点的数据,组成m维矢量,其中,k是总的数据长度,m是矢量维数,即通过算法将数据总长度转换为如下公式(1-4)所示的m维矢量,m取值为:m<k。

x(i)=[x(i),x(i+1),...,x(i+m-1)]

i=1,2,....,k-m+1……(1-4)

定义矢量x(i)和矢量x(j)之间的距离为:

d[x(i),x(j)]=max|x(i+k)-x(j-k)|……(1-5)

其中,k=0,1,2,...,m-1,1≤i,j≤k-m+1,给定相似容限r,计算当1≤i≤k-m时,d[x(i),x(j)]<r的数目与矢量总数k-m-1的比值,该比值如公式(1-6)所示,其中,d[x(i),x(j)]<r的数目指的是,矢量x(i)与x(j)之间的距离小于r的所有样本点的数量之和。

对于i所有的平均值为:

将维数加1可得:

当k为有限值时,该序列的样本熵samen为:

公式(1-9)中m表示最大模板长度,r表示匹配公差,k为总的数据长度。一般m取值为1或2,r取值范围为[0.1sd,0.25sd],sd是时间序列的标准差(standarddeviation),在具体应用例中,m可取值为2,r取值为0.15,整个数据长度为10000样本点。

上述公式中,psd为功率谱密度(powerspectraldensity)。

在172位测试者中获取每位测试者六块肌肉:左右侧腹内斜肌、腹外斜肌、竖脊肌/多裂肌的肌电信号,经过特征提取,得到31项肌肉功能指标参数作为特征,分别为左侧腹内斜肌aemg、右侧腹内斜肌aemg、左腹外斜肌aemg、右侧腹外斜肌aemg、左侧竖脊肌/多裂肌aemg、右侧竖脊肌/多裂肌aemg、六块肌肉的整体协调性参数ccr、左侧腹内斜肌rms、右侧腹内斜肌rms、左腹外斜肌rms、右侧腹外斜肌rms、左侧竖脊肌/多裂肌rms、右侧竖脊肌/多裂肌rms、左侧腹内斜肌samen、右侧腹内斜肌samen、左腹外斜肌samen、右侧腹外斜肌samen、左侧竖脊肌/多裂肌samen、右侧竖脊肌/多裂肌samen、左侧腹内斜肌mpf、右侧腹内斜肌mpf、左腹外斜肌mpf、右侧腹外斜肌mpf、左侧竖脊肌/多裂肌mpf、右侧竖脊肌/多裂肌mpf、左侧腹内斜肌mdf、右侧腹内斜肌mdf、左腹外斜肌mdf、右侧腹外斜肌mdf、左侧竖脊肌/多裂肌mdf、右侧竖脊肌/多裂肌mdf,从而这些特征可以用于样本训练以及后续的分类识别。

在步骤s304中,将待测样本的特征输入第一分类器进行第一次判断,若所得第一判断结果指示待测样本属于第一类别,则以第一判断结果作为分类结果,若第一判断结果指示待测样本不属于第一类别,则将待测样本的特征输入第二分类器进行第二次判断,若所得第二判断结果指示待测样本属于第一类别,则以第二判断结果作为分类结果。

在本发明实施中,第一分类器对应的第一样本集合中的已分类样本以及第二分类器对应的第三样本集合中的已分类样本均属于第一类别,第一样本集合包含:由相较于属于第二类别的参考样本、特征变化不具有显著差异的已分类样本构成的第二样本集合,以及,由相较于参考样本的特征变化、与第二样本集合中已分类样本相较于所述参考样本的特征变化之间具有显著差异的已分类样本构成的第三样本集合,第一类别为下背痛症状类别,而第二类别为无下背痛症状类别或健康类别。

由于第一分类器既考虑了属于第一类别的第二样本集合中样本特征相较于第二类别参考样本特征变化的普通性,也考虑了属于第一类别的第三样本集合中样本特征相较于第二类别参考样本特征变化的相对稀有性,从而能快速、较为准确地进行分类,而第二分类器重点考虑了属于第一类别的第三样本集合中样本特征相较于第二类别参考样本特征变化的稀有性,从而能在第一分类器的分类错误时对其进行修正性地再次分类,进而有效保证了下背痛症状分类识别的准确性;另外,基于下背痛症状患者时域、频域的31种指标参数,能更加全面地反映患者的疾病表征,且该方法应用时可达到低成本、无创、无辐射的效果。

优选的,采用上述下背痛症状识别方法对172名中89例正常无下背痛症状者和83例下背痛症状患者进行分类识别,识别结果如图4所示,结果显示:在人体不同运动状态下,识别的准确率有一定差异,具体表现在:前倾状态下,识别下背痛的准确率为96.08%;在后仰状态下,识别下背痛的准确率为89.13%;在左倾状态下,识别下背痛的准确率为88.89%;在右倾状态下,识别下背痛的准确率为90.38%,所以四种运动方式下,均可以较好地区分无痛人群和下背痛人群。通过四种运动状态的识别效果可以看出,在进行下背痛症状识别时,应该选择合适的人体运动状态以提高分类识别的准确率,例如前倾运动模态,或右倾运动模态。再者,二级分类器分类识别效果显著优于一级分类器的分类识别效果。

实施例四:

图5示出了本发明实施例四提供的计算装置的结构,为了便于说明,仅示出了与本发明实施例相关的部分。

本发明实施例的计算装置包括处理器501、存储器502以及存储在存储器502中并可在处理器501上运行的计算机程序503。该处理器501执行计算机程序503时实现上述各个方法实施例中的步骤,例如图1所示的步骤s101至s102等。

本发明实施例的计算装置可以为个人电脑、智能手机、平板电脑等。该计算装置中处理器501执行计算机程序503时实现上述方法时实现的步骤可参考前述方法实施例的描述,在此不再赘述。

实施例五:

在本发明实施例中,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法实施例中的步骤,例如,图1所示的步骤s101至s102等。

本发明实施例的计算机可读存储介质可以包括能够携带计算机程序代码的任何实体或装置、记录介质,例如,rom/ram、磁盘、光盘、闪存等存储器。

实施例六:

图6示出了本发明实施例三提供的下背痛症状识别系统的结构,为了便于说明,仅示出了与本发明实施例相关的部分,其中包括:

采集模块601,用于获得待测者的腰部局部肌肉肌电信号;

预处理模块602,用于对腰部局部肌肉肌电信号进行预处理,得到待测样本;

特征提取模块603,用于对待测样本进行处理,得到作为待测样本的特征;以及,

分类模块604,用于待测样本的特征输入第一分类器进行第一次判断,若所得第一判断结果指示待测样本属于第一类别,则以第一判断结果作为分类结果,若第一判断结果指示待测样本不属于第一类别,则将待测样本的特征输入第二分类器进行第二次判断,若所得第二判断结果指示待测样本属于第一类别,则以第二判断结果作为分类结果,其中,第一分类器对应的第一样本集合中的已分类样本以及第二分类器对应的第三样本集合中的已分类样本均属于第一类别,第一样本集合包含:由相较于属于第二类别的参考样本、特征变化不具有显著差异的已分类样本构成的第二样本集合,以及,由相较于参考样本的特征变化、与第二样本集合中已分类样本相较于所述参考样本的特征变化之间具有显著差异的已分类样本构成的第三样本集合,第一类别为下背痛症状类别,而第二类别为无下背痛症状类别或健康类别。

在本实施例中,该下背痛症状识别系统实现上述方法时实现的步骤可参考前述方法实施例的描述,在此不再赘述。

在本实施例中,下背痛症状识别系统的各模块可由相应的硬件或软件单元实现,各单元可以为独立的软、硬件单元,也可以集成为一个软、硬件单元,在此不用以限制本发明。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1