一种用于人类认知模式识别的特征归一化方法及系统的制作方法

文档序号:6625626阅读:242来源:国知局
一种用于人类认知模式识别的特征归一化方法及系统的制作方法
【专利摘要】本发明提供了一种用于人类认知模式识别的特征归一化方法及系统,该方法通过将特征数据按用户分组以形成特征矩阵,基于预定的归一化函数对特征矩阵进行分组参数估计以得到每个分组对应的分组参数,能够基于分组参数对特征矩阵的每个分组分别构建归一化函数,并利用构建的归一化函数对特征矩阵进行分组归一化处理。本方法采用多个归一化函数对认知模式特征数据进行归一化处理,既保留了现有特征整体归一化方法的优点,又减少了特征数据内部分布尺度过大的问题,从而提高了分类正确率,并具有很强的鲁棒性。
【专利说明】一种用于人类认知模式识别的特征归一化方法及系统

【技术领域】
[0001]本发明属于人类认知模式识别【技术领域】,特别涉及一种用于人类认知模式识别的特征归一化方法及系统。

【背景技术】
[0002]认知模式识别是指计算机通过分析人的外在行为特征达到对其内部心理模式的理解,特别是在人机交互中对于人的目的、意图进行识别和判断。使用模式识别技术对于人的不同认知模式的识别是近几年发展起来的研究热点,基于磁共振、脑波和眼动的认知模式识别方法研究的比较多。认知模式识别的流程包括以下步骤:特征提取、特征归一化、分类器训练和模式判别。
[0003]在认知模式识别处理中,特征提取及其归一化处理方法均对认知模式识别效果有着重要的影响。特征归一化的目的是将各种不同的特征转换到一个共同的值域范围,可以避免分类器训练时出现大数量级特征所占权重过大的问题,归一化处理后使得原本数量级较小但是差异性较大的特征能够在判别函数中起到相应的作用。
[0004]现有技术的特征归一化方法中,特征内部数据分布多样性问题导致不同认知模式下的特征数据互相重叠,可区分性大大降低,将会严重影响识别效果。而且该问题并不能通过特征整体归一化方法来解决,由于用户间特征数据分布存在个体差异,对特征进行特征整体归一化后仅仅解决了特征间的分布多样性问题,特征数据内部的差异仍然保留了下来,在训练分类器时就会产生影响,导致识别率不能有效地提高。
[0005]目前,适用于认知模式识别的特征提取技术已经日趋成熟,但是通用的特征归一化方法并不能满足认知模式识别的需求,因此亟需要一种能够用于认知模式识别的特征归一化方法。


【发明内容】

[0006]为了解决现有特征整体归一化方法导致识别准确率低的技术问题,本发明提供了一种分类准确率高、鲁棒性强的用于人类认知模式识别的特征归一化方法及系统。
[0007]根据本发明的一个方面,提供了一种用于人类认知模式识别的特征归一化方法,包括如下步骤:步骤SI,将特征数据按用户分组以形成特征矩阵;步骤S2,基于预定的归一化函数对特征矩阵进行分组参数估计,得到每个分组对应的分组参数;步骤S3,基于分组参数对特征矩阵的每个分组分别构建归一化函数;步骤S4,利用构建的归一化函数对特征矩阵进行分组归一化处理。
[0008]优选的,所述步骤SI包括:步骤S11,获取每个用户执行每个任务时的特征数据;步骤S12,将每个用户对应的特征数据构成特征矩阵的一行以构建特征矩阵。
[0009]优选的,所述步骤S2包括:步骤S21,设置归一化函数;步骤S22,基于特征矩阵每个分组的特征数据进行参数估计,以得到该分组对应的归一化函数的参数。
[0010]所述步骤S4中,把归一化前的每个分组的特征数据代入到该分组对应的归一化函数中,以得到该分组归一化后的特征数据。
[0011]其中,所述特征数据是每个用户执行多个任务类别的多个任务时的认知模式特征数据,所述任务类别至少包括观看图片和文本阅读。
[0012]其中,所述认知模式至少包括瞳孔直径、眼跳距离、注视时间、和注视次数中的一项或多项。
[0013]其中,所述归一化函数至少包括:Min_Max归一化函数、Z-score归一化函数、Median归一化函数或tanh归一化函数。
[0014]根据本发明的另一方面,提供了一种用于人类认知模式识别的特征归一化系统,所述系统包括特征矩阵形成单元1、分组参数估计单元2、函数构建单元3、数据处理单元4,所述特征矩阵形成单元I用于将特征数据按用户分组以形成特征矩阵;所述分组参数估计单元2连接到特征矩阵形成单元1,其基于预定的归一化函数对特征矩阵进行分组参数估计,得到每个分组对应的分组参数;所述函数构建单元3连接到分组参数估计单元2,其基于分组参数对特征矩阵的每个分组分别构建归一化函数;所述数据处理单元4连接到特征矩阵形成单元I和函数构建单元3,其利用构建的归一化函数对特征矩阵进行分组归一化处理。
[0015]优选的,所述特征矩阵形成单元I进一步包括:特征数据获取单元11,用于获取每个用户执行多种任务类型的多个任务时的特征数据并发送给特征矩阵构建单元12 ;和特征矩阵构建单元12,连接到特征数据获取单元11,其根据特征数据获取单元11获取的特征数据,将每个用户对应的特征数据构成特征矩阵T的一行以构建特征矩阵。
[0016]优选的,所述分组参数估计单元2进一步包括:函数设置单元21,用于设置归一化函数;和函数参数计算单元22,连接到函数设置单元21和前述特征矩阵形成单元I,其根据所述归一化函数的参数要求,基于特征矩阵中每个分组的特征数据计算得到该分组对应的归一化函数的参数。
[0017]如上所述,本发明提供了一种基于特征数据分组的特征归一化方法和系统,采用多个归一化函数对认知模式特征数据按用户分组以形成特征矩阵,对特征矩阵的每个分组分别构建归一化函数以进行分组归一化处理,既保留了原有特征整体归一化方法的优点,同时减少了特征数据内部分布尺度过大的问题,从而提高了分类正确率;同时,本发明提出的特征归一化方法具有很强的鲁棒性。

【专利附图】

【附图说明】
[0018]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1为现有技术提供的整体特征归一化方法流程图;
[0020]图2显示了本发明的用于人类认知模式识别的特征归一化方法的流程图;
[0021]图3显示了本发明的特征归一化方法中形成特征矩阵的流程示意图;
[0022]图4显示了本发明的特征归一化方法中分组参数估计的流程示意图;
[0023]图5显示了本发明的用于人类认知模式识别的特征归一化系统的结构示意图;
[0024]图6显示了本发明优选实施例中特征矩阵形成单元的结构示意图;
[0025]图7显示了本发明优选实施例中分组参数估计单元的结构示意图;
[0026]图8显示了现有技术的特征整体归一化方法应用于瞳孔直径的正态拟合分布图;
[0027]图9显示了本发明的特征归一化方法应用于瞳孔直径的正态拟合分布图;
[0028]图10显示了本发明的特征归一化方法与现有技术的整体归一化方法分别对瞳孔直径特征进行认知模式识别的识别率对比图;
[0029]图11显示了本发明的特征归一化方法与现有技术的整体归一化方法分别对眼跳距离特征进行认知模式识别的识别率对比图;
[0030]图12显示了本发明的特征归一化方法与现有技术的整体归一化方法分别对注视时间特征进行认知模式识别的识别率对比图;
[0031]图13显示了本发明的特征归一化方法与现有技术的整体归一化方法分别对注视次数特征进行认知模式识别的识别率对比图;
[0032]图14显示了本发明的特征归一化方法与现有技术方法对组合特征识别率的对比图。

【具体实施方式】
[0033]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0034]图1显示了现有技术中常用的特征归一化方法的示意图。
[0035]特征归一化的目的是将各种不同的特征转换到一个共同的值域范围,从而避免分类器训练时出现大数量级特征所占权重过大的问题,归一化处理后使得原本数量级较小但是差异性较大的特征能够在判别函数中起到相应的作用。除此之外,对每种特征归一化处理后,数据范围的变化使得分类算法可以较好的收敛,获得更好的识别效果。
[0036]如图1所示,现有技术的特征归一化方法包括下述步骤:
[0037]步骤SI’,选择需要使用的归一化函数;步骤S2’,对特征的所有特征数据进行归一化函数的参数估计;步骤S3’,对特征的所有特征数据使用相同参数的归一化函数进行整体转换。在这种归一化方法中,相同特征的数据采用相同参数的归一化函数进行整体变换,因此通常称为特征整体归一化方法。
[0038]这种特征整体归一化方法能够解决各个特征之间存在的分布多样性问题,研究表明,对于基于多种生物特征的用户识别系统,以及基于不同搜索引擎产生的文档相关度的文档检索系统,使用该方法均能有效提高识别性能。
[0039]但是,在实际操作中,使用认知模式识别的特征提取技术获取的特征通常具有以下特点:首先,各个特征的分布存在多样性,不同特征分布的位置和尺度具有差异;其次,为了得到人类认知的共性差异特征,需要同时提取多名用户的特征数据,比如基于视觉行为的认知模式识别,需要通过多名用户眼动特征中存在的共性差异来区分不同的认知模式。通常来说,不同用户的视觉行为特征是存在差异的,比如每名用户固有的瞳孔直径大小并不一致。因此,对于认知模式识别所提取的特征,即使是同一种特征,其内部的分布也是具有多样性的,即相同特征用户间的特征分布存在着个体差异。
[0040]对于这种相同特征用户间的特征分布存在个体差异的现象,现有技术的特征整体归一化方法在认知模式识别过程中的使用效果并不理想。具体来说,在使用该方法后,虽然统一了不同特征的值域范围,在一定程度上提高了认知模式的识别效果,但是并未解决每种特征内部存在分布多样性的问题。
[0041]图2显示了本发明的用于人类认知模式识别的特征归一化方法的流程图。
[0042]本发明的用于人类认知模式识别的特征归一化方法,主要用于对使用者执行视觉类任务时提取的大量视觉信息进行数据处理,使得经过数据处理的特征数据能够在后期的分类器训练和模式判别中被有效使用。
[0043]在本发明的实施例中,例如通过使用Tobii T120眼动装置(采样频率120Hz)采集30名用户进行20个A类任务(观看图片)和20个B类任务(文本阅读)认知时的视觉特征信息,然后提取这些用户的瞳孔直径、眼跳距离、注视时间和注视次数等体现视觉特征信息的特征数据。特征数据提取完成后通过特征归一化方法进行数据处理。
[0044]本发明的特征归一化方法包括四个阶段:特征数据分组、归一化函数选择和分组参数估计、分组归一化函数构建、特征分组归一化处理。在下面的优选实施例中,以瞳孔直径的特征数据为例描述特征分组归一化方法,同样的方法也适用于眼跳距离、注视时间和注视次数等其他特征数据,因此不再重复。
[0045]如图2所示,作为本发明优选实施例的用于人类认知模式识别的特征归一化方法包括如下步骤:
[0046]步骤SI,将特征数据按用户分组以形成特征矩阵。
[0047]将多个用户分别执行多个任务种类的多个任务的认知模式特征数据按用户数进行分组,每个用户分别执行多个任务种类的多个任务而获取的认知模式特征数据形成为一组,每个用户对应的一组特征数据构成特征矩阵T的一行,多个用户对应特征矩阵T的多个行,进而形成特征矩阵。这里,特征数据是指某个认知模式对应的特征数据,包括瞳孔直径、眼跳距离、注视时间及注视次数等视觉特征参数。
[0048]例如,将瞳孔直径特征T按用户分组,每一行为一组,30用户对应30个行,根据用户的数量最终得到30个分组。
[0049]步骤S2,基于预定的归一化函数对特征矩阵进行分组参数估计,得到每个分组对应的分组参数。
[0050]本步骤中,任选一个归一化函数,根据归一化函数的参数要求,对某个特征参数的特征矩阵的每个分组分别进行参数估计,得到每个分组对应的分组参数。
[0051 ] 可见,本发明中,对每个用户使用的归一化函数的参数彼此独立,从而能够有效解决用户间的相同特征分布存在个体差异的现象。与此对应,现有技术中是将所有的特征数据使用相同参数的归一化函数进行整体转换,各个用户的相同特征的数据采用相同参数的归一化函数进行整体变换,因此不能解决上述缺陷。
[0052]步骤S3,基于分组参数对特征矩阵的每个分组分别构建归一化函数。
[0053]根据步骤S2中得到的分组参数,对多个用户组的特征数据分别构建归一化函数,即每个用户组(对应于特征矩阵的每一行)基于其对应的归一化函数的参数构建独立的归一化函数。
[0054]步骤S4,利用构建的归一化函数对特征矩阵进行分组归一化处理。
[0055]根据步骤S3中构建的多个归一化函数,对特征矩阵中的每个用户组的特征数据分别进行归一化处理,每个用户组的归一化处理使用该组对应的分组归一化函数进行。
[0056]如上所述,本发明的特征归一化方法采用多个归一化函数对认知模式特征数据进行归一化处理,既保留了现有技术的特征整体归一化方法的优点,同时减少了特征数据内部分布尺度过大的问题,从而提高了分类正确率;同时,本发明提出的特征归一化方法具有很强的鲁棒性。
[0057]图3显示了本发明的特征归一化方法中形成特征矩阵的流程示意图。
[0058]在本发明的示例性实施例中,将所述用户数设为m个,所述任务数分为A类、B类,所述A类任务的个数为Ii1个,所述B类任务的任务数为n2个,所述认知模式特征数据表示为特征T,例如包括瞳孔直径、眼跳距离、注视时间和注视次数。如图3所示,所述形成特征矩阵的步骤SI包括:
[0059]步骤S11,获取每个用户执行每个任务时的特征数据。
[0060]分别获取每个用户在执行每个任务时的特征数据,其中,特征数据TAij, i =1,2,.= 1,2,...,H1表示第i个用户执行A类任务的每个任务获取的特征数据,特征数据TBij, i = I, 2,..., m ; j = I, 2,..., n2表示第i个用户执行B类任务的每个任务获取的特征数据。
[0061]步骤S12,将每个用户对应的特征数据构成特征矩阵的一行以构建特征矩阵。
[0062]将特征数据按用户数分组,每个用户对应的数据构成特征矩阵的一行,m个用户对应m行,即分成m个特征数据组,特征矩阵的第i个分组为:
[0063]

【权利要求】
1.一种用于人类认知模式识别的特征归一化方法,其特征在于,包括如下步骤: 步骤Si,将特征数据按用户分组以形成特征矩阵; 步骤S2,基于预定的归一化函数对特征矩阵进行分组参数估计,得到每个分组对应的分组参数; 步骤S3,基于分组参数对特征矩阵的每个分组分别构建归一化函数; 步骤S4,利用构建的归一化函数对特征矩阵进行分组归一化处理。
2.如权利要求1所述的方法,其特征在于,所述步骤SI包括: 步骤S11,获取每个用户执行每个任务时的特征数据; 步骤S12,将每个用户对应的特征数据构成特征矩阵的一行以构建特征矩阵。
3.如权利要求1所述的方法,其特征在于,所述步骤S2包括: 步骤S21,设置归一化函数; 步骤S22,基于特征矩阵每个分组的特征数据进行参数估计,以得到该分组对应的归一化函数的参数。
4.如权利要求1所述的方法,其特征在于,所述步骤S4中,把归一化前的每个分组的特征数据代入到该分组对应的归一化函数中,以得到该分组归一化后的特征数据。
5.如权利要求1至4任意一项所述的方法,其特征在于,所述特征数据是每个用户执行多个任务类别的多个任务时的认知模式特征数据,所述任务类别至少包括观看图片和文本阅读。
6.如权利要求5所述的方法,其特征在于,所述认知模式至少包括瞳孔直径、眼跳距离、注视时间和注视次数中的一项或多项。
7.如权利要求1至4任意一项所述的方法,其特征在于,所述归一化函数至少包括:Min-Max归一化函数、Z-score归一化函数、Median归一化函数或tanh归一化函数。
8.一种用于人类认知模式识别的特征归一化系统,所述系统包括特征矩阵形成单元(I)、分组参数估计单元(2)、函数构建单元(3)、数据处理单元(4),其特征在于: 所述特征矩阵形成单元(I)用于将特征数据按用户分组以形成特征矩阵; 所述分组参数估计单元(2)连接到特征矩阵形成单元(I),其基于预定的归一化函数对特征矩阵进行分组参数估计,得到每个分组对应的分组参数; 所述函数构建单元(3)连接到分组参数估计单元(2),其基于分组参数对特征矩阵的每个分组分别构建归一化函数;以及 所述数据处理单元(4)连接到特征矩阵形成单元(I)和函数构建单元(3),其利用构建的归一化函数对特征矩阵进行分组归一化处理。
9.如权利要求8所述的系统,其特征在于,所述特征矩阵形成单元(I)进一步包括: 特征数据获取单元(11),用于获取每个用户执行多种任务类型的多个任务时的特征数据并发送给特征矩阵构建单元(12);和 特征矩阵构建单元(12),连接到特征数据获取单元(11),其根据特征数据获取单元(II)获取的特征数据,将每个用户对应的特征数据构成特征矩阵T的一行以构建特征矩阵。
10.如权利要求8所述的系统,其特征在于,所述分组参数估计单元(2)进一步包括: 函数设置单元(21),用于设置归一化函数;和 函数参数计算单元(22),连接到函数设置单元(21)和前述特征矩阵形成单元(1),其根据所述归一化函数的参数要求,基于特征矩阵中每个分组的特征数据计算得到该分组对应的归一化函数的参数。
【文档编号】G06K9/62GK104200227SQ201410441415
【公开日】2014年12月10日 申请日期:2014年9月1日 优先权日:2014年5月17日
【发明者】栗觅, 吕胜富, 周宇, 钟宁 申请人:北京工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1