本发明属于手势识别技术领域,具体是涉及到一种基于fmcw雷达系统的笔画识别方法以及系统。
背景技术:
目前常用的人机交互方法有键盘、鼠标、手写板、触屏输入等,这些方式都是接触式人机交互方式。在很多特殊应用场景下接触式交互设备受环境限制,比如手术室的无菌操作和视觉障碍用户的操作。但随着科技的发展,很多智能终端设备以及人机交互设备出现在市场上,一些智能手机上设置了无障碍模式,提供了语音反馈以便用户在使用设备时不用看着屏幕,这能简化视觉障碍用户的操作,但可能存在隐私问题。针对视觉障碍用户设计专用的人机交互设备,用户需要费大量时间去适应产品,其没有主动去适应用户需求,而需要用户做出变化。
在非接触式人机交互设备中,基于视觉的人机交互设备有人提出了通过手机摄像头识别汉字的方法:一个是通过摄像头框取,扫描并识别汉字的方法,这种方法需要用户不断调整摄像头的上下距离和左右位置来框取,并点击确认来获取所要识别的汉字,其操作不好控制;另一个是通过先拍得一张包含所需汉字的图片,然后涂抹所要识别汉字,再将涂抹区域进行识别的方法,这种方法步骤过多且涂抹位置不好把握。还有人提出基于计算机视觉手势的文字输入方式:一个途径是人们正常使用纸笔书写然后通过摄像头采集纸上的书写墨迹,将其识别为文字。这种方法仍然受到了外部条件(如,纸张大小等)的限制;另一个途径是直接通过手指在桌面或空中书写虚拟文字,使用摄像头或运动传感器(如,kinect等)实时采集手指的移动轨迹,之后将轨迹识别为文字,这种方法字与字之间很难切割,只能识别最简单的文字。
基于射频的人机交互设备也只是做到了简单的手势指令操作,从目前已发表的文献资料来看,还没有利用毫米波雷达完成手写汉字基本笔画识别的相关研究。如果能够准确的识别手写汉字基本笔画,后续能发展到非接触式手写汉字人机交互设备,此项研究不仅能运用在无障碍模式中,也能运用在游戏、医疗、军事等人机交互领域。
技术实现要素:
针对现有非接触式人机交互设备存在的上述问题,本发明提供一种基于fmcw雷达系统的笔画识别方法以及系统。
本发明的技术方案如下:
第一方面,一种基于fmcw雷达系统的笔画识别方法,包括:
获取基于fmcw雷达系统手写汉字包含的至少一个待识别笔画的中频信号数据;
对各所述待识别笔画的所述中频信号数据进行预处理,获取各所述待识别笔画的特征图集合;该预处理包括特征提取和特征增强;
获取训练完成的汉字基本笔画识别模型;所述汉字基本笔画识别模型是指以所述特征图集合为输入参数,以基本笔画类别为输出参数的卷积神经网络模型;
将各所述待识别笔画的所述特征图集合输入至所述汉字基本笔画识别模型中,并获取所述汉字基本笔画识别模型输出的与每个所述待识别笔画匹配的基本笔画类别。
优选地,所述对各所述待识别笔画的所述中频信号数据进行预处理,获取各所述待识别笔画的特征图集合,包括:
通过第一算法对各所述待识别笔画的所述中频信号数据进行特征提取,获得对应的特征矩阵集合,所述特征矩阵集合包含距离-时间矩阵和角度-时间矩阵;
通过第二算法对各所述待识别笔画的所述特征矩阵集合进行特征增强,获得对应的所述特征图集合。
优选地,所述通过第一算法对各所述待识别笔画的所述中频信号数据进行特征提取,获得对应的特征矩阵集合,所述特征矩阵集合包含距离-时间矩阵和角度-时间矩阵,包括:
根据所述中频信号数据的格式和笔画挥动过程的趋势变化特征,通过第三算法获取所述中频信号数据的频率矩阵,并根据所述频率信息的变化获得距离随时间变化的距离-时间矩阵;
根据所述中频信号数据的格式和笔画挥动过程的趋势变化特征,通过第四算法获取所述距离矩阵的相位数据矩阵,并将所述相位数据矩阵转换为角度数据矩阵之后获得角度随时间变化的角度-时间矩阵。
优选地,所述根据所述中频信号数据的格式和笔画挥动过程的趋势变化特征,通过第四算法获取所述距离矩阵的相位数据矩阵,并将所述相位数据矩阵转换为角度数据矩阵之后获得角度随时间变化的角度-时间矩阵,包括:
对所述中频信号数据进行快速傅氏变换,获得所述距离矩阵中每个矩阵元素的相位信息;
对所述相位矩阵进行协方差运算获得协方差矩阵,并对预设的空间谱函数进行遍历获得所述角度矩阵;
将所述角度矩阵进行时间序列组合获得所述角度-时间矩阵。
优选地,所述通过第二算法对各所述待识别笔画的所述特征矩阵集合进行特征增强,获得对应的所述特征图集合,包括:
根据用两种特征矩阵表示的图像获取所述图像中特征区域位置坐标,并根据预设的矩阵框提取图像中笔画挥动过程的趋势变化特征;
通过第五算法获得最佳阈值,根据最佳阈值将两种所述特征矩阵二值化,获得对应的二画值图像;
对两种所述特征矩阵对应的所述二画值图像进行开操作。
优选地,所述获取训练好的汉字基本笔画识别模型之前,包括:
获取手写汉字预设基本笔画的第一样本数据和第二样本数据;所述第一样本数据和第二样本数据均包含预设数量的预设基本笔画对应的特征图集合;
搭建待训练的汉字基本笔画识别模型;
设置模型训练参数以及损失函数;
将所述第一样本数据输入至所述汉字基本笔画识别模型进行迭代训练,根据所述损失函数计算所述汉字基本笔画识别模型输出的预测类别结果与实际类别结果之间的损失值;
在每次迭代完成后,将所述第二样本数据输入至所述汉字基本笔画识别模型进行测试,获取所述汉字基本笔画识别模型的预测准确率;
每次迭代后判断损失值下降程度,以更新模型训练参数或者提前终止学习。
优选地,所述汉字基本笔画识别模型包括多个卷积层和多个池化层的卷积神经网路结构和三层全连接神经网路结构。
优选地,所述所述基本笔画类别为:
其中,
第二方面,一种基于fmcw雷达系统的笔画识别系统,包括:
数据获取模块,用于获取基于fmcw雷达系统手写汉字包含的至少一个待识别笔画的中频信号数据;
处理模块,用于对各所述待识别笔画的所述中频信号数据进行预处理,获取各所述待识别笔画的特征图集合;该预处理包括特征提取和特征增强;
模型获取模块,用于获取训练完成的汉字基本笔画识别模型;所述汉字基本笔画识别模型是指以所述特征图集合为输入参数,以基本笔画类别为输出参数的卷积神经网络模型;
识别模块,用于将各所述待识别笔画的所述特征图集合输入至所述汉字基本笔画识别模型中,并获取所述汉字基本笔画识别模型输出的与每个所述待识别笔画匹配的基本笔画类别。
优选地,所述的基于fmcw雷达系统的笔画识别系统,还包括
样本获取模块,用于获取手写汉字预设基本笔画的第一样本数据和第二样本数据;所述第一样本数据和第二样本数据均包含预设数量的预设基本笔画对应的特征图集合;
搭建模块,用于搭建待训练的汉字基本笔画识别模型,设置模型训练参数和损失函数;
训练模块,用于将所述第一样本数据输入至所述汉字基本笔画识别模型进行迭代训练,根据所述损失函数计算所述汉字基本笔画识别模型输出的预测类别结果与实际类别结果之间的损失值;
输出模块,用于根据所述损失值判断所述汉字基本笔画识别模型是否训练完成;
测试模块,用于将所述第二样本数据输入至训练完成的所述汉字基本笔画识别模型进行测试,获取所述汉字基本笔画识别模型的预测准确率。
采用上述方案,本发明具有以下有益效果:
1)本发明通过对手写汉字包含的待识别笔画的中频信号数据进行特征提取、特征增强等预处理,得到两种特征图,降低了用于表征手势运动趋势的数据量,提高了特征提取效率,同时节约了模型训练时间;
2)本发明通过汉字基本笔画网络模型对待识别笔画的两种特征图进行识别,得到基本笔画类别,能够精确地判别出基本笔画类别。此外,本发明有利于非接触式人机交互设备后续发展。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例中基于fmcw雷达系统的笔画识别方法的流程示意图;
图2为本发明一实施例中基于fmcw雷达系统的笔画识别方法的步骤s20的流程示意图;
图3为本发明一实施例中基于fmcw雷达系统的笔画识别方法的步骤s201的流程示意图;
图4为本发明一实施例中基于fmcw雷达系统的笔画识别方法的步骤s202的流程示意图;
图5为本发明另一实施例中基于fmcw雷达系统的笔画识别方法的模型训练过程的流程示意图;
图6为本发明一实施例中基于fmcw雷达系统的笔画识别系统的结构示意图;
图7为本发明另一实施例中基于fmcw雷达系统的笔画识别系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在一个本发明的实施例中,如图1所示,本发明实施例提供了一种基于fmcw雷达系统的笔画识别方法,该方法包括:
步骤s10,获取基于fmcw雷达系统预设手写汉字包含的至少一个待识别笔画的中频信号数据。
在步骤s10之前,本实施例需要对fmcw雷达(frequencymodulatedcontinuouswaveradar,调频连续波雷达)系统的硬件设备进行配置,设置手部运动区域的空间范围。
以手写汉字“八”字为例,使fmcw雷达系统发射电磁波的方向正对着手部,对手写汉“八”字的二个待识别笔画的挥动过程进行数据采集,得到各待识别笔画的中频信号数据。
步骤s20,对各所述待识别笔画的所述中频信号数据进行预处理,获取各所述待识别笔画的特征图集合。
在本实施例中,对手写汉字基本笔画的中频信号数据进行预处理包括特征提取和特征增强,其中,特征提取包括用于生成距离-时间矩阵(rtm)的距离估计和用于生成角度-时间矩阵(atm)的角度估计;特征增强包括特征区域框定、二值化和开操作。作为优选,如图2所示,步骤s20具体包括以下步骤:
步骤s201,通过第一算法对各所述待识别笔画的所述中频信号数据进行特征提取,获得对应的特征矩阵集合,所述特征矩阵集合包含距离-时间矩阵和角度-时间矩阵。
其中,第一算法为距离特征序列提取(distancefeaturesequenceextraction,dfse)和角度特征序列提取(azimuthfeaturesequenceextraction,afse)结合的特征提取算法(da-fse算法),用于通过距离-时间矩阵(rtm)和角度-时间矩阵(atm)来表征笔画挥动过程的趋势变化特征。
作为优选,如图3所示,步骤s201具体包括以下步骤:
步骤s2011,距离估计,根据所述中频信号数据的格式和笔画挥动过程的趋势变化特征,通过第三算法获取所述中频信号数据的频率矩阵,并将所述频率矩阵转换为距离矩阵之后获得距离随时间变化的距离-时间矩阵。
其中,第三算法为短时傅里叶变换(stft算法);频率矩阵包含中频信号数据每一帧的频率信息;距离矩阵包含由频率信息经转换得到的距离信息,距离-时间矩阵是指由距离矩阵按照时间维度进行组合的二维矩阵。作为优选,步骤s2011具体包括以下步骤:
首先,获取窗函数以及窗函数的参数;可选的,根据中频信号数据的特性和参数配置,通过多次对比实验选取窗函数并设置窗函数大小、冗余度。
然后,将所述窗函数和所述频率矩阵输入至基于第三算法的矩阵转化模型中,获得所述矩阵转化模型输出的所述距离矩阵;可选的,基于第三算法的矩阵转化模型为:
公式(1)中,
最后,将所述距离矩阵进行时间序列组合得到距离-时间矩阵(rtm)。
步骤s2012,角度估计,根据所述中频信号数据的格式和笔画挥动过程的趋势变化特征,通过第四算法获取所述中频信号数据的相位矩阵,并将所述相位矩阵转换为角度矩阵之后获得角度随时间变化的角度-时间矩阵。
其中,第四算法为傅里叶变换和空间谱函数结合的算法(range-capon算法);相位矩阵包含中频信号数据每一帧的相位信息;角度矩阵包含相位信息经转换得到的角度信息;角度-时间矩阵是指角度矩阵按照时间维度进行组合的二维矩阵。作为优选,步骤s2012具体包括以下步骤:
首先,将所述中频信号数据进行一次快速傅里叶变换(fft),获得包含相位信息的相位矩阵,可理解的,该相位矩阵中每一个矩阵元素表征中频信号数据每一帧的相位信息。
然后,对所述相位矩阵进行协方差运算获得协方差矩阵,并对预设的空间谱函数进行一次遍历获得角度矩阵。其中,空间谱函数为:
公式(2)中,
最后,将所述角度矩阵进行时间序列组合得到角度-时间矩阵(atm)。
本实施例中,采用第一算法(da-fse算法)获得距离随时间变化的距离-时间矩阵(rtm)和角度随时间变化的角度-时间矩阵(atm),进而通过距离-时间矩阵(rtm)和角度-时间矩阵(atm)来表征笔画挥动过程的趋势变化特征,能够减少数据量,同时有利于节约模型训练的时间。
步骤s202,通过第二算法对各所述待识别笔画的所述特征矩阵集合进行特征增强,获得对应的所述特征图集合。
其中,第二算法为特定区域框定、二值化和开操作结合的特征增强算法(fa-fbo算法),用于通过特定区域框定、二值化和开操作等一系列操作对用特征矩阵表示的图像进行特征增强。作为优选,如图4所示,步骤s202具体包括以下步骤:
步骤s2021,特征区域框定,根据用两种特征矩阵表示的图像获取所述图像中特征区域位置坐标,并根据预设的矩阵框提取图像中笔画挥动过程的趋势变化特征。其中,两种特征矩阵为距离-时间矩阵和角度-时间矩阵;预设的矩阵框设置为固定大小。
步骤s2022,二值化,通过第五算法获得最佳阈值,根据最佳阈值将两种所述特征矩阵二值化,获得对应的二画值图像。其中,第五算法为最大类间方差法(otsu算法)。
也即,采用otsu算法获得最佳阈值,当图像像素灰度值大于或等于最佳阈值时,将其置于第一数值,例如第一数值为255;反之,当图像像素灰度值小于最佳阈值时,将其置于第二数值,例如第二数值为0,进而分别将两种特征矩阵二值化得到二画值图像。作为优选,步骤s2022的二值化具体表示为:
公式(3)中,
步骤s2023,开操作,对两种所述特征矩阵对应的所述二画值图像进行开操作,使两种特征矩阵对应的二画值图像中的趋势变化特征的轮廓变得光滑,并断开狭窄的间断和消除细的突出物。作为优选,步骤s2023的开操作具体表示为:
公式(4)中,c为结构元素,b为集合。由公式(4)可知,用结构元素c对集合b进行开操作是指用结构元素c对集合b腐蚀,再用结构元素c对结果进行膨胀。
本实施例中,采用第二算法(fa-fbo算法)对距离随时间变化的rtm和角度随时间变化的atm进行特征增强,能够减少误差干扰并使特征突出。
步骤s30,获取训练完成的汉字基本笔画识别模型;所述汉字基本笔画识别模型是指以所述特征图集合为输入参数,以基本笔画类别为输出参数的卷积神经网络模型。
在本实施中,所述步骤s30中的汉字基本笔画识别模型是基于后续步骤s501至步骤s505训练获得的卷积神经网络模型。
步骤s40,将各所述待识别笔画的所述特征图集合输入至所述汉字基本笔画识别模型中,并获取所述汉字基本笔画识别模型输出的与每个所述待识别笔画匹配的基本笔画类别。
将各待识别笔画的特征图集合输入至汉字基本笔画识别模型,获得汉字基本笔画识别模型输出的一维数组,该输出数组是长度为
公式(5)、(6)中,
综上可知,本实施例首先通过对手写汉字包含的待识别笔画的中频信号数据进行特征提取、特征增强等预处理,得到两种特征图,降低了用于表征手势运动趋势的数据量,提高了特征提取效率,同时节约了模型训练时间。然后通过汉字基本笔画网络模型对待识别笔画的两种特征图进行识别,得到基本笔画类别,能够精确地判别出基本笔画类别。此外,本发明有利于非接触式人机交互设备后续发展。
作为本发明的再一个实施例,如图5所示,所述基于fmcw雷达系统的笔画识别方法,还包括模型训练的过程,具体包括以下步骤:
步骤s501,获取手写汉字预设基本笔画的第一样本数据和第二样本数据;所述第一样本数据和第二样本数据均包含预设数量的预设基本笔画对应的特征图集合。
在本实施例中,所述第一样本数据和第二数据样本的数量样本数量可以根据需求进行设置。以手写汉字“永”字为例,基于fmcw雷达系统对手写汉“永”字八个基本笔画横、点、提、撇、弯、捺、竖、钩的中频信号数据进行了采集。对每种基本笔画的中频信号数据采集100组样本数据,总共可以采集800组手写汉字基本笔画的样本数据,对于每一个样本数据进行预处理,包括:首先通过第一算法对各样本数据进行特征提取,以获得各数据样本的特征矩阵集合,然后通过第二算法对特征矩阵集合包含的两种特征矩阵进行特征增强,以得到对应的特征图集合,最后将特征图集合中包含的两种特征图进行归一化处理。可选的,可以将特征图规范化为125×189大小。
进一步的,对预处理后得到的手写汉字基本笔画的特征图集合进行分组,可选的,将其中的500组特征图集合作为手写汉字预设基本笔画的的第一样本数据,另外的300组特征图集合作为手写汉字基本笔画的第二样本数据。其中,该第一样本数据用于训练汉字基本笔画模型的训练,该第二样本数据用于测试汉字基本笔画模型的预测准确率。
需要说明的是,在其他实施例中,可以先对样本数据进行分组,再对分组后的样本数据进行预处理。
步骤s502,搭建待训练的汉字基本笔画识别模型,设置模型训练参数以及损失函数。
在本实施例中,该汉字基本笔画识别模型包括具有多个卷积层和多个池化层的卷积神经网路(cnn)结构和三层全连接神经网路结构。可选的,卷积神经网路(cnn)结构包含三层卷积层和三层池化层;cnn的三层卷积层的卷积核大小均为3×3,步长为1,每层的卷积核个数分别为4、4和8,卷积时采用全零填充操作;池化层核大小为2×2,步长为2。三层全连接神经网路结构中,隐藏层节点数为100,输出层节点数为
模型训练参数可以根据需求进行设置,模型训练参数包含但不限定于批量大小、学习率、迭代次数和方向传播算法等。可选的,可以分别将批量大小设置为10,学习率设置为0.00001,迭代次数设置为100,方向传播算法设置为随机梯度下降算法。
损失函数可以根据需求进行设置,损失函数可以采用交叉熵算法。
步骤s503,将所述第一样本数据输入至所述汉字基本笔画识别模型进行迭代训练,根据所述损失函数计算所述汉字基本笔画识别模型输出的预测类别结果与实际类别结果之间的损失值。
步骤s504,根据所述损失值判断所述汉字基本笔画识别模型是否训练完成。
在模型训练过程中,将手写汉字预设基本笔画的第一样本数据输入至待训练的汉字基本笔画识别模型进行迭代训练,通过损失函数计算模型输出的预测类别结果与实际类别结果之间的损失值,判断损失值是否小于预设损失阈值,若损失值小于预设损失阈值,则确定模型训练完成,保存模型训练参数,此时将提前终止学习;反之,若损失值大于或等于预设损失阈值,则更新模型训练参数,基于更新模型训练参数对汉字基本笔画识别模型重新进行训练,直至损失值小于预设损失阈值,则确定模型训练完成,保存更新后的模型训练参数。
步骤s505,将所述第二样本数据输入至训练完成的所述汉字基本笔画识别模型进行测试,获取所述汉字基本笔画识别模型的预测准确率。
需要说明的是,如图5所示,步骤s501至步骤s505执行于步骤s10之前,在其他实施例中,步骤s501至步骤s505也可以执行于步骤s20,或者步骤s30之前,因此步骤s501至步骤s505仅需执行在步骤s30、步骤s20和步骤s10中的任意一个步骤之前即可。
在模型测试过程中,将手写汉字预设基本笔画的第二数据样本作为训练完成的汉字基本笔画识别模型的输入参数,输入参数通过汉字基本笔画识别模型中的卷积神经网路(cnn)结构提取到特征向量,并通过三层全连接神经网路结构得到输出结果,也即手写汉字基本笔画的类别,进而获取模型的预测准确率。通过实验可以得到,采用300个第二样本数据测试汉字基本笔画识别模型,模型的预测准确率可以达到96%。可理解的,本实施例的基于fmcw雷达系统的笔画识别方法,可以精确地判别基本笔画类别。
此外,本发明实施例还提供了一种基于fmcw雷达系统的笔画识别系统,如图7所示,该系统包括数据获取模块110、预处理模块120、模型获取模块130和识别模块140,各功能模块的详细说明如下:
数据获取模块110,用于获取基于fmcw雷达系统手写汉字包含的至少一个待识别笔画的中频信号数据。
预处理模块120,用于对各所述待识别笔画的所述中频信号数据进行预处理,获取各所述待识别笔画的特征图集合;该预处理包括特征提取和特征增强。
模型获取模块130,用于获取训练完成的汉字基本笔画识别模型;所述汉字基本笔画识别模型是指以所述特征图集合为输入参数,以基本笔画类别为输出参数的卷积神经网络模型。
识别模块140,用于将各所述待识别笔画的所述特征图集合输入至所述汉字基本笔画识别模型中,并获取所述汉字基本笔画识别模型输出的与每个所述待识别笔画匹配的基本笔画类别。
进一步的,如图6所示,所述预处理模块120包括特征提取子模块121和特征增强子模块122,各功能子模块的详细说明如下:
特征提取子模块121,用于通过第一算法对各所述待识别笔画的所述中频信号数据进行特征提取,获得对应的特征矩阵集合,所述特征矩阵集合包含距离-时间矩阵和角度-时间矩阵。
特征增强子模块122,用于通过第二算法对各所述待识别笔画的所述特征矩阵集合进行特征增强,获得对应的所述特征图集合。
进一步的,如图6所示,所述特征提取子模块121包括以下单元,各功能单元的详细说明如下:
距离估计单元1211,用于根据所述中频信号数据的格式和笔画挥动过程的趋势变化特征,通过第三算法获取所述中频信号数据的频率矩阵,并根据所述频率信息的变化获得距离随时间变化的距离-时间矩阵。
角度估计单元1212,用于根据所述中频信号数据的格式和笔画挥动过程的趋势变化特征,通过第四算法获取所述距离矩阵的相位数据矩阵,并将所述相位数据矩阵转换为角度数据矩阵之后获得角度随时间变化的角度-时间矩阵-时间矩阵。
进一步的,所述角度估计单元包括以下单元,各功能单元的详细说明如下:
变换单元,用于对所述中频信号数据进行快速傅氏变换,获得所述距离矩阵中每个矩阵元素的相位信息。
遍历单元,用于对所述相位矩阵进行协方差运算获得协方差矩阵,并对预设的空间谱函数进行遍历获得所述角度矩阵。
组合单元,用于将所述角度矩阵进行时间序列组合获得所述角度-时间矩阵。
进一步的,如图6所示,该特征增强子模块122包括以下以下单元,各功能单元的详细说明如下:
特征框定单元1221,用于根据用两种特征矩阵表示的图像获取图像中特征区域位置坐标,并根据预设的矩阵框提取图像中笔画挥动过程的趋势变化特征。
二值化单元1222,用于通过第五算法获得最佳阈值,根据最佳阈值将两种所述特征矩阵二值化,获得对应的二画值图像。
开操作单元1223,用于对两种所述特征矩阵对应的所述二画值图像进行开操作。
进一步的,如图7所示,该系统还包括样本获取模块151、搭建模块152、训练模块153、测试模块154和输出模块155,各功能模块的详细说明如下:
样本获取模块151,用于获取手写汉字预设基本笔画的第一样本数据和第二样本数据;所述第一样本数据和第二样本数据均包含预设数量的预设基本笔画对应的特征图集合。
搭建模块152,用于搭建待训练的汉字基本笔画识别模型,设置模型训练参数和损失函数。
训练模块153,用于将所述第一样本数据输入至所述汉字基本笔画识别模型进行迭代训练,根据所述损失函数计算所述汉字基本笔画识别模型输出的预测类别结果与实际类别结果之间的损失值。
输出模块154,用于根据所述损失值判断所述汉字基本笔画识别模型是否训练完成;
测试模块155,用于将所述第二样本数据输入至训练完成的所述汉字基本笔画识别模型进行测试,获取所述汉字基本笔画识别模型的预测准确率。
进一步的,所述模型获取模块130中所述汉字基本笔画识别模型包括具有多个卷积层和多个池化层的卷积神经网路结构和三层全连接神经网路结构。
进一步的,所述识别模块140中所述基本笔画类别为:
其中,
本发明实施例中提供的基于fmcw雷达系统的笔画识别系统,能够通过对手写汉字包含的待识别笔画的中频信号数据进行特征提取、特征增强等预处理,得到两种特征图,降低了用于表征手势运动趋势的数据量,提高了特征提取效率,同时节约了模型训练时间;且能够通过汉字基本笔画网络模型对待识别笔画的两种特征图进行识别,得到基本笔画类别,能够精确地判别出基本笔画类别。此外,本发明有利于非接触式人机交互设备后续发展。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。