一种模型训练方法、装置、电子设备及存储介质与流程

文档序号:33192541发布日期:2023-02-04 09:12阅读:40来源:国知局
一种模型训练方法、装置、电子设备及存储介质与流程

1.本发明涉及计算机应用技术领域,尤其涉及一种模型训练方法、装置、电子设备及存储介质。


背景技术:

2.人体动作识别研究是物联网领域当下的热点研究方向,对于特定室内环境中的动作识别任务,可以通过部署wi-fi设备,利用人体的活动对wi-fi信号产生的扰动识别用户的特定行为,既不涉及用户隐私,也不受光线、视距等因素影响。
3.但是通过wi-fi信号识别用户动作具有一定的局限性,由于wi-fi信号与环境等多种因素息息相关,在某些室内环境中训练好的模型很难直接迁移到其它环境中去使用,而且很难采集大量实际应用环境中的用户数据,会降低模型的准确性。所以,一种能够准确判断人体动作类型的模型训练方法成为了目前亟待解决的问题。


技术实现要素:

4.本发明提供了一种模型训练方法、装置、电子设备及存储介质,以提高模型识别动作类型的准确性,提升用户的使用体验。
5.根据本发明的一方面,提供了一种模型训练方法,其中,该方法包括:
6.对原始数据集中的原始数据进行数据预处理得到对应的第一目标数据集;
7.采用预设数据增强算法对第一目标数据集进行数据增强,得到对应的第二目标数据集,其中,第二目标数据集中的目标数据量大于第一目标数据集中的目标数据量;
8.采用第二目标数据集对预先创建的原始神经网络模型进行训练,以得到对应的目标神经网络模型。
9.根据本发明的另一方面,提供了一种模型训练装置,其中,该装置包括:
10.第一数据集确定模块,用于对原始数据集中的原始数据进行数据预处理得到对应的第一目标数据集;
11.第二数据集确定模块,用于采用预设数据增强算法对第一目标数据集进行数据增强,得到对应的第二目标数据集,其中,第二目标数据集中的目标数据量大于第一目标数据集中的目标数据量;
12.模型训练模块,用于采用第二目标数据集对预先创建的原始神经网络模型进行训练,以得到对应的目标神经网络模型。
13.根据本发明的另一方面,提供了一种电子设备,该电子设备包括:
14.至少一个处理器;
15.以及与至少一个处理器通信连接的存储器;
16.其中,存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行本发明任一实施例的一种模型训练方法。
17.根据本发明的另一方面,提供了一种计算机可读存储介质,该计算机可读存储介
质存储有计算机指令,计算机指令用于使处理器执行时实现本发明任一实施例的一种模型训练方法。
18.本发明实施例的技术方案,通过对原始数据集中的原始数据进行数据预处理得到对应的第一目标数据集,采用预设数据增强算法对第一目标数据集进行数据增强,得到对应的第二目标数据集,采用第二目标数据集对预先创建的原始神经网络模型进行训练,以得到对应的目标神经网络模型,实现了扩充第一目标数据集,生成第二目标数据集,通过扩充后的第二目标数据集训练原始神经模型,提高了模型识别动作类型的准确性,提升用户的使用体验。
19.应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
20.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
21.图1是根据本发明实施例提供的一种模型训练方法的流程图;
22.图2是根据本发明实施例提供的一种模型训练方法的流程图;
23.图3是根据本发明实施例提供的一种模型训练方法的流程图;
24.图4是根据本发明实施例提供的未经预处理的原始数据的一条子载波示例图;
25.图5是根据本发明实施例提供的预处理后的原始数据的一条子载波示例图;
26.图6是根据本发明实施例提供的一种残差神经网络改进方法的流程图;
27.图7是根据本发明实施例提供的一种模型训练装置的结构示意图;
28.图8是实现本发明实施例的一种模型训练方法的电子设备的结构示意图。
具体实施方式
29.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
30.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
31.在一些实施例中,图1是根据本发明实施例提供的一种模型训练方法的流程图,本
实施例可适用于训练识别动作类型的模型情况,该方法可以由一种模型训练装置来执行,该模型训练装置可以采用硬件和/或软件的形式实现,该模型训练装置可配置于电子设备中。如图1所示,该方法包括:
32.s110、对原始数据集中的原始数据进行数据预处理得到对应的第一目标数据集。
33.其中,原始数据集可以是由原始数据组成的数据集,原始数据可以是指由wi-fi设备发送的包含人体动作信息的信道状态信息(channel state information,csi),可以是包含一段时间数据的序列片段以及对应的初始动作标签。在实际的操作过程中,用户可以在规定时间内完成指定动作,其中,规定动作的数量可以包括多个。接收天线可以采集包含人体动作信息的信道状态信息,其中,接收天线的数量可以为一个或者多个,接收天线的数量越多,获取的原始数据数量越大。在一实施例中,当接收天线的数量为3时,可以将接收的数据生成1
×
3的多进多出(multiple-in multiple out,mimo)阵列,以提高信道容量。数据预处理可以是指在主要的处理以前对数据进行的一些处理,通过数据预处理可以消除原始数据集的原始数据的噪声干扰、补全丢失的数据、以及对原始数据作规范化的调整。示例性的,数据预处理可以包括对原始数据消除噪声、切割动作片段等。第一目标数据集可以是指由数据预处理后的原始数据组成的数据集。
34.在实施例中,在获取原始数据后,由于环境等原因的影响,原始数据集中的部分原始数据可能不准确,可以对原始数据进行数据预处理。由于信道状态信息在非视距传输过程中,各种家具、设备以及墙体均可以吸收部分信号,会导致部分原始数据的缺失,需要对原始数据集中的原始数据补全缺失值。补全缺失值的方式可以包括多种,示例性的,补全缺失值的方式可以包括线性插值、多项式差值或者二次差值等,通过线性插值等方式,可以根据相邻的原始数据进行估值补充原始数据。由于接收原始数据时传输功率和传输速率等参数的变化可以引起接收原始数据的设备性能发生变化,产生突发噪声,对原始数据造成影响,需要对原始数据集中的噪声进行消除。噪声可以通过滤波器进行消除,其中,滤波器可以包括但不限于采用巴特沃斯滤波器等低通滤波器。在一实施例中,可以设置巴特沃斯滤波器频率的下限截止频率和上限截止频率,过滤截止频率以外的噪声。在一实施例中,下限截止频率和上限截止频率可以是工作人员根据经验设定的,示例性的,下限截止频率可以为1hz、2hz、3hz等,上限截止频率可以为170hz、175hz、177hz等。由于原始数据是随机采集的,所以每个原始数据包含的序列片段的长度可以是不同的,需统一每个原始数据的序列片段长度。在一实施例中,可以将每个人体动作信息的信道状态信息切割为相同长度的序列片段,其中,序列片段的长度可以是工作人员根据经验设定的,示例性的,一个序列片段的长度可以包括150、200、250等。通过对原始数据集中的原始数据进行数据预处理,得到对应的第一目标数据集。
35.s120、采用预设数据增强算法对第一目标数据集进行数据增强,得到对应的第二目标数据集,其中,第二目标数据集中的目标数据量大于第一目标数据集中的目标数据量。
36.其中,预设数据增强算法可以是预先设置的增强第一目标数据集中数据的算法,其中,预设增强算法可以包括窗口切片算法和mixup算法等。第二目标数据集可以是指通过预设数据增强算法对第一目标数据集进行数据增强后生成的数据集。
37.在实施例中,可以预先设置数据增强算法对第一目标数据集进行数据增强。其中,预设增强算法可以包括窗口切片算法或者mixup算法。当预设增强算法为窗口切片算法时,
可以通过预先设置切片窗口大小,通过滑动窗口,生成补充的数据。其中,切片窗口大小的序列宽度应小于原始数据的序列片段。在一实施例中,当序列片段中的长度为200时,可以预先设置切片窗口大小为180,当切片窗口在时间维度进行滑动时,可以得到多个序列片段长度为180的数据,可以将生成的数据合并入第一目标数据集生成第二目标数据集,此时,生成的数据的初始动作标签可以为原始数据的初始动作标签。当预设增强算法为mixup时,可以在获取第一目标数据集中获取任意两个数据,配置对每个数据的权重值,生成对应的数据,此时,生成的数据的初始动作标签可以为带有对应权重的标签,将生成的数据合并入第一目标数据集生成第二目标数据集。
38.s130、采用第二目标数据集对预先创建的原始神经网络模型进行训练,以得到对应的目标神经网络模型。
39.其中,原始神经网络模型可以是预先创建的用于训练的模型,原始神经网络模型可以包括但不限于任意可以处理时序信息的一维卷积模型,示例性的,可以包括但不限于经调整结构的残差神经网络模型。其中,目标神经网络模型可以是指通过输入包含人体动作信息的信道状态信息,获取对应动作类型的模型。
40.在一些实施例中,原始神经网络模型的创建过程,包括:
41.获取基础神经网络模型;
42.调整基础神经网络模型的卷积核尺寸,得到对应的原始神经网络模型。
43.在实施例中,基础神经网络模型可以包括残差神经网络模型。由于残差神经网络模型为处理图片的二维卷积模型,而训练样本为时序的一维卷积,可以通过调整基础神经网络模型的卷积核尺寸将处理图片的二维卷积调整为处理时序信息的一维卷积,得到对应的原始神经网络模型。
44.在实施例中,第二目标数据集输入到预先创建的原始神经网络模型后,原始神经网络模型可以根据第二目标数据集中的数据提取数据动作特征以及初始动作标签,根据动作特征和初始动作标签重新确定数据对应的训练标签。在一实施例中,原始神经网络模型可以直接根据初始动作标签确定数据对应的训练标签,又或者,原始神经网络模型可以根据动作特征预测数据为各个动作的概率,将概率值最大的动作作为对应数据的训练标签。将第二目标集合对应数据的训练标签对原始神经网络模型进行训练,得到对应的目标神经网络模型。
45.本发明实施例,通过对原始数据集中的原始数据进行数据预处理得到对应的第一目标数据集,采用预设数据增强算法对第一目标数据集进行数据增强,实现了数据集中数据的扩充,得到对应的第二目标数据集,通过第二目标数据集训练原始神经网络模型,提高了模型的准确性,提升用户的使用体验。
46.在一些实施例中,对模型使用的过程进行说明。具体地,在得到目标神经网络模型之后,还包括:将预先获取的测试样本输入至目标神经网络模型中,以得到对应的动作类型。
47.其中,测试样本可以是指预先获取的包含人体动作信息的信道状态信息,可以是用于判断对应动作类型的信息;动作类型可以是预先设置的多种动作类型,不同的测试样本可以对应不同的动作类型。在实施例中,将预先获取的测试样本输入至目标神经网络模型中,目标神经网络模型可以提取测试样本的动作特征,根据测试样本得到对应的动作类
型。
48.本发明实施例,通过对第一目标数据集进行数据增强,实现了对数据集中的数据扩充,通过数据扩充得到的第二目标数据集训练原始神经网络模型,提高了模型的准确性,在使用模型的过程中,也提高了根据测试样本得到动作类型的准确性,提升了用户的使用体验。
49.在一些实施例中,图2是根据本发明实施例提供的一种模型训练方法的流程图,本实施例是在上述实施例的基础上对一种模型训练方法的进一步细化。如图2所示,该方法包括:
50.s2010、对原始数据集中的原始数据进行线性插值,得到对应的插值数据集。
51.其中,线性插值是指插值函数为一次多项式的差值方式,其在插值节点上的误差为零,通过线性插值,可以计算原始数据集中缺失的原始数据。差值数据集可以是指通过线性插值计算补全缺失的原始数据后,将缺失的原始数据合并到原始数据集中生成的数据集。
52.在实施例中,由于原始数据在非视距的情况下,传输过程中可能存在确实的情况,所以需要对原始数据集进行补全缺失值。通过对原始数据集中的原始数据进行线性插值,可以补全原始数据集中的缺失值。在一实施例中,可以提取原始数据中的自子载波流幅值进行差值,在实际的操作过程中,每个原始数据中可以包含多个子载波,示例性的,可以包括30个、90个、100个等。获取左右邻近的两个数据进行数值估值获取线性插值后的数据。示例性的,提取的相邻数据可以为(x0,y0),(x1,y1),通过可以进行x数据处的补充数据,y为补充的值。其中,x0和x1可以分别为对应数据的相位,y0和y1可以分别为对应数据的幅值。获取线性插值的数据后,可以将线性插值的数据合并入原始数据集中生成对应的差值数据集。
53.s2020、对插值数据集中的数据进行滤波,得到对应的滤波数据集。
54.其中,滤波数据集可以是指通过滤波去除差值数据集中噪声干扰后生成的数据集。
55.在实施例中,可以采用滤波器对差值数据集中的数据进行滤波,滤波器的种类可以包括但不限于巴特沃斯滤波器。当采用巴特沃斯滤波器进行滤波时,可以预先设置频率的下限截止频率和上限截止频率。示例性的,下限截止频率和上限截止频率可以是工作人员根据经验设定的,示例性的,下限截止频率可以为1hz、2hz、3hz等,上限截止频率可以为170hz、175hz、177hz等。在一实施例中,当频率的下限截止频率与上限截止频率分别为2hz与175hz时,可以滤除截止频率外的噪声干扰。对差值数据集中的数据进行滤波,可以去除差值数据集中的噪声干扰,获取动作片段,生成对应的滤波数据集。
56.s2030、对滤波数据集对应的每个动作片段进行切割,得到对应的多个序列片段,将序列片段作为初始训练样本。
57.其中,动作片段可以是指一段时间内的动作数据,是经滤波处理去除噪声的数据。初始训练样本可以是指用于训练原始神经网络模型的样本。
58.在实施例中,滤波数据集中的动作片段对应的序列片段可以是不同的,在训练模型过程中可能会造成偏差,可以将动作片段切割为包含相同长度的序列片段。其中,序列片
段的长度可以是工作人员根据经验设定的,示例性的,一个序列片段的长度可以包括150、200、250等。对滤波数据集对应的每个动作片段进行切割,可以得到多个序列片段,可以将序列片段作为初始训练样本。在一实施例中,初始训练样本中还可以包括对应动作的初始动作标签。
59.s2040、将初始训练样本作为对应的第一目标数据集。
60.在实施例中,可以将全部初始训练样本生成数据集,作为第一目标数据集。
61.s2050、从第一目标数据集中随机选取两个初始训练样本,作为对应的初始训练样本对。
62.在实施例中,第一目标数据集中可以包含多个训练样本,可以在第一目标数据集中选取两个初始训练样本,作为对应的初始训练样本对。在实际的操作过程中,选取的初始训练样本可以是随机的,任意的两个初始训练样本。
63.s2060、采用预设数据增强算法分别对每个初始训练样本对进行数据增强,得到对应的补充训练样本。
64.在实施例中,可以采用预设数据增强算法分别对每个初始训练样本进行数据增强。在一实施例中,可以通过预先设置切片窗口,通过在时间维度在初始训练样本进行滑动窗口,获取每个窗口的数据,得到对应的补充训练样本。在一实施例中,可以在获取任意两个初始训练样本,通过对两个初始训练样本配置不同的权重,生成对应的补充训练样本。
65.在一些实施例中,s2060,包括:
66.预先配置初始训练样本对中每个初始训练样本的权重值;
67.根据每个初始训练样本和对应的权重值,得到对应的补充训练样本。
68.在实施例中,可以对初始训练样本对中每个初始训练样本配置权重值,其中,每个初始训练样本的权重值可以取0到1的任意数值,只要保证初始训练样本中每个初始训练样本的权重值之和为1即可。示例性的,当初始训练样本对中其中一个初始训练样本权重值配置为0.4时,另一个初始训练样本的权重值则配置为0.6。根据每个初始训练样本和对应的权重值,可以得到对应的补充训练样本。在一实施例中,获取的初始训练样本对可以为(xi,yi)和(xj,yj),其中,xi和xj可以标识初始训练样本的数据,yi和yj可以表示初始训练样本对应的标签,通过x
new
=λxi+(1-λ)xj,y
new
=λyi+(1-λ)yj可以生成补充训练样本,其中x
new
可以为补充训练样本的数据,y
new
可以为补充训练样本的标签。
69.s2070、将每个补充训练样本和第一目标数据集中的数据进行合并,得到对应的第二目标数据集。
70.在实施例中,可以将每个补充训练样本合并入第一目标数据集中,生成对应的第二目标数据集,其中,第二目标数据集中的目标数据量大于第一目标数据集中的目标数据量。
71.s2080、通过原始神经网络模型获取第二目标数据集中每个目标数据的动作特征。
72.其中,每个目标数据可以对应一个动作特征,可以通过原始神经网络模型获取第二目标数据集中每个目标数据的动作特征,其中,原始神经网络模型可以包括但不限于残差神经网络模型。通过残差神经网络模型,可以直接提取每个目标数据的动作特征。
73.s2090、根据原始神经网络模型预测动作特征为每个动作类型的概率,将概率最大值的动作类型作为目标数据对应的训练标签。
74.其中,动作类型可以是预先设置的动作种类,动作类型的数量可以与原始数据在采集过程中对应的人体动作信息的数量相同。
75.在实施例中,可以通过原始神经网络的softmax层预测动作特征为每个动作类型的概率。在实际的操作过程中,当动作类型为6种时,输入一个目标数据对应的动作特征可以得到该动作特征分别为6个动作类型的概率,可以选取概率最大值的动作类型作为目标数据对应的训练标签。
76.s2100、将第二目标数据集中的每个目标数据和对应的训练标签输入至预先创建的原始神经网络模型进行训练,以得到对应的目标神经网络模型。
77.在实施例中,可以将目标数据集中的每个目标数据和对应的训练标签输入至预先创建的原始神经网络模型,通过每个目标数据和对应的训练标签训练原始神经网络模型,得到对应的目标神经网络模型。
78.本发明实施例,通过对原始数据集中的原始数据进行线性插值、滤波以及切割,得到初始训练样本,实现了初始训练样本的规范性,降低初始训练样本对训练模型的影响。通过从第一目标数据集中随机选取两个初始训练样本,作为对应的初始训练样本对,用预设数据增强算法分别对每个初始训练样本对进行数据增强,实现了目标样本数量的扩充,生成第二目标数据集。根据原始神经网络模型预测动作特征为每个动作类型的概率,将概率最大值的动作类型作为目标数据对应的训练标签,将第二目标数据集中的每个目标数据和对应的训练标签输入至预先创建的原始神经网络模型进行训练,以得到对应的目标神经网络模型,提高模型的准确性,提升用户的使用体验。
79.在一些实施例中,图3是根据本发明实施例提供的一种模型训练方法的流程图,本实施例是在上述实施例的基础上,以预设数据增强算法为mixup算法,目标神经网络模型为人体动作识别的神经网络模型为例对一种模型训练方法的具体说明。如图3所示,该方法包括:
80.s310、接收通过商用wi-fi设备信号发送端发射的原始数据,其中,原始数据包含人体动作信息的信道状态信息。
81.在实施例中,可以在室内环境中部署商用wi-fi设备信号设备,包括wi-fi的发送装置和接收装置,其中,商用wi-fi设备可以包括但不限于tp-link双频普通商用路由器。tp-link双频普通商用路由器的工作频段可包括2.4ghz和5ghhz,在一实施例中,由于2.4ghz频段的设备较多,噪声干扰太大,可以选用5ghz工作频段。wi-fi设备发送端与接收设备之间的距离可以不做限定,可以包括但不限于2米、2.8米、3米等。wi-fi设备发送端与接收设备可以部署在空旷且无明显遮挡物的室内环境中,其中,室内环境的尺寸可以不作限定,示例性的,可以包括长8米,宽6米。商用wi-fi设备发送端可以外接一根天线,为了提高信道容量,接收端可以配备多个接收天线,示例性的,接收天线的数量可以为3,增益可以为6db,此时获取的数据可以组成1
×
3的mimo阵列。用户可以站在设备发送端和接收装置的中间位置,根据数据工作人员的指令,可以在规定时间内完成指定动作,接收装置可以采集人体动作信息的信道状态信息。在一实施例中,指定动作的动作类型可以包括多个,示例性的,可以包括但不限于5个、6个、7个。用户完成指定动作时,可以均匀的速度完成,且每两个动作之间留有2秒的间隔,以便于切割动作信息。
82.s320、对原始数据进行预处理。
83.在实施例中,原始数据中可以不仅包含人体动作信息,也可以包含一部分环境信息和噪声等干扰信息。为了要消除与人体动作信息无关的信息,可以对原始信号进行预处理。由于设备内部本身也可以存在一定的状态变化,信号会因此出现异常的突变,因此,也可以对这些突变产生的离群点进行处理。
84.对原始数据进行预处理,目的是消除原始数据中的噪声干扰和补全缺失值。由于csi信号在某些链路上会由于非视距(non line of sight,nlos)上原始数据可能会存在丢失。例如由于各种家具、设备以及墙体等的吸收作用,均可以导致原始数据的丢失偏差,所以为了保证原始数据的完整性,可以对原始数据进行线性插值补全缺失值。在一实施例中,可以对原始数据中每个子载波流幅值进行线性插值来降低与抵消损失。其中,插值就是根据已知数据序列,根据某个规律对其中尚未存在数据记录的点进行数值估计。补全缺失值可以通过多项式插值,线性插值以及二次插值等方式实现。在一实施例中,当采用线性插值是一种补充数据时,可以对一维数据根据序列中需要插值的原始数据左右邻近的两个数据进行数值估计填充。可以通过以下公式来进行x数据处补充数据:其中(x0,y0),(x1,y1)分别为提取的相邻数据,y为补充的值。其中,x0和x1可以分别为对应数据的相位,y0和y1可以分别为对应数据的幅值
85.在一实施例中,由于传输功率变化和传输速率自适应等可以引起的设备内部本身状态的变化,导致采集到的csi数据中存在一些较大的突发噪声。而这些异常值并非动作引起的,会对动作识别造成干扰。可以采用巴特沃斯低通滤波器来消除噪声,设置频率的下限截至止频率与上限截止频率,其中,频率的下限截至止频率与上限截止频率分别为2hz与175hz。采用巴特沃斯滤波器,在阻带中可以具有缓慢下降的增益,不会使人人体动作特征的信息失真。
86.在一实施例中,图4是根据本发明实施例提供的未经预处理的原始数据的一条子载波示例图,图5是根据本发明实施例提供的预处理后的原始数据的一条子载波示例图,经过预处理后的数据明显噪声变少且更平滑。
87.在一实施例中,可以对滤波后的原始数据切割动作片段,将每个动作的信息切割为包含n个数据的序列片段,示例性的,n可以取200。在一实施例中,由于采集信息时,形成了1
×
3的mimo阵列,每组接收设备采集到的信息可以包含30个子载波,所以,每个初始训练样本中可以包含90个子载波,序列的长度可以为200。
88.s330、对处理后的数据使用mixup算法来扩大数据量。
89.在一实施例,对预处理后的数据可以使用mixup算法来扩大数据量,可以选取任意两个初始训练样本作为初始训练样本对,获取的初始训练样本对可以为(xi,yi)和(xj,yj),其中,xi和xj可以标识初始训练样本的数据,yi和yj可以表示初始训练样本对应的标签。可以通过以下共识生成补充训练样本:
90.x
new
=λxi+(1-λ)xj91.y
new
=λyi+(1-λ)yj92.其中x
new
可以为补充训练样本的数据,y
new
可以为补充训练样本的标签。
93.s340、构建人体动作识别的神经网络模型。
94.在一实施例中,可以将初始训练样本和补充训练样本输入改进的残差神经网络模
型(residual network,resnet)中,其中,改进的残差神经网络模型可以为resnet1d,基于resnet1d来完成动作的分类。
95.在一实施例中,图6是根据本发明实施例提供的一种残差神经网络改进方法的流程图,如图6所示,可以重点通过调整卷积核的尺寸,将resnet网络模型从处理图片的二维卷积调整为处理时序信息的一维卷积。
96.初始训练样本和补充训练样本经过resnet1d提取特征后,经由softmax层输出,softmax层可以输出n个li,其中,n可以代表动作类型的数量l为动作类别数目,li的含义是预测动作类别为i的概率。在一实施例中,可以将li的最大值对应的i为预测的训练标签。将初始训练样本和补充训练样本以及对应的训练标签,可以得到人体动作识别的神经网络模型。
97.本发明实施例,通过将原始数据扩增数据量,提高训练人体动作识别的神经网络模型的准确性,提升用户的使用体验。
98.在一些实施例中,图7是根据本发明实施例提供的一种模型训练装置的结构示意图。如图7所示,该装置包括:第一数据集确定模块41,第二数据集确定模块42和模型训练模块43。
99.其中,第一数据集确定模块41,用于对原始数据集中的原始数据进行数据预处理得到对应的第一目标数据集。
100.第二数据集确定模块42,用于采用预设数据增强算法对第一目标数据集进行数据增强,得到对应的第二目标数据集,其中,第二目标数据集中的目标数据量大于第一目标数据集中的目标数据量。
101.模型训练模块43,用于采用第二目标数据集对预先创建的原始神经网络模型进行训练,以得到对应的目标神经网络模型。
102.本发明实施例,通过第一数据集确定模块对原始数据集中的原始数据进行数据预处理得到对应的第一目标数据集,第二数据集确定模块采用预设数据增强算法对第一目标数据集进行数据增强,实现了数据集中数据的扩充,得到对应的第二目标数据集,模型训练模块通过第二目标数据集训练原始神经网络模型,提高了模型的准确性,提升用户的使用体验。
103.在一些实施例中,第一数据集确定模块41,包括:
104.插值数据集确定单元,用于对原始数据集中的原始数据进行线性插值,得到对应的插值数据集。
105.滤波数据集确定单元,用于对插值数据集中的数据进行滤波,得到对应的滤波数据集。
106.训练样本确定单元,用于对滤波数据集对应的每个动作片段进行切割,得到对应的多个序列片段,将序列片段作为初始训练样本。
107.第一数据集确定单元,用于将初始训练样本作为对应的第一目标数据集。
108.在一些实施例中,第二数据集确定模块42,包括:
109.样本对提取单元,用于从第一目标数据集中随机选取两个初始训练样本,作为对应的初始训练样本对。
110.补充样本生成单元,用于采用预设数据增强算法分别对每个初始训练样本对进行
数据增强,得到对应的补充训练样本。
111.数据集确定单元,用于将每个补充训练样本和第一目标数据集中的数据进行合并,得到对应的第二目标数据集。
112.在一些实施例中,补充样本生成单元,包括:
113.权重值配置单元,用于预先配置初始训练样本对中每个初始训练样本的权重值。
114.补充样本获取单元,用于根据每个初始训练样本和对应的权重值,得到对应的补充训练样本。
115.在一些实施例中,模型训练模块43,包括:
116.动作特征获取单元,用于通过原始神经网络模型获取第二目标数据集中每个目标数据的动作特征。
117.训练标签生成单元,用于根据原始神经网络模型预测动作特征为每个动作类别的概率,将概率最大值的动作类型作为目标数据对应的训练标签。
118.模型训练单元,用于将第二目标数据集中的每个目标数据和对应的训练标签输入至预先创建的原始神经网络模型进行训练,以得到对应的目标神经网络模型。
119.在一些实施例中,模型训练单元43中原始神经网络模型的创建过程,包括:
120.获取基础神经网络模型;
121.调整基础神经网络模型的卷积核尺寸,得到对应的原始神经网络模型。
122.在一些实施例中,一种模型训练装置,还包括:
123.动作类型确定模块,用于将预先获取的测试样本输入至目标神经网络模型中,以得到对应的动作类型。
124.本发明实施例所提供的一种模型训练装置可执行本发明任意实施例所提供的一种模型训练方法,具备执行方法相应的功能模块和有益效果。
125.在一些实施例中,图8是实现本发明实施例的一种模型训练方法的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
126.如图8所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(rom)12、随机访问存储器(ram)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(rom)12中的计算机程序或者从存储单元18加载到随机访问存储器(ram)13中的计算机程序,来执行各种适当的动作和处理。在ram 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、rom 12以及ram 13通过总线14彼此相连。输入/输出(i/o)接口15也连接至总线14。
127.电子设备10中的多个部件连接至i/o接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
128.处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11
的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如一种模型训练方法。
129.在一些实施例中,一种模型训练方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由rom 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到ram 13并由处理器11执行时,可以执行上文描述的一种模型训练方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行一种模型训练方法。
130.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
131.用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
132.在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
133.为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
134.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算
系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)、区块链网络和互联网。
135.计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与vps服务中,存在的管理难度大,业务扩展性弱的缺陷。
136.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
137.上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1