本发明涉及脑电信号训练识别,具体为一种基于大数据的脑电信号识别训练方法及系统。
背景技术:
1、脑电信号识别训练技术是指使用机器学习和模式识别方法来解析和分类脑电信号的过程;脑电信号是通过将电极放置在头皮上来测量大脑电活动而获取的;这些电活动是由大脑神经元的电化学活动引起的,并通过电极捕捉到;脑电信号识别训练技术的目标是从脑电信号中提取有用的信息,从而实现对不同脑状态、认知任务或脑功能的分类和识别。
2、现有的用于脑电信号识别训练方法,通常是提高识别的准确率以及降低信号数据的冗余,使脑电信号识别能够更加精准,比如在申请公开号为cn115099274a的中国专利中,公开了一种脑电信号识别方法,该方案就是通过将数据划分为训练集以及测试集,将预处理后的训练集利用多元时空深度学习技术进行训练并利用测试集进行检测,该方案是在明确测试集信息且不同测试集数据存在明显差异的情况下进行分析,这会导致在测试集信息未知时,仅分析单一的测试集信息,由于没有分析其他测试集数据的统一性,在进行识别训练时会影响训练模型的准确率,鉴于此,有必要对现有的自动化测试进行改进。
技术实现思路
1、本发明旨在至少在一定程度上解决现有技术中的技术问题之一,通过对脑电信号进行分析,得到脑电信号的对应状态,通过分析所有相同对应状态的脑电信号的统一性,判断识别模型的准确率,用于解决现有技术中因缺少对测试集信息未知时,仅分析单一的结果无法准确判断识别模型识别结果是否正确,从而导致识别模型的准确率降低的问题。
2、为实现上述目的,第一方面,本发明提供一种基于大数据的脑电信号识别训练方法,包括:
3、步骤s1,获取第一数量的脑电信号数据,将第一数量进行划分,输出训练集数据以及测试集数据;
4、步骤s2,对每个脑电信号数据进行计算分析,基于计算结果输出标签电压以及判断电压频率;
5、步骤s3,基于判断电压频率对脑电信号数据进行分析,输出对应状态;基于对应状态计算状态电压区间,输出状态电压区间;利用深度学习技术进行模型训练,输出识别模型;
6、步骤s4,利用识别模型对测试集数据进行分析,输出识别状态;基于状态电压区间对识别状态进行分析,计算分析的f1分数;对f1分数进行分析,基于分析结果输出再训练信息或训练完成信息。
7、进一步地,所述步骤s1包括如下子步骤:
8、步骤s1011,获取第一数量的脑电信号数据,所述脑电信号数据包括电压;
9、步骤s1012,将第一数量乘以第一划分系数,得到预计训练数;将第一数量减去预计训练数的差标记为预计测试数;
10、步骤s1013,计算训练数据数与测试数据数的比值,再向下取整,标记为划分间隔数。
11、进一步地,所述步骤s1还包括如下子步骤:
12、步骤s1021,将第一数量的脑电数据进行排序得到脑电数据序列,利用划分计算公式计算得到划分编号;
13、所述划分计算公式配置为bhi=i×n+1;其中bhi为第i个划分编号,n为划分间隔数,i为正整数;
14、步骤s1022,将脑电数据数列中编号与划分编号相同的脑电数据标记为测试集数据,将除测试集数据外的其他脑电信号数据标记为训练集数据。
15、进一步地,所述步骤s2包括如下子步骤:
16、步骤s2011,获取每个脑电信号数据中电压的最大值,标记为标签电压;
17、步骤s2012,将标签电压减去判断倍数的计算单位电压的差标记为第一判断端点,将第一判断端点至标签电压之间的电压标记为第一判断区间;
18、步骤s2013,计算脑电信号数据中电压位于第一判断区间的频数,标记为第一校准判断频数;
19、步骤s2014,当第一校准判断频数大于校准判断阈值时,输出标签电压;
20、步骤s2015,当第一校准判断频数小于或等于校准判断阈值时,进行最大值再判断处理。
21、进一步地,所述最大值再判断处理包括:
22、将第一判断端点更新为标签电压;
23、重复执行步骤s2012至步骤s2013,得到第一校准判断频数,当第一校准判断频数大于校准判断阈值时,输出标签电压;
24、当第一校准判断频率小于或等于校准判断阈值时,重复进行最大值再判断处理。
25、进一步地,所述判断电压频率包括第一判断频率以及第二判断频率,步骤s2还包括如下子步骤:
26、步骤s2021,分析标签电压,当标签电压小于或等于第一电压阈值时,计算第一电压区间内电压的出现频率,标记为第一判断频率;
27、步骤s2022,当标签电压大于第一电压阈值时,计算第二电压区间内电压的出现频率,标记为第二判断频率。
28、进一步地,所述对应状态包括专注状态以及分心状态,所述状态电压区间包括专注电压区间以及分心电压区间,所述步骤s3包括如下子步骤:
29、步骤s301,接收判断电压频率,当接收到第一判断频率时,分析第一判断频率,当第一判断频率小于或等于第一频率阈值时,输出分心状态;当第一判断频率大于或等于第二频率阈值时,输出专注状态;当第一判断频率位于第一判断频率至第二判断频率之间时,将对应的脑电信号数据进行删除处理;
30、步骤s302,当接收到第二判断频率时,输出分心状态;
31、步骤s303,设置出现率阈值yz,获取单个对应状态为专注状态的测试集数据的最小电压以及标签电压,将最小电压至标签电压标记为第一分析区间[a,b],其中a表示最小电压,b表示标签电压;
32、计算单个测试集数据中电压位于第一分析区间的概率,标记为c1;
33、设置初始值为1的计算次数jz;
34、开始循环分析,所述循环分析包括:
35、分析c1与yz的关系;
36、当时c1<yz时,输出第一分析区间,结束循环分析;
37、当时c1>yz时,判断jz的奇偶性;当jz为奇数时,将b减d处理,其中d为计算单位电压;重新计算c1,将jz进行加一处理;
38、当jz为偶数时,将a加d处理,重新计算c1,将jz进行加一处理;
39、重复循环分析;
40、步骤s304,重复步骤s303,计算所有对应状态为专注状态的第一分析区间;计算所有第一分析区间的平均值,标记为专注电压区间;
41、步骤s305,获取单个对应状态为分心状态的测试集数据的最小电压以及标签电压,将最小电压至标签电压标记为第二分析区间[a,b],其中a表示最小电压,b表示标签电压;
42、计算单个测试集数据中电压位于第二分析区间的概率,标记为c2;
43、设置初始值为1的计算次数jz;
44、开始循环分析,所述循环分析包括:
45、分析c2与yz;
46、当时c2小于或等于yz时,输出第二分析区间,结束循环分析;
47、当时c2大于yz时,判断jz的奇偶性;当jz为奇数时,将b减d处理,其中d为计算单位电压;重新计算c2,将jz进行加一处理;
48、当jz为偶数时,将a加d处理,重新计算c2,将jz进行加一处理;
49、重复循环分析;
50、步骤s306,重复步骤s305,计算所有对应状态为分心状态的第二分析区间;计算所有第二分析区间的平均值,标记为分心电压区间;
51、步骤s307,利用深度学习技术对训练集数据、训练集数据对应的标签电压以及训练集数据的对应状态进行模型训练,当训练完成时输出识别模型。
52、进一步地,所述步骤s4包括如下子步骤:
53、步骤s4011,使用识别模型对测试集数据进行识别,输出识别状态,所述识别状态包括专注状态以及分心状态;
54、计算识别状态为专注状态的测试集数据的电压位于专注电压区间的概率e;
55、当e大于或等于yz时,将测试集数据标记为实际专注数据;
56、当e小于yz时,不做处理;
57、计算识别状态为分心状态的测试集数据的电压位于分心电压区间的概率f;
58、当f大于或等于yz时,将测试集数据标记为实际分心数据;
59、当f小于yz时,不做处理;
60、步骤s4012,计算识别模型的精确率;
61、所述精确率的计算方法为:
62、获取识别状态为专注状态的测试集数据数,标记为预计专注数;获取实际专注数据的总数,标记为实际专注数;
63、获取识别状态为分心状态的测试集数据数,标记为预计分心数;获取实际分心数据的总数,标记为实际分心数;
64、利用精确率计算公式计算得到精确率,
65、所述精确率计算公式配置为:其中jq为精确率,sz为实际专注数,sf为实际分心数,yz为预计专注数,yf为预计分心数;
66、步骤s4013,计算识别模型的召回率;
67、所述召回率的计算方法为:设置初始值为0的召回计算值,获取测试集数据的对应状态以及识别状态,当对应状态与识别状态相同时,将召回计算值进行加一处理;
68、获取测试集数据数,利用召回率计算公式计算得到召回率,
69、所述召回率计算公式配置为:其中zh为召回率,cs为召回计算值,ces为测试集数据数;
70、步骤s4014,利用f1分数计算公式计算识别模型的f1分数;
71、所述f1分数计算公式配置为:
72、进一步地,所述步骤s4还包括如下子步骤:
73、步骤s4021,获取f1分数,当f1分数大于或等于第一分数阈值时,输出训练完成信息;
74、步骤s4022,当f1分数小于第一分数阈值时,判断精确率;当精确率大于或等于第一分数阈值时,输出训练完成信息;
75、步骤s4023,当召回率小于第一分数阈值时,输出再训练信息。
76、第二方面,本发明还提供一种基于大数据的脑电信号识别训练系统,包括脑电数据处理模块、模型训练模块以及训练分析模块;
77、所述脑电数据处理模块用于获取脑电信号数据,将脑电信号数据划分成训练集数据以及测试集数据;
78、所述模型训练模块包括标签分析单元、电压计算单元以及模型训练单元;所述标签分析单元用于对脑电信号数据进行计算分析,输出标签电压以及判断电压频率;所述标签分析单元还用于对判断电压频率进行分析,输出对应状态;所述电压计算单元用于计算分析相同对应状态的状态电压区间;所述模型训练单元用于根据训练集数据进行模型训练,输出识别模型;
79、所述训练分析模块包括准确判断单元以及准确计算单元,所述准确判断单元用于基于状态电压区间分析测试集数据的识别状态;所述准确计算单元用于计算识别模型的f1分数,基于f1分数输出再训练信息或训练完成信息。
80、本发明的有益效果:本发明通过将脑电信号数据不连续的进行划分,得到测试集数据以及训练集数据;再分析脑电信号数据中最大电压是否可参考,计算可参考的标签电压;再根据标签电压计算判断电压频率,根据判断电压频率得到对应状态;这样的好处在于,通过不连续的划分处理,能够将数据进行打乱,避免出现连续相似的数据来增加数据冗余;通过计算可参考的标签电压,能够判断出由于误差导致的异常高电压,并减小异常导致的数据波动;能够提高数据处理的智能性以及准确性;
81、本发明还通过计算训练集数据中相同对应状态的状态电压区间,再利用深度学习技术对训练集数据进行模型训练,得到识别模型;再利用识别模型对测试集数据进行识别,输出识别状态;计算识别状态与对应状态相同的数据的电压位于状态电压区间的概率,判断识别是否正确;再计算识别模型的f1分数,根据f1分数判断识别模型的准确率;这样的好处在于通过计算状态电压区间,能够得到符合单种状态的常见电压区间,再判断识别状态与对应状态相同时,电压位于常见电压区间的概率,能够准确的判断识别是否准确,提高的识别判断的准确性;
82、本技术的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本技术了解。本技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。