铝电解阳极电流序列的特征模式提取方法及其系统与流程

文档序号:11620934阅读:176来源:国知局
铝电解阳极电流序列的特征模式提取方法及其系统与流程

本发明涉及铝电解生产过程中阳极电流的分析技术,尤其涉及一种铝电解阳极电流序列的特征模式提取方法及其系统。



背景技术:

铝电解是一个复杂的工业生产过程。在生产过程中,铝电解槽始终处于高温状态,且高温熔体具有强腐蚀性等特点。随着电流在线检测技术的改进和发展,对铝电解槽阳极导杆上的阳极电流信号检测成为可能。阳极电流是流经阳极导杆的电流信号,通过测量和计算等距压降信号的方式获取,分布在铝电解槽四周,可以高效实时的反映出电解槽整体以及各区域的状态信息。由此可见,结合阳极电流特点,高效的分析阳极电流信号的特征对提高实际生产效率尤为重要。

现有的铝电解阳极电流特征提取速度较慢,特征序列中序列位置之间的重叠率较高,特征序列的特征值相对较低,特征模式的特征性和可信度都不能让人满意。



技术实现要素:

本发明目的在于提供一种铝电解阳极电流序列的特征模式提取方法及其系统,以解决现有方法提取的特征模式特征性和可信度低的技术问题。

为实现上述目的,本发明提供了一种铝电解阳极电流序列的特征模式提取方法,包括以下步骤:

确定目标阳极导杆,对目标阳极导杆的电流信号进行数据采集,将采集的电流信号进行符号化处理得到待检索的目标序列;

依次确定目标特征模式、对应目标特征模式的项集间隔约束条件、以及序列跨度约束条件;

对待检索目标序列进行压缩,分割并定位对应所述目标特征模式的压缩序列组,然后遍历各压缩序列组中对应所述目标特征模式的潜在模式组的位置信息,根据所述潜在模式组的位置信息定位检索满足所述项集间隔约束条件及序列跨度约束条件的特征模式集,并统计所述特征模式集中所述目标特征模式的重现率以分析所述目标阳极导杆的工况。

进一步地,目标特征模式的潜在模式组的位置信息包括各特征字符的位置。

进一步地,项集间隔约束具体判断过程为:

确定潜在模式组中各特征字符的组内位置;

判断各潜在模式组中任一相邻两特征字符是否满足项集间隔约束条件,若不满足,则将该潜在模式组剔除。

进一步地,序列跨度约束具体判断过程为:

获取剩余所有潜在模式组的跨度,计算所有跨度的中位数;

计算各个潜在模式组的跨度与中位数的差值,将所有差值大于序列跨度约束的特征模式剔除,小于或等于序列跨度约束的特征模式给予保留。

进一步地,在根据潜在模式组的位置信息定位检索满足项集间隔约束条件及序列跨度约束条件的特征模式集之后,步骤还包括,计算最终检索结果的特征模式的特征值:

其中,为特征模式集中所有序列的总跨度之和,为特征模式集中各特征模式跨度与权重乘积之和,nj为字符重叠的相应特征模式组个数,nj的倒数为权重。

依托于上述方法,本发明还提出了一种铝电解阳极电流序列的特征模式提取系统,包括以下模块:

序列获取模块:用于确定目标阳极导杆,对目标阳极导杆的电流信号进行数据采集,将采集的电流信号进行符号化处理得到待检索的目标序列;

条件输入模块:用于依次确定目标特征模式、对应目标特征模式的项集间隔约束条件、以及序列跨度约束条件;

运算模块:用于对待检索目标序列进行压缩,分割并定位对应所述目标特征模式的压缩序列组,然后遍历各压缩序列组中对应所述目标特征模式的潜在模式组的位置信息,根据所述潜在模式组的位置信息定位检索满足所述项集间隔约束条件及序列跨度约束条件的特征模式集;

输出模块:用于统计所述特征模式集中所述目标特征模式的重现率以分析所述目标阳极导杆的工况。

进一步地,运算模块中目标特征模式的潜在模式组的位置信息包括各特征字符的位置。

进一步地,运算模块中项集间隔约束具体判断过程为:

确定潜在模式组中各特征模式的组内位置;

判断各潜在模式组中任一相邻两特征字符是否满足项集间隔约束条件,若不满足,则将该潜在模式组剔除。

进一步地,运算模块中序列跨度约束具体判断过程为:

获取剩余所有潜在模式组的跨度,计算所有跨度的中位数;

计算各个潜在模式组的跨度与中位数的差值,将所有差值大于序列跨度约束的特征模式剔除,小于或等于序列跨度约束的特征模式给予保留。

进一步地,本发明的铝电解阳极电流序列的特征模式提取系统还包括特征值计算模块,用于在根据潜在模式组的位置信息定位检索满足项集间隔约束条件及序列跨度约束条件的特征模式集之后,步骤还包括,计算最终检索结果的特征模式的特征值:

其中,为特征模式集中所有序列的总跨度之和,为特征模式集中各特征模式跨度与权重乘积之和,nj为字符重叠的相应特征模式组个数,nj的倒数为权重。

本发明具有以下有益效果:

对待检索目标序列进行压缩,分割并定位对应目标特征模式的压缩序列组,然后遍历各压缩序列组中对应目标特征模式的潜在模式组的位置信息,进而根据潜在模式组的位置信息定位检索满足项集间隔约束条件及序列跨度约束条件的特征模式集,加快了检索速度,在处理较长单序列时,比传统的方法速度有了明显的提升。引入了序列跨度约束,提高了特征模式的提取质量,降低了重叠性,使特征模式的特征性和可信度有了大大的提升。

下面将参照附图,对本发明作进一步详细的说明。

附图说明

构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是本发明优选实施例的铝电解阳极电流序列的特征模式提取方法流程图;

图2是本发明优选实施例连续字符所占比重图。

具体实施方式

以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。

本发明实施例公开一种铝电解阳极电流序列的特征模式提取方法,如图1所示,包括以下步骤:

步骤s1:确定目标阳极导杆,对所述目标阳极导杆的电流信号进行数据采集,将采集的电流信号进行符号化处理得到待检索的目标序列。

铝电解槽分为不同容量,阳极数量也有所不同,本实施例选用的铝电解槽包括24组由槽体隔开的阴极和阳极,现场多通道实时采集24组阳极电流信号,并选择其中几组阳极导杆的阳极电流数据进行分析。本实施例所选阳极电流数据采自阳极导杆a6-a8以及b6-b8处。数据样本如表1所示:

表1:

对采集到的阳极电流序列数据采用sax(symbolicaggregateapproximation,一种符号化的时间序列相似性度量方法)算法处理,即把时间序列进行分段均值,之后将这些均值转化为离散化的字符,从而达到了降维降噪的目的。具体过程为:假设选取连续30个数据作为数据样本,将每三个采集的数据取平均值作为一个字符点,构成一个长度为10的数据集。然后对数据集作规范化处理,即代入数据规范化算法中,x为字符点的数据,max是数据集中最大值,min是最小值,代入a6的数据集数据得到(0.497326203209,0.465240641711,0.326203208556,0.390374331551,0.272727272727,……);再通过高斯分布得到字符分裂点来确定目标序列s,分裂点如表2所示:

表2:

表2所示为通过高斯分布将得到字符分裂点将-1至1这个区间划分为α个子区间,其中β为各区间的分界点。数据在-1至第一个分裂点之间的区域对应字符a,数据在第一个分裂点至第二个分裂点之间的区域对应字符b,依此类推。完成数据字符化。换言之,该数据字符化即在电流数据的波动范围内划分成若干相邻接的区域,各区域对应特定的字符,然后将采样数据映射到具体的字符上以形成待检索的目标序列。

比如,假设得到一份数据为{-0.5,-0.3,0.1,0.3,0.6,0.9},若选择α为6的那一列(-0.97,-0.43,0,0.43,0.97),如果-0.5对于上面区域在-0.97与-0.43之间,则对应一个字符b,-0.3对于上面区域在-0.43与0之间,则对应一个字符c,字符顺序从左自右依次类推,得到目标序列s。其中,在确定α的区间值时,可以根据上述数据集的长度合理确定,优选的,数据集长度与α的区间值一致;通常,区间值越大,相关的数据处理精度会相应提高。

步骤s2:依次确定目标特征模式、对应目标特征模式的项集间隔约束条件、以及序列跨度约束条件。

本发明中,可选的,由于铝电解阳极电流的高时滞特性,连续字符(即同一字符重复且连续出现的场景)序列数据占据较大的比重,阳极导杆a6-a8以及b6-b8的阳极电流序列中连续字符所占比重如图2所示,由图可见,无论是区间【1,2】内的连续字符,还是(2,5】内的连续字符,还是连续出现5次以上的字符,序列中连续字符均占有一定的比例,因此有必要对待检索的目标序列进行压缩处理;假设阳极导杆a6处的部分序列为:

s=bbbbaaceeebbgaaajddddhhhbaaa;

采用字符和数字的格式代替原序列中连续字符的格式,压缩后得到序列:

s’=b4a2c1e3b2g1a3j1d4h3b1a3。

步骤s3、对待检索目标序列进行压缩,分割并定位对应目标特征模式的压缩序列组,然后遍历各压缩序列组中对应目标特征模式的潜在模式组的位置信息,根据潜在模式组的位置信息定位检索满足项集间隔约束条件及序列跨度约束条件的特征模式集,并统计特征模式集中目标特征模式的重现率以分析目标阳极导杆的工况。

在该步骤中,相关的工况分析可以是阳极导杆的腐蚀情况以及工作温度等其中的任意一种或任意组合。

本实施例中,潜在模式组的位置信息包括各特征字符的位置;针对上述压缩后的目标序列,相关位置的表现形式可参照下述表3,可选的一种的存储结构为:首字符位置、特征字符位置序列、偏移量、跨度集合。特征字符位置序列记录的是各个特征字符在压缩序列中出现的具体位置;偏移量记录的是在压缩后序列中,首字符位置及特征字符位置序列相同的所有潜在模式组中(换言之,即同一组压缩序列中),各个潜在模式组中各个特征字符的偏移信息,跨度集合记录的是在压缩后序列中,首字符位置及特征字符位置序列相同的所有潜在模式组中(即同一组压缩序列中),各个潜在模式组中首尾特征字符所占据的跨度值。例如,针对模式p=ba的候选集存储结构如表3所示:

表3:

表3中,项集间隔约束采用g=[0,2],目标特征模式p=ba。

对应表3,还是以s’=b4a2c1e3b2g1a3j1d4h3b1a3为例,该压缩序列中,对应目标特征模式的压缩序列组中,按从左到右的顺序进行分割,三个存储序列组各自的首字符位置分别为1、5、7;特征字符位置序列分别为(1,2)、(5,7)、(11,12)。表3中的对应首字符位置1的偏移量分别为(1,0)(2,0)(2,1)(3,0)(3,1),这是因为对应目标特征模式的第一组压缩序列组为:b4a2(其完整表现形式为:bbbbaa),在该压缩序列组中,由于重叠字符的存在,存在着若干种组合的潜在模式组;其中,第一个b相对于第一个a的间隔为3,相对于第2个a的间隔为4,不满足集间隔采用约束g=[0,2]的条件,予以剔除;第2个b相对于第一个a的间隔为2,满足集间隔采用约束g=[0,2]的条件,将b序列按(0,1,2,3),a序列按(0,1)排列,因此第2个b与第一个a组成的潜在模式组的偏移量为(1,0),以此类推,第一组ba特征所对应的组内位置即为(1,0)(2,0)(2,1)(3,0)(3,1)。在对应目标特征模式的第一组压缩序列组b4a2中,如第2个b与第一个a构成的ba模式长度为4,第4个b与第2个a构成的ba模式长度为3,以此类推,第一组ba特征所对应的跨度集合为4,3,4,2,3。

在该步骤中,项集间隔约束为特征模式各相邻特征字符之间间隔的约束条件,小于或等于间隔约束的潜在模式组予以保留,否则,予以剔除。通过检索筛选出符合项集间隔约束的特征模式候选集。

在该步骤中,在对项集间隔约束条件进行筛选后,还进一步的,获取剩余所有潜在模式组的跨度,计算所有跨度的中位数;计算各个潜在模式组的跨度与中位数的差值,将所有差值大于序列跨度约束的特征模式剔除,小于或等于序列跨度约束的特征模式给予保留。例如:在对应目标特征模式abc中,特征字符a与b之间、以及b与c之间,可能间隔有或多或少的其他干扰字符,例如潜在模式组中对应该目标特征模式abc的最大跨度为15,最小的跨度为3,则中位数可取9,藉此,则假设存在潜在模式组aertbyuc,该模式组的跨度为8,判断满足跨度约束条件。

本实施例中,对待检索目标序列进行压缩,(可参照上述表3)分割并定位对应目标特征模式的压缩序列组,然后遍历各压缩序列组中对应目标特征模式的潜在模式组的位置信息,进而根据潜在模式组的位置信息定位检索满足项集间隔约束条件及序列跨度约束条件的特征模式集,例如:相关的定位检索可参照上述表3,先通过定位对应目标特征模式的压缩序列组,然后在对该压缩序列组中各种能组合的潜在模式组进行后续约束条件的判断,加快了检索速度,在处理较长单序列时,比传统的方法速度有了明显的提升。引入了序列跨度约束,提高了特征模式的提取质量,降低了重叠性,使特征模式的特征性和可信度有了大大的提升。

进一步地,在根据潜在模式组的位置信息定位检索满足项集间隔约束条件及序列跨度约束条件的特征模式集之后,还包括计算最终检索结果的特征模式的特征值:

其中,为特征模式集中所有序列的总跨度之和,为特征模式集中各特征模式跨度与权重乘积之和,nj为字符重叠的相应特征模式组个数,nj的倒数为权重。举例说明如下:

假设序列为:bfgaggbacga,按从左至右的顺序分别为1-11;目标特征模式为bag,若最终筛选出的特征模式集中,与重现率关联的各特征字符顺序分别为(1、4、5)、(1、4、6)、(7、8、10),其中(1、4、5)、(1、4、6)存在ba两字符重叠,则η的计算公式如下:

藉此,字符的重叠率越低,特征值η越大;反之,特征值η越小。如果所有位置之间都不重叠,则该值为1,说明模式的特征性和周期性很强。

随着序列跨度约束强度逐渐加大,本实施例的算法提取出的特征模式数量较传统算法有明显减少,但特征模式的重现率η均值有显著提高,这表明特征模式候选集中序列位置之间的重叠率下降,特征模式的特征性和可信度得到明显加强和提高。在本案申请人的实验论证中,针对上述表1中阳极导杆a8处,传统算法以及mail算法所提取的特征模式的重现率η均值仅为17.1%和41.1%,可见其中特征模式候选集中序列位置之间的重叠率较高,而本发明的改进算法使该均值提升至77.1%,有效的突出了特征模式的特征性。

与上述方法相对应的,本发明还提出了一种铝电解阳极电流序列的特征模式提取系统,包括以下模块:

序列获取模块:用于确定目标阳极导杆,对目标阳极导杆的电流信号进行数据采集,将采集的电流信号进行符号化处理得到待检索的目标序列;

条件输入模块:用于依次确定目标特征模式、对应目标特征模式的项集间隔约束条件、以及序列跨度约束条件;

运算模块:用于对待检索目标序列进行压缩,分割并定位对应所述目标特征模式的压缩序列组,然后遍历各压缩序列组中对应所述目标特征模式的潜在模式组的位置信息,根据所述潜在模式组的位置信息定位检索满足所述项集间隔约束条件及序列跨度约束条件的特征模式集;

输出模块:用于统计所述特征模式集中所述目标特征模式的重现率以分析所述目标阳极导杆的工况。

进一步地,运算模块中目标特征模式的潜在模式组的位置信息包括特征模式的首字符位置和特征模式的特征字符位置序列。

进一步地,运算模块中项集间隔约束具体判断过程为:

确定潜在模式组中各特征模式的组内位置;

各特征模式的组内位置中相邻两位之间满足于项集间隔约束条件的给予保留,不满足的剔除。

进一步地,运算模块中序列跨度约束具体判断过程为:

获取潜在模式组中所有组内位置的跨度,计算所有跨度的中位数;

计算各个目标特征模式的潜在模式组中组内位置的跨度与中位数的差值,将所有差值大于序列跨度约束的特征模式剔除,小于或等于序列跨度约束的特征模式给予保留。

进一步地,本发明的铝电解阳极电流序列的特征模式提取系统还包括特征值计算模块,特征值计算模块的中特征值的计算公式为:

其中,为标准特征模式集中所有序列的总跨度之和,为特征模式集中存在重叠字符的相关特征模式跨度与权重乘积之和,nj为重叠子序列个数。

同理,本实施例系统对待检索目标序列进行压缩,分割并定位对应目标特征模式的压缩序列组,然后遍历各压缩序列组中对应目标特征模式的潜在模式组的位置信息,进而根据潜在模式组的位置信息定位检索满足项集间隔约束条件及序列跨度约束条件的特征模式集,加快了检索速度,在处理较长单序列时,比传统的方法速度有了明显的提升。引入了序列跨度约束,提高了特征模式的提取质量,降低了重叠性,使特征模式的特征性和可信度有了大大的提升。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1