动态数据类别确定系统的制作方法

文档序号:23705362发布日期:2021-01-23 12:57阅读:84来源:国知局
[0001]本发明涉及数据处理
技术领域
:,尤其涉及一种动态数据类别确定系统。
背景技术
::[0002]数据处理领域是计算机领域的重要分支。在计算机领域中,根据呈现方式,数据可以包括文本数据、图像数据、音频数据、视频数据等多种;根据存储方式,数据可以被存储到数据库、文本文件、特定格式文件(例如.doc/.gls)等;根据数据形成的方式,可以包括静态数据和动态数据,动态数据尤其是随时间变化的数据,例如通过温度传感器获取的温度数据、通过路由器交换机等网络设备获取的网络流量数据、通过gps或北斗等采集的设备lbs数据等。[0003]数据分类是数据处理领域中的重要技术,对静态数据分类相对容易,动态数据多是随时间变化的数据(尤其是随时间高频变化的数据),需要考虑时间维度对关联关系的影响,因此,如何对动态数据进行分类,成为数据处理的难点。现有的数据分类方法,例如,采用两条曲线相匹配的方式对数据进行分类,但可能计算出两个曲线是正相关,但事实上却是负相关的关系,因此分类准确性低,且采用曲线拟合的方式来拟合动态数据,效率较低。由此可知,如何提供一种高效准确的动态数据分类技术成为亟待解决的技术问题。技术实现要素:[0004]本发明目的在于,提供一种动态数据类别确定系统,提高了动态数据分类的效率和准确度。[0005]根据本发明第一方面,提供了一种动态数据类别确定系统,包括数据库、m个时间框架,处理器和存储有计算机程序的存储器,每一所述时间框架对应一种唯一的数据类型,所述m个时间框架对应m种数据类型,m为正整数,所述数据库包括第一数据表,所述第一数据表中的每条记录均为周期采样数据,所述第一数据表的字段包括周期采样数据id、g个时间-采样值对、周期标识,其中,g为采样周期内固定的采样次数;[0006]当所述计算机程序被处理器执行时,实现以下步骤:[0007]步骤s1、接收用户输入的待测周期采样数据id和第y-z周期到y周期,其中y和z均为正整数,y大于z;[0008]步骤s2、根据所述待测周期采样数据id在所述第一数据表的周期采样数据id中进行检索,获取所述待测周期采样数据id对应的记录,根据第i周期在所述待测周期采样数据id对应的记录的周期标识中进行检索,获取对应的g个时间-采样值对中的采样值,i=y-z,y-z+1…y;[0009]步骤s3、根据g个时间-采样值对中的采样值获取第i周期的待测周期采样数据,直至获取到第y-z周期到y周期的待测周期采样数据,将所述第y-z周期到y周期的待测周期采样数据按照时间顺序构成待测周期采样数据序列;[0010]步骤s4、将所述待测周期采样数据序列分别输入所述第j时间框架,j=1,2…m,将所述待测周期采样数据序列与所述第j时间框架进行匹配,获取所述待测周期采样数据序列与第j时间框架的匹配度qj,直至获取到所述待测周期采样数据序列与所有m个时间框架的匹配度;[0011]步骤s5、从所得到的m个匹配度中选择最大匹配度,将所述最大匹配度的时间框架对应的数据类型确定为待测周期采样数据的数据类型。[0012]本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明提供的一种动态数据类别确定系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:[0013]本发明基于多个时间框架来确定动态数据的类别,提高了动态数据分类的效率和准确度。[0014]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。附图说明[0015]图1为本发明实施例提供的动态数据类别确定系统示意图。具体实施方式[0016]为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种动态数据类别确定系统的具体实施方式及其功效,详细说明如后。[0017]本发明实施例提供一种动态数据类别确定系统,如图1所示,包括数据库、m个时间框架,处理器和存储有计算机程序的存储器,每一所述时间框架对应一种唯一的数据类型,所述m个时间框架对应m种数据类型,m为正整数,所述数据库包括第一数据表(table),所述第一数据表中的每条记录均为周期采样数据,所述第一数据表的字段(field)包括周期采样数据id、g个时间-采样值对、周期标识,其中,g为采样周期内固定的采样次数,周期标识根据g个时间-采样值对中最早的时间和最晚时间构成的时间范围确定;[0018]当所述计算机程序被处理器执行时,实现以下步骤:[0019]步骤s1、接收用户输入的待测周期采样数据id和第y-z周期到y周期,其中y和z均为正整数,y大于z;[0020]步骤s2、根据所述待测周期采样数据id在所述第一数据表的周期采样数据id中进行检索,获取所述待测周期采样数据id对应的记录,根据第i周期在所述待测周期采样数据id对应的记录的周期标识中进行检索,获取对应的g个时间-采样值对中的采样值,i=y-z,y-z+1…y;[0021]步骤s3、根据g个时间-采样值对中的采样值获取第i周期的待测周期采样数据,直至获取到第y-z周期到y周期的待测周期采样数据,将所述第y-z周期到y周期的待测周期采样数据按照时间顺序构成待测周期采样数据序列;[0022]步骤s4、将所述待测周期采样数据序列分别输入所述第j时间框架,j=1,2…m,将所述待测周期采样数据序列与所述第j时间框架进行匹配,获取所述待测周期采样数据序列与第j时间框架的匹配度qj,直至获取到所述待测周期采样数据序列与所有m个时间框架的匹配度;[0023]步骤s5、从所得到的m个匹配度中选择最大匹配度,将所述最大匹配度的时间框架对应的数据类型确定为待测周期采样数据的数据类型。[0024]本发明实施例所述系统基于多个时间框架来确定动态数据的类别,提高了动态数据分类的效率和准确度。[0025]本发明所述系统可以物理实现为一个服务器,也可以实现为包括多个服务器的服务器群组;所有用户均可终端开输入或接收信息,终端包括台式电脑、笔记本电脑、平板电脑、手机等。本领域技术人员知晓,服务器和终端的型号、规格等参数并不影响本发明的保护范围。[0026]作为一种实施例,所述步骤s3中、第i周期的待测周期采样数据为对应g个时间-采样值对中采样值的均值、中位数、最大值、最小值、最后时间采样值或最初时间采样值。其中,均值可为加权平均值,优选的,所述周期结果数据是g个时间-采样值的加权平均值。[0027]作为一种实施例,所述数据库还包括第二数据表,所述第二数据表中的每条记录均为周期采样数据,所述第二数据表的字段包括数据类型id、g个关键变量的时间-采样值对、周期标识;基于所述而数据表可以预先在所述系统中构建所述m个时间框架,具体地,当所述计算机程序被处理器执行时,还实现:[0028]步骤s10、构建每一所述时间框架,具体包括:[0029]步骤s101、接收用户输入的数据类型id和第p-q周期到第p周期,其中p和q均为正整数,p大于q,y-z大于p-q,y小于p;[0030]步骤s102、根据用户输入的数据类型id在所述第二数据表中的数据类型id中进行检索,获取所述用户输入的数据类型id对应的记录;[0031]步骤s103、根据第r周期在所所述用户输入的数据类型id对应的记录中进行检索,获取对应的g个关键变量的时间-采样值对中的采样值,r=p-q,p-q+1…p;[0032]步骤s104、根据g个关键变量的时间-采样值对中的采样值获取第r周期的关键变量数据,直至获取到第p-q周期到第p周期的关键变量数据,将第p-q周期到第p周期的关键变量数据构成关键变量的时间序列;[0033]步骤s105、根据所述关键变量的时间序列确定对应的第一状态区间、第二状态区间…第n状态区间,n为大于等于2的正整数;[0034]步骤s106、基于所述第一状态区间、第二状态区间…第n状态区间将第p-q周期到第p周期的时间划分为不同的状态时间段,得到所述用户输入的数据类型id对应的时间框架。[0035]通过步骤s101-步骤s106,基于每类数据的关键变量的时间序列构建对应的时间框架,以此来作为动态数据的分类依据,提高了动态数据分类的准确性。[0036]作为一种实施例,步骤s104中、所述第r周期的关键变量数据为对对应的g个关键变量的时间-采样值对中采样值的均值、中位数、最大值、最小值、最后时间采样值或最初时间采样值,其中,均值可为加权平均值,优选的,所述周期结果数据是g个时间-采样值的加权平均值。[0037]可以理解的是,n可以根据具体的分类参数、分类需求等来设定,作为一种实施例,n等于3,[0038]所述步骤s105包括:[0039]步骤s115、获取所述关键变量的时间序列的均值和标准差;[0040]步骤s125、基于所述关键变量的时间序列的均值和标准差确定三个状态区间:[0041]将所述关键变量的时间序列值>(均值+w*标准差)的周期确定为所述第一状态区间,[0042]将(均值-w*标准差)≤关键变量的时间序列值≤(均值+w*标准差)的周期确定为所述第二状态区间,[0043]将关键变量的时间序列值<(均值-w*标准差)的周期确定为所述第二状态区间。[0044]可以理解的是,w的值可以根据分类精确度等参数来具体设定,作为一种实施例,所述w取值范围可设定为(0.3,1),优选地,w=0.5。[0045]作为一种实施例,所述步骤s4包括:[0046]步骤s41、将所述待测周期采样数据序列输入所述第j时间框架,获取第j时间框架的所有状态区间总数xj、所有第n状态区间对应的待测周期采样数据序列区间期末值大于期初值的第n状态区间的数量xnj1、所有第n状态区间对应的待测周期采样数据序列区间期末值小于期初值的第n状态区间的数量xnj2;[0047]步骤s42、基于xj、xnj1、xnj2获取所述待测周期采样数据序列与第j时间框架的匹配度的匹配度qj:[0048][0049]其中,xnj为第j时间框架的所有第n状态区间的数量xnj。[0050]为了进一步提高数据分类的准确性,可以再得到的m个匹配度中选择所述最大匹配度之后,通过基于第n状态数据序列的预测参数特征来确定待测周期采样数据的数据类型是否为所述最大匹配度的时间框架对应的数据类型,作为一种实施例,所述第二数据表的字段还包括预设参数特征条件信息,所述步骤s5中,从所得到的m个匹配度中选择所述最大匹配度之后,还包括:[0051]步骤s51、获取所述最大匹配度的时间框架对应的数据类型id;[0052]步骤s52、根据所述最大匹配度的时间框架对应的数据类型id在所述第二数据表的数据类型id中进行检索,获取所述最大匹配度的时间框架对应的预设参数特征条件;[0053]步骤s53、将所述待测周期采样数据序列在所述最大匹配度的时间框架的所有第n状态区间对应时间段的数据串联,组成第n状态数据序列;[0054]步骤s54、获取所述第n状态数据序列对应的预测参数特征,直至获取所有n个状态数据序列;[0055]步骤s55、判断第一状态数据序列的预测参数特征,第二状态数据序列的预测参数特征…第n状态数据序列的预测参数特征是否符合所述最大匹配度的时间框架对应的预设参数特征条件,若符合,则将所述最大匹配度的时间框架对应的数据类型确定为所述待测周期采样数据的数据类型。[0056]仍以n=3为示例,所述预设参数特征条件可以为:所述第一状态数据序列的预测参数特征、第二状态数据序列的预测参数特征、第三状态数据序列的预测参数特征数值依次递减;或者,切换至所述第三状态数据序列的预测参数最小。可以理解的是,还可以设置其他的预设参数特征条件,不同的数据类型id可以对应相同的或不同的预设参数特征条件。[0057]以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。当前第1页1 2 3 当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1