异常信息的识别方法和装置、存储介质、电子装置与流程

文档序号:15695464发布日期:2018-10-19 18:58阅读:146来源:国知局
异常信息的识别方法和装置、存储介质、电子装置与流程
本发明涉及互联网领域,具体而言,涉及一种异常信息的识别方法和装置、存储介质、电子装置。
背景技术
:在相关技术中,在识别数据是否为不合理数据或者异常数据时,通常采用聚类算法来识别,例如dbscan算法(density-basedspatialclusteringofapplicationswithnoise),optics算法(orderingpointstoidentifytheclusteringstructure)等;在识别数据是否为不合理数据或者异常数据时,还可以通过异常点判断的方法来识别,如3倍均方差方法。dbscan算法是一个典型的基于密度的聚类算法,与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类,从而完成对不合理信息或者异常信息的识别。optics聚类算法也是基于密度的聚类算法,通过该算法可将空间中的数据按照密度分布进行聚类,其思想和dbscan非常类似,但是和dbscan不同的是,optics算法可以获得不同密度的聚类,直接说就是经过optics算法的处理,理论上可以获得任意密度的聚类,因为optics算法输出的是样本的一个有序队列,从这个队列里面可以获得任意密度的聚类。3倍均方差方法是在判定异常值时,使用平均值±3倍标准差的方法,该方法是数据分析中常用的异常值剔除方法。在利用上述方法进行聚类后,可将离群点或者躁点归为异常信息。利用3倍均方差方法判定异常值时,单个值与平均值之差大于3倍的标准差就可判定为异常。基于密度的聚类算法dbscan或者其他的聚类算法是通过聚类的方式,将可以划为一类的内容进行划分,而离群点作为不合理的数据被剔除,这种方法通常是针对海量数据进行分析的方法,故需要提供较多的数据信息才能实现对当前信息是否为异常信息的判定;3倍均方差方法存在一个较大的缺陷是需要数据具备正态分布,而少量数据往往并不能满足正态分布的需求,也需提供大量数据才能够满足正态分布,完成异常数据识别。针对上述的问题,目前尚未提出有效的解决方案。技术实现要素:本发明实施例提供了一种异常信息的识别方法和装置、存储介质、电子装置,以至少解决相关技术中判断信息是否为异常信息的复杂度较高的技术问题。根据本发明实施例的一个方面,提供了一种异常信息的识别方法,包括:获取识别请求,其中,识别请求用于请求识别异常信息;响应于识别请求,获取第一信息,其中,第一信息为目标游戏在第一时间段内产生的游戏信息,第一时间段的时间长度为目标阈值;基于第二信息确认第一信息是否为异常信息,其中,第二信息为目标游戏在第二时间段内产生的游戏信息,第二时间段的结束时间不晚于第一时间段的起始时间,第二时间段的时间长度不小于目标阈值。根据本发明实施例的另一方面,还提供了一种异常信息的识别装置,包括:第一获取单元,用于获取识别请求,其中,识别请求用于请求识别异常信息;第二获取单元,用于响应于识别请求,获取第一信息,其中,第一信息为目标游戏在第一时间段内产生的游戏信息,第一时间段的时间长度为目标阈值;识别单元,用于基于第二信息确认第一信息是否为异常信息,其中,第二信息为目标游戏在第二时间段内产生的游戏信息,第二时间段的结束时间不晚于第一时间段的起始时间,第二时间段的时间长度不小于目标阈值。根据本发明实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,程序运行时执行上述的方法。根据本发明实施例的另一方面,还提供了一种电子装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器通过计算机程序执行上述的方法。在本发明实施例中,在获取到识别请求时,可获取待识别的第一信息,第一信息为目标游戏在第一时间段内产生的游戏信息,第一时间段的时间长度为目标阈值;然后基于第二信息确认第一信息是否为异常信息,第二信息为目标游戏在第二时间段内产生的游戏信息,换言之,可仅参考第一信息之前的一个信息(即第二信息),即可判别第一信息是否为异常信息,而不用获取大量的参考用的第二信息,且由于仅需对第二信息和第一信息进行处理,故数据运算量较小,可以解决相关技术中判断信息是否为异常信息的复杂度较高的技术问题,进而达到降低信息是否为异常信息的复杂度的技术效果。附图说明此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:图1是根据本发明实施例的异常信息的识别方法的硬件环境的示意图;图2是根据本发明实施例的一种可选的异常信息的识别方法的流程图;图3是根据本发明实施例的一种可选的信息的示意图;图4是根据本发明实施例的一种可选的信息的示意图;图5是根据本发明实施例的一种可选的信息的示意图;图6是根据本发明实施例的一种可选的游戏信息的示意图;图7是根据本发明实施例的一种可选的游戏信息的示意图;图8是根据本发明实施例的一种可选的游戏信息的示意图;图9是根据本发明实施例的一种可选的异常信息的识别装置的示意图;以及图10是根据本发明实施例的一种终端的结构框图。具体实施方式为了使本
技术领域
的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。根据本发明实施例的一方面,提供了一种异常信息的识别方法的方法实施例。可选地,在本实施例中,上述异常信息的识别方法可以应用于如图1所示的由服务器101和用户终端103所构成的硬件环境中。如图1所示,服务器101通过网络与终端103进行连接,可用于为终端或终端上安装的客户端提供服务(如游戏服务、应用服务、视频服务等),可在服务器上或独立于服务器设置数据库105,用于为服务器101提供数据存储服务,上述网络包括但不限于:广域网、城域网或局域网,终端103并不限定于pc、手机、平板电脑等。本发明实施例的异常信息的识别方法可以由服务器101来执行。图2是根据本发明实施例的一种可选的异常信息的识别方法的流程图,如图2所示,该方法可以包括以下步骤:步骤s202,服务器获取识别请求,识别请求用于请求识别异常信息。步骤s204,响应于识别请求,服务器获取第一信息,第一信息为目标游戏在第一时间段内产生的游戏信息,第一时间段的时间长度为目标阈值。可选地,第一信息的获取可以通过窗口(window)的形式获取,通过窗口可以选择出固定长度的数据,如利用长度为n的窗口,可以选择出一段长度为n的连续数据。在窗口长度选定后,会保持不变,仅通过改变窗口的起始位置,就可以选择出固定长度的数据。上述游戏信息即在游戏过程中产生的信息,游戏类型包括但不局限于弹幕类游戏、射击游戏、冒险游戏、休闲游戏、多人在线战术竞技游戏moba等,以多人在线战术竞技游戏为例,游戏信息可以为游戏中某个英雄角色的胜率、某个英雄角色的使用率、在某个游戏场景中参与游戏的胜率、英雄角色的输出治疗量等。步骤s206,服务器基于第二信息确认第一信息是否为异常信息,第二信息为目标游戏在第二时间段内产生的游戏信息,第二时间段的结束时间不晚于第一时间段的起始时间,第二时间段的时间长度不小于目标阈值。上述的第一信息和第二信息可以时间序列(英文名称为timeseries)的形式存在,时间序列是指将同一统计指标的数值(如上述的游戏信息)按其发生的时间先后顺序排列而成的数列,通过采用时间序列的形式可以根据已有的历史数据(第二信息)对未来或现在的第一信息进行判断,判断出其是否为异常数据。上述异常数据或异常信息(英文名称为abnormaldata)是不符合过去一段时间内的变化趋势的数据。在上述实施例中,以本发明实施例的异常信息的识别方法由服务器101来执行为例进行说明,本发明实施例的异常信息的识别方法也可以由终端103来执行,与上述方案不同之处在于执行主体由服务器替换为了终端,还可以是由服务器101和终端103共同执行,如终端将第一信息提供给服务器来判定其是否异常,或服务器将第二信息提供给终端来判定第一信息是否异常。其中,终端103执行本发明实施例的异常信息的识别方法也可以是由安装在其上的客户端来执行。通过上述步骤s202至步骤s206,在获取到识别请求时,可获取待识别的第一信息,第一信息为目标游戏在第一时间段内产生的游戏信息,第一时间段的时间长度为目标阈值;然后基于第二信息确认第一信息是否为异常信息,第二信息为目标游戏在第二时间段内产生的游戏信息,换言之,可仅参考第一信息之前的一个信息(即第二信息),即可判别第一信息是否为异常信息,而不用获取大量的参考用的第二信息,且由于仅需对第二信息和第一信息进行处理,故数据运算量较小,可以解决相关技术中判断信息是否为异常信息的复杂度较高的技术问题,进而达到降低信息是否为异常信息的复杂度的技术效果。需要说明的是,基于密度的聚类算法dbscan或者其他的聚类算法是通过聚类的方式,将可以划为一类的内容进行划分,而离群点作为不合理的数据被剔除,这种方法通常是针对海量数据进行分析的方法,并且这些聚类算法处理的数据通常都不是时间序列,即数据是没有时间维度的;而3倍均方差方法存在一个较大的缺陷是需要数据具备正态分布,而时间序列的数据通常不是正态分布的,所以3倍均方差在时间序列的剔除不合理数据上并不完全适用。本方案提出了一种在窗口长度作为宽容度的情况下,使用面积计算的方法来确定数据在何时可以被认定为异常数据或异常信息的方法,可以降低相关技术中确认是否为异常信息的复杂度(体现在需要的数据量大和运算复杂度较高),下文结合图2所示的步骤进一步详述本申请的技术方案:在步骤s202提供的技术方案中,应用软件、网络游戏等应用通常都会记录用户或玩家的行为数据或者统计数据,这些数据会成为软件开发人员去衡量应用数据、游戏数据的质量以及改进的重要依据,比如,在moba游戏中,游戏开发人员会对包括胜率、伤害、控制时长等等数据进行监控,监控时可触发识别请求,服务器获取到触发的识别请求,按照识别请求的指示识别异常信息,从而发现异常波动的数据信息(即异常信息),并在数据异常时进行检查和分析。例如,某英雄的胜率在过去n个小时内一直维持在50%附近。而在n+1时刻,胜率达到了55%。那么55%是否属于异常变化的情况,可通过本发明,鉴别该英雄是否存在数据不合理变化的情况。而不合理变化指的是数据序列不符合过去一段时间内的预测趋势,本申请提供的即一种可以识别不合理数据并进行预警的方案。在步骤s204提供的技术方案中,响应于识别请求,服务器获取第一信息,第一信息为目标游戏在第一时间段内产生的游戏信息,第一时间段的时间长度为目标阈值。可选地,为了完整地判断出第一信息是否为异常信息,第一信息的长度可小于或等于第二信息的长度,如图3所示,纵轴表示周期,横轴表示每个周期内的时间刻度,以一个周期为一天为例,每个周期内可以有24个小时,一种可选的第二信息如图3所示,为采集到的4点到23点的信息,第一信息的长度小于或等于第二信息的长度,那么第一信息在第一周期t1内的起始时间应该大于等于第二信息在第二周期t2内的起始时间,如第一信息的起始时间为4点或者5点,第一信息在第一周期t1内的结束时间应该小于等于第二信息在第二周期t2内的结束时间,如第一信息的结束时间为18点或者23点。为了提高判断出第一信息是否为异常信息的效率,第一信息的长度可设置为等于第二信息的长度,这样,在获取第一信息时,如图3所示,可获取在第一时间周期t1中第一时间段内产生的游戏信息为第一信息,第一时间段的起始时间在第一时间周期内的时间位置与第二时间段的起始时间在第二时间周期内的时间位置相同,如同为4点,第一时间段的结束时间在第一时间周期内的时间位置与第二时间段的结束时间在第二时间周期内的时间位置相同,如同为23点。获取第一信息的方式可以用窗口(windows)获取,窗口的长度可以为w,那么每次获取的数据信息(也即第一信息)的长度可为(t+2),可以从窗口起始位置向前多获取一个单位长度的数据信息,并向后多获取一个单位长度的数据信息。相关技术中针对不合理数据或者成为异常数据,通常采用聚类算法或者异常点判断等算法,在进行聚类后,将离群点或者躁点归为异常数据,通常这些算法都要海量数据并且忽视了时间在其中的作用,而对于游戏而言,往往关注的数据是近期较少的数据样本,而且这些样本点通常与时间相关,即为时间序列数据,而采用本申请的技术方案,可以满足该需求。在步骤s206提供的技术方案中,服务器基于第二信息确认第一信息是否为异常信息,第二信息为目标游戏在第二时间段内产生的游戏信息,第二时间段的结束时间不晚于第一时间段的起始时间,第二时间段的时间长度不小于目标阈值。在上述技术方案中,以第二信息为一个为例,基于第二信息确认第一信息是否为异常信息可包括如下两个方面:其一,在第一信息中的游戏信息在第一时间段内的第一变化类型与第二信息中的游戏信息在第二时间段内的第二变化类型匹配的情况下,确定第一信息不为异常信息,此处的变化类型可以理解为变化趋势;其二,在第一信息中的游戏信息在第一时间段内的第一变化类型与第二信息中的游戏信息在第二时间段内的第二变化类型不匹配的情况下,确定第一信息为异常信息。在上述技术方案中,第二信息可为多个,例如,第二信息为x个,与前一实施例类似地,基于第二信息确认第一信息是否为异常信息也可包括如下两个方面:其一,在第一信息中的游戏信息在第一时间段内的第一变化类型与至少y个第二信息中的游戏信息在第二时间段内的第二变化类型匹配的情况下,换言之只要x个第二信息中游戏信息的变化趋势与第一信息的游戏信息的变化趋势匹配的个数达到y个,则可确定第一信息不为异常信息,整数y为不大于整数x;其二,在第一变化类型不与至少y个第二信息中的游戏信息的第二变化类型匹配的情况下,换言之,若x个第二信息中游戏信息的变化趋势与第一信息的游戏信息的变化趋势均不匹配,或者与第一信息的游戏信息的变化趋势匹配的第二信息的个数小于y个,则可确定第一信息为异常信息。在前述两种技术方案中,无论第二信息的个数为一个还是多个,均存在确认第一信息中的游戏信息在第一时间段内的第一变化类型与第二信息中的游戏信息在第二时间段内的第二变化类型是否匹配这一步骤,在本申请的实施例中,提供了一种可选地实施方案,具体可包括如下步骤1-步骤2:步骤1,获取第一信息中n个第一时间点的游戏信息,并获取第二信息中n个第二时间点的游戏信息,其中,第一时间段为第一时间周期内的时间段,第二时间段为第二时间周期内的时间段,第一时间点在第一时间周期内的位置与相应的一个第二时间点在第二时间周期内的位置相同,n为大于一的整数。如图4所示,x轴可表示时间(此处的时间可为相对时间,即周期内时间),y表示第一信息f1和第二信息f2在相应时间点下的数值,一种可选的选取第一时间点和第二时间点的方式如图4所示,可以等间距选取(如a点与b点),如每4个小时获取一个时间点;另一种可选的选取第二时间点的方式如图5所示,可以选取第二信息的数值变化趋势发生变化的地方,如由上升变为下降的拐点,或由下降变为上升的拐点。步骤2,根据n个第一时间点的游戏信息和n个第二时间点的游戏信息确定第一信息中的游戏信息的第一变化类型与第二信息中的游戏信息的第二变化类型是否匹配。从宏观上来讲,用户群的习惯是基本不会发生变化的,能够影响第一信息或第二信息变化的数值是由于用户量的变化引起的数值的等比例增加或者减少,换言之,不同周期内相同时间位置对应的信息数值之间的差值应该符合上述等比例增加或减少的数值,也即应该在一定的范围内(即下述的第二范围),对于图4所示的时间点的选取方式和图5所示的时间点的选取方式,可以按照如下方式判断二者的变化趋势是否匹配:在n个第一时间点中第七时间点的个数达到m个的情况下,确定第一信息中的游戏信息的第一变化类型与第二信息中的游戏信息的第二变化类型匹配,其中,第七时间点的游戏信息与n个第二时间点中的第八时间点的游戏信息之间的差值在第二范围内,第八时间点在第二时间周期的位置与第七时间点在第一时间周期内的位置相同,整数m不大于整数n;在n个第一时间点中第七时间点的个数未达到m个的情况下,确定第一信息中的游戏信息的第一变化类型与第二信息中的游戏信息的第二变化类型不匹配。可选地,在上述实施例中,若连续出现多个第一时间点的游戏信息与第二信息点的游戏信息之间的差值不在第二范围内,则可进一步定位出第一信息f1中异常信息所在的时间范围为异常时间段(即上述游戏信息与第二信息点的游戏信息之间的差值不在第二范围内的多个第一时间点所在的时间段)。换言之,上述方式可以变换为:在n个第一时间点中存在连续的第九时间点的个数至少为m个的情况下,确定第一信息中的游戏信息的第一变化类型与第二信息中的游戏信息的第二变化类型不匹配,其中,第九时间点的游戏信息与n个第二时间点中的第八时间点的游戏信息之间的差值不在第二范围内,第八时间点在第二时间周期的位置与第九时间点在第一时间周期内的位置相同,整数m不大于整数n;在n个第一时间点中存在连续的第九时间点的个数小于m个的情况下,确定第一信息中的游戏信息的第一变化类型与第二信息中的游戏信息的第二变化类型匹配。采用上述方式,可以确定第一信息中位于连续的第九时间点上的游戏信息为异常信息。需要说明的是,当第二时间点为拐点时,拐点更能够体现用户的习惯变化,因此,更加能够体现出游戏信息的变化趋势,利用该点来判断,能够使得判断结果更为准确。可选地,在上述实施例中,仅以离散的多个点来判断变化趋势是否匹配,虽然算法效率高,计算速度快,能够保证一定的准确率,但是仍然存在偶然性,即刚好在采样点匹配,而其余点不匹配。为了克服该问题,考虑到不同周期内相同时间位置对应的信息数值之间的差值应该符合上述等比例增加或减少的数值,那么对于多个连续点,其累计增加或减少的数值也应该在一定范围内(即第一范围),故可以采用如下方式来判定,该方法适用于如图4所示的方案:在n个第一区域中(如图4所示区域abcd或区域befc)面积在第一范围内的区域的数量达到p个的情况下,确定第一信息中的游戏信息的第一变化类型与第二信息中的游戏信息的第二变化类型匹配,第一区域为第一线条、第二线条、第三线条以及第四线条连接而构成的区域,第一线条cd为第一曲线上第三时间点所在的点c与第四时间点所在的点d之间的曲线,第二线条da为第一曲线上第四时间点所在的点d与第二曲线上第五时间点所在的点a之间的线段,第三线条ab为第二曲线上第五时间点所在的点a与第六时间点所在的点b之间的曲线,第四线条bc为第一曲线上第三时间点所在的点c与第二曲线上第六时间点所在的点b之间的线段,第一曲线f1用于表示第一信息中第一时间周期内多个时间点上的游戏信息y,第二曲线f2用于表示第二信息中第二时间周期内多个时间点上的游戏信息y,n个第一时间点包括相邻的第三时间点和第四时间点,n个第二时间点包括相邻的第五时间点和第六时间点,第五时间点在第二时间周期的位置与第四时间点在第一时间周期内的位置相同,第六时间点在第二时间周期的位置与第三时间点在第一时间周期内的位置相同,整数p不大于整数n;在n个第一区域中面积在第一范围内的区域的数量未达到p个的情况下,确定第一信息中的游戏信息的第一变化类型不与第二信息中的游戏信息的第二变化类型匹配。可选地,上述方式可以变换为:在n个第一区域中第二区域的连续个数达到p个的情况下,确定第一信息中的游戏信息的第一变化类型与第二信息中的游戏信息的第二变化类型不匹配,第二区域为n个第一区域中面积不在第一范围内的区域;在n个第一区域中第二区域的连续个数未达到p个的情况下,确定第一信息中的游戏信息的第一变化类型与第二信息中的游戏信息的第二变化类型匹配。采用上述方式,可以定位出异常信息为位于连续的第二区域上的游戏信息。采用本申请的技术方案,可以较为准确和有价值地给出实时数据异常的起始数据和时间;实时监测时无需利用海量数据,仅仅利用已发生的一段连续时间数据,预测未来数据的发生轨迹,计算效率很高;利用本申请可以自由设置阈值(即上述的第一范围或第二访问),阈值d的大小,可以自由满足各类数据的异常数据判定情况。作为一种可选的实施例,下面结合更为具体的实施方案进一步详述本申请的技术方案:本申请的技术方案可以应用到众多数据分析的产品中,以moba游戏的数据分析为例,可以将功能分为前台和后台两部分。后台完成对玩家数据的分析和异常判断,并存储在数据库mysql中,而前台通过网页web页面将告警或异常数据进行展示,例如图6所示的游戏中英雄角色的输出治疗量(即一种游戏技能)的曲线图(f1和f2),横轴表示周期内的时间,纵轴表示输出治疗量,按照本申请提供的方法可以得到异常波动(即异常信息或异常数据)所在的时间段,表1是网站中展示的匹配时长异常波动判定的结果表格。表1字段名称字段名称时间2017-12-1311:00:00段位星耀组队人数1服务器环境正式服匹配时长5.66秒在本申请的计算时间序列的异常波动识别的方案中,可在观察时间序列的时候,将时间序列绘制成一个以时间为横轴,数值为纵轴的坐标系下的曲线,如图7所示。在本申请提出的不合理数据的判定方式中,可假定前一天(或者前n天的数据)是正常的,通过与此数据进行比较,确定实时的曲线上的数据是符合波动规律的,而不符合规律的就被称为不合理数据(即异常信息),可以进行数据的告警,通知开发人员关注原因。数据判定方法如下:以游戏中某英雄每个小时的胜率组成的序列数据为例,将前一天数据与当日数据分别绘制两条曲线,如图8所示,假定窗口的长度为w,t表示一天中的任意时间,t+w的数值不大于24。步骤1,从t:00开始,获取当日t+w+2:00时刻,一共w+2个数据。步骤2,从t:00开始,获取前一日t+w+2:00时刻,一共w+2个数据。步骤3,从t时刻计算,计算当日与前一日的数据的差,记为h(t),h(t+1),……,h(t+w+2:00)。步骤4,计算每个时刻x与下一时刻(x+1)之间的两条曲线组成的面积s(x+1),在一种可选的计算方式中,为了提高计算效率,梯形面积上底可以取h(x),下底可以取h(x+1),高为1,(本示例中高为1,其他场景取决于数据序列的粒度)。需要说明的是,三角形可视为是特殊的梯形,该梯形的上底为0。步骤5,计算当日的t+1时刻与t+2时刻的数据差l,l的值可用来判断t+1时刻是否为异常数据段的起始点。步骤6,依次判断s(t+2)以后的所有s值是否大于设定的阈值m。步骤7,如果所有的s(t)都大于设定的阈值m,并且s(t+1)<m,并且l小于设定的阈值d。就可以判定t+2,t+3……,t+w+2时刻一共w个时刻都是异常数据,并且异常情况从t+2时刻开始。通过上述步骤,已经得到了数据异常的起始点,也判定出了在窗口w长度下的异常数据有哪些。采用本申请的技术方案,可解决在判定异常值是会出现的抖动情况,例如在一天的24小时中,每小时的数据均正常,但在21点的数据陡增,22点又恢复,假如通过平均值或者三倍均方差等方法,会认为21点的数据为异常数据。但事实上,任何数据都可能出现抖动的情况,如果只有的数据又恢复正常,这样的抖动数据不应视为异常数据,本发明利用窗口机制,保证了只有异常数据点持续了w个长度,才可以被认定为异常数据;利用过去的数据曲线(可以是前一日或者上周同期等已发生的既定数据即可)与当日数据叠加组成的几何图形面积来计算数据异常的可能情况,是将时间维度与空间几何结合的现实应用,改进了直接进行数据大小比较而丢失了时间粒度的缺陷。需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。根据本发明实施例的另一个方面,还提供了一种用于实施上述异常信息的识别方法的异常信息的识别装置。图9是根据本发明实施例的一种可选的异常信息的识别装置的示意图,如图9所示,该装置可以包括:第一获取单元901,用于获取识别请求,其中,识别请求用于请求识别异常信息;第二获取单元903,用于响应于识别请求,获取第一信息,其中,第一信息为目标游戏在第一时间段内产生的游戏信息,第一时间段的时间长度为目标阈值;识别单元905,用于基于第二信息确认第一信息是否为异常信息,其中,第二信息为目标游戏在第二时间段内产生的游戏信息,第二时间段的结束时间不晚于第一时间段的起始时间,第二时间段的时间长度不小于目标阈值。需要说明的是,该实施例中的第一获取单元901可以用于执行本申请实施例中的步骤s202,该实施例中的第二获取单元903可以用于执行本申请实施例中的步骤s204,该实施例中的识别单元905可以用于执行本申请实施例中的步骤s206。此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。通过上述模块,在获取到识别请求时,可获取待识别的第一信息,第一信息为目标游戏在第一时间段内产生的游戏信息,第一时间段的时间长度为目标阈值;然后基于第二信息确认第一信息是否为异常信息,第二信息为目标游戏在第二时间段内产生的游戏信息,换言之,可仅参考第一信息之前的一个信息(即第二信息),即可判别第一信息是否为异常信息,而不用获取大量的参考用的第二信息,且由于仅需对第二信息和第一信息进行处理,故数据运算量较小,可以解决相关技术中判断信息是否为异常信息的复杂度较高的技术问题,进而达到降低信息是否为异常信息的复杂度的技术效果。在一个可选的实施例中,上述识别单元可包括:第一识别模块,用于在第一信息中的游戏信息在第一时间段内的第一变化类型与第二信息中的游戏信息在第二时间段内的第二变化类型匹配的情况下,确定第一信息不为异常信息;第二识别模块,用于在第一信息中的游戏信息在第一时间段内的第一变化类型与第二信息中的游戏信息在第二时间段内的第二变化类型不匹配的情况下,确定第一信息为异常信息。在又一个可选的实施例中,第二信息为x个,其中,识别单元可包括:第三识别模块,用于在第一信息中的游戏信息在第一时间段内的第一变化类型与至少y个第二信息中的游戏信息在第二时间段内的第二变化类型匹配的情况下,确定第一信息不为异常信息,其中,整数y为不大于整数x;第四识别模块,用于在第一变化类型不与至少y个第二信息中的游戏信息的第二变化类型匹配的情况下,确定第一信息为异常信息。可选地,上述识别单元可包括:获取模块,用于获取第一信息中n个第一时间点的游戏信息,并获取第二信息中n个第二时间点的游戏信息,其中,第一时间段为第一时间周期内的时间段,第二时间段为第二时间周期内的时间段,第一时间点在第一时间周期内的位置与相应的一个第二时间点在第二时间周期内的位置相同,n为大于一的整数;匹配模块,用于根据n个第一时间点的游戏信息和n个第二时间点的游戏信息确定第一信息中的游戏信息的第一变化类型与第二信息中的游戏信息的第二变化类型是否匹配。上述匹配模块可用于:在n个第一区域中面积在第一范围内的区域的数量达到p个的情况下,确定第一信息中的游戏信息的第一变化类型与第二信息中的游戏信息的第二变化类型匹配,其中,第一区域为第一线条、第二线条、第三线条以及第四线条连接成的区域,第一线条为第一曲线上第三时间点与第四时间点之间的曲线,第二线条为第一曲线上第四时间点与第二曲线上第五时间点之间的线段,第三线条为第二曲线上第五时间点与第六时间点之间的曲线,第四线条为第一曲线上第三时间点与第二曲线上第六时间点之间的线段,第一曲线用于表示第一信息中携带的第一时间周期内多个时间点上的游戏信息,第二曲线用于表示第二信息中携带的第二时间周期内多个时间点上的游戏信息,n个第一时间点包括相邻的第三时间点和第四时间点,n个第二时间点包括相邻的第五时间点和第六时间点,第五时间点在第二时间周期的位置与第四时间点在第一时间周期内的位置相同,第六时间点在第二时间周期的位置与第三时间点在第一时间周期内的位置相同,整数p不大于整数n;在n个第一区域中面积在第一范围内的区域的数量未达到p个的情况下,确定第一信息中的游戏信息的第一变化类型不与第二信息中的游戏信息的第二变化类型匹配。上述匹配模块还可用于:在n个第一时间点中第七时间点的个数达到m个的情况下,确定第一信息中的游戏信息的第一变化类型与第二信息中的游戏信息的第二变化类型匹配,其中,第七时间点的游戏信息与n个第二时间点中的第八时间点的游戏信息之间的差值在第二范围内,第八时间点在第二时间周期的位置与第七时间点在第一时间周期内的位置相同,整数m不大于整数n;在n个第一时间点中第七时间点的个数未达到m个的情况下,确定第一信息中的游戏信息的第一变化类型与第二信息中的游戏信息的第二变化类型不匹配。上述匹配模块还可用于:在n个第一时间点中存在连续的第九时间点的个数至少为m个的情况下,确定第一信息中的游戏信息的第一变化类型与第二信息中的游戏信息的第二变化类型不匹配,其中,第九时间点的游戏信息与n个第二时间点中的第八时间点的游戏信息之间的差值不在第二范围内,第八时间点在第二时间周期的位置与第九时间点在第一时间周期内的位置相同,整数m不大于整数n;在n个第一时间点中存在连续的第九时间点的个数小于m个的情况下,确定第一信息中的游戏信息的第一变化类型与第二信息中的游戏信息的第二变化类型匹配。可选地,上述第二识别模块还可用于:确定第一信息中位于连续的第九时间点上的游戏信息为异常信息。上述的第二获取单元还可用于获取在第一时间周期中第一时间段内产生的游戏信息为第一信息,其中,第一时间段的起始时间在第一时间周期内的位置与第二时间段的起始时间在第二时间周期内的位置相同,第一时间段的结束时间在第一时间周期内的位置与第二时间段的结束时间在第二时间周期内的位置相同。采用本申请的技术方案,可解决在判定异常值是会出现的抖动情况,例如在一天的24小时中,每小时的数据均正常,但在21点的数据陡增,22点又恢复,假如通过平均值或者三倍均方差等方法,会认为21点的数据为异常数据。但事实上,任何数据都可能出现抖动的情况,如果只有的数据又恢复正常,这样的抖动数据不应视为异常数据,本发明利用窗口机制,保证了只有异常数据点持续了w个长度,才可以被认定为异常数据;利用过去的数据曲线(可以是前一日或者上周同期等已发生的既定数据即可)与当日数据叠加组成的几何图形面积来计算数据异常的可能情况,是将时间维度与空间几何结合的现实应用,改进了直接进行数据大小比较而丢失了时间粒度的缺陷。此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现,其中,硬件环境包括网络环境。根据本发明实施例的另一个方面,还提供了一种用于实施上述异常信息的识别方法的服务器或终端。图10是根据本发明实施例的一种终端的结构框图,如图10所示,该终端可以包括:一个或多个(图10中仅示出一个)处理器1001、存储器1003、以及传输装置1005(如上述实施例中的发送装置),如图10所示,该终端还可以包括输入输出设备1007。其中,存储器1003可用于存储软件程序以及模块,如本发明实施例中的异常信息的识别方法和装置对应的程序指令/模块,处理器1001通过运行存储在存储器1003内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的异常信息的识别方法。存储器1003可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器1003可进一步包括相对于处理器1001远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。上述的传输装置1005用于经由一个网络接收或者发送数据,还可以用于处理器与存储器之间的数据传输。上述的网络具体实例可包括有线网络及无线网络。在一个实例中,传输装置1005包括一个网络适配器(networkinterfacecontroller,nic),其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中,传输装置1005为射频(radiofrequency,rf)模块,其用于通过无线方式与互联网进行通讯。其中,具体地,存储器1003用于存储应用程序。处理器1001可以通过传输装置1005调用存储器1003存储的应用程序,以执行下述步骤:获取识别请求,其中,识别请求用于请求识别异常信息;响应于识别请求,获取第一信息,其中,第一信息为目标游戏在第一时间段内产生的游戏信息,第一时间段的时间长度为目标阈值;基于第二信息确认第一信息是否为异常信息,其中,第二信息为目标游戏在第二时间段内产生的游戏信息,第二时间段的结束时间不晚于第一时间段的起始时间,第二时间段的时间长度不小于目标阈值。处理器1001还用于执行下述步骤:在n个第一区域中面积在第一范围内的区域的数量达到p个的情况下,确定第一信息中的游戏信息的第一变化类型与第二信息中的游戏信息的第二变化类型匹配,其中,第一区域为第一线条、第二线条、第三线条以及第四线条连接成的区域,第一线条为第一曲线上第三时间点与第四时间点之间的曲线,第二线条为第一曲线上第四时间点与第二曲线上第五时间点之间的线段,第三线条为第二曲线上第五时间点与第六时间点之间的曲线,第四线条为第一曲线上第三时间点与第二曲线上第六时间点之间的线段,第一曲线用于表示第一信息中携带的第一时间周期内多个时间点上的游戏信息,第二曲线用于表示第二信息中携带的第二时间周期内多个时间点上的游戏信息,n个第一时间点包括相邻的第三时间点和第四时间点,n个第二时间点包括相邻的第五时间点和第六时间点,第五时间点在第二时间周期的位置与第四时间点在第一时间周期内的位置相同,第六时间点在第二时间周期的位置与第三时间点在第一时间周期内的位置相同,整数p不大于整数n;在n个第一区域中面积在第一范围内的区域的数量未达到p个的情况下,确定第一信息中的游戏信息的第一变化类型不与第二信息中的游戏信息的第二变化类型匹配。采用本发明实施例,在获取到识别请求时,可获取待识别的第一信息,第一信息为目标游戏在第一时间段内产生的游戏信息,第一时间段的时间长度为目标阈值;然后基于第二信息确认第一信息是否为异常信息,第二信息为目标游戏在第二时间段内产生的游戏信息,换言之,可仅参考第一信息之前的一个信息(即第二信息),即可判别第一信息是否为异常信息,而不用获取大量的参考用的第二信息,且由于仅需对第二信息和第一信息进行处理,故数据运算量较小,可以解决相关技术中判断信息是否为异常信息的复杂度较高的技术问题,进而达到降低信息是否为异常信息的复杂度的技术效果。可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。本领域普通技术人员可以理解,图10所示的结构仅为示意,终端可以是智能手机(如android手机、ios手机等)、平板电脑、掌上电脑以及移动互联网设备(mobileinternetdevices,mid)、pad等终端设备。图10其并不对上述电子装置的结构造成限定。例如,终端还可包括比图10中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图10所示不同的配置。本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(read-onlymemory,rom)、随机存取器(randomaccessmemory,ram)、磁盘或光盘等。本发明的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于执行异常信息的识别方法的程序代码。可选地,在本实施例中,上述存储介质可以位于上述实施例所示的网络中的多个网络设备中的至少一个网络设备上。可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:s12,获取识别请求,其中,识别请求用于请求识别异常信息;s14,响应于识别请求,获取第一信息,其中,第一信息为目标游戏在第一时间段内产生的游戏信息,第一时间段的时间长度为目标阈值;s16,基于第二信息确认第一信息是否为异常信息,其中,第二信息为目标游戏在第二时间段内产生的游戏信息,第二时间段的结束时间不晚于第一时间段的起始时间,第二时间段的时间长度不小于目标阈值。可选地,存储介质还被设置为存储用于执行以下步骤的程序代码:s22,在n个第一区域中面积在第一范围内的区域的数量达到p个的情况下,确定第一信息中的游戏信息的第一变化类型与第二信息中的游戏信息的第二变化类型匹配,其中,第一区域为第一线条、第二线条、第三线条以及第四线条连接成的区域,第一线条为第一曲线上第三时间点与第四时间点之间的曲线,第二线条为第一曲线上第四时间点与第二曲线上第五时间点之间的线段,第三线条为第二曲线上第五时间点与第六时间点之间的曲线,第四线条为第一曲线上第三时间点与第二曲线上第六时间点之间的线段,第一曲线用于表示第一信息中携带的第一时间周期内多个时间点上的游戏信息,第二曲线用于表示第二信息中携带的第二时间周期内多个时间点上的游戏信息,n个第一时间点包括相邻的第三时间点和第四时间点,n个第二时间点包括相邻的第五时间点和第六时间点,第五时间点在第二时间周期的位置与第四时间点在第一时间周期内的位置相同,第六时间点在第二时间周期的位置与第三时间点在第一时间周期内的位置相同,整数p不大于整数n;s24,在n个第一区域中面积在第一范围内的区域的数量未达到p个的情况下,确定第一信息中的游戏信息的第一变化类型不与第二信息中的游戏信息的第二变化类型匹配。可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。以上所述仅是本发明的优选实施方式,应当指出,对于本
技术领域
的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1