单体酒店间夜量的时间序列的异常识别方法与流程

文档序号:12271631阅读:221来源:国知局

本发明涉及酒店数据处理领域,特别涉及一种单体酒店间夜量的时间序列的异常识别方法。



背景技术:

单体酒店,又称独立酒店,指由个人、企业或组织独立拥有并经营的单个饭店企业。单体酒店是传统酒店形式,其特点是单独、分散地存在于各个城市和地区,独立地进行营销活动和管理活动,不属于任何酒店集团,也不以任何形式加入任何联盟,通俗地说就是“仅此一家,别无分店”。单体酒店在我国分布广、数量大,一直是我国酒店行业的主要构成部分。由于单体酒店自身的特点导致单体酒店间夜量的时间序列的波动较连锁酒店等要大很多,所以在对单体酒店间夜量的时间序列进行异常识别时难度较大。

目前现有的单体酒店间夜量的时间序列识别不大关注长期异常,即使对长期异常进行识别,也无法排除其中的由于季节性趋势引起的正常波动、节假日引起的正常波动或者规律的特殊事件引起的正常波动,即在识别过程中会将前述的正常波动误认为长期异常。

总之,由于单体酒店间夜量的时间序列自身波动大且历史数据存在很多个别的异常值,所以在运用现有的很多方法分析最近的长期异常时效果不理想。因为现有方法中会采用时间序列拟合的方法,即历史数据是用于拟合模型的,而单体酒店间夜量的时间序列的历史数据本身就存在很多异常值,那么在利用历史数据进行异常识别时,必然会对未来或者近期的异常识别结果造成不利影响。



技术实现要素:

本发明要解决的技术问题是为了克服现有技术中单体酒店间夜量的时间序列的异常识别效果不理想的缺陷,提供一种能够较好地检测出时间序列中的长期异常的单体酒店间夜量的时间序列的异常识别方法。

本发明是通过下述技术方案来解决上述技术问题:

一种单体酒店间夜量的时间序列的异常识别方法,其特点在于,包括以下步骤:S1、分别按天、按周、按月获取单体酒店的待分析时间段的间夜量的时间序列,得到第一按天时间序列、第一按周时间序列和第一按月时间序列;S2、分别按天、按周、按月获取单体酒店的前一年的同待分析时间段的同期时间的间夜量的时间序列,得到第二按天时间序列、第二按周时间序列和第二按月时间序列;S3、使用时间序列的模式分析方法比较所述第一按天时间序列和所述第二按天时间序列,若比较结果为模式不同则执行步骤S4;S4、使用时间序列的模式分析方法比较所述第一按周时间序列和所述第二按周时间序列,若比较结果为模式不同则执行步骤S5;S5、使用时间序列的模式分析方法比较所述第一按月时间序列和所述第二按月时间序列,若比较结果为模式不同则执行步骤S6;S6、确定所述待分析时间段的间夜量的时间序列和/或前一年的同待分析时间段的同期时间的间夜量的时间序列存在异常。

本方案中,通过按天、按周、按月获取单体酒店的待分析时间段的间夜量的时间序列和前一年的同期时间的时间序列,依次采用时间序列的模式分析方法对比分析按天、按周及按月的时间序列,只有当前述三次模式分析的结果均为模式不同时,才能确认待分析时间段的间夜量的时间序列和/或前一年的同待分析时间段的同期时间的间夜量的时间序列存在异常,其它结果均表示待分析时间段的间夜量的时间序列不存在异常。本方案通过按天、按周及按月三次模式分析,有效的规避了由于单体酒店的间夜量自身波动较大而导致识别单体酒店间夜量的时间序列的长期异常效果不理想的问题,排除了由于正常波动而引起的误判的情况,能够节省由于误判为异常而进一步分析时花费的时间和工作量,提高异常识别的准确性。

较佳地,步骤S6之后还包括以下步骤:S7、利用稳健回归、分位数回归、趋势提取STL Trend或者Piecewise Median方法单独分析所述待分析时间段的间夜量的时间序列是否存在异常,若是则确定所述待分析时间段的间夜量的时间序列存在异常。

本方案中,通过时间序列模式比较方法确定了待分析时间段的间夜量的时间序列和/或前一年的同待分析时间段的同期时间的间夜量的时间序列存在异常之后,再次对待分析时间段的间夜量的时间序列本身进行长期异常识别,若识别结果为不存在异常,则能够确定前一年的同待分析时间段的同期时间的间夜量的时间序列存在异常,若识别结果为存在异常,则说明待分析时间段的间夜量的时间序列有问题,可以输出酒店信息及存在异常的时间段信息,以便后续进一步的分析挖掘存在异常的真实原因。

较佳地,步骤S1中在分别按天、按周、按月获取单体酒店的待分析时间段的间夜量的时间序列后,还对获取的间夜量的时间序列分别提取趋势信息,以得到第一按天时间序列、第一按周时间序列和第一按月时间序列;步骤S2中在分别按天、按周、按月获取单体酒店的前一年的同待分析时间段的同期时间的间夜量的时间序列后,还对获取的间夜量的时间序列分别提取趋势信息,以得到第二按天时间序列、第二按周时间序列和第二按月时间序列。

较佳地,所述趋势信息为增长率。

本方案中,对于时间序列的模式分析方法具体的分析对象为间夜量的时间序列的增长率的时间序列,通过增长率的趋势变化能够有效的识别出待分析时间段的间夜量同同期时间的间夜量的时间序列是否增长率的模式一致,如果一致不存在异常,如果识别结果模式不一致,则存在异常。

较佳地,所述模式分析方法为同比环比法、小波分析法或者washer methodology。

本方案中,时间序列的模式分析方法可以采用同比环比法、小波分析法或者washer methodology中的任意一种。

较佳地,所述模式分析方法比较时间序列的形状图的模式是否相同。

本方案中,模式分析方法在具体比较待分析时间段的间夜量的时间序列和前一年的同待分析时间段的同期时间的间夜量的时间序列时,比较的是时间序列的形状图,该种比较方式操作简单、分析速度快。

较佳地,步骤S2为:S21、分析所述待分析时间段是否有特殊日期,若否,则分别按天、按周、按月获取单体酒店的前一年的同待分析时间段的同期时间的间夜量的时间序列,得到第二按天时间序列、第二按周时间序列和第二按月时间序列,执行步骤S3;若是,则执行步骤S22;S22、对所述待分析时间段的同期时间进行日期对齐,以获取对比时间段;S23、分别按天、按周、按月获取单体酒店的所述对比时间段的间夜量的时间序列,得到第二按天时间序列、第二按周时间序列和第二按月时间序列,执行步骤S3

本方案中,对于待分析的时间段包含特殊日期的情形,如春节、国庆或者世博会等,需要特别处理,具体为保持待分析时间段的间夜量的时间序列不变,调整同待分析时间段的同期时间的间夜量的时间序列,使其同待分析时间段的间夜量的时间序列具有可比性,具体调整方法为日期对齐,还可以包括日期的删除和拆分。在获得具有可比性的对比时间段后再获取对应的时间序列,经过本方案处理后的时间序列再进行异常识别时长期异常的识别的准确性更高、更科学合理。

较佳地,所述特殊日期包括法定节假日。

本发明的积极进步效果在于:本发明提供的单体酒店间夜量的时间序列的异常识别方法通过按天、按周及按月三次模式分析,有效的规避了由于单体酒店的间夜量自身波动较大而导致识别单体酒店间夜量的时间序列的长期异常效果不理想的问题,排除了由于正常波动而引起的误判的情况,能够节省由于误判为异常而进一步分析时花费的时间和工作量,提高异常识别的准确性。本发明提供的单体酒店间夜量的时间序列的异常识别方法稳健且鲁棒性好。

附图说明

图1为本发明一较佳实施例的单体酒店间夜量的时间序列的异常识别方法的流程图。

具体实施方式

下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。

如图1所示,一种单体酒店间夜量的时间序列的异常识别方法,包括以下步骤:

101、分别按天、按周、按月获取单体酒店的待分析时间段的间夜量的时间序列,并对获取的间夜量的时间序列分别提取趋势信息,以得到第一按天时间序列、第一按周时间序列和第一按月时间序列;其中趋势信息为时间序列的增长率。

102、分析待分析时间段是否有特殊日期,特殊日期包括法定节假日,如春节、国庆或者世博会等,如果有则执行步骤103,如果没有则执行步骤104。

103、对前一年的同待分析时间段的同期时间进行日期对齐,以获取对比时间段。

104、分别按天、按周、按月获取单体酒店的前一年的同待分析时间段的同期时间相对应的间夜量的时间序列,得到第二按天时间序列、第二按周时间序列和第二按月时间序列。

105、使用时间序列的模式分析方法比较第一按天时间序列和第二按天时间序列,若比较结果为模式不同则执行步骤106,若模式相同则执行步骤108。

106、使用时间序列的模式分析方法比较第一按周时间序列和第二按周时间序列,若比较结果为模式不同则执行步骤107,若模式相同则执行步骤108。

107、使用时间序列的模式分析方法比较第一按月时间序列和第二按月时间序列,若比较结果为模式不同则执行步骤109,若模式相同则执行步骤108。

108、确定待分析时间段的间夜量的时间序列没有异常,不用进一步的分析。

109、确定待分析时间段的间夜量的时间序列和/或前一年的同待分析时间段的同期时间相对应的间夜量的时间序列存在异常。

110、利用稳健回归、分位数回归、趋势提取STL Trend或者Piecewise Median方法单独分析待分析时间段的间夜量的时间序列是否存在异常,若是则执行步骤111,若否则执行步骤112。

111、确定待分析时间段的间夜量的时间序列存在异常,可以进一步分析异常的原因。

112、确定前一年的同待分析时间段的同期时间相对应的间夜量的时间序列存在异常。

本实施例中模式分析方法可以采用同比环比法、小波分析法或者washer methodology中的任意一种或者几种。另外模式分析方法比较时间序列是也可以不比较增长率,而是比较时间序列的形状图的模式是否相同。

本实施例中,如果待分析的时间段为2016年5月18日至2016年9月17日,其中包括中秋节特殊日期2016年9月14日至16日,那么需要执行日期对齐步骤,具体可以根据实际情况操作,例如首先选取前一年的同待分析时间段的同期时间,即2015年5月18日至2015年9月17日,考虑到2015年中秋节的相关日期为2015年9月26日至28日,所以日期对齐后确定的对比时间段可以为2015年5月30日至2015年9月29日,当然也可以采用其它日期对齐方式。

本实施例通过时间序列模式比较方法确定了待分析时间段的间夜量的时间序列和/或前一年的同待分析时间段的同期时间的间夜量的时间序列存在异常之后,再次对待分析时间段的间夜量的时间序列本身进行长期异常识别,若识别结果为不存在异常,则能够确定前一年的同待分析时间段的同期时间的间夜量的时间序列存在异常,若识别结果为存在异常,则说明待分析时间段的间夜量的时间序列有问题,可以输出酒店信息及存在异常的时间段信息,以便后续进一步的分析挖掘存在异常的真实原因。

本实施例对于待分析的时间段包含特殊日期的情形,如春节、国庆或者世博会等,需要特别处理,具体为保持待分析时间段的间夜量的时间序列不变,调整同待分析时间段的同期时间的间夜量的时间序列,使其同待分析时间段的间夜量的时间序列具有可比性,具体调整方法为日期对齐,还可以包括日期的删除和拆分。在获得具有可比性的对比时间段后再获取对应的时间序列,经过本实施例处理后的时间序列再进行异常识别时长期异常的识别的准确性更高、更科学合理。

本实施例提供的单体酒店间夜量的时间序列的异常识别方法通过按天、按周及按月三次模式分析,有效的规避了由于单体酒店的间夜量自身波动较大而导致识别单体酒店间夜量的时间序列的长期异常效果不理想的问题,排除了由于正常波动而引起的误判的情况,能够节省由于误判为异常而进一步分析时花费的时间和工作量,提高异常识别的准确性。

虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1