一种数据阈值制定方法

文档序号:10471592阅读:1405来源:国知局
一种数据阈值制定方法
【专利摘要】本发明提供一种数据阈值制定方法,属于大数据分析领域,本发明包括数据分布分析、数据阈值输出;数据分布分析需要通过大数据算法分析数据分布的特征;数据阈值输出需要利用确定的大数据分布特征,根据阈值规则,输出数据阈值。通过本发明可解决数据阈值制定的合理性和准确性问题,实现数据阈值的自动制定。
【专利说明】
一种数据阈值制定方法
技术领域
[0001]本发明涉及大数据分析技术,尤其涉及一种数据阈值制定方法。
【背景技术】
[0002]对于电信运营商及移动互联网来说,数据越来越多样化,分析场景越来越灵活多变,根据二八原则,百分之二十的数据是分析价值最高的,是数据的关注重点,目前的数据阈值制定是通过专家的经验手工设定,一方面存在数据阈值设定的不合理性,另一方面无法应对多样数据多样场景的阈值设定及优化。

【发明内容】

[0003]为了解决以上技术问题,本发明提出了一种基于大数据算法的数据阈值制定方法,供了一套完备的数据分布分析、阈值制定方法,首先解决了阈值制定的合理性和准确性,其次解决了数据阈值的自动化制定。
[0004]本发明的目的是按以下方式实现的,该体系在深入研究运营商及互联网行业数据特征的基础上,结合大数据算法,分析数据分布特征,基于数据分布模型,提供数据阈值的自动化生成和优化,创新实现了一套完备的基于大数据算法的数据阈值制定方法。
[0005]现有技术方式下,数据阈值存在人为制定阈值不准确、阈值制定维度单一、周期变化分析手段缺乏等问题,无法提供准确合理的数据阈值,实际指导意义欠缺。
[0006]应用本发明,可解决数据阈值制定的合理性和准确性问题,实现数据阈值的自动制定。
[0007]本发明的技术方案是:
一种数据阈值制定方法,包括数据分布分析、数据阈值输出;
数据分布分析需要通过大数据算法分析数据分布的特征;
数据阈值输出需要利用确定的大数据分布特征,根据阈值规则,输出数据阈值。
[0008](I)大数据分布分析功能
提供多种大数据分析算法,包括正态分布、指数分布、伽马分布、贝塔分布、均匀分布等,基于分时间(WHEN)、客户(WHO)、位置(WHERE )、事件(WHAT)、感知(HOW)五个维度,分析数据分布特征,生成数据最匹配的大数据分析模型。
[0009](2)数据阈值输出功能
基于匹配的数据分析模型特征,设定阈值规则,输出对应数据的数据阈值,并利用后续提供的数据,匹配分析模型优化调整数据阈值。
[0010]本发明在深入掌握数据特点的基础上,尤其是电信运营商领域,利用大数据算法,对不同类数据进行数据分析,形成符合不同类数据的分布特征和分析模型,输出数据阈值基准,形成基于大数据算法的阈值分析法,提供迭代优化的阈值自动制定方案。
本发明的有益效果是
本发明提供基于大数据算法的数据阈值制定,解决了数据阈值制定的合理性和准确性问题,实现数据阈值的自动制定,避免了数据分析对行业专家的依赖,实现对数据中重点数据的快速定位和获取。
【附图说明】
[0011 ]图1是本发明的工作流程示意图。
【具体实施方式】
[0012]下面对本发明的内容进行更加详细的阐述:
本发明涉及一种移动通信网及移动互联网大数据分析领域,具体地说是提供多种大数据分析算法,包括正态分布、指数分布、伽马分布、贝塔分布、均匀分布等,对数据进行分布特征分析,获取数据最匹配的分析模型,根据匹配的数据分析模型特征,设定阈值规则,输出对应数据的数据阈值,实现基于大数据的数据阈值制定方法。
[0013]本发明的数据阈值制定方法,包括指标数据清洗功能、指标数据分析功能、分布类型选择功能、阈值核查规则制定四个层面的功能群组。
[0014]指标数据清洗功能:提供指标数据清洗功能,利用数据清洗规则,对数据进行清洗及格式化,对清洗出的异常数据进行及时发现及关联分析。
[0015]指标数据分析功能:对阈值制定指标进行基于时间、位置等维度的横向分析,基于自身特点、关联影响等维度的纵向分析,实现对指标的全方位、多视角分析。
[0016]分布类型选择功能:针对不同指标特征,结合均匀分布、正态分布、指数分布、贝塔分布、伽马分布等分布特点,构建不同指标的分布模型,实现精准的指标所属分布类型输出,同时实现指标首阶段的阈值制定。
[0017]阈值核查规则制定:提供基于不同场景的针对性要求及整体场景的全局化要求,实现阈值核查规则制定。用来实现阈值的动态调整,实现合理阈值的精确制定。
[0018]本发明提供一种数据阈值制定方法,在深入掌握数据特点的基础上,尤其是电信运营商领域,利用大数据算法,对不同类数据进行数据分析,形成符合不同类数据的分布特征和分析模型,输出数据阈值基准,形成基于大数据算法的阈值分析法,提供迭代优化的阈值自动制定方案。
【主权项】
1.一种数据阈值制定方法,其特征在于,包括数据分布分析、数据阈值输出; 数据分布分析需要通过大数据算法分析数据分布的特征; 数据阈值输出需要利用确定的大数据分布特征,根据阈值规则,输出数据阈值。2.根据权利要求1所述的一种数据阈值制定的方法,其特征在于,大数据分析算法,包括正态分布、指数分布、伽马分布、贝塔分布、均匀分布,基于分时间、客户、位置、事件、感知五个维度,分析数据分布特征,生成数据最匹配的大数据分析模型。3.根据权利要求2所述的一种数据阈值制定的方法,其特征在于,数据阈值输出是基于匹配的数据分析模型特征,设定阈值规则,输出对应数据的数据阈值,并利用后续提供的数据,匹配分析模型优化调整数据阈值。
【文档编号】G06Q50/30GK105825306SQ201610167705
【公开日】2016年8月3日
【申请日】2016年3月23日
【发明人】沈林江, 张笑笑
【申请人】浪潮通信信息系统有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1