一种移动通信网络流量预测方法、装置及可读存储介质与流程

文档序号:17158187发布日期:2019-03-20 00:16阅读:174来源:国知局
一种移动通信网络流量预测方法、装置及可读存储介质与流程
本发明涉及通信技术、机器学习
技术领域
,尤其涉及一种移动通信网络流量预测方法、装置及可读存储介质。
背景技术
:随着移动通信网络的快速发展,目前的网络规模变得越来越庞大。快速发展的信息技术使得网络流量行为日趋复杂,通过网络传输的视频、音频、图像数据和其他网络应用业务不断增多,因此对网络服务过程中的服务质量和网络安全等相关性能也有了更多的要求,如何对网络中的业务流量变化规律进行分析和预测研究,成为未来网络研究的一个重要方向。通过网络流量预测,可为网络管理、规划和维护提供依据。现有方案使用流量的时间序列数据,只反映了流量的周期性,历史趋势等特征,当流量受外界因素影响,周期性产生变化时,模型预测误差较大。技术实现要素:本发明实施例提供一种移动通信网络流量预测方法、装置及可读存储介质,能有效解决现有技术建模维度单一的问题,能有效提高模型的预测准确性和适用范围。本发明一实施例提供一种移动通信网络流量预测方法,包括:根据采集到的预设日期的用户数据,采用预设的填补数据预测模型获取填补数据;其中,所述填补数据为预设日期至待预测日期之间的时间阈值的用户数据,所述用户数据为流量值和用户数的时间序列数据;根据所述填补数据和外部数据,得到特征集;其中,所述外部数据包括所述待预测日期的类型及天气数据;根据所述特征集对预先建立的机器学习模型进行训练,得到流量预测模型;将所述待预测日期输入到所述流量预测模型,得到流量预测值。作为上述方案的改进,所述方法还包括对所述预设日期的用户数据的划分步骤:将采集到的所述预设日期的用户数据划分为节假日序列和自然日序列;将所述节假日序列划分为节假日流量时间序列和节假日用户数时间序列;将所述自然日序列划分为自然日流量时间序列和自然日用户数时间序列。作为上述方案的改进,所述方法还包括所述填补数据预测模型的构建步骤:所述填补数据预测模型包括节假日流量预测模型、节假日用户数预测模型、自然日流量预测模型及自然日用户数预测模型;根据所述节假日流量时间序列对预先建立的机器学习算法进行训练,得到节假日流量预测模型;根据所述节假日用户数时间序列对所述机器学习算法进行训练,得到节假日用户数预测模型;根据所述自然日流量时间序列对所述机器学习算法进行训练,得到自然日流量预测模型;根据所述自然日用户数时间序列对所述机器学习算法进行训练,得到自然日用户数预测模型。作为上述方案的改进,所述根据采集到的预设日期的用户数据,采用预设的填补数据预测模型获取填补数据,具体包括:采用爬虫系统,对待预测日期的类型进行判断;根据所述待预测日期的类型,确定待填补日期阈值;将所述待填补日期阈值输入所述待预测日期的类型对应的填补数据预测模型进行预测,得到填补数据。进一步的,所述将所述待填补日期阈值输入所述待预测日期的类型对应的所述填补数据预测模型进行预测,得到填补数据,具体包括:当判断到所述待预测日期为节假日时,将所述预设日期至所述待预测日期之间的时间阈值中所有节假日的日期集合作为所述待填补日期阈值;将所述待填补日期阈值输入到所述节假日流量预测模型和节假日用户数预测模型,得到填补数据。作为上述方案的改进,所述根据所述填补数据和外部数据,得到特征集,具体为:根据所述填补数据,计算流量值和用户数的相关特征值;根据爬虫系统爬取所述待预测日期的类型、天气数据作为外部数据;根据所述相关特征值和所述外部数据,生成特征集。作为上述方案的改进,所述根据所述特征集对预先建立的机器学习模型进行训练,得到流量预测模型,具体为:将所述预设日期的用户数据作为训练样本;将所述特征集输入预先建立的机器学习模型,并根据所述训练样本对所述机器学习模型进行训练;采用所述训练样本对训练得到的机器学习模型进行参数调优,得到流量预测模型。本发明另一实施例对应提供了一种移动通信网络流量预测装置,包括:数据获取模块,用于根据采集到的预设日期的用户数据,采用预设的填补数据预测模型获取填补数据;其中,所述填补数据为预设日期至待预测日期之间的时间阈值的用户数据,所述用户数据为流量值和用户数的时间序列数据;特征获取模块,用于根据所述填补数据和外部数据,得到特征集;其中,所述外部数据包括所述待预测日期的类型及天气数据;模型构建模块,用于根据所述特征集对预先建立的机器学习模型进行训练,得到流量预测模型;流量预测模块,用于将所述待预测日期输入到所述流量预测模型,得到流量预测值。与现有技术相比,本发明实施例公开的一种移动通信网络流量预测方法,通过根据采集到的预设日期的用户数据,采用预设的填补数据预测模型获取填补数据,其中,所述填补数据为预设日期至待预测日期之间的时间阈值的用户数据,所述用户数据为流量值和用户数的时间序列数据,根据所述填补数据和外部数据,得到特征集,其中,所述外部数据包括所述待预测日期的类型及天气数据,根据所述特征集对预先建立的机器学习模型进行训练,得到流量预测模型,将所述待预测日期输入到所述流量预测模型,得到流量预测值,基于待预测日期的类型、流量、用户数、天气等多维度数据建立流量预测模型,通过增加了更多现实环境中影响流量变化的因素,尤其考虑节假日和自然日的流量形态存在较大差异,能有效消除节假日因素对流量变化的影响,能有效提高模型的鲁棒性,能有效解决现有技术仅采用流量的时间序列数据建模导致模型维度单一,适用范围有限的问题,提高模型的预测准确度和适用范围。本发明另一实施例提供了一种移动通信网络流量预测装置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现上述发明实施例所述的移动通信网络流量预测方法。本发明另一实施例提供了一种存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述发明实施例所述的移动通信网络流量预测方法。附图说明图1是本发明一实施例提供的一种移动通信网络流量预测方法的流程示意图;图2是本发明实施例提供的填补数据的处理流程示意图;图3是本发明一实施例提供的一种移动通信网络流量预测装置的结构示意图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。参见图1,是本发明一实施例提供的一种移动通信网络流量预测方法的流程示意图,包括:s11、根据采集到的预设日期的用户数据,采用预设的填补数据预测模型获取填补数据;其中,所述填补数据为预设日期至待预测日期之间的时间阈值的用户数据,所述用户数据为流量值和用户数的时间序列数据。具体地,采用爬虫系统,对待预测日期的类型进行判断;根据所述待预测日期的类型,确定待填补日期阈值;将所述待填补日期阈值输入所述待预测日期的类型对应的填补数据预测模型进行预测,得到填补数据。需要说明的是,预先设置日期阈值,是某一时间段内,按照时间先后顺序记录的日期。其中,所述统计日期阈值中可划分为节假日和自然日。节假日定义为法定节假日,包含元旦、春节、清明节、劳动节、端午节、中秋节及国庆节;自然日定义为剔除节假日后的正常工作日和双休日。参见图2,是本发明一实施例提供的填补数据的处理流程示意图,由于法定节假日中的部分节假日为农历节日,节日的时间每年都在变化结合爬虫系统的日历模块,获取待预测日期的类型,即为节假日或是自然日。基于预先建立的填补数据预测模型,获取待填补日期阈值为待预测日期与预设日期之间空缺的区间的填补数据。其中,所述填补数据预测模型包括节假日流量预测模型、节假日用户数预测模型、自然日流量预测模型及自然日用户数预测模型,所述填补数据包括节假日或自然日填补天粒度流量和用户数。例如,当检测到待预测日期为节假日时,对所述预设日期阈值的最后一天至所述待预测日期的前一天的日期区间进行筛选。结合爬虫系统与国家法定节假日规定,筛选出所述日期区间中的节假日日期,将选中的所有节假日日期按照时间顺序排列组成待填补日期阈值。之后,将所述待填补日期阈值输入到对应的填补数据预测模型进行预测,得到当天的天粒度流量和用户数。在一种可选的实施例中,当判断到所述待预测日期为节假日时,将所述预设日期至所述待预测日期之间的时间阈值中所有节假日的日期集合作为所述待填补日期阈值;将所述待填补日期阈值输入到所述节假日流量预测模型和节假日用户数预测模型,得到填补数据。作为举例,待预测日期为2018.10.7,预设日期最后一天为2018.9.28(自然日),结合日历模块可知2018.10.7为节假日,则待填补日期阈值为2018.10.1-2018.10.6(节假日)。而2018.9.29-2018.9.30为自然日,无需作为特征输入模型。将所述待填补日期阈值输入节假日流量预测模型,可得到待预测日期的流量值,将所述待填补日期阈值输入节假日用户数预测模型,可得到待预测日期的用户数,即节假日填补数据。在另一可选的实施例中,当判断到所述待预测日期为自然日时,将所述预设日期至所述待预测日期之间的时间阈值中所有自然日的日期集合作为所述待填补日期阈值;将所述待填补日期阈值输入到所述自然日流量预测模型和自然日用户数预测模型,得到填补数据。同理,自然日的待填补日期阈值则剔除节假日日期,与节假日填补方法类似。例如,待预测日期为2018.10.30,历史统计日期最后一天为2018.9.30,根据日历模块可知2018.10.30为自然日,剔除2018.10.1-2018.10.29中的节假日,剩余日期为待填补阈值2018.10.8-2018.10.29。将所述待填补日期阈值输入自然日流量预测模型,可得到待预测日期的流量值,将所述待填补日期阈值输入自然日用户数预测模型,可得到待预测日期的用户数,即自然日填补数据。s12、根据所述填补数据和外部数据,得到特征集;其中,所述外部数据包括所述待预测日期的类型及天气数据。。具体地,根据所述填补数据,计算流量值和用户数的相关特征值;根据爬虫系统爬取所述待预测日期的类型、天气数据作为外部数据;根据所述相关特征值和所述外部数据,生成特征集。其中,所述外部数据为通过爬虫系统爬取的对流量变化产生影响的实际环境因素,比如通过爬取日历模块获取待预测日期的类型为节假日或自然日,通过爬取天气模块获取天气数据,所述天气数据包括天气类型、平均温度,如天气类型为晴天、阴天、下雪、下雨。所述特征集用于作为训练模型的特征,具体特征集内容如下:序号特征1是否节假日2天气3平均温度4待预测日期前1天流量5待预测日期前2天流量6待预测日期前3天流量7待预测日期前4天流量8待预测日期前5天流量9待预测日期前6天流量10待预测日期前7天流量11待预测日期前8天流量12待预测日期前3天平均流量13待预测日期前5天平均流量14待预测日期前7天平均流量15待预测日期前30天平均流量16待预测日期前1天用户数17待预测日期前2天用户数18待预测日期前3天用户数19待预测日期前4天用户数20待预测日期前5天用户数21待预测日期前6天用户数22待预测日期前7天用户数23待预测日期前8天用户数24待预测日期前1天人均流量25待预测日期前2天人均流量26待预测日期前3天人均流量27待预测日期前4天人均流量28待预测日期前5天人均流量29待预测日期前6天人均流量30待预测日期前7天人均流量s13、根据所述特征集对预先建立的机器学习模型进行训练,得到流量预测模型。s14、将所述待预测日期输入到所述流量预测模型,得到流量预测值。本发明实施例公开的一种移动通信网络流量预测方法,通过根据采集到的预设日期的用户数据,采用预设的填补数据预测模型获取填补数据,其中,所述填补数据为预设日期至待预测日期之间的时间阈值的用户数据,所述用户数据为流量值和用户数的时间序列数据,根据所述填补数据和外部数据,得到特征集,其中,所述外部数据包括所述待预测日期的类型及天气数据,根据所述特征集对预先建立的机器学习模型进行训练,得到流量预测模型,将所述待预测日期输入到所述流量预测模型,得到流量预测值,基于待预测日期的类型、流量、用户数、天气等多维度数据建立流量预测模型,通过增加了更多现实环境中影响流量变化的因素,尤其考虑节假日和自然日的流量形态存在较大差异,能有效消除节假日因素对流量变化的影响,能有效提高模型的鲁棒性,能有效解决现有技术仅采用流量的时间序列数据建模导致模型维度单一,适用范围有限的问题,提高模型的预测准确度和适用范围。在上述实施例的基础上,步骤s11还包括对所述预设日期的用户数据的划分步骤:将采集到的所述预设日期的用户数据划分为节假日序列和自然日序列;将所述节假日序列划分为节假日流量时间序列和节假日用户数时间序列;将所述自然日序列划分为自然日流量时间序列和自然日用户数时间序列。可以理解,采集预设日期的全网流量与用户数,将节假日的数据抽取出来生成节假日全网流量和用户数天粒度的时间序列数据,剩余的日期生成自然日的全网流量和用户数天粒度的时间序列数据。所述节假日序列,是某一时间段内按照节假日时间先后顺序记录的流量数据和用户数数据,划分为节假日流量时间序列和节假日用户数时间序列。所述自然日序列,是某一时间段内按照自然日时间先后顺序记录的流量数据和用户数数据,划分为自然日流量时间序列和自然日用户数时间序列。所述预设日期的用户数据可以理解为历史统计数据,所述填补数据可以理解为最近统计数据。进一步的,步骤s11中所述填补数据预测模型的构建步骤:所述填补数据预测模型包括节假日流量预测模型、节假日用户数预测模型、自然日流量预测模型及自然日用户数预测模型;根据所述节假日流量时间序列对预先建立的机器学习算法进行训练,得到节假日流量预测模型;根据所述节假日用户数时间序列对所述机器学习算法进行训练,得到节假日用户数预测模型;根据所述自然日流量时间序列对所述机器学习算法进行训练,得到自然日流量预测模型;根据所述自然日用户数时间序列对所述机器学习算法进行训练,得到自然日用户数预测模型。优选地,所述机器学习模型可以为holt-winters三次指数平滑算法。本实施例中,采用对自然日和节假日分别建模的方法,考虑节假日和自然日的流量形态存在较大差异,法定假期中部分节日的时间每年都在变化,按自然年计算流量时间序列的周期性会产生较大误差,并结合爬虫系统进行推算预测,能有效消除节假日因素对流量变化的影响,能有效提高模型的鲁棒性,提高模型的预测准确度和适用范围。在另一实施例中,步骤s13具体为:所述根据所述特征集对预先建立的机器学习模型进行训练,得到流量预测模型,具体为:将所述预设日期的用户数据作为训练样本;将所述特征集输入预先建立的机器学习模型,并根据所述训练样本对所述机器学习模型进行训练;采用所述训练样本对训练得到的机器学习模型进行参数调优,得到流量预测模型。可以理解,将s12得到的特征集作为训练模型的特征,把预设日期的用户数据作为训练样本,预设日期的真实流量值作为训练样本的标签,采用预设的机器学习模型进行训练,如svm支持向量机模型。其中,核函数使用线性核函数,采用所述训练样本遍历svm模型的gamma,cost等参数的取值,计算流量预测模型的预测结果和真实流量值的绝对误差率,选取最优的参数。即可以通过决对误差率对流量预测模型的预测效果进行评估,以调整模型参数,有效提高模型的预测准确率。其中,绝对误差率计算公式如下:进一步的,输入待预测日期,采用所述流量预测模型对当天的流量值进行预测。本实施例中,创新性地采用holt-winters三次指数平滑算法与svm支持向量机算法混合模型,使模型可以处理更多维度的特征,可以有效延长预测周期,提前较长时间预测流量,并提供一种模型优化的方法,能有效提高模型优化的效果。参见图3,是本发明一实施例提供的一种移动通信网络流量预测装置的结构示意图,包括:数据获取模块1,用于根据采集到的预设日期的用户数据,采用预设的填补数据预测模型获取填补数据;其中,所述填补数据为预设日期至待预测日期之间的时间阈值的用户数据,所述用户数据为流量值和用户数的时间序列数据;特征获取模块2,用于根据所述填补数据和外部数据,得到特征集;其中,所述外部数据包括所述待预测日期的类型及天气数据;模型构建模块3,用于根据所述特征集对预先建立的机器学习模型进行训练,得到流量预测模型;流量预测模块4,用于将所述待预测日期输入到所述流量预测模型,得到流量预测值。优选地,所述移动通信网络流量预测装置包括对所述预设日期的用户数据的划分模块:用户数据划分单元,用于将采集到的所述预设日期的用户数据划分为节假日序列和自然日序列;节假日序列划分单元,用于将所述节假日序列划分为节假日流量时间序列和节假日用户数时间序列;自然日序列划分单元,用于将所述自然日序列划分为自然日流量时间序列和自然日用户数时间序列。优选地,所述移动通信网络流量预测装置包括所述填补数据预测模型的构建模块:填补数据预测模型单元,用于所述填补数据预测模型包括节假日流量预测模型、节假日用户数预测模型、自然日流量预测模型及自然日用户数预测模型节假日流量预测模型构建单元,用于根据所述节假日流量时间序列对预先建立的机器学习模型进行训练,得到节假日流量预测模型;节假日用户数预测模型构建单元,用于根据所述节假日用户数时间序列对所述机器学习模型进行训练,得到节假日用户数预测模型;自然日流量预测模型构建单元,用于根据所述自然日流量时间序列对所述机器学习模型进行训练,得到自然日流量预测模型;自然日用户数预测模型构建单元,用于根据所述自然日用户数时间序列对所述机器学习模型进行训练,得到自然日用户数预测模型。优选地,所述数据获取模块1包括:判断单元,用于采用爬虫系统,对待预测日期的类型进行判断;待填补日期阈值设置单元,用于根据所述待预测日期的类型,确定待填补日期阈值;填补数据预测单元,用于将所述待填补日期阈值输入所述待预测日期的类型对应的填补数据预测模型进行预测,得到填补数据。在一种可选的实施例中,所述填补数据预测单元包括:节假日待填补日期阈值设置单元,用于当判断到所述待预测日期为节假日时,将所述预设日期至所述待预测日期之间的时间阈值中所有节假日的日期集合作为所述待填补日期阈值;节假日填补数据预测单元,用于将所述待填补日期阈值输入到所述节假日流量预测模型和节假日用户数预测模型,得到填补数据。优选地,所述特征获取模块2包括:计算单元,用于根据所述填补数据,计算流量值和用户数的相关特征值;外部数据获取单元,用于根据爬虫系统爬取所述待预测日期的类型、天气数据作为外部数据;特征集生成单元,用于根据所述相关特征值和所述外部数据,生成特征集。优选地,所述模型构建模块3包括:训练样本设置单元,用于将所述预设日期的用户数据作为训练样本;训练单元,用于将所述特征集输入预先建立的机器学习模型,并根据所述训练样本对所述机器学习模型进行训练;参数调优单元,用于采用所述训练样本对训练得到的机器学习模型进行参数调优,得到流量预测模型。参见图3,是本发明一实施例提供的一种移动通信网络流量预测装置的结构示意图。该实施例的移动通信网络流量预测装置包括:处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序。所述处理器执行所述计算机程序时实现上述各个移动通信网络流量预测方法实施例中的步骤,例如图1所述的步骤s13根据所述特征集对预先建立的机器学习模型进行训练,得到流量预测模型。或者,所述处理器执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能,例如,模型构建模块3,用于根据所述特征集对预先建立的机器学习模型进行训练,得到流量预测模型。示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述移动通信网络流量预测装置中的执行过程。所述移动通信网络流量预测装置可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述移动通信网络流量预测装置可包括,但不仅限于,处理器、存储器。本领域技术人员可以理解,所述示意图仅仅是移动通信网络流量预测装置的示例,并不构成对移动通信网络流量预测装置的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述移动通信网络流量预测装置还可以包括输入输出设备、网络接入设备、总线等。所称处理器可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述移动通信网络流量预测装置的控制中心,利用各种接口和线路连接整个移动通信网络流量预测装置的各个部分。所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述移动通信网络流量预测装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。其中,所述移动通信网络流量预测装置集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。以上所述是本发明的优选实施方式,应当指出,对于本
技术领域
的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1