一种融合动态平均估计的无线电管理数据分析方法与流程

文档序号:33396541发布日期:2023-03-08 13:47阅读:57来源:国知局
一种融合动态平均估计的无线电管理数据分析方法与流程

1.本发明属于无线电数据分析技术领域,具体涉及一种融合动态平均估计的无线电管理数据分析方法。


背景技术:

2.近年来,随着信息化社会的进一步发展,我国无线电管理事业面临着新形式、新任务和新挑战,其中对大量的无线电管理数据进行高质量的分析,从而更加有效的利用这些数据来推动我国无线电管理事业的发展。
3.为了充分发挥无线电数据的价值,现有技术中有很多对无线电频谱资源数据挖掘、分析研究。公开号为cn 113177035 a的中国专利公开了一种基于无线电频谱数据管理平台的电磁频谱数据库系统,包括处理设备和处理系统;所述处理设备包括计算机、服务器以及磁盘阵列;所述处理系统包括数据库和无线电数据管控平台;所述数据库用于存储频谱数据信息,所述无线电数据管控平台用于增加修改和删除数据库内部数据的平台所述处理设备用于进行数据采集并将数据录入数据库。该专利通过兼容各种格式的样本数据;数据录入效率高,可直接导表录入数据效率提高,且降低了手动误输入的状态,提高了数据统计效率与相对应的频谱监测设备匹配可达到数据监测和黑电台排查功能,满足了不同使用需求,更加值得推广使用。公开号为 cn109634954 a的中国专利明公开了一种无线电频谱数据存储方法,包括以下步骤:s1、采集频谱数据,以自然分钟为频率振幅统计触发条件,将采集到频谱数据进行频率振幅统计,针对频率振幅统计的数据进行存储频率振幅统计值和实时谱值;s2、以自然时为信号统计和频谱统计的触发条件,根据频谱数据提取信号基础信息和频谱统计值,并对其分别进行存储;s3、当分析时间颗粒度为自然时、日、周和月时,通过信号基础信息和频谱统计值实现数据分析;当分析时间颗粒度小于自然时时,通过频率振幅统计值实现数据分析。该专利不仅提高频谱数据的存储效率,而且节省存储空间,同时加快其大量频谱数据的分析速度。但是上述两项专利都是对无线电频谱资源数据储存、挖掘方面的研究,并未提及关于无线电日常管理数据工作的开展情况的研究。


技术实现要素:

4.为了解决现有技术中存在的不足,本发明的目的是提供一种融合动态平均估计的无线电管理数据分析方法。该分析方法将移动平均线和统计学中区间估计结合用来分析无线电管理数据,通过对处理后的数据与原统计数据进行分析,并融合区间估计确定合理的区间上下界限,通过不同参数的组合实验,进而可以分析无线电管理数据受外界因素的影响。
5.为了实现上述目的,本发明采用如下技术方案:
6.一种融合动态平均估计的无线电管理数据分析方法,包括以下步骤:
7.(1)采用移动平均线方法对无线电管理的原始数据进行处理作为后续无线电管理数据分析的期望值;
8.(2)利用正态分布的区间估计法对步骤(1)中处理后的无线电管理数据进行分析;
9.(3)通过调整移动平均线的取样周期和正态分布区间估计的参数试验,得到参数组合,通过所述参数组合得出对无线电管理数据的分析结论。
10.进一步的,所述无线电管理数据包括监测数据、频率台站数据、地理信息、行业辅助数据、资产数据、黑广播执法案件查处数据和伪基站执法案件查处数据。
11.进一步的,所述黑广播执法案件查处数据和伪基站执法案件查处数据都是按照规定的情况、规定的条件定期开展进行,并且每个时间段的数据相互不受影响,且所述黑广播执法案件查处数据和伪基站执法案件查处数据分布概率是符合事件独立、同分布并且符合正态分布。
12.进一步的,所述步骤(1)中采用移动平均法处理无线电管理的原始数据的方法具体为:首先将一定时期内无线电管理原始数据的统计值进行求和,然后求其计算平均值,最后将不同时间点上的平均值连接起来。
13.进一步的,所述计算平均值的公式如式(1):
[0014][0015]
其中,man为计算步长为n的移动平均值;ci为每个采样点上的实际值;i表示采样点,从第(m-n+1)个采样点开始,到m结束; n不能大于总体样本数n;m不能小于步长n且不能大于总样本数n。
[0016]
进一步的,所述步骤(2)中的区间估计法所估计的区间为置信区间。
[0017]
进一步的,所述置信区间的具体计算方法包括以下步骤:
[0018]
1)假设总体x的分布函数f(x;θ)含有未知参数θ,对于给定值α(0《α《1),假若来自x的样本x1,x2…
,xn确定两个统计量,分别为θ,对于任意θ,均满足式(2):
[0019][0020]
则称随机区间(θ,)是θ的置信水平为1-α的置信区间,θ为置信水平1-α的置信下限,为置信水平1-α的置信上限;
[0021]
2)假设总体x~n(μ,σ2),σ2已知,μ未知,设x1,x2…
,xn是来自x的样本,是μ的无偏估计,且有
[0022][0023]
3)按照标准正态分布的上α分位点的定义,如公式(4):
[0024][0025]
则μ的置信水平为1-α的置信区间如公式(5):
[0026][0027]
4)将公式(3)中的σ换成得公式(6):
[0028][0029]
其中,t(n-1)不依赖于任何未知参数,使用作为枢轴量可得公式(7):
[0030][0031]
其中,公式(7)满足t分布函数曲线,所述t分布函数曲线接近标准正态分布函数曲线,且其形态变化与n值大小相关;
[0032]
5)将公式(7)作进一步转换得公式(8):
[0033][0034]
将公式(8)化简后,得μ的一个置信水平为1-α的置信区间,如公式(9)所示:
[0035][0036]
进一步的,所述步骤(3)中参数组合包括无线电管理数据的移动平均线和上下置信度区间界限值。
[0037]
进一步的,所述步骤(3)中得到参数组合的具体方法为:首先,以逐月的案件数据为样本点进行采集,选取合适的移动平均线步长n;然后,将连续n个月的采集的案件样本数据值求和后再求平均值,得到移动平均线;最后,计算在一定置信水平上所采集的案件样本数据点的上下置信度区间界限值。
[0038]
无线电数据管理业务以应用需求为导向,融合监测、频率、台站、卫星和设备检测数据库,利用数据挖掘分析技术,对各类无线电管理数据进行数据整合和挖掘分析,提供数据分析平台和数据综合应用服务。目前关于无线电数据管理工作还存在很多问题,主要包括以下两点:(1)数据融合分析与应用需求不明确:有必要结合无线电管理重点工作,对无线电管理应用需求进行系统梳理,促进各业务数据有效融合,全面支撑无线电管理各业务工作科学高效开展。(2)大数据的分析与应用能力较弱:需要以无线电管理和服务需求为导向,充分利用大数据、云计算等信息技术手段,加强数据分析模型算法研究,提升数据融合、分析、挖掘水平,实现对数据的深层次利用。
[0039]
现有的技术中有很多关于无线频谱资源或数据分析、开发和挖掘的研究。例如某一现有文献中提出以现有无线电管理数据资源为基础,综合评价频谱资源利用率、无线电管理日常工作开展情况、资金投入和使用情况等为分析目标,初步建立了数量与质量指标相结合的分级评价指标体系。某一现有研究中提出通过建设无线电数据中台,基于数据挖掘的技术更好地提升数据资源整合共享、分析处理以及辅助决策的能力。某一现有文献报道提出了一种融合emd分解和lstm网络的频谱占用度预测模型,通过频谱资源数据预测频谱的利用率。某一现有文献报道将移动平均线应用在研究bdi(波罗的海干散货指数) 走势中,为判断bdi长期发展趋势提供一种简便方法。相较于上述关于无线电频谱资源数据的研究,现有技术中很少有将移动平均线法和统计学中区间估计法结合在一起来进行无线电管理数据进行分析的研究报道。
[0040]
与现有技术相比,本发明具备的积极有益效果在于:
[0041]
(1)本发明首先用移动平均线方法对原始数据进行处理作为后续数据分析的期望值,然后应用正态分布的区间估计对处理后的数据进行分析,最后通过调整移动平均线的取样周期和区间估计的参数试验,得到较佳的参数组合;通过将移动平均线和区间估计法结合起来 (即移动均线区间估计方法)对无线电管理数据进行处理分析,能够使无线电管理数据的变化趋势更准确、更明显。
[0042]
(2)本发明通过移动均线区间估计方法得到无线电管理数据的不同参数组合,可以较为直观的看到某些时间点的无线电管理数据采样值偏离期望值较大,有些较小;同时由于某些确定时间点发生了明确的影响数据值的事件,利用这个时间点的数据,可以缩小置信度范围,从而优化数据的筛选,使选取的数据更为准确,这样更有利于分析无线电管理数据受外界因素的影响。
[0043]
(3)本发明的分析方法为全国无线电管理提供了一种新的手段,提高了无线电行业管理人员的工作效率,同时该分析方法也可以应用在具有相同性质(即符合事件独立、同分布、正态分布的特性)的数据分析上,例如某省高速车祸数据、某省案件发生数据的统计分析等其他领域,具有良好的应用前景。
附图说明
[0044]
图1是本发明中t分布函数曲线图;
[0045]
图2是本发明移动均线区间估计方法处理无线电管理数据的流程图。
具体实施方式
[0046]
为了便于理解本发明,下面将参照相关附图对本发明进行更加全面的描述,附图中给出了本发明的若干实施例,但是本发明可以通过不同的形式来实现,并不限于文本所描述的实施例,相反的,提供这些实施例是为了使对本发明公开的内容更加透彻全面。
[0047]
实施例
[0048]
以某省2019年-2021年的“黑广播”、伪基站类案件查处数量为例来具体阐述移动均线区间估计方法,并验证了本发明中移动均线区间估计方法的可用性。
[0049]
一种融合动态平均估计的无线电管理数据分析方法,包括以下步骤:
[0050]
(1)将一定时期内的统计值求和计算平均,并将不同时间点上的平均值连接起来,能使统计值随时间变化的趋势更明显,同时有助于预测数量的区间,其数学表达式如下:
[0051][0052]
man表为连续n月的案件查处数量的均值;ci为每个月的实际查处案件数量;n为案件收集月份的总数;i表示采样点,从第 (m-n+1)个采样点开始,到m结束;n不能大于n;m为起始月份;例如,m=4,ma3表示为2月、3月、4月查处案件累加和的平均数。将计算得到的每月不同大小的移动平均数标于图表上,连接起来,形成的移动平均线具有更明显的趋势性和稳定性。
[0053]
(2)利用正态分布的区间估计法对步骤(1)中处理后的无线电管理数据进行分析;
[0054]
正态分布的区间估计法的置信区间的具体计算方法包括以下步骤:
[0055]
1)假设总体x的分布函数f(x;θ)含有未知参数θ,对于给定值α(0《α《1),假若来自x
的样本x1,x2…
,xn确定两个统计量,分别为θ,对于任意θ,均满足式(2):
[0056][0057]
则称随机区间(θ,)是θ的置信水平为1-α的置信区间,θ为置信水平1-α的置信下限,为置信水平1-α的置信上限;
[0058]
2)为求置信区间,假设总体x~n(μ,σ2),σ2已知,μ未知,设 x1,x2…
,xn是来自x的样本,是μ的无偏估计,且有
[0059][0060]
3)按照标准正态分布的上α分位点的定义,如公式(4):
[0061][0062]
则μ的置信水平为1-α的置信区间如公式(5):
[0063][0064]
4)以上总体方差σ2已知,对均值做检验使用正态分布。当构建均值μ的置信区间时,总体方差σ2未知,对均值做检验或估计应使用 t分布,考虑到s2是σ2的无偏估计,将公式(3)中的σ换成得公式(6):
[0065][0066]
其中,公式(6)中t(n-1)不依赖于任何未知参数,使用作为枢轴量可得公式(7):
[0067][0068]
其中,公式(7)满足t分布函数曲线,t分布函数是正态分布函数中的一种,该曲线的形态变化与n值大小相关,n越小,自由度越低,t分布函数曲线愈低平;n越大,自由度越高,t分布函数曲线愈接近标准正态分布函数曲线,参见图1;
[0069]
5)将公式(7)作进一步转换得公式(8):
[0070][0071]
将公式(8)化简后,得μ的一个置信水平为1-α的置信区间,如公式(9)所示:
[0072][0073]
故在总体方差σ2未知,置信水平为1-α的基础上,可以确认总体参数值落在了公式(9)的区间范围内,从而达到对区间范围的有效估计;
[0074]
因为“黑广播”“伪基站”等执法案件查处数据会收到一些因素影响,比如专项行动,节假日,自然灾害等,通过不同参数的组合,可以较为直观的看到某些时间点的采样值
偏离期望值较大,有些较小;同时由于某些确定时间点发生了明确的影响数据值的事件,利用这个时间点的数据,可以缩小置信度范围,从而优化数据的筛选,使选取的数据更为准确;由于在“黑广播”、伪基站类案件查处数量中所选取的均值总体方差σ2未知,故使用t分布函数,即公式(9)展开计算区间范围,公式(9)中为步长为n的“黑广播”、伪基站类案件查处数的均值,s为样本的标准误差,t
α/2
(n-1)为t分布函数对应t值表(表1)中的值;
[0075]
(3)通过移动均线区间估计(ma-ie)法得到参数组合,通过所述参数组合得出对无线电管理数据的分析结论;移动均线区间估计 (ma-ie)法的流程如图2所示,其具体过程如下所示:首先,以逐月的“黑广播”、伪基站类案件数据为样本点进行采集,选取合适的移动平均线步长n,将连续n个月份案件的值求和后再求平均,参见公式(1),此时最开始的(n-1)个月份无法做均值化操作,不再做处理;当选取的n足够大时,所得到的移动平均线会逐渐收敛,趋于平缓,n 不能大于数据总量;其次,得到移动平均线后再计算在一定置信水平上该数据点上下的合理区间范围,参见公式(9);最后,根据实际情况,选取时间间隔(ma)和置信度(cl)数值,man,cl=m%,即设定每n月计算一次均值,有m%的置信度“黑广播”、伪基站类案件查处数量落在该区间范围内,此时需要计算该点的标准误差s,查找t值表,赋值给公式(9)中t
α/2
(n-1),t值表为二维表,每列的自变量代表自由度,每行的自变量代表拒绝域,具体如表1所示,计算完均值点和上下界值点后,即可输出移动平均线和上下界限的范围。
[0076]
表1t值表
[0077][0078]
移动均线区间估计(ma-ie)模型的具体算法如下所示: begin:step1:输入移动平均线步长,确定时间线上的均值点
[0079]
input n
[0080]
if n《n:
[0081]
for(i=n;i《n;i++):
[0082]
aversequence=average(arr[i-n]

arr[i])
[0083]
return aversequence
[0084]
step2:确定样本的标准误差
[0085]
input n
[0086]
for(i=n;i《n;i++):
[0087]
standarderr=stdev(arr[i-n]

arr[i])/sqrt(n)
[0088]
return standarderr
[0089]
step3:确定上下界限
[0090]
input aversequence,standarderr,t
[0091]
bounds=aversequence
±
t*standarderr
[0092]
return upbounds,lowboundsend。
[0093]
本发明提出的融合移动平均和区间估计(ma-ie)的无线电管理数据分析方法,为全国无线电管理提供了一种新的手段,无线电行业管理人员依据该方法能够更有效率地开展管理工作,这种方法也可以应用在具有相同性质(即符合事件独立、同分布、正态分布的特性) 的数据分析上,例如某省高速车祸数据、某省案件发生数据的统计分析等其他领域,因此,其应用范围广泛,应用前景良好。
[0094]
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定,因此本发明的实施例只是针对本发明的一个说明示例,无论从哪一点来看本发明的实施例都不构成对本发明的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1