一种数据统计方法、系统及介质

文档序号:31339109发布日期:2022-08-31 09:37阅读:83来源:国知局
一种数据统计方法、系统及介质

1.本发明涉及数据统计技术领域,特别是涉及一种数据统计方法、装置及介质。


背景技术:

2.在社会生活中,为了获取某一方面的知识或者情况,通常会对相关数据进行统计,以便为进一步处理给予决策支持。例如:如果想知道不同年龄段儿童成长发育情况,就需要统计他们的身高、体重、腰围等数据的均值与方差;如果想了解社会的贫富差距情况,就需要统计人们的收入数据的均值与方差;如果想了解成年人身体某一器官的大小或者长短,就需要统计成年人相关器官的大小或者长短的均值与方差。
3.而上述被统计的数据来源多种多样:有的来自于政府部门,有的来源于企事业单位,也有的来自于问卷调查。
4.但是,申请人发现:目前的数据统计通常直接获得原始数据,一旦使用不当就会泄露公民的隐私,从而导致采用这种统计方法进行问卷调查时,进一步增加了人们(被调查者)的疑虑,害怕自己的真实数据被泄露,并给自己带来困扰和麻烦,因而使人们不愿意配合调查或者填报假数据来敷衍,最终导致该项数据统计结果失真,准确率和真实性大大降低,根本无法反映不了真实的情况。


技术实现要素:

5.本发明提供了一种数据统计方法、系统及计算机可读存储介质,通过在用户的真实数据的同时将用户的真实数据隐蔽处理为待统计数据,使统计端不能直接呈现出用户的真实数据,统计人员不用面对用户的真实数据,也不能够从接收到的待统计数据中知晓用户的真实数据,能够有效保护用户的隐私,不会被泄露,提高用户配合统计的积极性和用户填写数据的真实性,从而提高数据统计的准确率,使数据统计能够反映出真实情况。
6.第一方面,本发明提供了一种数据统计方法,包括:
7.s1.获取用户填写的真实数据;
8.s2.将用户填写的真实数据与服从特定分布的随机数进行运算,得到待统计数据;
9.s3.计算待统计数据的均值,得到用户真实数据的均值;
10.s4.根据用户真实数据的均值与待统计数据的二阶距,得到用户真实数据的方差。
11.进一步地,所述s2包括:
12.产生服从特定分布的随机数,并将该随机数定义为第一随机变量;
13.将用户填写的真实数据定义为服从特定分布的第二随机变量;
14.将该服从特定分布的第二随机变量与服从特定分布的第一随机变量进行运算,得到待统计数据对应的随机变量。
15.进一步地,s2中的所述服从特定分布的随机数是服从高斯分布、均匀分布、伯努利分布、贝塔分布、柯西分布、卡方分布、两点分布、二项分布、几何分布、超几何分布、泊松分布中任意一种的随机数,所述服从特定分布的随机变量是服从高斯分布、均匀分布、伯努利
分布、贝塔分布、柯西分布、卡方分布、两点分布、二项分布、几何分布、超几何分布、泊松分布中任意一种的随机变量。
16.进一步地,s2中的所述运算为加法、减法、乘法或者除法。
17.进一步地,步骤s3按照以下公式计算待统计数据的均值,得到用户真实数据的均值e(y);
18.当s2的所述运算为加法时,则利用以下公式(1)和(2)计算得到用户真实数据的均值e(y):
19.e(x+y)=e(x)+e(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
20.e(y)=e(x+y)-e(x)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
21.其中,为随机数的均值,为用户真实数据的均值,为待统计数据的均值,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,x+y为待统计数据对应的随机变量,n为数据集合中样值个数;
22.当s2的所述运算为减法时,则利用以下公式(3)和(4)计算得到用户真实数据的均值:
23.e(x-y)=e(x)-e(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
24.e(y)=e(x)-e(x-y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
25.其中,为随机数的均值,为用户真实数据的均值,为待统计数据的均值,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,x-y为待统计数据对应的随机变量,n为数据集合中样值个数;
26.当s2的所述运算为乘法时,则利用以下公式(5)和(6)计算得到用户真实数据的均值e(y):
27.e(xy)=e(x)e(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
28.e(y)=e(xy)/e(x)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
29.其中,为随机数的均值,为用户真实数据的均值,为待统计数据的均值,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,xy为待统计数据对应的随机变量,n为数据集合中样值个数;
30.当s2的所述运算为除法时,则利用以下公式(7)和(8)计算得到用户真实数据的均值e(y):
31.e(x/y)=e(x)/e(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
32.e(y)=e(x)/e(x/y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
33.其中,为随机数的均值,为用户真实数据的均值,为待统计数据的均值,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,x/y为待统计数据对应的随机变量,n为数据集合中样值个数。
34.进一步地,步骤s4具体为:根据用户真实数据的均值与待统计数据的二阶距按照以下公式计算得到用户真实数据的方差d(y);
35.当s2的所述运算为加法时,则利用以下公式(9)-(11)计算得到用户真实数据的方差d(y):
36.e[(x+y)2]=e[x2+2xy+y2]=e(x2)+2e(x)e(y)+e(y2)
ꢀꢀꢀ
(9)
[0037]
e(y2)=e[(x+y)2]-e(x2)-2e(x)e(y)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(10)
[0038]
d(y)=e(y2)-e2(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0039]
其中,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,x+y为待统计数据对应的随机变量,n为数据集合中样值个数,为随机数的均值,为用户真实数据的均值,为第一随机变量的二阶距,为第一随机变量的二阶距,为第一随机变量的二阶距,为待统计数据的二阶距;
[0040]
当s2的所述运算为减法时,则利用以下公式(12)-(14)计算得到用户真实数据的方差d(y):
[0041]
e[(x-y)2]=e[x
2-2xy+y2]=e(x2)-2e(x)e(y)+e(y2)
ꢀꢀꢀꢀ
(12)
[0042]
e(y2)=e[(x-y)2]-e(x2)+2e(x)e(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)
[0043]
d(y)=e(y2)-e2(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(14)
[0044]
其中,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,x-y为待统计数据对应的随机变量,n为数据集合中样值个数,为随机数的均值,为用户真实数据的均值,为第一随机变量的二阶距,为第一随机变量的二阶距,为第一随机变量的二阶距,为待统计数据的二阶距;
[0045]
当s2的所述运算为乘法时,则利用以下公式(15)-(17)计算得到用户真实数据的方差d(y):
[0046]
e[(xy)2]=e(x2)e(y2)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(15)
[0047]
e(y2)=e[(xy)2]/e(x2)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(16)
[0048]
d(y)=e(y2)-e2(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(17)
[0049]
其中,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,xy为待统计数据对应的随机变量,n为数据集合中样值个数,
为随机数的均值,为用户真实数据的均值,为第一随机变量的二阶距,为第一随机变量的二阶距,为第一随机变量的二阶距,为待统计数据的二阶距;
[0050]
当s2的所述运算为除法时,则利用以下公式(18)-(20)计算得到用户真实数据的方差d(y):
[0051]
e(x2/y2)=e(x2)/e(y2)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(18)
[0052]
e(y2)=e(x2)/e(x2/y2)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(19)
[0053]
d(y)=e(y2)-e2(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(20)
[0054]
其中,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,x/y为待统计数据对应的随机变量,n为数据集合中样值个数,为随机数的均值,为用户真实数据的均值,为第一随机变量的二阶距,为第一随机变量的二阶距,为第一随机变量的二阶距,为待统计数据的二阶距。
[0055]
第二方面,本发明还提供了一种数据统计系统,应用了上述的数据统计方法,具体包括:
[0056]
多个统计终端,每个所述统计终端包括用户真实数据获取模块和待统计数据生成模块;其中,所述用户真实数据获取模块用于接收用户输入的真实数据;所述待统计数据生成模块用于将用户填写的真实数据与服从特定分布的随机数进行运算,得到待统计数据;
[0057]
统计服务器,与多个所述统计终端连接,用于接收统计终端上传的待统计数据,并根据待统计数据计算待统计数据的均值和二阶距,进而得到用户真实数据的均值和方差。
[0058]
第三方面,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法步骤。
[0059]
本发明主要有益效果:
[0060]
本发明的数据统计方法通过上述技术方案,能够在用户的真实数据的同时将用户的真实数据隐蔽处理为待统计数据,使统计端不能直接呈现出用户的真实数据,统计人员不用面对用户的真实数据,也不能够从接收到的待统计数据中知晓用户的真实数据,一方面能够有效保护用户的隐私,不会被泄露,另一方面能够提高用户配合统计的积极性和用户填写数据的真实性,从而提高数据统计的准确率,使数据统计能够反映出真实情况。
[0061]
本发明的数据统计系统及计算机可读存储介质中的各个方面以及各个方面可能达到的技术效果参照上述数据统计方法可以达到的技术效果说明,这里不再重复赘述。
附图说明
[0062]
图1为本发明实施例所述一种数据统计方法的流程图;
[0063]
图2为本发明实施例所述一种数据统计系统的示意图;
[0064]
图3为本发明实施例所述一种数据统计系统中统计终端的功能模块示意图。
具体实施方式
[0065]
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。方法实施例中的具体操作方法也可以应用于装置实施例或系统实施例中。需要说明的是,在本发明的描述中“多个”理解为“至少两个”。a与b连接,可以表示:a与b直接连接和a与b通过c连接这两种情况。另外,在本发明的描述中,“第一”、“第二”等词汇,仅用于区分描述的目的,而不能理解为指示或暗示相对重要性,也不能理解为指示或暗示顺序。
[0066]
如图1所示,为本发明实施例一种数据统计方法的流程图,该数据统计方法具体包括如下步骤:
[0067]
步骤s1.获取用户填写的真实数据。
[0068]
在一种可能实施的方案中,本发明可以通过智能手机、台式电脑、平板电脑、笔记本电脑等统计终端(电子设备)供给用户填写的真实数据,并获取该真实数据。
[0069]
步骤s2.将用户填写的真实数据与服从特定分布的随机数进行运算,得到待统计数据。
[0070]
在一种可能实施的方案中,所述步骤s2具体包括:
[0071]
s2-1.产生服从特定分布的随机数,并将该随机数定义为第一随机变量,
[0072]
即产生服从某一分布的随机数xi(对应的随机变量是x),已知其均值为e(x)、方差为d(x),例如这个随机数可以是服从高斯分布、均匀分布或者其他分布,通常其均值e(x)不设置为为0;
[0073]
s2-2.将用户填写的真实数据定义为服从特定分布的第二随机变量;
[0074]
s2-3.将该服从特定分布的第二随机变量与服从特定分布的第一随机变量进行运算,得到待统计数据对应的随机变量,所述运算为加法、减法、乘法或者除法。
[0075]
而且步骤s2中的所述服从特定分布的随机数是服从高斯分布、均匀分布、伯努利分布、贝塔分布、柯西分布、卡方分布、两点分布、二项分布、几何分布、超几何分布、泊松分布中任意一种的随机数,所述服从特定分布的随机变量是服从高斯分布、均匀分布、伯努利分布、贝塔分布、柯西分布、卡方分布、两点分布、二项分布、几何分布、超几何分布、泊松分布中任意一种的随机变量。
[0076]
步骤s3.计算待统计数据的均值,得到用户真实数据的均值。
[0077]
在一种可能实施的方案中,步骤s2将用户填写的真实数据与服从特定分布的随机数进行运算,得到待统计数据,并按照以下公式计算待统计数据的均值,得到用户真实数据的均值e(y)。具体为:
[0078]
当s2的所述运算为加法时,则利用以下公式(1)和(2)计算得到用户真实数据的均值e(y):
[0079]
e(x+y)=e(x)+e(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0080]
e(y)=e(x+y)-e(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0081]
其中,为随机数的均值,为用户真实数据
的均值,为待统计数据的均值,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,x+y为待统计数据对应的随机变量,n为数据集合中样值个数。
[0082]
当s2的所述运算为减法时,则利用以下公式(3)和(4)计算得到用户真实数据的均值e(y):
[0083]
e(x-y)=e(x)-e(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0084]
e(y)=e(x)-e(x-y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0085]
其中,为随机数的均值,为用户真实数据的均值,为待统计数据的均值,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,x-y为待统计数据对应的随机变量,n为数据集合中样值个数。
[0086]
当s2的所述运算为乘法时,则利用以下公式(5)和(6)计算得到用户真实数据的均值e(y):
[0087]
e(xy)=e(x)e(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0088]
e(y)=e(xy)/e(x)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)
[0089]
其中,为随机数的均值,为用户真实数据的均值,为待统计数据的均值,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,xy为待统计数据对应的随机变量,n为数据集合中样值个数。
[0090]
当s2的所述运算为除法时,则利用以下公式(7)和(8)计算得到用户真实数据的均值e(y):
[0091]
e(x/y)=e(x)/e(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
[0092]
e(y)=e(x)/e(x/y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0093]
其中,为随机数的均值,为用户真实数据的均值,为待统计数据的均值,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,x/y为待统计数据对应的随机变量,n为数据集合中样值个数。
[0094]
步骤s4.根据用户真实数据的均值与待统计数据的二阶距,得到用户真实数据的方差d(y)。
[0095]
在一种可能实施的方案中,步骤s4根据用户真实数据的均值与待统计数据的二阶距按照以下公式计算得到用户真实数据的方差d(y);具体为:
[0096]
当s2的所述运算为加法时,则利用以下公式(9)-(11)计算得到用户真实数据的方差d(y):
[0097]
e[(x+y)2]=e[x2+2xy+y2]=e(x2)+2e(x)e(y)+e(y2)
ꢀꢀꢀ
(9)
[0098]
e(y2)=e[(x+y)2]-e(x2)-2e(x)e(y)
ꢀꢀꢀꢀꢀꢀꢀꢀ
(10)
[0099]
d(y)=e(y2)-e2(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(11)
[0100]
其中,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,x+y为待统计数据对应的随机变量,n为数据集合中样值个数,为随机数的均值,为用户真实数据的均值,为第一随机变量的二阶距,为第一随机变量的二阶距,为第一随机变量的二阶距,为待统计数据的二阶距。
[0101]
当s2的所述运算为减法时,则利用以下公式(12)-(14)计算得到用户真实数据的方差d(y):
[0102]
e[(x-y)2]=e[x
2-2xy+y2]=e(x2)-2e(x)e(y)+e(y2)
ꢀꢀꢀꢀ
(12)
[0103]
e(y2)=e[(x-y)2]-e(x2)+2e(x)e(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(13)
[0104]
d(y)=e(y2)-e2(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(14)
[0105]
其中,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,x-y为待统计数据对应的随机变量,n为数据集合中样值个数,为随机数的均值,为用户真实数据的均值,为第一随机变量的二阶距,为第一随机变量的二阶距,为第一随机变量的二阶距,为待统计数据的二阶距。
[0106]
当s2的所述运算为乘法时,则利用以下公式(15)-(17)计算得到用户真实数据的方差d(y):
[0107]
e[(xy)2]=e(x2)e(y2)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(15)
[0108]
e(y2)=e[(xy)2]/e(x2)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(16)
[0109]
d(y)=e(y2)-e2(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(17)
[0110]
其中,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,xy为待统计数据对应的随机变量,n为数据集合中样值个数,为随机数的均值,为用户真实数据的均值,为第一随机变量的二阶距,为第一随机变量的二阶距,为第一随机变量的二阶距,为待统计数据的二阶距。
[0111]
当s2的所述运算为除法时,则利用以下公式(18)-(20)计算得到用户真实数据的方差d(y):
[0112]
e(x2/y2)=e(x2)/e(y2)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(18)
[0113]
e(y2)=e(x2)/e(x2/y2)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(19)
[0114]
d(y)=e(y2)-e2(y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(20)
[0115]
其中,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,x/y为待统计数据对应的随机变量,n为数据集合中样值个数,为随机数的均值,为用户真实数据的均值,为第一随机变量的二阶距,为第一随机变量的二阶距,为第一随机变量的二阶距,为待统计数据的二阶距。
[0116]
本发明通过上述方法,即可在用户的真实数据的同时将用户的真实数据隐蔽处理为待统计数据,使统计端不能直接呈现出用户的真实数据,统计人员不用面对用户的真实数据,也不能够从接收到的待统计数据中知晓用户的真实数据,一方面能够有效保护用户的隐私,不会被泄露,另一方面能够提高用户配合统计的积极性和用户填写数据的真实性,从而提高数据统计的准确率,使数据统计能够反映出真实情况。
[0117]
下面通过实施例对本发明所述数据统计方法做进一步说明。
[0118]
实施例1
[0119]
本实施例1是以步骤s2采用加法运算为例,结合计算机仿真方法的数据统计方法,具体为:
[0120]
假设第一随机变量x服从均值为100、方差为100的高斯分布,第二随机变量y服从(5,35)均匀分布,共有数据n=100000个,数据由计算机仿真产生,例如:
[0121]
lower=5;
[0122]
upper=35;
[0123]
dim=100000;
[0124]
real_data=lower+(upper-lower)*rand(1,dim);
[0125]
rand_data=100+10*randn(1,dim);
[0126]
static_data=rand_data+real_data;
[0127]
其中,rand_data为第一随机变量序列,real_data为第二随机变量序列,static_data为待统计随机变量序列,可以看出第二随机变量序列被第一随机变量序列随机加扰,已经不是真实数据了,起到了加密的作用。
[0128]
根据前述公式(1)和(2)计算得到的第二随机变量的均值为20.0165,与第二随机变量的实际均值20.0165一致。其中变量的实际均值20.0165一致。其中x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,x+y为待统计数据对应的随机变量,n为数据集合中样值个数。
[0129]
根据前述公式(9)、(10)和(11)计算得到第二随机变量的方差为74.3205,与第二随机变量的实际均值74.6951非常接近。其中,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,x+y为待统计数据对应的随机变量,n
为数据集合中样值个数,为数据集合中样值个数,为随机数的均值,为用户真实数据的均值,为第一随机变量的二阶距,第一随机变量的二阶距,为第一随机变量的二阶距,为第一随机变量的二阶距,为待统计数据的二阶距。
[0130]
实施例2
[0131]
本实施例2是以步骤s2采用减法运算为例,结合计算机仿真方法的数据统计方法,具体为:
[0132]
假设第一随机变量x服从均值为100、方差为100的高斯分布,第二随机变量y服从(5,35)均匀分布,共有数据n=100000个,数据由计算机仿真产生,例如:
[0133]
lower=5;
[0134]
upper=35;
[0135]
dim=100000;
[0136]
real_data=lower+(upper-lower)*rand(1,dim);
[0137]
rand_data=100+10*randn(1,dim);
[0138]
static_data=rand_data-real_data;
[0139]
其中,rand_data为第一随机变量序列,real_data为第二随机变量序列,static_data为待统计随机变量序列,可以看出第二随机变量序列被第一随机变量序列随机加扰,已经不是真实数据了,起到了加密的作用。
[0140]
根据前述公式(1)和(2)计算得到的第二随机变量的均值为20.0518,与第二随机变量的实际均值20.05185一致。其中5185一致。其中x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,x-y为待统计数据对应的随机变量,n为数据集合中样值个数。
[0141]
根据前述公式(9)、(10)和(11)计算得到第二随机变量的方差为74.9058,与第二随机变量的实际均值75.2533非常接近。其中,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,x-y为待统计数据对应的随机变量,n为数据集合中样值个数,为数据集合中样值个数,为随机数的均值,为用户真实数据的均值,为第一随机变量的二阶距,第一随机变量的二阶距,为第一随机变量的二阶距,为第一随机变量的二阶距,为待统计数据的二阶距。
[0142]
实施例3
[0143]
本实施例3是以步骤s2采用乘法运算为例,结合计算机仿真方法的数据统计方法,具体为:
[0144]
假设第一随机变量x服从均值为100、方差为100的高斯分布,第二随机变量y服从(5,35)均匀分布,共有数据n=100000个,数据由计算机仿真产生,例如:
[0145]
lower=5;
[0146]
upper=35;
[0147]
dim=100000;
[0148]
real_data=lower+(upper-lower)*rand(1,dim);
[0149]
rand_data=100+10*randn(1,dim);
[0150]
static_data=rand_data.*real_data;
[0151]
其中,rand_data为第一随机变量序列,real_data为第二随机变量序列,static_data为待统计随机变量序列,可以看出第二随机变量序列被第一随机变量序列随机加扰,已经不是真实数据了,起到了加密的作用。
[0152]
根据前述公式(1)和(2)计算得到的第二随机变量的均值为20.0133,与第二随机变量的实际均值20.0150基本一致,误差很小。其中0基本一致,误差很小。其中x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,xy为待统计数据对应的随机变量,n为数据集合中样值个数。
[0153]
根据前述公式(9)、(10)和(11)计算得到第二随机变量的方差为75.1120,与第二随机变量的实际均值75.2051非常接近,误差很小。其中,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,xy为待统计数据对应的随机变量,n为数据集合中样值个数,为随机数的均值,为用户真实数据的均值,为第一随机变量的二阶距,为第一随机变量的二阶距,为第一随机变量的二阶距,为待统计数据的二阶距。
[0154]
实施例4
[0155]
本实施例4是以步骤s2采用除法运算为例,结合计算机仿真方法的数据统计方法,具体为:
[0156]
假设第一随机变量x服从均值为100、方差为100的高斯分布,第二随机变量y的倒数服从(5,35)均匀分布,共有数据n=100000个,数据由计算机仿真产生,例如:
[0157]
lower=5;
[0158]
upper=35;
[0159]
dim=100000;
[0160]
real_data=1./(lower+(upper-lower)*rand(1,dim));
[0161]
rand_data=100+10*randn(1,dim);
[0162]
static_data=rand_data.*real_data;
[0163]
其中,rand_data为第一随机变量序列,real_data为第二随机变量序列,static_data为待统计随机变量序列,可以看出第二随机变量序列被第一随机变量序列随机加扰,已经不是真实数据了,起到了加密的作用。
[0164]
根据前述公式(1)和(2)计算得到的第二随机变量的均值为0.0648,与第二随机变量的实际均值0.0648一致。其中量的实际均值0.0648一致。其中x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,x/y为待统计数据对应的随机变量,n为数据集合中样值个数。
[0165]
根据前述公式(9)、(10)和(11)得到第二随机变量的方差为0.0015,与第二随机变量的实际均值0.0015一致。其中,x为第一随机变量,y为第二随机变量,xi为产生服从特定分布的随机数,yi为用户填写的真实数据,x/y为待统计数据对应的随机变量,n为数据集合中样值个数,中样值个数,为随机数的均值,为用户真实数据的均值,为第一随机变量的二阶距,一随机变量的二阶距,为第一随机变量的二阶距,为待统计数据的二阶距。
[0166]
基于同一发明构思,本发明还提供了一种应用了上述数据统计方法的数据统计系统,如图2所示,为本发明实施例一种数据统计系统的示意图,该数据统计系统包括有多个统计终端1和统计服务器2。其中,
[0167]
所述统计终端1可以包括智能手机、台式电脑、平板电脑、笔记本电脑等电子设备中的一种或多种,每个所述统计终端1包括用户真实数据获取模块11和待统计数据生成模块12,如图3所示;其中,所述用户真实数据获取模块11用于接收用户输入的真实数据;所述待统计数据生成模块12用于将用户填写的真实数据与服从特定分布的随机数进行运算,得到待统计数据。所述统计服务器2与多个所述统计终端11连接,例如图2所示,每个统计终端1通过网络(互联网)与统计服务器2通讯连接,实现数据传输;该统计服务器2用于接收统计终端11上传的待统计数据,并根据待统计数据计算待统计数据的均值和方差,进而得到用户真实数据的均值和方差。
[0168]
本发明实施例所述数据统计方法和系统基于同一技术构思,由于方法及系统所解决问题和技术效果的原理相似,因此系统与方法的实施例可以相互参见,重复之处不再赘述。
[0169]
基于同一发明构思,本发明还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,当该计算机指令在计算机上运行时,使得计算机执行前文论述数据统计方法。
[0170]
在一些可能的实施方式中,本技术提供的数据统计方法的各个方面还可以实现为
一种程序产品的形式,其包括程序代码,当程序产品在装置上运行时,程序代码用于使该控制设备执行本说明书上述描述的根据本技术各种示例性实施方式的数据统计方法中的步骤。
[0171]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0172]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0173]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0174]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0175]
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1