方差 百科内容来自于: 百度百科

方差是各个数据与平均数之差的平方的和的平均数,用字母D表示。在概率论和数理统计中,方差(英文Variance)用来度量随机变量和其数学期望(即均值)之间的偏离程度。在许多实际问题中,研究随机变量和均值之间的偏离程度有着重要意义。

概述

如下面的例子:
已知某零件的真实长度为a,现用甲、乙两台仪器各测量10次,将测量结果X用坐标上的点表示如图:
甲仪器测量结果:
乙仪器测量结果:
两台仪器的测量结果的均值都是 a 。但是用上述结果评价一下两台仪器的优劣,很明显,我们会认为乙仪器的性能更好,因为乙仪器的测量结果集中在均值附近。
由此可见,研究随机变量与其均值的偏离程度是十分必要的。那么,用怎样的量去度量这个偏离程度呢?容易看到E[|X-E[X]|]能度量随机变量与其均值E(X)的偏离程度。但由于上式带有绝对值,运算不方便,通常用量E[(X-E[X]) 2] 这一数字特征就是方差。一般在计算式用下面公式进行计算
D(X)=E(X 2)-[E(X)] 2
方差不只是为了取正值,它有很直接的意义,源自勾股定理。以典型的随机散步为例:醉汉每步的长度为 X i,以(x i, y i)表示,有x i 2 + y i 2= X i 2。走了N步时距离起始点的距离为 X, 则 X 2 = ∑ (x i 2+ y i 2) = ∑ X i 2,这正是方差。若每步的距离相等,都是单位距离,则方差 X 2 = ∑ X i 2 = N ,非常简单!

公式

方差

方差

方差是实际值与期望值之差平方的期望值,而标准差是方差算术平方根。 在实际计算中,我们用以下公式计算方差。
方差是各个数据与平均数之差的平方的和的平均数,即
,其中,x_表示样本的平均数,n表示样本的数量,xn表示个体,而s^2就表示方差。
而当用
作为样本X的方差的估计时,发现其数学期望并不是X的方差,而是X方差的
倍,
的数学期望才是X的方差,用它作为X的方差的估计具有“无偏性”,所以我们总是用
来估计X的方差,并且把它叫做“样本方差”。
方差,通俗点讲,就是和中心偏离的程度!用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差。记作S 2。 在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定。

定义

基本定义

设X是一个随机变量,若E{[X-E(X)] 2}存在,则称E{[X-E(X)] 2}为X的方差,记为D(X),Var(X)或DX。
即D(X)=E{[X-E(X)] 2}称为方差,而σ(X)=D(X) 0.5(与X有相同的量纲)称为 标准差(或均方差。即用来衡量一组数据的离散程度的统计量
方差刻画了随机变量的取值对于其数学期望的离散程度。(标准差.方差越大,离散程度越大。否则,反之)
若X的取值比较集中,则方差D(X)较小,
若X的取值比较分散,则方差D(X)较大。
因此,D(X)是刻画X取值分散程度的一个量,它是衡量取值分散程度的一个尺度。

数据波动

当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;当数据分布比较集中时,各个数据与平均数的差的平方和较小。因此方差越大,数据的波动越大;方差越小,数据的波动就越小。

计算

定义知,方差是随机变量 X 的函数
g(X)=[X-E(X)] 2 p i
数学期望。即:
由方差的定义可以得到以下常用计算公式:
D(X)=∑xi2pi-E(x)2
D(X)=∑(x i 2p i+E(X) 2p i-2x ip iE(X))
=∑x i 2p i+∑E(X) 2p i-2E(X)∑x ip i
=∑x i 2p i+E(X) 2-2E(X) 2
=∑xi2pi-E(x)2
方差其实就是标准差的平方。

重要性质

周期方差曲线

周期方差曲线

(1)设c是常数,则D(c)=0。
(2)设X是随机变量,c是常数,则有D(cX)=c 2D(X)。
(3)设 X 与 Y 是两个随机变量,则
D(X+Y)= D(X)+D(Y)+2Cov(X,Y)
D(X -Y)= D(X)+D(Y)-2Cov(X,Y)
特别的,当X,Y是两个不相关的随机变量则
D(X+Y)=D(X)+D(Y),D(X-Y)=D(X)+D(Y),
此性质可以推广到有限多个两两不相关的随机变量之和的情况。
(4)D(X)=0的充分必要条件是X以概率为1取常数值c,即X=c,a.s.其中E(X)=c。
(5)D(aX+bY)=a 2DX+b 2DY+2abCov(X,Y)。

随机变量

半方差图

半方差图

期望和方差求解公式
随机变量X。
X服从(0-1)分布,则E(X)=p D(X)=p(1-p)
X服从泊松分布,即X~ π(λ),则 E(X)= λ,D(X)= λ
X服从均匀分布,即X~U(a,b ),
,
X服从指数分布,即X~e(λ), E(X)= 1/λ,D(X)= 1/λ 2
X服从二项分布,即X~B(n,p),则E(x)=np, D(X)=np(1-p)
X 服从正态分布,即X~N(μ,σ 2), 则E(x)=μ, D(X)=σ 2
X 服从标准正态分布,即X~N(0,1), 则E(x)=0, D(X)=1
随机变量求方差的通用公式,即D(X)=E(X 2)-[E(X)] 2

统计学

概念

样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差
n-1

n-1

样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。
方差和标准差。方差和标准差是测算离散趋势最重要、最常用的指标。方差是各变量值与其均值离差平方的平均数,它是测算数值型数据离散程度的最重要的方法。标准差为方差的算术平方根,用S²表示。方差相应的计算公式为
标准差与方差不同的是,标准差和变量的计算单位相同,比方差清楚,因此很多时候我们分析的时候更多的使用的是标准差。

高考实例

(甘肃省,2002年)某校初三年级甲、乙两班举行电脑汉字输入速度比赛,两个班参加比赛的学生每分钟输入汉字的个数,经统计和计算后结果如下表所示:
班级 参加人数 平均字数 中位数 方差
55
135
149
191
55
135
151
110
有一位同学根据上表得出如下结论:
①甲、乙两班学生的平均水平相同
②乙班优秀的人数比甲班优秀的人数多(每分钟输入汉字达150个以上为优秀)
③甲班学生比赛成绩的波动比乙班学生比赛成绩的波动大。上述结论正确的是________(填序号)。
解:填①、②、③,
解:甲乙的平均数相同,所以①甲、乙两班学生的平均水平相同.根据中位数可知乙的中位数大,所以②乙班优秀的人数比甲班优秀的人数多。第三题,根据方差数据可知,方差越大波动越大,反之越小,所以甲班学生比赛成绩的波动比乙班学生比赛成绩的波动大。
故填:①②③.
点评:本题考查统计知识中的中位数、平均数和方差的意义。要知道平均数和中位数反映的是数据的集中趋势,方差反映的是离散程度。
极差与方差
极差 不能用作比较,单位不同 ; 方差能用作比较, 因为都是个比率
$firstVoiceSent
- 来自原声例句
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定
小调查
请问您想要如何调整此模块?

感谢您的反馈,我们会尽快进行适当修改!
进来说说原因吧 确定