返回 我的研究方向(Research Interests)


样本方差\(S^2\)

\[S^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i-\bar{x} )^2
\]

样本均值 \(\bar{x}\) 总位于样本中部,它是总体期望 \(\mu\) 的无偏估计。
各个数据 \(x_i\)\(\bar{x}\) 的偏差 \(x_i – \bar{x}\) 可正可负,其和恒为零,即

\[\sum_{i=1}^{n}(x_i-\bar{x} ) =0
\]

由于各个偏差之和恒为零,所以样本偏差之和不能把偏差积累起来,不能用来度量样本散布大小。

偏差平方和\(Q\)

\[Q = \sum_{i=1}^{n}(x_i-\bar{x} )^2
\]

偏差平方和 Q 可以把 n 个偏差积累起来,用于度量 n 个数据的散布大小。
记住:在样本量相等情况下,利用偏差平方和大小可以比较出样本散布的大小。

例如:
比较下面两个样本的散布大小:
image
样本一:
样本均值:

\[\frac{3+4+5+6+7}{5} =5
\]

偏差平方和:

\[Q_1 = (3-5)^2+(4-5)^2+(5-5)^2+(6-5)^2+(7-5)^2 = 2^2+1^2+0^2+1^2+2^2 =10
\]

样本二:
样本均值:

\[\frac{1+3+5+7+9}{5} =5
\]

偏差平方和:

\[Q_2 = (1-5)^2+(3-5)^2+(5-5)^2+(7-5)^2+(9-5)^2 = 4^2+2^2+0^2+2^2+4^2 =40
\]

直观上就可以看出,样本二比样本一分散(或者说样本一比样本二集中),其偏差平方和大小与这个直观感觉是一致的。
可见,在样本量相等的情况下,利用偏差平方和大小可以比较出样本散布的大小。

平均平方差和\(S_{n}^{2}\)

在样本量不同的场合,偏差平方和 \(Q\) 失去比较样本散布大小的公平性,因为样本量大的偏差平方和倾向偏大一些。
为了消除样本量大小对偏差平方和的干扰,改用平均偏差平方和 \(S_{n}^{2}\) 来度量样本散布大小,
其计算公式如下:

\[S_{n}^{2} = \frac{Q}{n} =\frac{1}{n} \sum_{i=1}^{n}(x_i-\bar{x} )^2
\]

它表示每个样本点上平均有多少偏差平方和,这就可在样本量不同场合下比较其散布大小。

例如:
比较下面两个样本的散布大小:
image
样本三:
样本均值:

\[\frac{1+5+9}{3} =5
\]

偏差平方和:

\[Q_3 = (1-5)^2+(5-5)^2+(9-5)^2 = 4^2+0^2+4^2 =32
\]

样本四:
样本均值:

\[\frac{1+2+3+4+5+6+7+8+9}{9} =5
\]

偏差平方和:

\[Q_4 = (1-5)^2+(2-5)^2+(3-5)^2+(4-5)^2+(5-5)^2+(6-5)^2+(7-5)^2+(8-5)^2+(9-5)^2 = 4^2+3^2+2^2+1^2+0^2+1^2+2^2+3^2+4^2 =60
\]

若仅从偏差平方和看,\(Q_4\)>\(Q_3\),但是“样本四比样本三更分散显然是不对的”,\(Q_4\)比较大的原因是样本四样本量是样本三样本量的3倍。所以两者不可比较。
为了消除样本量大小的干扰,改用 平均偏差平方和 \(S_{n}^{2}\) 即可:
样本三:

\[S_{n}^{2} =\frac{Q_3}{3}=\frac{32}{3} ≈ 10.67
\]

样本四:

\[S_{n}^{2} =\frac{Q_4}{9}=\frac{60}{9} ≈ 6.67
\]

所以从 平均偏差平方和 \(S_{n}^{2}\) 可以看出,样本三更分散一些,计算结果符合直观。

实际中 \(S_{n}^{2}\) 也被用来做 总体方差 \(σ^2\) 的估计,简称 \(S_{n}^{2}\) 为样本方差

\(S_{}^{2}=\frac{1}{n-1} \sum_{i=1}^{n}(x_i-\bar{x} )^2\)\(S_{n}^{2}=\frac{1}{n} \sum_{i=1}^{n}(x_i-\bar{x} )^2\) 都是平均偏差平方和,都称为样本方差。
但是\(S_{}^{2}\)用自由度(n-1)作平均,是无偏的样本方差
后者\(S_{n}^{2}\)用自由度(n)作平均,是有偏的样本方差

样本容量n很大的情况下两者相差无几,可以忽略不计,但是在小样本场合,\(S_{}^{2}\)明显优于\(S_{n}^{2}\)。因此大多数统计学家和实际工作者更愿意使用\(S_{}^{2}\)去计算方差。

版权声明:本文为yanFlyBlog原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/yanFlyBlog/articles/15105336.html