数据离散程度的指标——标准差

mac2024-04-14  46

标准差(Standard Deviation)

标准差,在概率统计中最常使用作为统计分布程度(statisticaldispersion)上的测量。反应组内个体间的离散程度。

标准差的计算(Calculation of standard deviation)

标准差的计算公式为: σ = 1 N ∑ i = 1 N ( x i − μ ) 2 \sigma=\sqrt{\frac{1}{N} \sum_{i=1}^{N}\left(x_{i}-\mu\right)^{2}} σ=N1i=1N(xiμ)2

举个例子:农场种植的某种水稻,连续6年的年平均产量如下(单位:500g):

品种第一年第二年第三年第四年第五年第六年产量900920900850910920

第一步:计算均值 用希腊字母μ表示水稻产量的均值 μ = x 1 + x 2 + x 3 + x 4 + x 5 + x 6 6 \mu=\frac{x_{1}+x_{2}+x_{3}+x_{4}+x_{5}+x_{6}}{6} μ=6x1+x2+x3+x4+x5+x6 第二步:计算每年产量与均值的差,并将结果平方 ( x 1 − μ 1 ) 2 \left(x_{1}-\mu_{1}\right)^{2} (x1μ1)2 ( x 2 − μ ) 2 \left(x_{2}-\mu\right)^{2} (x2μ)2 ( x 3 − μ 1 ) 2 \left(x_{3}-\mu_{1}\right)^{2} (x3μ1)2 ( x 4 − μ 1 ) 2 \left(x_{4}-\mu_{1}\right)^{2} (x4μ1)2 ( x 5 − μ 1 ) 2 \left(x_{5}-\mu_{1}\right)^{2} (x5μ1)2 ( x 6 − μ 1 ) 2 \left(x_{6}-\mu_{1}\right)^{2} (x6μ1)2 第三步:计算将差值平方后的均值 1 N [ ( x 1 − μ ) 2 + ( x 2 − μ ) 2 + ( x 3 − μ ) 2 + ( x 4 − μ ) 2 + ( x 5 − μ ) 2 + ( x 6 − μ ) 2 ] \frac{1}{N}\left[\left(x_{1}-\mu\right)^{2}+\left(x_{2}-\mu\right)^{2}+\left(x_{3}-\mu\right)^{2}+\left(x_{4}-\mu\right)^{2}+\left(x_{5}-\mu\right)^{2}+\left(x_{6}-\mu\right)^{2}\right] N1[(x1μ)2+(x2μ)2+(x3μ)2+(x4μ)2+(x5μ)2+(x6μ)2] 第四步:将结果开平方 1 N [ ( x 1 − μ ) 2 + ( x 2 − μ ) 2 + ( x 3 − μ ) 2 + ( x 4 − μ ) 2 + ( x 5 − μ ) 2 + ( x 6 − μ ) 2 ] \sqrt{\frac{1}{N}\left[\left(x_{1}-\mu\right)^{2}+\left(x_{2}-\mu\right)^{2}+\left(x_{3}-\mu\right)^{2}+\left(x_{4}-\mu\right)^{2}+\left(x_{5}-\mu\right)^{2}+\left(x_{6}-\mu\right)^{2}\right]} N1[(x1μ)2+(x2μ)2+(x3μ)2+(x4μ)2+(x5μ)2+(x6μ)2]

DONE!

且慢…还有

样本标准差

有时候我们的数据只是庞大的数据中心的一个样本 这种情况下仍可以计算标准差。 但我们用样本数据来对整个数据的情况进行估算,对样本数据的标准差计算公式做一些调整 s = 1 N − 1 ∑ i = 1 N ( x i − x ˉ ) 2 s=\sqrt{\frac{1}{N-1} \sum_{i=1}^{N}\left(x_{i}-\bar{x}\right)^{2}} s=N11i=1N(xixˉ)2 最重要的变化是将最上面的公式中的N换成了N-1,N-1的使用被称为“贝塞尔校正”。

Why Take a Sample? 为什么要抽样计算? Mostly because it is easier and cheaper. 主要是因为抽样计算的方式比较简单,成本更低一些。

但是当我们做采样统计的时候,我们就会损失一些数据的精确性。
最新回复(0)