NumPy⑨ (不偏分散、不偏標準偏差)

不偏分散、不偏標準偏差

統計的推定や検定を行う場合、母集団を推定する手段として不偏分散や不偏分散から求めた不偏標準偏差が使われます。

分散はデータと平均値の差の2乗(偏差平方)の合計値(偏差平方和)をデータの個数で割って計算しますが、不偏分散は偏差平方和を データの個数-1 で割って計算します。

この場合は、var()関数std()関数の引数として ddof=1 を指定します。

ddof は偏差平方和を割る時の分母(データの個数)から減らす値を指定するためのオプションです。

[Google Colaboratory]

1
2
3
4
5
6
import numpy as np
x = np.array([35, 40, 45, 50, 55, 60], dtype = np.float)

# 不偏分散、不偏標準偏差を求める
print('不偏分散  : ', np.var(x, ddof=1))
print('不偏標準偏差: ', np.std(x, ddof=1))

[実行結果]