統計
統計に関する問題をSciPyを使用して解いて、その結果をグラフ化します。
以下は、あるデータセットを使って簡単な統計的な問題を解決し、その結果をグラフ化する例です。
1 | import numpy as np |
このコードは、平均・標準偏差・中央値の計算、データのヒストグラムと正規分布の確率密度関数のグラフ表示を行います。
また、平均と中央値を縦線で示しています。
これにより、データの分布や統計的な特性を視覚化し、計算結果を表示します。
ソースコード解説
以下にソースコードの詳細を説明します。
ライブラリのインポートとサンプルデータの生成
1 | import numpy as np |
numpy
は数値計算を行うためのライブラリです。scipy.stats
からnorm
は正規分布を扱うための統計関数を提供します。matplotlib.pyplot
はグラフ描画ライブラリです。np.random.normal()
は平均が5で標準偏差が2の正規分布から1000個のサンプルデータを生成します。
基本的な統計量の計算
1 | mean = np.mean(data) |
np.mean()
、np.std()
、np.median()
はそれぞれデータの平均、標準偏差、中央値を計算します。
正規分布の確率密度関数の作成
1 | x = np.linspace(np.min(data), np.max(data), 100) |
np.linspace()
はdata
の最小値から最大値までの範囲を100個の等間隔な数値に分割します。
これにより、x
軸の値を作成します。norm.pdf()
は平均と標準偏差を指定して、正規分布の確率密度関数を計算します。
グラフ化
1 | plt.figure(figsize=(10, 6)) |
plt.figure(figsize=(10, 6))
は図のサイズを設定します。plt.hist()
はヒストグラムを描画します。plt.plot()
は正規分布の確率密度関数を描画します。plt.axvline()
は平均と中央値を縦線で表示します。それぞれ緑とオレンジの破線で示されています。plt.title()
、plt.xlabel()
、plt.ylabel()
はそれぞれグラフのタイトルと軸ラベルを設定します。plt.legend()
は凡例を表示し、plt.grid(True)
はグリッドを表示します。plt.show()
はグラフを表示します。
統計量の表示
1 | print(f"平均: {mean}") |
- 最後に、計算された平均、標準偏差、中央値を表示します。