Pandas⑨ (基本統計量/一括)

基本統計量(一括)

Pnadasdescribeメソッド を使うと、以下の 基本統計量 をまとめて算出できます。

  • データの個数
  • 平均値
  • 最大値と最小値
  • 標準偏差
  • 第1四分位数(25%)
  • 第2四分位数(50%)
  • 第3四分位数(75%)

[Google Colaboratory]

1
2
3
4
import pandas as pd
df = pd.read_csv('data1.csv') # CSVファイルの読み込み

df.describe() # 基本統計量

[実行結果]

データを値の大きさの順に並べて4等分したとき、区切り位置にある値が 四分位数 です。

第1四分位数(25%)は4等分した最下位の区切りの値、第2四分位数(50%)はその次の区切り位置(真ん中)になります。

第3四分位数(75%)は最上位の区切り位置です。