Pandas① (データフレーム)

Pandas

Pandas は、NumPy を拡張してさらに直感的な操作でデータを扱えるようにしたライブラリです。

データフレーム

Pandas には表形式でデータを管理できる データフレーム の機能が備わっています。

データフレーム は行列と同じように縦・横にデータが並ぶ構造をしていますが、数値だけではなく文字列などの任意のデータが扱えます。

また、行列のように 数値の並び を表すのではなく、行と列で構成されたデータ構造を表します。

データフレーム作成

データフレームは、DataFrameメソッド で作成します。

列データを辞書で設定し、複数の列で構成されるデータフレームを作成します。

[Google Colaboratory]

1
2
3
4
5
6
7
8
9
10
11
# 3列×5行のデータフレームを作成する

import pandas as pd
df = pd.DataFrame(
{'A': [10, 20, 30, 40, 50], # 列Aとその値
'B': [0.8, 1.6, 2.4, 4.3, 7.6], # 列Bとその値
'C': [-1, -2.6, -3.5, -4.3, -5.1] }, # 列Cとその値
index = ['row1', 'row2', 'row3', 'row4', 'row5'] # 行名を設定
)

df

データフレーム のデータは、Pythonの 辞書 を使って設定します。

辞書データはそのまま各列のデータになります。

[実行結果]

データフレーム を、Google Colaboratory で表示すると自動的に表形式で表示されます。