Pandasの高度な使い方
Pandasの高度な使い方として、以下のようなテクニックがあります。
これらはデータの前処理、分析、可視化に役立つ機能です。
1. 高度なデータフィルタリング
条件付きのフィルタリングや複数条件のフィルタリングを行うことができます。
1 | import pandas as pd |
[実行結果]
A B
1 20 200
2 30 300
2. `apply`と`lambda`を使ったデータ変換
Pandasのapply関数とlambdaを使ってカスタム関数を適用できます。
1 | import numpy as np |
[実行結果]
A B A_squared B_log
0 10 100 100 4.605170
1 20 200 400 5.298317
2 30 300 900 5.703782
3 40 400 1600 5.991465
3. 時系列データの操作
Pandasは時系列データの操作に強力な機能を提供します。
1 | # サンプルの時系列データの作成 |
[実行結果]
data
date
2023-01-31 39.7
4. `groupby`と`transform`によるデータの変換
groupbyとtransformを組み合わせて、グループごとに変換を行います。
1 | # サンプルデータの作成 |
[実行結果]
A B C B_normalized
0 foo 1 10 -0.707107
1 bar 2 20 -0.707107
2 foo 3 30 0.707107
3 bar 4 40 0.707107
5. `merge`の高度な使い方
複数のキーを使った結合や、結合方法の指定(内部結合、外部結合など)を行います。
1 | # サンプルデータの作成 |
[実行結果]
key1 key2 value_left value_right 0 A 1 10 100 1 B 2 20 200
6. マルチインデックス
マルチインデックスを使って階層的なデータを操作します。
1 | # サンプルデータの作成 |
[実行結果]
value
number
1 10
2 20
7. パイプラインを使ったデータ操作の連鎖
パイプラインを使って複数の操作を連鎖させます。
1 | # サンプルデータの作成 |
[実行結果]
alpha beta C 1 2 20 22 2 3 30 33
8. Window関数
Window関数を使ってローリング計算や移動平均を計算します。
1 | # サンプルデータの作成 |
[実行結果]
A moving_average 0 0 NaN 1 1 NaN 2 2 1.0 3 3 2.0 4 4 3.0 5 5 4.0 6 6 5.0 7 7 6.0 8 8 7.0 9 9 8.0
これらの高度な使い方を活用することで、Pandasを使ったデータ操作や分析がさらに効率的かつ強力になります。



