次元削減
次元削減の例題として、手書き数字の画像データセットであるMNISTを使用して、PCAを用いた次元削減を行う例を示します。
まず、Scikit-learnのデータセットモジュールからMNISTデータセットを読み込みます。
1 | from sklearn.datasets import fetch_openml |
次に、読み込んだデータを正規化します。
1 | from sklearn.preprocessing import MinMaxScaler |
データを正規化した後、PCAを使用して次元削減を行います。
1 | from sklearn.decomposition import PCA |
最後に、次元削減されたデータを可視化します。
1 | import matplotlib.pyplot as plt |
このコードを実行すると、次元削減されたデータを2次元平面上にプロットした散布図が表示されます。
各データポイントは手書き数字を表し、色によって異なる数字が示されます。
[実行結果]
この例では、MNISTデータセットを使用してPCAを適用し、高次元の手書き数字のデータを2次元に削減しました。
削減されたデータを散布図としてプロットすることで、異なる数字のパターンやクラスタを視覚化することができます。