分類の検証を行う場合に、データ全体を何分割かして分割した回数分検証を行う方法です。
例えば5分割の場合、学習データを8割、検証データを2割に分割して検証し、さらに検証データをかえて実行・・・・といった感じに5回検証を行います。
[アヤメのデータをダウンロード]
1 | !wget https://raw.githubusercontent.com/pandas-dev/pandas/master/pandas/tests/data/iris.csv |
[5分割でクロスバリデーション実行]
1 | import pandas as pd |
[出力結果]
1 | 各正解率 [0.96666667 1. 0.96666667 0.96666667 1. ] |
5回分の検証結果が96%~100%、平均正解率も98%以上なので十分実用性がある・・・ということになると思います。。
(Google Colaboratoryで動作確認しています。)