【機械学習入門】YellowBrickで学習を可視化する方法

機械学習を行った際、学習が上手く行ってるか確認したい場合があります。その際、簡単にパフォーマンスを可視化するライブラリとして「Yellowbrick」があります。

ここでは使用方法をまとめています。

この記事の対象

機械学習に挑戦したい方
精度評価を可視化する方法を知りたい方
学習〜精度評価可視化までの流れを知りたい方

INDEX

Yellowbrickとは
「Yellowbrick」を用いた使用例
1. 多変量データ視覚化(RadViz)
  1. 結果
2. 棒グラフ(Rank 1D)
  1. 結果

Yellowbrickとは

「Yellowbrick」とは機械学習の実行した結果を可視化するライブラリになります。

ちなみに、単純なデータを可視化するライブラリには「Seaborn」というものがあります。Seabornについては以下をご参考下さい。

>>>Seabornを用いたデータ可視化方法-まとめ-

Yellowbrickは、外部ライブラリなので以下の様にpipでインストールしておく必要があります。

$ pip install yellowbrick

「Yellowbrick」を用いた使用例

多変量データ視覚化(RadViz)

from yellowbrick.features.radviz import radviz
from yellowbrick.datasets import load_occupancy

#Load the classification dataset
x, y = load_occupancy()

# Specify the target classes
classes = ["unoccupied", "occupied"]

# Instantiate the visualizer
radviz(X, y, classes=classes)

結果

棒グラフ(Rank 1D)

from yellowbrick.datasets import load_credit
from yellowbrick.features import Rank1D

# Load the credit dataset
X, y = load_credit()

# Instantiate the 1D visualizer with the Shapiro ranking algorithm
visualizer = Rank1D(algorithm='shapiro')

visualizer.fit(X, y)           # Fit the data to the visualizer
visualizer.transform(X)        # Transform the data
visualizer.show()              # Finalize and render the figure