seabornによるプロット

R では ggplot2 というライブラリが人気ですが、Python では seaborn(シーボーン)というデータ視覚化ライブラリが人気です。pip install seaborn または conda install seaborn などとしてインストールしておきましょう。seaborn は matplotlib の上で動いているので、いずれにしても matplotlib の設定は必要です。seaborn については Kaggle で Data Visualization という初心者向けの無料講座があるようです。

seaborn 用に用意されているサンプルデータの一覧を見てみましょう:

import seaborn as sns

sns.get_dataset_names()
['anagrams',
 'anscombe',
 'attention',
 'brain_networks',
 'car_crashes',
 'diamonds',
 'dots',
 'exercise',
 'flights',
 'fmri',
 'gammas',
 'geyser',
 'iris',
 'mpg',
 'penguins',
 'planets',
 'taxis',
 'tips',
 'titanic']

seaborn や sns という短縮名は、どうやら Samuel Norman Seaborn から来ているようです(Import seaborn as ??Seaborn - Why import as sns?)。

現時点で19通りのデータがあります。これらは seaborn-data レポジトリからオンデマンドで取ってきて ~/seaborn-data にキャッシュされます。試しに iris データセットを取ってきてみましょう。

iris = sns.load_dataset("iris")

Seaborn の命令一覧は API reference にあります。ペアプロットを描いてみましょう。

sns.pairplot(iris)
Iris

スタイルの設定は次のようにします:

sns.set_style("darkgrid")

スタイルは whitedarkwhitegriddarkgridticks から選びます。