R では ggplot2 というライブラリが人気ですが、Python では seaborn(シーボーン)というデータ視覚化ライブラリが人気です。pip install seaborn
または conda install seaborn
などとしてインストールしておきましょう。seaborn は matplotlib の上で動いているので、いずれにしても matplotlib の設定は必要です。seaborn については Kaggle で Data Visualization という初心者向けの無料講座があるようです。
seaborn 用に用意されているサンプルデータの一覧を見てみましょう:
import seaborn as sns sns.get_dataset_names()
['anagrams', 'anscombe', 'attention', 'brain_networks', 'car_crashes', 'diamonds', 'dots', 'exercise', 'flights', 'fmri', 'gammas', 'geyser', 'iris', 'mpg', 'penguins', 'planets', 'taxis', 'tips', 'titanic']
seaborn や sns という短縮名は、どうやら Samuel Norman Seaborn から来ているようです(Import seaborn as ??、Seaborn - Why import as sns?)。
現時点で19通りのデータがあります。これらは seaborn-data レポジトリからオンデマンドで取ってきて ~/seaborn-data にキャッシュされます。試しに iris データセットを取ってきてみましょう。
iris = sns.load_dataset("iris")
Seaborn の命令一覧は API reference にあります。ペアプロットを描いてみましょう。
sns.pairplot(iris)
スタイルの設定は次のようにします:
sns.set_style("darkgrid")
スタイルは white
、dark
、whitegrid
、darkgrid
、ticks
から選びます。