相関関係と因果関係

「相関関係は必ずしも因果関係を意味しない」とよく言われていますが、これらの語が必ずしも正しく使われていないケースを見聞きしたので、ちょっとだけ解説します。

まず、「相関関係がある」というのは「相関係数が(ほぼ)0 ではない」という意味ではありません。学校で習う「相関係数」(積率相関係数、Pearson(ピアソン)の相関係数)は、二つの変数の間に直線的な(線形の)相関関係があるかどうかだけを調べるものです。つまり、X が増えれば Y も増える、あるいは X が増えれば Y は減るという傾向があるかどうかを調べるものです。でも、相関関係ということばは、もっと広い意味で使われます。

例えば、人間の作業の能率は、気温によって変わりますが、最適な気温があり、それより低くても高くても能率が落ちます。逆U字型(∩の形)の相関ですね。気温の範囲をうまく選べば、相関係数はほぼ 0 になりますが、それでも相関関係があります。

「相関関係は必ずしも因果関係を意味しない」というときの相関関係は、この意味でとらえなければなりません。

相関関係が因果関係を意味しない場合はいろいろありますが、よく例にあげられるのが、次のような、共通の原因 C が X と Y の両方に影響している場合です。

C
︎↙↘︎
XY

この場合、X と Y に直接の因果関係がないにもかかわらず、相関関係が生じてしまいます。まったく因果関係がないわけではありません。C を含めれば因果関係はあります。でも、直接の因果関係はありません。

これに対して、まったく因果関係がないのに、単なる偶然で相関関係が生じることもありえます。有名な spurious correlations というサイトにある例はたいていが偶然によるものだと考えられます。