相関、因果、疑似相関

たまにツイッターで相関関係と因果関係のあれこれを見て、イラっと来ることもあるので文書として吐き出してしまう

相関関係

変数xと変数yが互いに連動して動く統計上に現れる関係を指す。
余談だが、いわゆる「比例」と「反比例」も、大概の場合は、それぞれ正の相関と負の相関を指すことが多いのではないか。
ちょっと言いやすく「正相関」「負相関」という言い方を広めれば、数学的には全く比例関係でも反比例関係でもないときに比例/反比例という言い方をやめさせることができるかもしれない。

因果関係

色々と因果関係を定義づける要件はあるのだが、要は物理法則だと最近は考えている。 例えば、鉄球を床に落としたときの破壊力が、落とす直前の鉄球の高さに比例するのはまさに因果関係だが、これは物理法則で説明できる。 気温とアイスクリームの売り上げも長い説明が必要とはいえ物理法則による理論に積み重ねで説明可能だろう。

問題は、我々は物理学者でもないし、マクスウェルの悪魔でもないので、事象Aから事象Bが発生することを物理法則で導出できるかが殆どの場合で不可能なことだろう。では我々は何によって因果関係であるかどうかを感じるのか。答えは「常識」であろう。常識的に考えることで気温の高い夏にアイスクリームがよく売れることは因果関係として説明できるし、逆にアイスクリームが売れたことで台風が発生することは因果関係を否定される。

疑似相関

因果関係が疑似であることを指す言葉なのに、なぜ疑似「相関」なのか、理解に苦しむ単語。
この単語が使われる状況は大概「相関関係があるからと言って因果関係があるとは限らないんですよ~」という衒学的発言のときで、見るたび大変ムカつく。(ああいう頭悪そうな人間が頭良く見せようとする言動がとても嫌い。自己嫌悪と言われれば否定できないが)

そもそも論として、変数xと変数yのグラフをいくらみても因果関係があることを証明するのは不可能に近く、「因果関係ではなく相関関係」というのは意味の無い指摘であろう。どうせ統計を見てるだけではそれらは全て相関関係でしかなく、そんなことは分析に関わる人間は最初から知っていることなのだから。 「因果関係ではなく相関関係」という人たちが指摘するべきはその先で、どうやれば因果関係を採択したり棄却したりできるのかだ。