偏相関係数とは、偏相関を示した値のことです。
そして、偏相関とは、変数Aと変数Bの相関から、変数Xの影響を取り除いた相関のことを言います。
はい。
わかります。あなたの言いたいこと。
全然わかりませんよね。
なので、具体例を説明します。
偏相関の具体的な考え方
例えば、次のような仮説があったとします。
- 「食事量と月収には相関がある」
そして、この仮説に基づいて、相関係数を求めたら「0.31」になったとします。
これをイメージ化すると、こんな感じですね。
この「0.31」という値を相関係数表に当てはめると、どういう解釈になるでしょうか?「弱い相関がある」ということになります。
しかし、どうでしょうか?
あなたは、本当にこの2つの変数に相関があると思いますか?
相関があるということは、「食事量が多いほど、月収も増える」、あるいは「月収が増えるほど、食事量も増える」ということですよ?
本当にそうでしょうか?
理由は、「月収」が多ければ、「量より質」と言うことで「高級レストランに行く」という人もいるでしょうし、「食事より、ブランド品」、「食事より、旅行」という人もいるわけです。
みかけの相関
ということは、この相関は、「みかけの相関」と言うことで、実は、この2つの変数に影響を与えている変数があるのかもしれないと考えられるのです。それを可視化するとこんな感じになります。
このように、食事量(変数A)と月収(変数B)に影響を与えている変数Xがあると仮定します。つまり、「食事量と月収の見かけの相関」はこの「変数X」によるものだということです。
しかし、これはあくまでも「仮定」ですから、その検証をするためには「変数X」の影響を取り除いた上で、「食事量と月収の相関係数」を理解する必要があります。この値が、もし小さくなれば、仮説通り、「見かけの相関」と言うことになりますし、そうでなければ「相関がある」と結論付けることができるというわけです。
見かけの相関かどうかを見抜くには
では、この「変数X」に該当する要因は一体何でしょうか?
ここではひとまず、「仕事量」ということにしておきます。仕事量が増えれば、「月収」は「成果に応じて増える」ことが見込まれますし、「食事量」も豆腐メンタルでなければ、お腹が減るので増えると考えられるからです。ということで、変数Xにこの「仕事量」を迎え入れて、相関係数を求めたところ次のようになったとしましょう。
- 「仕事量と食事量の相関係数」・・・・・0.56(中程度の相関)
- 「仕事量と月収の相関係数」・・・・・0.42(中程度の相関)
これはつまり、食事量も、月収も「仕事量の影響を受けている」ということになりますね(架空の話ですが)。であれば、「食事量と月収の純粋な相関」をみるためには、「仕事量の影響」を除外する必要があると言うことです。
これが、偏相関
これはわかりづらいかもしれませんが、「赤枠の部分の影響」を除外すると言うことです。
そして、このように「食事量と月収の相関から、仕事量の影響を取り除いたもの」を偏相関と呼びます。つまり、このエントリーの当初に求めた「0.31」と言う「食事量と月収の相関係数」は「赤枠の部分の影響」を含んだ上での「相関係数」だったと言うことになります。よって、「純粋な食事量と月収の相関係数」ではなかったということになりますね。
これが、偏相関とは、変数A(食事量)変数B(月収)の相関から、変数X(仕事量)の影響を取り除いた相関のことだと言った意味です。
偏相関係数
で、仮にですよ?
仮に、「仕事量の影響を排除した、食事量と月収の相関係数」が「0.18」とかだったとします。
そうなれば、この値の意味は「ほとんど相関がない」ということになります。
そして、この「0.18」という値こそが「相関係数」なのです。