偏相関係数とは、一体なんなのか?
という疑問については過去記事で解説しましたので、今回は、エクセルを使って、具体的にその値を求める手続きを紹介します。
目次
偏相関係数を求める公式
はじめに、偏相関係数を求める式を以下に示しておきます。
- 偏相関係数=r①-(r②×r③)/√(1-r②×r②)×√(1-r③×r③)
ただ、この公式だけをみて理解できる方はいないと思うので、この公式に到るまでの流れをスモールステップ化すると以下の通りです。
- 各項目の平均を求める
- 各項目の標準偏差を求める
- 各項目の偏差を求める
- 各項目の組み合わせの偏差積を求める
- 組み合わせごとの偏差積の平均を求める
- 組み合わせごとの相関係数を求める
- 偏相関係数の公式の分子を求める
- 偏相関係数の分母の左側を求める
- 偏相関係数の分母の右側を求める
- 偏相関係数を求める
全部で10のステップがあります。「なんだよ細けえな」と思う方もいるかもしれませんが、ご安心ください。「1〜6」の手続きは、「相関係数」を求める手順です。つまり、今回はある程度省きます。
相関係数の求め方がわからないという方は以下を参照ください。
まずは、ローデータの確認
善は急げ、さっそく取り掛かりましょう。ということで、まずはこのエントリーで使うローデータの確認です。相関係数を求める際に使った、「記事数」と「PV数」のデータに「収益」を加えています。
このエントリーでは、、「記事数」と「収益」の偏相関係数を求めます。以下の図で確認してください。
では、先ほどの手順にしたがって、話を進めましょう。
各項目の平均と標準偏差を求める
まずは、こちらの表に「収益の列」を挿入し、「記事数」と「PV数」と同様に、平均と標準偏差を計算います。画像では、すでに計算済みになってます。赤枠の部分ですね。
偏差を計算する
続いては偏差を求めます。相関係数を求めるときに使用した、こちらの表に、赤枠で囲った、「収益」と「偏差③」の欄を加えましょう。
したらば、画像のように、「収益額-平均」をデータごとの偏差を求めます。こちらも詳しくは、相関係数の求め方を参照ください。
偏差積の計算
偏差が計算できたら、続いては偏差積の計算です。
相関係数の時に求めたのは、偏差①と偏差②の積のみでしたから、今回は、①と③、②と③の積を当然ながら求めます。表に2列加えて、表を修正します。
で、こちらも計算すると、こうなります。こちらも詳しくは、相関係数の求め方を参照ください。
偏差積の平均を求める
これで、それぞれの偏差積の平均が求められます。偏差積①と②の平均は、すでに求めてますから、残りは、偏差積①と③の平均、偏差積②と③の平均ですね。赤枠で囲った部分がそれです。赤枠の左側が、偏差積①と③の平均、右側が、偏差積②と③の平均です
それぞれの、相関係数を求める
これで相関係数を求めるための材料が揃いました。
- 記事数と収益の相関係数=138049÷52.9018÷4802.3201で「0.54339」です。
- PV数と収益の相関係数=45776575.2÷16326÷4802.3201で「0.58386458」です。
結果を可視化するとこうなります。これで、「記事数と収益の偏相関係数」を求める準備が整いました。ここからが本番ですよ?
偏相関係数を求める(ここからが本題)
偏相関係数の公式は以下の通りでした。
- 偏相関係数=r①-(r②×r③)/√(1-r②×r②)×√(1-r③×r③)
この公式で示されている「r」は、「相関係数」を意味しますが、以下のように考えてください。
なので、この公式を分解し、以下のように捉えて、1つずつ値を求めてから、最終的に統合して計算することにします。
- 分子・・・r①-(r②×r③)
- 分母の左半分・・・√(1-r②×r②)
- 分母の右半分・・・√(1-r③×r③)
公式の分子を求める
まずは、分子の以下の部分を計算します。
- r①-(r②×r③)
これをしたの図に照らし合わせ、実際に数値を代入すると、こうです。
で、公式通りに計算を行うと、以下のとおり。
- 0.54339-(0.58386458×0.87439)=0.03286
ですので、先ほどの表に、偏相関係数を求めるための公式の「分子」の部分を表に付け加えました。赤枠で示した部分ですね。
公式の、分母の左半分を求める
続いて、分母の左側の計算です。
- √(1-r②×r②)
これが「計算式」なので、ここに数値を代入します。
- √1-(0.58386458×0.58386458)=0.81185
となりますね。先ほど同様に、画像の赤枠で囲った部分です。
公式の、分母の右半分を求める
続いて、分母の右側の計算をします。
- √(1-r③×r③)
これが「計算式」なので、ここに数値を代入して
- √1-(0.87439×0.87439)=0.48522
となるわけです。
偏相関係数を求める
これで、偏相関係数を求めるための、全ての値が揃いましたので、こちらの公式に還元します。
- 偏相関係数=r①-(r②×r③)/√(1-r②×r②)×√(1-r③×r③)
それぞれの値を代入し
- 0.03286÷(0.81185×0.48522)=0.08343
これこそが、「記事数と収益の偏相関係数」ということになりますね。
解釈
では、最後に、ここで求められた「0.08343」という値が、どのような位置付けとなるか確認して締めくくりたいと思います。以下の表をご覧ください。
この相関係数表と照らし合わせると、「0.08343」という値は、「ほとんど相関がない」ということになります。従って、「相関があるように見えていた」のは「みせかけの相関」だったと結論づけることができるわけです。つまり、「記事数」と「収益」になんら関連はないということですね。「記事数を増やせば、収益が伸びる」とお考えのブロガーさんは、ぜひ考えを改めてみてはいかがでしょうか。