ども、やまだです。
前回に続き、今回のテーマは分散分析です。
↓↓こちらのエントリーで分散分析の考え方を解説しました。
本エントリーでは「エクセルを使って実際に分散分析をやってみたい」と思います。
それでは本日もよろしくお願いします。
まずは、ローデータの確認
今回分散分析に使うローデータは、こちらになります。
全国からランダムサンプリング によって抽出された「健常者・精神障害・発達障害」の協力者に対し、他者意識アンケートを実施した結果です。
(もちろん架空データ)
これを使って、属性(健常・精神・発達)によって、他者意識の平均値に統計的な差があるかどうか検定するのです。
平均値と標準偏差を求める
それでは、例のごとく、各グループの平均および標準偏差を求めましょう。
以下のようになります。
これまで標準偏差は
「偏差を求めて、2乗して、それらの総和の平均を求め、さらにその平方根を算出する」
というやり方で求めてきました。
しかし、ここではエクセルの「STDEV.P」関数を使って一気に算出してやりましょう。
計算するとわかりますが、、「偏差を求めて、2乗して、それらの総和の平均を求め、さらにその平方根を算出する」というやり方で求めた値と一致します。
各グループの”群内のズレ”、すなわち平方和を求める
では、精神・発達・健常の「他者意識の平均点」が求められたところで、各グループの群内の平方和を計算します。なぜなら、それこそが、分散分析で必要な「群内のズレ」だからです。
- 「群内の平方和(ズレ)ってなに?」
- 「なぜ群内の平方和(ズレ)を求めるの?」
という方は、↓↓こちらのエントリーを参照
話を戻します。
群内の平方和というのは、これまで散々やってきましたが
- (各データーグループ平均 )の2乗の総和
のことを意味します。
ということは、各グループの分散を求めてその値にデータ数を掛けることで導き出せます。
なぜなら、「平方和の平均=分散」だからです。
ですので、各グループの分散をまずは求めることにしましょう。
分散は、エクセル関数の「VAR.P」を使って算出します。
結果は以下の様になります。
あとは、これらの値(分散)にそれぞれのサンプル数(今回は全グループ「15」)を掛ければ、それが「群内のズレ」ということです。
↓↓こうなりますね
したらば、これらが各属性ごとの「群内のズレ」ということは、これらを全て合算したものが、「全体の群内のズレ」ということになります。
ということで、その結果が赤枠で示した「1310.93」という値です。
次に、群間のズレを求める
「群内のズレ」が求められたところで、お次は「群間のズレ」を計算する必要がありましたね?
この意味がわからないという方は↓↓を参照
「群間のズレ」は言い換えれば、「群間の平方和」ということであり、
つまり、「全体平均と各グループ平均との差の2乗」×サンプルサイズ
を求めろという意味です。
というわけで、全体の列の空欄を埋めましょう。
すると、↓↓こうなります。
ちなみに、サンプルサイズは、「16×3」で「48」です。
これで、準備が整いましたので
- (各グループの平均-全体平均)
- 上記値の2乗
- 2乗した値×サンプル数
の順番で計算を進めます。
すると、下図の赤枠のようになります。
これは、健常者の値なので、同様に、精神障害と発達障害の値も求めるというわけですね。
ということで、以上が、各グループごとの「群間のズレ」ということになりますので、これら3つを合算すると「全体の群間のズレ」ということになります。
その結果が以下です。
これで、「全体の群内のズレ(平方和)」と「全体の群間のズレ(平方和)」が出揃いました。
これで分散分析をすることができます。
ただし、両者の値の正誤を確認しておきます。
つまり、
- 全体の群内のズレ+全体の群間のズレ=全体のズレ(平方和)
と一致しているかを確認するということです。
この意味がわからないという方は↓↓を参照
そのために、まず全体の平方和の値を確認します。
全体の平方和(ズレ)は、「分散×サンプル数」で求めるんでしたね?
- 全体の分散・・・「179.488」
- 全体のサンプル数・・・「45」
なので、「179..488」×「45」を計算し、「8077」という値がえられます。
あとは、全体の群内のズレ+全体の群間のズレ=全体のズレ(平方和)
の値がこ「8077」に一致するかを確かめるだけです。
- 郡内のズレ・・・1310.93
- 群間のズレ・・・6766.04
でこれらを足し合わせると、「8077」になります。
ちゃんと一致してますね?
これで、分散分析をするための材料が揃いましたから、いよいよ次回は、それらを使い
分散分析表というものを作成します。
乞うご期待。
参考書
①p値とは何か
②統計学がわかる
③やさしく学ぶ統計の教科書
④よくわかる心理統計