やまだです。
「重回帰モデル」というタイトルにちなんで、「モデル」をトップ画にしてみたのですが、伝わったでしょうか?
では、本編に参りましょう。
重回帰モデルとは
重回帰モデルとは、以下の式すなわち、「重回帰式」と「誤差式」を1つにまとめた式のことを言います。そして、重回帰モデルは一般的に「パス図」を使って視覚的に表されます。
- ①予測値=(独立変数①×a)+(独立変数②×b)+ 切片
- ②誤差=従属変数-予測値
では、1つにまとめるとはどういうことか?
まず、この2つの式に共通部分にお気づきのことかと思います。そう「予測値」の部分です。そこで、②の式に注目し、これを次の様に変換してみます。
- ③従属変数=予測値+誤差
そこで、①の式をこの③の式に代入すれば、1つにまとまるというわけです。
- ④従属変数=(独立変数×a)+(独立変数②×b)+ 切片+誤差
この式こそ、「重回帰モデル」だといえます。
パス図
で、冒頭に申し上げた通り、重回帰モデルは一般的に「パス図」を使って視覚的に表されます。パス図では、観測される変数は四角で、誤差を円で描きます。こんな感じですね。
加えて、パス図の独立変数から従属変数に向かって伸びる矢印上に「a」と「b」とありますが、これは「偏回帰係数」を示し、これらが独立変数(食事量・運動量)に乗じられ、そこに切片を加えらた値が、「従属変数(体重)」になることを意味します。ただし、切片は基本パス図では省かれます。
重回帰モデルの「式とパス図」の関係
では、最後に、この図を先ほどの「④の式」と照らし合わせて見ましょう。「④の式」とは以下の式です。
- 従属変数=(独立変数×a)+(独立変数②×b)+ 切片+誤差
で、図はこちらですね。
対応部分は以下の通りです。
- 赤枠の部分→(独立変数×a)+(独立変数②×b)+ 切片
- 青枠の部分→誤差
そして、これらを足したものが、「従属変数」つまり、「体重」になるということを意味するわけですね。
それと、最後に「誤差」に関する注意点です。
重回帰モデルでは、いわば「結果」である従属変数を、その「原因(要因)」とみなせる説明変数で説明しようとするモデルである。そして、「説明変数では説明されずに残った要因」として、誤差が導入され、そこから従属変数にパスが伸びるわけである。
(引用:足立浩平(2006),多変量データ解析法,ナカニシヤ出版)
これは、つまり体重が「運動量」と「食事量」だけでは、説明しきれないということで、例えば、本人の体調や、天候、気温などにもおそらく左右されるものであることを意味してます。
なので、足立氏は以下の様な提案をしてますね。覚えておきましょう。
すなわち、誤差を、文字通りの「誤った差」と見なすのではなく、
誤差=「説明変数では説明しきれずに残った成分」
のように考えるべきである。
(引用:足立浩平(2006),多変量データ解析法,ナカニシヤ出版)
参考書
①多変量データ解析法