スポンサーリンク




信頼区間とは何か?その意味をわかりやすくまとめてみた

信頼区間 わかりやすく

こんにちは。

統計シリーズのおかげで一気にコンテンツが増加しているやまだです。

過去エントリーでは、「度数分布」と「ヒストグラム」を扱ってきましたが

この記事より新章に入り、「信頼区間」というテーマで進めて行きたいと思います。

それでは、よろしくお願いいたします。

スポンサーリンク
スポンサーリンク




この記事を読むと

今回のエントリーを読むことで

  • 信頼区間って何?
  • 信頼区間ってどういう意味があるのか?

この疑問を解消することができます。

信頼区間とは

おそらく、この定義を読んだだけでわかる人はいないと思うのですが、とりあえずその定義をバシッと示しておきます。

信頼区間とは標本(サンプル)から推定される母集団の推定値の範囲。主に、標本平均が推定したい母平均を含んでいるであろう範囲のことを意味します。

僕ら個人が行う調査は、「推測統計」の考えに基づいて行われます。ですから、標本から得られたデータに基づいて、母集団の性質を推測するわけです。

想像しみてください。

僕らがデータを集めようとしている対象集団、つまり母集団の人数が100万人いたとします。

しかし、その100万人全員から、データを集めようとするのは、現実的ではありません。

ですから、その100万人のうちから一部、ここでは、「100人」として、その100人から集めたデータに基づいて「100万人(母集団)」の特性を推測しようという取り組みをするわけです。

これが「推測統計」ですね。

で、この推測統計で予測される「母集団の特性」というのは、「母集団の平均値」が通常扱われます。

話がわかりづらいと思うので、もう少し具体的に考えてみましょう。

コロナウイルスの陽性患者数

例えば、最近話題になっているコロナウイルスを扱って考えましょうか。

以下は、4月1日現在、厚生労働省において出されている都道府県ごとのコロナ陽性者数をエクセルにまとめたもの一部です。

信頼区間 わかりやすく1

つまり、日本全国を母集団と考えようということです。

で、この母集団から標本(サンプル)として5つの都道府県を無作為抽出し、そのサンプルから患者数の「平均」を求め、それによって、母集団、つまり、「日本全国におけるコロナ感染者の平均」を予測します。

標本(サンプル)の抽出

で、47都道府県からサンプルとして5都道府県抽出した、その平均、分散標準偏差を求めたのが以下です。

信頼区間 わかりやすく2

で、信頼区間を出すのは、サンプルの平均から母集団の平均を予測するためです。

ですから、信頼区間を求めるためには、「平均値」と「標準偏差」が必要になります。

ただし、ここで話していることは「信頼区間の意味」というイメージづくりをしているにすぎないので、厳密にいうと、計算が異なります。

つまり、ここでは話を簡略化しているということです。

で、そういった前提のもと、話を戻します。

このサンプルでは、

  • 平均・・・・27
  • 標準偏差・・・22

という値が求められました。

これらを用いて、母集団の平均を予測すると、どうなるでしょうか?

例えば、平均値を使って、母集団の平均値を「27」です!

ということができるでしょうか?

結論を言うとできます。

しかし、考えて見てください。これはあくまで、予測です。競馬でいったら、「単勝」ですよ?危険すぎます。

ですから、統計学では、その予測に幅を持たせるわけです。競馬でいえば、「複勝」狙いをするわけです。これで、母集団の平均が「○○です」と予想が当たる可能性をあげるわけです。

そのために、データのばらつき、つまり「標準偏差」を使うわけです。すると「27±22」の範囲に母集団が含まれると言うことなので、「5〜49」の範囲に母集団の平均が含まれると考えるわけです。(繰り返しますが、実際はもう少し異なります。とにかくイメージです

で、実際にこの母集団の平均を調べると「44.83」となりましたので、「5〜49」という範囲に含まれていましたよね?信頼区間とはこのように用いられます。

ですから、この「5〜49」のことを「信頼区間」というわけで、標本から得られた「平均」と「ばらつき」に基づいて予測される、母集団の「平均」を含むであろう範囲ということになります。

ちなみに、「信頼区間」という言葉を使うときは、「95%信頼区間」というような表現をしたりしますが、それはつまり、母集団から100回サンプルを取り出して、そのそれぞれにおいて信頼区間を求めたとき、

95回は、母集団の平均を含むであろうことを意味しています。

つまり、「100回中5回は、母集団の平均を含まないであろうこともある」ということです。

下図でいうと、標本④がそれにあたります。

信頼区間 わかりやすく3

この場合は、「偶然では起きるはずでないことが起きた」、つまり「何かしらの意味がある」と統計では考えるのですが、それについは別エントリーに譲りましょう。

参考書

①p値とは何か

②統計学がわかる

③やさしく学ぶ統計の教科書

④よくわかる心理統計

スポンサーリンク
スポンサーリンク




スポンサーリンク




シェアする

  • このエントリーをはてなブックマークに追加

フォローする

関連記事

関連記事



AMP用の関連コンテンツ


Notice: Undefined index: codoc_script_tag_attributes in /home/users/1/main.jp-5015863796e13821/web/human-relations/wordpress/wp-content/plugins/codoc/class-codoc.php on line 133