スポンサーリンク




代表値とは

代表値とは

心理学を学ぶからというか

しっかり理解しておくと日常的に役に立つことがあるので、

ここでさらっとイメージ作りだけでもしていってください

3分もあれば読めるかと

スポンサーリンク
スポンサーリンク




代表値とは

その名の通り、データを代表する値のことです。

では、彼(代表値のこと)の存在意義は何かと言うと、

膨大なデータ量を1つの数字に圧縮して伝えることできるということ、これに尽きます。

そして、代表値には、平均値・中央値・最頻値という3つの下位分類があり

平均値・中央値・最頻値

これらをデータに応じて使い分けると膨大なデータ量を効果的に人に伝達することが可能となるわけですね。代表値をざっくり説明するとこんな感じです。

データの図表化は重要ですが、たくさんの変数についてデータをとった場合、その1つ1つについていちいち図表化していたら、たくさんの図表を前にした読者は、視覚的に圧倒されてしまうでしょう。また、何よりも図表化止まりですと、分析がそこから先へ進みません。そこで、一般的には、データ全体のもつ情報を1つの値にまとめてしまうことが多いです。このような作業を、数値要約といい、要約された値のことを要約統計量と言います。

引用:よくわかる心理統計,ミネルヴァ書房,p30

意味わかんないことをタラタラ語ってますが、

要は、「すごく大変」ってことですね。

このように、データ同様に言語の「スリム化」ができるようになると文章作りも楽しくなってきますよね。

平均値

ここからは

各代表値について少しだけ深掘りしてみます。

まずは平均値から

平均値とは、収集したデータの総計をデータの個数で割った値です。

例えば、あるテスト結果において、5人の受験者全員が50点をとったとしましょうか。

この場合の平均は、(50+50+50+50+50)÷5で50点ですね

平均値のメリットは、全てのデータを用いるため、統計的な処理に向いている点です。

逆に、欠点は、外れ値の影響を受けやすいことですね。

外れ値とは、収集されたデータの中で、他の値に比べ、極端に大きかったり、小さかったりする値を意味します。

これについても1つ事例を示しましょう。

先ほどのテストで、40点、35点、35点、40点、100点といったスコアが得られたとします。

この場合の平均も50点ですが、先ほどの場合と意味が異なりますね。

なぜなら、平均は50点であるが、平均を超えているのが100点の人間のみだからです。

したがって、この50という値は代表値とするには疑問が残ります。

中央値

続いては、中央値です

中央値とは、データを大小順に並べた際に、中央に位置する値のこと。

例えば、先ほどのテスト結果を並べると

35,35,40,40,100

となるため、中央値は40ということになりますね?

利点としては、平均値と違い、外れ値の影響を受けないことです。

ただし、

欠点も平均値とは異なり、全てのデータを用いない点があげられます。

外れ値の影響を受けないということは、つまり、中央値を除く値の幅が全くわからないということです。

最頻値

最後に、最頻値です。

最頻値とは、1つのデータのうちで最も多く生じた値のこと

最頻値の具体例にも先ほどのテスト結果を用いると、

35点が2人、40点が2人、100点が1人であるため、

最頻値は、35点と40点の2つになります。

あるいは、35点が1人で40点が3人になれば、最頻値は40点です。

最頻値の利点も、中央値同様に外れ値の影響を受けないことです。

欠点は、データが少ない場合や、最頻値がデータの端に位置する場合には代表値として不適切なことです。

例えば、

ストの結果が5点、5点、5点、40点、50点、60点にも関わらず、

代表値が5点では代表値として機能しているとは言い難いですよね?

3つの代表値の使い分け

以上、3つの代表値の特性を踏まえると、第一選択としては、平均値の使用が適切と考えられる。ただし、中央値もしくは、最頻値の使用を検討する。その際、データ全ての値を考慮する最頻値の使用を第二選択とし、最頻値が端によっている様であれば中央値を第三選択として使用するのが良い判断であると考えられる。

スポンサーリンク
スポンサーリンク




スポンサーリンク




シェアする

  • このエントリーをはてなブックマークに追加

フォローする

関連記事

関連記事



AMP用の関連コンテンツ