データの分析

代表値

平均値・中央値・最頻値

データの分析の「代表値」を、答えを先に押さえてから理解できる形に整理したページです。「平均値・中央値・最頻値」でつまずきやすい点も含めて、学習の流れを短く確認できます。

数学Ⅰ 約10分 難易度 1

このページのまとめ

先に押さえておくこと

代表値の要点をまとめたページです。先に答えを確認してから、解き方とつまずきやすい点を順にたどれます。

答えの要点

平均値・中央値・最頻値の答えと条件を先に確認できます。

  • テーマ: 平均値・中央値・最頻値
  • ポイント: データの分析の基礎を短く確認しやすく、検索から入ってもそのまま理解まで進めやすい記事です。
  • 次に読むなら: 関連ページ、またはアプリで類題演習

問題

(1)(1)\quad データ 3,5,7,8,123, 5, 7, 8, 12 の平均値と中央値を求めよ。

(2)(2)\quad データ 2,3,3,5,5,5,7,8,10,1002, 3, 3, 5, 5, 5, 7, 8, 10, 100 の平均値と中央値を求めよ。

(3)(3)\quad 3030人の生徒にアンケートを行い、11日の勉強時間(時間)を調べたところ、次の度数分布表を得た。最頻値を求めよ。

勉強時間12345度数(人)351084\large\begin{array}{|c|c|c|c|c|c|} \hline 勉強時間 & 1 & 2 & 3 & 4 & 5 \\ \hline 度数(人) & 3 & 5 & 10 & 8 & 4 \\ \hline \end{array}

答えを見る

(1)  (1)\; 平均値 7\underline{7}、中央値 7\underline{7}

(2)  (2)\; 平均値 14.8\underline{14.8}、中央値 5\underline{5}

(3)  (3)\; 最頻値 3\underline{3}時間

解説

代表値の問題について解説していきます。

代表値って何ですか?

代表値とは、データ全体の特徴を11つの数値で表したものだよ。

代表値にはいくつか種類があるので、それぞれ確認していこう!

それでは問題を解いていきましょう。

(1)(1)\quad データ 3,5,7,8,123, 5, 7, 8, 12 の平均値と中央値を求めよ。

まず平均値を求めます。データの値をすべて足して、個数で割ればOKです。

平均値 =3+5+7+8+125= \frac{3+5+7+8+12}{5}

=355=7= \frac{35}{5} = \underline{7}

次に中央値を求めます。データを大きさの順に並べると、

3,5,7,8,123, 5, \textcolor{red}{7}, 8, 12

データの個数は55個(奇数)なので、真ん中の33番目の値が中央値です。

よって中央値は7\underline{7}です。

この場合は平均値と中央値がたまたま同じ値になったね。

でも、いつも同じになるわけではないよ。次の問題を見てみよう!

(2)(2)\quad データ 2,3,3,5,5,5,7,8,10,1002, 3, 3, 5, 5, 5, 7, 8, 10, 100 の平均値と中央値を求めよ。

まず平均値を求めましょう。

平均値 =2+3+3+5+5+5+7+8+10+10010= \frac{2+3+3+5+5+5+7+8+10+100}{10}

=14810=14.8= \frac{148}{10} = \underline{14.8}

次に中央値を求めます。データはすでに大きさの順に並んでいます。

2,3,3,5,5,5,7,8,10,1002, 3, 3, 5, \textcolor{red}{5, 5}, 7, 8, 10, 100

データの個数は1010個(偶数)なので、真ん中の55番目と66番目の値の平均が中央値です。

5+52=5\frac{5+5}{2} = \underline{5}

あれ?平均値が14.814.8なのに中央値が55って、だいぶ違いますね...?

いいところに気づいたね!この違いは100100という外れ値\textcolor{red}{外れ値}が原因なんだ。

平均値は外れ値の影響を大きく受けるけれど、中央値はほとんど影響を受けないよ。

今回の例では、ほとんどのデータが22から1010の間にあるよね。

中央値55の方が「データの中心」をよく表しているといえるね。

(3)(3)\quad 次の度数分布表から最頻値を求めよ。

勉強時間12345度数(人)351084\large\begin{array}{|c|c|c|c|c|c|} \hline 勉強時間 & 1 & 2 & 3 & 4 & 5 \\ \hline 度数(人) & 3 & 5 & 10 & 8 & 4 \\ \hline \end{array}

最頻値は、最も度数が大きい値です。

度数分布表を見ると、各値の度数は以下のようになっています。

  • 11時間:33
  • 22時間:55
  • 33時間:10\textcolor{red}{10}人 ← 最も多い
  • 44時間:88
  • 55時間:44

度数が最も大きいのは33時間の1010人なので、最頻値は3\underline{3}時間です。

平均値・中央値・最頻値って、どう使い分ければいいんですか?

いい質問だね!状況に応じて使い分けるのがポイントだよ。

平均値は全体を均等に見たいとき、中央値は外れ値がある場合、最頻値は「最も多い値」を知りたいときに使うよ。

このページのまとめ

ここでは代表値(平均値・中央値・最頻値)について学習しました。

平均値は外れ値に敏感で、中央値は外れ値に強いという違いを押さえておきましょう。

問題で「どの代表値が適切か」を聞かれることもあるので、それぞれの特徴を理解しておくことが大切です!

アプリで続ける

この問題の「よくある質問」や「解法の鍵」は、アプリで読めます。

この問題に関するよくある疑問への回答や、解法のポイントをまとめた「解法の鍵」はアプリに収録しています。 類題演習やAIへの質問もアプリから使えます。代表値 に近い内容をそのまま続けられます。

よくある質問 解法の鍵 類題演習 AIに質問

ストアからダウンロードして、同じ単元の演習やAI質問をそのまま続けられます。