データの分析

分散・標準偏差

公式の使い分けとデータの散らばり

データの分析の「分散・標準偏差」を、答えを先に押さえてから理解できる形に整理したページです。「公式の使い分けとデータの散らばり」でつまずきやすい点も含めて、学習の流れを短く確認できます。

数学Ⅰ 約16分 難易度 2

このページのまとめ

先に押さえておくこと

分散・標準偏差の要点をまとめたページです。先に答えを確認してから、解き方とつまずきやすい点を順にたどれます。

答えの要点

公式の使い分けとデータの散らばりの答えと条件を先に確認できます。

  • テーマ: 公式の使い分けとデータの散らばり
  • ポイント: データの分析の基礎を短く確認しやすく、検索から入ってもそのまま理解まで進めやすい記事です。
  • 次に読むなら: 関連ページ、またはアプリで類題演習

問題

次のデータについて、以下の問いに答えよ。

データAA3,5,6,8,83, 5, 6, 8, 8

データBB2,4,6,8,102, 4, 6, 8, 10

(1)(1)\quad データAAの平均値xˉ\bar{x}、分散s2s^2、標準偏差ssを求めよ。

(2)(2)\quad データBBの平均値xˉ\bar{x}、分散s2s^2、標準偏差ssを求めよ。

(3)(3)\quad データAAとデータBBの平均値を比較し、どちらのデータの方が散らばりが大きいか答えよ。

答えを見る

(1)  (1)\; 平均値xˉ=6\bar{x}=\underline{6}、分散s2=185s^2=\underline{\frac{18}{5}}、標準偏差s=3105s=\underline{\frac{3\sqrt{10}}{5}}

(2)  (2)\; 平均値xˉ=6\bar{x}=\underline{6}、分散s2=8s^2=\underline{8}、標準偏差s=22s=\underline{2\sqrt{2}}

(3)  (3)\; 平均値はどちらも66で等しいが、分散(標準偏差)はデータBBの方が大きいので、データBの方が散らばりが大きい\underline{\text{データ}B\text{の方が散らばりが大きい}}

解説

分散と標準偏差の問題について解説します。

まず、分散と標準偏差の定義と公式を確認しましょう。

偏差の2乗の平均って、どういう意味があるんですか?

偏差は「平均値からどれだけ離れているか」を表しているんだ。

ただ、偏差をそのまま足すとプラスとマイナスが打ち消し合って00になるんだよ。

だから2乗して全部プラスにしてから平均を取るんだ。これが分散だよ。

それでは問題を解いていきましょう。

(1)(1)\quad データAA3,5,6,8,83, 5, 6, 8, 8 の平均値、分散、標準偏差を求めよ。

まず平均値を求めて、それから分散を計算しよう。

ここでは「偏差の2乗の平均」と「x2(xˉ)2\overline{x^2}-(\bar{x})^2」の両方の方法でやってみるね。

まず平均値を求めます。

xˉ=3+5+6+8+85=305=6\bar{x} = \frac{3+5+6+8+8}{5} = \frac{30}{5} = 6
方法1:偏差の2乗の平均\textbf{方法1:偏差の2乗の平均}

各データの偏差(xixˉx_i - \bar{x})を計算します。

36=3,56=1,66=0,86=2,86=23-6=-3,\quad 5-6=-1,\quad 6-6=0,\quad 8-6=2,\quad 8-6=2

偏差の2乗の平均が分散です。

s2=(3)2+(1)2+02+22+225s^2 = \frac{(-3)^2+(-1)^2+0^2+2^2+2^2}{5}
=9+1+0+4+45=185= \frac{9+1+0+4+4}{5} = \frac{18}{5}
方法2:x2(xˉ)2\textbf{方法2:}\overline{x^2}-(\bar{x})^2

2乗の平均を計算します。

x2=32+52+62+82+825\overline{x^2} = \frac{3^2+5^2+6^2+8^2+8^2}{5}
=9+25+36+64+645=1985= \frac{9+25+36+64+64}{5} = \frac{198}{5}

平均の2乗は xˉ2=62=36\bar{x}^2 = 6^2 = 36 なので、

s2=x2(xˉ)2=198536=1981805=185s^2 = \overline{x^2} - (\bar{x})^2 = \frac{198}{5} - 36 = \frac{198-180}{5} = \frac{18}{5}

どちらの方法でも同じ答えになりました!

その通り!検算にもなるから、余裕があれば両方やってみるのがオススメだよ。

標準偏差は分散の正の平方根なので、

s=185=185=325=32×55=3105s = \sqrt{\frac{18}{5}} = \frac{\sqrt{18}}{\sqrt{5}} = \frac{3\sqrt{2}}{\sqrt{5}} = \frac{3\sqrt{2} \times \sqrt{5}}{5} = \frac{3\sqrt{10}}{5}

よって、xˉ=6,  s2=185,  s=3105\underline{\bar{x}=6,\; s^2=\frac{18}{5},\; s=\frac{3\sqrt{10}}{5}} です。

(2)(2)\quad データBB2,4,6,8,102, 4, 6, 8, 10 の平均値、分散、標準偏差を求めよ。

同じように計算していきます。

平均値は、

xˉ=2+4+6+8+105=305=6\bar{x} = \frac{2+4+6+8+10}{5} = \frac{30}{5} = 6

ここでは「x2(xˉ)2\overline{x^2}-(\bar{x})^2」の公式で求めてみましょう。

x2=22+42+62+82+1025\overline{x^2} = \frac{2^2+4^2+6^2+8^2+10^2}{5}
=4+16+36+64+1005=2205=44= \frac{4+16+36+64+100}{5} = \frac{220}{5} = 44
s2=x2(xˉ)2=4436=8s^2 = \overline{x^2} - (\bar{x})^2 = 44 - 36 = 8

標準偏差は、

s=8=22s = \sqrt{8} = 2\sqrt{2}

よって、xˉ=6,  s2=8,  s=22\underline{\bar{x}=6,\; s^2=8,\; s=2\sqrt{2}} です。

(3)(3)\quad データAAとデータBBの平均値を比較し、どちらのデータの方が散らばりが大きいか答えよ。

2つのデータの結果をまとめて比較してみよう。

平均値  xˉ分散  s2標準偏差  sデータA6185=3.631051.90データB68222.83\begin{array}{|c|c|c|c|} \hline & \text{平均値}\;\bar{x} & \text{分散}\;s^2 & \text{標準偏差}\;s \\ \hline \text{データ}A & 6 & \frac{18}{5}=3.6 & \frac{3\sqrt{10}}{5}\approx 1.90 \\ \hline \text{データ}B & 6 & 8 & 2\sqrt{2}\approx 2.83 \\ \hline \end{array}

平均値はどちらも66で同じですが、分散はデータAA185=3.6\frac{18}{5}=3.6、データBB88です。

平均値が同じでも、散らばりが全然違うんですね!

そうなんだ。平均値だけではデータの特徴はわからない。

分散や標準偏差を見ることで、データがどれだけ平均値の周りに散らばっているかがわかるんだよ。

データBB2,4,6,8,102, 4, 6, 8, 10と等間隔に広がっているのに対し、データAA3,5,6,8,83, 5, 6, 8, 8と平均値66の近くに比較的集まっています。

この違いが分散・標準偏差の大きさの違いに反映されているのです。

よって、データBの方が散らばりが大きい\underline{\text{データ}B\text{の方が散らばりが大きい}}

このページのまとめ

ここでは分散と標準偏差の計算方法と、その意味について学習しました。

分散の計算では「偏差の2乗の平均」と「x2(xˉ)2\overline{x^2}-(\bar{x})^2(2乗の平均 - 平均の2乗)」の2つの方法があります。どちらも使えるようにしておきましょう。

また、分散・標準偏差は「データの散らばり具合」を表す重要な指標です。平均値だけでなく、散らばりにも注目する習慣をつけてくださいね!

アプリで続ける

この問題の「よくある質問」や「解法の鍵」は、アプリで読めます。

この問題に関するよくある疑問への回答や、解法のポイントをまとめた「解法の鍵」はアプリに収録しています。 類題演習やAIへの質問もアプリから使えます。分散・標準偏差 に近い内容をそのまま続けられます。

よくある質問 解法の鍵 類題演習 AIに質問

ストアからダウンロードして、同じ単元の演習やAI質問をそのまま続けられます。