このページのまとめ
先に押さえておくこと
分散・標準偏差の要点をまとめたページです。先に答えを確認してから、解き方とつまずきやすい点を順にたどれます。
答えの要点
公式の使い分けとデータの散らばりの答えと条件を先に確認できます。
- テーマ: 公式の使い分けとデータの散らばり
- ポイント: データの分析の基礎を短く確認しやすく、検索から入ってもそのまま理解まで進めやすい記事です。
- 次に読むなら: 関連ページ、またはアプリで類題演習
問題
次のデータについて、以下の問いに答えよ。
データA:3,5,6,8,8
データB:2,4,6,8,10
(1) データAの平均値xˉ、分散s2、標準偏差sを求めよ。
(2) データBの平均値xˉ、分散s2、標準偏差sを求めよ。
(3) データAとデータBの平均値を比較し、どちらのデータの方が散らばりが大きいか答えよ。
解説
分散と標準偏差の問題について解説します。
まず、分散と標準偏差の定義と公式を確認しましょう。
偏差の2乗の平均って、どういう意味があるんですか?
偏差は「平均値からどれだけ離れているか」を表しているんだ。
ただ、偏差をそのまま足すとプラスとマイナスが打ち消し合って0になるんだよ。
だから2乗して全部プラスにしてから平均を取るんだ。これが分散だよ。
それでは問題を解いていきましょう。
(1) データA:3,5,6,8,8 の平均値、分散、標準偏差を求めよ。
まず平均値を求めて、それから分散を計算しよう。
ここでは「偏差の2乗の平均」と「x2−(xˉ)2」の両方の方法でやってみるね。
まず平均値を求めます。
xˉ=53+5+6+8+8=530=6 方法1:偏差の2乗の平均 各データの偏差(xi−xˉ)を計算します。
3−6=−3,5−6=−1,6−6=0,8−6=2,8−6=2 偏差の2乗の平均が分散です。
s2=5(−3)2+(−1)2+02+22+22 =59+1+0+4+4=518 方法2:x2−(xˉ)2 2乗の平均を計算します。
x2=532+52+62+82+82 =59+25+36+64+64=5198 平均の2乗は xˉ2=62=36 なので、
s2=x2−(xˉ)2=5198−36=5198−180=518 その通り!検算にもなるから、余裕があれば両方やってみるのがオススメだよ。
標準偏差は分散の正の平方根なので、
s=518=518=532=532×5=5310 よって、xˉ=6,s2=518,s=5310 です。
(2) データB:2,4,6,8,10 の平均値、分散、標準偏差を求めよ。
同じように計算していきます。
平均値は、
xˉ=52+4+6+8+10=530=6 ここでは「x2−(xˉ)2」の公式で求めてみましょう。
x2=522+42+62+82+102 =54+16+36+64+100=5220=44 s2=x2−(xˉ)2=44−36=8 標準偏差は、
s=8=22 よって、xˉ=6,s2=8,s=22 です。
(3) データAとデータBの平均値を比較し、どちらのデータの方が散らばりが大きいか答えよ。
データAデータB平均値xˉ66分散s2518=3.68標準偏差s5310≈1.9022≈2.83 平均値はどちらも6で同じですが、分散はデータAが518=3.6、データBが8です。
そうなんだ。平均値だけではデータの特徴はわからない。
分散や標準偏差を見ることで、データがどれだけ平均値の周りに散らばっているかがわかるんだよ。
データBは2,4,6,8,10と等間隔に広がっているのに対し、データAは3,5,6,8,8と平均値6の近くに比較的集まっています。
この違いが分散・標準偏差の大きさの違いに反映されているのです。
よって、データBの方が散らばりが大きい
このページのまとめ
ここでは分散と標準偏差の計算方法と、その意味について学習しました。
分散の計算では「偏差の2乗の平均」と「x2−(xˉ)2(2乗の平均 − 平均の2乗)」の2つの方法があります。どちらも使えるようにしておきましょう。
また、分散・標準偏差は「データの散らばり具合」を表す重要な指標です。平均値だけでなく、散らばりにも注目する習慣をつけてくださいね!