このページのまとめ
先に押さえておくこと
母平均の区間推定の要点をまとめたページです。先に答えを確認してから、解き方とつまずきやすい点を順にたどれます。
答えの要点
図と式の対応や答えの条件を、先に短く確認できます。
- テーマ: 95%信頼区間の計算と解釈
- ポイント: 統計的な推測の要点を、図と式を往復しながら確認しやすい記事です。
- 次に読むなら: 関連ページ、またはアプリで類題演習
問題
ある高校の全生徒の身長は母標準偏差σ=10cmの正規分布に従うことが知られている。この高校から無作為に100人の生徒を選び身長を測ったところ、標本平均はX=170cmであった。
(1) 母平均μの95%信頼区間を求めよ。
(2) 信頼区間の幅を(1)の半分にするには、何人の標本を取ればよいか。
解説
母平均の95%信頼区間について解説します。
区間推定って何ですか?標本平均をそのまま母平均の推定値にすればいいんじゃないんですか?
それは点推定と呼ばれる方法だね。標本平均Xは母平均μの点推定値として使えるよ。
でも、標本を取り直すたびにXの値は変わるから、「どのくらいの誤差があるか」まで示した方が信頼できるよね。
標本平均Xの分布を利用するんだ。母平均μ、母標準偏差σの母集団から大きさnの標本を取ると、標本平均は
X∼N(μ,nσ2) に従うんだったね。
ここで標準化すると、Z=nσX−μは標準正規分布N(0,1)に従います。
95%信頼区間で1.96という値が出てきますが、なぜ1.96なんですか?
標準正規分布において、P(∣Z∣≦1.96)=0.95が成り立つからだよ。つまりZが−1.96から1.96の間に入る確率がちょうど95%なんだ。
グラフで確認してみましょう。
色のついた部分の面積が0.95(95%)です。つまり、標準正規分布に従うZが−1.96から1.96の範囲に収まる確率が95%ということですね。
P(∣Z∣≦1.96)=0.95をXとμの不等式に書き換えると、
P(−1.96≦nσX−μ≦1.96)=0.95 P(X−1.96⋅nσ≦μ≦X+1.96⋅nσ)=0.95 これが95%信頼区間の公式です。
「95%の確率でμがこの区間に入る」ということですか?
実はその解釈は厳密には正しくないんだ。母平均μは固定された値だから、「μが動いて区間に入ったり出たりする」わけではないよ。
動いているのは「区間の方」なんだ。標本を取り直すたびにXが変わるから、信頼区間も毎回変わるよね。その区間のうち95%がμを含んでいる、というのが正しい解釈だよ。
なるほど!区間が動いて、μは固定なんですね。理解できました!
では、問題を解いていきましょう。
(1) ある高校の全生徒の身長は母標準偏差σ=10cmの正規分布に従う。100人の標本平均がX=170cmのとき、母平均μの95%信頼区間を求めよ。
問題の条件を整理すると、σ=10、n=100、X=170です。
まず、標準誤差nσを計算します。
nσ=10010=1010=1 nσは標準誤差と呼ばれていて、標本平均のばらつきの大きさを表しているよ。
95%信頼区間の公式に代入すると、
X−1.96⋅nσ≦μ≦X+1.96⋅nσ 170−1.96×1≦μ≦170+1.96×1 168.04≦μ≦171.96 信頼区間の幅は171.96−168.04=3.92cmですね。
そうだね。信頼区間の幅は2×1.96×nσで計算できるよ。今回は2×1.96×1=3.92だね。
(2) 信頼区間の幅を(1)の半分にするには、何人の標本を取ればよいか。
95%信頼区間の幅は2×1.96×nσです。
(1)の幅が3.92なので、その半分1.96にしたいとき、
2×1.96×n10=1.96 n10=0.5 n=400 幅を半分にするのに4倍の人数が必要なんですか?
その通り!信頼区間の幅はnσに比例するから、幅をk1倍にしたければnをk2倍にする必要があるんだ。
今回は幅を21にしたいから、nを22=4倍にして100×4=400人となるよ。
グラフでnの違いによる信頼区間の幅の変化を確認してみましょう。
標本平均の分布(nの違い)
n=100
n=400
n=400の方が分布が鋭くなっているね。標本平均のばらつきが小さくなるから、より狭い信頼区間でμを推定できるんだ。
推定の精度を上げたければ、標本サイズを大きくすればいいんですね!
そうだね。ただし、精度を上げるためのコスト(調査にかかる時間やお金)とのバランスも大切だよ。
このページのまとめ
ここでは母平均の95%信頼区間の計算方法とその解釈について学習しました。
ポイントをまとめると、
95%信頼区間の公式:
X±1.96⋅nσ
1.96は標準正規分布で
P(∣Z∣≦1.96)=0.95となる値
信頼区間は「この操作を繰り返したとき
95%の区間が
μを含む」という意味
幅を
k1倍にするには
nを
k2倍にする
区間推定は仮説検定とあわせて統計的推測の中心的な内容です。公式だけでなく意味もしっかり理解しておきましょう!