統計的な推測

二項分布の正規近似

$n$が大きい場合

統計的な推測の「二項分布の正規近似」を、答えを先に押さえてから理解できる形に整理したページです。「$n$が大きい場合」でつまずきやすい点も含めて、学習の流れを短く確認できます。

数学B 約11分 難易度 2 図つき

このページのまとめ

先に押さえておくこと

二項分布の正規近似の要点をまとめたページです。先に答えを確認してから、解き方とつまずきやすい点を順にたどれます。

答えの要点

図と式の対応や答えの条件を、先に短く確認できます。

  • テーマ: nnが大きい場合
  • ポイント: 統計的な推測の要点を、図と式を往復しながら確認しやすい記事です。
  • 次に読むなら: 関連ページ、またはアプリで類題演習

問題

ある製品の不良品率は5%5\%である。この製品を400400個検査するとき、不良品の個数XXについて次の問いに答えよ。

(1)X(1)\quad Xの期待値と標準偏差を求めよ。

(2)(2)\quad不良品が1515個以下である確率を、正規分布による近似を用いて求めよ。

答えを見る

(1)  (1)\;期待値E(X)=20E(X)=\underline{20}、標準偏差σ(X)=19\sigma(X)=\underline{\sqrt{19}}

(2)  P(X15)0.1515(2)\;P(X \leqq 15) \fallingdotseq \underline{0.1515}

解説

二項分布の正規近似について解説します。

二項分布の確率を計算するのって、nnが大きいと大変ですよね...

その通り!例えば400C15{}_{400} \mathrm{C}_{15}なんて計算するのは現実的じゃないよね。

そこで登場するのが「正規近似」なんだ。

まず、二項分布の正規近似の考え方を確認しましょう。

nnが十分大きいって、具体的にはどのくらいですか?

一般的に、以下の条件を満たすとき正規近似が使えるとされているよ。

この条件は、二項分布のグラフが左右対称に近くなるための目安なんだ。

pp0011に近いと、nnがかなり大きくないと近似精度が悪くなるよ。

それでは問題を解いていきましょう。

ある製品の不良品率は5%5\%である。この製品を400400個検査するとき、不良品の個数XXについて

(1)X(1)\quad Xの期待値と標準偏差を求めよ。

XXは二項分布B(400,0.05)B(400,\, 0.05)に従います。

二項分布B(n,p)B(n, p)の期待値と分散は、

  • 期待値:E(X)=npE(X) = np
  • 分散:V(X)=np(1p)V(X) = np(1-p)

よって、

E(X)=400×0.05=20E(X) = 400 \times 0.05 = \underline{20}
V(X)=400×0.05×0.95=19V(X) = 400 \times 0.05 \times 0.95 = 19
σ(X)=V(X)=194.36\sigma(X) = \sqrt{V(X)} = \underline{\sqrt{19}} \fallingdotseq 4.36

正規近似が使えるかどうかも確認しておこう。

np=205np = 20 \geqq 5n(1p)=3805n(1-p) = 380 \geqq 5なので、条件を満たしているね。

(2)(2)\quad不良品が1515個以下である確率を、正規分布による近似を用いて求めよ。

XXは近似的にN(20,19)N(20,\, 19)に従うので、Z=X2019Z = \frac{X - 20}{\sqrt{19}}N(0,1)N(0, 1)に従います。

P(X15)P(X \leqq 15)を求めればいいんですね。

そうだね。ただし、ここで重要なポイントがあるんだ。

それが「連続性補正」だよ。

なぜ0.50.5を足すんですか?

二項分布ではX=15X = 15という離散的な値を取るけど、

正規分布では14.514.5から15.515.5の範囲がX=15X = 15に対応すると考えるんだ。

だからX15X \leqq 15X15.5X \leqq 15.5として計算するんだよ。

連続性補正を適用して計算していきます。

P(X15)P(X15.5)P(X \leqq 15) \fallingdotseq P(X \leqq 15.5)
=P(Z15.52019)= P\left(Z \leqq \frac{15.5 - 20}{\sqrt{19}}\right)
=P(Z4.519)= P\left(Z \leqq \frac{-4.5}{\sqrt{19}}\right)
=P(Z1.03)= P(Z \leqq -1.03)

194.36\sqrt{19} \fallingdotseq 4.36なので、4.54.361.03\frac{-4.5}{4.36} \fallingdotseq -1.03だね。

標準正規分布表より、P(0Z1.03)=0.3485P(0 \leqq Z \leqq 1.03) = 0.3485なので、

P(Z1.03)=0.5P(0Z1.03)P(Z \leqq -1.03) = 0.5 - P(0 \leqq Z \leqq 1.03)
=0.50.3485= 0.5 - 0.3485
=0.1515= \underline{0.1515}

グラフで確認すると、Z1.03Z \leqq -1.03の部分(色付き)が求める確率に対応します。

-4 -2 0 2 4

連続性補正をしないとどうなりますか?

補正なしだと152019=54.361.15\frac{15-20}{\sqrt{19}} = \frac{-5}{4.36} \fallingdotseq -1.15となって、

P(Z1.15)=0.50.3749=0.1251P(Z \leqq -1.15) = 0.5 - 0.3749 = 0.1251と少し異なる値になるよ。

連続性補正をした方が精度が高いんだ。

このページのまとめ

ここでは二項分布の正規近似について学習しました。

nnが大きいとき、二項分布B(n,p)B(n, p)は正規分布N(np,np(1p))N(np,\, np(1-p))で近似できます。

連続性補正を忘れずに適用して、精度の高い近似値を求められるようになりましょう!

アプリで続ける

この問題の「よくある質問」や「解法の鍵」は、アプリで読めます。

この問題に関するよくある疑問への回答や、解法のポイントをまとめた「解法の鍵」はアプリに収録しています。 類題演習やAIへの質問もアプリから使えます。二項分布の正規近似 に近い内容をそのまま続けられます。

よくある質問 解法の鍵 類題演習 AIに質問

ストアからダウンロードして、同じ単元の演習やAI質問をそのまま続けられます。