統計的な推測

中心極限定理

標本平均と正規分布

統計的な推測の「中心極限定理」を、答えを先に押さえてから理解できる形に整理したページです。「標本平均と正規分布」でつまずきやすい点も含めて、学習の流れを短く確認できます。

数学B 約20分 難易度 2 図つき

このページのまとめ

先に押さえておくこと

中心極限定理の要点をまとめたページです。先に答えを確認してから、解き方とつまずきやすい点を順にたどれます。

答えの要点

図と式の対応や答えの条件を、先に短く確認できます。

  • テーマ: 標本平均と正規分布
  • ポイント: 統計的な推測の要点を、図と式を往復しながら確認しやすい記事です。
  • 次に読むなら: 関連ページ、またはアプリで類題演習

問題

サイコロをnn回投げて出た目の平均をXˉ\bar{X}とする。サイコロ11個の目の期待値はμ=3.5\mu = 3.5、分散はσ2=3512\sigma^2 = \dfrac{35}{12}である。

(1)(1)\quad Xˉ\bar{X}の期待値E(Xˉ)E(\bar{X})と分散V(Xˉ)V(\bar{X})nnを用いて表せ。

(2)(2)\quad n=36n = 36のとき、Xˉ\bar{X}の標準偏差を求めよ。

(3)(3)\quad n=36n = 36のとき、Xˉ\bar{X}33以上44以下となるおよその確率を求めよ。ただし、P(0Z1.76)=0.4608P(0 \leqq Z \leqq 1.76) = 0.4608とする。

答えを見る

(1)  (1)\; E(Xˉ)=3.5E(\bar{X}) = \underline{3.5}V(Xˉ)=3512nV(\bar{X}) = \underline{\dfrac{35}{12n}}

(2)  (2)\; 105360.285\underline{\dfrac{\sqrt{105}}{36} \fallingdotseq 0.285}

(3)  (3)\; 0.9216\underline{0.9216}(約92%92\%

解説

中心極限定理について解説します。

中心極限定理って名前は聞いたことがありますが、どんな定理ですか?

統計で最も大切な定理の一つだよ。ひとことで言うと「たくさんのデータの平均をとると、元の分布がどんな形でも正規分布に近づく」という定理なんだ。

母集団の分布がどんな形でもいいんですか?偏った分布でも?

そうなんだ!一様分布でも、歪んだ分布でも、標本サイズnnさえ十分大きければ標本平均の分布は正規分布に近づくよ。

これが中心極限定理のすごいところだね。

では、なぜ「平均をとると正規分布に近づく」のでしょうか。直感的に考えてみましょう。

サイコロを例にとります。サイコロ11個の目は11から66が同じ確率で出る一様分布\textcolor{red}{一様分布}です。正規分布とは全く違う形をしていますね。

0 0.2 0.4 0.6 0.8 1 0.5 1.5 2.5 3.5 4.5 5.5 7

しかし、サイコロを22個投げた場合の平均はどうでしょうか。平均が3.53.5に近い値は出やすく、端の値は出にくくなります。例えば、平均が11になるのは(1,1)(1,1)の場合だけですが、平均が3.53.5になる組合せは(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)66通りもあります。

なるほど!中央付近の値が出やすくなるんですね。

そうだね。nnを大きくするほど、この「中央に集まる」傾向が強くなって、分布の形が正規分布に近づいていくんだ。

nnが大きくなるにつれて、標本平均の分布が正規分布に近づく様子をグラフで確認しましょう。nnが大きいほど、分布が鋭く中央に集中していきます。

サイコロ11個のとき(n=1n=1):標準偏差1.71\approx 1.71(一様分布なので正規分布ではないが参考として表示)

サイコロ44個の平均(n=4n=4):標準偏差0.85\approx 0.85(もう正規分布に近い形)

サイコロ1010個の平均(n=10n=10):標準偏差0.54\approx 0.54(さらに鋭く集中)

nnが増えるほどグラフが細く高くなって、μ=3.5\mu=3.5の周りに集中していますね!

その通り!これが中心極限定理の本質だよ。次に、なぜ分散がσ2n\frac{\sigma^2}{n}になるのか、数式で確認してみよう。

標本平均Xˉ=X1+X2++Xnn\bar{X} = \frac{X_1 + X_2 + \cdots + X_n}{n}について、X1,X2,,XnX_1, X_2, \ldots, X_nは互いに独立で、それぞれE(Xi)=μE(X_i) = \muV(Xi)=σ2V(X_i) = \sigma^2を満たします。

分散の式で1n2\frac{1}{n^2}が出てくるのはなぜですか?

V(aX)=a2V(X)V(aX) = a^2 V(X)という性質を使っているんだ。Xˉ=1n(X1++Xn)\bar{X} = \frac{1}{n}(X_1 + \cdots + X_n)だから、a=1na = \frac{1}{n}として1n2\frac{1}{n^2}が出てくるんだよ。

また、X1,,XnX_1, \ldots, X_nが独立なのでV(X1++Xn)=V(X1)++V(Xn)V(X_1 + \cdots + X_n) = V(X_1) + \cdots + V(X_n)が使えるんだ。

つまり、nnが大きくなると分散σ2n\frac{\sigma^2}{n}00に近づきます。これは「nnを大きくするほど標本平均Xˉ\bar{X}のばらつきが小さくなる」ことを意味します。

では問題を解いていきましょう。

サイコロをnn回投げて出た目の平均をXˉ\bar{X}とする。サイコロ11個の目の期待値はμ=3.5\mu = 3.5、分散はσ2=3512\sigma^2 = \frac{35}{12}である。

(1)(1)\quad Xˉ\bar{X}の期待値E(Xˉ)E(\bar{X})と分散V(Xˉ)V(\bar{X})nnを用いて表せ。

先ほどの公式をそのまま適用します。

E(Xˉ)=μ=3.5E(\bar{X}) = \mu = \underline{3.5}
V(Xˉ)=σ2n=3512nV(\bar{X}) = \frac{\sigma^2}{n} = \underline{\frac{35}{12n}}

サイコロの目の分布は一様分布だけど、標本平均の期待値は母平均3.53.5と一致するし、分散も公式通りσ2n\frac{\sigma^2}{n}になるよ。

(2)(2)\quad n=36n = 36のとき、Xˉ\bar{X}の標準偏差を求めよ。

標準偏差は分散の正の平方根です。

σ(Xˉ)=V(Xˉ)=3512×36\sigma(\bar{X}) = \sqrt{V(\bar{X})} = \sqrt{\frac{35}{12 \times 36}}
=35432= \sqrt{\frac{35}{432}}
=35432=35123= \frac{\sqrt{35}}{\sqrt{432}} = \frac{\sqrt{35}}{12\sqrt{3}}
=353123=105360.285= \frac{\sqrt{35} \cdot \sqrt{3}}{12 \cdot 3} = \frac{\sqrt{105}}{36} \fallingdotseq \underline{0.285}

サイコロ11個だと標準偏差が約1.711.71だったのに、3636個の平均だと約0.2850.285になるんですね!

そうだね。σn=1.7136=1.7160.285\frac{\sigma}{\sqrt{n}} = \frac{1.71}{\sqrt{36}} = \frac{1.71}{6} \approx 0.285だから、3636個の平均をとることでばらつきが16\frac{1}{6}になったんだ。

(3)(3)\quad n=36n = 36のとき、Xˉ\bar{X}33以上44以下となるおよその確率を求めよ。

n=36n = 36は十分大きいので、中心極限定理よりXˉ\bar{X}は近似的に正規分布N ⁣(3.5,  (10536) ⁣2)N\!\left(3.5,\; \left(\frac{\sqrt{105}}{36}\right)^{\!2}\right)に従います。

標準化変量Z=Xˉ3.5105/36Z = \frac{\bar{X} - 3.5}{\sqrt{105}/36}を求めます。

Xˉ=3\bar{X} = 3のとき:Z=33.5105/36=0.5×36105=181051.76Z = \frac{3 - 3.5}{\sqrt{105}/36} = \frac{-0.5 \times 36}{\sqrt{105}} = \frac{-18}{\sqrt{105}} \fallingdotseq -1.76

Xˉ=4\bar{X} = 4のとき:Z=43.5105/36=0.5×36105=181051.76Z = \frac{4 - 3.5}{\sqrt{105}/36} = \frac{0.5 \times 36}{\sqrt{105}} = \frac{18}{\sqrt{105}} \fallingdotseq 1.76

正規分布の対称性を使って、

P(3Xˉ4)=P(1.76Z1.76)P(3 \leqq \bar{X} \leqq 4) = P(-1.76 \leqq Z \leqq 1.76)
=2P(0Z1.76)= 2P(0 \leqq Z \leqq 1.76)
=2×0.4608= 2 \times 0.4608
=0.9216= \underline{0.9216}

正規分布表よりP(0Z1.76)=0.4608P(0 \leqq Z \leqq 1.76) = 0.4608を用いました。

サイコロの目は11から66の一様分布なのに、3636個の平均をとるとこんなにきれいな正規分布になるんですね!

これが中心極限定理の力だよ。母集団の分布が何であっても、nnが大きければ標本平均は正規分布に近づくんだ。

この性質があるからこそ、区間推定\textcolor{red}{区間推定}仮説検定\textcolor{red}{仮説検定}が可能になるんだよ。

区間推定や仮説検定にどうつながるんですか?

例えば、母平均μ\muが未知のとき、標本平均Xˉ\bar{X}を使って「μ\muはだいたいこの範囲にある」と推定するのが区間推定だよ。

中心極限定理のおかげでXˉ\bar{X}が正規分布に従うと分かるから、確率計算ができるんだ。

このページのまとめ

ここでは中心極限定理について学習しました。

中心極限定理の要点は「母集団の分布によらず、標本サイズnnが十分大きければ、標本平均Xˉ\bar{X}は正規分布N ⁣(μ,σ2n)N\!\left(\mu, \frac{\sigma^2}{n}\right)に従う」ということです。

nnが大きくなるほど分散σ2n\frac{\sigma^2}{n}は小さくなり、標本平均は母平均μ\muの周りに集中していきます。この定理は区間推定・仮説検定の土台となるので、しっかり理解しておきましょう!

アプリで続ける

この問題の「よくある質問」や「解法の鍵」は、アプリで読めます。

この問題に関するよくある疑問への回答や、解法のポイントをまとめた「解法の鍵」はアプリに収録しています。 類題演習やAIへの質問もアプリから使えます。中心極限定理 に近い内容をそのまま続けられます。

よくある質問 解法の鍵 類題演習 AIに質問

ストアからダウンロードして、同じ単元の演習やAI質問をそのまま続けられます。