このページのまとめ
先に押さえておくこと
中心極限定理の要点をまとめたページです。先に答えを確認してから、解き方とつまずきやすい点を順にたどれます。
答えの要点
図と式の対応や答えの条件を、先に短く確認できます。
- テーマ: 標本平均と正規分布
- ポイント: 統計的な推測の要点を、図と式を往復しながら確認しやすい記事です。
- 次に読むなら: 関連ページ、またはアプリで類題演習
問題
サイコロをn回投げて出た目の平均をXˉとする。サイコロ1個の目の期待値はμ=3.5、分散はσ2=1235である。
(1) Xˉの期待値E(Xˉ)と分散V(Xˉ)をnを用いて表せ。
(2) n=36のとき、Xˉの標準偏差を求めよ。
(3) n=36のとき、Xˉが3以上4以下となるおよその確率を求めよ。ただし、P(0≦Z≦1.76)=0.4608とする。
解説
中心極限定理について解説します。
中心極限定理って名前は聞いたことがありますが、どんな定理ですか?
統計で最も大切な定理の一つだよ。ひとことで言うと「たくさんのデータの平均をとると、元の分布がどんな形でも正規分布に近づく」という定理なんだ。
母集団の分布がどんな形でもいいんですか?偏った分布でも?
そうなんだ!一様分布でも、歪んだ分布でも、標本サイズnさえ十分大きければ標本平均の分布は正規分布に近づくよ。
これが中心極限定理のすごいところだね。
では、なぜ「平均をとると正規分布に近づく」のでしょうか。直感的に考えてみましょう。
サイコロを例にとります。サイコロ1個の目は1から6が同じ確率で出る一様分布です。正規分布とは全く違う形をしていますね。
しかし、サイコロを2個投げた場合の平均はどうでしょうか。平均が3.5に近い値は出やすく、端の値は出にくくなります。例えば、平均が1になるのは(1,1)の場合だけですが、平均が3.5になる組合せは(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)の6通りもあります。
そうだね。nを大きくするほど、この「中央に集まる」傾向が強くなって、分布の形が正規分布に近づいていくんだ。
nが大きくなるにつれて、標本平均の分布が正規分布に近づく様子をグラフで確認しましょう。nが大きいほど、分布が鋭く中央に集中していきます。
サイコロ1個のとき(n=1):標準偏差≈1.71(一様分布なので正規分布ではないが参考として表示)
サイコロ4個の平均(n=4):標準偏差≈0.85(もう正規分布に近い形)
サイコロ10個の平均(n=10):標準偏差≈0.54(さらに鋭く集中)
nが増えるほどグラフが細く高くなって、μ=3.5の周りに集中していますね!
その通り!これが中心極限定理の本質だよ。次に、なぜ分散がnσ2になるのか、数式で確認してみよう。
標本平均Xˉ=nX1+X2+⋯+Xnについて、X1,X2,…,Xnは互いに独立で、それぞれE(Xi)=μ、V(Xi)=σ2を満たします。
分散の式でn21が出てくるのはなぜですか?
V(aX)=a2V(X)という性質を使っているんだ。Xˉ=n1(X1+⋯+Xn)だから、a=n1としてn21が出てくるんだよ。
また、X1,…,Xnが独立なのでV(X1+⋯+Xn)=V(X1)+⋯+V(Xn)が使えるんだ。
つまり、nが大きくなると分散nσ2は0に近づきます。これは「nを大きくするほど標本平均Xˉのばらつきが小さくなる」ことを意味します。
では問題を解いていきましょう。
サイコロをn回投げて出た目の平均をXˉとする。サイコロ1個の目の期待値はμ=3.5、分散はσ2=1235である。
(1) Xˉの期待値E(Xˉ)と分散V(Xˉ)をnを用いて表せ。
先ほどの公式をそのまま適用します。
E(Xˉ)=μ=3.5 V(Xˉ)=nσ2=12n35 サイコロの目の分布は一様分布だけど、標本平均の期待値は母平均3.5と一致するし、分散も公式通りnσ2になるよ。
(2) n=36のとき、Xˉの標準偏差を求めよ。
標準偏差は分散の正の平方根です。
σ(Xˉ)=V(Xˉ)=12×3635 =43235 =43235=12335 =12⋅335⋅3=36105≒0.285 サイコロ1個だと標準偏差が約1.71だったのに、36個の平均だと約0.285になるんですね!
そうだね。nσ=361.71=61.71≈0.285だから、36個の平均をとることでばらつきが61になったんだ。
(3) n=36のとき、Xˉが3以上4以下となるおよその確率を求めよ。
n=36は十分大きいので、中心極限定理よりXˉは近似的に正規分布N(3.5,(36105)2)に従います。
標準化変量Z=105/36Xˉ−3.5を求めます。
Xˉ=3のとき:Z=105/363−3.5=105−0.5×36=105−18≒−1.76
Xˉ=4のとき:Z=105/364−3.5=1050.5×36=10518≒1.76
正規分布の対称性を使って、
P(3≦Xˉ≦4)=P(−1.76≦Z≦1.76) =2P(0≦Z≦1.76) =2×0.4608 =0.9216 正規分布表よりP(0≦Z≦1.76)=0.4608を用いました。
サイコロの目は1から6の一様分布なのに、36個の平均をとるとこんなにきれいな正規分布になるんですね!
これが中心極限定理の力だよ。母集団の分布が何であっても、nが大きければ標本平均は正規分布に近づくんだ。
この性質があるからこそ、区間推定や仮説検定が可能になるんだよ。
例えば、母平均μが未知のとき、標本平均Xˉを使って「μはだいたいこの範囲にある」と推定するのが区間推定だよ。
中心極限定理のおかげでXˉが正規分布に従うと分かるから、確率計算ができるんだ。
このページのまとめ
ここでは中心極限定理について学習しました。
中心極限定理の要点は「母集団の分布によらず、標本サイズnが十分大きければ、標本平均Xˉは正規分布N(μ,nσ2)に従う」ということです。
nが大きくなるほど分散nσ2は小さくなり、標本平均は母平均μの周りに集中していきます。この定理は区間推定・仮説検定の土台となるので、しっかり理解しておきましょう!