統計的な推測

母集団と標本(基本概念)

母平均$\mu$・母分散$\sigma^2$と標本平均$\overline{X}$

統計的な推測の「母集団と標本(基本概念)」を、答えを先に押さえてから理解できる形に整理したページです。「母平均$\mu$・母分散$\sigma^2$と標本平均$\overline{X}$」でつまずきやすい点も含めて、学習の流れを短く確認できます。

数学B 約15分 難易度 1

このページのまとめ

先に押さえておくこと

母集団と標本(基本概念)の要点をまとめたページです。先に答えを確認してから、解き方とつまずきやすい点を順にたどれます。

答えの要点

母平均$\mu$・母分散$\sigma^2$と標本平均$\overline{X}$の答えと条件を先に確認できます。

  • テーマ: 母平均μ\mu・母分散σ2\sigma^2と標本平均X\overline{X}
  • ポイント: 統計的な推測の基礎を短く確認しやすく、検索から入ってもそのまま理解まで進めやすい記事です。
  • 次に読むなら: 関連ページ、またはアプリで類題演習

問題

ある工場で生産された電球1000010000個の寿命を調べたい。全数調査が困難であるため、100100個の電球を無作為に取り出して調査したところ、その寿命(時間)の平均は12001200、分散は25002500であった。

(1)(1)\quadこの調査における母集団、標本、標本の大きさをそれぞれ答えよ。

(2)(2)\quad母平均μ\mu、母標準偏差σ\sigmaの推定値を求めよ。

(3)(3)\quad全数調査ではなく標本調査を行う理由を述べよ。

答えを見る

(1)  (1)\;母集団:工場で生産された電球10000個全体\underline{工場で生産された電球10000個全体}

標本:無作為に取り出した100個の電球\underline{無作為に取り出した100個の電球}

標本の大きさ:100\underline{100}

(2)  (2)\;母平均の推定値:μ1200\underline{\mu \approx 1200}(時間)

母標準偏差の推定値:σ50\underline{\sigma \approx 50}(時間)

(3)  (3)\;全数調査では費用・時間がかかりすぎる。また、電球の寿命検査のように調査により製品が使えなくなる場合は全数調査ができない。

解説

母集団と標本の基本概念について解説します。

「統計的推測」って何から勉強すればいいですか?

まずは「母集団と標本」という基本的な考え方から始めよう。統計的推測の全ての土台になる概念だよ。

統計的推測とは、集団全体(母集団)の特徴を、一部のデータ(標本)から推測する方法です。

まず、最も基本となる用語を確認しましょう。

なぜ全部調べないんですか?全部調べた方が正確ですよね?

たしかに全数調査の方が正確だけど、現実には難しい場合が多いんだ。例えば次のような場合を考えてみよう。

  • 工場の電球の寿命検査 → 全部検査すると商品がなくなる(破壊検査\textcolor{red}{破壊検査}
  • 世論調査 → 国民全員に聞くのは費用・時間がかかりすぎる
  • 川の水質検査 → 川の水を全部調べることは不可能

なるほど!全部調べられない場合や、調べると壊れてしまう場合があるんですね。

そうだね。だから一部を調べて全体を推測する「標本調査」が必要になるんだ。

次に、標本の選び方について見ていきましょう。

復元抽出と非復元抽出って、どちらを使うんですか?

実際の調査では非復元抽出を使うことが多いよ。ただし、母集団が十分大きいとき(標本の大きさに比べて母集団が十分大きいとき)は、復元抽出でも非復元抽出でもほぼ同じ結果になるんだ。数学Bでは、母集団が十分大きい場合を考えることが多いよ。

では、問題を解いていきましょう。

ある工場で生産された電球1000010000個の寿命を調べたい。全数調査が困難であるため、100100個の電球を無作為に取り出して調査したところ、その寿命(時間)の平均は12001200、分散は25002500であった。

(1)(1)\quadこの調査における母集団、標本、標本の大きさをそれぞれ答えよ。

この問題では、「調べたい集団全体」と「実際に調べた一部」を区別しましょう。

調べたいのは「工場で生産された電球1000010000個全体」の寿命ですから、

母集団\textcolor{red}{母集団}:工場で生産された電球1000010000個全体

実際に調べたのは「無作為に取り出した100100個」ですから、

標本\textcolor{red}{標本}:無作為に取り出した100100個の電球

標本の大きさ\textcolor{red}{標本の大きさ}n=100n = 100

(2)(2)\quad母平均μ\mu、母標準偏差σ\sigmaの推定値を求めよ。

ここで、母集団と標本それぞれの統計量について確認しておきましょう。

母平均や母分散は「未知」なんですか?

そうだよ。母集団全体を調べていないから、母平均μ\muや母分散σ2\sigma^2の真の値は分からない。だから標本のデータを使って推測するんだ。

標本から計算される統計量は次の通りです。

この問題では、標本平均X=1200\overline{X} = 1200、標本分散S2=2500S^2 = 2500です。

無作為抽出された標本であれば、標本平均は母平均の良い推定値となるので、

母平均の推定値:μ1200\mu \approx \underline{1200}(時間)

母分散の推定値:σ22500\sigma^2 \approx 2500 ですから、

母標準偏差の推定値:σ2500=50\sigma \approx \sqrt{2500} = \underline{50}(時間)

標本の値をそのまま母集団の推定値にしていいんですか?

良い疑問だね。無作為抽出であれば、標本平均は母平均の良い推定値(不偏推定量)になることが数学的に証明されているよ。ただし、あくまで「推定」であって、真の値とは多少のずれがあることには注意しよう。

(3)(3)\quad全数調査ではなく標本調査を行う理由を述べよ。

電球の寿命検査では、検査のために電球を点灯させ続けて寿命が尽きるまで待つ必要があります。

つまり、調査を行うと電球が使えなくなってしまいます(破壊検査)。

全数調査を行うと、1000010000個全ての電球が使えなくなり、商品として出荷できなくなります。

また、1000010000個全てを検査するには膨大な費用と時間がかかります。

したがって、全数調査では費用・時間がかかりすぎること、および検査によって製品が使えなくなることが標本調査を行う理由です。

「なぜ標本調査を行うか」は記述問題で出ることがあるから、しっかり説明できるようにしておこう。

このページのまとめ

ここでは母集団と標本の基本概念について学習しました。

  • 母集団\textcolor{red}{母集団}:調査対象全体、標本\textcolor{red}{標本}:母集団から取り出した一部
  • 母平均μ\mu、母分散σ2\sigma^2、母標準偏差σ\sigmaは通常未知で、標本から推定する
  • 無作為抽出\textcolor{red}{無作為抽出}:全てのデータが等しい確率で選ばれるように抽出する方法
  • 復元抽出(戻して抽出)と非復元抽出(戻さず抽出)がある

これらの概念は統計的推測の全ての土台になります。次に学ぶ「標本平均の分布」や「区間推定」を理解するためにも、しっかり押さえておきましょう!

アプリで続ける

この問題の「よくある質問」や「解法の鍵」は、アプリで読めます。

この問題に関するよくある疑問への回答や、解法のポイントをまとめた「解法の鍵」はアプリに収録しています。 類題演習やAIへの質問もアプリから使えます。母集団と標本(基本概念) に近い内容をそのまま続けられます。

よくある質問 解法の鍵 類題演習 AIに質問

ストアからダウンロードして、同じ単元の演習やAI質問をそのまま続けられます。