このページのまとめ
先に押さえておくこと
データの変換の要点をまとめたページです。先に答えを確認してから、解き方とつまずきやすい点を順にたどれます。
答えの要点
$u=ax+b$ の平均・分散の答えと条件を先に確認できます。
- テーマ: u=ax+b の平均・分散
- ポイント: データの分析の基礎を短く確認しやすく、検索から入ってもそのまま理解まで進めやすい記事です。
- 次に読むなら: 関連ページ、またはアプリで類題演習
問題
(1) データ x の平均が 5、分散が 4 のとき、u=3x+2 によって変換されたデータ u の平均と分散を求めよ。
(2) データ 102,105,98,101,104 の分散を、u=x−100 と変換して求めよ。
解説
データの変換について解説します。
データの各値 xi に対して ui=axi+b のように一次式で変換することだよ。
大きな数値のデータを扱いやすくしたり、単位を変換したりするときに使うんだ。
例えば、気温のデータが 102,105,98,⋯ のように大きな値ばかりだと計算が大変ですよね。このようなとき u=x−100 と変換すると、2,5,−2,⋯ と小さな値で計算できます。
データを ui=axi+b で変換したとき、平均・分散・標準偏差は次のように変わります。
平均は a 倍して b を足すのに、分散は a2 倍だけで b は関係ないんですね。
いいところに気づいたね!
分散は「データの散らばり具合」を表す値だから、全部のデータに同じ値 b を足しても散らばり方は変わらないんだ。
一方、a 倍するとデータの散らばりが a 倍に広がるから、分散は a2 倍になるよ。
それでは問題を解いていきましょう。
(1) データ x の平均が 5、分散が 4 のとき、u=3x+2 によって変換されたデータ u の平均と分散を求めよ。
この問題では a=3, b=2 ですね。公式に当てはめていきましょう。
まず平均は、
uˉ=axˉ+b =3×5+2 次に分散は、
su2=a2sx2 分散の公式では a2 であることに注意してね。a=3 なら 32=9 を掛けるよ。
b=2 は分散には影響しないから使わないよ。
(2) データ 102,105,98,101,104 の分散を、u=x−100 と変換して求めよ。
この問題では a=1, b=−100 として u=x−100 と変換します。
その通り!100 前後の大きな数を扱わなくて済むから、計算がかなり楽になるよ。
変換後のデータ u は、
102−100=2,105−100=5,98−100=−2,101−100=1,104−100=4 つまり u: 2,5,−2,1,4 となります。
まず u の平均を求めます。
uˉ=52+5+(−2)+1+4 =510=2 次に u の分散を求めます。
su2=51{(2−2)2+(5−2)2+(−2−2)2+(1−2)2+(4−2)2} =51(0+9+16+1+4) =530=6 ここで、u=x−100 は a=1,b=−100 なので、変換の公式より
sx2=a2su2=12×6=6 a=1 のとき sx2=su2 となるから、変換後の分散がそのまま元の分散になるんだよ。
つまり「全部のデータに同じ値を足し引きしても分散は変わらない」ということだね。
102,105,98,⋯ のまま計算するより、ずっと楽でした!
このように、大きな値のデータを扱うときは仮平均を使って変換すると計算が楽になるよ。
試験ではよく出るテクニックだから覚えておこう!
このページのまとめ
ここでは、データの変換 u=ax+b と平均・分散の関係について学習しました。
ポイントは、平均は uˉ=axˉ+b、分散は su2=a2sx2 という公式です。特に分散には定数 b が影響しないことを押さえておきましょう。
大きな数値のデータを扱うときは、仮平均を利用した変換で計算を簡単にするテクニックが非常に有効です。ぜひ活用してくださいね!