このページのまとめ
先に押さえておくこと
相関係数の要点をまとめたページです。先に答えを確認してから、解き方とつまずきやすい点を順にたどれます。
答えの要点
図と式の対応や答えの条件を、先に短く確認できます。
- テーマ: 散布図・共分散・相関係数の計算
- ポイント: データの分析の要点を、図と式を往復しながら確認しやすい記事です。
- 次に読むなら: 関連ページ、またはアプリで類題演習
問題
次の表は、6人の生徒の数学と理科のテストの得点である。
生徒数学x理科yA23B45C54D78E910F36 (1) このデータの散布図を描き、xとyの間にどのような相関があるか答えよ。
(2) xとyの共分散sxyを求めよ。
(3) xとyの相関係数rを求めよ。
解説
相関係数の問題について解説します。
まず、2種類のデータの関係を調べる方法について見ていきましょう。
「2種類のデータの関係を調べる」ってどういうことですか?
例えば、「数学の点数が高い人は理科の点数も高い傾向があるのか?」ということを数値で調べるんだよ。
そのための道具が散布図、共分散、相関係数だよ。
目安として、∣r∣≧0.7なら強い相関、0.4≦∣r∣<0.7ならやや相関あり、∣r∣<0.4ならほとんど相関なしと判断するよ。
それでは、問題を解いていきましょう。
(1) このデータの散布図を描き、xとyの間にどのような相関があるか答えよ。
与えられたデータを座標平面上にプロットします。
散布図を見ると、右上がりの傾向があるね。つまり数学の点数が高い人は理科の点数も高い傾向があるよ。
散布図が右上がりの傾向を示しているので、xとyの間には正の相関があります。
(2) xとyの共分散sxyを求めよ。
共分散を求めるには、まず平均値を計算します。
xˉ=62+4+5+7+9+3=630=5 yˉ=63+5+4+8+10+6=636=6 次に、偏差(各データから平均を引いた値)の表を作ろう。この表を使うと計算がスムーズだよ!
各データの偏差を計算して表にまとめましょう。
xi−xˉyi−yˉ(xi−xˉ)(yi−yˉ)−3−39−1−110−202244416−200 3行目の合計は 9+1+0+4+16+0=30 なので、
sxy=61×30=5 共分散が正の値だから、正の相関があるということですね!
その通り!共分散が正なら正の相関、負なら負の相関だよ。ただし共分散だけでは相関の強さがわかりにくいから、相関係数を使うんだ。
(3) xとyの相関係数rを求めよ。
相関係数は r=sx⋅sysxy で求めます。(2)で sxy=5 を求めたので、あとは sx と sy を計算しましょう。
先ほどの偏差の表に、(xi−xˉ)2 と (yi−yˉ)2 の行を追加します。
xi−xˉyi−yˉ(xi−xˉ)2(yi−yˉ)2−3−399−1−1110−2042244441616−2040 sx2=69+1+0+4+16+4=634=317 sy2=69+1+4+4+16+0=634=317 あれ、sx2とsy2が同じ値になりました!
偶然だけど、計算が楽になるね!sx=syだから、sx⋅sy=sx2=317 だよ。
よって、相関係数は
r=sx⋅sysxy=3175=5×173=1715 1715≒0.88 であり、1にかなり近い値です。
相関係数が約0.88ということは、数学と理科の間に強い正の相関があるということだね。数学の点数が高い人は理科の点数も高い傾向が強いよ。
散布図に回帰直線(データの傾向を表す直線)を重ねると、相関の強さが視覚的にもよくわかります。
このページのまとめ
ここでは、散布図・共分散・相関係数について学習しました。
相関係数を求めるには、偏差の表を丁寧に作ることがポイントです。計算量が多いので、表を活用してミスなく解きましょう!
また、相関係数は「2つの変量の間の直線的な関係の強さ」を表す値であり、−1≦r≦1 の範囲をとることを覚えておいてくださいね。