データの分析

相関係数

データの分析の「相関係数」を、答えを先に押さえてから理解できる形に整理したページです。学習の流れを短く確認できます。

数学Ⅰ 約17分 難易度 1

このページのまとめ

先に押さえておくこと

相関係数の要点をまとめたページです。先に答えを確認してから、解き方とつまずきやすい点を順にたどれます。

答えの要点

データの分析の答えと条件を先に確認できます。

  • テーマ: 相関係数
  • ポイント: データの分析の基礎を短く確認しやすく、検索から入ってもそのまま理解まで進めやすい記事です。
  • 次に読むなら: 関連ページ、またはアプリで類題演習

問題

次の表は、テストAAとテストBBを受けた5人の得点である。テストAAとテストBBの相関係数を求めよ。

テストA764108テストB684107\large\begin{array}{|c|c|c|c|c|c|} \hline テストA & 7 & 6 & 4 & 10 & 8 \\ \hline テストB & 6 & 8 & 4 & 10 & 7 \\ \hline \end{array}

答えを見る

相関係数は0.85\underline{0.85}

解説

相関係数の問題について解説します。

まずは相関係数の公式について確認しましょう。

相関係数って何ですか?

「2種類のデータの関係を表す指標」だよ。

この問題だったら、テストAとテストBの点数にどのような傾向があるかを調べることができるんだ。

「2つのデータの関係」って具体的にどんなものですか?

例えばある学校で「数学」と「英語」のテストが行われたとしよう。そこで先生がこんな疑問を思い浮かべました。

「数学」のテストの点数が高い人は「英語」も\underline{「数学」のテストの点数が高い人は「英語」も}高い点数を取っているのだろうか?それとも\underline{高い点数を取っているのだろうか?それとも}数学の点数と英語の点数に関係はないのだろうか?\underline{数学の点数と英語の点数に関係はないのだろうか?}

こんなときに具体的な指標として計算できるのが「相関係数」だよ。

相関係数を求める意味を理解した上で、問題を見ていきましょう!

次の表は、テストAAとテストBBを受けた5人の得点である。テストAAとテストBBの相関係数を求めよ。

テストA764108テストB684107\large\begin{array}{|c|c|c|c|c|c|} \hline テストA & 7 & 6 & 4 & 10 & 8 \\ \hline テストB & 6 & 8 & 4 & 10 & 7 \\ \hline \end{array}

結論から言ってしまうと、公式に代入すれば相関係数は求められます。共分散も標準偏差も公式を使うだけです。

ここでは、実際にこの問題が出題されたときに素早く正確に解答する方法について解説していきます。

・テストAの平均値をxˉ,標準偏差をsx・テストAの平均値を\bar{x},標準偏差をs_x
・テストBの平均値をyˉ,標準偏差をsy・テストBの平均値を\bar{y},標準偏差をs_y
・テストA,Bの共分散をsxy・テストA,Bの共分散をs_{xy}

として問題を解いていきます。

「相関係数を求めよ」という問題が出た時は次のように解きましょう。

  1. 平均値xˉ,yˉ\bar{x},\bar{y}を求める
  2. 表を書く
  3. 計算する

この3つのステップで解くことで正確に・素早く解くことができます。

ステップごとに見ていきましょう。


1
平均値xˉ,yˉ\bar{x},\bar{y}を求める

まずはxˉ\bar{x}yˉ\bar{y}を求めましょう。

これは簡単ですね。

xˉ=7+6+4+10+85=7\bar{x}=\frac{7+6+4+10+8}{5}=7
yˉ=6+8+4+10+75=7\bar{y}=\frac{6+8+4+10+7}{5}=7

となります。


2
表を書く

次に、今求めた平均値をふまえながら表を書いていきます。具体的には次の表です。

xxˉyyˉ(xxˉ)(yyˉ)(xxˉ)2(yyˉ)2\large\begin{array}{|c|c|c|c|c|c|} \hline x-\bar{x} & & & & & \\ \hline y-\bar{y} & & & & & \\ \hline (x-\bar{x})(y-\bar{y}) & & & & & \\ \hline (x-\bar{x})^2 & & & & & \\ \hline (y-\bar{y})^2 & & & & & \\ \hline \end{array}

この表を書いたら、1行ずつ上から埋めていきます。

問題で与えられた表の値から先ほど求めた平均値を引くことで上の2行はすぐに埋めることができます。

xxˉ01331yyˉ11330(xxˉ)(yyˉ)(xxˉ)2(yyˉ)2\large\begin{array}{|c|c|c|c|c|c|} \hline x-\bar{x} & \textcolor{red}{0} & \textcolor{red}{-1} & \textcolor{red}{-3} & \textcolor{red}{3} & \textcolor{red}{1} \\ \hline y-\bar{y} & \textcolor{red}{-1} & \textcolor{red}{1} & \textcolor{red}{-3} & \textcolor{red}{3} & \textcolor{red}{0} \\ \hline (x-\bar{x})(y-\bar{y}) & & & & & \\ \hline (x-\bar{x})^2 & & & & & \\ \hline (y-\bar{y})^2 & & & & & \\ \hline \end{array}

次に3行目の(xxˉ)(yyˉ)(x-\bar{x})(y-\bar{y})を求めていきます。

1行目と2行目を上下に掛け合わせるだけなので一瞬で埋めることができますね。

xxˉ01331yyˉ11330(xxˉ)(yyˉ)01990(xxˉ)2(yyˉ)2\large\begin{array}{|c|c|c|c|c|c|} \hline x-\bar{x} & 0 & -1 & -3 & 3 & 1 \\ \hline y-\bar{y} & -1 & 1 & -3 & 3 & 0 \\ \hline (x-\bar{x})(y-\bar{y}) & \textcolor{red}{0} & \textcolor{red}{-1} & \textcolor{red}{9} & \textcolor{red}{9} & \textcolor{red}{0} \\ \hline (x-\bar{x})^2 & & & & & \\ \hline (y-\bar{y})^2 & & & & & \\ \hline \end{array}

最後に4行目と5行目の値を求めます。1行目と2行目の値をそれぞれ2乗するだけなので一瞬ですね。

xxˉ01331yyˉ11330(xxˉ)(yyˉ)01990(xxˉ)201991(yyˉ)211990\large\begin{array}{|c|c|c|c|c|c|} \hline x-\bar{x} & 0 & -1 & -3 & 3 & 1 \\ \hline y-\bar{y} & -1 & 1 & -3 & 3 & 0 \\ \hline (x-\bar{x})(y-\bar{y}) & 0 & -1 & 9 & 9 & 0 \\ \hline (x-\bar{x})^2 & \textcolor{red}{0} & \textcolor{red}{1} & \textcolor{red}{9} & \textcolor{red}{9} & \textcolor{red}{1} \\ \hline (y-\bar{y})^2 & \textcolor{red}{1} & \textcolor{red}{1} & \textcolor{red}{9} & \textcolor{red}{9} & \textcolor{red}{0} \\ \hline \end{array}

これで2つ目のステップである表を完成させることができました。

最後に相関係数の計算を行いましょう。

相関係数はr=sxysxsyr=\frac {s_{xy}}{s_x s_y}で求めることができましたね。

表3行目よりsxy=0+(1)+9+9+05=175s_{xy}=\frac{0+(-1)+9+9+0}{5}=\frac{17}{5}

表4行目よりsx2=0+1+9+9+15=4    sx=2s_x^2=\frac{0+1+9+9+1}{5}=4 \quad \iff \quad s_x=2

表5行目よりsy2=1+1+9+9+05=4    sy=2s_y^2=\frac{1+1+9+9+0}{5}=4\quad \iff \quad s_y=2

となるのでr=sxysxsy=17522=1720r=\frac {s_{xy}}{s_x s_y}=\frac{\frac{17}{5}}{2\cdot 2}=\underline{\frac{17}{20}}となります。

相関係数が1720(=0.85)\frac{17}{20}(=0.85)ということは、強い正の相関を持っていることがわかるね。

テストAの点数が高い人はテストBの点数も高い傾向があるということだよ。

このページのまとめ

ここでは相関係数の問題について解説しました。

「表を書く」ことで上下で比較するだけで計算を行えるようになるので、計算ミスが少なくなり素早く解くことが可能です。

表の書き方を覚えてマスターしてくださいね!

アプリで続ける

この問題の「よくある質問」や「解法の鍵」は、アプリで読めます。

この問題に関するよくある疑問への回答や、解法のポイントをまとめた「解法の鍵」はアプリに収録しています。 類題演習やAIへの質問もアプリから使えます。相関係数 に近い内容をそのまま続けられます。

よくある質問 解法の鍵 類題演習 AIに質問

ストアからダウンロードして、同じ単元の演習やAI質問をそのまま続けられます。