大学入学共通テスト 2023年(令和5年) 追試 数学Ⅰ 第4問 [2] 解説

(1)

まず、相関係数と散布図の復習から。

復習

以下の散布図は、横軸・縦軸ともに矢印方向が大きい値とする。

大学入学共通テスト2023年追試 数学Ⅰ第4問[2] 復習図

左端の散布図のように すべての点が右上がりの直線上に分布していれば、相関係数は$+1$ 右端の図のように 右下がりの直線上に分布していれば、相関係数は$-1$ 点の分布が直線的な配置から乱れるにつれて、相関係数は$0$に近づく

ただし、点が直線的に分布していても、次の図のように縦軸や横軸に平行なときには、相関係数は$0$に近い値になる。

大学入学共通テスト2023年追試 数学Ⅰ第4問[2] 復習図

(誤解しないでほしいのだけど、分布の傾きが$0$に近づけば相関係数も$0$に近づくという意味ではない。このへんについてはページをつくって詳しく解説したいけど、当分先の話になるかも。)

特に、下の図のように点が完全に軸に平行に分布しているとき、相関係数は計算できないため存在しない。

大学入学共通テスト2023年追試 数学Ⅰ第4問[2] 復習図

問題文中の図2を見ると、データ$Z'$の分布は全然直線的じゃない。

なので、相関係数は、選択肢のうちの
② $0.0$ だと考えられる。

解答ク:2

(2)

$W'$の

$x$の平均値$\overline{x}$は
$\overline{x}=\dfrac{5a}{5}$
$\hspace{14px}=a$

$y$の平均値$\overline{y}$も
$\overline{y}=\dfrac{5a}{5}$
$\hspace{12px}=a$

である。

解答ケ:3


ここで、分散,標準偏差,共分散,相関係数の復習をしておこう。

分散の復習

大きさ$n$のデータ$\{x_{1},x_{2},\cdots,x_{n}\}$があり、
データの平均値を$\overline{x}$ データの各値の2乗の平均値を$\overline{x^{2}}$ とするとき、分散$s^{2}$は
$s^{2}=\dfrac{\left(x_{1}-\overline{x}\right)^{2}+\left(x_{2}-\overline{x}\right)^{2}+\cdots+\left(x_{n}-\overline{x}\right)^{2}}{n}$
$\phantom{ s^{2} } =\overline{x^{2}}-\left(\overline{x}\right)^{2}$
とかける。

このふたつの式は問題によって使い分けるので、両方憶えておこう。

標準偏差の復習

標準偏差は、分散の正の平方根なので、
分散を$s^{2}$とすると、標準偏差$s$は
$s=\sqrt{s^{2}}$
である。

共分散の復習

データ$\{x_{1},x_{2},\cdots,x_{n}\}$と$\{y_{1},y_{2},\cdots,y_{n}\}$があり、
それぞれの標準偏差を$s_{x}$,$s_{y}$ とするとき、$\{x\}$と$\{y\}$の共分散$s_{xy}$は
$s_{xy}=\dfrac{1}{n}\{\left(x_{1}-\overline{x}\right)\left(y_{1}-\overline{y}\right)+\left(x_{2}-\overline{x}\right)\left(y_{2}-\overline{y}\right)+$
$\hspace{100px} \cdots+\left(x_{n}-\overline{x}\right)\left(y_{n}-\overline{y}\right)\}$
である。

相関係数の復習

データ$\{x_{1},x_{2},\cdots,x_{n}\}$と$\{y_{1},y_{2},\cdots,y_{n}\}$があり、
それぞれの標準偏差を$s_{x}$,$s_{y}$ $\{x\}$と$\{y\}$の共分散を$s_{xy}$ とするとき、$\{x\}$と$\{y\}$の相関係数$r_{xy}$は
$r_{xy}=\dfrac{s_{xy}}{s_{x}\cdot s_{y}}$
である。


復習が終わったところで、問題を解こう。

表1の計算表の空欄は簡単に埋められるから、ぱぱっと表1を完成させてしまおう。
すると、表Aができる。

表A
$x$ $y$ $x-\overline{x}$ $y-\overline{y}$ $\left(x-\overline{x}\right)\left(y-\overline{y}\right)$
$-1$ $-1$ $-1-a$ $-1-a$ $(-1-a)^{2}$$=a^{2}+2a+1$
$-1$ $1$ $-1-a$ $1-a$ $(-1-a)(1-a)$$=a^{2}-1$
$1$ $-1$ $1-a$ $-1-a$ $(1-a)(-1-a)$$=a^{2}-1$
$1$ $1$ $1-a$ $1-a$ $(1-a)^{2}$$=a^{2}-2a+1$
$5a$ $5a$ $4a$ $4a$ $(4a)^{2}$$=16a^{2}$

復習より、$x$と$y$の共分散$s_{xy}$は 表Aの黄色い部分の平均値なので、

$s_{xy}=\dfrac{1}{5}\{(a^{2} \textcolor{red}{\cancel{\textcolor{black}{+2a}}} \textcolor{green}{\cancel{\textcolor{black}{+1}}})+2(a^2 \textcolor{green}{\cancel{\textcolor{black}{-1}}})$
$\hspace{80px}+(a^2 \textcolor{red}{\cancel{\textcolor{black}{-2a}}} \textcolor{green}{\cancel{\textcolor{black}{+1}}})+(16a^{2})\}$
$$ \begin{align} \phantom{ s_{xy}} &=\dfrac{1}{5}\cdot 20a^{2}\\ &=4a^{2} \end{align} $$

である。

解答コ:0


また、復習より、表Aの青い部分の値を2乗して平均すると$x$の分散が求められる。
$x$の分散の正の平方根が $x$の標準偏差$s_{x}$だ。
式で表すと
$s_{x}=\sqrt{x\text{の分散}}$
である。

同様に、表Aの緑の部分の値を2乗して平均すると$y$の分散になり、その正の平方根が$y$の標準偏差$s_{y}$だから、
$s_{y}=\sqrt{y\text{の分散}}$
となる。

なので、ここで問われている
$s_{x}s_{y}=\sqrt{x\text{の分散}}\times\sqrt{y\text{の分散}}$式A
とかける。

ここで表Aを見ると、青い部分と緑の部分は同じ値の順番が変わっているだけだ。
なので
$x$の分散$=y$の分散
といえる。

よって、式Aは
$s_{x}s_{y}=\sqrt{x\text{の分散}}\times\sqrt{x\text{の分散}}$
$\hspace{34px}=x\text{の分散}$
となるから、$x$の分散を求めれば、それがだ。

あとは、計算。

$x$の分散$=\dfrac{1}{5}\{(-1-a)^{2}+(-1-a)^{2}$
$\hspace{100px}+(1-a)^{2}+(1-a)^{2}+(4a)^{2}\}$

これを計算すると

途中式 $$ \begin{align} x\text{の分散}&=\dfrac{1}{5}\{2(-1-a)^{2}+2(1-a)^{2}+(4a)^{2}\}\\ &=\dfrac{1}{5}\{4(1+a^{2})+(4a)^{2}\}\\ &=\dfrac{4}{5}(1+a^{2}+4a^{2})\\ &=\dfrac{4}{5}(1+5a^{2}) \end{align} $$
より
$x$の分散$=4a^{2}+\dfrac{4}{5}$
であることが分かる。

よって、求める$s_{x}s_{y}$も
$s_{x}s_{y}=4a^{2}+\dfrac{4}{5}$
となる。

解答サ:2


さらに、復習より、相関係数を$r_{xy}$とすると、
$r_{xy}=\dfrac{s_{xy}}{s_{x}\cdot s_{y}}$
なので、これにを代入して
$r_{xy}=\dfrac{4a^{2}}{4a^{2}+\cfrac{4}{5}}$
と表せる。

これが$0.95$以上になるから、
$\dfrac{4a^{2}}{4a^{2}+\cfrac{4}{5}}\geqq 0.95$
より
$4a^{2}\geqq 0.95\left(4a^{2}+\dfrac{4}{5}\right)$
とかける。

これを計算すると

途中式 両辺を$4$で割って$100$倍して、
$100a^{2}\geqq 95\left(a^{2}+\dfrac{1}{5}\right)$
$100a^{2}-95a^{2} \geqq 95\cdot\dfrac{1}{5}$
$5a^{2}\geqq\dfrac{95}{5}$
$a^{2}\geqq\dfrac{95}{5^{2}}$
なので、求める$a$の範囲は
$a\leqq-\dfrac{\sqrt{95}}{5}$,$\dfrac{\sqrt{95}}{5}\leqq a$
である。

解答シ:3