大学入試センター試験 2018年(平成30年) 追試 数学ⅠA 第2問 [2] 解説

(1)

最初に、期間A,Bの相関係数と、全期間の相関係数との大小関係の問題。
全期間の共分散も$X$と$Y$の標準偏差も分かっているので、とにかく手を動かそう。

まず、相関係数の復習から。

復習

データ$X$の標準偏差を$s_{x}$,データ$Y$の標準偏差を$s_{y}$,$X$と$Y$の共分散を$s_{xy}$とすると、相関係数$r_{xy}$は
$r_{xy}=\displaystyle \frac{s_{xy}}{s_{x}\cdot s_{y}}$
である。

問題文の表1から、全期間の$X$の標準偏差は$0.105$,$Y$の標準偏差は$0.260$,$X$と$Y$の共分散は$0.0263$なので、相関係数$r$は
$r=\displaystyle \frac{0.0263}{0.105\cdot 0.260}$
$r$$\doteqdot 0.96$
となる。
よって、正しいのは⑤の$0.91 \lt r$である。

解答シ:5

(2)

まず、箱ひげ図の復習をしておこう。

復習

大学入試センター試験2018年追試 数学ⅠA第2問[2] 復習図

範囲は、最大値$-$最小値
四分位範囲は、第3四分位数$-$第1四分位数

復習が終わったところで、選択肢の⓪~⑥をひとつずつ確認する。

問題文の図4を見ると、期間Aの最大値(ひげの右端)は、期間Bのひげの右端よりも右にある。なので、誤り。

問題文の図4を見ると、期間Aの第1四分位数(箱の左端)は、期間Bの箱の左端よりもわずかに右にあるようだ。なので、誤り。

問題文の図4を見ると、期間Aも期間Bも、四分位範囲(箱の幅)は0.6~0.7の間の数。なので、差は0.2より小さいから、誤り。

問題文の図4を見ると、期間Aの範囲(ひげの右端から左端の幅)は、期間Bのものよりも大きい。なので、誤り。

問題文より、期間Aの中央値は0.0584、期間Bの中央値は0.0252。
また、図4より、期間Aも期間Bも四分位範囲(箱の幅)は0.6~0.7の間の数。
期間Aも期間Bも、四分位範囲は中央値の絶対値の10倍以上なので、当然8倍より大きい。
よって、正しい。

問題文の図4を見ると、期間Aの第3四分位数は0.4付近。
図3を見ると、期間Aで度数が最大なのは、0~0.5の階級。
この階級に0.4前後の数は含まれるので、正しい。

問題文の図4を見ると、期間Bの第1四分位数は-0.3付近。
図3を見ると、期間Bで度数が最大なのは、0~0.5の階級。
この階級に-0.3前後の数は含まれないので、誤り。

以上より、当てはまるものは④⑤である。

解答ス:4, セ:5 (順不同)

(3)

今回もまず復習から。
データの変換と統計量の関係の復習をしておこう。

復習

データ$\{x\}$があり、その
平均値を$\overline{x}$ 分散を$s_{x}^{2}$ 標準偏差を$s_{x}$ とする。

$\{x\}$のすべてを$a$倍して$b$を加えて、新しいデータ$\{X\}$をつくる。
式にすると、
$X_{n}=ax_{n}+b$
として新しいデータをつくる。

このとき、新しいデータ$\{X\}$の
平均値は$a\overline{x}+b$ 分散は$a^{2}s_{x}^{2}$ 標準偏差は$|a|s_{x}$式A となる。

さらに、共分散と相関係数については、

データ$\{x\}$,$\{y\}$があり、その
共分散を$s_{xy}$ 相関係数を$r_{xy}$ とする。

$\{x\}$,$\{y\}$のそれぞれを
$X_{n}=ax_{n}+b$
$Y_{n}=cy_{n}+d$
として新しいデータ$\{X\}$,$\{Y\}$をつくる。

このとき、$\{X\}$,$\{Y\}$の
共分散は$ac\cdot s_{xy}$式B 相関係数は、
$a$と$c$が同符号のとき、$r_{xy}$
         異符号のとき、$-r_{xy}$式C
となる。

式Cより、選択肢の⓪,④以外は不適。
⓪は$a$と$c$が同符号であれば正しいんだけど、異符号だと困る。
というわけで④が正しそうなんだけど、理由が何となくじゃいけないので、ちゃんと考えてみる。

$a$と$c$が同符号のとき
($a \lt 0 \cap c \lt 0$ または $0 \lt a \cap 0 \lt c$ のとき)
$0 \lt ac$なので、$|ac|=ac$
よって、
$\displaystyle \frac{ac}{|ac|}=1$

$a$と$c$が異符号のとき
($a \lt 0 \cap 0 \lt c$ または $a \lt 0 \cap 0 \lt c$ のとき)
$ac \lt 0$なので、$|ac|=-ac$
よって、
$\displaystyle \frac{ac}{|ac|}=\frac{ac}{-ac}=-1$

以上より、
$\displaystyle \frac{ac}{|ac|}=\left\{\begin{array}{ll}
1 & (a,c\text{が同符号のとき})\\
-1 & (a,c\text{が異符号のとき})
\end{array}\right.$
となるので、④は正しい。

解答ソ:4

別解

上の解説のように、直接相関係数を考えるよりも、共分散と標準偏差から考えた方が分かりやすいかも知れない。

$X$,$Y$の標準偏差を$s_{x}$,$s_{y}$とし、共分散を$s_{xy}$としたとき、
式Aより、$X'$,$Y'$の標準偏差は$|a|s_{x}$,$|c|s_{y}$
式Bより、$X'$と$Y'$の共分散は、$ac\cdot s_{xy}$
となる。

なので、$X'$と$Y'$の相関係数は
$\displaystyle \frac{ac\cdot s_{xy}}{|a|s_{x}\cdot|c|s_{y}}=\frac{ac}{|ac|}\cdot$$\displaystyle \frac{s_{xy}}{s_{x}\cdot s_{y}}$
となるけど、上の式の赤文字の部分は$X$と$Y$の相関係数だ。
よって、正解は④である。

解答ソ:4

(4)

さらに、相関係数と散布図について復習する。

復習

ここに載せた散布図は、全て
横軸$\alpha$は右が大きい値、
縦軸$\beta$は上が大きい値
であるとする。

図A
大学入試センター試験2018年追試 数学ⅠA第2問[2] 解説図A  
図B
大学入試センター試験2018年追試 数学ⅠA第2問[2] 解説図B

図A・図Bのように、点が直線状に連なっているとき、$\alpha$と$\beta$の間には相関があるという。
図Aのように右上がりの場合を「正の相関」といい、図Bのように右下がりの場合を「負の相関」という。

図C
大学入試センター試験2018年追試 数学ⅠA第2問[2] 解説図C

また、同じ正の相関であっても、図Aと図Cを比較すると、図Aの方がより直線状になっている。このような場合、図Aの方が「相関が強い」といい、図Cの方が「相関が弱い」という。 相関が強い場合、相関係数は、
正の相関なら$1$に
負の相関なら$-1$に近づく。
相関が弱い場合、相関係数は$0$に近づく。

これを考えながら問題文中の散布図を見る。

図D
大学入試センター試験2018年追試 数学ⅠA第2問[2] 解説図D

散布図1は、右上がりの直線状に点が分布している(図D) 従って、3つの散布図中で相関係数が最も$1$に近いと考えられる。 よって、
$r_{1}=0.98$
である。

散布図2と3はちょっと分かりにくいけど、
散布図2は...分布に沿って直線を引くのは無理だねぇ(図E) 散布図3も難しいけど、分布図2よりは右下がりの直線に近い(図F)

従って、分布図3の相関係数が$-1$に近く、分布図2の相関係数が$0$に近いと考えられる。

図E
大学入試センター試験2018年追試 数学ⅠA第2問[2] 解説図E
図F
大学入試センター試験2018年追試 数学ⅠA第2問[2] 解説図F

よって、
$r_{2}=0.10$
$r_{3}=-0.76$
になる。

以上より、正しい組合せは⑤である。

解答タ:5