大学入試センター試験 2018年(平成30年) 追試 数学ⅠA 第2問 [2] 解説
(1)
最初に、期間A,Bの相関係数と、全期間の相関係数との大小関係の問題。
全期間の共分散も$X$と$Y$の標準偏差も分かっているので、とにかく手を動かそう。
まず、相関係数の復習から。
復習
データ$X$の標準偏差を$s_{x}$,データ$Y$の標準偏差を$s_{y}$,$X$と$Y$の共分散を$s_{xy}$とすると、相関係数$r_{xy}$は
$r_{xy}=\displaystyle \frac{s_{xy}}{s_{x}\cdot s_{y}}$
である。
問題文の表1から、全期間の$X$の標準偏差は$0.105$,$Y$の標準偏差は$0.260$,$X$と$Y$の共分散は$0.0263$なので、相関係数$r$は
$r=\displaystyle \frac{0.0263}{0.105\cdot 0.260}$
$r$$\doteqdot 0.96$
となる。
よって、正しいのは⑤の$0.91 \lt r$である。
解答シ:5
(2)
まず、箱ひげ図の復習をしておこう。
復習
範囲は、最大値$-$最小値
四分位範囲は、第3四分位数$-$第1四分位数
復習が終わったところで、選択肢の⓪~⑥をひとつずつ確認する。
⓪ 問題文の図4を見ると、期間Aの最大値(ひげの右端)は、期間Bのひげの右端よりも右にある。なので、誤り。
① 問題文の図4を見ると、期間Aの第1四分位数(箱の左端)は、期間Bの箱の左端よりもわずかに右にあるようだ。なので、誤り。
② 問題文の図4を見ると、期間Aも期間Bも、四分位範囲(箱の幅)は0.6~0.7の間の数。なので、差は0.2より小さいから、誤り。
③ 問題文の図4を見ると、期間Aの範囲(ひげの右端から左端の幅)は、期間Bのものよりも大きい。なので、誤り。
④
問題文より、期間Aの中央値は0.0584、期間Bの中央値は0.0252。
また、図4より、期間Aも期間Bも四分位範囲(箱の幅)は0.6~0.7の間の数。
期間Aも期間Bも、四分位範囲は中央値の絶対値の10倍以上なので、当然8倍より大きい。
よって、正しい。
⑤
問題文の図4を見ると、期間Aの第3四分位数は0.4付近。
図3を見ると、期間Aで度数が最大なのは、0~0.5の階級。
この階級に0.4前後の数は含まれるので、正しい。
⑥
問題文の図4を見ると、期間Bの第1四分位数は-0.3付近。
図3を見ると、期間Bで度数が最大なのは、0~0.5の階級。
この階級に-0.3前後の数は含まれないので、誤り。
以上より、当てはまるものは④⑤である。
解答ス:4, セ:5 (順不同)
(3)
今回もまず復習から。
データの変換と統計量の関係の復習をしておこう。
復習
データ$\{x\}$があり、その
平均値を$\overline{x}$
分散を$s_{x}^{2}$
標準偏差を$s_{x}$
とする。
$\{x\}$のすべてを$a$倍して$b$を加えて、新しいデータ$\{X\}$をつくる。
式にすると、
$X_{n}=ax_{n}+b$
として新しいデータをつくる。
このとき、新しいデータ$\{X\}$の
平均値は$a\overline{x}+b$
分散は$a^{2}s_{x}^{2}$
標準偏差は$|a|s_{x}$式A
となる。
さらに、共分散と相関係数については、
データ$\{x\}$,$\{y\}$があり、その
共分散を$s_{xy}$
相関係数を$r_{xy}$
とする。
$\{x\}$,$\{y\}$のそれぞれを
$X_{n}=ax_{n}+b$
$Y_{n}=cy_{n}+d$
として新しいデータ$\{X\}$,$\{Y\}$をつくる。
このとき、$\{X\}$,$\{Y\}$の
共分散は$ac\cdot s_{xy}$式B
相関係数は、
$a$と$c$が同符号のとき、$r_{xy}$
異符号のとき、$-r_{xy}$式C
となる。
式Cより、選択肢の⓪,④以外は不適。
⓪は$a$と$c$が同符号であれば正しいんだけど、異符号だと困る。
というわけで④が正しそうなんだけど、理由が何となくじゃいけないので、ちゃんと考えてみる。
$a$と$c$が同符号のとき
($a \lt 0 \cap c \lt 0$ または $0 \lt a \cap 0 \lt c$ のとき)
$0 \lt ac$なので、$|ac|=ac$
よって、
$\displaystyle \frac{ac}{|ac|}=1$
$a$と$c$が異符号のとき
($a \lt 0 \cap 0 \lt c$ または $a \lt 0 \cap 0 \lt c$ のとき)
$ac \lt 0$なので、$|ac|=-ac$
よって、
$\displaystyle \frac{ac}{|ac|}=\frac{ac}{-ac}=-1$
以上より、
$\displaystyle \frac{ac}{|ac|}=\left\{\begin{array}{ll}
1 & (a,c\text{が同符号のとき})\\
-1 & (a,c\text{が異符号のとき})
\end{array}\right.$
となるので、④は正しい。
解答ソ:4
別解
上の解説のように、直接相関係数を考えるよりも、共分散と標準偏差から考えた方が分かりやすいかも知れない。
$X$,$Y$の標準偏差を$s_{x}$,$s_{y}$とし、共分散を$s_{xy}$としたとき、
式Aより、$X'$,$Y'$の標準偏差は$|a|s_{x}$,$|c|s_{y}$
式Bより、$X'$と$Y'$の共分散は、$ac\cdot s_{xy}$
となる。
なので、$X'$と$Y'$の相関係数は
$\displaystyle \frac{ac\cdot s_{xy}}{|a|s_{x}\cdot|c|s_{y}}=\frac{ac}{|ac|}\cdot$$\displaystyle \frac{s_{xy}}{s_{x}\cdot s_{y}}$
となるけど、上の式の赤文字の部分は$X$と$Y$の相関係数だ。
よって、正解は④である。
解答ソ:4
(4)
さらに、相関係数と散布図について復習する。
復習
ここに載せた散布図は、全て
横軸$\alpha$は右が大きい値、
縦軸$\beta$は上が大きい値
であるとする。
図A・図Bのように、点が直線状に連なっているとき、$\alpha$と$\beta$の間には相関があるという。
図Aのように右上がりの場合を「正の相関」といい、図Bのように右下がりの場合を「負の相関」という。
また、同じ正の相関であっても、図Aと図Cを比較すると、図Aの方がより直線状になっている。このような場合、図Aの方が「相関が強い」といい、図Cの方が「相関が弱い」という。
相関が強い場合、相関係数は、
正の相関なら$1$に
負の相関なら$-1$に近づく。
相関が弱い場合、相関係数は$0$に近づく。
これを考えながら問題文中の散布図を見る。
散布図1は、右上がりの直線状に点が分布している(図D)
従って、3つの散布図中で相関係数が最も$1$に近いと考えられる。
よって、
$r_{1}=0.98$
である。
散布図2と3はちょっと分かりにくいけど、
散布図2は...分布に沿って直線を引くのは無理だねぇ(図E)
散布図3も難しいけど、分布図2よりは右下がりの直線に近い(図F)
従って、分布図3の相関係数が$-1$に近く、分布図2の相関係数が$0$に近いと考えられる。
よって、
$r_{2}=0.10$
$r_{3}=-0.76$
になる。
以上より、正しい組合せは⑤である。
解答タ:5