大学入試センター試験 2020年(令和2年) 追試 数学ⅠA 第2問 [2] 解説
(1)
まず、本文中の図1を見る。
図1より、進学率が$35$以上$40$未満の階級には、1つの都道府県が含まれることが分かる。
よって、散布図のうち、進学率が$35$以上$40$未満に点が2つ存在する①,②は不適。
残る 散布図⓪と③を見比べると、⓪は③と比べて点の分布が上に寄っている。
上下方向の分布の違いなので、就職率を確認しよう。
問題文中の就職率の図は箱ひげ図なので、箱ひげ図の復習から。
復習
ついでに、四分位数の復習もしておこう。
復習
第1四分位数
データの下位半分の中央値。データの大きさが奇数のときは、全体の中央値を除いて偶数にし、その下位半分の中央値をとる。
第2四分位数
中央値に等しい。データの大きさが偶数のときには、中央2数の平均値。
第3四分位数
データの上位半分の中央値。データの大きさが奇数のときは、全体の中央値を除いて偶数にし、その上位半分の中央値をとる。
四分位範囲
第3四分位数$-$第1四分位数。
(箱ひげ図の箱の部分の幅にあたる)
問題文中の図2を見ると、就職率の第1四分位数は$17$~$18$くらいの値だ。
いま、データの大きさは都道府県数の$47$だけど、復習より 第1四分位数は下から$12$番目の値にあたる。
なので、⓪と③のうち、下から$12$番目の点が$17$~$18$の方が答えだ。
両方の散布図とも、点の数は$47$あるので、複数の点がちょうど重なってひとつに見えていることはない。
なので、単に点を数えると、
⓪では、下から$12$番目の点は$20$~$21$付近
③では、下から$12$番目の点は$17$~$18$付近
に存在する。
以上より、正しい散布図は
③
である。
解答サ:3
(2)
選択肢をひとつずつ確認しよう。
1998年度,2003年度の進学率の箱ひげ図を見ると、左側のひげの方が右側よりも長い。
なので、誤り。
多分これが正しいけれど、念のために残りの選択肢も確認しておこう。
2003年度→2008年度は、就職率の四分位範囲(箱の幅)は増加している。
なので、誤り。
1978年度,2003年度,2008年度,2013年度は、明らかに進学率の四分位範囲の方が大きい。
なので、誤り。
1973年度の就職率の最小値は、$34$前後。最大値は$66$前後なので、最小値の2倍よりも小さい。
なので、誤り。
以上より、正しい選択肢は
①
である。
解答シ:1
(3)
問題文中の図4から、就職率についての最大最小値と各四分位数にあたる点を調べる。
データの大きさは$47$なので、復習より、
第1四分位数は、下から$12$番目
中央値(第2四分位数)は、下から(上からでもいいけど)$24$番目
第3四分位数は、上から$12$番目
の点にあたる。
それぞれの点を探すと、図Aのようになる。
図Aより、選択肢⑤の四分位範囲は
第3四分位数$-$第1四分位数
$=39$前後$-29$前後
$=10$前後
なので不適。
図Aより、残る選択肢のうちで$ 34.8\%$にあたるのは中央値である。
解答ス:1
さらに、進学率の中央値は、点のうち左から(右からでもいいけど)$24$番目の値だ。
左から$24$番目の点は、図Aの赤い点。
進学率の目盛を見ると、この値は$34$~$35$あたりであることが分かる。
選択肢のうち、これに当てはまるのは
③
の$34.5$である。
解答セ:3
(4)
問題文中の図5を見ると、はっきりしないけれど、点は何となく図Bの青い線に沿って分布しているように見える。
青い部分は右下がりなので、負の相関が考えられる。
実際、問題文に「相関係数は$-0.41$であった」と書かれている。
図Bの黒い点は、特に青い線によく沿っている。
よって、黒い点のおかげで負の相関が強くなっていると考えられる。
なので、この黒い点を除外すると、相関は弱くなる。
つまり、相関係数は$0$に近づく。
以上より、5つの点を除外したときの相関係数$r$は、
$-0.41 \lt r \lt 0$
であると推測できる。
解答ソ:2
(5)
平均値の2乗というと、まず思い出すのは、問題文中にも載っている分散の公式だ。
復習
データ$\{x_{1}$,$x_{2}$,$\cdots x_{n}\}$があり、平均値を$\overline{x}$,それぞれの値の2乗の平均値を$\overline{x^{2}}$とするとき、分散$s^{2}$は
$s^{2}=\displaystyle \frac{(x_{1}-\overline{x})^{2}+(x_{2}-\overline{x})^{2}+\cdots+(x_{n}-\overline{x})^{2}}{n}$
$s^{2}$$=\overline{x^{2}}-(\overline{x})^{2}$式A
である。
この式Aを使おう。
ここでは、データ$X$について考えているので
$X$の平均値を$\overline{X}$
$X^{2}$の平均値を$\overline{X^{2}}$
$X$の分散を$s_{X}^{2}$
とすると、式Aは
$s_{X}^{2}=\overline{X^{2}}-\left(\overline{X}\right)^{2}$
とかける。
これに、問題中の表1にある$X^{2}$の平均値を代入すると
$s_{X}^{2}=1223-$$\left(\overline{X}\right)^{2}$式A'
となる。
式A'の赤い部分が、求めるツだ。
ところが、$s_{X}^{2}$が分からないので、式A'は解けない。
仕方がないから、$X$の分散$s_{X}^{2}$を求めよう。
分散の正の平方根が標準偏差なので、求めるのは$X$の標準偏差$s_{X}$でも可だ。
改めて問題中の表1を見ると、まだ使ってない値は
$Y$の平均値$\overline{Y}$
$Y$の標準偏差$s_{Y}$
$X$と$Y$の共分散$s_{XY}$
$X$と$Y$の相関係数$r_{XY}$
の4つだ。
これを使って、
$X$の分散$s_{X}^{2}$または標準偏差$s_{X}$
を求めたい。
上のような値から思い出すのは、共分散から相関係数を求める式だ。
復習
相関係数$r_{xy}$は、
$r_{xy}=\displaystyle \frac{s_{xy}}{s_{x}\cdot s_{y}}$式B
である。
ただし、$s_{xy}$は共分散
$s_{x}$,$s_{y}$はそれぞれのデータの標準偏差
式Bを、この問題に合わせて書きなおすと
$r_{XY}=\displaystyle \frac{s_{XY}}{s_{X}\cdot s_{Y}}$
とかける。
これに、表1にあるそれぞれの値を代入して、
$-0.41=\displaystyle \frac{-20}{s_{X}\cdot 7.6}$
より
$s_{X}=\displaystyle \frac{-20}{-0.41\cdot 7.6}$
$=6.418\ldots$
なので、これを四捨五入して、$X$の標準偏差$s_{X}$は
$s_{X}\doteqdot 6.4$式C
となる。
解答タ:6, チ:4
ここまで来ると勝ったも同然。
式Cを式A'に代入だ。
$6.4^{2}\doteqdot 1223-\left(\overline{X}\right)^{2}$
より
$\left(\overline{X}\right)^{2}\doteqdot 1223-6.4^{2}$
なので、
$\left(\overline{X}\right)^{2}\doteqdot 1182.04$
であることが分かる。
これに最も近いのは、選択肢
②
の$1182$である。
解答ツ:2