大学入試センター試験 2020年(令和2年) 追試 数学ⅠA 第2問 [2] 解説

(1)

まず、本文中の図1を見る。
図1より、進学率が$35$以上$40$未満の階級には、1つの都道府県が含まれることが分かる。
よって、散布図のうち、進学率が$35$以上$40$未満に点が2つ存在する①,②は不適。


残る 散布図⓪と③を見比べると、⓪は③と比べて点の分布が上に寄っている。
上下方向の分布の違いなので、就職率を確認しよう。

問題文中の就職率の図は箱ひげ図なので、箱ひげ図の復習から。

復習

大学入試センター試験2020年追試 数学ⅠA第2問[2] 復習図

ついでに、四分位数の復習もしておこう。

復習

第1四分位数
データの下位半分の中央値。データの大きさが奇数のときは、全体の中央値を除いて偶数にし、その下位半分の中央値をとる。
第2四分位数
中央値に等しい。データの大きさが偶数のときには、中央2数の平均値。
第3四分位数
データの上位半分の中央値。データの大きさが奇数のときは、全体の中央値を除いて偶数にし、その上位半分の中央値をとる。
四分位範囲
第3四分位数$-$第1四分位数。
(箱ひげ図の箱の部分の幅にあたる)

問題文中の図2を見ると、就職率の第1四分位数は$17$~$18$くらいの値だ。
いま、データの大きさは都道府県数の$47$だけど、復習より 第1四分位数は下から$12$番目の値にあたる。
なので、⓪と③のうち、下から$12$番目の点が$17$~$18$の方が答えだ。

両方の散布図とも、点の数は$47$あるので、複数の点がちょうど重なってひとつに見えていることはない。
なので、単に点を数えると、
⓪では、下から$12$番目の点は$20$~$21$付近 ③では、下から$12$番目の点は$17$~$18$付近 に存在する。

以上より、正しい散布図は

である。

解答サ:3

(2)

選択肢をひとつずつ確認しよう。

1998年度,2003年度の進学率の箱ひげ図を見ると、左側のひげの方が右側よりも長い。
なので、誤り。

多分これが正しいけれど、念のために残りの選択肢も確認しておこう。

2003年度→2008年度は、就職率の四分位範囲(箱の幅)は増加している。
なので、誤り。

1978年度,2003年度,2008年度,2013年度は、明らかに進学率の四分位範囲の方が大きい。
なので、誤り。

1973年度の就職率の最小値は、$34$前後。最大値は$66$前後なので、最小値の2倍よりも小さい。
なので、誤り。

以上より、正しい選択肢は

である。

解答シ:1

(3)

問題文中の図4から、就職率についての最大最小値と各四分位数にあたる点を調べる。
データの大きさは$47$なので、復習より、
第1四分位数は、下から$12$番目 中央値(第2四分位数)は、下から(上からでもいいけど)$24$番目 第3四分位数は、上から$12$番目 の点にあたる。

それぞれの点を探すと、図Aのようになる。

図A
大学入試センター試験2020年追試 数学ⅠA第2問[2] 解説図A

図Aより、選択肢⑤の四分位範囲は
第3四分位数$-$第1四分位数
$=39$前後$-29$前後
$=10$前後
なので不適。

図Aより、残る選択肢のうちで$ 34.8\%$にあたるのは中央値である。

解答ス:1


さらに、進学率の中央値は、点のうち左から(右からでもいいけど)$24$番目の値だ。
左から$24$番目の点は、図Aの赤い点。
進学率の目盛を見ると、この値は$34$~$35$あたりであることが分かる。

選択肢のうち、これに当てはまるのは

の$34.5$である。

解答セ:3

(4)

問題文中の図5を見ると、はっきりしないけれど、点は何となく図Bの青い線に沿って分布しているように見える。
青い部分は右下がりなので、負の相関が考えられる。
実際、問題文に「相関係数は$-0.41$であった」と書かれている。

図B
大学入試センター試験2020年追試 数学ⅠA第2問[2] 解説図B

図Bの黒い点は、特に青い線によく沿っている。
よって、黒い点のおかげで負の相関が強くなっていると考えられる。

なので、この黒い点を除外すると、相関は弱くなる。
つまり、相関係数は$0$に近づく。

以上より、5つの点を除外したときの相関係数$r$は、
$-0.41 \lt r \lt 0$
であると推測できる。

解答ソ:2

(5)

平均値の2乗というと、まず思い出すのは、問題文中にも載っている分散の公式だ。

復習

データ$\{x_{1}$,$x_{2}$,$\cdots x_{n}\}$があり、平均値を$\overline{x}$,それぞれの値の2乗の平均値を$\overline{x^{2}}$とするとき、分散$s^{2}$は
$s^{2}=\displaystyle \frac{(x_{1}-\overline{x})^{2}+(x_{2}-\overline{x})^{2}+\cdots+(x_{n}-\overline{x})^{2}}{n}$
$s^{2}$$=\overline{x^{2}}-(\overline{x})^{2}$式A
である。

この式Aを使おう。

ここでは、データ$X$について考えているので
$X$の平均値を$\overline{X}$ $X^{2}$の平均値を$\overline{X^{2}}$ $X$の分散を$s_{X}^{2}$ とすると、式Aは
$s_{X}^{2}=\overline{X^{2}}-\left(\overline{X}\right)^{2}$
とかける。

これに、問題中の表1にある$X^{2}$の平均値を代入すると
$s_{X}^{2}=1223-$$\left(\overline{X}\right)^{2}$式A'
となる。
式A'の赤い部分が、求めるだ。


ところが、$s_{X}^{2}$が分からないので、式A'は解けない。
仕方がないから、$X$の分散$s_{X}^{2}$を求めよう。
分散の正の平方根が標準偏差なので、求めるのは$X$の標準偏差$s_{X}$でも可だ。

改めて問題中の表1を見ると、まだ使ってない値は
$Y$の平均値$\overline{Y}$ $Y$の標準偏差$s_{Y}$ $X$と$Y$の共分散$s_{XY}$ $X$と$Y$の相関係数$r_{XY}$ の4つだ。
これを使って、
$X$の分散$s_{X}^{2}$または標準偏差$s_{X}$ を求めたい。

上のような値から思い出すのは、共分散から相関係数を求める式だ。

復習

相関係数$r_{xy}$は、
$r_{xy}=\displaystyle \frac{s_{xy}}{s_{x}\cdot s_{y}}$式B
である。
ただし、$s_{xy}$は共分散
$s_{x}$,$s_{y}$はそれぞれのデータの標準偏差

式Bを、この問題に合わせて書きなおすと
$r_{XY}=\displaystyle \frac{s_{XY}}{s_{X}\cdot s_{Y}}$
とかける。

これに、表1にあるそれぞれの値を代入して、
$-0.41=\displaystyle \frac{-20}{s_{X}\cdot 7.6}$
より
$s_{X}=\displaystyle \frac{-20}{-0.41\cdot 7.6}$
    $=6.418\ldots$
なので、これを四捨五入して、$X$の標準偏差$s_{X}$は
$s_{X}\doteqdot 6.4$式C
となる。

解答タ:6, チ:4


ここまで来ると勝ったも同然。
式Cを式A'に代入だ。

$6.4^{2}\doteqdot 1223-\left(\overline{X}\right)^{2}$
より
$\left(\overline{X}\right)^{2}\doteqdot 1223-6.4^{2}$
なので、
$\left(\overline{X}\right)^{2}\doteqdot 1182.04$
であることが分かる。

これに最も近いのは、選択肢

の$1182$である。

解答ツ:2