大学入学共通テスト 2023年(令和5年) 本試 数学ⅠA 第2問 [1] 解説
(1)
最初に四分位数などの復習だ。
復習
第1四分位数
データの下位半分の中央値。
データの大きさが奇数のときは、全体の中央値を除いて偶数にし、その下位半分の中央値をとる。
第2四分位数
中央値に等しい。
データの大きさが偶数のときには、中央2数の平均値。
第3四分位数
データの上位半分の中央値。
データの大きさが奇数のときは、全体の中央値を除いて偶数にし、その上位半分の中央値をとる。
四分位範囲 第3四分位数$-$第1四分位数。
範囲 最大値$-$最小値。
復習より、52市のデータを小さい順に並べると、図Aができる。
図Aのように、
第1四分位数は、小さい方から13番目と14番目の値の平均値
第3四分位数は、大さい方から13番目と14番目の値の平均値
だ。
問題文中の図1を見ると、
小さい方から13番目の値も14番目の値も$1800$以上$2200$未満の階級に含まれるから、第1四分位数は$1800$以上$2200$未満
解答ア:2
大きい方から13番目の値も14番目の値も$3000$以上$3400$未満の階級に含まれるから、第1四分位数は$3000$以上$3400$未満
解答イ:5
であることが分かる。
これを図にすると、図Bになる。
復習より、四分位範囲は 第3四分位数$-$第1四分位数。
第3四分位数はオレンジの階級に、第1四分位数は緑の階級に含まれるから、その差は
$800$より大きく$1600$より小さい
ことが分かる。
解答ウ:1
(2)
(i)
さらに、箱ひげ図の復習をしておこう。
復習
復習が終わったところで解答群を見るんだけど、⓪とか ぱっと目では分からないのは後回しだ。
分かりやすい選択肢だけ先に見よう。
①
範囲は、最大値$-$最小値。
図2と図3では明らかに範囲が異なる。
なので、不適。
②
図2の地域Eの中央値よりも、図3の地域Wの中央値の方が大きい。
というわけで、見つけた。これが正解だ。
解答エ:2
余談
正解は見つけたし、⓪と③は放っておいてもいいんだけど、せっかくなので解説しておく。
⓪
地域Eは19市なので、第1四分位数は小さい方から5番目の値だ。
図2を見ると、第1四分位数は$2000$よりもちょっとだけ大きい値だから、小さい方から5番目は$2000$より大きい。
なので、不適。
③
地域E
図2を見ると中央値は$2600$未満だから、地域Eの19市のうち小さい方から10番目の値は$2600$未満である。
よって、19市のうち少なくとも10市は$2600$未満だ。
したがって、地域Eの$2600$未満の市の割合は、$\dfrac{1}{2}$より大きい。
地域W
図3を見ると中央値は$2600$より大きいから、地域Wの33市のうち小さい方から17番目の値は$2600$より大きい。
よって、33市のうち$2600$未満なのは、多くても16市。
したがって、地域Eの$2600$未満の市の割合は、$\dfrac{1}{2}$より小さい。
なので、不適。
(ii)
問題文は長いけれど、問われているのは単に分散の計算方法だ。
復習
分散とは、偏差の2乗の平均値である。
復習より、正しい選択肢は
②
である。
解答オ:2
(3)
相関係数の復習もしておこう。
復習
データ$\{x_{1},x_{2},\cdots,x_{n}\}$と$\{y_{1},y_{2},\cdots,y_{n}\}$があり、
それぞれの標準偏差を$s_{x}$,$s_{y}$
$\{x\}$と$\{y\}$の共分散を$s_{xy}$
とするとき、$\{x\}$と$\{y\}$の相関係数$r_{xy}$は
$r_{xy}=\dfrac{s_{xy}}{s_{x}\cdot s_{y}}$
である。
この問題も問題文は長いけれど、要約すると「表1から相関係数を求めよ」の一言ですむ。
復習より、求める相関係数を$r$とすると、
$r=\dfrac{124000}{590\cdot 570}$
途中式
$\phantom{ r} =\dfrac{1240}{59\cdot 57}$
$\phantom{ r} =\dfrac{1240}{3363}$
なので、正解は解答群の
⑦
である。
解答カ:7