大学入学共通テスト 2023年(令和5年) 本試 数学Ⅰ 第3問 解説
(1)
最初に四分位数などの復習だ。
復習
第1四分位数
データの下位半分の中央値。
データの大きさが奇数のときは、全体の中央値を除いて偶数にし、その下位半分の中央値をとる。
第2四分位数
中央値に等しい。
データの大きさが偶数のときには、中央2数の平均値。
第3四分位数
データの上位半分の中央値。
データの大きさが奇数のときは、全体の中央値を除いて偶数にし、その上位半分の中央値をとる。
四分位範囲 第3四分位数$-$第1四分位数。
範囲 最大値$-$最小値。
復習より、52市のデータを小さい順に並べると、図Aができる。
図Aのように、
中央値(第2四分位数)は、小さい方から(大きい方からでもいいけど)26番目と27番目の値の平均値
第1四分位数は、小さい方から13番目と14番目の値の平均値
第3四分位数は、大さい方から13番目と14番目の値の平均値
だ。
問題文中の図1を見ると、
小さい方から26番目の値も27番目の値も$2200$以上$2600$未満の階級に含まれるから、中央値は$2200$以上$2600$未満
解答ア:3
小さい方から13番目の値も14番目の値も$1800$以上$2200$未満の階級に含まれるから、第1四分位数は$1800$以上$2200$未満
解答イ:2
大きい方から13番目の値も14番目の値も$3000$以上$3400$未満の階級に含まれるから、第1四分位数は$3000$以上$3400$未満
解答ウ:5
であることが分かる。
イウを図にすると、図Bになる。
復習より、四分位範囲は 第3四分位数$-$第1四分位数。
第3四分位数はオレンジの階級に、第1四分位数は緑の階級に含まれるから、その差は
$800$より大きく$1600$より小さい
ことが分かる。
解答エ:1
(2)
(i)
さらに、箱ひげ図の復習をしておこう。
復習
復習が終わったところで解答群を見るんだけど、⓪とか ぱっと目では分からないのは後回しだ。
分かりやすい選択肢だけ先に見よう。
①
範囲は、最大値$-$最小値。
図2と図3では明らかに範囲が異なる。
なので、不適。
②
図2の地域Eの中央値よりも、図3の地域Wの中央値の方が大きい。
というわけで、見つけた。これが正解だ。
解答オ:2
余談
正解は見つけたし、⓪と③は放っておいてもいいんだけど、せっかくなので解説しておく。
⓪
地域Eは19市なので、第1四分位数は小さい方から5番目の値だ。
図2を見ると、第1四分位数は$2000$よりもちょっとだけ大きい値だから、小さい方から5番目は$2000$より大きい。
なので、不適。
③
地域E
図2を見ると中央値は$2600$未満だから、地域Eの19市のうち小さい方から10番目の値は$2600$未満である。
よって、19市のうち少なくとも10市は$2600$未満だ。
したがって、地域Eの$2600$未満の市の割合は、$ \dfrac{1}{2}$より大きい。
地域W
図3を見ると中央値は$2600$より大きいから、地域Wの33市のうち小さい方から17番目の値は$2600$より大きい。
よって、33市のうち$2600$未満なのは、多くても16市。
したがって、地域Eの$2600$未満の市の割合は、$ \dfrac{1}{2}$より小さい。
なので、不適。
(ii)
問題文は長いけれど、問われているのは単に分散の計算方法だ。
復習
分散とは、偏差の2乗の平均値である。
復習より、正しい選択肢は
②
である。
解答カ:2
(3)
(i)
相関係数の復習をしておこう。
復習
データ$\{x_{1},x_{2},\cdots,x_{n}\}$と$\{y_{1},y_{2},\cdots,y_{n}\}$があり、
それぞれの標準偏差を$s_{x}$,$s_{y}$
$\{x\}$と$\{y\}$の共分散を$s_{xy}$
とするとき、$\{x\}$と$\{y\}$の相関係数$r_{xy}$は
$r_{xy}= \dfrac{s_{xy}}{s_{x}\cdot s_{y}}$
である。
この問題も問題文は長いけれど、要約すると「表1から相関係数を求めよ」の一言ですむ。
復習より、求める相関係数を$r$とすると、
$r= \dfrac{124000}{590\cdot 570}$
途中式
$\phantom{ r } =\dfrac{1240}{59\cdot 57}$
$\phantom{ r } =\dfrac{1240}{3363}$
なので、正解は解答群の
⑦
である。
解答キ:7
(ii)
データの変換についての復習もしておこう。
復習
データ$x$の
平均値が $\overline{x}$
分散が $s_{x}^{2}$
標準偏差が $s_{x}$
であるとする。
データのすべてを$a$倍して$b$を加え
$y=ax+b$
として新しいデータをつくったとき、データ$y$の
平均値 $\overline{y}=a\overline{x}+b$
分散 $s_{y}^{2}=a^{2}s_{x}^{2}$
標準偏差 $s_{y}=|a|s_{x}$
となる。
復習より、$x'$の分散$s_{x'}^{2}$は
$s_{x'}^{2}= \dfrac{x\text{の分散}}{1000^{2}}$
になるので、問題文中の表1より
$s_{x'}^{2}= \dfrac{348100}{1000^{2}}$
である。
解答ク:0
また、相関係数について復習すると、
復習
データ$x$,$y$を使って、新しいデータ$x'$,$y'$を
$\left\{\begin{array}{l}
x'=ax+b\\
y'=cx+d
\end{array}\right.\quad (a\neq 0$,$y\neq 0)$
と定める。
このとき、
$x$,$y$の相関係数と $x'$,$y'$の相関係数は等しい。
だった。
復習より、ケに入るのは、解答群のうちの
②
である。
解答ケ:2