大学入学共通テスト 2025年(令和7年) 旧課程 本試 数学ⅠA 第2問 [2] 解説
(1)
(i)
最初に、データの代表値と階級値の復習をしておこう。
データの代表値の復習
平均値
データの値の和をデータの大きさで割ったもの。小学校以来使ってきた「平均」のこと。
中央値
データを大きい順(小さい順でもいいけど)に並べたとき、中央になる値。データの大きさが偶数のときには、中央2数の平均値。
最頻値
データ中で最も個数が多い値。度数分布表や度数分布図では、度数が最も多い階級の階級値。
階級値の復習
それぞれの階級の中央の値(中央値ではない)、つまり 階級の上限と下限の平均値を階級値という。
問題中の図1を見ると、$32$以上$36$未満の階級の度数が一番多い。
なので、総平均時間の最頻値は、この階級の階級値
$\dfrac{32+36}{2}=34$
である。
解答タ:3, チ:4
図2では、$64$以上$72$未満の階級の度数が一番多い。
なので、行動者平均時間の最頻値は、この階級の階級値
$\dfrac{64+72}{2}=68$
である。
解答ツ:6, テ:8
(ii)
それぞれの階級に含まれているデータの値が階級値と等しい場合、総平均時間のデータは表Aのようになっている。
| 総平均時間 | $26$ | $30$ | $34$ | $38$ | $42$ | $46$ |
|---|---|---|---|---|---|---|
| 都道府県の数 | $6$ | $10$ | $15$ | $8$ | $4$ | $4$ |
図1の階級幅は$4$なので、$34$を仮平均として 仮平均からの差を表Aに書き込むと、表Bができる。
| 総平均 時間 | $26$ | $30$ | $34$ | $38$ | $42$ | $46$ |
|---|---|---|---|---|---|---|
| 仮平均 との差 | $-2\times 4$ | $-1\times 4$ | $0$ | $1\times 4$ | $2\times 4$ | $3\times 4$ |
| 都道府 県の数 | $6$ | $10$ | $15$ | $8$ | $4$ | $4$ |
表Bから平均値$m$を計算すると、
$$
\begin{align}
m&=34+\dfrac{4\times\left(\begin{aligned}&\AKA{\cancel{\KURO{-2\times 6}}}-1\times 10+1\times 8\\&\qquad+2\times 4+\AKA{\cancel{\KURO{3\times 4}}}\end{aligned}\right)}{47}\\
&=34+\dfrac{4\times\left(-10+8+8\right)}{47}\\
&=34+\AKA{\dfrac{4\times 6}{47}}\TF{式A}
\end{align}
$$
$4\times 6 \lt 47$なので、式Aの赤い部分は
$0 \lt \dfrac{4\times 6}{47} \lt 1$
である。
なので、求める$m$は
$34 \lt m \lt 34+1$
であることが分かる。
解答ト:3, ナ:4
(iii)
ここで、箱ひげ図と四分位数の復習をしておこう。
箱ひげ図と四分位数の復習
第1四分位数
データの下位半分の中央値。
データの大きさが奇数のときは、全体の中央値を除いて偶数にし、その下位半分の中央値をとる。
第2四分位数
中央値に等しい。
第3四分位数
データの上位半分の中央値。
データの大きさが奇数のときは、全体の中央値を除いて偶数にし、その上位半分の中央値をとる。
四分位範囲
第3四分位数$-$第1四分位数。
復習より、$H_{1}$~$H_{4}$は 箱の右側のひげの長さ(図Cの赤線の長さ)にあたる。
図Cを見ながら (a)~(c) を考えよう。
図C中、令和3年の
総平均時間の最大値は、緑の線
行動者平均時間の最小値は、青い線
である。
緑の線は青い線より左にあるので、総平均時間の最大値は行動者平均時間の最小値より小さい。
よって、(a) は正しい。
図C中、平成28年の
総平均時間の四分位範囲は、紫の箱の幅
行動者平均時間の四分位範囲は、黄色の箱の幅
である。
紫の箱の幅は黄色の箱の幅より小さいので、総平均時間の四分位範囲は行動者平均時間の四分位範囲より小さい。
よって、(b) は正しい。
図Cの
$H_{2}$は$H_{1}$の半分より短いので、$\dfrac{H_{2}}{H_{1}} \lt \dfrac{1}{2}$
$H_{4}$は$H_{3}$の半分より長いので、$\dfrac{1}{2} \lt \dfrac{H_{4}}{H_{3}}$
である。
よって
$\dfrac{H_{2}}{H_{1}} \lt \dfrac{H_{4}}{H_{3}}$
だから、(c) は誤り。
以上より、解答群のうち正しいものは
①
である。
解答ニ:1
(2)
問題文中の図4と図5を、図D,図Eとして載せた。
(i)
図Eの行動者平均時間において、
通勤・通学が$60$以下なのは、青い線より左(線を含む)
移動が$75$以下なのは、緑の線より下(線を含む)
なので、問われているのは黄色い部分に含まれる都道府県の数だ。
よって、ヌは
$4$
である。
解答ヌ:4
(ii)
次は「通勤・通学」についての問題だ。
図D,図Eを見ると、
$\mathrm{A}$~$\mathrm{D}$の総平均時間は等しい。
行動者平均時間は$\mathrm{A}$が一番大きい。
言いかえると、
$\ \ $※
$\dfrac{\text{行動者平均時間}}{\text{総平均時間}}$式B
は$\mathrm{A}$が一番大きい。
この理由を問われている。
ということで、総平均時間と行動者平均時間について整理しよう。
総平均時間はデータの平均値だから、
$\text{総平均時間}=\dfrac{\text{すべての値の和}}{\text{データの大きさ}}$
行動者平均時間は$0$以外の値の平均値だから、
$\text{行動者平均時間}=\dfrac{0\text{以外の値の和}}{(\text{データの大きさ})-(0\text{の数})}$
なので、式Bは
$\dfrac{\cfrac{0\text{以外の値の和}}{(\text{データの大きさ})-(0\text{の数})}}{\cfrac{\text{すべての値の和}}{\text{データの大きさ}}}$式B'
とかける。
ここで、
すべての値の和$=0$以外の値の和
だから、式B'はさらに
$\dfrac{\AKA{\cancel{\KURO{0\text{以外の値の和}}}}}{(\text{データの大きさ})-(0\text{の数})}\times\dfrac{\text{データの大きさ}}{\AKA{\cancel{\KURO{\text{すべての値の和}}}}}$
$\qquad=\dfrac{\text{データの大きさ}}{(\text{データの大きさ})-(0\text{の数})}$
と変形できる。
この値が$\mathrm{A}$が一番大きいということは、$\mathrm{A}$の$0$の割合が多いということだ。
よって、選択肢のうちで最も適当なものは
⓪
である。
解答ネ:0
(iii)
さらに、相関係数について復習すると、
復習
データ$\{x_{1},x_{2},\cdots,x_{n}\}$と$\{y_{1},y_{2},\cdots,y_{n}\}$があり、
それぞれの標準偏差を $s_{x}$,$s_{y}$
$\{x\}$と$\{y\}$の共分散を$s_{xy}$
とするとき、$\{x\}$と$\{y\}$の相関係数$r_{xy}$は
$r_{xy}=\dfrac{s_{xy}}{s_{x}\cdot s_{y}}$式E
だった。
式Eに問題文中の表1の値を代入すると、求める相関係数$r$は
$$
\begin{align}
r&=\dfrac{64.4}{11.8\times 7.9}\\
&\doteqdot 0.69
\end{align}
$$
であることが分かる。
解答ノ:4