大学入学共通テスト 2021年(令和3年) 追試 数学ⅠA 第2問 [2] 解説

(1)

(I)~(III)をひとつずつ確認しよう。

(I)

まず、四分位範囲の復習から。

復習

四分位範囲はデータの散らばりを表す値のひとつ。大きいほど散らばりが大きいと考えられる。
四分位範囲$=$第3四分位数$-$第1四分位数

問題文中の散布図(図1)では、
小学生数の散らばりは、
●の分布の縦方向の広がり
外国人数の散らばりは、
○の分布の縦方向の広がり
にあたる。
今は横軸の旅券取得者数は関係ないので、縦方向の広がりだけを見る。

散布図(図1)を見ると、●よりも○の方が広がって分布している。
なので、外国人数の四分位範囲の方が大きいと考えられる。
よって、(I)は誤り。

別解

四分位範囲を求めて比較すると、次のようになる。

というわけで、四分位数の復習から。

復習

値を左から小さい順に並べる。
中央値は、ちょうど真ん中にある数。値の数が偶数のときは、真ん中にある2個の値の平均値。 値の数が奇数のときは、中央値を除いて偶数にして、
左半分の中央値が、第1四分位数。 右半分の中央値が、第3四分位数。 都道府県の$47$個の値の場合、次の図のようになる。

大学入学共通テスト2021年追試 数学ⅠA第2問[2] 復習図

第1四分位数は、左(小さい方)から12番目の都道府県の値 第1四分位数は、右(大きい方)から12番目の都道府県の値 である。

なので、この問題の場合、
四分位範囲$=$大きい方から$12$番目の都道府県の値
$\hspace{110px} -$ 小さい方から$12$番目の都道府県の値
だ。

図Aに、小学生数,外国人数それぞれの、大きい方から$12$番目を緑,小さい方から$12$番目を青で示した。

図A
大学入学共通テスト2021年追試 数学ⅠA第2問[2] 解説図A

図中の
赤い矢印の範囲が小学生数の四分位範囲 オレンジの矢印の範囲が外国人数の四分位範囲 にあたる。

赤い範囲はオレンジの範囲より小さい。
つまり、小学生数の四分位範囲は外国人数の四分位範囲より小さい。
よって、(I)は誤り。

(II)

復習

範囲はデータの散らばりを表す値のひとつ。大きいほど散らばりが大きいと考えられるけど、外れ値の影響が大きい。
範囲$=$最大値$-$最小値

図B
大学入学共通テスト2021年追試 数学ⅠA第2問[2] 解説図B

復習より、
旅券取得者数の範囲は、赤い矢印の範囲 外国人数の範囲は、オレンジの矢印の範囲 だ。

見るからに赤の範囲が大きいけれど、横軸と縦軸で目盛の幅が違うので注意。
問題によっては見た目の幅と実際の値の幅の大小が異なる場合もある。
この問題の場合は大丈夫だけど、念のために確認しておくと、
赤い矢印の範囲は、
約$530-$約$140=$約$390$
オレンジの矢印の範囲は、
約$240-$約$30=$約$210$
なので、赤い矢印の範囲の方が大きい。

旅券取得者数の範囲の方が大きいから、(II)は正しい。

(III)

さらに、相関係数と散布図の復習だ。

復習

以下の散布図は、横軸・縦軸ともに矢印方向が大きい値とする。

大学入学共通テスト2021年追試 数学ⅠA第2問[2] 復習図

左端の図のように すべての点が右上がりの直線上にあれば、相関係数は$+1$

右端の図のように 右下がりの直線上にあれば、
相関係数は$-1$

点の分布が直線的な配置から乱れるにつれて、
相関係数は$0$に近づく

ただし、点が直線的に分布していても、次の図のように縦軸や横軸に平行なときには、相関係数は$0$に近い値になる。

大学入学共通テスト2021年追試 数学ⅠA第2問[2] 復習図

(誤解しないでほしいのだけど、分布の傾きが$0$に近づけば相関係数も$0$に近づくという意味ではない。このへんについてはページをつくって詳しく解説したいけど、当分先の話になるかも。)

特に、下の図のように点が完全に軸に平行に分布しているとき、相関係数は計算できないため存在しない。

大学入学共通テスト2021年追試 数学ⅠA第2問[2] 復習図

問題文中の図1を見ると、小学生数の分布は直線的だけど、ほぼ横軸に平行だ。
一方、外国人数の分布は右上がりの直線に近い。

なので、復習より、外国人数の方の相関係数の方が大きいと考えられる。
よって、(III)は誤り。

以上より、解答群のうち正しい選択肢は

である。

解答ツ:5

(2)

まずは、単純に計算しよう。

問題文中の式
$\displaystyle \overline{x}=\frac{1}{n} \Bigl( x_{1}f_{1}+x_{2}f_{2}+x_{3}f_{3}+\cdots+x_{k}f_{k} \Bigr)$

$x_{2}=x_{1}+h$
$x_{3}=x_{1}+2h$
$\qquad \vdots$
$x_{k}=x_{1}+(k-1)h$

を代入して、平均値$\overline{x}$は
$\displaystyle \overline{x}=\frac{1}{n} \Bigl[ x_{1}f_{1}+(x_{1}+h)f_{2}+(x_{1}+2h)f_{3}$
$\hspace{150px} +\cdots+\{x_{1}+(k-1)h\}f_{k} \Bigr]$
と表せる。

この式の$[\quad ]$の中を展開した
$\displaystyle \overline{x}=\frac{1}{n} \Bigl\{ x_{1}f_{1}+x_{1}f_{2}+hf_{2}+x_{1}f_{3}+2hf_{3}$
$\hspace{150px} +\cdots+x_{1}f_{k}+(k-1)hf_{k} \Bigr\}$
の、$x_{1}$の項と$h$の項に分けると
$\displaystyle \overline{x}=\frac{1}{n} \Bigl[ x_{1} \bigl( \textcolor{red}{f_{1}+f_{2}+f_{3}+\cdots+f_{k}} \bigr)$
$\hspace{120px} +h\bigl\{ f_{2}+2f_{3}+\cdots+(k-1)f_{k} \bigr\} \Bigr]$
と変形できる。

この式の赤い部分は
$f_{1}+f_{2}+f_{3}+f_{4}+\cdots+f_{k}=n$
とかける。

詳しく

$f_{1}$~$f_{k}$はそれぞれの階級の度数なので、この問題だと都道府県の数にあたる。
$f_{1}+f_{2}+f_{3}+f_{4}+\cdots+f_{k}$
はすべての度数の和だから、この問題だと全都道府県数だ。
なので、データの大きさ$n$に等しい。

問題文中の度数分布表を見ると、度数の計が$n$になっている。
このことからも、
$f_{1}+f_{2}+f_{3}+f_{4}+\cdots+f_{k}=n$
であることが分かる。

なので、さらに
$\displaystyle \overline{x}=\frac{1}{n} \Bigl[ nx_{1}$
$\hspace{60px} +h \bigl\{f_{2}+2f_{3}+3f_{4}+\cdots+(k-1)f_{k} \bigr\} \Bigr]$
より
$\displaystyle \overline{x}=\frac{nx_{1}}{n}$
$\hspace{60px} \displaystyle +\frac{h}{n} \bigl\{ f_{2}+2f_{3}+3f_{4}+\cdots+(k-1)f_{k} \bigr\}$
$\phantom{ \overline{x} } \displaystyle =x_{1}+\frac{h}{n} \bigl\{ f_{2}+2f_{3}+3f_{4}+\cdots+(k-1)f_{k} \bigr\}$
$\hspace{250px}$式A
となる。

解答テ:3


式Aを使って、問題文中の図2のヒストグラムから平均値$\overline{x}$を求める。

図2を見ると、階級幅$h$は$100$で、

表C
階級値$x_{1}$$x_{2}$$x_{3}$$x_{4}$$x_{5}$
$100$
度数$f_{1}$$f_{2}$$f_{3}$$f_{4}$$f_{5}$$n$
$25$$14$$3$$1$$47$

であることが分かる。

これを式Aに当てはめて、
$\displaystyle \overline{x}=100+\frac{100}{47}(25+2\cdot 14+3\cdot 3+4\cdot 1)$
より
$\displaystyle \overline{x}=100+\frac{100}{47}\times 113$
$\phantom{ \overline{x} } \doteqdot 240$
である。

解答ト:2, ナ:4, ニ:0

(3)

次に、分散$s^{2}$について考える。

問題文中の式にもあるように、分散$s^{2}$は
$s^{2}=\displaystyle \frac{1}{n} \Bigl\{ (x_{1}-\overline{x})^{2}f_{1}+(x_{2}-\overline{x})^{2}f_{2}$
$\hspace{170px} +\cdots+(x_{k}-\overline{x})^{2}f_{k} \Bigr\}$
とかける。

この式の$\{ \quad \}$の中を展開して
$s^{2}=\displaystyle \frac{1}{n} \Bigl[ \{x_{1}^{2}-2\overline{x}x_{1}+(\overline{x})^{2}\}f_{1}$
$\hspace{100px} +\{x_{2}^{2}-2\overline{x}x_{2}+(\overline{x})^{2}\}f_{2}$
$\hspace{120px} +\cdots+\{x_{k}^{2}-2\overline{x}x_{k}+(\overline{x})^{2}\}f_{k} \Bigr]$
途中式 $\phantom{ s^{2}\displaystyle } \displaystyle =\frac{1}{n} \Bigl\{x_{1}^{2}f_{1}-2\overline{x}x_{1}f_{1}+(\overline{x})^{2}f_{1}$
$\hspace{100px} +x_{2}^{2}f_{2}-2\overline{x}x_{2}f_{2}+(\overline{x})^{2}f_{2}$
$\hspace{120px} +\cdots+x_{k}^{2}f_{k}-2\overline{x}x_{k}f_{k}+(\overline{x})^{2}f_{k} \Bigr\}$
$\overline{x}$がない項,$\overline{x}$の項,$(\overline{x})^{2}$の項に分けて、
$s^{2}=\displaystyle \frac{1}{n} \Bigl\{x_{1}^{2}f_{1}+x_{2}^{2}f_{2}+\cdots+x_{k}^{2}f_{k}$
$\hspace{80px} -2\overline{x}x_{1}f_{1}-2\overline{x}x_{2}f_{2}-\cdots-2\overline{x}x_{k}f_{k}$
$\hspace{100px} +(\overline{x})^{2}f_{1}+(\overline{x})^{2}f_{2}+\cdots+(\overline{x})^{2}f_{k} \Bigr\}$
$\phantom{ s^{2} } \displaystyle =\frac{1}{n} \Bigl[ \bigl( x_{1}^{2}f_{1}+x_{2}^{2}f_{2}+\cdots+x_{k}^{2}f_{k} \bigr)$
$\hspace{80px} -\bigl( 2\overline{x}x_{1}f_{1}+2\overline{x}x_{2}f_{2}+\cdots+2\overline{x}x_{k}f_{k} \bigr)$
$\hspace{100px} +\bigl\{ (\overline{x})^{2}f_{1}+(\overline{x})^{2}f_{2}+\cdots+(\overline{x})^{2}f_{k} \bigr\} \Bigr]$
$\phantom{ s^{2} } \displaystyle =\frac{1}{n} \Bigl\{ \bigl( x_{1}^{2}f_{1}+x_{2}^{2}f_{2}+\cdots+x_{k}^{2}f_{k} \bigr)$
$\hspace{80px} -2\overline{x} \bigl( \textcolor{green}{ x_{1}f_{1}+x_{2}f_{2}+\cdots+x_{k}f_{k} } \bigr)$
$\hspace{100px} +\bigl( \overline{x})^{2} \bigl( \textcolor{red}{ f_{1}+f_{2}+\cdots+f_{k} } \bigr) \Bigr\}$
$\hspace{250px}$式B
と変形できる。

(2)の問題文中の式にもあるように
$\displaystyle \frac{1}{n}(x_{1}f_{1}+x_{2}f_{2}+\cdots+x_{k}f_{k})=\overline{x}$
なので、式Bの緑の部分は
$x_{1}f_{1}+x_{2}f_{2}+\cdots+x_{k}f_{k}=n\overline{x}$
である。

また、(2)でも考えたように、式Bの赤い部分は
$f_{1}+f_{2}+f_{3}+f_{4}+\cdots+f_{k}=n$
だった。

よって、式Bは
$s^{2}=\displaystyle \frac{1}{n} \Bigl\{ \bigl( x_{1}^{2}f_{1}+x_{2}^{2}f_{2}+\cdots+x_{k}^{2}f_{k} \bigr)$
$\hspace{120px} -2\overline{x}\times \textcolor{green}{n\overline{x}}+(\overline{x})^{2}\times \textcolor{red}{n} \Bigr\}$
とかける。

解答ヌ:3, ネ:0

これはさらに
$s^{2}=\displaystyle \frac{1}{n} \Bigl\{ \bigl( x_{1}^{2}f_{1}+x_{2}^{2}f_{2}+\cdots+x_{k}^{2}f_{k} \bigr) -n(\overline{x})^{2} \Bigr\}$
より
$s^{2}=\displaystyle \frac{1}{n} \bigl( x_{1}^{2}f_{1}+x_{2}^{2}f_{2}+\cdots+x_{k}^{2}f_{k} \bigr) -(\overline{x})^{2}$
$\hspace{250px}$式B'
と表せる。

解答ノ:6


表Cに必要な値を書きたすと、表Dができる。

表D
階級値$x_{1}$$x_{2}$$x_{3}$$x_{4}$$x_{5}$
$100$$200$$300$$400$$500$
度数$f_{1}$$f_{2}$$f_{3}$$f_{4}$$f_{5}$$n$
$4$$25$$14$$3$$1$$47$

これとトナニを式B'に当てはめて、
$s^{2}=\displaystyle \frac{1}{47} \Bigl( 100^{2}\cdot 4+200^{2}\cdot 25+300^{2}\cdot 14$
$\hspace{120px} +400^{2}\cdot 3+500^{2}\cdot 1 \Bigr) -240^{2}$
途中式 より
$s^{2}=\displaystyle \frac{1}{47}\cdot 100^{2} \Bigl( 1\cdot 4+2^{2}\cdot 25+3^{2}\cdot 14$
$\hspace{120px} +4^{2}\cdot 3+5^{2}\cdot 1\Bigr) -24^{2}\cdot 10^{2}$
$\phantom{ s^{2} } \displaystyle =10^{2} \Bigl\{ \frac{1}{47}\cdot 10^{2} \bigl( 4+100+126+48+25 \bigr) -24^{2} \Bigr\}$
$\phantom{ s^{2} } \displaystyle =10^{2} \Bigl( \frac{1}{47}\cdot 10^{2}\cdot 303-576 \Bigr)$
$\phantom{ s^{2} } \doteqdot 10^{2}(6.45\cdot 10^{2}-576)$
$\phantom{ s^{2} } \doteqdot 69\cdot 10^{2}$
$\phantom{ s^{2} } \doteqdot 6900$
となる。

よって、正しい選択肢は

だ。

解答ハ:3