大学入学共通テスト 2022年(令和4年) 試作問題 数学ⅠA 第2問 [2] 解説

(1)

まず、データの代表値と四分位数の復習から。

復習

平均値
データの値の和をデータの大きさで割ったもの。小学校以来使ってきた「平均」のこと。

中央値
データを大きい順(小さい順でもいいけど)に並べたとき、中央になる値。データの大きさが偶数のときには、中央2数の平均値。

最頻値
データ中で最も個数が多い値。度数分布表や度数分布図では、度数が最も多い階級の階級値。

復習

大学入学共通テスト2022年試作問題 数学ⅠA第2問[2] 復習図

第1四分位数
データの下位半分の中央値。
データの大きさが奇数のときは、全体の中央値を除いて偶数にし、その下位半分の中央値をとる。

第2四分位数
中央値に等しい。

第3四分位数
データの上位半分の中央値。
データの大きさが奇数のときは、全体の中央値を除いて偶数にし、その上位半分の中央値をとる。

四分位範囲
第3四分位数$-$第1四分位数。

復習より、問題文中の枠で囲んだデータについて、
第1四分位数は、数が小さい方から$10$番目と$11$番目の値の平均値なので、$13$ 第3四分位数は、数が大きい方から$10$番目と$11$番目の値の平均値なので、$25$ だから、四分位範囲は
$25-13=12$
である。

解答タ:1, チ:2

よって、外れ値は

「(第1四分位数)$-1.5\times$(四分位範囲)」以下
より
$13-1.5\times 12=-5$ 以下
だけど、これに当てはまる値はない。

「(第3四分位数)$+1.5\times$(四分位範囲)」以上
より
$25+1.5\times 12=43$ 以上
だけど、これに当てはまる値は、
$56$,$48$,$47$
の3つある。

以上より、外れ値は全部で3つある。

解答ツ:3

(2)

(i)

次に、「1kmあたりの所要時間」を考える。

問題文中の図1にすこし描きたして、図Aをつくった。

図Aは、
横軸が移動距離 縦軸が所要時間 だから、「所要時間」$\div$「移動距離」は、原点とそれぞれの点の間の
$\dfrac{\text{縦軸方向の増加量}}{\text{横軸方向の増加量}}=\text{直線の傾き}$
にあたる。

例えば、点Bの空港の場合、
「1kmあたりの所要時間」$=$赤い直線の傾き
だ。

図A
大学入学共通テスト2022年試作問題 数学ⅠA第2問[2] 解説図A

図Aを見ると、直線の傾きが

最大であるのは 赤い直線
これは$(6,36)$付近にある点$\mathrm{B}$を通るから、直線の傾きは
$\dfrac{36}{6}=6$
ぐらい

最小であるのは 青い直線
これは$(15,10)$付近にある点$\mathrm{D}$を通るから、直線の傾きは
$\dfrac{10}{15}\doteqdot 0.67$
ぐらい

であることが分かる。

よって、「1kmあたりの所要時間」が
最大なのは点$\mathrm{B}$で、最大値は$6$ぐらい 最小なのは点$\mathrm{D}$で、最小値は$0.6$~$0.7$ぐらい だ。


の選択肢の箱ひげ図を見ると、これに当てはまるものは
最大の外れ値が$6$前後 最小値が$0.6$~$0.7$前後 である②しかない。

解答テ:2

④がちょっと紛らわしいけど、最小の外れ値が$0.8$くらいなので、不適。

また、②の箱ひげ図には外れ値が2つある。

ひとつは点$\mathrm{B}$なのは明らか。
もうひとつは点$\mathrm{B}$の次に直線の傾きが大きい点なので、点$\mathrm{A}$だと考えられる。

解答ト:0, ナ:1 (順不同)

(ii)

(Ⅰ),(Ⅱ),(Ⅲ) それぞれを、記述が正しいかどうか検討してゆこう。

(Ⅰ)

「費用」と「所要時間」についての記述なので、問題文中の図2を見る。

新空港は、「費用」も「所要時間」も平均値と等しい。

なので、(Ⅰ)の記述が正しいなら、図2の白丸はすべて
「費用」の平均値よりも下 「所要時間」の平均値よりも右 に分布しているはず。

そうはなっていないので、(Ⅰ)は誤り。


(Ⅱ),(Ⅲ) はちょっと説明しないといけない。
長くなるかもだけど、いい機会だし、復習もかねてちゃんと理解しておこう。


「平均値」について考えてみる。
問題の空港のデータはサイズが大きいし、説明にはもっと単純なのがいい。

表B
持っている
ドーナツの数
A君$2$個
B君$6$個

ここでは、表Bのような$2$人のデータを使うことにする。
なぜドーナツかって?私が今食べたいからです。

それで、このデータの平均値は$4$個だ。
これは、ドーナツを同じ個数に分けたときの、一人あたりの取り分だともいえる。

なので、このデータに ドーナツを平均値と同じ $4$個持っているC君を加えて

表C
持っている
ドーナツの数
A君$2$個
B君$6$個
C君$4$個

としても、一人あたりの取り分は変わらないから、平均値は変わらない。


さらに、表Cのデータに、ドーナツを持っていないD君を加えてみる。

表D
持っている
ドーナツの数
A君$2$個
B君$6$個
C君$4$個
D君$0$個

このとき、D君を加える前後で
値(ドーナツの数)の合計は変わらない データの大きさ(人数)は $3$→$4$ になっている。

したがって、平均値は、
E君を加える前は、$\dfrac{(\text{ドーナツの合計})}{3}$
E君を加えたあとは、$\dfrac{(\text{ドーナツの合計})}{4}$

だ。

よって、E君を加えたことで、平均値は
$\dfrac{\dfrac{(\text{ドーナツの合計)}}{4}}{\dfrac{(\text{ドーナツの合計})}{3}}=\dfrac{3}{4}$
になる。


以上より、データに値を加える場合、
加えた値が平均値と等しければ、
平均値は変わらない

加えた値が$0$であれば、平均値は
$\dfrac{(\text{値を加える前のデータの大きさ})}{(\text{値を加えたあとのデータの大きさ})}$
になる※※

ことが分かる。

これを頭に入れて、問題を解こう。

(Ⅱ)

まず、新空港は「移動距離」「所要時間」「費用」ともに平均値と等しいので、※より、この空港を加えても平均値は3つとも変わらない。

で、(Ⅱ)では標準偏差について問われている。
標準偏差は

復習

標準偏差$=\sqrt{\text{分散}}$

だった。

ということで、さらに分散についての復習だ。

復習

分散は、平均値からの偏差の2乗の平均値である。

なので、問題文の(1)に載っている空港の移動距離のデータを使って分散を求めると、次のようになる。

これは説明のための作業で、共通テスト本番でこの計算をする必要はない。

また、式を短くするために、
「移動距離」を「距」 「所要時間」を「時」 「費用」を「費」 「新空港を加える前」を「(前)」 「新空港を加えた後」を「(後)」 「平均値からの偏差」を「偏差」 と書くことにする。


各空港の移動距離から平均値の$22$を引いたものを2乗すると、各空港の移動距離の偏差の2乗が求められる(表Eの緑の列)。

表E
移動距離偏差の2乗
空港1$56$$(56-22)^{2}$
空港2$48$$(48-22)^{2}$
空港3$47$$(47-22)^{2}$
$\vdots$ $\vdots$$\vdots$
空港40$6$$(6-22)^{2}$
平均値$22$分散(前)

表Eの緑の部分の平均値が、分散(前)だ。

表Eのデータに、新空港を加える。
新空港の移動距離は平均値と同じ$22$なので、偏差の2乗は$0$だ。
したがって、※※より、分散(後)は、分散(前)の
$\dfrac{40}{41}$倍
になる。

よって、
$\text{距の分散(後)}=\dfrac{40}{41}\times \text{距の分散(前)}$
と表せる。

この式の両辺の正の平方根をとって、
$$ \begin{align} \sqrt{\text{距の分散(後)}}&=\sqrt{\dfrac{40}{41}\times \text{距の分散(前)}}\\ &=\sqrt{\dfrac{40}{41}}\times\sqrt{\text{距の分散(前)}} \end{align} $$

$\sqrt{\text{分散}}=\text{標準偏差}$ だから、これはさらに
$\text{距の標準偏差(後)}=\sqrt{\dfrac{40}{41}}\times \text{距の標準偏差(前)}$
式A
とかける。

なので、(Ⅱ)は誤り。

同様に考えると、
時の標準偏差(後)$=\sqrt{\dfrac{40}{41}}\times$時の標準偏差(前)
式B
費の標準偏差(後)$=\sqrt{\dfrac{40}{41}}\times$費の標準偏差(前)

であることが分かる。

(Ⅲ)

(Ⅲ)で問われているのは、相関係数だ。
例えば「移動距離」と「所要時間」の相関係数は、

復習

$$ \begin{align} &\text{距と時の相関係数}\\ &\qquad=\dfrac{\text{距と時の共分散}}{\text{距の標準偏差}\times\text{時の標準偏差}} \end{align} $$

だった。
ということで、さらに共分散についての復習だ。

復習

共分散は、大きさが同じ2つのデータの偏差の積(以後「交差積」と書く)の平均値である。

なので、問題の空港の移動距離と所要時間の共分散を求めると、次のようになる。
これも説明のための作業で、共通テスト本番でこの計算をする必要はない。


各空港の移動距離から平均値の$22$を引いたものと、所要時間から平均値の$38$を引いたものをかけ合わせると、各空港の移動距離と所要時間の交差積が求められる(表Fの緑の列)。

各空港の所要時間は問題に載ってないので、ここでは$t_{1}$~$t_{40}$とした。

表F
移動距離所要時間交差積
空港1$56$ $t_{1}$$(56-22)(t_{1}-38)$
空港2$48$ $t_{2}$$(48-22)(t_{2}-38)$
空港3$47$ $t_{3}$$(47-22)(t_{3}-38)$
$\vdots$ $\vdots$ $\vdots$$\vdots$
空港40$6$ $t_{40}$$(6-22)(t_{40}-38)$
平均値$22$ $38$共分散(前)

表Fの緑の部分の平均値が、共分散(前)だ。

表Fのデータに、新空港を加える。
新空港の移動距離も所要時間も平均値と同じなので、交差積は$0$だ。
したがって、※※より、共分散(後)は 共分散(前)の
$\dfrac{40}{41}$倍
になるから、
$\text{距と時の共分散(後)}=\dfrac{40}{41}\times \text{距と時の共分散(前)}$
式C
と表せる。

復習より、

$$ \begin{align} &\text{距と時の相関係数(後)}\\ &\qquad =\dfrac{\text{距と時の共分散(後)}}{\text{距の標準偏差(後)}\times \text{時の標準偏差(後)}} \end{align} $$

とかける。

これに 式A,式B,式Cを代入すると

$$ \begin{align} &\text{距と時の相関係数(後)}\\ &\qquad =\dfrac{\textcolor{red}{\cancel{\textcolor{black}{\frac{40}{41}}}}\times \text{距と時の共分散(前)}}{\textcolor{red}{\cancel{\textcolor{black}{\sqrt{\frac{40}{41}}}}} \left( \begin{aligned} &\text{距の標準}\\&\text{偏差(前)} \end{aligned} \right) \times \textcolor{red}{\cancel{\textcolor{black}{\sqrt{\frac{40}{41}}}}} \left( \begin{aligned} &\text{時の標準}\\&\text{偏差(前)} \end{aligned} \right) }\\ &\qquad =\dfrac{\text{距と時の共分散(前)}}{\text{距の標準偏差(前)}\times \text{時の標準偏差(前)}} \end{align} $$

となるけど、この式の右辺は相関係数(前)なので
$\text{距と時の相関係数(後)}=\text{距と時の相関係数(前)}$
だ。

以上より、新空港を加える前後で、図1の「移動距離」と「所要時間」の相関係数は変化しない。

同様に、図2と図3の変量の相関係数も変化しない。

なので、(Ⅲ)は正しい。


したがって、解答群のうち正しいものは

である。

解答ニ:6

アドバイス

説明は長かったけれど、これをちゃんと理解すれば、(Ⅱ),(Ⅲ)の正誤は見た瞬間に分かるようになる。

(3)

硬貨が$20$枚以上表になる割合は、問題文中の「実験結果」の「表の枚数」が$20$から$30$までの「割合」を全部たした
$$ \begin{align} 3.2+1.4+& 1.0+0.0+0.1+0.0+0.1\\ &+0.0+0.0+0.0+0.0=5.8 [%] \end{align} $$ である。

解答ヌ:5, ネ:8

$1000$回は十分に多い数だとすると、実験結果より
$\dfrac{1}{2}$の確率で起こる事象が $30$回中$20$回以上起こる割合は、$ 5.8\%$ であると考えられる。

このことから、
「便利だと思う」と回答する割合と回答しない割合が等しいとき、$30$人中$20$人以上が「便利だと思う」と回答する割合は $ 5.8\%$ だといえる。

$ 5.8\%$は確かにレアなケースだけど、「方針」で決めた$ 5\%$よりはレアじゃない。
なので、「方針」でたてた仮説は誤っているとは判断されない。

解答ノ:1

したがって、P空港は便利だと思う人の方が多いとはいえないことになる。

解答ハ:1