大学入学共通テスト 2022年(令和4年) 試作問題 数学ⅠA 第2問 [2] 解説
(1)
まず、データの代表値と四分位数の復習から。
復習
平均値
データの値の和をデータの大きさで割ったもの。小学校以来使ってきた「平均」のこと。
中央値
データを大きい順(小さい順でもいいけど)に並べたとき、中央になる値。データの大きさが偶数のときには、中央2数の平均値。
最頻値
データ中で最も個数が多い値。度数分布表や度数分布図では、度数が最も多い階級の階級値。
復習
第1四分位数
データの下位半分の中央値。
データの大きさが奇数のときは、全体の中央値を除いて偶数にし、その下位半分の中央値をとる。
第2四分位数
中央値に等しい。
第3四分位数
データの上位半分の中央値。
データの大きさが奇数のときは、全体の中央値を除いて偶数にし、その上位半分の中央値をとる。
四分位範囲
第3四分位数$-$第1四分位数。
復習より、問題文中の枠で囲んだデータについて、
第1四分位数は、数が小さい方から$10$番目と$11$番目の値の平均値なので、$13$
第3四分位数は、数が大きい方から$10$番目と$11$番目の値の平均値なので、$25$
だから、四分位範囲は
$25-13=12$
である。
解答タ:1, チ:2
よって、外れ値は
「(第1四分位数)$-1.5\times$(四分位範囲)」以下
より
$13-1.5\times 12=-5$ 以下
だけど、これに当てはまる値はない。
「(第3四分位数)$+1.5\times$(四分位範囲)」以上
より
$25+1.5\times 12=43$ 以上
だけど、これに当てはまる値は、
$56$,$48$,$47$
の3つある。
以上より、外れ値は全部で3つある。
解答ツ:3
(2)
(i)
次に、「1kmあたりの所要時間」を考える。
問題文中の図1にすこし描きたして、図Aをつくった。
図Aは、
横軸が移動距離
縦軸が所要時間
だから、「所要時間」$\div$「移動距離」は、原点とそれぞれの点の間の
$\dfrac{\text{縦軸方向の増加量}}{\text{横軸方向の増加量}}=\text{直線の傾き}$
にあたる。
例えば、点Bの空港の場合、
「1kmあたりの所要時間」$=$赤い直線の傾き
だ。
図Aを見ると、直線の傾きが
最大であるのは 赤い直線
これは$(6,36)$付近にある点$\mathrm{B}$を通るから、直線の傾きは
$\dfrac{36}{6}=6$
ぐらい
最小であるのは 青い直線
これは$(15,10)$付近にある点$\mathrm{D}$を通るから、直線の傾きは
$\dfrac{10}{15}\doteqdot 0.67$
ぐらい
であることが分かる。
よって、「1kmあたりの所要時間」が
最大なのは点$\mathrm{B}$で、最大値は$6$ぐらい
最小なのは点$\mathrm{D}$で、最小値は$0.6$~$0.7$ぐらい
だ。
テの選択肢の箱ひげ図を見ると、これに当てはまるものは
最大の外れ値が$6$前後
最小値が$0.6$~$0.7$前後
である②しかない。
解答テ:2
④がちょっと紛らわしいけど、最小の外れ値が$0.8$くらいなので、不適。
また、②の箱ひげ図には外れ値が2つある。
ひとつは点$\mathrm{B}$なのは明らか。
もうひとつは点$\mathrm{B}$の次に直線の傾きが大きい点なので、点$\mathrm{A}$だと考えられる。
解答ト:0, ナ:1 (順不同)
(ii)
(Ⅰ),(Ⅱ),(Ⅲ) それぞれを、記述が正しいかどうか検討してゆこう。
(Ⅰ)
「費用」と「所要時間」についての記述なので、問題文中の図2を見る。
新空港は、「費用」も「所要時間」も平均値と等しい。
なので、(Ⅰ)の記述が正しいなら、図2の白丸はすべて
「費用」の平均値よりも下
「所要時間」の平均値よりも右
に分布しているはず。
そうはなっていないので、(Ⅰ)は誤り。
(Ⅱ),(Ⅲ) はちょっと説明しないといけない。
長くなるかもだけど、いい機会だし、復習もかねてちゃんと理解しておこう。
「平均値」について考えてみる。
問題の空港のデータはサイズが大きいし、説明にはもっと単純なのがいい。
| 持っている ドーナツの数 | |
|---|---|
| A君 | $2$個 |
| B君 | $6$個 |
ここでは、表Bのような$2$人のデータを使うことにする。
なぜドーナツかって?私が今食べたいからです。
それで、このデータの平均値は$4$個だ。
これは、ドーナツを同じ個数に分けたときの、一人あたりの取り分だともいえる。
なので、このデータに ドーナツを平均値と同じ $4$個持っているC君を加えて
| 持っている ドーナツの数 | |
|---|---|
| A君 | $2$個 |
| B君 | $6$個 |
| C君 | $4$個 |
としても、一人あたりの取り分は変わらないから、平均値は変わらない。
さらに、表Cのデータに、ドーナツを持っていないD君を加えてみる。
| 持っている ドーナツの数 | |
|---|---|
| A君 | $2$個 |
| B君 | $6$個 |
| C君 | $4$個 |
| D君 | $0$個 |
このとき、D君を加える前後で
値(ドーナツの数)の合計は変わらない
データの大きさ(人数)は $3$→$4$
になっている。
したがって、平均値は、
E君を加える前は、$\dfrac{(\text{ドーナツの合計})}{3}$
E君を加えたあとは、$\dfrac{(\text{ドーナツの合計})}{4}$
だ。
よって、E君を加えたことで、平均値は
$\dfrac{\dfrac{(\text{ドーナツの合計)}}{4}}{\dfrac{(\text{ドーナツの合計})}{3}}=\dfrac{3}{4}$
になる。
以上より、データに値を加える場合、
加えた値が平均値と等しければ、
平均値は変わらない※
加えた値が$0$であれば、平均値は
$\dfrac{(\text{値を加える前のデータの大きさ})}{(\text{値を加えたあとのデータの大きさ})}$
になる※※
ことが分かる。
これを頭に入れて、問題を解こう。
(Ⅱ)
まず、新空港は「移動距離」「所要時間」「費用」ともに平均値と等しいので、※より、この空港を加えても平均値は3つとも変わらない。
で、(Ⅱ)では標準偏差について問われている。
標準偏差は
復習
標準偏差$=\sqrt{\text{分散}}$
だった。
ということで、さらに分散についての復習だ。
復習
分散は、平均値からの偏差の2乗の平均値である。
なので、問題文の(1)に載っている空港の移動距離のデータを使って分散を求めると、次のようになる。
これは説明のための作業で、共通テスト本番でこの計算をする必要はない。
また、式を短くするために、
「移動距離」を「距」
「所要時間」を「時」
「費用」を「費」
「新空港を加える前」を「(前)」
「新空港を加えた後」を「(後)」
「平均値からの偏差」を「偏差」
と書くことにする。
各空港の移動距離から平均値の$22$を引いたものを2乗すると、各空港の移動距離の偏差の2乗が求められる(表Eの緑の列)。
| 移動距離 | 偏差の2乗 | |
|---|---|---|
| 空港1 | $56$ | $(56-22)^{2}$ |
| 空港2 | $48$ | $(48-22)^{2}$ |
| 空港3 | $47$ | $(47-22)^{2}$ |
| $\vdots$ | $\vdots$ | $\vdots$ |
| 空港40 | $6$ | $(6-22)^{2}$ |
| 平均値 | $22$ | 分散(前) |
表Eの緑の部分の平均値が、分散(前)だ。
表Eのデータに、新空港を加える。
新空港の移動距離は平均値と同じ$22$なので、偏差の2乗は$0$だ。
したがって、※※より、分散(後)は、分散(前)の
$\dfrac{40}{41}$倍
になる。
よって、
$\text{距の分散(後)}=\dfrac{40}{41}\times \text{距の分散(前)}$
と表せる。
この式の両辺の正の平方根をとって、
$$
\begin{align}
\sqrt{\text{距の分散(後)}}&=\sqrt{\dfrac{40}{41}\times \text{距の分散(前)}}\\
&=\sqrt{\dfrac{40}{41}}\times\sqrt{\text{距の分散(前)}}
\end{align}
$$
$\sqrt{\text{分散}}=\text{標準偏差}$ だから、これはさらに
$\text{距の標準偏差(後)}=\sqrt{\dfrac{40}{41}}\times \text{距の標準偏差(前)}$
式A
とかける。
なので、(Ⅱ)は誤り。
同様に考えると、
時の標準偏差(後)$=\sqrt{\dfrac{40}{41}}\times$時の標準偏差(前)
式B
費の標準偏差(後)$=\sqrt{\dfrac{40}{41}}\times$費の標準偏差(前)
であることが分かる。
(Ⅲ)
(Ⅲ)で問われているのは、相関係数だ。
例えば「移動距離」と「所要時間」の相関係数は、
復習
$$ \begin{align} &\text{距と時の相関係数}\\ &\qquad=\dfrac{\text{距と時の共分散}}{\text{距の標準偏差}\times\text{時の標準偏差}} \end{align} $$
だった。
ということで、さらに共分散についての復習だ。
復習
共分散は、大きさが同じ2つのデータの偏差の積(以後「交差積」と書く)の平均値である。
なので、問題の空港の移動距離と所要時間の共分散を求めると、次のようになる。
これも説明のための作業で、共通テスト本番でこの計算をする必要はない。
各空港の移動距離から平均値の$22$を引いたものと、所要時間から平均値の$38$を引いたものをかけ合わせると、各空港の移動距離と所要時間の交差積が求められる(表Fの緑の列)。
各空港の所要時間は問題に載ってないので、ここでは$t_{1}$~$t_{40}$とした。
| 移動距離 | 所要時間 | 交差積 | |
|---|---|---|---|
| 空港1 | $56$ | $t_{1}$ | $(56-22)(t_{1}-38)$ |
| 空港2 | $48$ | $t_{2}$ | $(48-22)(t_{2}-38)$ |
| 空港3 | $47$ | $t_{3}$ | $(47-22)(t_{3}-38)$ |
| $\vdots$ | $\vdots$ | $\vdots$ | $\vdots$ |
| 空港40 | $6$ | $t_{40}$ | $(6-22)(t_{40}-38)$ |
| 平均値 | $22$ | $38$ | 共分散(前) |
表Fの緑の部分の平均値が、共分散(前)だ。
表Fのデータに、新空港を加える。
新空港の移動距離も所要時間も平均値と同じなので、交差積は$0$だ。
したがって、※※より、共分散(後)は 共分散(前)の
$\dfrac{40}{41}$倍
になるから、
$\text{距と時の共分散(後)}=\dfrac{40}{41}\times \text{距と時の共分散(前)}$
式C
と表せる。
復習より、
$$ \begin{align} &\text{距と時の相関係数(後)}\\ &\qquad =\dfrac{\text{距と時の共分散(後)}}{\text{距の標準偏差(後)}\times \text{時の標準偏差(後)}} \end{align} $$
とかける。
これに 式A,式B,式Cを代入すると
$$ \begin{align} &\text{距と時の相関係数(後)}\\ &\qquad =\dfrac{\textcolor{red}{\cancel{\textcolor{black}{\frac{40}{41}}}}\times \text{距と時の共分散(前)}}{\textcolor{red}{\cancel{\textcolor{black}{\sqrt{\frac{40}{41}}}}} \left( \begin{aligned} &\text{距の標準}\\&\text{偏差(前)} \end{aligned} \right) \times \textcolor{red}{\cancel{\textcolor{black}{\sqrt{\frac{40}{41}}}}} \left( \begin{aligned} &\text{時の標準}\\&\text{偏差(前)} \end{aligned} \right) }\\ &\qquad =\dfrac{\text{距と時の共分散(前)}}{\text{距の標準偏差(前)}\times \text{時の標準偏差(前)}} \end{align} $$
となるけど、この式の右辺は相関係数(前)なので
$\text{距と時の相関係数(後)}=\text{距と時の相関係数(前)}$
だ。
以上より、新空港を加える前後で、図1の「移動距離」と「所要時間」の相関係数は変化しない。
同様に、図2と図3の変量の相関係数も変化しない。
なので、(Ⅲ)は正しい。
したがって、解答群のうち正しいものは
⑥
である。
解答ニ:6
アドバイス
説明は長かったけれど、これをちゃんと理解すれば、(Ⅱ),(Ⅲ)の正誤は見た瞬間に分かるようになる。
(3)
硬貨が$20$枚以上表になる割合は、問題文中の「実験結果」の「表の枚数」が$20$から$30$までの「割合」を全部たした
$$
\begin{align}
3.2+1.4+& 1.0+0.0+0.1+0.0+0.1\\
&+0.0+0.0+0.0+0.0=5.8 [%]
\end{align}
$$
である。
解答ヌ:5, ネ:8
$1000$回は十分に多い数だとすると、実験結果より
$\dfrac{1}{2}$の確率で起こる事象が $30$回中$20$回以上起こる割合は、$ 5.8\%$
であると考えられる。
このことから、
「便利だと思う」と回答する割合と回答しない割合が等しいとき、$30$人中$20$人以上が「便利だと思う」と回答する割合は $ 5.8\%$
だといえる。
$ 5.8\%$は確かにレアなケースだけど、「方針」で決めた$ 5\%$よりはレアじゃない。
なので、「方針」でたてた仮説は誤っているとは判断されない。
解答ノ:1
したがって、P空港は便利だと思う人の方が多いとはいえないことになる。
解答ハ:1