大学入学共通テスト 2021年(令和3年) 追試 数学ⅡB 第3問 解説

(1) ア~シ

問題文より、各コースの人数の和$=$留学生の数 なので、
$20\%+35\%+$アイ$\%=100\%$
アイ$\%=100\%-20\%-35\%$
               $=45\%$
である。

解答ア:4, イ:5

よって、留学生を一人選んだ場合、その留学生が登録しているのが、
初級コースである確率は$\displaystyle \frac{20}{100}$ 中級コースの確率は$\displaystyle \frac{35}{100}$ 上級コースの確率は$\displaystyle \frac{45}{100}$ となる。

このことから、確率変数$X$の確率分布表をつくると、表Aができる。

表A
コース初級中級上級
$X$ $10$ $8$ $6$
確率$\displaystyle \frac{20}{100}$ $\displaystyle \frac{35}{100}$ $\displaystyle \frac{45}{100}$ $1$

表Aより、$X$の期待値$E(X)$は
$E(X)=10\displaystyle \cdot\frac{20}{100}+8\cdot\frac{35}{100}+6\cdot\frac{45}{100}$
途中式 $\phantom{ E(X)\displaystyle } \displaystyle =\frac{10\cdot 20+8\cdot 35+6\cdot 45}{100}$
$\phantom{ E(X)\displaystyle } \displaystyle =\frac{2 \cdot 5 \cdot(20+4\cdot 7+3\cdot 9)}{100}$
$\phantom{ E(X)\displaystyle } \displaystyle =\frac{2 \cdot 5 \cdot 75}{100}$
$\phantom{ E(X)\displaystyle } \displaystyle =\frac{15}{2}$

解答ウ:1, エ:5

$X$の分散$V(X)$は、
$V(X)=(10-E(X))^{2}\displaystyle \cdot\frac{20}{100}$
              $\displaystyle +(8-E(X))^{2}\cdot\frac{35}{100}$
                $\displaystyle +(6-E(X))^{2}\cdot\frac{45}{100}$
途中式 より
$V(X)=\displaystyle \left(10-\frac{15}{2}\right)^{2}\cdot\frac{20}{100}$
              $\displaystyle +\left(8-\frac{15}{2}\right)^{2}\cdot\frac{35}{100}$
                $\displaystyle +\left(6-\frac{15}{2}\right)^{2}\cdot\frac{45}{100}$
$\phantom{ V(X)\displaystyle } \displaystyle =\left(\frac{5}{2}\right)^{2}\cdot\frac{20}{100}+\left(\frac{1}{2}\right)^{2}\cdot\frac{35}{100}$
                $\displaystyle +\left(-\frac{3}{2}\right)^{2}\cdot\frac{45}{100}$
$\phantom{ V(X)\displaystyle } \displaystyle =\frac{5\cdot(5\cdot 20+1\cdot 7+9\cdot 9)}{4\cdot 100}$
$\phantom{ V(X)\displaystyle } \displaystyle =\frac{5\cdot 188}{4\cdot 100}$
$\phantom{ V(X)\displaystyle } \displaystyle =\frac{47}{20}$
となる。

解答オ:4, カ:7

別解

オカについては、

公式

$V(X)=E(X^{2})-\{E(X)\}^{2}$

を使う方法もある。
この問題では計算が面倒になるけど、あえて計算すると次のようになる。

表Aより、$X^{2}$の期待値$E(X^{2})$は、
$E(X^{2})=10^{2}\displaystyle \cdot\frac{20}{100}+8^{2}\cdot\frac{35}{100}+6^{2}\cdot\frac{45}{100}$
途中式 $\phantom{ E(X)\displaystyle } \displaystyle =\frac{10^{2}\cdot 20+8^{2}\cdot 35+6^{2}\cdot 45}{100}$
$\phantom{ E(X)\displaystyle } \displaystyle =\frac{2^{2}\cdot 5\cdot(10^{2}+4^{2}\cdot 7+3^{2}\cdot 9)}{100}$
$\phantom{ E(X)\displaystyle } \displaystyle =\frac{2^{2}\cdot 5\cdot 293}{100}$

ウエより、$\{E(X)\}^{2}$は、
$\displaystyle \{E(X)\}^{2}=\left(\frac{15}{2}\right)^{2}$

なので、分散$V(X)$は、
$V(X)=\displaystyle \frac{2^{2}\cdot 5\cdot 293}{100}-\left(\frac{15}{2}\right)^{2}$
途中式 $\phantom{ V(X) } \displaystyle =\frac{2^{2}\cdot 293}{20}-\frac{15^{2}\times 5}{2^{2}\times 5}$
$\phantom{ V(X) } \displaystyle =\frac{1172-1125}{20}$
$\phantom{ V(X) } \displaystyle =\frac{47}{20}$
となる。

解答オ:4, カ:7

ここで、問題文に二項分布が出てきたから、復習だ。

復習

確率$p$で事象$A$が起こる試行を$n$回くり返す。
このとき、事象$A$が起こる回数$Y$は、二項分布
$B(n,p)$
に従う。

この確率変数$Y$の
平均は、$np$
分散は、$np(1-p)$
標準偏差は、$\sqrt{np(1-p)}$
である。

初級コースに登録している留学生は、留学生全体の$20\displaystyle \%=\frac{1}{5}$だった。
なので、留学生全体の母集団から$a$人抽出したときに含まれる初級コースの人数$Y$は、
$a$回の反復試行をしたとき、確率$\displaystyle \frac{1}{5}$の事象が起こる回数 と同じだ。
つまり、$Y$は反復試行における事象の起こる回数なので、二項分布
$\displaystyle B\left(a,\frac{1}{5}\right)$
に従う。

復習より、確率変数$Y$の平均$E(Y)$は
$E(Y)=a\displaystyle \cdot\frac{1}{5}$
$\phantom{ E(Y) } \displaystyle =\frac{a}{5}$

解答キ:a, ク:5

標準偏差$\sigma(Y)$は
$\sigma(Y)=\displaystyle \sqrt{a\cdot\frac{1}{5}\cdot\left(1-\frac{1}{5}\right)}$
$\phantom{ \sigma(Y) } \displaystyle =\displaystyle \frac{2\sqrt{a}}{5}$
である。

同様に、上級者コースの人数$Z$は、二項分布
$\displaystyle B\left(a,\frac{45}{100}\right)=B\left(a,\frac{9}{20}\right)$
に従うので、標準偏差$\sigma(Z)$は
$\sigma(Z)=\displaystyle \sqrt{a\cdot\frac{9}{20}\cdot\left(1-\frac{9}{20}\right)}$
$\phantom{ \sigma(Z) } \displaystyle =\frac{3\sqrt{11a}}{20}$
となる。

以上より、
$\displaystyle \frac{\sigma(Z)}{\sigma(Y)}=\frac{\frac{3\sqrt{11a}}{20}}{\frac{2\sqrt{a}}{5}}$
途中式 $\displaystyle \phantom{ \frac{\sigma(Z)}{\sigma(Y)} } \displaystyle =\frac{3\sqrt{11a}}{20}\times\frac{5}{2\sqrt{a}}$
$\displaystyle \phantom{ \frac{\sigma(Z)}{\sigma(Y)} } \displaystyle =\frac{3\sqrt{11}}{4\cdot 2}$
$\displaystyle \phantom{ \frac{\sigma(Z)}{\sigma(Y)} } \displaystyle =\frac{3\sqrt{11}}{8}$
である。

解答ケ:3, コ:1, サ:1, シ:8

(1) ス

さらに、$Y$が$28$以上である確率$p$を求める。

長くなるので、解説は最小限にとどめる。
詳しい考え方はこのページを見てほしい。

復習

$n$が十分に大きいとき、二項分布
$B(n,p)$
は、正規分布
$N(np,np(1-p))$
で近似できる。

$a=100$なので、$Y$が従う確率分布は
$\displaystyle B\left(100,\frac{1}{5}\right)$
だ。

これは、復習より、正規分布
$\displaystyle N\left(100\cdot\frac{1}{5},100\cdot\frac{1}{5}\cdot\left(1-\frac{1}{5}\right)\right)$
  $=N(20,16)$
で近似できる。

$N(20,16)$の確率分布図を描くと、図Aができる。

図A
大学入学共通テスト2021年追試 数学ⅡB 第3問 解説図A

この図が正確に描けるようになる必要はない。
イメージが頭の中に描ければ大丈夫。

で、図Aの赤い部分の面積が、求める確率$p$だ。


正規分布表を使って 赤い部分の面積を求めるんだけど、表に載っているのは、標準正規分布の
$N(0,1)$
なので、図Aのグラフの
$N(20,16)$
のままでは使えない。
仕方がないから$N(20,16)$を標準化して、$N(0,1)$にそろえよう。

復習

確率変数$Y$があり、その
平均値が$\mu$ 標準偏差が$\sigma$ とする。

このとき、$Y$を標準化した確率変数は
$\displaystyle \frac{Y-\mu}{\sigma}$
である。

復習より、図Aの$28$を標準化すると、
$\displaystyle \frac{28-20}{4}=2$
となる。

また、標準化するので 平均値は$0$になるから、図Aの$20$は$0$になる。

よって、図Aのグラフを標準化すると図Bができるけど、図Aも図Bも確率分布図なので、曲線と横軸の間の面積は$1$で変わらない。
なので、ふたつの図の赤い部分の面積は等しい。
ということで、図Aの代わりに、図Bの赤い部分の面積を求める。

図B
大学入学共通テスト2021年追試 数学ⅡB 第3問 解説図B

標準化したので、図Bのグラフは$N(0,1)$だ。
そのまま正規分布表が使えるから、正規分布表で
$z_{0}=2.00$
を探すと、
$0.4772$
とある。
これが図Bの緑の部分の面積である。

緑の面積$+$赤い面積$=0.5$
だから、赤い部分の面積$p$は、
$p=0.5-0.4772$
$\phantom{ p } =0.0228$
となる。

選択肢のうち、これに一番近いのは、

の$0.023$である。

解答ス:1

(2)

ここで、標本平均の確率分布について復習だ。

復習

母平均$m$,母分散$\sigma^{2}$の母集団から大きさ$n$の標本を取り出す。
このとき、標本平均は
母集団が正規分布に従うときには $n$の値にかかわらず完全に その他の確率分布のときには $n$が大きければ近似的に 正規分布
$\displaystyle N\left(m,\frac{\sigma^{2}}{n}\right)$
に従う。

この問題では母集団はどのような確率分布に従うか分からないけれど、問題文に「近似的に正規分布に従う」とあるので、復習の②のパターンだ。
なので、標本平均は、近似的に 正規分布
$\displaystyle N\left(m,\frac{\sigma^{2}}{n}\right)=N\left(m,\frac{640}{40}\right)$
  $=N(m,16)$
に従う。

この正規分布の分散は
$16$
なので、標準偏差は
$\sqrt{16}=4$
である。

解答セ:4


さらに、母平均の信頼区間を求める式について復習しよう。

公式

母標準偏差を$\sigma$,標本平均を$\overline{X}$,標本の大きさを$n$とすると、母平均$m$の信頼区間を求める式は
$\displaystyle \overline{X}-z\cdot\frac{\sigma}{\sqrt{n}}\leqq m\leqq\overline{X}+z\cdot\frac{\sigma}{\sqrt{n}}$式A

大学入学共通テスト2021年追試 数学ⅡB 第3問 復習図

信頼度が$ c\%$のとき、
右図を標準正規分布の確率分布図として、$z$は図中の$z_{0}$の値。
特に
信頼度$ 95\%$のとき、$z=1.96$ 信頼度$ 99\%$のとき、$z=2.56$ である。

よって、求める信頼区間
$C_{1}\leqq m\leqq C_{2}$

$\displaystyle \overline{X}-z\cdot\frac{\sigma}{\sqrt{n}}\leqq m\leqq\overline{X}+z\cdot\frac{\sigma}{\sqrt{n}}$式B
とかける。

いまは、
母分散が
$\sigma^{2}=640$
なので、母標準偏差は
$\sigma=\sqrt{640}$
標本平均は
$\overline{X}=120$
標本の大きさは
$n=40$
信頼度が$ 95\%$なので、
$z=1.96$
だ。

以上から、式Bは
$120-1.96\displaystyle \cdot\frac{\sqrt{640}}{\sqrt{40}}\leqq m\leqq 120+1.96\cdot\frac{\sqrt{640}}{\sqrt{40}}$
より
$120-7.84\leqq m\leqq 120+7.84$
$112.16\leqq m\leqq 127.84$
となる。

解答ソ:1, タ:1, チ:2, ツ:1, テ:6, ト:1, ナ:2, ニ:7, ヌ:8, ネ:4

以上、計算だけ解説した。
母平均の信頼区間の推定についての原理など、詳しくはこのページ参照。

(3)

(2)と(3)の調査を比べると、
標本の大きさが、(2)は$40$人、(3)は$50$人 母分散と標本平均は等しい ことになっている。
よって、標本の大きさだけを考える。

式Aを数直線にすると、母平均$m$の信頼区間は図Cのように表せる。

図C
大学入学共通テスト2021年追試 数学ⅡB 第3問 解説図C

つまり、母平均$m$の信頼区間は、
$\overline{X}$を中心として、$\displaystyle \pm z\cdot\frac{\sigma}{\sqrt{n}}$の範囲 だといえる。
$\displaystyle \pm z\cdot\frac{\sigma}{\sqrt{n}}$は誤差の範囲を表していると思ってもらっていい。

直感的に分かると思うけど、標本の大きさが大きいほど(この問題では多くの人数を調査するほど)正確な推定ができる。
つまり、誤差の範囲が小さくなる。
なので、標本の大きさが$40$人の(2)の調査より、$50$人の(3)の調査の方が、誤差の範囲が小さいはずだ。
数直線でいえば、図Dのようになっているはずだ。

図D
大学入学共通テスト2021年追試 数学ⅡB 第3問 解説図D

図Dより
$C_{1} \lt D_{1} \lt D_{2} \lt C_{2}$
なので、選択肢のうちで正しいのは

である。

解答ノ:2

別解

上の解の考え方が思いつかなければ、次のように計算で解くしかない。

式Aに$n$だけ代入して(2)と(3)の式をつくると、
(2)$C_{1} \leqq m \leqq C_{2}$

$\displaystyle \overline{X}-z\cdot\frac{\sigma}{\sqrt{40}}\leqq m\leqq\overline{X}+z\cdot\frac{\sigma}{\sqrt{40}}$
(3)$D_{1} \leqq m \leqq D_{2}$

$\displaystyle \overline{X}-z\cdot\frac{\sigma}{\sqrt{50}}\leqq m\leqq\overline{X}+z\cdot\frac{\sigma}{\sqrt{50}}$
となる。

なので、
$\left\{\begin{array}{l}
C_{1}=\overline{X}-z\cdot\frac{\sigma}{\sqrt{40}}\\
C_{2}=\overline{X}+z\cdot\frac{\sigma}{\sqrt{40}}\\
D_{1}=\overline{X}-z\cdot\frac{\sigma}{\sqrt{50}}\\
D_{2}=\overline{X}+z\cdot\frac{\sigma}{\sqrt{50}}
\end{array}\right.$式C
とかける。

ここで、
$\sqrt{50} \gt \sqrt{40}$
より
$\displaystyle \frac{1}{\sqrt{50}} \lt \frac{1}{\sqrt{40}}$
なので
$z\displaystyle \cdot\frac{\sigma}{\sqrt{50}} \lt z\cdot\frac{\sigma}{\sqrt{40}}$
だ。

よって、式Cの4つの値は
$C_{1} \lt D_{1} \lt D_{2} \lt C_{2}$
であることが分かる。

選択肢のうち、これに当てはまるのは

である。

解答ノ:2

最後は、(3)の調査で母分散を$640$としたときと$960$としたときの比較だ。

2つの調査で$D_{2}-D_{1}$と$E_{2}-E_{1}$、つまり信頼区間の幅が等しくなればよい。
数直線でいえば 図Cの赤い範囲の幅が等しくなればよいので、式Aの
$\displaystyle z\cdot\frac{\sigma}{\sqrt{n}}$
の部分が等しくなればよい。

母分散を$640$としたとき 標本の大きさは$50$ 母標準偏差は$\sigma=\sqrt{640}$ 母分散を$960$としたとき
母標準偏差は$\sigma=\sqrt{960}$
なので、母分散が$960$のときの標本の大きさを$n$とすると、
$z\displaystyle \cdot\frac{\sqrt{640}}{\sqrt{50}}=z\cdot\frac{\sqrt{960}}{\sqrt{n}}$
とかける。

これを解くと、
途中式 $\sqrt{640n}=\sqrt{960\times 50}$
$640n=960\times 50$
$n=\displaystyle \frac{960}{640}\times 50$
$\phantom{ n\displaystyle } \displaystyle =\frac{3}{2}\times 50$
$n =1.5\times 50$
となる。

以上より、標本の大きさを$50$の$1.5$倍にすればよい。

解答ハ:1, ヒ:5

別解

今回も、上の考え方が思いつかないときは 式Aを使って解くしかない。
値が変わるのは母分散と標本の大きさなので、この2つだけを式Aに代入する。

母分散を$640$としたとき
標本の大きさは$50$ 母標準偏差は$\sigma=\sqrt{640}$ なので、式Aより
$D_{1} \leqq m \leqq D_{2}$

$\displaystyle \overline{X}-z\cdot\frac{\sqrt{640}}{\sqrt{50}}\leqq m\leqq\overline{X}+z\cdot\frac{\sqrt{640}}{\sqrt{50}}$
とかける。

母分散を$960$としたとき
母標準偏差は$\sigma=\sqrt{960}$ なので、標本の大きさを$n$とすると、式Aより
$E_{1} \leqq m \leqq E_{2}$

$\displaystyle \overline{X}-z\cdot\frac{\sqrt{960}}{\sqrt{n}}\leqq m\leqq\overline{X}+z\cdot\frac{\sqrt{960}}{\sqrt{n}}$
となる。

なので、
$D_{2}-D_{1}=\left(\overline{X}+z\cdot\frac{\sqrt{640}}{\sqrt{50}}\right)-\left(\overline{X}-z\cdot\frac{\sqrt{640}}{\sqrt{50}}\right)$
$\phantom{ D_{2}-D_{1}\displaystyle } \displaystyle =2z\cdot\frac{\sqrt{640}}{\sqrt{50}}$
$E_{2}-E_{1}=\left(\overline{X}+z\cdot\frac{\sqrt{960}}{\sqrt{n}}\right)-\left(\overline{X}-z\cdot\frac{\sqrt{960}}{\sqrt{n}}\right)$
$\phantom{ E_{2}-E_{1}\displaystyle } \displaystyle =2z\cdot\frac{\sqrt{960}}{\sqrt{n}}$
である。


この2つの値を等しくしたいから、
$2z\displaystyle \cdot\frac{\sqrt{640}}{\sqrt{50}}=2z\cdot\frac{\sqrt{960}}{\sqrt{n}}$
という式がつくれる。

これを解くと、
途中式 $\sqrt{640n}=\sqrt{960\times 50}$
$640n=960\times 50$
$n=\displaystyle \frac{960}{640}\times 50$
$\phantom{ n\displaystyle } \displaystyle =\frac{3}{2}\times 50$
$n =1.5\times 50$
となる。

以上より、標本の大きさを$50$の$1.5$倍にすればよい。

解答ハ:1, ヒ:5