大学入学共通テスト 2023年(令和5年) 本試 数学ⅡB 第3問 解説
(1) (i)
確率変数$X$は正規分布$N(m,\sigma^{2})$、つまり
平均値が$m$
分散が$\sigma^{2}$
の正規分布に従うので、$X$の確率分布図は図Aのようになる。
最初に、重さが$m$g以上、つまり平均値以上である確率を問われている。
これは、図Aの緑の部分の面積にあたる。
図Aのグラフは正規分布の確率分布図なので、
$X=m$に関して対称
横軸と曲線の間の面積は$1$
だ。
よって、緑の部分の面積は、$1$の半分の
$\dfrac{1}{2}$
であることが分かる。
解答イ:1, ウ:2
うっかりアをとばして先に確率を求めてしまった。
アが含まれる問題文の式は
$P(X\geqq m)=P\left(\textcolor{red}{\dfrac{X-m}{\sigma}}\geqq\fbox{ ア }\right)$式A
だけど、この式の赤い部分は見覚えがある。
標準化の式だ。
ということで、標準化について復習しておこう。
復習
確率変数を
平均値が$0$
標準偏差が$1$
になるように変換することを、標準化という。
もとの確率変数を$X$とし、$X$の
平均値を$m$
標準偏差を$\sigma$
とすると、$X$を標準化した確率変数$W$は
$W=\dfrac{X-m}{\sigma}$式B
となる。
式Aに戻ると、左辺の()の中は
$X\geqq m$
つまり
$X\geqq X$の平均値
だから、右辺の()の中は
$\dfrac{X-m}{\sigma}\geqq\dfrac{X-m}{\sigma}$の平均値
だと考えられる。
式Bより、$\dfrac{X-m}{\sigma}$は$X$を標準化したもの。
なので、復習より、その平均値は
$0$
である。
解答ア:0
別解
$\dfrac{X-m}{\sigma}$が$X$の標準化の式だと気づくと、アは上のような方法で一瞬で分かる。説明は長かったけど。
でも、標準化の式だと気づかなければしかたがない。
次のように求めることになる。
$P(X\geqq m)=P\left(\dfrac{X-m}{\sigma}\geqq\fbox{ ア }\right)$式A
の両辺の()内部分を見比べると、
$X\geqq m$の左辺を$\dfrac{X-m}{\sigma}$になるように変形すれば、そのときの右辺がアになる
と考えられる。
この方法で解く。
$X\geqq m$
の両辺から$m$を引いて、
$X-m\geqq m-m$
$X-m\geqq 0$
両辺を$\sigma$で割ると、$ 0 \lt \sigma$なので、
$\dfrac{X-m}{\sigma}\geqq\dfrac{0}{\sigma}$
$\dfrac{X-m}{\sigma}\geqq 0$
この式の右辺がアなので、
ア$=0$
である。
解答ア:0
(1) (ii)
標本平均の期待値(平均)と標準偏差の復習をすると、
復習
母平均$m$,母標準偏差$\sigma$の母集団から大きさ$n$の標本を無作為に取り出すとき、標本平均$\overline{X}$の
期待値(平均)$E(\overline{X})=m$
分散$V(\overline{X})=\dfrac{\sigma^{2}}{n}$
標準偏差$\sigma(\overline{X})=\dfrac{\sigma}{\sqrt{n}}$
である。
だった。
復習より、$\overline{X}$の
期待値(平均)$E(\overline{X})=m$
標準偏差$\sigma(\overline{X})=\dfrac{\sigma}{\sqrt{n}}$
となる。
解答エ:4, オ:2
次は母平均の信頼区間だけど、これには公式があった。
公式
母標準偏差を$\sigma$,標本平均を$\overline{X}$,標本の大きさを$n$とすると、母平均$m$の信頼区間を求める式は
$\overline{X}-z\cdot\dfrac{\sigma}{\sqrt{n}}\leqq m\leqq\overline{X}+z\cdot\dfrac{\sigma}{\sqrt{n}}$式C
ただし、信頼区間が$c$%のとき、$z$は、図Bを標準正規分布の確率分布図として、図中の$z_{0}$の値。
特に、
信頼度$95$%のとき、$z=1.96$
信頼度$99$%のとき、$z=2.56$
である。
今回は信頼度$90$%の信頼区間を求めるんだけど、問題文に、実際の作業には$90.1$%を使うよう指示がある。
なので、図Bにおいて、緑の部分が$90.1$%になるような$z_{0}$を求めることから始めよう。
図Bの$c$%を$90.1$%に書きかえると、図Cができる。
図Cの緑の部分が$90.1$%なので、オレンジの部分はその半分の
$\dfrac{90.1}{2}$%$=45.05$%
$\hspace{50px} =0.4505$
だ。
正規分布表を見ると、オレンジの部分の面積が$0.4505$となるのは、
$z_{0}=1.65$
のときであることが分かる。
解答カ:1, キ:6, ク:5
あとは、公式に代入だ。
式Cの
$z$に、カ.キクで求めた$1.65$を
$\overline{X}$に、標本平均の$30.0$を
$n$に、標本の大きさの$400$を
$\sigma$に、問題文の指示通り標本標準偏差の$3.6$を
それぞれ代入すると、求める信頼区間は
$30.0-1.65\cdot\dfrac{3.6}{\sqrt{400}}\leqq m\leqq 30.0+1.65\cdot\dfrac{3.6}{\sqrt{400}}$
と表せる。
これを計算すると
途中式
$30.0-1.65\cdot\dfrac{3.6}{20}\leqq m\leqq 30.0+1.65\cdot\dfrac{3.6}{20}$
$30.0-1.65\cdot 0.18\leqq m\leqq 30.0+1.65\cdot 0.18$
$30.0-0.297\leqq m\leqq 30.0+0.297$
となるので、正解は、選択肢の
④
である。
解答ケ:4
アドバイス
これじゃ原理がゼンゼン分からないけど、原理通り解くと時間がかかるから、共通テスト本番では機械的に公式を使おう。
原理に関してはこのページを参照してほしい。
(2) (i)
(1)の(i)で考えたように、ピーマンを無作為に1個取り出したとき、重さが$m$以上、つまり平均値以上である確率は
$\dfrac{1}{2}$
だった。
同様に、Sサイズ、つまり重さが平均値の$30$g以下である確率も
$\dfrac{1}{2}$
である。
解答コ:1, サ:2
なので、ピーマンを無作為に$50$個取り出したときのSサイズの個数は、
$50$回の試行中、$\dfrac{1}{2}$の確率の事象が起こった回数
と言いかえられる。
つまり反復試行なので、その確率は二項分布に従う。
ということで、二項分布の復習だ。
復習
確率$p$で事象$\mathrm{A}$が起こる試行を$n$回繰り返し、$\mathrm{A}$が起こった回数を$U_{0}$とすると、$U_{0}$の確率分布は二項分布$B(n,p)$である。
復習より、$U_{0}$は 二項分布
$B\left(50,\dfrac{1}{2}\right)$
に従う。
このとき、25袋作ることができるのは、Sサイズが25個取り出された場合。
これは、
$50$回の試行中、$\dfrac{1}{2}$の確率の事象がちょうど25回起こった場合
と言いかえられる。
反復試行の考え方でこの場合の確率を考えると、求める確率$p_{0}$は
$p_{0}={}_{50}\mathrm{C}_{25}\times\left(\dfrac{1}{2}\right)^{25}\times\left(1-\dfrac{1}{2}\right)^{50-25}$
とかける。
解答シ:2, ス:5
とても計算したくない式ができてしまったけど、ありがたいことに これを計算する必要はない。
結果は問題文中に載っていて、
$ p_{0}=0.1122\cdots$
くらいになり、このときに25袋作ることができる確率は
$0.11$
程度になるようだ。
(2) (ii)
ピーマンを$50+k$個取り出したとき、それに含まれるSサイズの数を$U_{k}$とする。
いま問われているのは、25袋つくることができる場合。
そのためには、
Sサイズが$25$個以上※A
Lサイズが$25$個以上※B
取り出されないといけない。
Sサイズの個数$+$Lサイズの個数$=50+k$式D
なので、※BをSサイズの個数で表すと、
Sサイズが$25+k$個以下
となる。
詳しく
式Dを変形すると
Lサイズの個数$=50+k-$Sサイズの個数
とかける。
※Bより、これは
$50+k-$Sサイズの個数$\geqq 25$
でなければならない。
これを変形すると
Sサイズの個数$\leqq 25+k$
となる。
よって、25袋作ることができるためには、Sサイズの個数、つまり$U_{k}$が
$25\leqq U_{k}\leqq 25+k$
であればよい。
ということで、$U_{k}$が
$25\leqq U_{k}\leqq 25+k$
となる確率を求める。
求める確率を$p_{k}$として式で表すと、
$p_{k}=P(25\leqq U_{k}\leqq 25+k)$
だ。
(i)と同様に考えると、$U_{k}$は
二項分布$B\left(50+k,\dfrac{1}{2}\right)$
に従う。
この確率分布図を描くと、図Dができる。
アドバイス
図Dはイメージをつかみやすくするために載せただけで、受験生の皆さんがこのグラフを描けるようになる必要はない。
実際、私も簡単には描けない。図DはPCに描かせた。
何となくでいいから、頭の中に似たようなイメージが描ければそれでいい。
いま考えている$p_{k}$は、図Dの緑の部分の面積だ。
この面積を二項分布で求めるのは大変なので、正規分布で近似しよう。
復習
$n$が十分に大きいとき、二項分布$B(n,p)$は、正規分布$N(np,np(1-p))$で近似できる。
$50+k$は十分に大きいので、復習より、$U_{k}$は近似的に 正規分布
$N\left((50+k)\cdot\dfrac{1}{2},(50+k)\cdot\dfrac{1}{2}\cdot\left(1-\dfrac{1}{2}\right)\right)$
$\hspace{100px} =N\left(\dfrac{50+k}{2},\dfrac{50+k}{4}\right)$
に従う。
解答セ:3, ソ:7
この正規分布を図Dに重ねると、図Eができる。
図Dの緑の部分の面積の代わりに、図Eの赤い部分の面積を求めるわけだ。
(ここで「あれ?」って思った人は、解説末尾の余談を見てください。)
面積を求めるのには、正規分布表を使う。
けれど、
図Eの正規分布は
平均値が$\dfrac{50+k}{2}$
分散が$\dfrac{50+k}{4}$
正規分布表に載っている標準正規分布は
平均値が$0$
分散が$1$
だから、そのままでは比較できない。
なので、図Eの正規分布を標準化して、平均値$0$,分散$1$にそろえよう。
$U_{k}$を標準化した確率変数を$Y$とすると、(1)(i)の復習の式Bより、$U_{k}$から$Y$を計算する式は
$Y=\dfrac{U_{k}-\dfrac{50+k}{2}}{\sqrt{\dfrac{50+k}{4}}}$
右辺の分母分子に$2$をかけて、
$Y=\dfrac{2U_{k}-50-k}{\sqrt{50+k}}$
とかける。
これを使って図Eの赤い部分の両端の$25$と$25+k$を標準化すると、
$25$は
$\dfrac{2\times 25-50-k}{\sqrt{50+k}}=-\dfrac{k}{\sqrt{50+k}}$
$25+k$は
$\dfrac{2(25+k)-50-k}{\sqrt{50+k}}=\dfrac{k}{\sqrt{50+k}}$
となる。
解答タ:0
よって、図Eの正規分布を標準化すると、図Fになる。
いま問われているのは、
$p_{k}\geqq 0.95$
となる場合。
つまり、図Fの紫の部分の面積が
紫$\geqq\dfrac{0.95}{2}$
より
紫$\geqq 0.475$
となる場合だ。
正規分布表を見ると、これは
$\dfrac{k}{\sqrt{50+k}}\geqq 1.96$式E
である場合だと分かる。
式Eが成り立つ$k$の範囲を求めるんだけど、$k$は自然数なので、細かい値は必要ない。
なので、式Eの右辺を$2$にして
$\dfrac{k}{\sqrt{50+k}}\geqq 2$式E'
としても、答えは変わらないと考えられる。
この式E'を解く。
ここで
$ k=\alpha$
$\sqrt{50+k}=\beta$
とおくと、式E'は
$\dfrac{\alpha}{\beta}\geqq 2$①
とかける。
いま、$\alpha \gt 0$,$\beta \gt 0$なので、①の両辺を2乗すると
$\dfrac{\alpha^{2}}{\beta^{2}}\geqq 4$
より
$\alpha^{2}\geqq 4\beta^{2}$
と変形できる。
この$\alpha$,$\beta$をもとに戻すと
$k^{2}\geqq 4\sqrt{50+k}^{2}$
$k^{2}\geqq 4\cdot 50+4k$
$k^{2}-4k-4\cdot 50\geqq 0$
と表せる。
この解は、解の公式より
$k\leqq\dfrac{4-\sqrt{4^{2}-4\cdot 1\cdot(-4\cdot 50)}}{2\cdot 1}$,
$\dfrac{4+\sqrt{4^{2}-4\cdot 1\cdot(-4\cdot 50)}}{2\cdot 1}\leqq k$
だけど、$k$は自然数なので、
$k\leqq\dfrac{4-\sqrt{4^{2}-4\cdot 1\cdot(-4\cdot 50)}}{2\cdot 1}$
は不適。
$\dfrac{4+\sqrt{4^{2}-4\cdot 1\cdot(-4\cdot 50)}}{2\cdot 1}\leqq k$式F
だけ考える。
式Fを整理して、
$\dfrac{4+\sqrt{4^{2}(1+50)}}{2}\leqq k$
$\dfrac{4+4\sqrt{51}}{2}\leqq k$
$2(1+\sqrt{51})\leqq k$
問題文より、$\sqrt{51}=7.14$ なので、これは
$2(1+7.14)\leqq k$
$2\times 8.14\leqq k$
$16.28\leqq k$
となる。
したがって、これを満たす最小の自然数$k_{0}$は
$k_{0}=17$
である。
解答チ:1, ツ:7
以上より、
$50+17=67$
個のピーマンを取り出しておけば、$0.95$以上の確率で25袋作ることができることが分かる。
余談
図Eを見て「あれ?」って思った人は、以下の解説も読んでください。
疑問を持たなかった人は読む必要はないです。
図Gは図Dと図Eを重ねたものだ。
以下、図Gを使って説明する。
上の解説では、緑の面積の近似値として、赤い部分の面積を求めた。
でも、左右の端っこの部分をよく見ると、緑が赤からはみ出している。
なので、近似値を求めるのなら、赤い部分ではなく オレンジの部分の面積を使うべきじゃないか、という考えが成り立つ。
式にすると、
$p_{k}=P(25 \leqq Y \leqq 25+k)$
ではなくて、
$p_{k}=P(24.5 \leqq Y \leqq 25.5+k)$
とするべきじゃないか、ということだ。
この考え方はとても正しいんだけれど、共通テストでは不正解になる。
つまり、共通テスト的には、赤い部分の面積が正解で、オレンジの部分の面積は不正解だ。
なので、共通テストでは、疑問を持たずに赤い部分の面積を求めてください。