大学入学共通テスト 2023年(令和5年) 本試 数学ⅡB 第3問 解説

(1) (i)

確率変数$X$は正規分布$N(m,\sigma^{2})$、つまり
平均値が$m$ 分散が$\sigma^{2}$ の正規分布に従うので、$X$の確率分布図は図Aのようになる。

図A
大学入学共通テスト2023年本試 数学ⅡB第3問 解説図A

最初に、重さが$m$g以上、つまり平均値以上である確率を問われている。
これは、図Aの緑の部分の面積にあたる。

図Aのグラフは正規分布の確率分布図なので、
$X=m$に関して対称 横軸と曲線の間の面積は$1$ だ。

よって、緑の部分の面積は、$1$の半分の
$\dfrac{1}{2}$
であることが分かる。

解答イ:1, ウ:2


うっかりをとばして先に確率を求めてしまった。

が含まれる問題文の式は
$P(X\geqq m)=P\left(\textcolor{red}{\dfrac{X-m}{\sigma}}\geqq\fbox{ ア }\right)$式A
だけど、この式の赤い部分は見覚えがある。
標準化の式だ。

ということで、標準化について復習しておこう。

復習

確率変数を
平均値が$0$ 標準偏差が$1$ になるように変換することを、標準化という。

もとの確率変数を$X$とし、$X$の
平均値を$m$ 標準偏差を$\sigma$ とすると、$X$を標準化した確率変数$W$は
$W=\dfrac{X-m}{\sigma}$式B
となる。

式Aに戻ると、左辺の()の中は
$X\geqq m$
つまり
$X\geqq X$の平均値
だから、右辺の()の中は
$\dfrac{X-m}{\sigma}\geqq\dfrac{X-m}{\sigma}$の平均値 だと考えられる。

式Bより、$\dfrac{X-m}{\sigma}$は$X$を標準化したもの。
なので、復習より、その平均値は
$0$
である。

解答ア:0

別解

$\dfrac{X-m}{\sigma}$が$X$の標準化の式だと気づくと、は上のような方法で一瞬で分かる。説明は長かったけど。
でも、標準化の式だと気づかなければしかたがない。
次のように求めることになる。

$P(X\geqq m)=P\left(\dfrac{X-m}{\sigma}\geqq\fbox{ ア }\right)$式A
の両辺の()内部分を見比べると、
$X\geqq m$の左辺を$\dfrac{X-m}{\sigma}$になるように変形すれば、そのときの右辺がになる と考えられる。
この方法で解く。

$X\geqq m$
の両辺から$m$を引いて、
$X-m\geqq m-m$
$X-m\geqq 0$
両辺を$\sigma$で割ると、$ 0 \lt \sigma$なので、
$\dfrac{X-m}{\sigma}\geqq\dfrac{0}{\sigma}$
$\dfrac{X-m}{\sigma}\geqq 0$

この式の右辺がなので、
$=0$
である。

解答ア:0

(1) (ii)

標本平均の期待値(平均)と標準偏差の復習をすると、

復習

母平均$m$,母標準偏差$\sigma$の母集団から大きさ$n$の標本を無作為に取り出すとき、標本平均$\overline{X}$の
期待値(平均)$E(\overline{X})=m$ 分散$V(\overline{X})=\dfrac{\sigma^{2}}{n}$ 標準偏差$\sigma(\overline{X})=\dfrac{\sigma}{\sqrt{n}}$ である。

だった。

復習より、$\overline{X}$の
期待値(平均)$E(\overline{X})=m$ 標準偏差$\sigma(\overline{X})=\dfrac{\sigma}{\sqrt{n}}$ となる。

解答エ:4, オ:2


次は母平均の信頼区間だけど、これには公式があった。

公式

母標準偏差を$\sigma$,標本平均を$\overline{X}$,標本の大きさを$n$とすると、母平均$m$の信頼区間を求める式は
$\overline{X}-z\cdot\dfrac{\sigma}{\sqrt{n}}\leqq m\leqq\overline{X}+z\cdot\dfrac{\sigma}{\sqrt{n}}$式C

図B
大学入学共通テスト2023年本試 数学ⅡB第3問 解説図B

ただし、信頼区間が$c$%のとき、$z$は、図Bを標準正規分布の確率分布図として、図中の$z_{0}$の値。
特に、
信頼度$95$%のとき、$z=1.96$ 信頼度$99$%のとき、$z=2.56$ である。

今回は信頼度$90$%の信頼区間を求めるんだけど、問題文に、実際の作業には$90.1$%を使うよう指示がある。
なので、図Bにおいて、緑の部分が$90.1$%になるような$z_{0}$を求めることから始めよう。

図Bの$c$%を$90.1$%に書きかえると、図Cができる。

図C
大学入学共通テスト2023年本試 数学ⅡB第3問 解説図C

図Cの緑の部分が$90.1$%なので、オレンジの部分はその半分の
$\dfrac{90.1}{2}$%$=45.05$%
$\hspace{50px} =0.4505$
だ。

正規分布表を見ると、オレンジの部分の面積が$0.4505$となるのは、
$z_{0}=1.65$
のときであることが分かる。

解答カ:1, キ:6, ク:5

あとは、公式に代入だ。
式Cの
$z$に、.キクで求めた$1.65$を $\overline{X}$に、標本平均の$30.0$を $n$に、標本の大きさの$400$を $\sigma$に、問題文の指示通り標本標準偏差の$3.6$を それぞれ代入すると、求める信頼区間は
$30.0-1.65\cdot\dfrac{3.6}{\sqrt{400}}\leqq m\leqq 30.0+1.65\cdot\dfrac{3.6}{\sqrt{400}}$
と表せる。

これを計算すると

途中式 $30.0-1.65\cdot\dfrac{3.6}{20}\leqq m\leqq 30.0+1.65\cdot\dfrac{3.6}{20}$
$30.0-1.65\cdot 0.18\leqq m\leqq 30.0+1.65\cdot 0.18$
$30.0-0.297\leqq m\leqq 30.0+0.297$
$29.703\leqq m\leqq 30.297$
となるので、正解は、選択肢の

である。

解答ケ:4

アドバイス

これじゃ原理がゼンゼン分からないけど、原理通り解くと時間がかかるから、共通テスト本番では機械的に公式を使おう。
原理に関してはこのページを参照してほしい。

(2) (i)

(1)の(i)で考えたように、ピーマンを無作為に1個取り出したとき、重さが$m$以上、つまり平均値以上である確率は
$\dfrac{1}{2}$
だった。

同様に、Sサイズ、つまり重さが平均値の$30$g以下である確率も
$\dfrac{1}{2}$
である。

解答コ:1, サ:2

なので、ピーマンを無作為に$50$個取り出したときのSサイズの個数は、
$50$回の試行中、$\dfrac{1}{2}$の確率の事象が起こった回数 と言いかえられる。

つまり反復試行なので、その確率は二項分布に従う。
ということで、二項分布の復習だ。

復習

確率$p$で事象$\mathrm{A}$が起こる試行を$n$回繰り返し、$\mathrm{A}$が起こった回数を$U_{0}$とすると、$U_{0}$の確率分布は二項分布$B(n,p)$である。

復習より、$U_{0}$は 二項分布
$B\left(50,\dfrac{1}{2}\right)$
に従う。


このとき、25袋作ることができるのは、Sサイズが25個取り出された場合。
これは、
$50$回の試行中、$\dfrac{1}{2}$の確率の事象がちょうど25回起こった場合 と言いかえられる。

反復試行の考え方でこの場合の確率を考えると、求める確率$p_{0}$は
$p_{0}={}_{50}\mathrm{C}_{25}\times\left(\dfrac{1}{2}\right)^{25}\times\left(1-\dfrac{1}{2}\right)^{50-25}$
とかける。

解答シ:2, ス:5

とても計算したくない式ができてしまったけど、ありがたいことに これを計算する必要はない。
結果は問題文中に載っていて、
$ p_{0}=0.1122\cdots$
くらいになり、このときに25袋作ることができる確率は
$0.11$
程度になるようだ。

(2) (ii)

ピーマンを$50+k$個取り出したとき、それに含まれるSサイズの数を$U_{k}$とする。

いま問われているのは、25袋つくることができる場合。
そのためには、
Sサイズが$25$個以上※A Lサイズが$25$個以上※B 取り出されないといけない。

Sサイズの個数$+$Lサイズの個数$=50+k$式D
なので、※BをSサイズの個数で表すと、
Sサイズが$25+k$個以下 となる。

詳しく

式Dを変形すると
Lサイズの個数$=50+k-$Sサイズの個数
とかける。

※Bより、これは
$50+k-$Sサイズの個数$\geqq 25$
でなければならない。

これを変形すると
Sサイズの個数$\leqq 25+k$
となる。

よって、25袋作ることができるためには、Sサイズの個数、つまり$U_{k}$が
$25\leqq U_{k}\leqq 25+k$ であればよい。

ということで、$U_{k}$が
$25\leqq U_{k}\leqq 25+k$
となる確率を求める。

求める確率を$p_{k}$として式で表すと、
$p_{k}=P(25\leqq U_{k}\leqq 25+k)$
だ。


(i)と同様に考えると、$U_{k}$は
二項分布$B\left(50+k,\dfrac{1}{2}\right)$
に従う。
この確率分布図を描くと、図Dができる。

図D
大学入学共通テスト2023年本試 数学ⅡB第3問 解説図D

アドバイス

図Dはイメージをつかみやすくするために載せただけで、受験生の皆さんがこのグラフを描けるようになる必要はない。
実際、私も簡単には描けない。図DはPCに描かせた。
何となくでいいから、頭の中に似たようなイメージが描ければそれでいい。


いま考えている$p_{k}$は、図Dの緑の部分の面積だ。
この面積を二項分布で求めるのは大変なので、正規分布で近似しよう。

復習

$n$が十分に大きいとき、二項分布$B(n,p)$は、正規分布$N(np,np(1-p))$で近似できる。

$50+k$は十分に大きいので、復習より、$U_{k}$は近似的に 正規分布
$N\left((50+k)\cdot\dfrac{1}{2},(50+k)\cdot\dfrac{1}{2}\cdot\left(1-\dfrac{1}{2}\right)\right)$
$\hspace{100px} =N\left(\dfrac{50+k}{2},\dfrac{50+k}{4}\right)$
に従う。

解答セ:3, ソ:7

この正規分布を図Dに重ねると、図Eができる。
図Dの緑の部分の面積の代わりに、図Eの赤い部分の面積を求めるわけだ。
(ここで「あれ?」って思った人は、解説末尾の余談を見てください。)

図E
大学入学共通テスト2023年本試 数学ⅡB第3問 解説図E

面積を求めるのには、正規分布表を使う。
けれど、
図Eの正規分布は 平均値が$\dfrac{50+k}{2}$ 分散が$\dfrac{50+k}{4}$ 正規分布表に載っている標準正規分布は 平均値が$0$ 分散が$1$ だから、そのままでは比較できない。
なので、図Eの正規分布を標準化して、平均値$0$,分散$1$にそろえよう。

$U_{k}$を標準化した確率変数を$Y$とすると、(1)(i)の復習の式Bより、$U_{k}$から$Y$を計算する式は
$Y=\dfrac{U_{k}-\dfrac{50+k}{2}}{\sqrt{\dfrac{50+k}{4}}}$
右辺の分母分子に$2$をかけて、
$Y=\dfrac{2U_{k}-50-k}{\sqrt{50+k}}$
とかける。

これを使って図Eの赤い部分の両端の$25$と$25+k$を標準化すると、
$25$は
$\dfrac{2\times 25-50-k}{\sqrt{50+k}}=-\dfrac{k}{\sqrt{50+k}}$
$25+k$は
$\dfrac{2(25+k)-50-k}{\sqrt{50+k}}=\dfrac{k}{\sqrt{50+k}}$
となる。

解答タ:0


よって、図Eの正規分布を標準化すると、図Fになる。

図F
大学入学共通テスト2023年本試 数学ⅡB第3問 解説図F

いま問われているのは、
$p_{k}\geqq 0.95$
となる場合。

つまり、図Fの紫の部分の面積が
紫$\geqq\dfrac{0.95}{2}$
より
紫$\geqq 0.475$
となる場合だ。

正規分布表を見ると、これは
$\dfrac{k}{\sqrt{50+k}}\geqq 1.96$式E
である場合だと分かる。


式Eが成り立つ$k$の範囲を求めるんだけど、$k$は自然数なので、細かい値は必要ない。

なので、式Eの右辺を$2$にして
$\dfrac{k}{\sqrt{50+k}}\geqq 2$式E'
としても、答えは変わらないと考えられる。

この式E'を解く。


ここで
$ k=\alpha$ $\sqrt{50+k}=\beta$ とおくと、式E'は
$\dfrac{\alpha}{\beta}\geqq 2$
とかける。

いま、$\alpha \gt 0$,$\beta \gt 0$なので、①の両辺を2乗すると
$\dfrac{\alpha^{2}}{\beta^{2}}\geqq 4$
より
$\alpha^{2}\geqq 4\beta^{2}$
と変形できる。

この$\alpha$,$\beta$をもとに戻すと
$k^{2}\geqq 4\sqrt{50+k}^{2}$
$k^{2}\geqq 4\cdot 50+4k$
$k^{2}-4k-4\cdot 50\geqq 0$
と表せる。

この解は、解の公式より
$k\leqq\dfrac{4-\sqrt{4^{2}-4\cdot 1\cdot(-4\cdot 50)}}{2\cdot 1}$,
   $\dfrac{4+\sqrt{4^{2}-4\cdot 1\cdot(-4\cdot 50)}}{2\cdot 1}\leqq k$
だけど、$k$は自然数なので、
$k\leqq\dfrac{4-\sqrt{4^{2}-4\cdot 1\cdot(-4\cdot 50)}}{2\cdot 1}$
は不適。
$\dfrac{4+\sqrt{4^{2}-4\cdot 1\cdot(-4\cdot 50)}}{2\cdot 1}\leqq k$式F
だけ考える。

式Fを整理して、
$\dfrac{4+\sqrt{4^{2}(1+50)}}{2}\leqq k$
$\dfrac{4+4\sqrt{51}}{2}\leqq k$
$2(1+\sqrt{51})\leqq k$

問題文より、$\sqrt{51}=7.14$ なので、これは
$2(1+7.14)\leqq k$
$2\times 8.14\leqq k$
$16.28\leqq k$
となる。

したがって、これを満たす最小の自然数$k_{0}$は
$k_{0}=17$
である。

解答チ:1, ツ:7


以上より、
$50+17=67$
個のピーマンを取り出しておけば、$0.95$以上の確率で25袋作ることができることが分かる。

余談

図Eを見て「あれ?」って思った人は、以下の解説も読んでください。
疑問を持たなかった人は読む必要はないです。

図Gは図Dと図Eを重ねたものだ。
以下、図Gを使って説明する。

図G
大学入学共通テスト2023年本試 数学ⅡB第3問 解説図G

上の解説では、緑の面積の近似値として、赤い部分の面積を求めた。
でも、左右の端っこの部分をよく見ると、緑が赤からはみ出している。
なので、近似値を求めるのなら、赤い部分ではなく オレンジの部分の面積を使うべきじゃないか、という考えが成り立つ。

式にすると、
$p_{k}=P(25 \leqq Y \leqq 25+k)$
ではなくて、
$p_{k}=P(24.5 \leqq Y \leqq 25.5+k)$
とするべきじゃないか、ということだ。

この考え方はとても正しいんだけれど、共通テストでは不正解になる
つまり、共通テスト的には、赤い部分の面積が正解で、オレンジの部分の面積は不正解だ。
なので、共通テストでは、疑問を持たずに赤い部分の面積を求めてください。