大学入学共通テスト 2022年(令和4年) 試作問題 数学ⅡBC 第5問 解説
(1)
はじめに、標本平均について思い出そう。
復習
平均$m$,分散$\sigma^{2}$の母集団から大きさ$n$の標本を取り出す。
このとき、標本平均は
母集団が正規分布に従うときには、$n$の値にかかわらず完全に 母集団がその他の確率分布に従うときには、$n$が大きければ近似的に
正規分布
$N\left(m,\dfrac{\sigma^{2}}{n}\right)$
に従う。
復習より、$\overline{X}$は近似的に
$N\left(m,\dfrac{\sigma^{2}}{49}\right)$式A
に従う。
この正規分布の
平均値は$m$式B
標準偏差は$\sqrt{\dfrac{\sigma^{2}}{49}}=\dfrac{\sigma}{7}$式C
だ。
解答ア:0, イ:7
確率変数の変換についても思い出しておこう。
復習
確率変数$A$の
平均値を$E(A)$
分散を$V(A)$
標準偏差を$\sigma(A)$
とする。
$A$と定数$a,b$を使って、確率変数$B$を
$B=aA+b$
と定める。
このとき、$B$の
平均値$E(B)=aE(A)+b$
分散$V(B)=a^{2}V(B)$
標準偏差$\sigma(B)=\sqrt{V(B)}=\left|a\right|\sigma(A)$
となる。
方針の$W$も近似的に正規分布に従い、復習より、その
平均値は
$125000\times$式B $=125000m$
解答ウ:4
標準偏差は
$\left| 125000 \right| \times$式C $=\dfrac{125000\sigma}{7}$
解答エ:5
になる。
以上から、$M$の信頼区間を求める。
アドバイス
出題者の意図は、エで求めた標準偏差を使って信頼区間を求めることだろう。
だけど、共通テスト本番のような気持ちに余裕がないときには、解き慣れた方法がおすすめだ。
なので、問題の流れからは外れるけど、ここではいつもの見慣れた方法で解く。
いま、$m$と$M$の関係は
$M=125000\times m$
だった。
なので、母平均$m$の信頼区間を求めて$125000$倍すると、$M$の信頼区間が分かる。
ここで母平均の信頼区間を求める式を復習しておくと、
復習
母標準偏差を$\sigma$,標本平均を$\overline{X}$,標本の大きさを$n$とすると、母平均$m$の信頼区間を求める式は
$\overline{X}-z\cdot\dfrac{\sigma}{\sqrt{n}}\leqq m\leqq\overline{X}+z\cdot\dfrac{\sigma}{\sqrt{n}}$
ただし、信頼度が$c$%のとき
$z$は図Aを標準正規分布の確率分布図として、図中の$z_{0}$の値。
特に
信頼度$95$%のとき、$z=1.96$
信頼度$99$%のとき、$z=2.58$
だった。
復習の式を使って $X$の母平均$m$の信頼区間を求める。
いま
$X$の標本平均$\overline{X}=16$
問題文の指示に従って、母標準偏差$\sigma=2$
だ。
なので、$m$の信頼度$95$%での信頼区間は
$16-1.96\cdot\dfrac{2}{\sqrt{49}}\leqq m\leqq 16+1.96\cdot\dfrac{2}{\sqrt{49}}$
途中式
$$
\begin{align}
& 16-\textcolor{red}{\cancelto{0.28}{\textcolor{black}{1.96}}}\cdot\dfrac{2}{\textcolor{red}{\cancel{\textcolor{black}{7}}}}\\
&\hspace{110px}\leqq m\leqq\\
&\hspace{150px} 16+\textcolor{red}{\cancelto{0.28}{\textcolor{black}{1.96}}}\cdot\dfrac{2}{\textcolor{red}{\cancel{\textcolor{black}{7}}}}
\end{align}
$$
$16-0.28\times 2\leqq m\leqq 16+0.28\times 2$
$8(2-0.07)\leqq m\leqq 8(2+0.07)$
$M=125000\times m$ なので、式Dの各辺を$125000$倍すると
途中式
$$
\begin{align}
& 125000\times 8\times 1.93\\
&\hspace{90px}\leqq 125000\times m\leqq \\
&\hspace{180px} 125000\times 8\times 2.07
\end{align}
$$
$1000000\times 1.93\leqq M\leqq 1000000\times 2.07$
$1930000\leqq M\leqq 2070000$
より、$M$の信頼区間は
となる。
解答オ:1, カ:9, キ:3, ク:2, ケ:0, コ:7
(2)
次は検定だ。
今年の母平均$m$が去年と異なるかどうかを検定するので、
帰無仮説は
今年の母平均は昨年と異なる
$\ \Leftrightarrow$ 今年の母平均と昨年の母平均は等しい
$\quad\Leftrightarrow$ 今年の母平均は$15$である
解答サ:2
対立仮説は
今年の母平均は去年と異なる
$\ \Leftrightarrow$ 今年の母平均は$15$ではない
解答シ:6
である。
この帰無仮説が正しい場合、
$\left\{\begin{array}{l}
m=15\\
\sigma=2
\end{array}\right.$
なので、式Aより、$\overline{X}$は近似的に
$N\left(m,\dfrac{\sigma^{2}}{n}\right)=N\left(15,\dfrac{2^{2}}{49}\right)$
に従う。
この正規分布の
平均値は$15$
標準偏差は$\sqrt{\dfrac{2^{2}}{49}}=\dfrac{2}{7}$
である。
解答ス:7, セ:1
この正規分布の確率分布図を図B,斜線部の面積の合計を$5$%とする。
図Bにおいて、今年の標本平均の$16$が
青い範囲にあれば、
帰無仮説は棄却されない
オレンジの範囲にあれば、
帰無仮説は棄却される
といえる。
これを逆に言うと、図Cの赤と紫の面積の合計が
※
$5$%以上の場合、帰無仮説は棄却されない
$5$%未満の場合、帰無仮説は棄却される
ことになる。
というわけで、図Cの赤と紫の面積を求めよう。
面積を求めるのには正規分布表を使うんだけど、
正規分布表に載っているのは
標準正規分布$N(0,1)$
面積を求めたい図Cは
$N\left(15,\dfrac{2^{2}}{49}\right)$
だから、そのままでは正規分布表は使えない。
しかたがないから、$N\left(15,\dfrac{2^{2}}{49}\right)$を標準化して$N(0,1)$にそろえよう。
標準化の式を思い出すと、
復習
確率変数$Y$の
平均値が$m$
標準偏差が$\sigma$
のとき、$Y$を標準化した確率変数は
$\dfrac{Y-m}{\sigma}$
だった。
復習より、図Cの
平均値の$15$を標準化すると、
計算するまでもなく$0$
スセより、$16$を標準化した$z$は
$z=\dfrac{16-15}{\cfrac{2}{7}}=\dfrac{7}{2}=3.5$
となるから、図Cを標準化すると図Dができる。
図Dの赤の面積が$P(Z\geqq|z|)$,紫の面積が$P(Z\leqq-|z|)$にあたる。
正規分布表の$z=3.5$を見ると、
$0.4998$
とあるけど、これは図Dの黄色の面積だから、赤の面積は
$0.5-0.4998=0.0002$
赤の面積と紫の面積は等しいので、
赤$+$紫$=0.0002\times 2=0.0004$
となる。
したがって、$P(Z\leqq-|z|)$と$P(Z\geqq|z|)$の和は$0.05$よりも小さい。
解答ソ:1
別解
(1)の母平均の信頼区間を求める式の復習を見てもらうと、
信頼度$95$%のとき、$z=1.96$
だった。
これは、図Aの緑の面積が$95$%のとき、
$z_{0}=1.96$
であるという意味だ。
これを図にすると、図Eになる。
$3.5$は$1.96$より右にあるから、図Eより、赤と紫の面積の合計が$5$%よりも小さいのは明らか。
したがって、$P(Z\leqq-|z|)$と$P(Z\geqq|z|)$の和は$0.05$よりも小さい。
解答ソ:1
以上より、※の判断基準にしたがって、帰無仮説は棄却されて対立仮説が支持される。
つまり、今年の母平均は昨年と異なるといえる。
解答タ:0