大学入学共通テスト 2017年(平成29年) 試行調査 数学ⅠA 第2問 [2] 解説

(1)

問題文中の図1のデータの相関係数だけど、図1を見て分かることは
点はかなり直線状に分布している。なので、相関はかなり強くて、相関係数は$1$または$-1$に近い数と考えられる 全体として、$x$座標が大きい点ほど$y$座標も大きい傾向がある。なので、相関係数は正 である。

よって、選択肢のうち適当なものは
$0.83$
の④だ。

解答シ:4

アドバイス

という説明になるんだけど、きっとこれじゃ納得できない人も多いと思う。
「相関係数は正」の部分は大丈夫だと思うけど、問題は「$1$に近い数だから$0.83$」の部分だ。
散布図を見慣れていれば何となく想像がつくけど、「そんなの分からん」って人がほとんどじゃないだろうか。
なので、見慣れよう。

以下に、相関係数が$0.02$,$0.34$,$0.83$の散布図を載せておいた。
ながめてイメージをつかんでほしい。

図A:相関係数が$0.02$
大学入学共通テスト2017年試行調査 数学ⅠA第2問[2] 解説図A:相関係数が0.02 大学入学共通テスト2017年試行調査 数学ⅠA第2問[2] 解説図A:相関係数が0.02
図B:相関係数が$0.34$
大学入学共通テスト2017年試行調査 数学ⅠA第2問[2] 解説図B:相関係数が0.34 大学入学共通テスト2017年試行調査 数学ⅠA第2問[2] 解説図B:相関係数が0.34
図C:相関係数が$0.83$
大学入学共通テスト2017年試行調査 数学ⅠA第2問[2] 解説図C:相関係数が0.83 大学入学共通テスト2017年試行調査 数学ⅠA第2問[2] 解説図C:相関係数が0.83

上の散布図を見ると、相関係数が$0.34$なんかは点がゼンゼン直線状に並んで見えないことが分かると思う。
一概には言えないけれど、ぱっと見て明らかに「点が並んでいるっぽい」と思ったときは、相関係数は$0.7$以上(負の相関のときには$-0.7$以下)のことが多い。

(2)

問題文より、消費額単価とは、
$\displaystyle \text{消費額単価}=\frac{\text{消費総額}}{\text{観光客数}}$
のこと。

図1では、$x$が観光客数,$y$が消費総額なので、消費額単価は、それぞれの点の
$\displaystyle \frac{x\text{座標}}{y\text{座標}}$
であるといえる。
これは、原点からそれぞれの点に引いた直線の傾きと等しい。

なので、消費額単価が最も高い県を探すには、原点からそれぞれの点に直線を引き、その傾きが一番大きいものを探せばよい。

以上、考え方を詳しく書いた。
共通テスト本番では時間も限られているし、こんなに丁寧に書く必要はない。
正解例が公表されているので、それを参考にしてほしい。
→ 数学入試問題データベースサイト
       大学入試数学問題集成さんで
          正解例を見る。

(3)

(2)より、原点から⓪~⑨の点に直線を引き、その傾きが一番大きいものが答えだ。
だけど、⑧か⑨あたりが答えなのは明らか。
なので、図Dで、⑧にだけ直線を引いてみた。

図D
大学入学共通テスト2017年試行調査 数学ⅠA第2問[2] 解説図D

図Dを見ると、原点から⑧に引いた赤い直線よりも上に点はない。
よって、原点から引いた直線の傾きが赤い線より大きくなる点はない。
なので、これが答えだ。

以上より、消費額単価が最も高い県を表す点は

である。

解答ス:8

(4)

選択肢をひとつずつ確認しよう。


観光客数の話なので、問題文中の図2の上の箱ひげ図を見る。

箱ひげ図の表す値は図Bの通り。

図E
大学入学共通テスト2017年試行調査 数学ⅠA第2問[2] 解説図E

$44$県を当てはめて考えると、
第1四分位数は下位半分の中央値なので、下から$11$番目と$12$番目の平均値 第3四分位数は上位半分の中央値なので、上から$11$番目と$12$番目の平均値 上から$22$番目と$23$番目の平均値が中央値 となるから、図Eのように、箱ひげ図のそれぞれの部分には$11$県ずつが含まれる(境界を含む)。

箱ひげ図から分かることはこれだけだ。
なので、県内からの観光客の値と 県外からの観光客の値の関係は、図2の箱ひげ図からだけでは分からない。

以下、具体的な場合を挙げて説明する。

ふたつの箱ひげ図の上に $44$県の値の点を取って、同じ県を線で結ぶ場合を考える。
この線が右下がりであれば、その県では県内からの観光客よりも県外からの観光客が多いことになる。
右上がりであれば逆だ。

図2の上の箱ひげ図からは、例えば図Fや図Gのような場合が考えられる。

図F
大学入学共通テスト2017年試行調査 数学ⅠA第2問[2] 解説図F
図G
大学入学共通テスト2017年試行調査 数学ⅠA第2問[2] 解説図G

図中、県内からの観光客よりも県外からの観光客が多い県はオレンジで、逆は緑で表した。

図Fのような分布であった場合、$44$県中$43$県では、県内からの観光客よりも県外からの観光客が多い。
図Gのような分布であった場合、$44$県中$7$県で、県内からの観光客よりも県外からの観光客が多い。
図Fおよび図Gでは、ふたつの箱ひげ図で県の並び順は変わらないようにしてある。だけど、当然ながら順番が変わることもあるから、実際にはもっと色々なパターンが考えられる。

なので、この箱ひげ図からだけでは⓪が正しいとは言えない。


観光客の消費総額の話なので、問題文中の図2の下の箱ひげ図を見る。

⓪のときと同じように考えると、例えば図H,図Iができる。

図H
大学入学共通テスト2017年試行調査 数学ⅠA第2問[2] 解説図H
図I
大学入学共通テスト2017年試行調査 数学ⅠA第2問[2] 解説図I

図Hのような分布であった場合、$44$県すべてで、県内からの観光客の消費総額よりも県外からの観光客の消費総額が高い。
図Iのような分布であった場合、$44$県中$17$県で、県内からの観光客の消費総額よりも県外からの観光客の消費総額が高い(左の方にある2本の緑の線は、それぞれ$9$本の線が重なっている)。
この他にも、さらに多くのパターンが考えられる。

なので、この箱ひげ図からだけでは①が正しいとは言えない。


観光客の消費額単価の話なので、問題文中の図3の散布図を見る。

図3に、
県外からの観光客の消費額単価$=$県内からの観光客の消費額単価 である線
つまり
直線 $x=y$
を赤い線で書き加えると、図Jができる。

図J
大学入学共通テスト2017年試行調査 数学ⅠA第2問[2] 解説図J

図Jを見ると、$44$県の$4$分の$3$以上の点は、赤い線よりもグラフの上方にある。
よって、$44$県の$4$分の$3$以上では、県外からの観光客の消費額単価方が県内からの観光客の消費額単価より高い。

なので、②は正しい。


観光客の消費額単価の話なので、問題文中の図3の散布図を見る。

図3を見ると、県外からの観光客の消費額単価では、北海道,鹿児島県,沖縄県は上位3県にあたる。

上位3県を除いた$41$県の平均値は、$44$県すべての平均値よりも小さい。
なので、③は正しい。


これも観光客の消費額単価の話なので、問題文中の図3の散布図を見る。

県内の観光客の消費額単価の分散は、点の横方向のばらつき。
県外の観光客の消費額単価の分散は、点の縦方向のばらつき。

図3で北海道,鹿児島県,沖縄県を除いて考えると、一見 横方向のばらつきの方が大きいように見えるけど、これは目盛が違うから。
目盛を見ると、点は、
横方向には、$3$(千円)から$13$(千円)くらいの間に分布 縦方向には、$4$(千円)から$20$(千円)くらいの間に分布 している。

なので、横方向のばらつきよりも 縦方向のばらつきの方が小さいとは言えない。
よって、誤り。

アドバイス

本当は「点が$3$(千円)から$13$(千円)くらいの間に分布」や「$4$(千円)から$20$(千円)くらいの間に分布」から分かることは、データの範囲であって分散ではない。
しかし、この場合、点は特にどこかに集中しているわけではなく、ある程度ばらばらに分布している。
なので、点の分布の幅が大きいほど、分散も大きいと予想できる。


以上より、正しい選択肢は
②③
である。

解答セ:2,3

(5)

今回も、選択肢をひとつずつ確認しよう。


図4の横方向の分布を見ると、左の方に分布の中心があって、右の方は点の密度が小さい。

このような左右対称じゃない分布のときには、
右の方が点の密度が小さいとき、平均値は中央値より右 左の方が点の密度が小さいとき、平均値は中央値より左 にある。

今はグラフの右の方が点の密度が小さいので、平均値は中央値よりも右にある。
なので、⓪は適切ではない。


だけど、この判断はグラフを見た印象に基づいているので、不正確なこともある。
なので、時間があれば確認しておいた方がいい。

$44$県の中央値は、上から数えても下から数えてもいいから、$22$番目の県と$23$番目の県の値の平均値。
図4を見ると、$22$番目と$23$番目の点の開催数は、$30$と$35$くらい。
なので、中央値は$30$台前半だ。

次は、平均。
図4の点の数を数えると、行事数・イベントの開催数の度数分布は表Kのようになる。

表K
階級県数
0以上20未満9
204020
40608
60803
801001
1001202
1201400
1401601
44

表Kより、開催数の平均値は、$40$を仮平均として、
$(-30)\cdot 9+(-10)\cdot 20+10\cdot 8+30\cdot 3$
            $+50\cdot 1+70\cdot 2+90\cdot 0+110\cdot 1$
とかける。

共通因数の$10$でくくると、
$10(-27-20+8+9+5+14+11)$
$=10\cdot 0$
なので、平均値は$40$ちょうどあたり。

以上より
中央値$ \lt $平均値
なので、適切ではない。

アドバイス

以上の説明では、本当はちょっと足りない。
だけど、解説が長くなるし、この問題にはあまり影響がない話なので、ここで説明をやめておく。
そのうちに「度数分布から平均を求める」というページでもつくって詳しい説明をしたいけど、当分先の話になるかも。


「多く開催しすぎると」とあるので、開催数が多い県について考える。
「多い」の基準がはっきりしないけど、とりあえず$80$回以上あたりを考えることにする。

多く開催しすぎると観光客数が減るのなら、点は図Lの赤い線のように右下がりに並ぶはず。
ところが、実際はそうなってないので、適切ではない。

図L
大学入学共通テスト2017年試行調査 数学ⅠA第2問[2] 解説図L

散布図や相関係数でよく誤解されるんだけど、強い相関があっても、因果関係があるとは限らない。
因果関係とは、片方が原因で片方が結果である関係のことだ。

例えば、テストの点数を考えてみよう。
英語の点数と数学の点数に強い相関があっても、それは因果関係ではない。
因果関係なら、
片方の点数がよかったことが原因で、もう片方の点数がよかった
ことになるけど、これは変だ。

この問題でも同じで、イベントの開催数と県外からの観光客数の間に相関があっても、因果関係とは限らない。
なので、イベントを増やしても県外からの観光客が増えるとは限らない。
よって、適切ではない。


行祭事・イベントの開催数が最も多い県は、図Lの赤い点。

開催数は$150$弱で、県外からの観光客数は$6500$(千人)前後だから、割り算をして、イベント1回あたりの観光客数は
$\displaystyle \frac{6500}{150}=43.\dot{3}$(千人)
くらい。

上の計算ではイベントに関係なくその県を訪れた観光客数は考えていないので、実際はもっと少ない人数になる。
なので、適切ではない。


図4を見ると、あんまりはっきりしてないけど、グラフの右の方に行くほど点が上に分布している。

なので、適切である。


と言っても「図4を見ても、私にはそうは見えない」っていう人もいるかも知れない。
なので、ちょっと作業をしてみた。

まず、図4のグラフを、縦の目盛線でグループに分ける。
次に、グループを横の目盛線でマスに分ける。
マスに含まれる点の数がグループの点の数の何%にあたるかによって、マスに色をつける。
できたのが、図Mである。
色が濃いマスの方が、グループ内で多くの割合の点を含んでいる。

図M
大学入学共通テスト2017年試行調査 数学ⅠA第2問[2] 解説図M

図Mを見ると、全体として右上がりの分布と考えられる。


以上より、適切な記述は

である。

解答ソ:4