全体を推計する統計学

２個や３個も多めに出ています。
一方で７個なんていうデータも出ました。
実を言うとえ～正解はですね１０％の…、あのう１００個青い玉というのが正解なんですよね。
なんと…、５０個ではなかったのです。
ということはこの実験では正しい玉の数は青い玉の数は、わからなかったという事ですよね。
そうですね。
で引いたのは１個だったから、５０個っていう話になってましたよね。
正しい値が推定できたのは、この２個のケースですよね。
はい。
だけれどもその数字自体が答えだっていうふうには、統計学では考えないんですよね。
はい。
誤差があるんで。
そういう答えの出し方をするんですよね。
はいはい。
この場合…、この違いが誤差なのです。
部分から全体を推計する統計学では、必ず誤差が出ることを想定します。
そのうこの誤差の範囲を付けて、ここからここまでの間に入ってますよと。
はい。
で今１００回実験を繰り返したわけですけど、９５％の確率で本当の値が入ってますよという、この誤差を伴った区間のことを、「９５％信頼区間」というふうに言うんですよね。
はい。
この範囲の中に本当の値が、９５％の確率で入っています。
それでその誤差の大きさがどんな形になるかっていう事を、理論的に計算することができるんですよね。
あっそれも統計学でわかっちゃうんですか。
わかっちゃうんですね。
へぇ～！なんと…、じゃじゃ～ん！これが今申し上げた誤差の範囲というのが、どれぐらいあるかっていうのを計算するときに使う式なんですね。
これは複雑ですね。
ですよね。
見たことない数式ですけど。
はい。
なんか平方根とか入ってたりとかちょっと複雑なんですけど、これ実を言うとよく見てみるとですね、そんなにややこしくもないんですよね。
本当ですか？
はい。
先生ごめんなさい。
とにかくこの式を使うと、今日の実験誤差の範囲はプラスマイナス１３％と出せるんです。
ここから…、水槽の青いボールの数は…、…の間。
幅がありますねぇ。
もっと正確にこの水槽の中の青玉の数を知ろうと思ったら、どうしたらいいと思います？
う～んあっ。
玉の数を増やすと。
引き上げる。
そうですよね。
はい。
というわけで…、…開始！今度は取り出す数を２０個から１００個に増やします。
できるかな？
できるかな？
できるかな？
できるかな？
でき・るか・な？
な？
な～っ！？
結果はこちら！気になる誤差の範囲はプラスマイナス５．９％。
今度は青いボールの数は…、…の間ということになります。
２０個取り出した時と１００個の時を比べると、誤差の範囲が小さくなります。
でも先生調査は１回しかできないんですよね。
はい。
例えば１回したときにこの表であるように、「７」というのが出たりしたらこれがもう調査結果に、なっちゃうわけですもんね。