全体を推計する統計学
2個や3個も多めに出ています。
一方で7個なんていうデータも出ました。
実を言うとえ~正解はですね10%の…、あのう100個青い玉というのが正解なんですよね。
なんと…、50個ではなかったのです。
ということはこの実験では正しい玉の数は青い玉の数は、わからなかったという事ですよね。
そうですね。
で引いたのは1個だったから、50個っていう話になってましたよね。
正しい値が推定できたのは、この2個のケースですよね。
はい。
だけれどもその数字自体が答えだっていうふうには、統計学では考えないんですよね。
はい。
誤差があるんで。
そういう答えの出し方をするんですよね。
はいはい。
この場合…、この違いが誤差なのです。
部分から全体を推計する統計学では、必ず誤差が出ることを想定します。
そのうこの誤差の範囲を付けて、ここからここまでの間に入ってますよと。
はい。
で今100回実験を繰り返したわけですけど、95%の確率で本当の値が入ってますよという、この誤差を伴った区間のことを、「95%信頼区間」というふうに言うんですよね。
はい。
この範囲の中に本当の値が、95%の確率で入っています。
それでその誤差の大きさがどんな形になるかっていう事を、理論的に計算することができるんですよね。
あっそれも統計学でわかっちゃうんですか。
わかっちゃうんですね。
へぇ~!なんと…、じゃじゃ~ん!これが今申し上げた誤差の範囲というのが、どれぐらいあるかっていうのを計算するときに使う式なんですね。
これは複雑ですね。
ですよね。
見たことない数式ですけど。
はい。
なんか平方根とか入ってたりとかちょっと複雑なんですけど、これ実を言うとよく見てみるとですね、そんなにややこしくもないんですよね。
本当ですか?
はい。
先生ごめんなさい。
とにかくこの式を使うと、今日の実験誤差の範囲はプラスマイナス13%と出せるんです。
ここから…、水槽の青いボールの数は…、…の間。
幅がありますねぇ。
もっと正確にこの水槽の中の青玉の数を知ろうと思ったら、どうしたらいいと思います?
う~んあっ。
玉の数を増やすと。
引き上げる。
そうですよね。
はい。
というわけで…、…開始!今度は取り出す数を20個から100個に増やします。
できるかな?
できるかな?
できるかな?
できるかな?
でき・るか・な?
な?
な~っ!?
結果はこちら!気になる誤差の範囲はプラスマイナス5.9%。
今度は青いボールの数は…、…の間ということになります。
20個取り出した時と100個の時を比べると、誤差の範囲が小さくなります。
でも先生調査は1回しかできないんですよね。
はい。
例えば1回したときにこの表であるように、「7」というのが出たりしたらこれがもう調査結果に、なっちゃうわけですもんね。
「統計学」カテゴリーの関連記事