慶應義塾大学 商学部・商学研究科

新保一成 研究室

開発と環境の経済分析...

統計学I

シミュレーション

統計的確率ーコイン投げで表が出る確率は50%?

「コインを投げて表が出る確率は?」と問えば,みなさんは1/2と答える。 それは,みなさんは自分が持っている10円玉や100円玉などのコインは「理想的なコイン」で, 表と裏が出る確率は相等しく1/2であるという確率モデルを頭の中で想定しているからである。 しかし,コインを2回投げたときに表と裏が1回ずつ出る(表,裏),(裏,表)が必ずしも実現するわけではなく, (表,表),(裏,裏)が少なからず実現することも知っている。

授業では,コインを1000回も投げて表の出た回数を数えてみれば,それは500回の近傍にあるはずなので, ぜひ試してみろと言った。そんな暇があれば本でも読んでいるほうがましだというのは当然の反応だろう。 そんな単純作業は,コンピューターに任せればよい。

下の「Number of Traials」の右の枠にコインを投げる回数を入力して,[Run]ボタンをプッシュしてみよう。 描かれたグラフの高さは,コインを投げた回数のうち表が出た回数の割合を示している。 いま100を入力したとしよう。 1回目が表なら,投げた回数1に対して表が1回であるからグラフの高さは1から始まる。 2回目も表ならグラフの高さは1のままであり,裏なら2回投げたうち表は1回であるからグラフの高さは0.5まで落ちる。 さて,100回目の高さは,0.5の近傍に収束していくことが見えるのではないだろうか。 終点における表の相対的頻度は,「Sample Mean:」の右側に表示される。 もう一度[Run]ボタンをプッシュしてみよう。新たなグラフが重ねられる。 経路は違うけれども,やはり0.5の近傍に収束してくはずだ。 投げる回数を変えると一度グラフはクリアされて,新たなグラフが描かれる。 経路も,終点の相対的頻度も異なるのは,これが確率的な現象だからである。

さて,$X$を0または1をとる離散的な確率変数であるとしよう。 すなわちコインを投げて表が出たときに$x=0$で裏が出たときに$x=1$である。 いまコインを$n$回投げたとすると,$X_1,\ldots,X_n$は平均$p=0.5$の2項母集団からの無作為標本で, 標本平均 $$p'_n = \frac{1}{n} \sum_{i=1}^n X_i$$ は,表の出た回数の割合を示す。 グラフは,任意の正の実数$\epsilon$に対して,次の関係が成り立つことを示唆している。 $$\lim_{n \rightarrow \infty} \Pr\left[\left|p'_n-p\right| < \epsilon \right]=1$$ 上の式は,標本平均と母平均の差の絶対値がいくらでも小さな実数$\epsilon$より小さくなる確率は, 標本の大きさ$n$が大きくなるにしたがって1に近づくことを示している。 すなわち,標本平均は,標本の大きさを大きくするにつれていくらでも母平均に近づく。 これを大数の(弱)法則といい,この極限値$p$のことを統計的確率あるいは頻度解釈の確率という。