慶應義塾大学 商学部・商学研究科

新保一成 研究室

開発と環境の経済分析...

統計学 I

シミュレーション

母平均の区間推定(母分散既知の場合)

母平均$\mu$,母分散$\sigma^2$の母集団から抽出された大きさ$n$の無作為標本から計算される標本平均$\bar{X}$の分布は, 標本の大きさ$n$が大きいとき,中心極限定理によって平均$\mu$,分散$\sigma^2/n$の正規分布で近似できる。 母分散$\sigma^2$が既知であるとき,未知の母平均$\mu$に関する95%の信頼区間を次の確率に基づいて設定することができる。 $$ \Pr\left( \bar{X}-1.96\frac{\sigma}{\sqrt{n}} < \mu < \bar{X}+1.96\frac{\sigma}{\sqrt{n}}\right)=0.95 $$ この式は,区間 $$ \left[\bar{X}-1.96\frac{\sigma}{\sqrt{n}}, \bar{X}+1.96\frac{\sigma}{\sqrt{n}}\right] $$ の中に母平均$\mu$が95%の確率で含まれることを示している。

下の「Sample Size」の右にある枠に標本の大きさ$n$を入力して[Run]ボタンをプッシュしてみよう。 母集団$U(0,1)$(平均0.5,分散1/12)から大きさ$n$の標本を抽出し, 95%の信頼区間を設定してその範囲を線分で表示する。これを100回繰り返す。 もし,信頼区間の中に母平均$\mu=0.5$を含まない場合には,赤い線分で描かれる。 「Proportion of valid CIs:」の右側には,母平均$\mu$を含む信頼区間の割合が表示される。 赤い線分の本数がおおよそ5本,すなわち母平均を含む信頼区間の割合がおおよそ95%になっていることが確認できるだろう。

さて,入力する表の大きさ$n$を大きくすると,信頼区間の幅が狭くなることがわかるだろう。 これは信頼区間の算式からも明らかである。 信頼区間が狭くなったからといって,母平均$\mu$を含む信頼区間の割合が減るわけではない。 つまり,標本の大きさが大きくなれば狭い区間の中に母平均を含むことになり, 区間推定の精度を上げることができる。