硬貨やサイコロを投げるというようかことを試行といいます。このとき、
・二値性:試行の結果は、ある事象が起こるか起こらないかの2つの状態になる。
・独立性:次の試行の結果は、これまでの試行の結果とは無関係である。
という条件を満たす試行のことをベルヌーイ試行といいます。
以降での試行とは、すべてベルヌーイ試行です。
1回の試行で硬貨で表がでるか、サイコロで1の目がでるかというような事象が発生する確率が既知であるとして、数回の試行をしたときに、それらの事象が何回起こるかというような問題を取り扱うのが二項分布です。
ここでは、二項分布およびそれに関連するいくつかの確率分布について学習します。
二項分布
ある事象が起こる確率がpの試行をn回行ったとき、その事象がx回起こる確率P(x)は、次の二項分布になる。
P(x)=nCxpx(1-p)n-x
平均:np 分散:np(1-p)
- 例題
- 硬貨を5回投げたとき、2回が表になる確率を求めよ。
- 解答
- p=1/2、n=5、x=2を公式に代入する。
P(2)=5C2(1/2)2(1-1/2)5-2
=10×(1/2)5=5/16=0.3125
- 解説
- nCxに関しては「順列・組合せ」(stat-pc)、二項分布の公式に関しては「確率の基礎的例題」(stat-kakuritu-reidai)を参照のこと。
なお、例題でx=0~5について計算すると次のようになります。
確率密度 累積確率
x P(x) ∑P(x)
0 0.03125 0.03125
1 0.15625 0.1875
2 0.3125 0.5
3 0.3125 0.8175
4 0.15625 0.96875
5 0.03125 1
ここで、「二項」分布といわれる理由を簡単に示します。
ある事象が起こることをa、起こらないことをbとし、それをn回行うとすれば、(a+b)n と関係がありそうです。これを展開したときの axbn-x の係数は、nCx を二項係数といいます。このようなことから二項分布という名称になったのです。
- 二項分布と正規分布
- 二項分布は、平均=np、分散=np(1-p) になります。
npが大きいときには、二項分布は、平均=np、分散=np(1-p) の正規分布で近似できます。
- Excelの関数
- 二項分布で、xを与えて確率密度P(x)と累積確率∑P(x)を求める。
BINOMDIST(x,n,p,FALSE/TRUE) FALSE:P(x)、TRUE:∑P(x)
例:BINOMDIST(2,5,0.5,FALSE)=0.3125
BINOMDIST(2,5,0.5,TRUE)=0.5
二項分布の累積確率Pを与えて、P≦∑P(x)となるxを求める。
CRITBINOM(n,p,∑P)
例:CRITBINOM(5, 0.5, 0.9)=4
二項分布の計算プログラム
負の二項分布
ある事象が起こる確率がpのとき、n回投げたときに、その事象がはじめてx回発生する確率P(n)は、次の負の二項分布になる。
P(n)=n-1Cx-1px(1-p)n-x
平均:x(1-p)/p 分散:x(1-p)/p2
- 例題
- 硬貨を投げて、5回投げたときに、はじめて表が3回になる確率を求めよ。
- 解答
- n=5、x=3、p=1/2を公式に代入。
P(5)=5-1C3-1(1/2)3(1-1/2)5-3
=4C2(1/2)5
=6/32=3/16=0.1875
- 解説
- n回の試行ではじめてx回になるということは、
n-1回まででx-1回起こっていた
この確率は二項分布の公式で、n→n-1、x→x-1とした確率であるから、
n-1Cx-1px-1(1-p)n-x
になります。
そして、n回目にその事象が起こった
その確率はp
これから、負の二項分布の公式が得られます。
- 二項分布との関係
- 二項分布では、試行回数nが先にあって、事象が起こる確率などを求めました。負の二項分布では、事象が起こる回数xが先にあります。ここで試行回数を時間だと考えれば、事象がx回起こるまでの時間を問題にしていることになります。
なお、どうして「負」の二項分布というのかの説明は省略します。
- Excelの関数
- 負の二項分布の確率P(n)を求める。
NEGBINOMDIST(n-x,x,p)
例:NEGBINOMDIST(2,3,0.5)=0.1875
負の二項分布の計算プログラム
幾何分布
ある事象が起こる確率がpのとき、n回の試行により、はじめてその事象が起こる確率P(n)は、次の幾何分布になる。
P(n)=(1-p)n-1p
平均:(1-p)/p 分散:2*μ2
(負の二項分布で、x=1とおくと、幾何分布に一致する)
- 例題
- サイコロを3回目に投げたときにはじめて1の目が出る確率を求めよ。
- 解答
- 2回目までは、1の目が出ない確率:(1-1/6)2=25/36
次に投げたときに1の目が出る確率:1/6
従って、P(3)=(25/36)×(1/6)=25/216=0.116
- 解説
- この公式が成立する理由は、上の解答からも自明でしょう。
なぜ「幾何」分布というのかの説明は省略します。
幾何分布の計算プログラム
超幾何分布
n個のなかにAがa個、Bがb(=n-a)個ある。n個からx個を取り出したとき、Aがα個である(Bがβ(=x-α)個である)確率P(x)は、超幾何分布になる。
aCα×bCβ
P(x)=─────────
nCx
平均:xa/n 分散:a(a-1)x(x-1)/n(n-1)
- 例題
- 袋の中に赤玉が3つ、白玉が4つ入っている。玉を2つ取り出したとき、赤玉と白玉が1つずつである確率を求めよ。
- 解答
- 赤玉をA、白玉をBとすると、n=7、a=3、b=4、x=2、α=1、β=1である。
これを公式に代入すると、
3C1×4C1 3×4
P(x)=─────────=────
7C2 21
=4/7=0.5714
詳しい説明は、「確率の基礎的例題」(stat-kakuritu-reidai)を参照のこと。
- Excelの関数
- 超幾何分布で、P(x)を求める。
HYPGEOMDIST(α,x,a,n)
例:HYPGEOMDIST(1,2,3,7)=0.5714
超幾何分布の計算プログラム
ポアソン分布
単位時間中にある事象が発生する平均回数をλとするとき、単位時間中にその事象がx回発生する確率密度P(x)は、ポアソン分布に従う。
λx
P(x)=──e-λ eは自然対数の底=2.718
x!
平均:λ 分散:λ2
- 例題
- ある店では、1時間に平均5人の客が来る。客の来かたはランダムだとするとき、1時間に3人の客が来る確率を求めよ。
- 解答
- λ=5[人/時間]、x=3[人/時間]を公式に代入する。
λx 53 125
P(x)=──e-λ=──────e-5=───×0.006738
x! 3×2×1 6
=0.1404
- 解説
- この公式の証明は、数学的に高度なので省略します。また、計算も面倒ですので、数表や表計算ソフトを用いることにします。
なお、ポアソン分布は、平均=λ、分散=λになります。平均=分散の関係があるのが特徴です。
- Excelの関数
- ポアソン分布の確率密度P(x)と累積確率∑P(x)を求める。
POISSON(x,λ,FALSE/TRUE) FALSE:P(x)、TRUE:∑P(x)
例:POISSON(3,5,FALSE)=0.1404
POISSON(3,5,TRUE)=0.2650
- ポアソン分布のグラフ
発生頻度の平均λを変えて、発生頻度xとその確率P(x) のグラフを描くと右図のようになります。x=λのときに最大になりますが、λが小さいときは左寄りの山になり、λが大きくなると左右対称になり正規分布のようになります。
これは次のように解釈できます。1時間を単位にとれば、来客数は平均10人程度で、毎時間の来客数は10人のまわりに正規分布すると考えてもよいでしょう。ところが、1分単位にすれば、客は来るか来ないかのどちらかになり、2人以上来る確率は非常に低くなります、λ=1がそのような状況を示しているのだといえます。
このように、ある事象をとらえるには時間の単位が重要であり、それによって正規分布として考えるかポアソン分布として考えるのが適切かが変わってくるのです。
ポアソン分布の計算プログラム