硬貨やサイコロを投げるというようかことを試行といいます。このとき、
・二値性:試行の結果は、ある事象が起こるか起こらないかの2つの状態になる。
・独立性:次の試行の結果は、これまでの試行の結果とは無関係である。
という条件を満たす試行のことをベルヌーイ試行といいます。
以降での試行とは、すべてベルヌーイ試行です。
1回の試行で硬貨で表がでるか、サイコロで1の目がでるかというような事象が発生する確率が既知であるとして、数回の試行をしたときに、それらの事象が何回起こるかというような問題を取り扱うのが二項分布です。
ここでは、二項分布およびそれに関連するいくつかの確率分布について学習します。
二項分布
ある事象が起こる確率がpの試行をn回行ったとき、その事象がx回起こる確率P(x)は、次の二項分布になる。
P(x)=nCxpx(1-p)n-x
- 例題
- 硬貨を5回投げたとき、2回が表になる確率を求めよ。
- 解答
- p=1/2、n=5、x=2を公式に代入する。
P(2)=5C2(1/2)2(1-1/2)5-2
=10×(1/2)5=5/16=0.3125
- 解説
- nCxに関しては「順列・組合せ」(stat-pc)、二項分布の公式に関しては「確率の基礎的例題」(stat-kakuritu-reidai)を参照のこと。
なお、例題でx=0~5について計算すると次のようになります。
確率密度 累積確率
x P(x) ∑P(x)
0 0.03125 0.03125
1 0.15625 0.1875
2 0.3125 0.5
3 0.3125 0.8175
4 0.15625 0.96875
5 0.03125 1
ここで、「二項」分布といわれる理由を簡単に示します。
ある事象が起こることをa、起こらないことをbとし、それをn回行うとすれば、(a+b)n と関係がありそうです。これを展開したときの axbn-x の係数は、nCx を二項係数といいます。このようなことから二項分布という名称になったのです。
- 二項分布と正規分布
- 二項分布は、平均=np、分散=np(1-p) になります。
npが大きいときには、二項分布は、平均=np、分散=np(1-p) の正規分布で近似できます。
- Excelの関数
- 二項分布で、xを与えて確率密度P(x)と累積確率∑P(x)を求める。
BINOMDIST(x,n,p,FALSE/TRUE) FALSE:P(x)、TRUE:∑P(x)
例:BINOMDIST(2,5,0.5,FALSE)=0.3125
BINOMDIST(2,5,0.5,TRUE)=0.5
二項分布の累積確率Pを与えて、P≦∑P(x)となるxを求める。
CRITBINOM(n,p,∑P)
例:CRITBINOM(5, 0.5, 0.9)=4
負の二項分布
ある事象が起こる確率がpのとき、n回試行したときに、その事象がはじめてx回になる確率P(n)は、次の負の二項分布になる。
P(n)=n-1Cx-1px(1-p)n-x
- 例題
- 硬貨を投げて、5回投げたときに、はじめて表が3回になる確率を求めよ。
- 解答
- n=5、x=3、p=1/2を公式に代入。
P(5)=5-1C3-1(1/2)3(1-1/2)5-3
=4C2(1/2)5
=6/32=3/16=0.1875
- 解説
- n回の試行ではじめてx回になるということは、
n-1回まででx-1回起こっていた
この確率は二項分布の公式で、n→n-1、x→x-1とした確率であるから、
n-1Cx-1px-1(1-p)n-x
になります。
そして、n回目にその事象が起こった
その確率はp
これから、負の二項分布の公式が得られます。
- 二項分布との関係
- 二項分布では、試行回数nが先にあって、事象が起こる確率などを求めました。負の二項分布では、事象が起こる回数xが先にあります。ここで試行回数を時間だと考えれば、事象がx回起こるまでの時間を問題にしていることになります。
なお、どうして「負」の二項分布というのかの説明は省略します。
- Excelの関数
- 負の二項分布の確率P(n)を求める。
NEGBINOMDIST(n-x,x,p)
例:NEGBINOMDIST(2,3,0.5)=0.1875
幾何分布
ある事象が起こる確率がpのとき、n回の試行により、はじめてその事象が起こる確率P(n)は、次の幾何分布になる。
P(n)=(1-p)n-1p
(負の二項分布で、x=1とおくと、幾何分布に一致する)
- 例題
- サイコロを3回目に投げたときにはじめて1の目が出る確率を求めよ。
- 解答
- 2回目までは、1の目が出ない確率:(1-1/6)2=25/36
次に投げたときに1の目が出る確率:1/6
従って、P(3)=(25/36)×(1/6)=25/216=0.116
- 解説
- この公式が成立する理由は、上の解答からも自明でしょう。
なぜ「幾何」分布というのかの説明は省略します。
超幾何分布
n個のなかにAがa個、Bがb(=n-a)個ある。n個からx個を取り出したとき、Aがα個である(Bがβ(=x-α)個である)確率P(x)は、超幾何分布になる。
aCα×bCβ
P(x)=─────────
nCx
- 例題
- 袋の中に赤玉が3つ、白玉が4つ入っている。玉を2つ取り出したとき、赤玉と白玉が1つずつである確率を求めよ。
- 解答
- 赤玉をA、白玉をBとすると、n=7、a=3、b=4、x=2、α=1、β=1である。
これを公式に代入すると、
3C1×4C1 3×4
P(x)=─────────=────
7C2 21
=4/7=0.5714
詳しい説明は、「確率の基礎的例題」(stat-kakuritu-reidai)を参照のこと。
- 解説
- ここではA、Bの2種類でしたが、3種類以上の場合も同じような公式が成立します。なお、これをなぜ「超」幾何分布というのかの説明は省略します。
- Excelの関数
- 超幾何分布で、P(x)を求める。
HYPGEOMDIST(α,x,a,n)
例:HYPGEOMDIST(1,2,3,7)=0.5714