Web教材一覧統計・確率

パレート分布


パレート分布の概念

右図の青字を見てください。パレートは、所得の高い人から順に並べて所得をプロットすると、赤線のようになり、富の8割は人口の2割によって支配されるという、80:20の法則,またはパレートの法則を提唱しました。
 このような分布は、経済現象、社会現象、自然現象などの様々な事例に当てはめられることが分かり、広範な研究領域に渡って広く用いられている確率分布です。

統計的な説明

黒字で説明します。赤線は、パラメタA(>0)とK(>0)を持つパレート分布の確率密度関数です。

パレート分布のグラフ

確率密度関数:f(X) = KAK/XK+1、累積確率関数:F(X) = 1-(A/X)K のパラメタAとKを変化させて図示したのが右図です。

確率密度関数について考察します。
 Aは軸の目盛りの単位を示すものだといえます。所得の例でいえば、何人を一つのグループにしたかというようなイメージです。
 Kは傾きを示すものだといえます。Kが大になるにつれて傾きが大になります。所得でいえば貧富格差が大になります。

 A・Kが定まったとき(1本の線)では、主に1/XK+1 により値が小さくなります。累乗的な減少ですので、

確率密度関数の期待値:(K>1のとき)KA/(K-1)、 分散:(K>2のとき)KA2/((K-1)2(K-2))

一般化パレート分布(Generalized Pareto Distributions,GPD)

パレート分布を拡張したものです。説明は省略しますが、次の式で与えられます。

            1┌  ξ(X-μ)┐-1-1/ξ
確率密度関数:f(X) = ─│1+─────│
            σ└    σ  ┘

                 σ σ
    期待値:(ξ<1) μ+───    分散:(ξ<1/2) ─────────
                1-ξ               (1-ξ)2(1-ξ)

              ┌  ξ(X-μ)┐1/ξ
累積分布関数:F(X) = 1-│1+─────│
              └    σ  ┘

確率密度関数に、σ=A/K、ξ=1/k、μ=Aを代入すると、f(X) = KAK/XK+1 となりパレート分布に一致します。

このように、一般化パレート分布のパラメタを適当に指定することにより、指数分布やべき乗分布など多様な分布が得られます。逆にいえば、それらの分布を一つにまとめたのが一般化パレート分布なのです。