第7章 代表的な離散型確率分布
7-3: ポアソン分布Poisson Distribution ~まれな出来事の回数の分布~
ベルヌーイ分布(1回の試行)、二項分布(n回の成功回数)と見てきたね。今回紹介するのは、これらとは少しタイプの違う、でもとても役立つ離散型確率分布、「ポアソン分布Poisson Distribution」だよ。
ポアソン分布は、「ある一定の期間や空間において、平均すると $\lambda$(ラムダ)回起こるような『まれな』事象が、実際に何回起こるか」の確率を表す分布なんだ。
例えば、こんな場面で使われるよ:
- 1時間に交差点を通過する車の台数
- Webサーバーへの1分間のアクセス要求の数
- 1平方キロメートルあたりに生息する特定の希少動物の数
- 文章1ページあたりのタイプミスの数
- 一定量の血液に含まれる特定の細胞の数
これらの例に共通するのは、「広い範囲(時間や空間)の中で、個々の事象は比較的まれにしか起こらないけれど、その発生回数を数える」という点だね。
ポアソン分布Poisson Distribution とは?
ある一定の期間(または空間、距離など。これを「単位区間」と呼ぼう)において、
- 平均して $\mathbf{\lambda}$ 回起こると期待される事象があり($\lambda > 0$)、
- 各事象の発生は互いに独立であり、
- 非常に短い区間内では、事象が1回だけ起こる確率はその区間の長さに比例し、2回以上起こる確率は無視できるほど小さい
という条件が満たされるとき、その単位区間における事象の発生回数 $X$($X=0, 1, 2, \dots$)が従う離散型確率分布を、パラメータ $\lambda$ を持つポアソン分布という。
パラメータ $\mathbf{\lambda}$ は、その単位区間における平均発生回数を表しているんだ。
上記の条件は、より正確にはポアソン過程と呼ばれるモデルの仮定に基づいているよ。 簡単に言うと、「いつ起こるか予測不能(ランダム)」で、「過去の発生が未来の発生に影響しない(独立)」ような、「平均的な発生ペースは一定」の事象の「回数」を扱うのに適しているんだ。
ポアソン分布の確率質量関数 (PMF)
単位区間あたりの平均発生回数が $\lambda$ であるポアソン分布に従うとき、その区間で事象がちょうど $k$ 回起こる確率 $P(X=k)$ は、次の式で計算できるんだ。
$P(X=k) = \frac{e^{-\lambda} \lambda^k}{k!} \quad (\text{ただし } k=0, 1, 2, \dots)$
ここで、
- $e$ はネイピア数 (Napier's constant) と呼ばれる数学定数で、約 $2.71828...$ という値だよ。関数電卓やコンピュータで $e^x$ (または $\exp(x)$) として計算できる。
- $\lambda$ は単位区間あたりの平均発生回数(ポアソン分布のパラメータ)。
- $k$ は実際に事象が発生する回数(求めたい確率に対応)。$k$ は0以上の整数だよ。
- $k!$ は $k$ の階乗 ($k \times (k-1) \times \dots \times 1$)。$0!=1$ と約束するんだったね。
この式は、二項分布で試行回数 $n$ をすごく大きく、成功確率 $p$ をすごく小さくして、$np = \lambda$(一定)となるようにしたときの極限の形としても導かれるんだ。(だから「まれな事象の回数」によく使われるんだね)
ポアソン分布の期待値と分散
ポアソン分布には、とても面白い性質があるんだ。
期待値 $E[X]$ (平均発生回数):
$E[X] = \lambda$
なんと、パラメータ $\lambda$ がそのまま期待値(平均発生回数)になっている!これはとても分かりやすいね。
分散 $V[X]$ (発生回数のばらつき):
$V[X] = \lambda$
さらに驚くことに、分散も期待値と同じ $\lambda$ になるんだ!つまり、平均発生回数が多いほど、実際の発生回数のばらつきも大きくなる、ということだね。期待値と分散が等しい、というのがポアソン分布の大きな特徴だよ。
(期待値と分散の導出は少し難しいので、ここでは結果だけ覚えておこう!)
具体的な例で計算してみよう!
例題1:交差点の事故件数
ある交差点では、1時間に平均して3件 ($\lambda=3$) の交通事故が起こるというデータがあるとする。ポアソン分布に従うと仮定して、次の1時間に事故がちょうど2件 ($k=2$) 起こる確率 $P(X=2)$ を求めてみよう。
公式 $P(X=k) = \frac{e^{-\lambda} \lambda^k}{k!}$ に、$\lambda=3, k=2$ を代入する。
$P(X=2) = \frac{e^{-3} \times 3^2}{2!} = \frac{e^{-3} \times 9}{2 \times 1}$
$e^{-3}$ の値は電卓などを使うと約 $0.049787$ だから…
$P(X=2) \approx \frac{0.049787 \times 9}{2} \approx \frac{0.448083}{2} \approx 0.224$
答え: 約 0.224 (約 22.4%)
(注意: $e^{-\lambda}$ の計算には関数電卓やコンピュータが必要になることが多いよ)
例題2:Webサーバーへのアクセス数
あるWebサーバーには、1分間に平均して5回 ($\lambda=5$) のアクセスがあるとする。ポアソン分布に従うとして、次の1分間にアクセスが1回もない ($k=0$) 確率 $P(X=0)$ は?
公式に $\lambda=5, k=0$ を代入する。
$P(X=0) = \frac{e^{-5} \times 5^0}{0!}$
ここで、$5^0=1$ であり、$0!=1$ だったことを思い出すと…
$P(X=0) = \frac{e^{-5} \times 1}{1} = e^{-5}$
$e^{-5}$ は約 $0.006738$ なので…
答え: 約 0.0067 (約 0.67%)
平均5回アクセスがあるサーバーでも、たまたま1分間アクセスがゼロになる確率は1%以下なんだね。
ポアソン確率計算ツール
ポアソン分布の形状
ポアソン分布の形は、パラメータ $\lambda$(平均発生回数)の値によって変わるよ。下のグラフで見てみよう。
$\lambda=1$ (青), $\lambda=4$ (赤), $\lambda=10$ (緑) の場合のグラフ。
$\lambda$ が小さいと右に歪み、大きいと対称的な山形に近づく。
- $\lambda$ が小さい(平均発生回数が少ない)とき:
$k=0$ や $k=1$ の確率が最も高く、グラフは右に長く裾を引く形(右に歪んだ分布)になる。 - $\lambda$ が大きい(平均発生回数が多い)とき:
グラフの山は $\lambda$ の値のあたりにでき、形はだんだん左右対称の釣鐘型(正規分布に似た形)に近づいていくんだ。
二項分布との関係:ポアソンの極限定理
実は、ポアソン分布は二項分布と深い関係があるんだ。
二項分布 $B(n, p)$ において、試行回数 $n$ がものすごく大きくて、成功確率 $p$ がものすごく小さい(つまり「まれな事象」を考えている)場合を考えてみよう。このとき、期待値 $\lambda = np$ がある一定の値になるようにしておくと、なんと二項分布の確率はポアソン分布の確率でとてもよく近似できることが知られているんだ!
$P_{B(n,p)}(X=k) \approx P_{Poisson(\lambda=np)}(X=k) \quad (\text{n が大, p が小, } \lambda=np \text{ が適度な値のとき})$
これを「ポアソン分布による二項分布の近似」や「ポアソンの極限定理」と呼ぶよ。計算が大変な二項分布の代わりに、より計算しやすいポアソン分布を使うことができる場合があるんだね。
まとめ
- ポアソン分布は、一定期間(空間)における「まれな」事象の発生回数 $X$ の確率分布。
- パラメータは平均発生回数 $\mathbf{\lambda}$ のみ。
- 確率質量関数(PMF)は $P(X=k) = \frac{e^{-\lambda} \lambda^k}{k!}$ ($k=0, 1, 2, \dots$)。
- 期待値 $E[X]=\lambda$、分散 $V[X]=\lambda$ (期待値と分散が等しい!)。
- 交通事故の件数、Webアクセス数、製品の欠陥数など、様々な「回数」を数える場面で応用される。
- $n$ が大きく $p$ が小さい二項分布の良い近似になる。
ポアソン分布も、確率の世界でとてもよく登場する重要な分布の一つだよ!
もっと具体的な例題は次のページで見てみよう。
→ ポアソン分布の例題へ
このページで出てきたEnglish wordsとその仲間たち
英単語 (English) | 意味 (Meaning) | 例文 (Example Sentence) | 例文の読み上げ | 例文の日本語訳 |
---|---|---|---|---|
Poisson Distribution | ポアソン分布 | The Poisson distribution models the number of events occurring in a fixed interval of time or space. | ▶ 再生 | ポアソン分布は、固定された時間または空間の区間内で発生する事象の数をモデル化します。 |
Rate / Average Rate ($\lambda$) | 率、平均発生率(ラムダ) | Lambda ($\lambda$) represents the average rate of events per unit interval. | ▶ 再生 | ラムダ($\lambda$)は、単位区間あたりの事象の平均発生率を表します。 |
Event Count (k) | 事象の発生回数 (k) | We calculate the probability of observing an event count of k. | ▶ 再生 | 私たちはkという事象発生回数を観測する確率を計算します。 |
Rare Event | まれな事象 | Poisson distribution is often used for modeling rare events. | ▶ 再生 | ポアソン分布は、しばしばまれな事象のモデル化に使用されます。 |
Napier's Constant / Euler's Number (e) | ネイピア数 / オイラー数 (e) | The constant e (approximately 2.718) appears in the Poisson formula. | ▶ 再生 | 定数e(約2.718)はポアソンの公式に現れます。 |
Factorial (k!) | 階乗 (k!) | Remember that $0! = 1$ in the factorial calculation. | ▶ 再生 | 階乗の計算において $0!=1$ であることを覚えておいてください。 |
Poisson Approximation to Binomial | 二項分布のポアソン近似 | The Poisson approximation to the binomial distribution is useful when n is large and p is small. | ▶ 再生 | 二項分布のポアソン近似は、nが大きくpが小さい場合に役立ちます。 |