第7章 代表的な離散型確率分布
7-4: 幾何分布Geometric Distribution ~初めて成功するまでの試行回数~
ベルヌーイ分布(1回の試行の結果)、二項分布($n$回中の成功回数)、ポアソン分布(一定区間での発生回数)と、色々な離散型確率分布を見てきたね。
今回は、また少し違った視点の確率分布、「幾何分布Geometric Distribution」を紹介するよ。これは、「成功するまでチャレンジを続ける」ような状況で活躍する分布なんだ。
例えば、こんなことを考えたことはないかな?
- 「コインを投げ続けて、初めて表が出るのは、平均して何回目くらいだろう?」
- 「なかなか当たらないガチャだけど、初めて当たりを引くのは何回目になる確率が一番高いのかな?」
このように、成功するまでベルヌーイ試行を繰り返したときに、初めて成功するのが「何回目の試行か」、その試行回数が従う確率分布が幾何分布なんだ。
幾何分布Geometric Distribution とは?
互いに独立なベルヌーイ試行(成功確率 $p$ で一定、$0 < p \le 1$)を繰り返し行う。
このとき、初めて成功するまでの試行回数を確率変数 $X$ とする。この確率変数 $X$ が従う離散型確率分布を、パラメータ $p$ を持つ幾何分布という。
確率変数 $X$ は、$1, 2, 3, \dots$ という、1以上の整数値をどこまでもとりうる可能性があるね。(運が悪ければ、ものすごくたくさんの回数がかかるかもしれない!)
注意:教科書によっては、「初めて成功するまでの失敗回数 $Y = X-1$」($Y=0, 1, 2, \dots$) を幾何分布と定義することもあるよ。どちらの定義を使っているか確認することが大切だけど、ここでは「初めて成功するまでの試行回数 $X$」の分布として話を進めるね。
幾何分布の確率質量関数 (PMF)
初めて成功するのが、ちょうど $k$ 回目 ($k=1, 2, 3, \dots$) である確率 $P(X=k)$ はどうなるかな?
「$k$ 回目に初めて成功する」ということは、その前の $k-1$ 回はすべて失敗し、かつ、$k$ 回目に初めて成功する、ということだね。
1回の試行での成功確率を $p$、失敗確率を $1-p$ とすると、各試行は独立なので、確率の乗法定理から、
$P(X=k) = \underbrace{P(\text{1回目失敗}) \times \dots \times P(k-1\text{回目失敗})}_{k-1 \text{ 回失敗}} \times \underbrace{P(k\text{回目成功})}_{1 \text{ 回成功}}$
$P(X=k) = (1-p)^{k-1} p \quad (\text{ただし } k=1, 2, 3, \dots)$
これが幾何分布の確率質量関数(PMF)だよ。$k-1$ 回の失敗が続いて、最後に成功する確率、という形になっているね。
具体的な例で確率を計算してみよう!
例題1:コインで初めて表が出るのは?
公正なコインを繰り返し投げる。初めて表が出るのがちょうど3回目である確率 $P(X=3)$ は?
成功(表が出る)確率 $p = \frac{1}{2}$。失敗(裏が出る)確率 $1-p = \frac{1}{2}$。
求めたいのは $k=3$ の確率。
公式 $P(X=k) = (1-p)^{k-1} p$ に代入すると、
$P(X=3) = (\frac{1}{2})^{3-1} \times \frac{1}{2} = (\frac{1}{2})^2 \times \frac{1}{2} = (\frac{1}{2})^3 = \frac{1}{8}$
確率は $\frac{1}{8}$
(これは「裏、裏、表」の順で出る確率と等しいね!)
例題2:サイコロで初めて1の目が出るのは?
公正なサイコロを繰り返し振る。初めて1の目が出るのがちょうど4回目である確率 $P(X=4)$ は?
成功(1の目が出る)確率 $p = \frac{1}{6}$。失敗(1以外の目が出る)確率 $1-p = \frac{5}{6}$。
求めたいのは $k=4$ の確率。
$P(X=4) = (\frac{5}{6})^{4-1} \times \frac{1}{6} = (\frac{5}{6})^3 \times \frac{1}{6}$
$P(X=4) = \frac{125}{216} \times \frac{1}{6} = \frac{125}{1296}$
確率は $\frac{125}{1296}$ (約 9.6%)
例題3:ガチャで初めて当たりが出るのは?
あるゲームのガチャで、当たりが出る確率が5% ($p=0.05$)であるとする。初めて当たりが出るのがちょうど10回目である確率 $P(X=10)$ は?
成功(当たり)確率 $p = 0.05$。失敗(はずれ)確率 $1-p = 0.95$。
求めたいのは $k=10$ の確率。
$P(X=10) = (0.95)^{10-1} \times 0.05 = (0.95)^9 \times 0.05$
$(0.95)^9$ は電卓で計算すると約 $0.630249$ なので、
$P(X=10) \approx 0.630249 \times 0.05 \approx 0.03151$
$P(X=10) \approx 0.0315$ (約 3.15%)
(9回連続ではずれて、10回目にやっと当たる確率、ということだね。)
幾何分布 確率計算ツール
幾何分布の期待値と分散
初めて成功するまでには、平均して何回くらい試行が必要になるんだろう? それが期待値 $E[X]$ だ。
期待値 $E[X]$ (初めて成功するまでの平均試行回数):
$E[X] = \frac{1}{p}$
これはとても直感的!成功確率が $p$ なら、その逆数 $\frac{1}{p}$ 回くらい試せば、平均して1回は成功するだろう、ということだね。
- 例:コイン($p=1/2$)なら、平均 $1/(1/2) = 2$ 回投げれば初めて表が出ると期待される。
- 例:サイコロで1の目($p=1/6$)なら、平均 $1/(1/6) = 6$ 回投げれば初めて1が出ると期待される。
- 例:ガチャ($p=0.05=1/20$)なら、平均 $1/(1/20) = 20$ 回引けば初めて当たりが出ると期待される。
分散 $V[X]$ (初めて成功するまでの回数のばらつき):
$V[X] = \frac{1-p}{p^2}$
分散は、初めて成功するまでの回数がどれくらいばらつくかを示す。成功確率 $p$ が小さい(成功しにくい)ほど、分散は大きくなる傾向があるよ。(なかなか成功しないときは、すごく早く成功することもあれば、ものすごく時間がかかることもある、というばらつきが大きいイメージだね。)
(期待値や分散の導出は、無限級数の和の計算が必要になるので、ここでは結果だけ紹介するね。)
幾何分布の形状
幾何分布の確率 $P(X=k) = (1-p)^{k-1}p$ は、$k$ が増えるにつれてどうなるかな?
- $k=1$ のとき、$P(X=1) = (1-p)^0 p = p$。これが最も確率が高い(最初の試行で成功するのが一番起こりやすい)。
- $k=2$ のとき、$P(X=2) = (1-p)^1 p$。これは $P(X=1)$ に $(1-p)$(1より小さい数)を掛けたもの。
- $k=3$ のとき、$P(X=3) = (1-p)^2 p$。これは $P(X=2)$ にさらに $(1-p)$ を掛けたもの。
このように、$k$ が1増えるごとに確率は $(1-p)$ 倍になっていく。つまり、$k=1$ が最も確率が高く、あとは指数関数的に減少していく、右下がりの形の分布になるんだ。
$p=0.5$ (青) と $p=0.2$ (赤) の場合のグラフ。
$p$ が小さい方が、確率の減少が緩やかになる。
幾何分布の面白い性質:「無記憶性Memorylessness」
幾何分布(と、連続型の指数分布)には、「無記憶性」というちょっと変わった性質があるんだ。
これは、「最初の $m$ 回が失敗だった」という情報を知ったとしても、「そこからさらに何回試行すれば初めて成功するか」の確率分布は、最初から始めた場合と全く同じになる、という意味なんだ。
数式で書くと、$P(X = m+k | X > m) = P(X=k)$ となる。
例えるなら、「コイン投げで5回連続で裏が出た!次こそは表が出る確率が高くなるはず!」…とはならないのと同じ。コイン(やベルヌーイ試行)には過去の記憶がないから、何回失敗が続いても、次の1回で成功する確率は常に $p$ のままなんだ。過去の失敗は未来の確率に影響しない、ということだね!
まとめ
- 幾何分布は、独立なベルヌーイ試行(成功確率 $p$)を繰り返したとき、初めて成功するまでの試行回数 $X$ ($X=1, 2, 3, \dots$) の確率分布。
- ちょうど $k$ 回目に初めて成功する確率は $P(X=k) = (1-p)^{k-1} p$。
- 期待値(平均試行回数)は $E[X] = \frac{1}{p}$。
- 分散は $V[X] = \frac{1-p}{p^2}$。
- 分布の形は、$k=1$ が最大で、指数関数的に減少する右下がりの形になる。
- 無記憶性という特徴を持つ。
これで代表的な離散型確率分布(ベルヌーイ、二項、ポアソン、幾何)を一通り見たことになるね! 次の第8章からは、いよいよ連続型の確率分布の世界に入っていくよ。
このページで出てきたEnglish wordsとその仲間たち
英単語 (English) | 意味 (Meaning) | 例文 (Example Sentence) | 例文の読み上げ | 例文の日本語訳 |
---|---|---|---|---|
Geometric Distribution | 幾何分布 | The geometric distribution models the number of trials needed to get the first success. | ▶ 再生 | 幾何分布は、最初の成功を得るために必要な試行回数をモデル化します。 |
First Success | 最初の成功 | We are interested in the probability of the first success occurring on the k-th trial. | ▶ 再生 | 私たちは、k回目の試行で最初の成功が起こる確率に関心があります。 |
Number of Trials until Success | 成功までの試行回数 | The geometric random variable represents the number of trials until success. | ▶ 再生 | 幾何確率変数は、成功までの試行回数を表します。 |
Memorylessness | 無記憶性 | The geometric distribution has the memorylessness property. | ▶ 再生 | 幾何分布は無記憶性という性質を持っています。 |
Waiting Time | 待ち時間(最初の成功までの時間や回数) | Geometric distribution is related to waiting time problems. | ▶ 再生 | 幾何分布は待ち時間問題に関連しています。 |
Exponential Decay | 指数関数的減衰 | The probabilities in a geometric distribution show exponential decay as k increases. | ▶ 再生 | 幾何分布における確率は、kが増加するにつれて指数関数的な減衰を示します。 |