ウルトラ先生の確率教室

第7章 代表的な離散型確率分布

7-4: 幾何分布Geometric Distribution ~初めて成功するまでの試行回数~

ベルヌーイ分布(1回の試行の結果)、二項分布($n$回中の成功回数)、ポアソン分布(一定区間での発生回数)と、色々な離散型確率分布を見てきたね。

今回は、また少し違った視点の確率分布、「幾何分布Geometric Distribution」を紹介するよ。これは、「成功するまでチャレンジを続ける」ような状況で活躍する分布なんだ。

例えば、こんなことを考えたことはないかな?

このように、成功するまでベルヌーイ試行を繰り返したときに、初めて成功するのが「何回目の試行か」、その試行回数が従う確率分布が幾何分布なんだ。

幾何分布Geometric Distribution とは?

互いに独立なベルヌーイ試行(成功確率 $p$ で一定、$0 < p \le 1$)を繰り返し行う。

このとき、初めて成功するまでの試行回数を確率変数 $X$ とする。この確率変数 $X$ が従う離散型確率分布を、パラメータ $p$ を持つ幾何分布という。

確率変数 $X$ は、$1, 2, 3, \dots$ という、1以上の整数値をどこまでもとりうる可能性があるね。(運が悪ければ、ものすごくたくさんの回数がかかるかもしれない!)

注意:教科書によっては、「初めて成功するまでの失敗回数 $Y = X-1$」($Y=0, 1, 2, \dots$) を幾何分布と定義することもあるよ。どちらの定義を使っているか確認することが大切だけど、ここでは「初めて成功するまでの試行回数 $X$」の分布として話を進めるね。

幾何分布の確率質量関数 (PMF)

初めて成功するのが、ちょうど $k$ 回目 ($k=1, 2, 3, \dots$) である確率 $P(X=k)$ はどうなるかな?

「$k$ 回目に初めて成功する」ということは、その前の $k-1$ 回はすべて失敗し、かつ、$k$ 回目に初めて成功する、ということだね。

1回の試行での成功確率を $p$、失敗確率を $1-p$ とすると、各試行は独立なので、確率の乗法定理から、

$P(X=k) = \underbrace{P(\text{1回目失敗}) \times \dots \times P(k-1\text{回目失敗})}_{k-1 \text{ 回失敗}} \times \underbrace{P(k\text{回目成功})}_{1 \text{ 回成功}}$

$P(X=k) = (1-p)^{k-1} p \quad (\text{ただし } k=1, 2, 3, \dots)$

これが幾何分布の確率質量関数(PMF)だよ。$k-1$ 回の失敗が続いて、最後に成功する確率、という形になっているね。

具体的な例で確率を計算してみよう!

例題1:コインで初めて表が出るのは?

公正なコインを繰り返し投げる。初めて表が出るのがちょうど3回目である確率 $P(X=3)$ は?

成功(表が出る)確率 $p = \frac{1}{2}$。失敗(裏が出る)確率 $1-p = \frac{1}{2}$。

求めたいのは $k=3$ の確率。

公式 $P(X=k) = (1-p)^{k-1} p$ に代入すると、

$P(X=3) = (\frac{1}{2})^{3-1} \times \frac{1}{2} = (\frac{1}{2})^2 \times \frac{1}{2} = (\frac{1}{2})^3 = \frac{1}{8}$

確率は $\frac{1}{8}$

(これは「裏、裏、表」の順で出る確率と等しいね!)

例題2:サイコロで初めて1の目が出るのは?

公正なサイコロを繰り返し振る。初めて1の目が出るのがちょうど4回目である確率 $P(X=4)$ は?

成功(1の目が出る)確率 $p = \frac{1}{6}$。失敗(1以外の目が出る)確率 $1-p = \frac{5}{6}$。

求めたいのは $k=4$ の確率。

$P(X=4) = (\frac{5}{6})^{4-1} \times \frac{1}{6} = (\frac{5}{6})^3 \times \frac{1}{6}$

$P(X=4) = \frac{125}{216} \times \frac{1}{6} = \frac{125}{1296}$

確率は $\frac{125}{1296}$ (約 9.6%)

例題3:ガチャで初めて当たりが出るのは?

あるゲームのガチャで、当たりが出る確率が5% ($p=0.05$)であるとする。初めて当たりが出るのがちょうど10回目である確率 $P(X=10)$ は?

成功(当たり)確率 $p = 0.05$。失敗(はずれ)確率 $1-p = 0.95$。

求めたいのは $k=10$ の確率。

$P(X=10) = (0.95)^{10-1} \times 0.05 = (0.95)^9 \times 0.05$

$(0.95)^9$ は電卓で計算すると約 $0.630249$ なので、

$P(X=10) \approx 0.630249 \times 0.05 \approx 0.03151$

$P(X=10) \approx 0.0315$ (約 3.15%)

(9回連続ではずれて、10回目にやっと当たる確率、ということだね。)

幾何分布 確率計算ツール



幾何分布の期待値と分散

初めて成功するまでには、平均して何回くらい試行が必要になるんだろう? それが期待値 $E[X]$ だ。

期待値 $E[X]$ (初めて成功するまでの平均試行回数):

$E[X] = \frac{1}{p}$

これはとても直感的!成功確率が $p$ なら、その逆数 $\frac{1}{p}$ 回くらい試せば、平均して1回は成功するだろう、ということだね。

  • 例:コイン($p=1/2$)なら、平均 $1/(1/2) = 2$ 回投げれば初めて表が出ると期待される。
  • 例:サイコロで1の目($p=1/6$)なら、平均 $1/(1/6) = 6$ 回投げれば初めて1が出ると期待される。
  • 例:ガチャ($p=0.05=1/20$)なら、平均 $1/(1/20) = 20$ 回引けば初めて当たりが出ると期待される。

分散 $V[X]$ (初めて成功するまでの回数のばらつき):

$V[X] = \frac{1-p}{p^2}$

分散は、初めて成功するまでの回数がどれくらいばらつくかを示す。成功確率 $p$ が小さい(成功しにくい)ほど、分散は大きくなる傾向があるよ。(なかなか成功しないときは、すごく早く成功することもあれば、ものすごく時間がかかることもある、というばらつきが大きいイメージだね。)

(期待値や分散の導出は、無限級数の和の計算が必要になるので、ここでは結果だけ紹介するね。)

幾何分布の形状

幾何分布の確率 $P(X=k) = (1-p)^{k-1}p$ は、$k$ が増えるにつれてどうなるかな?

このように、$k$ が1増えるごとに確率は $(1-p)$ 倍になっていく。つまり、$k=1$ が最も確率が高く、あとは指数関数的に減少していく、右下がりの形の分布になるんだ。

$p=0.5$ (青) と $p=0.2$ (赤) の場合のグラフ。
$p$ が小さい方が、確率の減少が緩やかになる。

幾何分布の面白い性質:「無記憶性Memorylessness

幾何分布(と、連続型の指数分布)には、「無記憶性」というちょっと変わった性質があるんだ。

これは、「最初の $m$ 回が失敗だった」という情報を知ったとしても、「そこからさらに何回試行すれば初めて成功するか」の確率分布は、最初から始めた場合と全く同じになる、という意味なんだ。

数式で書くと、$P(X = m+k | X > m) = P(X=k)$ となる。

例えるなら、「コイン投げで5回連続で裏が出た!次こそは表が出る確率が高くなるはず!」…とはならないのと同じ。コイン(やベルヌーイ試行)には過去の記憶がないから、何回失敗が続いても、次の1回で成功する確率は常に $p$ のままなんだ。過去の失敗は未来の確率に影響しない、ということだね!

まとめ

これで代表的な離散型確率分布(ベルヌーイ、二項、ポアソン、幾何)を一通り見たことになるね! 次の第8章からは、いよいよ連続型の確率分布の世界に入っていくよ。

このページで出てきたEnglish wordsとその仲間たち

英単語 (English) 意味 (Meaning) 例文 (Example Sentence) 例文の読み上げ 例文の日本語訳
Geometric Distribution 幾何分布 The geometric distribution models the number of trials needed to get the first success. ▶ 再生 幾何分布は、最初の成功を得るために必要な試行回数をモデル化します。
First Success 最初の成功 We are interested in the probability of the first success occurring on the k-th trial. ▶ 再生 私たちは、k回目の試行で最初の成功が起こる確率に関心があります。
Number of Trials until Success 成功までの試行回数 The geometric random variable represents the number of trials until success. ▶ 再生 幾何確率変数は、成功までの試行回数を表します。
Memorylessness 無記憶性 The geometric distribution has the memorylessness property. ▶ 再生 幾何分布は無記憶性という性質を持っています。
Waiting Time 待ち時間(最初の成功までの時間や回数) Geometric distribution is related to waiting time problems. ▶ 再生 幾何分布は待ち時間問題に関連しています。
Exponential Decay 指数関数的減衰 The probabilities in a geometric distribution show exponential decay as k increases. ▶ 再生 幾何分布における確率は、kが増加するにつれて指数関数的な減衰を示します。