第8章 代表的な連続型確率分布
8-4: 指数分布Exponential Distribution ~次に何かが起こるまでの待ち時間~
前回は、確率・統計の世界で最も重要な連続型分布である正規分布について学んだね。
今回は、もう一つ、とてもよく使われる連続型分布である「指数分布Exponential Distribution」を紹介するよ。これは、ある出来事が起こってから、次に同じような出来事が起こるまでの時間(間隔)や、機械などが故障するまでの時間(寿命)のような、「待ち時間waiting time」に関連する現象をモデル化するのによく使われるんだ。
実は、前に学んだポアソン分布(一定期間に起こる「回数」の分布)と深い関係がある分布でもあるんだよ。
指数分布Exponential Distribution とは?
ある事象がランダムに(専門的には「ポアソン過程に従って」)発生している状況を考えよう。例えば、お店のレジにお客さんが来る、電話がかかってくる、などだね。
このとき、一つの事象が発生してから、次の事象が発生するまでの時間(間隔)を確率変数 $T$ とすると、この $T$ が従う連続型確率分布が指数分布なんだ。
指数分布は、ただ一つのパラメータparameter $\mathbf{\lambda}$ (ラムダ、$\lambda > 0$)だけで形が決まる。この $\lambda$ は、ポアソン分布のときと同じで、単位時間(または単位空間など)あたりの平均発生率を表すんだ。
確率変数 $T$ は、待ち時間なので、$0$ 以上の任意の実数値をとる ($T \ge 0$)。
指数分布の確率密度関数 (PDF)
平均発生率が $\lambda$ である指数分布に従う確率変数 $T$ の確率密度関数(PDF) $f(t)$ は、次のような式で与えられる。
$ f(t) = \begin{cases} \lambda e^{-\lambda t} & (t \ge 0 \text{ のとき}) \\ 0 & (t < 0 \text{ のとき}) \end{cases} $
ここで、$e$ はネイピア数(約 2.718)、$\lambda$ は平均発生率、 $t$ は時間(待ち時間)だよ。
このグラフの形を見てみよう。$t=0$ のとき $f(0) = \lambda e^0 = \lambda$ となり、確率密度は最大になる。そして、$t$ が大きくなるにつれて、$e^{-\lambda t}$ の項のために指数関数的に急速に減少していくんだ。つまり、待ち時間が短いほど起こりやすく(密度が高く)、長くなるほど起こりにくい(密度が低い)という性質を表しているね。
指数分布のPDF ($t \ge 0$ で定義され、指数関数的に減少)
もちろん、これもPDFなので、グラフとt軸(横軸)で囲まれる $t \ge 0$ の範囲の全面積 $\int_{0}^{\infty} \lambda e^{-\lambda t} dt$ はちゃんと 1 になるんだよ。
指数分布の確率計算
連続型分布なので、確率 $P(a \le T \le b)$ は PDF $f(t)$ のグラフの下の $t=a$ から $t=b$ までの面積 $\int_a^b \lambda e^{-\lambda t} dt$ で求められる。
特に指数分布で重要になるのは、次の2つの確率だ。
- ある時間 $t_0$ までに事象が起こる確率 ($T \le t_0$)
- ある時間 $t_0$ を過ぎてもまだ事象が起こらない確率 ($T > t_0$)
これらの確率は、積分計算をすると(ここでは結果だけ示すね)、次のようになるんだ。
確率1:待ち時間が $t_0$ 以下である確率(累積分布関数CDF)
$P(T \le t_0) = 1 - e^{-\lambda t_0} \quad (t_0 \ge 0)$
確率2:待ち時間が $t_0$ より長くなる確率(生存関数Survival Function)
$P(T > t_0) = e^{-\lambda t_0} \quad (t_0 \ge 0)$
(この2つの確率を足すと $(1 - e^{-\lambda t_0}) + e^{-\lambda t_0} = 1$ となり、ちゃんと全体の確率が1になるね!)
グラフで見ると、下の図のように、PDFの下の面積がこれらの確率に対応しているよ。
$P(T \le t_0)$ は左側の水色部分の面積、$P(T > t_0)$ は右側の緑色部分の面積
例題1:部品の故障時間
ある機械の部品が故障するまでの時間 $T$(単位:年)は、1年あたりの平均故障率 $\lambda=0.2$ の指数分布に従うとします。
(a) この部品が最初の3年以内に故障する確率 $P(T \le 3)$ は?
$\lambda=0.2$, $t_0=3$ として、$P(T \le t_0) = 1 - e^{-\lambda t_0}$ を使う。
$P(T \le 3) = 1 - e^{-(0.2)(3)} = 1 - e^{-0.6}$
$e^{-0.6}$ は関数電卓などで計算すると約 $0.5488$。
$P(T \le 3) \approx 1 - 0.5488 = 0.4512$
答え:約 0.4512 (約 45.1%)
(b) この部品が5年以上故障しない確率 $P(T > 5)$ は?
$\lambda=0.2$, $t_0=5$ として、$P(T > t_0) = e^{-\lambda t_0}$ を使う。
$P(T > 5) = e^{-(0.2)(5)} = e^{-1}$
$e^{-1}$ は約 $0.3679$。
答え:約 0.3679 (約 36.8%)
指数分布 確率計算ツール
指数分布の期待値と分散
指数分布に従う待ち時間 $T$ の期待値(平均待ち時間)と分散(待ち時間のばらつき)はどうなるかな?
期待値 $E[T]$ (平均待ち時間):
$E[T] = \frac{1}{\lambda}$
これはとても重要で直感的!単位時間あたりの平均発生率が $\lambda$ なら、次に発生するまでの平均時間はその逆数 $\frac{1}{\lambda}$ になる、ということだね。
- 例:1時間に平均2回 ($\lambda=2$) 客が来るレジなら、次の客が来るまでの平均待ち時間は $1/2 = 0.5$ 時間(30分)。
分散 $V[T]$:
$V[T] = \frac{1}{\lambda^2}$
分散は期待値の2乗と間違えやすいけど、$1/\lambda^2$ となる。ちなみに、標準偏差 $\sigma$ は $\sqrt{V[T]} = \sqrt{1/\lambda^2} = \frac{1}{\lambda}$ となり、なんと期待値と同じ値になるんだ!
- 例:平均発生率 $\lambda=0.2$ の部品の平均寿命は $E[T]=1/0.2=5$年、標準偏差も $1/0.2=5$年となる。
(期待値と分散の導出には積分計算が必要なので、ここでは結果だけ覚えておこう!)
指数分布の「無記憶性Memorylessness」
前のページで紹介した離散型の幾何分布と同じように、連続型の指数分布も「無記憶性memoryless property」という面白い性質を持っているんだ。
これは、「ある時点 $s$ まで事象が起こらなかった」という情報があっても、「そこからさらに $t$ 時間待つ間に事象が起こらない確率」は、最初から $t$ 時間待つ間に事象が起こらない確率と変わらない、ということなんだ。
数式で書くと、$P(T > s+t | T > s) = P(T > t)$ となる。
例えるなら、「この電球はもう1000時間も使っているから、そろそろ切れやすいはずだ」…とはならないのが指数分布の世界なんだ(もし寿命が指数分布に従うならね!)。どれだけ長く使っていても(過去の履歴は関係なく)、これから先 $t$ 時間もつ確率は、新品が $t$ 時間もつ確率と同じ、ということになる。ちょっと不思議な感じがするけど、ランダムな事象の待ち時間にはこういう性質が現れることがあるんだね。
まとめ
- 指数分布は、ランダムな事象が発生するまでの「待ち時間」や「寿命」の確率分布で、連続型。
- パラメータは単位時間(空間)あたりの平均発生率 $\mathbf{\lambda}$ のみ。
- 確率密度関数(PDF)は $f(t) = \lambda e^{-\lambda t}$ ($t \ge 0$) で、右下がりの指数関数的な形。
- 待ち時間が $t_0$ 以下である確率(CDF)は $P(T \le t_0) = 1 - e^{-\lambda t_0}$。
- 待ち時間が $t_0$ より長くなる確率(生存関数)は $P(T > t_0) = e^{-\lambda t_0}$。
- 期待値(平均待ち時間)は $E[T]=\mathbf{1/\lambda}$。
- 分散は $V[T]=\mathbf{1/\lambda^2}$ (標準偏差は $1/\lambda$)。
- 無記憶性を持つ。
これで代表的な連続型確率分布(一様分布、正規分布、指数分布)の紹介は終わりだよ。次は、確率論の重要な定理である「大数の法則」と「中心極限定理」について学んでいこう!
このページで出てきたEnglish wordsとその仲間たち
英単語 (English) | 意味 (Meaning) | 例文 (Example Sentence) | 例文の読み上げ | 例文の日本語訳 |
---|---|---|---|---|
Exponential Distribution | 指数分布 | The exponential distribution often describes the time until an event occurs in a Poisson process. | ▶ 再生 | 指数分布は、ポアソン過程において事象が発生するまでの時間をしばしば記述します。 |
Waiting Time | 待ち時間 | This distribution models the waiting time for the next customer arrival. | ▶ 再生 | この分布は、次の顧客が到着するまでの待ち時間をモデル化します。 |
Arrival Rate / Event Rate ($\lambda$) | 到着率 / イベント発生率(ラムダ) | $\lambda$ is the average arrival rate or event rate per unit time. | ▶ 再生 | λは、単位時間あたりの平均到着率またはイベント発生率です。 |
Failure Rate | 故障率(指数分布ではλと同じ) | In reliability, $\lambda$ can represent the constant failure rate. | ▶ 再生 | 信頼性工学において、λは一定の故障率を表すことがあります。 |
Probability Density Function (PDF) | 確率密度関数 | The PDF of the exponential distribution is $f(t) = \lambda e^{-\lambda t}$ for $t \ge 0$. | ▶ 再生 | 指数分布のPDFは、$t \ge 0$ において $f(t) = \lambda e^{-\lambda t}$ です。 |
Cumulative Distribution Function (CDF) | 累積分布関数 ($P(T \le t_0)$) | The CDF, $F(t_0) = P(T \le t_0)$, is $1 - e^{-\lambda t_0}$. | ▶ 再生 | CDF, $F(t_0) = P(T \le t_0)$ は、$1 - e^{-\lambda t_0}$ です。 |
Survival Function | 生存関数 ($P(T > t_0)$) | The survival function, $S(t_0) = P(T > t_0)$, is $e^{-\lambda t_0}$. | ▶ 再生 | 生存関数, $S(t_0) = P(T > t_0)$ は、$e^{-\lambda t_0}$ です。 |
Memorylessness | 無記憶性 | The exponential distribution exhibits the memorylessness property, meaning the past does not affect the future waiting time. | ▶ 再生 | 指数分布は無記憶性を示します。これは過去が未来の待ち時間に影響しないことを意味します。 |