第8章 代表的な連続型確率分布
8-2: 一様分布Uniform Distribution ~どこも同じ起こりやすさ~
前のページでは、連続型の確率変数の確率は「確率密度関数(PDF)」のグラフの下の「面積」で考え、PDFの値自体は確率ではなく「密度」を表す、ということを学んだね。
今日からはいよいよ、具体的な連続型確率分布を見ていくよ。そのトップバッターは、形が一番シンプルで分かりやすい「一様分布Uniform Distribution」だ!
「一様」という言葉には「すべて同じ様子」という意味があるんだけど、まさに一様分布は、ある決まった範囲(区間)の中だったら、どの値も同じくらいの起こりやすさ(密度)を持つ、という状況を表す分布なんだ。
例えるなら、目盛りがたくさんついた精密なルーレットを回したとき、針がどの角度で止まるか、みたいなイメージかな。どの角度も同じように止まりそうだよね。
一様分布Uniform Distribution とは?
ある区間 $[a, b]$ ($a$ が下限、 $b$ が上限で $a < b$)の値をとる連続型確率変数 $X$ があるとする。
もし、$X$ がこの区間 $[a, b]$ の中の値をとる確率密度がどこでも一定で、区間の外では確率密度が $0$ である場合、この確率変数 $X$ は区間 $[a, b]$ 上の一様分布に従う、と言うんだ。
一様分布は、区間の下限 $a$ と上限 $b$ という2つのパラメータparameterで決まるよ。
一様分布の確率密度関数 (PDF)
一様分布の確率密度関数(PDF) $f(x)$ はどんな形になるかな?
まず、区間 $[a, b]$ の外では確率密度は 0 だ。じゃあ、区間 $[a, b]$ の中では? どこでも密度が一定なんだから、グラフは水平な直線になるはずだね。
そして、PDFの大事な性質として、「グラフとx軸で囲まれた部分の全面積は1になる」というのがあったのを思い出そう。
区間 $[a, b]$ の幅は $b-a$。この幅で面積が1になるためには、グラフの高さ(つまり確率密度 $f(x)$ の値)はいくつになればいいかな?
(長方形の面積)=(底辺の長さ)$\times$(高さ) だから、
$1 = (b-a) \times (\text{高さ})$
つまり、高さは $\frac{1}{b-a}$ になるね!
これを式でまとめると、一様分布のPDFは次のようになる。
$ f(x) = \begin{cases} \frac{1}{b-a} & (a \le x \le b \text{ のとき}) \\ 0 & (\text{それ以外}) \end{cases} $
グラフで描くと、こんな長方形の形になるんだ。
区間 $[a, b]$ 上の一様分布のPDF。長方形の面積は $(b-a) \times \frac{1}{b-a} = 1$
一様分布の確率計算
一様分布に従う確率変数 $X$ が、ある区間 $[c, d]$ (ただし $a \le c \le d \le b$)の値をとる確率 $P(c \le X \le d)$ はどう計算できるかな?
連続型分布の確率計算のルールを思い出そう。「PDFのグラフの下の、対応する区間の面積」を求めればいいんだったね!
一様分布の場合、区間 $[c, d]$ の下の面積は、底辺の長さが $d-c$ で、高さが $\frac{1}{b-a}$ の長方形の面積になる。
だから、確率は…
$P(c \le X \le d) = (\text{区間の幅}) \times (\text{高さ}) = (d-c) \times \frac{1}{b-a} = \frac{d-c}{b-a}$
(ただし、$a \le c \le d \le b$)
とてもシンプルだね!確率は、考えている区間の幅 $(d-c)$ が、全体の区間の幅 $(b-a)$ に対してどれくらいの割合か、というだけで決まるんだ。
$P(c \le X \le d)$ は、緑色の部分の面積 $\frac{d-c}{b-a}$ に等しい。
例題1:バスの到着時刻
あるバスは、午前8時0分から午前8時10分までの間(つまり10分間)のいずれかの時刻 $X$(分)に、一様な確率で到着する($[0, 10]$ の一様分布に従う)とする。
このとき、$a=0, b=10$ なので、PDFの高さは $f(x)=\frac{1}{10-0}=\frac{1}{10}$ ($0 \le x \le 10$)。
(a) バスが8時3分から8時7分までの間 ($3 \le X \le 7$) に到着する確率は?
区間の幅は $d-c = 7-3 = 4$ 分。
$P(3 \le X \le 7) = \frac{d-c}{b-a} = \frac{7-3}{10-0} = \frac{4}{10} = \frac{2}{5}$
答え: $\frac{2}{5}$ (または 40%)
(b) バスが8時5分ちょうど ($X=5$) に到着する確率は?
これは連続型確率変数が特定の値をとる確率なので…
$P(X=5) = 0$
答え: 0
(c) バスが8時8分以降 ($X \ge 8$) に到着する確率は?
これは区間 $[8, 10]$ の確率 $P(8 \le X \le 10)$ を考えればいいね。区間の幅は $d-c = 10-8 = 2$ 分。
$P(8 \le X \le 10) = \frac{10-8}{10-0} = \frac{2}{10} = \frac{1}{5}$
答え: $\frac{1}{5}$ (または 20%)
一様分布の期待値と分散
区間 $[a, b]$ 上の一様分布に従う確率変数 $X$ の期待値と分散も、きれいな式で表せるよ。
期待値 $E[X]$:
$E[X] = \frac{a+b}{2}$
期待値は、区間のちょうど真ん中(下限と上限の平均)になるんだ。どの値も同じように出やすいのだから、平均が真ん中になるのは自然だね。
- 例:[0, 10] の一様分布なら、期待値は $\frac{0+10}{2}=5$。
分散 $V[X]$:
$V[X] = \frac{(b-a)^2}{12}$
分散は、区間の幅 $(b-a)$ の2乗に比例する。区間が広いほど、値はよりばらつくということだね。分母の12は、積分計算の結果出てくるものだよ。
- 例:[0, 10] の一様分布なら、分散は $\frac{(10-0)^2}{12} = \frac{100}{12} = \frac{25}{3} \approx 8.33$。
(期待値と分散の導出には積分計算が必要なので、ここでは結果だけ覚えておこう!)
まとめ
- 一様分布は、ある区間 $[a, b]$ 内で確率密度が一定 ($f(x) = \frac{1}{b-a}$) な連続型確率分布。
- 区間 $[c, d]$ ($a \le c \le d \le b$) に入る確率は $P(c \le X \le d) = \frac{d-c}{b-a}$ で、区間の幅の比率になる。
- 期待値(平均)は区間の中心 $E[X] = \frac{a+b}{2}$。
- 分散(ばらつき)は $V[X] = \frac{(b-a)^2}{12}$。
- ルーレット、乱数、待ち時間(特定の条件下)など、「どの値も同じ起こりやすさ」を持つ現象のモデルとして使われる。
一様分布は形も計算もシンプルだけど、連続型分布の基本としてしっかり理解しておこう。次は、最も重要でよく使われる連続型分布の王様、「正規分布」について学んでいくよ!
このページで出てきたEnglish wordsとその仲間たち
英単語 (English) | 意味 (Meaning) | 例文 (Example Sentence) | 例文の読み上げ | 例文の日本語訳 |
---|---|---|---|---|
Uniform Distribution | 一様分布 | The uniform distribution has a constant probability density over a fixed interval. | ▶ 再生 | 一様分布は、固定された区間上で一定の確率密度を持ちます。 |
Continuous Uniform Distribution | 連続一様分布 | We are studying the continuous uniform distribution defined on $[a, b]$. | ▶ 再生 | 私たちは区間 $[a, b]$ で定義された連続一様分布を学んでいます。 |
Constant Density | 一定の密度 | The key feature is the constant density within the interval. | ▶ 再生 | 重要な特徴は、区間内での一定の密度です。 |
Interval $[a, b]$ | 区間 $[a, b]$ | The random variable takes values only in the interval $[a, b]$. | ▶ 再生 | その確率変数は区間 $[a, b]$ 内の値のみをとります。 |
Lower Bound (a) | 下限 (a) | $a$ is the lower bound of the distribution. | ▶ 再生 | $a$ は分布の下限です。 |
Upper Bound (b) | 上限 (b) | $b$ is the upper bound of the distribution. | ▶ 再生 | $b$ は分布の上限です。 |
Random Number Generation | 乱数生成 | Uniform distribution is fundamental in random number generation. | ▶ 再生 | 一様分布は乱数生成において基本的です。 |