第7章 代表的な離散型確率分布
7-1: ベルヌーイ分布Bernoulli Distribution ~コイン投げの数学モデル~
前の章では、「確率変数」と「確率分布」という新しい言葉を学んだね。確率変数 $X$ がとる値とその確率の対応関係が確率分布だった。そして、確率変数には離散型と連続型があるんだったね。
この章からは、世の中でよく使われる代表的な「離散型確率分布」をいくつか紹介していくよ。まず最初に登場するのは、最もシンプルで、他の多くの分布の基礎にもなっている「ベルヌーイ分布Bernoulli Distribution」だ!
ベルヌーイ試行 (復習)
ベルヌーイ分布を理解するために、まずは「ベルヌーイ試行」を思い出そう。これは、
結果が「成功」か「失敗」のどちらか一方にしかならない試行
のことだったね。
- コインを投げて「表(成功)」か「裏(失敗)」か
- 製品を検査して「良品(成功)」か「不良品(失敗)」か
- シュートを打って「ゴール(成功)」か「外れ(失敗)」か
など、結果が2択で考えられる試行はたくさんある。このとき、1回の試行で「成功」する確率を $\mathbf{p}$ とすると、「失敗」する確率は $\mathbf{1-p}$ となるんだった。
ベルヌーイ分布Bernoulli Distribution とは?
ベルヌーイ分布とは、1回だけのベルヌーイ試行の結果を表す確率分布のことだよ。
この分布を考えるときは、確率変数 $X$ を次のように定義するのが一般的だ。
- 試行の結果が「成功」のとき $\implies X=1$
- 試行の結果が「失敗」のとき $\implies X=0$
つまり、ベルヌーイ分布に従う確率変数 $X$ は、0か1のどちらかの値しかとらない、とてもシンプルな離散型確率変数なんだ。
成功確率を $p$ とすると、この確率分布は次の表のように書けるね。
$X=k$ (結果) | 1 (成功) | 0 (失敗) | 合計 |
---|---|---|---|
$P(X=k)$ (確率) | $p$ | $1-p$ | 1 |
これを確率質量関数 (PMF) で書くと、一つの式で表せるよ。
$P(X=k) = p^k (1-p)^{1-k} \quad (\text{ただし } k=0, 1)$
試しに $k=1$(成功)を代入すると $p^1 (1-p)^{1-1} = p^1 (1-p)^0 = p \times 1 = p$ となり、$k=0$(失敗)を代入すると $p^0 (1-p)^{1-0} = 1 \times (1-p)^1 = 1-p$ となって、ちゃんと上の表と一致するね!
ベルヌーイ分布は、成功確率 $\mathbf{p}$ という1つのパラメータだけで形が決まるんだ。
ベルヌーイ分布の期待値と分散
このシンプルなベルヌーイ分布の期待値 $E[X]$ と分散 $V[X]$ を計算してみよう。(分散は確率変数の「ばらつき具合」を表す指標だよ。詳しくはまた後の章で説明するね)
期待値 $E[X]$:
期待値は「(値)$\times$(その確率)」の合計だったね。
$E[X] = \sum_k k P(X=k) = (1 \times P(X=1)) + (0 \times P(X=0))$
$E[X] = (1 \times p) + (0 \times (1-p)) = p$
ベルヌーイ分布の期待値は、成功確率 $p$ そのものになるんだ!これは、「成功なら1、失敗なら0」という値をとる変数の平均を考えれば、成功する割合 $p$ になるというのは直感的にもわかりやすいね。
分散 $V[X]$:
分散は $V[X] = E[X^2] - (E[X])^2$ という式で計算できるんだ(これは分散の公式として覚えておこう)。
まず $E[X^2]$ を計算しよう。これは「$X^2$ の期待値」という意味だ。
$E[X^2] = \sum_k k^2 P(X=k) = (1^2 \times P(X=1)) + (0^2 \times P(X=0))$
$E[X^2] = (1 \times p) + (0 \times (1-p)) = p$
おや、$E[X^2]$ も $p$ になったね($X$が0か1しかとらないから $X^2=X$ となるため)。
これを使って分散を計算すると、
$V[X] = E[X^2] - (E[X])^2 = p - p^2 = p(1-p)$
ベルヌーイ分布の分散は $p(1-p)$ となるんだ。この値は、$p=0.5$ のときに最大値 $0.5 \times 0.5 = 0.25$ をとり、$p$ が0や1に近づくと0に近づく。つまり、成功と失敗の確率が半々のときが一番結果がばらつきやすく(分散が大きく)、どちらかに偏っているときは結果のばらつきが小さい(分散が小さい)ということを表しているんだよ。
成功確率 $p$ と分散 $V[X]=p(1-p)$ の関係
$p=0.5$ のとき、分散は最大になる
ベルヌーイ分布と二項分布の関係
ベルヌーイ分布は、1回だけのベルヌーイ試行の結果(0か1か)の分布だったね。
一方、前のページでちょっと紹介した二項分布 $B(n, p)$ は、成功確率 $p$ のベルヌーイ試行を $n$ 回繰り返したときの成功回数 $k$ の分布だった。
実は、二項分布に従う確率変数(成功回数)は、独立なベルヌーイ分布に従う $n$ 個の確率変数(各回の結果が0か1か)を全部足し合わせたものと考えることができるんだ!
$X_{B(n,p)} = X_{Bernoulli(p), 1} + X_{Bernoulli(p), 2} + \dots + X_{Bernoulli(p), n}$
この関係は、確率分布の性質を理解する上でとても重要になってくるよ。
まとめ
- ベルヌーイ分布は、結果が「成功(1)」か「失敗(0)」の2種類しかない1回の試行の確率分布。
- 成功確率を $p$ とすると、$P(X=1)=p$, $P(X=0)=1-p$ となる。
- 期待値は $E[X]=p$。
- 分散は $V[X]=p(1-p)$。
- ベルヌーイ分布は、二項分布をはじめとする他の多くの離散型分布の基礎となる、シンプルだけど重要な分布。
たった1回のコイン投げも、数学的に見ると「ベルヌーイ分布」という名前が付いているんだね。次は、このベルヌーイ試行を繰り返した場合の分布、「二項分布」をもう一度詳しく見ていこう!
このページで出てきたEnglish wordsとその仲間たち
英単語 (English) | 意味 (Meaning) | 例文 (Example Sentence) | 例文の読み上げ | 例文の日本語訳 |
---|---|---|---|---|
Bernoulli Distribution | ベルヌーイ分布 | The Bernoulli distribution models a single trial with two outcomes. | ▶ 再生 | ベルヌーイ分布は、2つの結果を持つ単一の試行をモデル化します。 |
Bernoulli Trial | ベルヌーイ試行 | Each flip of a coin is a Bernoulli trial if we define heads as success. | ▶ 再生 | もし表を成功と定義するならば、コインの各投げはベルヌーイ試行です。 |
Success | 成功 | Let p be the probability of success. | ▶ 再生 | pを成功の確率とします。 |
Failure | 失敗 | The probability of failure is 1-p. | ▶ 再生 | 失敗の確率は1-pです。 |
Parameter | パラメータ、母数 | The Bernoulli distribution has one parameter, p. | ▶ 再生 | ベルヌーイ分布はpという1つのパラメータを持ちます。 |
Expected Value | 期待値 | The expected value of a Bernoulli random variable is p. | ▶ 再生 | ベルヌーイ確率変数の期待値はpです。 |
Variance | 分散 | The variance measures the spread of the distribution. | ▶ 再生 | 分散は分布の広がりを測ります。 |