ウルトラ先生の確率教室

第7章 代表的な離散型確率分布

7-1: ベルヌーイ分布Bernoulli Distribution ~コイン投げの数学モデル~

前の章では、「確率変数」と「確率分布」という新しい言葉を学んだね。確率変数 $X$ がとる値とその確率の対応関係が確率分布だった。そして、確率変数には離散型と連続型があるんだったね。

この章からは、世の中でよく使われる代表的な「離散型確率分布」をいくつか紹介していくよ。まず最初に登場するのは、最もシンプルで、他の多くの分布の基礎にもなっている「ベルヌーイ分布Bernoulli Distribution」だ!

ベルヌーイ試行 (復習)

ベルヌーイ分布を理解するために、まずは「ベルヌーイ試行」を思い出そう。これは、

結果が「成功」か「失敗」のどちらか一方にしかならない試行

のことだったね。

など、結果が2択で考えられる試行はたくさんある。このとき、1回の試行で「成功」する確率を $\mathbf{p}$ とすると、「失敗」する確率は $\mathbf{1-p}$ となるんだった。

ベルヌーイ分布Bernoulli Distribution とは?

ベルヌーイ分布とは、1回だけのベルヌーイ試行の結果を表す確率分布のことだよ。

この分布を考えるときは、確率変数 $X$ を次のように定義するのが一般的だ。

  • 試行の結果が「成功」のとき $\implies X=1$
  • 試行の結果が「失敗」のとき $\implies X=0$

つまり、ベルヌーイ分布に従う確率変数 $X$ は、0か1のどちらかの値しかとらない、とてもシンプルな離散型確率変数なんだ。

成功確率を $p$ とすると、この確率分布は次の表のように書けるね。

$X=k$ (結果)1 (成功)0 (失敗)合計
$P(X=k)$ (確率)$p$$1-p$1

これを確率質量関数 (PMF) で書くと、一つの式で表せるよ。

$P(X=k) = p^k (1-p)^{1-k} \quad (\text{ただし } k=0, 1)$

試しに $k=1$(成功)を代入すると $p^1 (1-p)^{1-1} = p^1 (1-p)^0 = p \times 1 = p$ となり、$k=0$(失敗)を代入すると $p^0 (1-p)^{1-0} = 1 \times (1-p)^1 = 1-p$ となって、ちゃんと上の表と一致するね!

ベルヌーイ分布は、成功確率 $\mathbf{p}$ という1つのパラメータだけで形が決まるんだ。

ベルヌーイ分布の期待値と分散

このシンプルなベルヌーイ分布の期待値 $E[X]$ と分散 $V[X]$ を計算してみよう。(分散は確率変数の「ばらつき具合」を表す指標だよ。詳しくはまた後の章で説明するね)

期待値 $E[X]$:

期待値は「(値)$\times$(その確率)」の合計だったね。

$E[X] = \sum_k k P(X=k) = (1 \times P(X=1)) + (0 \times P(X=0))$

$E[X] = (1 \times p) + (0 \times (1-p)) = p$

ベルヌーイ分布の期待値は、成功確率 $p$ そのものになるんだ!これは、「成功なら1、失敗なら0」という値をとる変数の平均を考えれば、成功する割合 $p$ になるというのは直感的にもわかりやすいね。

分散 $V[X]$:

分散は $V[X] = E[X^2] - (E[X])^2$ という式で計算できるんだ(これは分散の公式として覚えておこう)。

まず $E[X^2]$ を計算しよう。これは「$X^2$ の期待値」という意味だ。

$E[X^2] = \sum_k k^2 P(X=k) = (1^2 \times P(X=1)) + (0^2 \times P(X=0))$

$E[X^2] = (1 \times p) + (0 \times (1-p)) = p$

おや、$E[X^2]$ も $p$ になったね($X$が0か1しかとらないから $X^2=X$ となるため)。

これを使って分散を計算すると、

$V[X] = E[X^2] - (E[X])^2 = p - p^2 = p(1-p)$

ベルヌーイ分布の分散は $p(1-p)$ となるんだ。この値は、$p=0.5$ のときに最大値 $0.5 \times 0.5 = 0.25$ をとり、$p$ が0や1に近づくと0に近づく。つまり、成功と失敗の確率が半々のときが一番結果がばらつきやすく(分散が大きく)、どちらかに偏っているときは結果のばらつきが小さい(分散が小さい)ということを表しているんだよ。

成功確率 $p$ と分散 $V[X]=p(1-p)$ の関係

$p=0.5$ のとき、分散は最大になる

ベルヌーイ分布と二項分布の関係

ベルヌーイ分布は、1回だけのベルヌーイ試行の結果(0か1か)の分布だったね。

一方、前のページでちょっと紹介した二項分布 $B(n, p)$ は、成功確率 $p$ のベルヌーイ試行を $n$ 回繰り返したときの成功回数 $k$ の分布だった。

実は、二項分布に従う確率変数(成功回数)は、独立なベルヌーイ分布に従う $n$ 個の確率変数(各回の結果が0か1か)を全部足し合わせたものと考えることができるんだ!

$X_{B(n,p)} = X_{Bernoulli(p), 1} + X_{Bernoulli(p), 2} + \dots + X_{Bernoulli(p), n}$

この関係は、確率分布の性質を理解する上でとても重要になってくるよ。

まとめ

たった1回のコイン投げも、数学的に見ると「ベルヌーイ分布」という名前が付いているんだね。次は、このベルヌーイ試行を繰り返した場合の分布、「二項分布」をもう一度詳しく見ていこう!

このページで出てきたEnglish wordsとその仲間たち

英単語 (English) 意味 (Meaning) 例文 (Example Sentence) 例文の読み上げ 例文の日本語訳
Bernoulli Distribution ベルヌーイ分布 The Bernoulli distribution models a single trial with two outcomes. ▶ 再生 ベルヌーイ分布は、2つの結果を持つ単一の試行をモデル化します。
Bernoulli Trial ベルヌーイ試行 Each flip of a coin is a Bernoulli trial if we define heads as success. ▶ 再生 もし表を成功と定義するならば、コインの各投げはベルヌーイ試行です。
Success 成功 Let p be the probability of success. ▶ 再生 pを成功の確率とします。
Failure 失敗 The probability of failure is 1-p. ▶ 再生 失敗の確率は1-pです。
Parameter パラメータ、母数 The Bernoulli distribution has one parameter, p. ▶ 再生 ベルヌーイ分布はpという1つのパラメータを持ちます。
Expected Value 期待値 The expected value of a Bernoulli random variable is p. ▶ 再生 ベルヌーイ確率変数の期待値はpです。
Variance 分散 The variance measures the spread of the distribution. ▶ 再生 分散は分布の広がりを測ります。