7-1: ベルヌーイ分布～コイン投げの数学モデル～

第7章代表的な離散型確率分布

7-1: ベルヌーイ分布Bernoulli Distribution ～コイン投げの数学モデル～

前の章では、「確率変数」と「確率分布」という新しい言葉を学んだね。確率変数 $X$ がとる値とその確率の対応関係が確率分布だった。そして、確率変数には離散型と連続型があるんだったね。

この章からは、世の中でよく使われる代表的な「離散型確率分布」をいくつか紹介していくよ。まず最初に登場するのは、最もシンプルで、他の多くの分布の基礎にもなっている「ベルヌーイ分布Bernoulli Distribution」だ！

ベルヌーイ試行 (復習)

ベルヌーイ分布を理解するために、まずは「ベルヌーイ試行」を思い出そう。これは、

結果が「成功」か「失敗」のどちらか一方にしかならない試行

のことだったね。

コインを投げて「表（成功）」か「裏（失敗）」か
製品を検査して「良品（成功）」か「不良品（失敗）」か
シュートを打って「ゴール（成功）」か「外れ（失敗）」か

など、結果が2択で考えられる試行はたくさんある。このとき、1回の試行で「成功」する確率を $\mathbf{p}$ とすると、「失敗」する確率は $\mathbf{1-p}$ となるんだった。

ベルヌーイ分布Bernoulli Distribution とは？

ベルヌーイ分布とは、1回だけのベルヌーイ試行の結果を表す確率分布のことだよ。

この分布を考えるときは、確率変数 $X$ を次のように定義するのが一般的だ。

試行の結果が「成功」のとき $\implies X=1$
試行の結果が「失敗」のとき $\implies X=0$

つまり、ベルヌーイ分布に従う確率変数 $X$ は、0か1のどちらかの値しかとらない、とてもシンプルな離散型確率変数なんだ。

成功確率を $p$ とすると、この確率分布は次の表のように書けるね。

$X=k$ (結果)	1 (成功)	0 (失敗)	合計
$P(X=k)$ (確率)	$p$	$1-p$	1

これを確率質量関数 (PMF) で書くと、一つの式で表せるよ。

$P(X=k) = p^k (1-p)^{1-k} \quad (\text{ただし } k=0, 1)$

試しに $k=1$（成功）を代入すると $p^1 (1-p)^{1-1} = p^1 (1-p)^0 = p \times 1 = p$ となり、$k=0$（失敗）を代入すると $p^0 (1-p)^{1-0} = 1 \times (1-p)^1 = 1-p$ となって、ちゃんと上の表と一致するね！

ベルヌーイ分布は、成功確率 $\mathbf{p}$ という1つのパラメータだけで形が決まるんだ。

ベルヌーイ分布の期待値と分散

このシンプルなベルヌーイ分布の期待値 $E[X]$ と分散 $V[X]$ を計算してみよう。（分散は確率変数の「ばらつき具合」を表す指標だよ。詳しくはまた後の章で説明するね）

期待値 $E[X]$:

期待値は「（値）$\times$（その確率）」の合計だったね。

$E[X] = \sum_k k P(X=k) = (1 \times P(X=1)) + (0 \times P(X=0))$

$E[X] = (1 \times p) + (0 \times (1-p)) = p$

ベルヌーイ分布の期待値は、成功確率 $p$ そのものになるんだ！これは、「成功なら1、失敗なら0」という値をとる変数の平均を考えれば、成功する割合 $p$ になるというのは直感的にもわかりやすいね。

分散 $V[X]$:

分散は $V[X] = E[X^2] - (E[X])^2$ という式で計算できるんだ（これは分散の公式として覚えておこう）。

まず $E[X^2]$ を計算しよう。これは「$X^2$ の期待値」という意味だ。

$E[X^2] = \sum_k k^2 P(X=k) = (1^2 \times P(X=1)) + (0^2 \times P(X=0))$

$E[X^2] = (1 \times p) + (0 \times (1-p)) = p$

おや、$E[X^2]$ も $p$ になったね（$X$が0か1しかとらないから $X^2=X$ となるため）。

これを使って分散を計算すると、

$V[X] = E[X^2] - (E[X])^2 = p - p^2 = p(1-p)$

ベルヌーイ分布の分散は $p(1-p)$ となるんだ。この値は、$p=0.5$ のときに最大値 $0.5 \times 0.5 = 0.25$ をとり、$p$ が0や1に近づくと0に近づく。つまり、成功と失敗の確率が半々のときが一番結果がばらつきやすく（分散が大きく）、どちらかに偏っているときは結果のばらつきが小さい（分散が小さい）ということを表しているんだよ。

成功確率 $p$ と分散 $V[X]=p(1-p)$ の関係

$p=0.5$ のとき、分散は最大になる

ベルヌーイ分布と二項分布の関係

ベルヌーイ分布は、1回だけのベルヌーイ試行の結果（0か1か）の分布だったね。

一方、前のページでちょっと紹介した二項分布 $B(n, p)$ は、成功確率 $p$ のベルヌーイ試行を $n$ 回繰り返したときの成功回数 $k$ の分布だった。

実は、二項分布に従う確率変数（成功回数）は、独立なベルヌーイ分布に従う $n$ 個の確率変数（各回の結果が0か1か）を全部足し合わせたものと考えることができるんだ！

$X_{B(n,p)} = X_{Bernoulli(p), 1} + X_{Bernoulli(p), 2} + \dots + X_{Bernoulli(p), n}$

この関係は、確率分布の性質を理解する上でとても重要になってくるよ。

まとめ

ベルヌーイ分布は、結果が「成功(1)」か「失敗(0)」の2種類しかない1回の試行の確率分布。
成功確率を $p$ とすると、$P(X=1)=p$, $P(X=0)=1-p$ となる。
期待値は $E[X]=p$。
分散は $V[X]=p(1-p)$。
ベルヌーイ分布は、二項分布をはじめとする他の多くの離散型分布の基礎となる、シンプルだけど重要な分布。

たった1回のコイン投げも、数学的に見ると「ベルヌーイ分布」という名前が付いているんだね。次は、このベルヌーイ試行を繰り返した場合の分布、「二項分布」をもう一度詳しく見ていこう！

このページで出てきたEnglish wordsとその仲間たち

英単語 (English)	意味 (Meaning)	例文 (Example Sentence)	例文の読み上げ	例文の日本語訳
Bernoulli Distribution	ベルヌーイ分布	The Bernoulli distribution models a single trial with two outcomes.	▶ 再生	ベルヌーイ分布は、2つの結果を持つ単一の試行をモデル化します。
Bernoulli Trial	ベルヌーイ試行	Each flip of a coin is a Bernoulli trial if we define heads as success.	▶ 再生	もし表を成功と定義するならば、コインの各投げはベルヌーイ試行です。
Success	成功	Let p be the probability of success.	▶ 再生	pを成功の確率とします。
Failure	失敗	The probability of failure is 1-p.	▶ 再生	失敗の確率は1-pです。
Parameter	パラメータ、母数	The Bernoulli distribution has one parameter, p.	▶ 再生	ベルヌーイ分布はpという1つのパラメータを持ちます。
Expected Value	期待値	The expected value of a Bernoulli random variable is p.	▶ 再生	ベルヌーイ確率変数の期待値はpです。
Variance	分散	The variance measures the spread of the distribution.	▶ 再生	分散は分布の広がりを測ります。

第7章 代表的な離散型確率分布