第7章 代表的な離散型確率分布
7-2: 二項分布Binomial Distribution ~成功回数の確率分布~
前のページでは、最もシンプルな確率分布である「ベルヌーイ分布」を学んだね。これは、コイン投げのように結果が2通りしかない試行を「1回だけ」行った結果を表す分布だった。
今回は、そのベルヌーイ試行を「何回か繰り返した」ときに、「成功が合計で何回起こるか」の確率分布である「二項分布Binomial Distribution」について、改めて詳しく見ていこう!実は第5章の反復試行の確率で、すでにその計算方法は学んでいるんだけど、ここでは「確率分布」としての性質に注目するよ。
二項分布とは? (定義の再確認)
次の3つの条件を満たす状況を考えるよ。
- 同じ条件での試行(結果が「成功」か「失敗」のベルヌーイ試行)を、決まった回数 $\mathbf{n}$ 回繰り返す。
- 各回の試行は互いに独立である。
- 各回の試行で「成功」する確率は $\mathbf{p}$ で常に一定(失敗確率は $1-p$)。
このとき、$n$ 回の試行における総成功回数を確率変数 $X$ とすると、この $X$ が従う離散型の確率分布を、パラメータ $n, p$ を持つ二項分布と呼び、$B(n, p)$ と書く。
確率変数 $X$ は、$0, 1, 2, \dots, n$ のいずれかの整数値をとるね。
二項分布の確率質量関数 (PMF)
二項分布 $B(n, p)$ に従う確率変数 $X$ が、ちょうど $k$ 回の成功を示す確率 $P(X=k)$ は、反復試行の確率の公式で計算できるんだったね。
$P(X=k) = {}_n C_k \, p^k (1-p)^{n-k} \quad (\text{for } k=0, 1, 2, \dots, n)$
この式が、二項分布の確率質量関数(PMF)だよ。各 $k$ に対して確率を計算できる。
- ${}_n C_k$: $n$ 回中 $k$ 回成功する「順番のパターン」が何通りあるか(組み合わせ)。
- $p^k$: そのパターンのうち、$k$ 回成功する部分の確率。
- $(1-p)^{n-k}$: そのパターンのうち、$n-k$ 回失敗する部分の確率。
二項分布の期待値と分散
二項分布 $B(n, p)$ に従う確率変数 $X$ (つまり成功回数)の期待値(平均値)と分散(ばらつき具合)は、とてもきれいな形で表せるんだ!
期待値 $E[X]$ (平均成功回数):
$E[X] = np$
これは、「$n$ 回試行して、1回あたりの成功確率が $p$ なんだから、平均すると $n \times p$ 回成功するだろう」という直感と一致していて分かりやすいね!
- 例:コインを100回投げたら($n=100, p=0.5$)、表が出る回数の期待値は $100 \times 0.5 = 50$ 回。
- 例:サイコロを30回投げて($n=30, p=1/6$)、1の目が出る回数の期待値は $30 \times \frac{1}{6} = 5$ 回。
(導出のヒント:二項分布は独立なベルヌーイ分布(期待値 $p$)の $n$ 個の和と考えられる。期待値には加法性 $E[X_1+\dots+X_n] = E[X_1]+\dots+E[X_n]$ があるので、$E[X] = p + \dots + p = np$ となるんだ。)
分散 $V[X]$ (成功回数のばらつき):
$V[X] = np(1-p)$
分散は、成功回数が期待値(平均)の周りにどれくらいばらつくかを示す指標だ。試行回数 $n$ が多いほど、また、成功確率 $p$ が $0.5$ に近い(成功と失敗が同じくらい起こりやすい)ほど、ばらつきは大きくなるんだ。
- 例:コイン100回投げ ($n=100, p=0.5$) の分散は $100 \times 0.5 \times (1-0.5) = 25$。
- 例:サイコロ30回投げ ($n=30, p=1/6$) で1の目の回数の分散は $30 \times \frac{1}{6} \times (1-\frac{1}{6}) = 5 \times \frac{5}{6} = \frac{25}{6} \approx 4.17$。
(導出のヒント:独立な確率変数の和の分散は、それぞれの分散の和になる $V[X_1+\dots+X_n] = V[X_1]+\dots+V[X_n]$ という性質がある(これも後の章で!)。ベルヌーイ分布の分散は $p(1-p)$ だったので、$V[X] = p(1-p) + \dots + p(1-p) = np(1-p)$ となるんだ。)
二項分布の形状を見てみよう
二項分布 $B(n, p)$ の形(確率分布のグラフ)は、パラメータ $n$ と $p$ の値によって変わるよ。いくつか例を見てみよう。
$n=10$ で $p$ を変えた場合
$p=0.2$ (青), $p=0.5$ (赤), $p=0.8$ (緑)
$p=0.5$ で左右対称、$p$ が偏ると分布も歪む。
$p=0.5$ で $n$ を変えた場合
$n=5$ (青), $n=10$ (赤), $n=20$ (緑)
$n$ が大きくなると、山の裾野が広がり、形が正規分布に似てくる。
もっと色々な $n$ と $p$ の組み合わせでグラフがどう変わるか見てみたい? 次のページにインタラクティブなグラフ表示アプリを用意したよ!
→ 二項分布グラフ表示アプリへ二項分布が使われる場面
二項分布は、世の中の様々な場面に現れるんだ。例をいくつか挙げてみよう。
- 品質管理:工場で作った製品を $n$ 個検査して、不良品が $k$ 個見つかる確率(1個あたりの不良率が $p$)。
- 世論調査: $n$ 人にアンケートをとって、ある政策に賛成する人が $k$ 人である確率(全体の賛成率が $p$)。
- 生物学:ある遺伝子を持つ親から $n$ 匹の子が生まれたとき、$k$ 匹がその遺伝子を受け継ぐ確率(受け継ぐ確率が $p$)。
- スポーツ:バスケットボール選手がフリースローを $n$ 回打って、$k$ 回成功する確率(1回の成功率が $p$)。
このように、「独立な試行の繰り返し」で「成功回数」に興味がある場面では、二項分布が基本的なモデルとして使われることが多いんだよ。
まとめ
- 二項分布 $B(n, p)$ は、$n$ 回の独立なベルヌーイ試行(成功確率 $p$)における成功回数 $X$ の確率分布。
- 成功回数が $k$ 回である確率は $P(X=k) = {}_n C_k \, p^k (1-p)^{n-k}$。
- 期待値(平均成功回数)は $E[X]=np$。
- 分散(成功回数のばらつき)は $V[X]=np(1-p)$。
- $n$ と $p$ の値によって分布の形が変わる。
- 実社会の多くの場面で応用される、非常に重要な離散型確率分布。
このページで出てきたEnglish wordsとその仲間たち
英単語 (English) | 意味 (Meaning) | 例文 (Example Sentence) | 例文の読み上げ | 例文の日本語訳 |
---|---|---|---|---|
Binomial Distribution | 二項分布 | The binomial distribution models the number of successes in a fixed number of independent trials. | ▶ 再生 | 二項分布は、固定された回数の独立試行における成功数をモデル化します。 |
Parameters (n, p) | パラメータ (n, p) | The shape of the binomial distribution depends on the parameters n and p. | ▶ 再生 | 二項分布の形状は、パラメータnとpに依存します。 |
Probability Mass Function (PMF) | 確率質量関数 | The PMF of a binomial distribution gives the probability of exactly k successes. | ▶ 再生 | 二項分布のPMFは、ちょうどk回の成功の確率を与えます。 |
Expected Value | 期待値 | The expected value (mean) of a binomial distribution B(n, p) is np. | ▶ 再生 | 二項分布 B(n, p) の期待値(平均)は np です。 |
Variance | 分散 | The variance of a binomial distribution B(n, p) is np(1-p). | ▶ 再生 | 二項分布 B(n, p) の分散は np(1-p) です。 |
Shape (of Distribution) | (分布の)形 | The shape of the binomial distribution can be symmetric or skewed. | ▶ 再生 | 二項分布の形は、対称にも歪むこともあります。 |
Skewness | 歪度、歪み | The distribution shows positive skewness when p is small. | ▶ 再生 | pが小さいとき、分布は正の歪度を示します。 |
Symmetry | 対称性 | Symmetry occurs when p = 0.5. | ▶ 再生 | p=0.5のときに対称性が生じます。 |