第4部 大数の法則と中心極限定理
第9章 大数の法則Law of Large Numbers ~試行回数を増やすと見えてくる真実~
9-1: 大数の法則とは?
さあ、今日からは確率論の中でも特に重要な基本法則について学んでいくよ。第3部までで、色々な確率の計算方法や、確率変数が従うパターンである「確率分布」について見てきたね。
ところで、コイン投げのシミュレーター (02_02_01_CoinTossSimulator.html
) を試したときに、面白い現象に気づかなかったかな? コインを投げる回数が少ないうちは、表が出る割合は $1/2$ からずれることも多かったけど、投げる回数をうんと増やしていくと、だんだん割合が $1/2$ (50%) に近づいていったよね。
実は、この現象は偶然ではなく、確率の世界のとても大切なルールに基づいているんだ。それが今回学ぶ「大数の法則Law of Large Numbers」だよ!
大数の法則Law of Large Numbers とは?
すごく簡単に言うと、大数の法則とは、
「同じ条件で独立な試行をものすごくたくさん繰り返すと、ある出来事が起こった割合(相対度数relative frequency)は、その出来事が起こる本来の確率(数学的確率theoretical probability)に限りなく近づいていく」
という法則なんだ。
- 相対度数: (その事象が起こった回数) $\div$ (全体の試行回数)
- 数学的確率: 事前に理論的に計算される確率(例:サイコロの各目は $1/6$)
つまり、偶然に見える出来事も、回数をこなせばこなすほど、その「真の姿(本来の確率)」が見えてくる、ということだね!
例えば、ゆがみのないサイコロを振る試行なら、何千回、何万回と繰り返せば、1の目が出た回数の割合は、数学的な確率である $\frac{1}{6}$ にどんどん近づいていくんだ。
数学的確率と統計的確率
大数の法則は、「確率」という言葉が持つ2つの意味を結びつけてくれる、大切な橋渡し役でもあるんだ。
数学的確率
(Theoretical Probability)
- 意味:理論的に計算される確率。
- 根拠:同様の確からしさなどの仮定。
- 特徴:試行を行う前に決まっている値。
- 例:公正なサイコロで1の目が出る確率は $\frac{1}{6}$。
統計的確率
(Statistical / Empirical Probability)
- 意味:実際に試行を繰り返して得られる確率。
- 根拠:観測されたデータ(相対度数)。
- 特徴:試行回数によって値が変わる可能性がある。
- 例:サイコロを10回振ったら1が2回出た $\implies$ 統計的確率は $\frac{2}{10}$。
大数の法則が言っているのは、「試行回数 $n$ を無限に大きくしていくと、統計的確率は数学的確率に近づいていく(収束convergeする)」ということなんだ。下のグラフは、コイン投げで表が出る割合(統計的確率)が、試行回数を増やすと理論的な確率 $0.5$ に近づいていく様子を表しているよ。
補足:大数の法則の種類
実は「大数の法則」には、数学的な「近づき方」の定義によって、「弱法則」と「強法則」の2種類があるんだ(発見した数学者の名前をとってベルヌーイの大数の法則、ボレルの大数の法則、コルモゴロフの大数の法則などとも呼ばれるよ)。でも、どちらも基本的な考え方は同じで、「たくさん試行すれば、確率は理論値に近づく」ということを数学的に保証してくれているんだ。ここではその違いには深入りしないよ。
期待値との関係
大数の法則は、確率だけでなく「期待値」にも関係しているんだ。
「独立な試行をたくさん繰り返して得られた結果の標本平均(サンプル平均)は、試行回数を増やすとその確率変数の期待値(母平均)に近づいていく」
とも表現できるんだ。例えば、サイコロの目の期待値は $3.5$ だったね。実際にサイコロをものすごくたくさん振って、出た目の平均値を計算すると、その値は $3.5$ にどんどん近づいていくんだ。
もし、$X_1, X_2, \dots, X_n$ が、同じ確率分布に従う互いに独立な確率変数(例えば、サイコロを $n$ 回振ったときのそれぞれの目の値)だとすると、その標本平均 $\bar{X}_n$ は、
$\bar{X}_n = \frac{X_1 + X_2 + \dots + X_n}{n}$
この $\bar{X}_n$ が、$n$ を大きくすると、期待値 $E[X]$ に近づいていく ($n \to \infty$ のとき $\bar{X}_n \to E[X]$) というのが、期待値で見た大数の法則だよ。
大数の法則の応用と誤解
大数の法則は、実は身の回りの色々なところでその考え方が使われているんだ。
- 保険会社: たくさんの人が保険に入れば、一人ひとりに事故が起こるかどうかは不確実でも、全体として支払う保険金の総額は、確率(事故発生率)に基づいてかなり正確に予測できる(大数の法則が働くから)。だから保険料を適切に設定できるんだね。
- カジノ: ルーレットやスロットマシンなどのゲームは、一回一回の勝負は客が勝つこともあるけど、長い目で見るとわずかにカジノ側が有利になるように確率が設定されている。たくさんのお客さんが何回もプレイすれば、大数の法則によってカジノは安定して利益を上げられる仕組みになっている。
- 統計調査: 日本全体の状況を知りたいとき、全員に聞くのは大変だから、一部の人(標本)を選んで調査するよね(標本調査)。その結果から日本全体の様子(母集団)を推定できるのは、選んだ標本の数が十分大きければ、標本の平均値などが母集団の平均値などに近くなる、という大数の法則が背景にあるんだ。
- シミュレーション: 複雑な現象の確率や期待値を計算するのが難しいとき、コンピュータでその現象を何度もシミュレーション(仮想的に試行)して、その結果の平均をとることで、求めたい値を推定する方法(モンテカルロ法など)がある。これも大数の法則を応用している。
注意!よくある誤解:「ギャンブラーの誤謬(ごびゅう)」
ギャンブラーの誤謬 (Gambler's Fallacy) という有名な間違いがあるんだ。
例えば、「コイン投げで裏が5回連続で出た。そろそろバランスが取れるはずだから、次は表が出やすいだろう!」と考えてしまうこと。
これは間違いだよ!コイン投げのような独立な試行では、過去の結果は未来の結果に影響しないんだったね。裏が何回続こうと、次に表が出る確率は常に $1/2$ のままだ。
大数の法則は、「これから先、さらに何百回、何千回と繰り返していけば、トータルで見ると表と裏の割合が $1/2$ に近づいていく」という長期的な傾向を示しているだけであって、過去の偏りを「修正」するような力が働くわけではないんだ。この違いをしっかり理解しておこう!
まとめ
- 大数の法則は、同じ条件の独立な試行をたくさん繰り返すと、事象の起こる相対度数(統計的確率)が理論的な確率(数学的確率)に近づく、という法則。
- 同様に、試行結果の標本平均は、その確率変数の期待値(母平均)に近づく。
- 確率論の基礎であり、保険、統計、シミュレーションなど、多くの分野で応用されている。
- 過去の結果が未来に影響するかのように考える「ギャンブラーの誤謬」とは違うので注意!
大数の法則は、「偶然の中にも法則性がある」ことを示してくれる、なんだか心強い法則だね。次のページでは、シミュレーションを使って、この大数の法則が実際に成り立つのを体験してみよう!
→ 大数の法則シミュレーションへ進む!このページで出てきたEnglish wordsとその仲間たち
英単語 (English) | 意味 (Meaning) | 例文 (Example Sentence) | 例文の読み上げ | 例文の日本語訳 |
---|---|---|---|---|
Law of Large Numbers (LLN) | 大数の法則 | The Law of Large Numbers is a fundamental theorem in probability theory. | ▶ 再生 | 大数の法則は確率論における基本的な定理です。 |
Weak Law (WLLN) / Strong Law (SLLN) | 弱法則 / 強法則 | There are two main versions: the Weak Law and the Strong Law of Large Numbers. | ▶ 再生 | 主なバージョンとして、大数の弱法則と強法則の2つがあります。 |
Relative Frequency | 相対度数 | The relative frequency of an event converges to its theoretical probability. | ▶ 再生 | 事象の相対度数は、その理論的確率に収束します。 |
Theoretical Probability | 理論的(数学的)確率 | The theoretical probability of rolling a 6 is 1/6. | ▶ 再生 | 6の目を振る理論的確率は1/6です。 |
Statistical / Empirical Probability | 統計的/経験的確率 | Statistical probability is based on observed frequencies. | ▶ 再生 | 統計的確率は、観測された頻度に基づいています。 |
Sample Mean ($\bar{X}_n$) | 標本平均 | The sample mean approaches the population mean as n increases. | ▶ 再生 | 標本平均はnが増加するにつれて母平均に近づきます。 |
Population Mean / Expected Value ($E[X]$) | 母平均 / 期待値 | $E[X]$ represents the population mean or expected value. | ▶ 再生 | $E[X]$ は母平均または期待値を表します。 |
Converge | 収束する、近づく | The sample average will converge to the true average. | ▶ 再生 | 標本平均は真の平均に収束します。 |
Gambler's Fallacy | ギャンブラーの誤謬 | Believing that past results affect future independent events is known as the Gambler's Fallacy. | ▶ 再生 | 過去の結果が未来の独立事象に影響すると信じることは、ギャンブラーの誤謬として知られています。 |