第3部 確率分布 (Probability Distributions)
第6章 確率変数と確率分布 ~偶然を支配するパターン~
6-1: 確率変数Random Variable とは?(離散型Discrete と 連続型Continuous)
さあ、今日から新しい第3部「確率分布」の世界に足を踏み入れるよ!
これまでは、特定の出来事(事象)が起こる確率 $P(A)$ や、条件が付いたときの確率 $P(B|A)$、あるいは試行を繰り返したときに成功する「回数」の確率(反復試行の確率)などを学んできたね。
これからは、試行の結果として得られる「数値」そのものに注目していくんだ。そして、その数値がどのくらいの確率で現れるのか、そのパターン(分布)はどうなっているのかを探っていくよ。
そのために、まず絶対に理解しておきたい大切な言葉が「確率変数Random Variable」だ。
確率変数Random Variable とは?
確率変数とは、ある試行を行った結果によって、その値が確率的に決まる変数のことだよ。
サイコロを投げるまでどの目が出るかわからないように、確率変数の値は、実際に試行してみるまで確定しないんだ。通常、大文字のアルファベット $X$ や $Y$ などで表すことが多いよ。
例を見てみよう:
- サイコロを1回投げる試行 $\implies$ 出る目の数 $X$ は確率変数だね。 $X$ は $\{1, 2, 3, 4, 5, 6\}$ の中のどれかの値を、それぞれ確率 $\frac{1}{6}$ でとる。
- コインを3回投げる試行 $\implies$ 表が出る回数 $Y$ は確率変数だ。 $Y$ は $\{0, 1, 2, 3\}$ の中のどれかの値を、それぞれ特定の確率(二項分布に従う確率)でとる。
- バス停でバスを待つ時間 $T$ $\implies$これも確率変数だ。$T$ は(理論的には)0分以上の任意の実数値を取りうるね。
- トランプを1枚引く試行 $\implies$ 引いたカードの「数字」は確率変数だけど、「マーク(ハート、ダイヤなど)」はそのままでは数値じゃないから、普通は確率変数とは呼ばない。(もし、ハートなら1、ダイヤなら2…のように数字を割り当てれば、それも確率変数になるよ。)
つまり、試行の結果が「数値」で表されるとき、その数値を確率変数と呼ぶんだね。
確率変数の種類:離散型と連続型
確率変数は、それがとる値の性質によって、大きく2つのタイプに分けられるんだ。これは今後の確率の計算方法にも関わってくるから、しっかり区別できるようになろう!
1. 離散型確率変数Discrete Random Variable
とる値が 0, 1, 2, 3,... のように、飛び飛びの値(数え上げられる値)である確率変数のことだよ。多くの場合、整数値をとる。
例:
- サイコロの出る目 $X$ ($1, 2, 3, 4, 5, 6$)
- コインを10回投げたときの表の回数 $Y$ ($0, 1, \dots, 10$)
- 1日に受け取るメールの数 $Z$ ($0, 1, 2, \dots$)
- ある製品を5個検査したときの不良品の数 $W$ ($0, 1, 2, 3, 4, 5$)
値が整数などの点でポツポツと存在するイメージ
2. 連続型確率変数Continuous Random Variable
とる値が、ある範囲(区間)の中の任意の実数値を取りうるような、連続的な値である確率変数のことだよ。
例:
- 人の身長 $H$ (例: 160cm以上170cm以下の任意の値)
- 製品の寿命(時間) $T$ (例: 0時間以上の任意の値)
- ある地点の温度 $C$
- 機械で加工した部品の長さ $L$
ある範囲の値がびっしり詰まっているイメージ
注意:身長や時間なども、実際に測るときは「170.5cm」とか「3.1秒」のように飛び飛びの値になるけど、理論上はもっと細かく(例えば170.51cmとか3.1415...秒とか)値を取りうると考えて、「連続型」として扱うことが多いんだ。
なぜ種類分けが重要か?
確率変数が離散型か連続型かで、その確率の考え方や「確率分布」の表し方が変わってくるんだ。
- 離散型の場合:
サイコロの目のように、$X=1$, $X=2$ など、特定の値をとる確率 $P(X=k)$ を考えることができる。例えば $P(X=1) = 1/6$ のようにね。 - 連続型の場合:
身長のように、$X=170.000\dots$ のように特定の値ピッタリになる確率は、実は0になってしまうんだ(無数の可能性の中の1点だから)。だから、連続型の場合は、「身長が165cm以上175cm以下になる確率 $P(165 \le X \le 175)$」のように、ある範囲(区間)に入る確率を考えることになるんだよ。
この違いは、次の「確率分布」のページでさらに詳しく見ていくからね!
まとめ
- 確率変数とは、試行の結果によって値が確率的に決まる変数のこと(通常、数値で表される)。
- 確率変数には、値が飛び飛びの離散型と、値が連続的な連続型の2種類がある。
- この区別は、確率の計算方法や確率分布の表現方法を理解する上でとても重要になる。
まずは「確率変数って何?」と聞かれたら、「試行結果を数値で表したもの」で、「離散型と連続型がある」と答えられればバッチリだよ!
このページで出てきたEnglish wordsとその仲間たち
英単語 (English) | 意味 (Meaning) | 例文 (Example Sentence) | 例文の読み上げ | 例文の日本語訳 |
---|---|---|---|---|
Random Variable | 確率変数 | A random variable assigns a numerical value to each outcome of an experiment. | ▶ 再生 | 確率変数は、実験の各結果に数値を割り当てます。 |
Discrete (Random Variable) | 離散(型確率変数) | The number of heads in three coin flips is a discrete random variable. | ▶ 再生 | 3回のコイン投げにおける表の数は、離散確率変数です。 |
Continuous (Random Variable) | 連続(型確率変数) | A person's height is typically modeled as a continuous random variable. | ▶ 再生 | 人の身長は、通常、連続確率変数としてモデル化されます。 |
Value | 値 | A random variable can take on different values depending on the outcome. | ▶ 再生 | 確率変数は、結果に応じて異なる値をとることがあります。 |
Outcome | 結果 | Each possible result of a trial is an outcome. | ▶ 再生 | 試行の各可能な結果がアウトカム(結果)です。 |
Countable | 数えられる、可算の | A discrete random variable takes on countable values. | ▶ 再生 | 離散確率変数は、数えられる値をとります。 |
Uncountable | 数えられない、非可算の | A continuous random variable can take on an uncountable number of values within a range. | ▶ 再生 | 連続確率変数は、ある範囲内で数えられないほどの多くの値をとることがあります。 |
Range / Interval | 範囲 / 区間 | Continuous variables take values over an interval or range. | ▶ 再生 | 連続変数は、区間または範囲にわたる値をとります。 |