ウルトラ先生の確率教室

第3部 確率分布 (Probability Distributions)

第6章 確率変数と確率分布 ~偶然を支配するパターン~

6-1: 確率変数Random Variable とは?(離散型Discrete連続型Continuous

さあ、今日から新しい第3部「確率分布」の世界に足を踏み入れるよ!

これまでは、特定の出来事(事象)が起こる確率 $P(A)$ や、条件が付いたときの確率 $P(B|A)$、あるいは試行を繰り返したときに成功する「回数」の確率(反復試行の確率)などを学んできたね。

これからは、試行の結果として得られる「数値」そのものに注目していくんだ。そして、その数値がどのくらいの確率で現れるのか、そのパターン(分布)はどうなっているのかを探っていくよ。

そのために、まず絶対に理解しておきたい大切な言葉が「確率変数Random Variable」だ。

確率変数Random Variable とは?

確率変数とは、ある試行を行った結果によって、その値が確率的に決まる変数のことだよ。

サイコロを投げるまでどの目が出るかわからないように、確率変数の値は、実際に試行してみるまで確定しないんだ。通常、大文字のアルファベット $X$ や $Y$ などで表すことが多いよ。

例を見てみよう:

  • サイコロを1回投げる試行 $\implies$ 出る目の数 $X$ は確率変数だね。 $X$ は $\{1, 2, 3, 4, 5, 6\}$ の中のどれかの値を、それぞれ確率 $\frac{1}{6}$ でとる。
  • コインを3回投げる試行 $\implies$ 表が出る回数 $Y$ は確率変数だ。 $Y$ は $\{0, 1, 2, 3\}$ の中のどれかの値を、それぞれ特定の確率(二項分布に従う確率)でとる。
  • バス停でバスを待つ時間 $T$ $\implies$これも確率変数だ。$T$ は(理論的には)0分以上の任意の実数値を取りうるね。
  • トランプを1枚引く試行 $\implies$ 引いたカードの「数字」は確率変数だけど、「マーク(ハート、ダイヤなど)」はそのままでは数値じゃないから、普通は確率変数とは呼ばない。(もし、ハートなら1、ダイヤなら2…のように数字を割り当てれば、それも確率変数になるよ。)

つまり、試行の結果が「数値」で表されるとき、その数値を確率変数と呼ぶんだね。

確率変数の種類:離散型と連続型

確率変数は、それがとる値の性質によって、大きく2つのタイプに分けられるんだ。これは今後の確率の計算方法にも関わってくるから、しっかり区別できるようになろう!

1. 離散型確率変数Discrete Random Variable

とる値が 0, 1, 2, 3,... のように、飛び飛びの値(数え上げられる値)である確率変数のことだよ。多くの場合、整数値をとる。

例:

  • サイコロの出る目 $X$ ($1, 2, 3, 4, 5, 6$)
  • コインを10回投げたときの表の回数 $Y$ ($0, 1, \dots, 10$)
  • 1日に受け取るメールの数 $Z$ ($0, 1, 2, \dots$)
  • ある製品を5個検査したときの不良品の数 $W$ ($0, 1, 2, 3, 4, 5$)

値が整数などの点でポツポツと存在するイメージ

2. 連続型確率変数Continuous Random Variable

とる値が、ある範囲(区間)の中の任意の実数値を取りうるような、連続的な値である確率変数のことだよ。

例:

  • 人の身長 $H$ (例: 160cm以上170cm以下の任意の値)
  • 製品の寿命(時間) $T$ (例: 0時間以上の任意の値)
  • ある地点の温度 $C$
  • 機械で加工した部品の長さ $L$

ある範囲の値がびっしり詰まっているイメージ

注意:身長や時間なども、実際に測るときは「170.5cm」とか「3.1秒」のように飛び飛びの値になるけど、理論上はもっと細かく(例えば170.51cmとか3.1415...秒とか)値を取りうると考えて、「連続型」として扱うことが多いんだ。

なぜ種類分けが重要か?

確率変数が離散型か連続型かで、その確率の考え方や「確率分布」の表し方が変わってくるんだ。

  • 離散型の場合:
    サイコロの目のように、$X=1$, $X=2$ など、特定の値をとる確率 $P(X=k)$ を考えることができる。例えば $P(X=1) = 1/6$ のようにね。
  • 連続型の場合:
    身長のように、$X=170.000\dots$ のように特定の値ピッタリになる確率は、実は0になってしまうんだ(無数の可能性の中の1点だから)。だから、連続型の場合は、「身長が165cm以上175cm以下になる確率 $P(165 \le X \le 175)$」のように、ある範囲(区間)に入る確率を考えることになるんだよ。

この違いは、次の「確率分布」のページでさらに詳しく見ていくからね!

まとめ

まずは「確率変数って何?」と聞かれたら、「試行結果を数値で表したもの」で、「離散型と連続型がある」と答えられればバッチリだよ!

このページで出てきたEnglish wordsとその仲間たち

英単語 (English) 意味 (Meaning) 例文 (Example Sentence) 例文の読み上げ 例文の日本語訳
Random Variable 確率変数 A random variable assigns a numerical value to each outcome of an experiment. ▶ 再生 確率変数は、実験の各結果に数値を割り当てます。
Discrete (Random Variable) 離散(型確率変数) The number of heads in three coin flips is a discrete random variable. ▶ 再生 3回のコイン投げにおける表の数は、離散確率変数です。
Continuous (Random Variable) 連続(型確率変数) A person's height is typically modeled as a continuous random variable. ▶ 再生 人の身長は、通常、連続確率変数としてモデル化されます。
Value A random variable can take on different values depending on the outcome. ▶ 再生 確率変数は、結果に応じて異なる値をとることがあります。
Outcome 結果 Each possible result of a trial is an outcome. ▶ 再生 試行の各可能な結果がアウトカム(結果)です。
Countable 数えられる、可算の A discrete random variable takes on countable values. ▶ 再生 離散確率変数は、数えられる値をとります。
Uncountable 数えられない、非可算の A continuous random variable can take on an uncountable number of values within a range. ▶ 再生 連続確率変数は、ある範囲内で数えられないほどの多くの値をとることがあります。
Range / Interval 範囲 / 区間 Continuous variables take values over an interval or range. ▶ 再生 連続変数は、区間または範囲にわたる値をとります。