ウルトラ先生の確率教室

第8章 代表的な連続型確率分布

8-3-2: 正規分布の標準化Standardization ~いつでも使えるN(0, 1)へ変身!~

前のページで、正規分布 $N(\mu, \sigma^2)$ の形が平均 $\mu$ と標準偏差 $\sigma$ で決まること、そして確率 $P(a \le X \le b)$ を求めるにはグラフの下の面積を計算する必要があり、これが手計算では大変だということを学んだね。

「じゃあ、正規分布の確率ってどうやって計算するの?」と思ったかもしれないね。その問題を解決してくれる魔法の杖が、今回学ぶ「標準化Standardization」なんだ!

標準化とは、世の中にたくさんある色々な正規分布(平均や標準偏差が違うもの)を、たった一つの特別な正規分布(平均が0、標準偏差が1)に変換してしまう操作のこと。これによって、確率計算がぐっと楽になるんだよ。

標準化Standardization とは?

平均 $\mu$、標準偏差 $\sigma$ の正規分布 $N(\mu, \sigma^2)$ に従う確率変数 $X$ があるとき、それを次の式で変換して得られる新しい確率変数 $Z$ を考える。

$\mathbf{Z = \frac{X - \mu}{\sigma}}$

この操作を標準化Standardizationと呼ぶ。

そして、驚くことに、この変換によって得られた新しい確率変数 $Z$ は、必ず平均が0、標準偏差が1の正規分布に従うんだ!この特別な正規分布のことを標準正規分布Standard Normal Distribution と呼び、$N(0, 1)$ と書くんだったね。

この $Z$ の値は、元の値 $X$ が「平均 $\mu$ から、標準偏差 $\sigma$ の何個分だけ離れているか」を示している。そのため、ZスコアZ-score や標準得点と呼ばれることもあるよ。

  • $X = \mu$ のとき、$Z = \frac{\mu - \mu}{\sigma} = 0$
  • $X = \mu + \sigma$ のとき、$Z = \frac{(\mu+\sigma) - \mu}{\sigma} = 1$ (平均から標準偏差1個分だけ上)
  • $X = \mu - 2\sigma$ のとき、$Z = \frac{(\mu-2\sigma) - \mu}{\sigma} = -2$ (平均から標準偏差2個分だけ下)

なぜこの式で $N(0, 1)$ に変換できるの?(イメージ)

  1. $X-\mu$ (平均を引く)
    まず、元の値 $X$ から平均 $\mu$ を引くと、データの中心が $\mu$ から 0 に移動するよね。これで分布の山の中心が $Z=0$ の位置に来る。グラフ全体が左右に平行移動するイメージだ。
  2. $\frac{X-\mu}{\sigma}$ ($\sigma$で割る)
    次に、平均からの差を標準偏差 $\sigma$ で割る。これは、ばらつきの「単位」を $\sigma$ から $1$ に変換する操作にあたるんだ。$\sigma$ が大きくてグラフがなだらかだったものはキュッと縮まり、$\sigma$ が小さくて尖っていたものは横に広げられて、ちょうど標準偏差が1の釣鐘型になる。グラフの横幅と縦の高さが変わるイメージだね。

標準化のプロセス:(1) 平均を0にシフト → (2) 標準偏差を1にスケーリング

なぜ標準化が便利なの? ~ 標準正規分布表

どんな正規分布 $N(\mu, \sigma^2)$ も、標準化 $Z = \frac{X - \mu}{\sigma}$ によって、たった一つの標準正規分布 $N(0, 1)$ に変身させられる、というのがミソなんだ。

ということは、標準正規分布 $N(0, 1)$ についての確率(グラフの下の面積)さえ計算できれば、どんな正規分布の確率も計算できることになる!

そして、標準正規分布については、親切なことに、様々な $z$ の値に対する確率(面積)を計算した結果が「標準正規分布表Standard Normal Table」という表にまとめられているんだ。(もちろん、今はコンピュータで簡単に計算できるけどね!)

標準正規分布表って?
通常、標準正規分布に従う確率変数 $Z$ について、$P(0 \le Z \le z)$(平均0からある値 $z$ までの間の確率)や $P(Z \le z)$(ある値 $z$ 以下になる確率)などが載っている表だよ。教科書の後ろやウェブサイトなどで見ることができる。この表と、$N(0, 1)$ のグラフが左右対称であることを利用すれば、色々な区間の確率を求めることができるんだ。

標準化を使った確率計算の手順

正規分布 $N(\mu, \sigma^2)$ に従う $X$ について、確率 $P(a \le X \le b)$ を計算したいときは、次のステップで計算できるよ。

  1. 求めたい確率の区間 $[a, b]$ を確認する。
  2. 区間の下限 $a$ と上限 $b$ を、それぞれ標準化の式を使って $Z$ の値に変換する。
    $z_1 = \frac{a - \mu}{\sigma}$
    $z_2 = \frac{b - \mu}{\sigma}$
  3. 求めたい確率は、標準正規分布 $N(0, 1)$ に従う $Z$ が区間 $[z_1, z_2]$ に入る確率 $P(z_1 \le Z \le z_2)$ と等しくなる。
  4. 標準正規分布表(またはコンピュータ)を使って、$P(z_1 \le Z \le z_2)$ を求める。

例題1:テストの点数の確率を計算!

あるクラスの数学のテストの点数 $X$ は、平均 $\mu=60$点、標準偏差 $\sigma=10$点の正規分布 $N(60, 10^2)$ に従うとします。

(a) 70点以上80点以下の範囲 ($70 \le X \le 80$) に入る確率は?

Step 1 & 2: 標準化
$x=70 \implies z_1 = \frac{70 - 60}{10} = 1.0$
$x=80 \implies z_2 = \frac{80 - 60}{10} = 2.0$

Step 3: 求める確率
$P(70 \le X \le 80) = P(1.0 \le Z \le 2.0)$

Step 4: 標準正規分布表で計算
標準正規分布表で $P(0 \le Z \le z)$ の値を見ると(表の種類によって見方が違うので注意!)、
$P(0 \le Z \le 2.0) \approx 0.4772$
$P(0 \le Z \le 1.0) \approx 0.3413$
グラフを考えると、$P(1.0 \le Z \le 2.0)$ は、$P(0 \le Z \le 2.0)$ から $P(0 \le Z \le 1.0)$ を引いた面積になる。
$P(1.0 \le Z \le 2.0) \approx 0.4772 - 0.3413 = 0.1359$

答え:約 0.1359 (約 13.6%)


(b) 55点以下 ($X \le 55$) になる確率は?

Step 1 & 2: 標準化
$x=55 \implies z = \frac{55 - 60}{10} = -0.5$

Step 3: 求める確率
$P(X \le 55) = P(Z \le -0.5)$

Step 4: 標準正規分布表と対称性で計算
標準正規分布 $N(0, 1)$ のグラフは $Z=0$ に関して左右対称なので、$P(Z \le -0.5)$ は $P(Z \ge 0.5)$ と等しい。
$Z \ge 0.5$ の確率は、グラフの右半分全体の確率($0.5$)から、$0 \le Z < 0.5$ の確率を引けば求まる。
$P(Z \le -0.5) = P(Z \ge 0.5) = P(Z \ge 0) - P(0 \le Z < 0.5)$
表から $P(0 \le Z < 0.5) \approx 0.1915$ なので、
$P(Z \le -0.5) \approx 0.5 - 0.1915 = 0.3085$

答え:約 0.3085 (約 30.9%)

N(60, 10^2)での確率計算を N(0, 1) に変換

まとめ

この標準化は、正規分布を扱う上で絶対に必要になるテクニックだから、しっかりマスターしておこう!

このページで出てきたEnglish wordsとその仲間たち

英単語 (English) 意味 (Meaning) 例文 (Example Sentence) 例文の読み上げ 例文の日本語訳
Standardization 標準化 Standardization transforms a normal variable into a standard normal variable (Z). ▶ 再生 標準化は、正規変数を標準正規変数(Z)に変換します。
Z-score Zスコア、標準得点 The Z-score tells you how many standard deviations a value is from the mean. ▶ 再生 Zスコアは、ある値が平均から標準偏差いくつ分離れているかを示します。
Standard Normal Distribution 標準正規分布 The standard normal distribution has a mean of 0 and a standard deviation of 1. ▶ 再生 標準正規分布は、平均が0で標準偏差が1です。
Standard Normal Table 標準正規分布表 We use the standard normal table to find probabilities for Z. ▶ 再生 私たちはZの確率を見つけるために標準正規分布表を使います。
Probability Calculation 確率計算 Standardization simplifies probability calculation for any normal distribution. ▶ 再生 標準化は、あらゆる正規分布の確率計算を単純化します。
Transformation 変換 The Z-score formula is a linear transformation. ▶ 再生 Zスコアの公式は線形変換です。
Shift 移動させる、ずらす Subtracting the mean $\mu$ shifts the distribution's center to zero. ▶ 再生 平均μを引くと、分布の中心がゼロに移動します。
Scale 尺度を変える、拡大縮小する Dividing by $\sigma$ scales the distribution to have a standard deviation of 1. ▶ 再生 σで割ると、分布の尺度が変わり標準偏差が1になります。