第8章 代表的な連続型確率分布
8-3-2: 正規分布の標準化Standardization ~いつでも使えるN(0, 1)へ変身!~
前のページで、正規分布 $N(\mu, \sigma^2)$ の形が平均 $\mu$ と標準偏差 $\sigma$ で決まること、そして確率 $P(a \le X \le b)$ を求めるにはグラフの下の面積を計算する必要があり、これが手計算では大変だということを学んだね。
「じゃあ、正規分布の確率ってどうやって計算するの?」と思ったかもしれないね。その問題を解決してくれる魔法の杖が、今回学ぶ「標準化Standardization」なんだ!
標準化とは、世の中にたくさんある色々な正規分布(平均や標準偏差が違うもの)を、たった一つの特別な正規分布(平均が0、標準偏差が1)に変換してしまう操作のこと。これによって、確率計算がぐっと楽になるんだよ。
標準化Standardization とは?
平均 $\mu$、標準偏差 $\sigma$ の正規分布 $N(\mu, \sigma^2)$ に従う確率変数 $X$ があるとき、それを次の式で変換して得られる新しい確率変数 $Z$ を考える。
$\mathbf{Z = \frac{X - \mu}{\sigma}}$
この操作を標準化Standardizationと呼ぶ。
そして、驚くことに、この変換によって得られた新しい確率変数 $Z$ は、必ず平均が0、標準偏差が1の正規分布に従うんだ!この特別な正規分布のことを標準正規分布Standard Normal Distribution と呼び、$N(0, 1)$ と書くんだったね。
この $Z$ の値は、元の値 $X$ が「平均 $\mu$ から、標準偏差 $\sigma$ の何個分だけ離れているか」を示している。そのため、ZスコアZ-score や標準得点と呼ばれることもあるよ。
- $X = \mu$ のとき、$Z = \frac{\mu - \mu}{\sigma} = 0$
- $X = \mu + \sigma$ のとき、$Z = \frac{(\mu+\sigma) - \mu}{\sigma} = 1$ (平均から標準偏差1個分だけ上)
- $X = \mu - 2\sigma$ のとき、$Z = \frac{(\mu-2\sigma) - \mu}{\sigma} = -2$ (平均から標準偏差2個分だけ下)
なぜこの式で $N(0, 1)$ に変換できるの?(イメージ)
- $X-\mu$ (平均を引く):
まず、元の値 $X$ から平均 $\mu$ を引くと、データの中心が $\mu$ から 0 に移動するよね。これで分布の山の中心が $Z=0$ の位置に来る。グラフ全体が左右に平行移動するイメージだ。 - $\frac{X-\mu}{\sigma}$ ($\sigma$で割る):
次に、平均からの差を標準偏差 $\sigma$ で割る。これは、ばらつきの「単位」を $\sigma$ から $1$ に変換する操作にあたるんだ。$\sigma$ が大きくてグラフがなだらかだったものはキュッと縮まり、$\sigma$ が小さくて尖っていたものは横に広げられて、ちょうど標準偏差が1の釣鐘型になる。グラフの横幅と縦の高さが変わるイメージだね。
標準化のプロセス:(1) 平均を0にシフト → (2) 標準偏差を1にスケーリング
なぜ標準化が便利なの? ~ 標準正規分布表
どんな正規分布 $N(\mu, \sigma^2)$ も、標準化 $Z = \frac{X - \mu}{\sigma}$ によって、たった一つの標準正規分布 $N(0, 1)$ に変身させられる、というのがミソなんだ。
ということは、標準正規分布 $N(0, 1)$ についての確率(グラフの下の面積)さえ計算できれば、どんな正規分布の確率も計算できることになる!
そして、標準正規分布については、親切なことに、様々な $z$ の値に対する確率(面積)を計算した結果が「標準正規分布表Standard Normal Table」という表にまとめられているんだ。(もちろん、今はコンピュータで簡単に計算できるけどね!)
通常、標準正規分布に従う確率変数 $Z$ について、$P(0 \le Z \le z)$(平均0からある値 $z$ までの間の確率)や $P(Z \le z)$(ある値 $z$ 以下になる確率)などが載っている表だよ。教科書の後ろやウェブサイトなどで見ることができる。この表と、$N(0, 1)$ のグラフが左右対称であることを利用すれば、色々な区間の確率を求めることができるんだ。
標準化を使った確率計算の手順
正規分布 $N(\mu, \sigma^2)$ に従う $X$ について、確率 $P(a \le X \le b)$ を計算したいときは、次のステップで計算できるよ。
- 求めたい確率の区間 $[a, b]$ を確認する。
- 区間の下限 $a$ と上限 $b$ を、それぞれ標準化の式を使って $Z$ の値に変換する。
$z_1 = \frac{a - \mu}{\sigma}$
$z_2 = \frac{b - \mu}{\sigma}$ - 求めたい確率は、標準正規分布 $N(0, 1)$ に従う $Z$ が区間 $[z_1, z_2]$ に入る確率 $P(z_1 \le Z \le z_2)$ と等しくなる。
- 標準正規分布表(またはコンピュータ)を使って、$P(z_1 \le Z \le z_2)$ を求める。
例題1:テストの点数の確率を計算!
あるクラスの数学のテストの点数 $X$ は、平均 $\mu=60$点、標準偏差 $\sigma=10$点の正規分布 $N(60, 10^2)$ に従うとします。
(a) 70点以上80点以下の範囲 ($70 \le X \le 80$) に入る確率は?
Step 1 & 2: 標準化
$x=70 \implies z_1 = \frac{70 - 60}{10} = 1.0$
$x=80 \implies z_2 = \frac{80 - 60}{10} = 2.0$
Step 3: 求める確率
$P(70 \le X \le 80) = P(1.0 \le Z \le 2.0)$
Step 4: 標準正規分布表で計算
標準正規分布表で $P(0 \le Z \le z)$ の値を見ると(表の種類によって見方が違うので注意!)、
$P(0 \le Z \le 2.0) \approx 0.4772$
$P(0 \le Z \le 1.0) \approx 0.3413$
グラフを考えると、$P(1.0 \le Z \le 2.0)$ は、$P(0 \le Z \le 2.0)$ から $P(0 \le Z \le 1.0)$ を引いた面積になる。
$P(1.0 \le Z \le 2.0) \approx 0.4772 - 0.3413 = 0.1359$
答え:約 0.1359 (約 13.6%)
(b) 55点以下 ($X \le 55$) になる確率は?
Step 1 & 2: 標準化
$x=55 \implies z = \frac{55 - 60}{10} = -0.5$
Step 3: 求める確率
$P(X \le 55) = P(Z \le -0.5)$
Step 4: 標準正規分布表と対称性で計算
標準正規分布 $N(0, 1)$ のグラフは $Z=0$ に関して左右対称なので、$P(Z \le -0.5)$ は $P(Z \ge 0.5)$ と等しい。
$Z \ge 0.5$ の確率は、グラフの右半分全体の確率($0.5$)から、$0 \le Z < 0.5$ の確率を引けば求まる。
$P(Z \le -0.5) = P(Z \ge 0.5) = P(Z \ge 0) - P(0 \le Z < 0.5)$
表から $P(0 \le Z < 0.5) \approx 0.1915$ なので、
$P(Z \le -0.5) \approx 0.5 - 0.1915 = 0.3085$
答え:約 0.3085 (約 30.9%)
N(60, 10^2)での確率計算を N(0, 1) に変換
まとめ
- 正規分布の標準化とは、確率変数 $X \sim N(\mu, \sigma^2)$ を $Z = \frac{X - \mu}{\sigma}$ によって、標準正規分布 $Z \sim N(0, 1)$ に変換すること。
- $Z$スコアは、元の値が平均から標準偏差いくつ分離れているかを示す。
- どんな正規分布の確率 $P(a \le X \le b)$ も、まず $a, b$ を標準化して $z_1, z_2$ に変換し、$P(z_1 \le Z \le z_2)$ を標準正規分布表などを使って求めることで計算できる。
この標準化は、正規分布を扱う上で絶対に必要になるテクニックだから、しっかりマスターしておこう!
このページで出てきたEnglish wordsとその仲間たち
英単語 (English) | 意味 (Meaning) | 例文 (Example Sentence) | 例文の読み上げ | 例文の日本語訳 |
---|---|---|---|---|
Standardization | 標準化 | Standardization transforms a normal variable into a standard normal variable (Z). | ▶ 再生 | 標準化は、正規変数を標準正規変数(Z)に変換します。 |
Z-score | Zスコア、標準得点 | The Z-score tells you how many standard deviations a value is from the mean. | ▶ 再生 | Zスコアは、ある値が平均から標準偏差いくつ分離れているかを示します。 |
Standard Normal Distribution | 標準正規分布 | The standard normal distribution has a mean of 0 and a standard deviation of 1. | ▶ 再生 | 標準正規分布は、平均が0で標準偏差が1です。 |
Standard Normal Table | 標準正規分布表 | We use the standard normal table to find probabilities for Z. | ▶ 再生 | 私たちはZの確率を見つけるために標準正規分布表を使います。 |
Probability Calculation | 確率計算 | Standardization simplifies probability calculation for any normal distribution. | ▶ 再生 | 標準化は、あらゆる正規分布の確率計算を単純化します。 |
Transformation | 変換 | The Z-score formula is a linear transformation. | ▶ 再生 | Zスコアの公式は線形変換です。 |
Shift | 移動させる、ずらす | Subtracting the mean $\mu$ shifts the distribution's center to zero. | ▶ 再生 | 平均μを引くと、分布の中心がゼロに移動します。 |
Scale | 尺度を変える、拡大縮小する | Dividing by $\sigma$ scales the distribution to have a standard deviation of 1. | ▶ 再生 | σで割ると、分布の尺度が変わり標準偏差が1になります。 |