データには形がある。身長は釣鐘型、サイト訪問数は右に裾を引く。この「形」を数式で表現したものが確率分布。正規分布、ポアソン分布、ベルヌーイ分布。それぞれが異なる現象を記述する道具である。
確率分布 期待値 分散 正規分布 離散・連続
確率変数と確率分布
確率変数(Random Variable)
結果を数値で表す変数。
例:サイコロの目 X ∈ {1, 2, 3, 4, 5, 6}
確率分布(Probability Distribution)
確率変数が各値をとる確率の全体像。
離散:確率質量関数 P(X = x)
連続:確率密度関数 f(x)
期待値と分散
期待値(Expected Value)E[X]
確率変数の「平均的な値」。
離散:E[X] = Σ x·P(X=x)
連続:E[X] = ∫ x·f(x)dx
分散(Variance)Var(X)
期待値からのばらつき。
Var(X) = E[(X - E[X])²] = E[X²] - (E[X])²
標準偏差 σ = √Var(X)
代表的な離散分布
| 分布 | 用途 | パラメータ |
|---|---|---|
| ベルヌーイ | 成功/失敗の1回試行 | p(成功確率) |
| 二項分布 | n回中k回成功 | n, p |
| ポアソン分布 | 単位時間あたりの発生回数 | λ(平均発生率) |
| カテゴリカル | 多クラス分類 | 各クラスの確率 |
代表的な連続分布
| 分布 | 用途 | パラメータ |
|---|---|---|
| 一様分布 | 等確率な範囲 | a, b(範囲) |
| 正規分布 | 自然現象、誤差 | μ(平均), σ(標準偏差) |
| 指数分布 | 待ち時間 | λ(率) |
正規分布
正規分布(Gaussian Distribution)
f(x) = (1/√(2πσ²)) exp(-(x-μ)²/(2σ²))
別名:ガウス分布。釣鐘型の対称な分布。
中心極限定理:多くの独立な変数の和は正規分布に近づく。
実務での応用
WEB開発での応用
アクセス解析:PV数はポアソン分布でモデル化。
負荷テスト:レスポンス時間の分布を分析。
異常検知:正規分布からの外れ値を検出。
AI/MLでの応用
出力層:分類はカテゴリカル、回帰は正規分布を仮定。
重み初期化:正規分布や一様分布からサンプリング。
VAE:潜在空間を正規分布でモデル化。
ドロップアウト:ベルヌーイ分布でマスク生成。
深掘りリンク
- Wikipedia: 確率分布
- Wikipedia: 正規分布
- 動画:StatQuest「確率分布」シリーズ
- 次のステップ:ベイズ定理、最尤推定