データには形がある。身長は釣鐘型、サイト訪問数は右に裾を引く。この「形」を数式で表現したものが確率分布。正規分布、ポアソン分布、ベルヌーイ分布。それぞれが異なる現象を記述する道具である。

確率分布 期待値 分散 正規分布 離散・連続

確率変数と確率分布

確率変数(Random Variable)

結果を数値で表す変数。

例:サイコロの目 X ∈ {1, 2, 3, 4, 5, 6}

確率分布(Probability Distribution)

確率変数が各値をとる確率の全体像。

離散:確率質量関数 P(X = x)

連続:確率密度関数 f(x)

期待値と分散

期待値(Expected Value)E[X]

確率変数の「平均的な値」。

離散:E[X] = Σ x·P(X=x)

連続:E[X] = ∫ x·f(x)dx

分散(Variance)Var(X)

期待値からのばらつき。

Var(X) = E[(X - E[X])²] = E[X²] - (E[X])²

標準偏差 σ = √Var(X)

代表的な離散分布

分布 用途 パラメータ
ベルヌーイ 成功/失敗の1回試行 p(成功確率)
二項分布 n回中k回成功 n, p
ポアソン分布 単位時間あたりの発生回数 λ(平均発生率)
カテゴリカル 多クラス分類 各クラスの確率

代表的な連続分布

分布 用途 パラメータ
一様分布 等確率な範囲 a, b(範囲)
正規分布 自然現象、誤差 μ(平均), σ(標準偏差)
指数分布 待ち時間 λ(率)

正規分布

正規分布(Gaussian Distribution)

f(x) = (1/√(2πσ²)) exp(-(x-μ)²/(2σ²))

別名:ガウス分布。釣鐘型の対称な分布。

中心極限定理:多くの独立な変数の和は正規分布に近づく。

実務での応用

WEB開発での応用

アクセス解析:PV数はポアソン分布でモデル化。

負荷テスト:レスポンス時間の分布を分析。

異常検知:正規分布からの外れ値を検出。

AI/MLでの応用

出力層:分類はカテゴリカル、回帰は正規分布を仮定。

重み初期化:正規分布や一様分布からサンプリング。

VAE:潜在空間を正規分布でモデル化。

ドロップアウト:ベルヌーイ分布でマスク生成。

深掘りリンク