サイコロを振る。コインを投げる。明日の天気を予測する。不確実な世界を数学で扱う方法、それが確率論である。機械学習モデルの出力は確率であり、データ分析は確率的な推論である。不確実性を定量化する言語を身につける。
確率 標本空間 事象 条件付き確率 独立
確率の基本概念
標本空間(Sample Space)Ω
起こりうるすべての結果の集合。
例:サイコロ → Ω = {1, 2, 3, 4, 5, 6}
例:コイン2回 → Ω = {HH, HT, TH, TT}
事象(Event)
標本空間の部分集合。
例:「偶数が出る」= {2, 4, 6}
確率(Probability)
事象 A が起こる可能性を 0〜1 の数値で表す。
P(A) = 0: 絶対に起こらない
P(A) = 1: 必ず起こる
確率の公理(コルモゴロフの公理)
| 公理 | 内容 |
|---|---|
| 非負性 | P(A) ≥ 0 |
| 正規化 | P(Ω) = 1 |
| 加法性 | 互いに排反な事象について P(A∪B) = P(A) + P(B) |
条件付き確率
条件付き確率
P(A|B) = P(A∩B) / P(B)
「Bが起きたとき、Aも起きる確率」
例:「雨が降っているとき、傘を持っている確率」
独立性
独立(Independence)
P(A∩B) = P(A) × P(B) のとき、AとBは独立。
一方が起きても他方の確率に影響しない。
例:異なるサイコロの結果は独立。
余事象と加法定理
P(A') = 1 - P(A)(余事象)
P(A∪B) = P(A) + P(B) - P(A∩B)(加法定理)
実務での応用
WEB開発での応用
A/Bテスト:クリック率の差が偶然かどうかを確率で判定。
レコメンデーション:「この商品を買う確率」を予測。
エラー発生率:システム障害の確率を見積もる。
AI/MLでの応用
分類確率:Softmax出力は各クラスの確率。
確率的モデル:ベイズ推論、生成モデル。
サンプリング:確率分布からデータを生成。
ドロップアウト:確率的にニューロンを無効化。
深掘りリンク
- Wikipedia: 確率
- 書籍:「確率論入門」伊藤清
- 動画:3Blue1Brown「確率」シリーズ
- 次のステップ:確率分布、期待値