Solomonoff帰納推論
1. 概要
1.1 帰納推論の問題
過去の観測x₁x₂...xₙから次の観測xₙ₊₁を予測する。
例: 101010... → 次は1?0?
ヒューム問題: どの規則性を外挿すべきか?
Solomonoffの解: すべての計算可能な仮説を重み付け
1.2 万能事前分布
M(x) = Σ_p 2^{-|p|} [U(p) = x* となるpについて和]
U: 万能チューリングマシン
p: プログラム
x*: xで始まる無限列
「xを出力するプログラムの確率の総和」
2. 予測
2.1 Solomonoff予測
P(xₙ₊₁ = 1 | x₁...xₙ) = M(x₁...xₙ1) / M(x₁...xₙ)
条件付き確率としての予測
2.2 最適性
定理(Solomonoff):
任意の計算可能な確率分布μに対して、
Solomonoff予測との累積KLダイバージェンスは有界:
Σₙ D_KL(μ(xₙ₊₁|x₁...xₙ) || M(xₙ₊₁|x₁...xₙ)) ≤ K(μ) log 2
→ 真の分布がどれであっても、有限の損失で収束
3. 性質
3.1 オッカムの剃刀
- 短いプログラム(単純な仮説)に高い重み
- 2^{-|p|}: プログラム長に指数的に減少
- 単純さへのバイアスが組み込まれている
3.2 普遍性
- すべての計算可能な仮説を考慮
- 特定のモデルクラスに限定されない
- 「理想的な」ベイズ学習
3.3 計算不可能性
M(x)は計算不可能
- K(x)の計算が必要
- 停止問題に帰着
→ 理論的な理想であり、直接実装は不可能
→ 近似が必要(圧縮ベースの方法など)
4. LLMとの関係
4.1 類似点
- 次トークン予測 ≈ Solomonoff予測
- 大規模データからパターンを学習
- 多様な仮説を暗黙的に考慮
4.2 相違点
- LLMは計算可能(近似)
- 訓練データに依存
- アーキテクチャによる帰納バイアス
5. 参考文献
- Solomonoff (1964). "A Formal Theory of Inductive Inference" Parts I & II
- Hutter (2005). "Universal Artificial Intelligence"
- Rathmanner & Hutter (2011). "A Philosophical Treatise of Universal Induction"