U字型のバイアス・バリアンス曲線:
- モデル複雑度↑ → 訓練誤差↓、テスト誤差↓(最初)
- さらに複雑度↑ → 過学習、テスト誤差↑
- 最適な複雑度が存在
深層学習では:
テスト誤差の推移(モデル複雑度に対して):
↑テスト誤差
| *
| * *
| * * *
| * * * *
|* * * *
| * *****
+------------------→ モデル複雑度
[古典的] [補間] [過パラメータ化]
閾値
訓練データを完全にフィット(補間)しながら、良好な汎化性能を示す現象。
| 条件 | 説明 |
|---|---|
| 高次元 | 特徴次元 >> サンプル数 |
| 最小ノルム | 補間解の中で最小ノルムを選択 |
| 共分散構造 | 信号とノイズの分離可能性 |
高次元では:
- 多くの補間解が存在
- 最小ノルム解は「単純」
- ノイズが多くの次元に分散
- 本質的なパターンは少数の次元に集中
モデル複雑度だけでなく、訓練時間でも二重降下が起こる。
エポック数↑:
1. テスト誤差↓(学習)
2. テスト誤差↑(過学習開始)
3. テスト誤差↓(再び改善)