AI にも“ワクワクで動く”仕組みがある——それが内発的動機づけ(IM)です。外からごほうびがほとんど得られない場面でも、AI は〈予測が外れた驚き〉や〈まだ見ぬ場所〉といった“内的報酬”を使って自発的に探索し、学び続けられます。 2024–2025 年は、大規模モデルと好奇心ボーナスの融合や、ズルい行動(報酬ハッキング)を抑える手法が注目され、教育支援・ロボット探査・創作サポートなどの応用が急拡大中です。人と AI がともに「面白いから挑戦する」世界が、すぐそこまで来ています。
続きを読む