Anthropicが「拡張思考モード」を導入

拡張思考モードとは

Claude 3.7 Sonnetの「拡張思考モード」（Extended Thinking Mode）は、AIが複雑な問題に取り組む際に、より多くの時間と計算リソースを利用できるようにする機能です。通常のチャットAIモデルは即時に回答を生成しますが、この新モードでは、人間が難しい問題に向き合うときのように、より深く考える時間が与えられます。

特筆すべき点は、この思考プロセス全体がユーザーに対して「可視化」されることです。ユーザーはClaudeが問題をどのように分析し、異なる角度からアプローチし、解答に至るまでの推論過程をリアルタイムで観察できます。

思考プロセスの可視化がもたらすメリット

Anthropicによると、思考プロセスの可視化には以下のような利点があります：

信頼性の向上：ユーザーはClaudeの思考過程を観察することで、その回答をより理解し検証しやすくなります。
アラインメント研究への貢献：研究者は、モデルの内部思考と外部出力の矛盾を分析することで、潜在的な問題行動（例：欺瞞）を特定できる可能性があります。
教育的価値：複雑な数学や物理の問題などでは、解答だけでなくその思考過程を見ることで学習効果が高まります。

一方で、思考プロセスの公開には潜在的なリスクも存在します。Anthropicはこの機能をリサーチプレビューと位置付け、安全性への配慮として一部の有害なコンテンツを含む思考過程は暗号化し、ユーザーには表示しないなどの対策を講じています。

拡張思考モードのパフォーマンス向上効果

テスト時のコンピューティングスケーリング

Anthropicの研究によれば、拡張思考モードでは2つのタイプのコンピューティングスケーリングが利用されています：

直列テスト時コンピューティング：複数の連続的な推論ステップを使用して、より深く問題を分析します。
並列テスト時コンピューティング：同じ問題に対して複数の独立した思考プロセスを実行し、最も良い解答を選択します。

特に並列処理を用いた場合、GPQAと呼ばれる科学系の評価セットで84.8%（物理サブセットでは96.5%）という高いスコアを達成しています。これは、同じモデルでも思考方法を変えることで性能が大幅に向上することを示しています。

AIエージェントとしての能力向上

Claude 3.7 Sonnetは「アクション・スケーリング」と呼ばれる機能も備えており、関数を反復的に呼び出し、環境の変化に対応しながら複雑なタスクを完了する能力が向上しています。

この能力を示す興味深い実験として、「ポケモン・レッド」というゲームプレイのテストが行われました。Claude 3.7 Sonnetは前モデルが初期段階で行き詰まるのに対し、ゲーム内の3人のジムリーダーに勝利するという高度なタスクを達成しています。

この能力は単なるゲームだけでなく、複雑な実世界のタスクに対応するAIエージェントの構築にも応用できると期待されています。

利用可能性と安全性への配慮

拡張思考モードはClaude Pro、Team、Enterprise、およびAPIユーザーが利用可能です。Anthropicは安全性への配慮として、「AI安全レベル（ASL）2」の基準を適用し、有害なコンテンツを含む可能性がある思考プロセスの一部は暗号化して表示しないなどの対策を講じています。

また、「プロンプトインジェクション」と呼ばれる攻撃に対する防御も強化され、以前の74%から88%の防御率に向上しています。

今後の展望

Anthropicによれば、思考プロセスの可視化は現在のところリサーチプレビューと位置付けられており、将来のモデルではその表示方法や範囲について再検討される可能性があります。また、将来的にはより高度な「AI安全レベル3」の基準を適用することも検討しているとのことです。

この取り組みは、AIシステムの透明性と解釈可能性を高める重要なステップとして、業界内外から注目を集めています。

Anthropicが「可視化された拡張思考モード」を導入、Claude 3.7 Sonnetで思考プロセスを可視化