OpenAIが新たなGPT-4.1シリーズモデルを発表
OpenAIは2025年4月14日、APIで利用可能な新しいGPTモデル「GPT-4.1」シリーズを発表しました。このシリーズには「GPT-4.1」、「GPT-4.1 mini」、「GPT-4.1 nano」の3つのモデルが含まれています。
主な特徴
このモデルシリーズは以下の点でGPT-4oやGPT-4o miniよりも全面的に優れた性能を発揮します:
- コーディング能力の大幅な向上:GPT-4.1はSWE-bench Verifiedで54.6%のスコアを達成(GPT-4oより21.4%向上)
- 指示への追従性の向上:ScaleのMultiChallengeベンチマークで38.3%のスコアを達成(GPT-4oより10.5%向上)
- 長文脈理解の向上:最大100万トークンのコンテキストウィンドウをサポート
- 更新された知識カットオフ:2024年6月までの情報を保持
実用性を重視して開発されたこれらのモデルは、開発者コミュニティとの密接な協力により、最も重要なタスクに最適化されています。
各モデルの位置づけ
- GPT-4.1:フラッグシップモデルで、コーディングや指示追従において最高レベルの性能
- GPT-4.1 mini:小型モデルながら多くのベンチマークでGPT-4oを上回る性能を発揮、GPT-4oと比較してレイテンシが半分、コストが83%減
- GPT-4.1 nano:最も高速で低コストなモデルで、低レイテンシが求められるタスクに最適(分類や自動補完など)
価格設定
OpenAIは推論システムの効率化により、GPT-4.1シリーズでより低価格を実現しています:
モデル | 入力(100万トークンあたり) | キャッシュ入力(100万トークンあたり) | 出力(100万トークンあたり) |
---|---|---|---|
GPT-4.1 | $2.00 | $0.50 | $8.00 |
GPT-4.1-mini | $0.40 | $0.10 | $1.60 |
GPT-4.1-nano | $0.10 | $0.025 | $0.40 |
これらのモデルはBatch APIで利用する場合、さらに50%の割引が適用されます。
ベンチマーク結果
コーディング性能
- SWE-bench Verified:GPT-4.1は54.6%のスコアを達成(GPT-4oの33.2%、GPT-4.5の38.0%と比較して大幅に向上)
- フロントエンドコーディング:人間の評価者がGPT-4.1の作成したウェブサイトをGPT-4oよりも80%の確率で好む結果に
指示追従性
- MultiChallenge:GPT-4.1は38.3%のスコアを達成(GPT-4oの27.8%より大幅に向上)
- IFEval:GPT-4.1は87.4%のスコアを達成(GPT-4oの81.0%と比較)
長文脈理解
- OpenAI-MRCR:GPT-4.1は全モデルで最大100万トークンまでの文脈で優れた性能を発揮
- Video-MME:GPT-4.1は字幕なしの30〜60分の長い動画に基づく多肢選択問題で72.0%のスコアを達成(GPT-4oの65.3%から向上)
実世界での活用例
コーディング
- Windsurf:GPT-4.1は内部コーディングベンチマークでGPT-4oより60%高いスコアを達成。ツール呼び出しが30%効率的になり、不要な編集の繰り返しが50%減少
- Qodo:GitHubプルリクエストから高品質なコードレビューを生成するテストで、GPT-4.1が55%のケースでより良い提案を提供
指示追従性
- Blue J:最も難しい実世界の税務シナリオに関する内部ベンチマークでGPT-4.1はGPT-4oより53%正確
- Hex:最も難しいSQL評価セットでGPT-4.1は約2倍の性能向上を実現
長文脈理解
- Thomson Reuters:法律業務向けAIアシスタントCoCounselで、GPT-4.1を使用した場合、複数文書レビューの精度が17%向上
- Carlyle:複数の長文書から詳細な財務データを抽出する際にGPT-4.1は非常に大きな文書からのデータ取得で50%の性能向上を達成
可用性と今後
GPT-4.1、GPT-4.1 mini、およびGPT-4.1 nanoは現在すべての開発者が利用可能です。OpenAIはGPT-4.5 Previewを段階的に廃止する予定で、開発者が移行するための期間として2025年7月14日まで利用可能とされています。
なお、GPT-4.1はAPIでのみ利用可能で、ChatGPTでは指示追従、コーディング、インテリジェンスの改善点の多くがGPT-4oの最新バージョンに段階的に組み込まれており、今後のリリースでさらに追加される予定です。
まとめ
GPT-4.1シリーズは、コーディング、指示追従、長文脈理解など実世界の開発者ニーズに焦点を当てた実用的なAI応用において大きな前進です。これらのモデルにより、インテリジェントシステムや高度なエージェントアプリケーションの構築における新たな可能性が開かれます。
出典: OpenAI - Introducing GPT-4.1 in the API(2025年4月14日)