xAIが「Grok 3」を発表、強力な推論能力と広範な知識を兼ね備えた次世代AI

xAIは2025年2月19日、同社の最新AIモデル「Grok 3」および「Grok 3 mini」を発表しました。この新モデルは強力な推論能力と広範な事前学習知識を融合させた次世代の人工知能で、数学、コーディング、一般知識などの分野で顕著な性能向上を実現しています。

強力な推論能力を実現する「Think」機能

Grok 3の最大の特徴は「Think」機能で、これによりモデルは数秒から数分間にわたって「思考」できるようになりました。大規模な強化学習(RL)を用いて思考連鎖プロセスを洗練させることで、問題解決戦略の改善、エラー修正、ステップの簡略化などが可能になっています。

この思考能力は、特に複雑な問題に対して複数のアプローチを検討し、自身の解答を検証するという人間に近い問題解決アプローチを可能にしています。ユーザーはGrok 3の思考プロセスを完全に閲覧できるため、モデルがどのように結論に至ったかを透明に確認できます。

ベンチマークで示された圧倒的な性能

Grok 3の性能は、様々なベンチマークテストで実証されています:

特に注目すべきは、Grok 3が2025年2月12日に公開されてわずか7日後のAIME試験で高いスコアを達成した点です。より小型の「Grok 3 mini」も、STEM分野のタスクにおいてコスト効率の高い推論を実現し、AIME 2024で95.8%、LiveCodeBenchで80.4%の正解率を達成しています。

大規模な事前学習によるモデル性能の向上

Grok 3は「推論モード」をオフにした状態でも高品質な即時応答を提供します。これは同社のColossusスーパークラスタでの大規模な事前学習によるもので、従来の最先端モデルの10倍の計算リソースを用いて訓練されています。

この事前学習により、Grok 3は様々な学術ベンチマークで非推論モデルとしても最先端の結果を実現しています。また、100万トークンのコンテキストウィンドウを持ち、これは前モデルの8倍のサイズであり、膨大なドキュメント処理や複雑なプロンプトにも対応可能です。

DeepSearch:最初のGrokエージェント

xAIはGrok 3の発表に合わせて、「DeepSearch」と呼ばれる初のエージェントサービスも発表しました。このAIエージェントは「宇宙全体の人類の知識」を高速に検索し、複雑な情報を統合して明確な答えを導き出すよう設計されています。

DeepSearchは最新のリアルタイムニュース、科学研究、さらには社会的な悩みに対するアドバイスなど、あらゆる情報ニーズに対応。検索結果を簡潔で包括的なレポートとして提供します。

API提供とエンタープライズ向けサービス

xAIは今後数週間のうちに、Grok 3およびGrok 3 miniをAPIプラットフォームを通じて提供開始する予定です。標準モデルと推論モデルの両方へのアクセスが可能になり、DeepSearchもエンタープライズパートナー向けにAPIで提供される予定です。

現在、Grok 3はX(旧Twitter)のPremiumおよびPremium+ユーザー向けにX上とGrok.comで利用可能です。Premium+ユーザーはThink機能とDeepSearchにも即時アクセスできます。さらに、すべてのGrokユーザーも一定の使用制限付きでGrok 3の機能を利用できるようになります。

今後の展望

xAIによると、Grok 3の訓練は継続中であり、今後数ヶ月で頻繁なアップデートが予定されています。今後のエンタープライズAPI向け新機能として、ツール使用、コード実行、高度なエージェント機能などが計画されています。

また同社は、先週発表したRMF(Risk Management Framework)に続き、トレーニング中のスケーラブルな監視と敵対的ロバスト性の進展にも特に注力していくとしています。

2023年11月のGrok 1リリース以来、xAIの小規模ながらも才能豊かなチームは急速な進歩を遂げ、AIイノベーションの最前線に位置づけられています。同社は拡張されたColossusスーパークラスタを活用して中核的な推論能力を向上させ、さらなる発展を目指しています。

出典: xAI - Grok 3 Beta — The Age of Reasoning Agents(2025年2月19日)

広告
xAI Grok 3 推論モデル DeepSearch AI技術
× 拡大図