OpenAIは2025年2月2日、ChatGPT向けの新機能「deep research」を発表しました。この機能は、インターネット上の情報を収集・分析・合成し、複雑な調査タスクを自動化するエージェント能力を提供します。人間が数時間かけて行う調査作業を数十分で完了させることができます。
deep researchの主要機能と特徴
deep researchは、複雑な調査タスクを実行するために設計された新しいエージェント機能です。主な特徴は以下の通りです:
- 複数ステップの研究能力 - インターネット上の情報を検索、分析、合成して複雑なタスクを実行
- 高速処理 - 人間が数時間かかるタスクを数十分で完了
- テキスト・画像・PDF解析 - さまざまな形式の情報を理解・分析する能力
- 情報の検証 - すべての出力に明確な引用と思考プロセスの要約を提供
- 非直感的情報の発見 - 数百のウェブサイトを閲覧して見つけにくい情報も収集
この機能はOpenAIの最新モデル「o3」をベースにしており、ウェブブラウジングとデータ分析に最適化されています。o3は、OpenAI o1と同じ強化学習手法を使用してトレーニングされていますが、より広範なコンテキストと情報収集能力を持っています。
利用シーン
deep researchは以下のような分野での知識集約型作業に特に有効です:
- 金融 - 市場調査、競合分析、投資リサーチ
- 科学 - 文献調査、データ分析、仮説検証
- 政策 - 規制分析、政策影響評価、公共データ分析
- エンジニアリング - 技術調査、問題解決、コード分析
- 個人利用 - 高額購入(車、家電、家具など)の調査
例えば、「iOSとAndroidの採用率、言語学習希望者の割合、モバイル普及率の変化を先進国と発展途上国で比較し、新しい翻訳アプリのターゲット市場を推奨してほしい」といった複雑なリクエストに、包括的なレポートを提供することができます。
性能評価
deep researchは複数のベンチマークで優れた性能を示しています:
- Humanity's Last Exam - 100以上の科目にわたる3,000以上の問題で26.6%の精度を達成(GPT-4oの3.3%から大幅向上)
- GAIA - 実世界の問題に関する公開ベンチマークで最先端の結果(レベル1: 74.29%、レベル2: 69.06%、レベル3: 47.6%)
- 専門家レベルのタスク - 内部評価では、数時間の手動調査を自動化する能力を実証
GPT-4oとdeep researchの比較
deep researchとGPT-4oはそれぞれ異なる強みを持っています:
機能 | deep research | GPT-4o |
---|---|---|
適した用途 | 多面的、分野特化型の調査 深さと詳細さが重要な場合 広範な情報収集が必要な場合 |
リアルタイムの会話 マルチモーダル対話 即時的な回答が必要な場合 |
処理時間 | 5〜30分 | 数秒〜数分 |
情報の範囲 | インターネット全体 | トレーニングデータのみ |
引用 | 各主張に対する詳細な引用 | 一般的な知識の要約 |
使用方法
ChatGPTでdeep researchを使用するには:
- ChatGPTのメッセージ作成画面で「deep research」を選択
- 調査したい内容を質問として入力(コンテキストを追加するためのファイル添付も可能)
- 実行開始後、サイドバーに実行ステップとソースの要約が表示される
- 研究の複雑さに応じて5〜30分程度かかる場合があります
- 完了すると通知が表示され、チャット内にレポートが表示されます
今後数週間のうちに、レポートに画像、データの可視化、その他の分析出力が埋め込まれる機能が追加される予定です。
利用可能範囲と今後の展開
deep researchの利用可能範囲と今後の展開は以下の通りです:
- 現在 - Proユーザー向けに月間100クエリまで提供中
- 近日中 - PlusユーザーとTeamユーザー向けに提供予定
- 地域展開 - 英国、スイス、欧州経済領域のユーザーへの提供も計画中
- 将来計画 - より高速で費用対効果の高い小型モデルバージョンを開発中
OpenAIは、deep researchは「知識を統合する能力は新しい知識を生み出すための前提条件」であり、AGI(汎用人工知能)の開発に向けた重要なステップであると位置づけています。
制限事項
OpenAIはdeep researchにはいくつかの制限があることも認めています:
- 事実の誤認や推論エラーの可能性(従来モデルより低率)
- 信頼性の高い情報源と不確かな情報の区別が困難な場合がある
- 不確実性の表現に関する課題
- レポートや引用の軽微な書式エラーの可能性
- タスク開始に時間がかかる場合がある
「知識を統合する能力は新しい知識を生み出すための前提条件です。そのため、deep researchはAGIを開発するという私たちの広範な目標に向けた重要なステップであり、新たな科学的研究を生み出す能力を長期的に構想しています。」— OpenAI
出典: OpenAI - Introducing deep research(2025年2月2日)