主要LLMの特徴と性能比較。GPT、Claude、Gemini、Llama、Mistral、DeepSeek。モデル選択の指針。
最終更新:2025年11月
| 種類 | 特徴 | 代表例 |
|---|---|---|
| クローズド | API提供のみ、重みは非公開 | GPT-4、Claude、Gemini |
| オープンウェイト | 重みは公開、訓練詳細は一部非公開 | Llama、Mistral |
| オープンソース | 重み・データ・コードをすべて公開 | OLMo、Pythia |
| 組織 | 主要モデル | 特徴 |
|---|---|---|
| OpenAI | GPT-4o, o1/o3 | マルチモーダル、推論特化 |
| Anthropic | Claude 3.5/4 | 長文脈、安全性 |
| Gemini 1.5/2 | 超長文脈、マルチモーダル | |
| Meta | Llama 3.x | オープン、多言語 |
| Mistral | Mistral Large, Mixtral | MoE、効率性 |
| DeepSeek | DeepSeek-V3 | コスト効率、MoE |
| モデル | 公開 | 特徴 |
|---|---|---|
| GPT-3.5 Turbo | 2022 | ChatGPTの基盤、低コスト |
| GPT-4 | 2023/3 | 大幅な性能向上、画像理解 |
| GPT-4 Turbo | 2023/11 | 128Kコンテキスト、低コスト |
| GPT-4o | 2024/5 | ネイティブマルチモーダル、高速 |
| GPT-4o mini | 2024/7 | 軽量版、GPT-3.5 Turbo後継 |
| モデル | 公開 | 特徴 |
|---|---|---|
| Claude 2 | 2023/7 | 100Kコンテキスト |
| Claude 3 Haiku/Sonnet/Opus | 2024/3 | 3サイズ、200Kコンテキスト |
| Claude 3.5 Sonnet | 2024/6 | Opus級性能、Sonnet価格 |
| Claude 3.5 Haiku | 2024/10 | 高速・低コスト |
| モデル | 公開 | 特徴 |
|---|---|---|
| Gemini 1.0 | 2023/12 | Ultra/Pro/Nano |
| Gemini 1.5 Pro | 2024/2 | 1Mトークンコンテキスト |
| Gemini 1.5 Flash | 2024/5 | 高速・低コスト版 |
| Gemini 2.0 Flash | 2024/12 | エージェント向け、マルチモーダル出力 |
| モデル | 公開 | サイズ |
|---|---|---|
| Llama 2 | 2023/7 | 7B, 13B, 70B |
| Llama 3 | 2024/4 | 8B, 70B |
| Llama 3.1 | 2024/7 | 8B, 70B, 405B |
| Llama 3.2 | 2024/9 | 1B, 3B(軽量)、11B, 90B(マルチモーダル) |
| Llama 3.3 | 2024/12 | 70B(405B級性能) |
| モデル | MMLU | GSM8K | HumanEval |
|---|---|---|---|
| GPT-4o | 〜88% | 〜95% | 〜90% |
| Claude 3.5 Sonnet | 〜89% | 〜96% | 〜92% |
| Gemini 1.5 Pro | 〜86% | 〜91% | 〜84% |
| Llama 3.1 405B | 〜88% | 〜96% | 〜89% |
| DeepSeek-V3 | 〜88% | 〜92% | 〜86% |
※数値は概算。評価設定により変動。
| 順位 | モデル | Elo(概算) |
|---|---|---|
| 1 | o1 | 〜1350 |
| 2 | Claude 3.5 Sonnet | 〜1270 |
| 3 | GPT-4o | 〜1260 |
| 4 | Gemini 1.5 Pro | 〜1250 |
| 5 | DeepSeek-V3 | 〜1250 |
| モデル | 入力 ($/1M tokens) | 出力 ($/1M tokens) |
|---|---|---|
| GPT-4o | $2.50 | $10.00 |
| Claude 3.5 Sonnet | $3.00 | $15.00 |
| Gemini 1.5 Pro | $1.25 | $5.00 |
| GPT-4o mini | $0.15 | $0.60 |
| Claude 3.5 Haiku | $0.80 | $4.00 |
| 用途 | 推奨モデル | 理由 |
|---|---|---|
| 汎用チャット | GPT-4o, Claude 3.5 Sonnet | 総合性能 |
| コーディング | Claude 3.5 Sonnet, o1 | SWE-bench性能 |
| 長文書処理 | Gemini 1.5 Pro, Claude | 長文脈対応 |
| 数学・推論 | o1/o3 | 推論特化 |
| コスト重視 | GPT-4o mini, Gemini Flash | 低価格 |
| ローカル実行 | Llama 3.x, Mistral | オープンウェイト |
| 日本語特化 | Claude, GPT-4o | 日本語品質 |