性能
直接対決ベンチマーク比較
Llama 4 Maverick はコンテキスト長とオープンアクセス性でリードし、Kimi K2.6 はエージェントコーディングと複数のフロンティアベンチマークで優位です。Scout は他に類を見ない10Mトークンのコンテキストウィンドウを追加します。
Llama 4 と Kimi K2.6 はそれぞれ異なる強みを持っています。Maverick はオープンウェイトと1Mコンテキストを備えた強力なオールラウンダーです。Kimi K2.6 はエージェントタスク向けに構築された1Tパラメータの専門モデルで、MoonViT によるネイティブマルチモーダルをサポートします。Scout の10Mコンテキストウィンドウはこの比較のどのモデルにも匹敵しません。
Kimi K2.6:SWE-Bench Pro 58.6%、HLE-Full 54.0%、BrowseComp 83.2%
Maverick:MMLU Pro 80.5%、GPQA Diamond 69.8%、MMMU 73.4%
Scout:10Mトークンのコンテキスト - Kimi K2.6 の256Kの39倍
Kimi K2.6:MoonViT 400M によるネイティブマルチモーダル(テキスト+画像+動画)
両ファミリーとも MoE アーキテクチャを採用、スケールのトレードオフが異なる
完全比較
Llama 4 Maverick vs Kimi K2.6 vs Llama 4 Scout
推論、コーディング、マルチモーダル、アーキテクチャ指標の完全なベンチマーク結果です。
| Benchmark | Llama 4 Maverick 400B / 17Bアクティブ オープンウェイト | Kimi K2.6 1T / 32Bアクティブ エージェント | Llama 4 Scout 109B / 17Bアクティブ 長文コンテキスト |
|---|---|---|---|
MMLU Pro 知識と推論 | 80.5% | - | 74.3% |
GPQA Diamond 科学知識 | 69.8% | - | 57.2% |
MMMU マルチモーダル理解 | 73.4% | - | 69.4% |
SWE-Bench Pro エージェントコーディング | - | 58.6% | - |
HLE-Full 高難度言語評価 | - | 54.0% | - |
BrowseComp ウェブブラウジングタスク | - | 83.2% | - |
Context Window 最大トークン数 | 1M | 256K | 10M |
Total Parameters モデルサイズ | 400B | 1T | 109B |
Active Parameters トークンあたり | 17B | 32B | 17B |
Number of Experts MoE ルーティング | 128 | 384(8+1共有) | 16 |
Multimodal 入力モダリティ | テキスト+画像 | テキスト+画像+動画(MoonViT 400M) | テキスト+画像 |
データは Meta 公式モデルカード、Moonshot の技術レポート、独立評価に基づきます。
Llama 4 を選ぶ
Kimi K2.6 より Llama 4 を選ぶべきとき
大規模コンテキストウィンドウ、オープンウェイトの柔軟性、実績あるエコシステムが必要な場合は Llama 4 が適しています。Scout の10Mトークンコンテキストは Kimi K2.6 の256Kの39倍で、両 Llama 4 モデルはセルフホストデプロイ向けに完全オープンウェイトです。
- 10Mトークンのコンテキスト(Scout)- コードベース全体を一度に処理
- Llama 3.1 互換ライセンスで完全オープンウェイト
- 低いアクティブパラメータコスト(トークンあたり17B vs 32B)
- より強力な汎用知識ベンチマーク(MMLU Pro 80.5%)
- クラウドプロバイダーとフレームワーク全体で幅広いエコシステムサポート
Kimi K2.6 を選ぶ
Kimi K2.6 が優位なとき
Kimi K2.6 はエージェントコーディングタスクとウェブブラウジングに優れています。384エキスパートの1Tパラメータスケールと MoonViT 400M によるネイティブ動画理解により、複雑な自律ワークフローに強い選択肢です。
- SWE-Bench Pro 58.6% - フロンティアのエージェントコーディング性能
- BrowseComp 83.2% - 優れたウェブブラウジングとナビゲーション
- HLE-Full 54.0% - 高難度言語評価で高い性能
- MoonViT 400M エンコーダーによるネイティブ動画理解
- 384エキスパート(8選択+1共有)で深い専門化
始める
Llama 4 モデルを無料で試す
Llama 4 Maverick または Scout ですぐにチャットを始められます。セットアップ不要 - 自分でモデルを比較して、ワークフローに合うものを見つけてください。