성능
직접 벤치마크 비교
Llama 4 Maverick은 컨텍스트 길이와 오픈 접근성에서, Kimi K2.6는 에이전틱 코딩과 여러 프론티어 벤치마크에서 우위를 보입니다. Scout는 비교 불가한 1,000만 토큰 컨텍스트 윈도우를 추가합니다.
Llama 4와 Kimi K2.6는 서로 다른 강점을 목표로 합니다. Maverick은 오픈 웨이트와 1M 컨텍스트를 갖춘 강력한 올라운더입니다. Kimi K2.6는 MoonViT를 통한 네이티브 멀티모달 지원과 함께 에이전틱 작업에 특화된 1T 파라미터 전문 모델입니다. Scout의 1,000만 토큰 컨텍스트 윈도우는 이 비교에서 어떤 모델도 따라올 수 없습니다.
Kimi K2.6: SWE-Bench Pro 58.6%, HLE-Full 54.0%, BrowseComp 83.2%
Maverick: MMLU Pro 80.5%, GPQA Diamond 69.8%, MMMU 73.4%
Scout: 1,000만 토큰 컨텍스트 - Kimi K2.6의 256K보다 39배 길다
Kimi K2.6: MoonViT 400M을 통한 네이티브 멀티모달 (텍스트 + 이미지 + 비디오)
두 패밀리 모두 서로 다른 규모 트레이드오프로 MoE 아키텍처 사용
전체 비교
Llama 4 Maverick vs Kimi K2.6 vs Llama 4 Scout
추론, 코딩, 멀티모달, 아키텍처 지표에 걸친 전체 벤치마크 결과.
| Benchmark | Llama 4 Maverick 400B / 17B 활성 오픈 웨이트 | Kimi K2.6 1T / 32B 활성 에이전틱 | Llama 4 Scout 109B / 17B 활성 장문맥 |
|---|---|---|---|
MMLU Pro 지식 및 추론 | 80.5% | - | 74.3% |
GPQA Diamond 과학 지식 | 69.8% | - | 57.2% |
MMMU 멀티모달 이해 | 73.4% | - | 69.4% |
SWE-Bench Pro 에이전틱 코딩 | - | 58.6% | - |
HLE-Full 고난도 언어 평가 | - | 54.0% | - |
BrowseComp 웹 브라우징 작업 | - | 83.2% | - |
Context Window 최대 토큰 | 1M | 256K | 10M |
Total Parameters 모델 크기 | 400B | 1T | 109B |
Active Parameters 토큰당 | 17B | 32B | 17B |
Number of Experts MoE 라우팅 | 128 | 384 (8+1 공유) | 16 |
Multimodal 입력 모달리티 | 텍스트 + 이미지 | 텍스트 + 이미지 + 비디오 (MoonViT 400M) | 텍스트 + 이미지 |
Meta 공식 모델 카드, Moonshot 기술 보고서, 독립 평가 데이터 기반.
Llama 4 선택
Kimi K2.6 대신 Llama 4를 선택해야 할 때
대규모 컨텍스트 윈도우, 오픈 웨이트 유연성, 검증된 생태계가 필요하다면 Llama 4가 더 나은 선택입니다. Scout의 1,000만 토큰 컨텍스트는 Kimi K2.6의 256K보다 39배 길며, 두 Llama 4 모델 모두 셀프 호스팅 배포를 위한 완전한 오픈 웨이트입니다.
- 1,000만 토큰 컨텍스트 (Scout) - 전체 코드베이스를 한 번에 처리
- Llama 3.1 호환 라이선스 하의 완전한 오픈 웨이트
- 더 낮은 활성 파라미터 비용 (토큰당 17B vs 32B)
- 더 강력한 일반 지식 벤치마크 (MMLU Pro 80.5%)
- 클라우드 제공업체 및 프레임워크 전반의 폭넓은 생태계 지원
Kimi K2.6 선택
Kimi K2.6가 우위를 보이는 경우
Kimi K2.6는 에이전틱 코딩 작업과 웹 브라우징에서 뛰어납니다. 384개 전문가를 갖춘 1T 파라미터 규모와 MoonViT 400M을 통한 네이티브 비디오 이해는 복잡한 자율 워크플로에 강력한 선택입니다.
- SWE-Bench Pro 58.6% - 프론티어 에이전틱 코딩 성능
- BrowseComp 83.2% - 우수한 웹 브라우징 및 내비게이션
- HLE-Full 54.0% - 고난도 언어 평가에서 강력한 성능
- MoonViT 400M 인코더를 통한 네이티브 비디오 이해
- 깊은 전문화를 위한 384개 전문가 (8개 선택 + 1개 공유)
Llama 4 패밀리
더 많은 Llama 4 비교 및 모델 살펴보기
개별 Llama 4 모델을 자세히 살펴보거나 다른 프론티어 오픈 모델과 비교해 보세요.