Llama 4 Modelleri
İki model, bir aile - uzun bağlamdan sınır kalitesine
Llama 4 modelleri, Meta'nın bugüne kadarki en iddialı açık ağırlıklı sürümünü temsil eder. Bu aile, farklı öncelikler için tasarlanmış iki uzman karışımı mimarisi içerir: Scout, 16 uzman arasında 10 milyon token penceresiyle büyük bağlamı işlerken, Maverick 128 uzman ve 400B toplam parametreyle sınır sınıfı kalite sunar. İkisi de token başına 17B aktif parametre ve yerel çok modlu destek paylaşır, özel iş akışınız için bağlam uzunluğu ve çıktı kalitesi arasında doğru dengeyi seçme esnekliği sağlar.
Tüm modeller
Llama 4 modellerinden doğru seçeneği seçin
Scout ve Maverick farklı senaryolar için optimize edilmiştir. Güçlü yönlerini anlamak, iş yükünüze uygun varyantı seçmenize yardımcı olur, ister tüm kod tabanlarını işleme ister en yüksek kalitede akıl yürütme ve kod üretme olsun.
Llama 4 Scout
10M bağlam penceresi - uzun bağlam uzmanı
Token başına 17B aktif ile 16 uzman arasında 109B toplam parametre. Öne çıkan özelliği, herhangi bir açık modelin en uzun bağlam penceresi olan 10 milyon token bağlam penceresidir. Scout, göreviniz tüm depolardan çok belgeli araştırma koleksiyonlarına kadar büyük bilgi hacimlerini tek seferde işlemenizi gerektirdiğinde parlar. İğne-kütle testleri, 8 milyon tokena kadar %95 erişim doğruluğunu onaylar.
Tek bir çağrıda tüm kod tabanlarını, çok belgeli araştırma setlerini veya çok uzun konuşma geçmişlerini işlemeniz gerektiğinde Scout'u seçin. Bağlam uzunluğu marjinal kalite farklarından daha önemli olduğunda en iyi seçenektir.
Llama 4 Maverick
128 uzman, 400B parametre - kalite amiral gemisi
Token başına 17B aktif ile 128 uzman arasında 400B toplam parametre. Maverick, MMLU Pro, GPQA Diamond ve LiveCodeBench dahil önemli kıyaslamalarda GPT-4o'yu geçer. 128 uzmanlı mimari, alanlar arasında derin uzmanlık sağlar, bu da onu akıl yürütme, kodlama ve çok modlu görevler için mevcut en güçlü açık ağırlıklı model yapar. Çoğu üretim ihtiyacı için 1M token bağlam penceresi sunar.
Akıl yürütme, kodlama, çok modlu analiz ve karmaşık görev tamamlama için maksimum kaliteye ihtiyacınız olduğunda Maverick'i seçin. Bu sitedeki varsayılan sohbet modeli olmasının iyi bir nedeni var.
Uzun Bağlam
Llama 4 Scout
109B toplam, 17B aktif, 16 uzman. 10M token bağlam penceresi.
En iyi: tüm kod tabanları, çok belgeli analiz, uzun araştırma makaleleri, genişletilmiş konuşmalar.
Amiral Gemisi
Llama 4 Maverick
400B toplam, 17B aktif, 128 uzman. Kıyaslamalarda GPT-4o'yu geçer.
En iyi: karmaşık akıl yürütme, kod üretimi, çok modlu görevler, araştırma sentezi.
Paylaşılan yetenekler
Tüm Llama 4 modellerinin yapabilecekleri
Scout ve Maverick, Meta'nın uzman karışımı mimarisi üzerine kurulmuş ortak bir yetenek setini paylaşır. Bu paylaşılan temeller, entegrasyon kodunuzu değiştirmeden iki varyant arasında geçiş yapabileceğiniz anlamına gelir.
Yerel çok modlu
Her iki Llama 4 modeli de erken kaynaşma mimarisiyle metni ve görüntüleri yerel olarak işler. Görsel anlama baştan sona yerleşiktir, ayrı bir kodlayıcı olarak eklenmez. Bu, metinle birlikte ekran görüntüleri, diyagramlar ve belgeler dahil karışık içerik gönderebileceğiniz ve her iki modda tutarlı akıl yürütme alabileceğiniz anlamına gelir.
MoE verimliliği
Her iki Llama 4 modeli de büyük toplam parametre sayılarına rağmen token başına yalnızca 17B parametre etkinleştirir. Scout 109B toplamla 16 uzman kullanır, Maverick 400B toplamla 128 uzman kullanır. Bu seyrek yönlendirme stratejisi, eşdeğer yoğun mimarilerin bilgi işlem maliyetinin çok küçük bir kısmıyla güçlü performans sunar.
Fonksiyon çağırma
Her iki Llama 4 modelinde yerleşik fonksiyon çağırma, ek ince ayar olmadan ajan iş akışlarını sağlar. Araçlarınızı tanımlayın, model ne zaman ve nasıl çağıracağına karar verir. Bu, veritabanlarını sorgulayan, API'leri çağıran, kod çalıştıran ve işlemleri birbirine bağlayan otonom ajanlar oluşturmayı kolaylaştırır.
Genişletilmiş bağlam
Scout, aşırı uzun belge görevleri için 10M token bağlam penceresi sunarken, Maverick çoğu üretim senaryosu için 1M token sağlar. İkisi de önceki nesil modellerin 128K sınırını çok aşar, her istekte daha fazla bağlam, daha fazla örnek ve daha fazla geçmiş için alan verir.
Çok dilli
Her iki Llama 4 modelinde de güçlü çok dilli destek, küresel uygulamaları sağlar. Kullanıcılarınız İngilizce, Çince, İspanyolca, Fransızca veya diğer desteklenen dillerde iletişim kursa da, her iki varyant da kültürel olarak farkında yanıtlarla tutarlı kaliteyi korur.
Açık ağırlıklar
Her iki Llama 4 modeli de Llama 3.1 uyumlu lisans altında tamamen açık ağırlıklıdır. İstediğiniz her yerde dağıtın, özgürce değiştirin ve belirli ihtiyaçlarınıza göre ince ayar yapın. Bu açıklık, satıcı kilitlenmesi olmadan, model davranışına tam şeffaflık ve tamamen kendi altyapınızda çalıştırma yeteneği anlamına gelir.
Hızlı seçim kılavuzu
Llama 4 modellerinden hangisini seçmelisiniz?
Birincil kullanım durumunuzu doğru varyanta eşleştirin.
Scout'u ne zaman seçmeli
- Çok uzun belgeleri işlemeniz gerektiğinde (10M token)
- Yüzlerce dosya genelinde tüm kod tabanı analizi
- Çok belgeli araştırma ve sentez
- Genişletilmiş konuşma geçmişleri
- Daha düşük bellek gereksinimleri (400B yerine 109B toplam)
Maverick'i ne zaman seçmeli
- Maksimum kalite öncelik olduğunda
- Karmaşık akıl yürütme ve bilimsel görevler
- Kod üretimi ve hata ayıklama
- Çok modlu analiz (ekran görüntüleri, diyagramlar)
- Kıyaslama performansının en çok önemli olduğu görevler
Performans
Llama 4 modelleri genelinde tam kıyaslama karşılaştırması
Scout bağlam uzunluğu için optimize eder, Maverick ham kalite için. İkisi de tasarım hedeflerine göre güçlü performans sunar.
Llama 4 modelleri arasında seçim yapmak, birincil ihtiyacınıza indirgenir. İş akışınız tek bir çağrıda büyük metin, kod veya belge hacimlerini işlemeyi içeriyorsa, Scout'un 10M token bağlam penceresi eşsizdir. Akıl yürütme, kodlama veya çok modlu görevler için mümkün olan en yüksek kaliteye ihtiyacınız varsa, Maverick'in 128 uzmanlı mimarisi, en iyi tescilli tekliflerle rekabet eden sınır sınıfı sonuçlar sunar. Birçok ekip ikisini de kullanır: kalite kritik görevler için Maverick ve büyük ölçekli analiz için Scout.
Maverick: %80.5 MMLU Pro, %73.4 MMMU, kodlamada GPT-4o'yu geçer
Scout: 10M token bağlam, 8M tokenda %95+ erişim
İkisi de: 17B aktif parametre, yerel çok modlu, fonksiyon çağırma
İkisi de: Llama 3.1 uyumlu lisans altında açık ağırlıklı
Tam karşılaştırma
Scout vs Maverick yan yana
Akıl yürütme, kodlama, çok modlu ve dağıtım metrikleri genelinde tam kıyaslama sonuçları.
| Benchmark | Llama 4 Scout 16 uzman Uzun Bağlam | Llama 4 Maverick 128 uzman Kalite |
|---|---|---|
MMLU Pro Bilgi ve akıl yürütme | %74.3 | %80.5 |
GPQA Diamond Bilimsel bilgi | %57.2 | %69.8 |
LiveCodeBench v5 Kodlama | %32.8 | %43.4 |
MMMU Çok modlu | %69.4 | %73.4 |
Bağlam Penceresi Maksimum token | 10M | 1M |
Toplam Parametreler Model boyutu | 109B | 400B |
Aktif Parametreler Token başına | 17B | 17B |
Uzman Sayısı MoE yönlendirme | 16 | 128 |
Meta'nın resmi model kartından ve bağımsız değerlendirmelerden veriler.
Scout
Llama 4 Scout: bağlam uzunluğu her şey olduğunda
Scout'un 10M token bağlam penceresi, Llama 4 modelleri ve tüm açık ağırlıklı manzara genelinde eşsizdir. Tek bir çağrıda tüm kod tabanlarını, çok belgeli araştırma setlerini ve saatlerce transkripsiyonu işleyebilir. Göreviniz çok uzun girdileri içeriyorsa, Scout açık seçimdir.
- 10M token bağlam, bugün mevcut herhangi bir açık modelin en uzun
- İğne-kütle testlerinde 8M tokenda %95+ erişim doğruluğu
- Token başına 17B aktif ile 16 uzman arasında 109B toplam parametre
- Kapsamlı kod incelemesi için tüm GitHub depolarını işleyin
- Hukuki belge analizi, araştırma sentezi ve denetim iş akışları için ideal
Maverick
Llama 4 Maverick: kalite öncelik olduğunda
Maverick'in 128 uzmanlı mimarisi, önemli kıyaslamalarda GPT-4o'yu geçen sınır sınıfı performans sunar. Bu sitedeki varsayılan model olmasının iyi bir nedeni var: karmaşık akıl yürütme, kodlama ve çok modlu görevleri, en iyi tescilli alternatiflerden bekleyeceğiniz kaliteyle ele alır.
- Sınır sınıfı bilgi ve akıl yürütme için %80.5 MMLU Pro
- LiveCodeBench v5'te %43.4 ile kodlama kıyaslamalarında GPT-4o'yu geçer
- Derin alan uzmanlığı için 128 uzman arasında 400B toplam parametre
- Görüntüler ve belgeler için güçlü çok modlu anlama ile MMMU'da %73.4
- Otonom ajan iş akışları oluşturmak için yerel fonksiyon çağırma
Seçim Kılavuzu
Llama 4 modellerinden doğru seçeneği seçmek
Llama 4 modelleri arasında seçim yapmak, özel iş akışınız için en çok neyin önemli olduğuna bağlıdır. İkisi de aynı 17B aktif parametre ayak izini ve yerel çok modlu desteği paylaşır, bu yüzden karar bağlam uzunluğu ile çıktı kalitesine indirgenir. Birçok ekip, boru hatlarının farklı bölümleri için her iki varyantı kullanmanın değerini bulur.
- Aynı anda 1 milyondan fazla token işlemeyi gerektiren görevler için Scout'u seçin
- Çıktı kalitesi ve akıl yürütme derinliği en çok önemli olduğunda Maverick'i seçin
- İkisi de 17B aktif parametre paylaşır, bu yüzden token başına çıkarım maliyeti karşılaştırılabilir
- Alım ve analiz için Scout, sentez ve üretim için Maverick kullanın
- İkisi de aynı açık ağırlıklı lisans altında çalışır, bu yüzden istediğinizi veya ikisini de özgürce dağıtabilirsiniz
Şimdi dene
Llama 4 ile sohbet etmeye başla
Sohbet arayüzümüz aracılığıyla her iki modeli anında dene.
İndir
Model ağırlıklarını al
Herhangi bir Llama 4 varyantı için resmi ağırlıkları indir.
SSS
Llama 4 modelleri hakkında sıkça sorulan sorular
Projeleriniz için Llama 4 modellerini seçme, çalıştırma ve dağıtma hakkında en yaygın soruların yanıtları.
Şu anda iki Llama 4 modeli var: Scout ve Maverick. Her biri iki varyant olarak gelir, sohbet ve görev tamamlama için optimize edilmiş talimat ayarlı bir versiyon ve ince ayar ve araştırma için temel önceden eğitilmiş bir versiyon. Bu, hazır kullanımlı konuşmalı bir model mi yoksa özel eğitim için bir temel mi istediğinize bağlı olarak arasından seçim yapabileceğiniz dört toplam kontrol noktası verir.
Maverick, kodlama görevleri için daha güçlü bir seçimdir. LiveCodeBench v5'te %43.4 puan alarak hem Scout'u (%32.8) hem de GPT-4o'yu (%37.0) geçer. 128 uzmanlı mimari, programlama dilleri ve çerçeveler arasında derin uzmanlık sağlar. Ancak, aynı anda büyük bir kod tabanının tamamını analiz etmeniz gerekiyorsa, Scout'un 10M token bağlam penceresi, çapraz dosya analizi için her şeyi tek bir çağrıya yüklemenizi sağlar.
Tam versiyonları çalıştırmak çoklu GPU kurulumları gerektirir. Scout tam hassasiyette yaklaşık 220 GB VRAM, Maverick ise yaklaşık 800 GB gerektirir. Ancak, kuantize versiyonlar bu gereksinimleri önemli ölçüde azaltır. INT4 kuantizasyon ile Scout yaklaşık 55 GB'a sığabilir, bu da üst düzey tüketici GPU'larıyla elde edilebilir. INT4 ile Maverick hala yaklaşık 200 GB gerektirir, bu da onu bulut veya kurumsal donanıma daha uygun hale getirir.
Scout, 10M token penceresi ve 16 uzmanla (109B toplam parametre) uzun bağlam görevleri için optimize edilmiştir. Maverick, 128 uzman ve 400B toplam parametreyle ham kaliteyi önceliklendirir ancak 1M token bağlam penceresi vardır. İkisi de token başına 17B parametre etkinleştirir. Scout'u geniş açılı lens, Maverick'i aynı kamera sistemindeki yüksek çözünürlüklü lens olarak düşünün.
Evet. Tüm Llama 4 modelleri, ticari kullanıma, ince ayara ve yeniden dağıtıma izin veren Llama 3.1 uyumlu lisans altında yayınlanmıştır. Bunları kendi altyapınızda dağıtabilir, üzerine ürünler inşa edebilir ve belirli ihtiyaçlarınıza göre ağırlıkları değiştirebilirsiniz. Lisans, yüz milyonlarca kullanıcıya hizmet eden çok büyük ölçekli dağıtımlar için kullanım eşikleri içerir.
Bu, belgelerinizin hacmine ve karmaşıklığına bağlıdır. Tek bir geçişte büyük belge koleksiyonlarını, sözleşmeleri veya araştırma makalelerini analiz etmek için, Scout'un 10M token bağlam penceresi idealdir. En yüksek kalitede çıkarma, özetleme veya akıl yürütme gerektiren daha kısa belgeler için, Maverick'in 128 uzmanlı mimarisi daha nüanslı ve doğru sonuçlar üretir. İkisi de grafikler, tablolar ve diyagramlar içeren belgeler için yerel görüntü anlama destekler.
Llama 4 Ailesi
Her modeli keşfet ve rakiplerle karşılaştır
Her varyanta daha derin dalın veya Llama 4 modellerinin diğer sınır açık modellerle nasıl karşılaştığını görün.
Başlangıç
Llama 4 modelleri arasından ideal seçeneğinizi bulun
Her iki varyantla da ücretsiz sohbet etmeye başlayın veya yerel dağıtım için ağırlıkları indirin. İkisi de açık ağırlıklı ve kullanıma hazır.