Llama 4 Modelleri

İki model, bir aile - uzun bağlamdan sınır kalitesine

Llama 4 modelleri, Meta'nın bugüne kadarki en iddialı açık ağırlıklı sürümünü temsil eder. Bu aile, farklı öncelikler için tasarlanmış iki uzman karışımı mimarisi içerir: Scout, 16 uzman arasında 10 milyon token penceresiyle büyük bağlamı işlerken, Maverick 128 uzman ve 400B toplam parametreyle sınır sınıfı kalite sunar. İkisi de token başına 17B aktif parametre ve yerel çok modlu destek paylaşır, özel iş akışınız için bağlam uzunluğu ve çıktı kalitesi arasında doğru dengeyi seçme esnekliği sağlar.

Sohbete Başla Modelleri Karşılaştır

Tüm modeller

Llama 4 modellerinden doğru seçeneği seçin

Scout ve Maverick farklı senaryolar için optimize edilmiştir. Güçlü yönlerini anlamak, iş yükünüze uygun varyantı seçmenize yardımcı olur, ister tüm kod tabanlarını işleme ister en yüksek kalitede akıl yürütme ve kod üretme olsun.

Llama 4 Scout

10M bağlam penceresi - uzun bağlam uzmanı

Token başına 17B aktif ile 16 uzman arasında 109B toplam parametre. Öne çıkan özelliği, herhangi bir açık modelin en uzun bağlam penceresi olan 10 milyon token bağlam penceresidir. Scout, göreviniz tüm depolardan çok belgeli araştırma koleksiyonlarına kadar büyük bilgi hacimlerini tek seferde işlemenizi gerektirdiğinde parlar. İğne-kütle testleri, 8 milyon tokena kadar %95 erişim doğruluğunu onaylar.

Tek bir çağrıda tüm kod tabanlarını, çok belgeli araştırma setlerini veya çok uzun konuşma geçmişlerini işlemeniz gerektiğinde Scout'u seçin. Bağlam uzunluğu marjinal kalite farklarından daha önemli olduğunda en iyi seçenektir.

Scout'u Dene Daha fazla bilgi

Llama 4 Maverick

128 uzman, 400B parametre - kalite amiral gemisi

Token başına 17B aktif ile 128 uzman arasında 400B toplam parametre. Maverick, MMLU Pro, GPQA Diamond ve LiveCodeBench dahil önemli kıyaslamalarda GPT-4o'yu geçer. 128 uzmanlı mimari, alanlar arasında derin uzmanlık sağlar, bu da onu akıl yürütme, kodlama ve çok modlu görevler için mevcut en güçlü açık ağırlıklı model yapar. Çoğu üretim ihtiyacı için 1M token bağlam penceresi sunar.

Akıl yürütme, kodlama, çok modlu analiz ve karmaşık görev tamamlama için maksimum kaliteye ihtiyacınız olduğunda Maverick'i seçin. Bu sitedeki varsayılan sohbet modeli olmasının iyi bir nedeni var.

Maverick'i Dene Daha fazla bilgi

Uzun Bağlam

Llama 4 Scout

109B toplam, 17B aktif, 16 uzman. 10M token bağlam penceresi.

En iyi: tüm kod tabanları, çok belgeli analiz, uzun araştırma makaleleri, genişletilmiş konuşmalar.

Şimdi mevcut

Daha fazla bilgi İndir

Amiral Gemisi

Llama 4 Maverick

400B toplam, 17B aktif, 128 uzman. Kıyaslamalarda GPT-4o'yu geçer.

En iyi: karmaşık akıl yürütme, kod üretimi, çok modlu görevler, araştırma sentezi.

Şimdi mevcut

Daha fazla bilgi İndir

Paylaşılan yetenekler

Tüm Llama 4 modellerinin yapabilecekleri

Scout ve Maverick, Meta'nın uzman karışımı mimarisi üzerine kurulmuş ortak bir yetenek setini paylaşır. Bu paylaşılan temeller, entegrasyon kodunuzu değiştirmeden iki varyant arasında geçiş yapabileceğiniz anlamına gelir.

Yerel çok modlu

Her iki Llama 4 modeli de erken kaynaşma mimarisiyle metni ve görüntüleri yerel olarak işler. Görsel anlama baştan sona yerleşiktir, ayrı bir kodlayıcı olarak eklenmez. Bu, metinle birlikte ekran görüntüleri, diyagramlar ve belgeler dahil karışık içerik gönderebileceğiniz ve her iki modda tutarlı akıl yürütme alabileceğiniz anlamına gelir.

MoE verimliliği

Her iki Llama 4 modeli de büyük toplam parametre sayılarına rağmen token başına yalnızca 17B parametre etkinleştirir. Scout 109B toplamla 16 uzman kullanır, Maverick 400B toplamla 128 uzman kullanır. Bu seyrek yönlendirme stratejisi, eşdeğer yoğun mimarilerin bilgi işlem maliyetinin çok küçük bir kısmıyla güçlü performans sunar.

Fonksiyon çağırma

Her iki Llama 4 modelinde yerleşik fonksiyon çağırma, ek ince ayar olmadan ajan iş akışlarını sağlar. Araçlarınızı tanımlayın, model ne zaman ve nasıl çağıracağına karar verir. Bu, veritabanlarını sorgulayan, API'leri çağıran, kod çalıştıran ve işlemleri birbirine bağlayan otonom ajanlar oluşturmayı kolaylaştırır.

Genişletilmiş bağlam

Scout, aşırı uzun belge görevleri için 10M token bağlam penceresi sunarken, Maverick çoğu üretim senaryosu için 1M token sağlar. İkisi de önceki nesil modellerin 128K sınırını çok aşar, her istekte daha fazla bağlam, daha fazla örnek ve daha fazla geçmiş için alan verir.

Çok dilli

Her iki Llama 4 modelinde de güçlü çok dilli destek, küresel uygulamaları sağlar. Kullanıcılarınız İngilizce, Çince, İspanyolca, Fransızca veya diğer desteklenen dillerde iletişim kursa da, her iki varyant da kültürel olarak farkında yanıtlarla tutarlı kaliteyi korur.

Açık ağırlıklar

Her iki Llama 4 modeli de Llama 3.1 uyumlu lisans altında tamamen açık ağırlıklıdır. İstediğiniz her yerde dağıtın, özgürce değiştirin ve belirli ihtiyaçlarınıza göre ince ayar yapın. Bu açıklık, satıcı kilitlenmesi olmadan, model davranışına tam şeffaflık ve tamamen kendi altyapınızda çalıştırma yeteneği anlamına gelir.

Hızlı seçim kılavuzu

Llama 4 modellerinden hangisini seçmelisiniz?

Birincil kullanım durumunuzu doğru varyanta eşleştirin.

Scout'u ne zaman seçmeli

Çok uzun belgeleri işlemeniz gerektiğinde (10M token)
Yüzlerce dosya genelinde tüm kod tabanı analizi
Çok belgeli araştırma ve sentez
Genişletilmiş konuşma geçmişleri
Daha düşük bellek gereksinimleri (400B yerine 109B toplam)

Maverick'i ne zaman seçmeli

Maksimum kalite öncelik olduğunda
Karmaşık akıl yürütme ve bilimsel görevler
Kod üretimi ve hata ayıklama
Çok modlu analiz (ekran görüntüleri, diyagramlar)
Kıyaslama performansının en çok önemli olduğu görevler

Sohbete Başla Tüm kıyaslamaları görüntüle

Performans

Llama 4 modelleri genelinde tam kıyaslama karşılaştırması

Scout bağlam uzunluğu için optimize eder, Maverick ham kalite için. İkisi de tasarım hedeflerine göre güçlü performans sunar.

Llama 4 modelleri arasında seçim yapmak, birincil ihtiyacınıza indirgenir. İş akışınız tek bir çağrıda büyük metin, kod veya belge hacimlerini işlemeyi içeriyorsa, Scout'un 10M token bağlam penceresi eşsizdir. Akıl yürütme, kodlama veya çok modlu görevler için mümkün olan en yüksek kaliteye ihtiyacınız varsa, Maverick'in 128 uzmanlı mimarisi, en iyi tescilli tekliflerle rekabet eden sınır sınıfı sonuçlar sunar. Birçok ekip ikisini de kullanır: kalite kritik görevler için Maverick ve büyük ölçekli analiz için Scout.

Sohbete Başla Model kartını görüntüle

Llama 4 ailesi performans karşılaştırması

Maverick: %80.5 MMLU Pro, %73.4 MMMU, kodlamada GPT-4o'yu geçer

Scout: 10M token bağlam, 8M tokenda %95+ erişim

İkisi de: 17B aktif parametre, yerel çok modlu, fonksiyon çağırma

İkisi de: Llama 3.1 uyumlu lisans altında açık ağırlıklı

Tam karşılaştırma

Scout vs Maverick yan yana

Akıl yürütme, kodlama, çok modlu ve dağıtım metrikleri genelinde tam kıyaslama sonuçları.

Benchmark	Llama 4 Scout 16 uzman Uzun Bağlam	Llama 4 Maverick 128 uzman Kalite
MMLU Pro Bilgi ve akıl yürütme	%74.3	%80.5
GPQA Diamond Bilimsel bilgi	%57.2	%69.8
LiveCodeBench v5 Kodlama	%32.8	%43.4
MMMU Çok modlu	%69.4	%73.4
Bağlam Penceresi Maksimum token	10M	1M
Toplam Parametreler Model boyutu	109B	400B
Aktif Parametreler Token başına	17B	17B
Uzman Sayısı MoE yönlendirme	16	128

Meta'nın resmi model kartından ve bağımsız değerlendirmelerden veriler.

Scout

Llama 4 Scout: bağlam uzunluğu her şey olduğunda

Scout'un 10M token bağlam penceresi, Llama 4 modelleri ve tüm açık ağırlıklı manzara genelinde eşsizdir. Tek bir çağrıda tüm kod tabanlarını, çok belgeli araştırma setlerini ve saatlerce transkripsiyonu işleyebilir. Göreviniz çok uzun girdileri içeriyorsa, Scout açık seçimdir.

10M token bağlam, bugün mevcut herhangi bir açık modelin en uzun
İğne-kütle testlerinde 8M tokenda %95+ erişim doğruluğu
Token başına 17B aktif ile 16 uzman arasında 109B toplam parametre
Kapsamlı kod incelemesi için tüm GitHub depolarını işleyin
Hukuki belge analizi, araştırma sentezi ve denetim iş akışları için ideal

Scout'u Dene Scout detayları

Maverick

Llama 4 Maverick: kalite öncelik olduğunda

Maverick'in 128 uzmanlı mimarisi, önemli kıyaslamalarda GPT-4o'yu geçen sınır sınıfı performans sunar. Bu sitedeki varsayılan model olmasının iyi bir nedeni var: karmaşık akıl yürütme, kodlama ve çok modlu görevleri, en iyi tescilli alternatiflerden bekleyeceğiniz kaliteyle ele alır.

Sınır sınıfı bilgi ve akıl yürütme için %80.5 MMLU Pro
LiveCodeBench v5'te %43.4 ile kodlama kıyaslamalarında GPT-4o'yu geçer
Derin alan uzmanlığı için 128 uzman arasında 400B toplam parametre
Görüntüler ve belgeler için güçlü çok modlu anlama ile MMMU'da %73.4
Otonom ajan iş akışları oluşturmak için yerel fonksiyon çağırma

Maverick'i Dene Maverick detayları

Seçim Kılavuzu

Llama 4 modellerinden doğru seçeneği seçmek

Llama 4 modelleri arasında seçim yapmak, özel iş akışınız için en çok neyin önemli olduğuna bağlıdır. İkisi de aynı 17B aktif parametre ayak izini ve yerel çok modlu desteği paylaşır, bu yüzden karar bağlam uzunluğu ile çıktı kalitesine indirgenir. Birçok ekip, boru hatlarının farklı bölümleri için her iki varyantı kullanmanın değerini bulur.

Aynı anda 1 milyondan fazla token işlemeyi gerektiren görevler için Scout'u seçin
Çıktı kalitesi ve akıl yürütme derinliği en çok önemli olduğunda Maverick'i seçin
İkisi de 17B aktif parametre paylaşır, bu yüzden token başına çıkarım maliyeti karşılaştırılabilir
Alım ve analiz için Scout, sentez ve üretim için Maverick kullanın
İkisi de aynı açık ağırlıklı lisans altında çalışır, bu yüzden istediğinizi veya ikisini de özgürce dağıtabilirsiniz

Şimdi dene

Llama 4 ile sohbet etmeye başla

Sohbet arayüzümüz aracılığıyla her iki modeli anında dene.

Sohbete Başla

Llama 4 modelleriyle anında sohbet et, kurulum gerekmez

Model kartı

Her iki varyant için tam teknik özellikler

Dokümantasyon

Entegrasyon kılavuzları ve en iyi uygulamalar

İndir

Model ağırlıklarını al

Herhangi bir Llama 4 varyantı için resmi ağırlıkları indir.

Hugging Face

Tüm Llama 4 model depoları

Ollama

Ollama ile her iki varyantı yerel olarak çalıştır

GitHub

Kaynak kodu ve örnekler

SSS

Llama 4 modelleri hakkında sıkça sorulan sorular

Projeleriniz için Llama 4 modellerini seçme, çalıştırma ve dağıtma hakkında en yaygın soruların yanıtları.

Şu anda kaç Llama 4 modeli mevcut?

Şu anda iki Llama 4 modeli var: Scout ve Maverick. Her biri iki varyant olarak gelir, sohbet ve görev tamamlama için optimize edilmiş talimat ayarlı bir versiyon ve ince ayar ve araştırma için temel önceden eğitilmiş bir versiyon. Bu, hazır kullanımlı konuşmalı bir model mi yoksa özel eğitim için bir temel mi istediğinize bağlı olarak arasından seçim yapabileceğiniz dört toplam kontrol noktası verir.

Kodlama görevleri için hangi Llama 4 modeli en iyi?

Maverick, kodlama görevleri için daha güçlü bir seçimdir. LiveCodeBench v5'te %43.4 puan alarak hem Scout'u (%32.8) hem de GPT-4o'yu (%37.0) geçer. 128 uzmanlı mimari, programlama dilleri ve çerçeveler arasında derin uzmanlık sağlar. Ancak, aynı anda büyük bir kod tabanının tamamını analiz etmeniz gerekiyorsa, Scout'un 10M token bağlam penceresi, çapraz dosya analizi için her şeyi tek bir çağrıya yüklemenizi sağlar.

Herhangi bir Llama 4 modelini tüketici GPU'sunda çalıştırabilir miyim?

Tam versiyonları çalıştırmak çoklu GPU kurulumları gerektirir. Scout tam hassasiyette yaklaşık 220 GB VRAM, Maverick ise yaklaşık 800 GB gerektirir. Ancak, kuantize versiyonlar bu gereksinimleri önemli ölçüde azaltır. INT4 kuantizasyon ile Scout yaklaşık 55 GB'a sığabilir, bu da üst düzey tüketici GPU'larıyla elde edilebilir. INT4 ile Maverick hala yaklaşık 200 GB gerektirir, bu da onu bulut veya kurumsal donanıma daha uygun hale getirir.

Llama 4 ailesinde Scout ve Maverick arasındaki fark nedir?

Scout, 10M token penceresi ve 16 uzmanla (109B toplam parametre) uzun bağlam görevleri için optimize edilmiştir. Maverick, 128 uzman ve 400B toplam parametreyle ham kaliteyi önceliklendirir ancak 1M token bağlam penceresi vardır. İkisi de token başına 17B parametre etkinleştirir. Scout'u geniş açılı lens, Maverick'i aynı kamera sistemindeki yüksek çözünürlüklü lens olarak düşünün.

Tüm Llama 4 modelleri ücretsiz ve açık ağırlıklı mı?

Evet. Tüm Llama 4 modelleri, ticari kullanıma, ince ayara ve yeniden dağıtıma izin veren Llama 3.1 uyumlu lisans altında yayınlanmıştır. Bunları kendi altyapınızda dağıtabilir, üzerine ürünler inşa edebilir ve belirli ihtiyaçlarınıza göre ağırlıkları değiştirebilirsiniz. Lisans, yüz milyonlarca kullanıcıya hizmet eden çok büyük ölçekli dağıtımlar için kullanım eşikleri içerir.

Belge analizi için hangi Llama 4 modelini seçmeliyim?

Bu, belgelerinizin hacmine ve karmaşıklığına bağlıdır. Tek bir geçişte büyük belge koleksiyonlarını, sözleşmeleri veya araştırma makalelerini analiz etmek için, Scout'un 10M token bağlam penceresi idealdir. En yüksek kalitede çıkarma, özetleme veya akıl yürütme gerektiren daha kısa belgeler için, Maverick'in 128 uzmanlı mimarisi daha nüanslı ve doğru sonuçlar üretir. İkisi de grafikler, tablolar ve diyagramlar içeren belgeler için yerel görüntü anlama destekler.

Llama 4 Ailesi