Добавили Llama 4 Maverick и Llama 4 Scout на
llmarena.ruВышли две новые модели с открытыми весами:
Llama 4 Scout и Llama 4 Maverick — обе мультимодальные, обе на MoE, обе 🔥
Что нового и крутого:
— 10М контекста у Scout — да, 10 миллионов токенов, и модель тянет это с качеством
— Мультимодальность из коробки: текст, картинки, видео, всё в одной архитектуре
— Llama 4 Scout — 17B активных параметров / 109B общих (16 экспертов), работает на одном H100
— Llama 4 Maverick — 17B активных / 400B общих (128 экспертов), уделывает GPT-4o и Gemini 2.0 Flash на бенчмарках
— В основе — Behemoth (ещё в обучении): 288B активных / 2T общих
Обе модели мощно посттренились:
— Сложные данные, онлайн RL, мягкий DPO
— Вычищены «лёгкие» примеры — упор на reasoning, код, математику
— Scout отлично держит длинный контекст (10М) + iRoPE архитектура
— Maverick — топ в мультимодальности и диалогах
Где трогать:
—
Hugging Face
—
Блогпост
—
llmarena.ru
Модели доступны совершенно бесплатно как в публичной, так и в анонимной арене, го тестировать!