Битва за господство на рынке ИИ продолжается и кто назначен ответственным за поиск истинны ?
В начале месяца в открытый доступ выведен DeepSeek, на неделю обрушивший рынки США.
На этой неделе Илон Маск запустил в публичный доступ новую языковую модель - Grok 3
По предварительным тестам думающая Grok 3 Reasoning Beta достигает феноменальных показателей в бенчмарках.
Интегральный показатель производительности ГИИ вывел Grok 3 Reasoning Beta на уверенное 1 место среди публичных моделей с 67 баллами опережая DeepSeekR1 с 60.
Обычные (не рассуждающие модели) также выводят в лидеры Grok-3 с 53 баллами, опережая формально лучшую из публичных «обычных» LLM – Gemini 2.0 PRO - 47, следом идет DeepSeek V3 – 46, крайне устаревшая ChatGPT-4o – 41.
Плотность конкуренции феноменальная, разрывы минимальные, все решает гибкость LLM, глубина настройки и умение решать специфические задачи.
Идеальных LLM не существует, у каждой есть сильные и слабые стороны, поэтому лучше использовать комбинацию LLMs под разные типы задач.
По формальным показателям, Grok-3 это лучшая из существующих LLM в сопоставимой категории, как среди думающих, так и среди «обычных», хотя не самая лучшая, т.к более сильная модель – это OpenAI o3, которая в ограниченной версии за 200 баксов в месяц, но ее сложно назвать публичной.
Илон Маск начал позже всех, выпуская относительно слабые LLM (в сравнении с конкурентами), но сумел всех обогнать, подчеркивая экстраординарный темп инноваций в этой индустрии.
Grok 3 использует архитектуру Mixture-of-Experts (MoE), что позволяет стратегически активировать подмножества параметров для различных задач, что делает его эффективнее в обработке и анализе данных. Он включает в себя 314 миллиардов параметров, что делает его крупнейшей из доступных моделей, хотя не самую крупную, но качество модели не имеет линейную зависимость от количества параметров, очень много факторов влияет.
Для обучения Grok 3 использовался суперкомпьютер Colossus, оснащенный 200 тысячами графических процессоров Nvidia H100.
В Grok 3 были введены новые функции, такие как режимы Think и Big Brain для сложных задач, а также инструмент DeepSearch для анализа информации из интернета и из социальной сети X. Также были добавлены возможности генерации изображений и голосового режима.
Илон Маск подчеркнул:
Grok 3 ориентирован на "поиск истины", даже если она идет вразрез с политкорректностью, стремясь к политическому нейтралитету.
Екатерина Ледокол сообщила:
Библейский сюжет от Маска:
Поиск истины. Заслуживает внимание. Это именно то, что привлекает внимание крупных инвесторов
Развертывание функционала будет идти на протяжении 2-3 месяцев.
Интересно, чем ответят конкуренты?
Google уже ничем не ответит до середины лета, когда выкатит промежуточную Gemini 2.5, теперь ждем Llama 4, Claude 4 и возможно OpenAI GPT 4.5 Orion.
Инсайдеры сообщают, что Microsoft активно наращивает серверные мощности для OpenAI. Это говорит о том, что релиз GPT-4.5 и GPT-5 уже на финальной стадии и состоится совсем скоро. Однако важно понять, как он сможет обогнать сегодняшних фаворитов?
Буквально один месяц и можно оказаться за бортом.
Кто из отечественных игроков будет отвечать за истину? Сбер в коллаборации с DeepSeek, об сообщало Reuters.
Подробнее
в статье.Больше аналитики в нашем ТГ
@gvsummit