Сравнил лучшие ИИ на рынке для своих повседневных задач и вот, что понял
Маск, Гугл и китайцы сделали круто. Claude – скрытый алмаз. Альтман сдает позиции.
Я проверил, как шесть самых популярных ИИ-платформ справляются с повседневными задачами работников медиа, социальных наук и аналитики/консалтинга. Я скормил каждой по три выверенных промта для решения следующих задач:
1. Нарыть хороших исследований и подробно ответить на несколько задротских вопросов по теме одного из наших будущих видео
2. Найти лакуны в работах по поколению альфа, подготовить несколько ресерч-дизайнов и посоветовать, где искать литературу
3. Решить бизнес-кейс по расширению оптоволоконной сети в Германии. Кейс реальный, решение лежит в интернете – использовать его я запретил.
Вот, что получилось.
Claude (Anthropic)
Важное уточнение: Клод недавно получил доступ в интернет, но у меня (как и у многих юзеров) он пока не появился. Задания отрабатывались на встроенных датасетах.
Он дал мне 15 хороших исследований. Отчет выдал без воды, при этом подробно и с объяснениями. Лакуны в ресерчах нашел, дизайны сделал так себе, но стратегию поиска литературы прописал как надо. Кейс решил хорошо и навалил деталей сверху – с этим справились почти все ИИ.
Клод хорошо пишет по-русски и поймет вас, как бы плохо вы не сформулировали промт. Из минусов: интернет, нежелание выдавать длинные ответы и быстрый расход лимитов на число запросов – они быстро иссякают даже в платной версии.
Цена за месяц – 1800 руб. Оценка – 7,5/10
ChatGPT (OpenAI)
Базовый модель о4 с поиском и анализом справилась очень плохо: ответы – куцые и без объяснений. Но режим DeepSearch – очень хорош (число запросов ограничено).
Ресерч-дизайны – вполне себе, советы по поиску работ дал под каждую тему. Темы придумал узкие и конкретные, но при этом – блеклые и неинтересные.
Кажется, в базовом ГПТ низкое качество ответов должно компенсироваться неограниченностью запросов.
Цена за месяц – 1800 руб. Оценка – 8/10
Grok (xAI)
Grok 3 – сильная модель.
В режиме DeepSearch информации собирает прям много, а отвечает – подробно и объяснительно. Одна проблема: ждать ответа в этом режиме пришлось 68 минут (баг, произошедший единожды). С ресерч-дизайнами справился немного хуже Клода. Темы и стратегии – на уровне.
С бизнес-консультацией Grok справился лучше всех: расчеты были близки к верным, а решения по комплексности превзошли правильный ответ.
Но лимиты free-версии осязаемы – буквально 10-20 запросов в день.
Цена за месяц – 2700-4500 руб. Оценка – 8/10
Google AI Studio (Google AI)
Сначала был настроен скептически: в моей голове Гугл и ИИ – понятия плохо совместимые.
Я ошибался.
В поиске и анализе Gemini 2.0 Flash показал себя лучше всех – много источников, все суперподробно и сверхобъяснительно. Удивительно, Гугл прекрасно умеет гуглить.
Дизайны – на уровне Клода и Грока, но расписаны в два раза шире.
Цена за месяц – 1800 руб. Оценка – 8,5/10
Perplexity (Perplexity AI, Inc.)
Этот ИИ работает в РФ и включает несколько моделей, в том числе Грок, GPT, Клод и Дипсик.
В том, что касается поиска и анализа – в хорошем смысле лаконичен: идеальное решение, если нужно быстро вкатится в тему и пойти по ссылкам – их он насыпает щедро. Ресерч-дизайны выполнены на уровне, рекомендации по поиску литературы – немного хуже.
А вот для бизнес-консультантов бот не подойдет: здесь лаконичность становится проблемой – общим принципам решения кейсов соответствует, но не более того.
Цена за месяц – 1800 руб. Оценка – 7/10
DeepSeek (High-Flyer)
Инвесторы в США не зря занервничали, когда китайцы его выпустили.
Со всеми заданиями бот справился качественно – на уровне Grok и Gemini: такой же подробный, но менее объяснительный. И советы по поиску литературы будут похуже. Из плюсов – 1) он бесплатный; 2) не надо обходить блокировки. Из минусов –
Цена за месяц – 0 руб. Оценка – 8/10
Итог
Любой из ИИ-инструментов выше может быть эффективным. Вопрос лишь в том, сколько запросов, времени и денег на это уйдет. Ну и есть ли у вас хоть какая-то гипотеза насчет результатов.