Про подписку на чатгпт за 200 баксов
Я, вроде, обещал рассказать о результатах эксперимента с подпиской на чатгпт за 200 баксов. Итак, месяц прошёл, пришло время результатов.
THE GOOD:
- o1 — это неплохая модель. Она нормально пишет код, хоть и ленивая, зараза такая. Она прекрасно понимает русский и нормально на нём пишет, она умеет решать сложные задачки и пользоваться канвасом. Она не находится на каком-то недостижимом для конкурентов уровне, но это хорошая модель.
- 4.5 — это тоже неплохая модель. На большинстве промптов она неотличима от GPT-4o, но иногда есть промпты, в которых она выигрывает. В про подписке лимитов на неё нет, она бесплатная (а не за 150 баксов в апи), так что (почти) нет причин ей не пользоваться.
- Если надо что-то по быстрому погуглить, есть web search, который включается отдельной кнопкой. Это удобно, потому что в остальных моделях это тул, который иногда срабатывает, а иногда нет.
- ПОТРЯСАЮЩИЙ Deep Research режим. Я не скажу, что аналоги от конкурентов мне не нравятся, но у опенаи он действительно сделан на абсолютно другом уровне. Это тот самый moat, которого больше нет ни у кого.
- Сам по себе advanced voice mode мне не очень актуален, плюс, модель сильно тупеет, если с ней общаться голосом, но иногда попользоваться было прикольно.
THE BAD:
- Я не поймал вайб o3-mini-high. Кто-то на неё молится, но мне показалось, что это просто ещё более ленивая версия o1. Пользовался только для веб сёрча.
- Я совершенно не понял прикола o1-pro. На моих промптах я не смог отличить её от обычной o1 — где o1 лажала, лажала и o1-pro, только думала дольше. Возможно, я как-то неправильно её промптил, или просто задачи у меня какие-то не такие, но мне всё равно не понравилось.
- Канвас неудобный. Во-первых, не все модели с ним работают, только 4.5, 4o и o1. Если по какой-то причине начал общаться через o3-mini-high, то канвас открыть не получится. Кроме того, там всегда есть только одна вкладка с одним файлом — вайбкодить не так удобно. Лучший канвас всё ещё у Mistral, хоть там моделька и туповата, но работа с несколькими файлами там слишком хорошо сделана.
- Я не очень большой пользователь генерации картинок, но Dalle хуже Flux у Mistral. Интерфейс тоже багованный — например, если попросить нарисовать стол, а потом на столе обвести мышкой кружочек и попросить нарисовать там вазу, она либо не рисовалась, либо рисовалась не там, где надо. Сегодня, правда, вышел режим, где
картинки генерирует 4o (то, что анонсировали ещё год назад), но подписка у меня уже закончилась.
- Sora ужасно понимает физику и видосы получались у меня стрёмненькие. Скину примеры гифками.
- Operator смешной, но бестолковый, руками проще и быстрее. Думаю, что будущее за банальным файликом agents.txt в корне вебсайта со списком доступных для агента эндпоинтов, а не за подобными мультимодальными штуками.
THE UGLY:
- Качество сервиса ужасно. Может быть, проблема в том, что я в России и у меня хреновый впн, но примерно в половине случаев 4.5 и o1 висли ещё до генерации первого токена с вечным белым кружком, мол, "ща будет".
- В o1-pro и в дип ресёрче криво работал прогрессбар, зависая, когда всё давно уже досчиталось. Чтобы обновить, приходилось переоткрывать приложение или обновлять вкладку.
- Скорость генерации и ttft очень плохие. Вкупе с тем, что модели иногда висли, терялось очень много времени, а итерироваться становилось сложнее. Из-за ожидания продуктивность у меня настолько упала, что я в какой-то момент перешёл на более слабые, но более быстрые модели (Flash Thinking/Flash 2.0/Mistral Large), чтобы всё таки делать свою работу, а не листать реддит, ожидая генерации.
- Цена абсолютно грабительская. За 200 баксов можно купить неплохие наушники, 100 порций шаурмы, четыре алисы лайт для мультирум стереопары, пять лет премиума для телеги, или бутылку очень хорошего виски.
То, что предлагается в ChatGPT Pro совершенно не соответствует стоимости — модели там не настолько лучше конкурентов и после конца подписки я банально не заметил разницы в продуктивности. OpenAI has no moat.