Рисует. Понимает. Исправляет.
Теперь ChatGPT умеет не только писать, но и рисовать сам. Без “посредников” вроде DALL·E.
Он стал мультимодальным — то есть, всё делает одна и та же модель.
Раньше было как: языковая модель писала промпт → отправляла его в генератор картинок → получала результат.
Проблема: генераторы не понимали текст. Надписи выходили с ошибками, буквы съезжали, смысл терялся.
Теперь всё иначе.
Один мозг думает и над словами, и над картинкой.
ChatGPT сам по кусочкам “собирает” изображение, понимая, что делает.
Баги случаются, как без них. Но все можно сразу же исправить текстовым или голосовым запросом: вписать текст, изменить фон, стиль, внести правки.
Разговор с изображением стал таким же живым, как с текстом. Вот такую инфограмку я наговорила за 20 секунд. На такой подвиг в Canva у меня ушел бы целый день.
Что это меняет? Все. Особенно для таких анти-визуалов как я. ChatGPT постепенно учит меня видеть изображение и мыслить образами. Такие у нас с ним тренировки теперь.
Делайте ваши выводы!