Тяжелый понедельник начнем с тяжелых тестов.
У нас на разделочном столе (H100) три новых участника хитпарада прошлой недели:
HiDream, Wan FLF 2.1 720P и огненный FramePack от господина Жанга(автора Фокуса, Форджа, первого контролНета, IC Light, гения в общем).
Начнем с
HiDream.
Как я и обещал в пятницу расчехлил свой H100-сервак на immers.cloud, чтобы погонять вышеозначенных господ, посмотреть расходы памяти и времени. И сдается мне, что вторым, после GPU, важным компонентом, становятся SSD диски.
Я брал самый жирный сервак с 480Гиг диском и надо сказать, мне не хватило места на диске, постоянно приходилось что-то сносить. То Wan качнет 200 гиг за раз, то Комфи попросит скачать 200Гиг, FramePack тоже не отстает.
Ну и кстати, как я уже писал вот тут, сервер в нерабочее время надо не стоппить, а отправлять в хибернацию (SHELVED) - так вот, выход из хибернации может занимать 20-30 минут, если у вас конский размер диска, надо просто быть к этому готовым.
Итак, я сначала я накатил новый побиватель Image Arean - HiDream, чтобы погонять его на память и на NSFW.
Надо сказать, что полная версия выглядит монстроподобно - потребление 62Гига VRAM. Скорость генерации 30 секунд на полной модели Full, отсутствие лор (пока) и управления. Похоже, что он будет доступен прежде всего в API и на сайтах типа Фрипика и Креа.
Но тут пришел апдейт от Самих Комфи про нативную поддержку HiDream. Я, естественно, бросился, проверять.
И нашел новый Template Manager в Комфи, в котором уже собраны нативные форкфлоу для очень большого количества моделей. Не очень интуитивно, но проходимо. Надо ткнуть в Images, потом в HiDream (выбрать full, dev, fast).
Дальше выскочит окно "а скачайка модели сам!" и "почитай доки, куда это рассувать".
Я отдельным постом взору про Комфи пожалуй, ибо накипело.
Скачал, рассувал - на удаленной машине в облаке это несильно удобно и решает командная строка и WinSCP, благо на immers.cloud он подцепляется без проблем.
Комфи работает со своими "оптимизированными" моделями HiDream(читай снова давай 200 гиг), и содержит также пожатые версии.
Что я намерил:
Чистый HiDream (через gradio) - чуть быстрее, 30 сек, 1.5 it/s, модель Full, 50 шагов.
Comfy HiDream (через Comfy) - чуть медленне, 37 сек, 1. 5 it/s, модель Full, 50 шагов.
Зато память есть не 62, а в районе 30 гиг VRAM. Есть и более пожатые версии, но мы сейчас не о них.
В NSFW HiDream исполняет гораздо лучше любой модели из коробки (Flux, SD3.5, Reve), знает анатомию, но конечно хуже, чем любая специально обученная лора к флюксу или SD.
Также держите пару хинтов для генерации в HiDream:
Пользуйте Dev, от в три раза быстрее.
Понижайте SD3 Sampling до 2 и меньше, пишут, что 1.72 хороший выбор.
Euler sampler with ddim_uniform scheduler at exactly 20 steps
Будет выгодно отличаться от Флюкса и лучше делать лица.
А мы пойдем дальше, зря что ли H100 нагревал.
@cgevent