⚡️ 10 open-source генераторов видео достойных вашего внимания (text-to-video и image-to-video)
1)
HunyuanVideo (text-to-video)Флагманская модель от Tencent (~13B параметров), обеспечивает высокое качество качество и реализм.
Категория: подходит для генерации реалистичных видео
▪Ресурсы: 45–80 ГБ VRAM, A100/H100, поддержка FP8
🟡
Ссылка2)
Mochi (text-to-video)Описание: модель от Genmo (~10B параметров), быстрая и мощная
▪Категория: реализм + плавность движения
▪Бенчмарки: качество почти на уровне Hunyuan, 30 FPS
▪Кейсы: реклама, креативы, short-видео
▪Ресурсы: Для работы модели требуется не менее 4 GPU H100., поддержка LoRA, FP8
🟡
Ссылка3)
Wan2.1 (text/image-to-video)▪Описание: универсальный генератор от Alibaba (до 14B параметров)
▪Категория: синтез движений, анимация изображения
▪Бенчмарки: высокая стабильность, особенно в SkyReels.
▪Кейсы: оживление изображений, видеопрототипы
▪Ресурсы: 12–24 ГБ VRAM (1.3B и 14B версии)
🟡
Ссылка4)LTX-Video-Trainer
Проект, предоставляющий инструменты и скрипты для обучения и дообучения модели LTX-Video от компании Lightricks.
▪Категория: с его помощью можно обучать адаптеры LoRA поверх LTX-Video, а также выполнять полное дообучение модели на ваших датасетах.
▪Ресурсы: не менее 12 ГБ GPU для эффективного обучения и дообучения модели. RaM: Минимум 16 ГБ;
🟡
Ссылка5)
Pyramid Flow (text/image-to-video)
▪Описание: модель на базе Flux для генерации длинных видео (до 10 сек, 768p)
▪Категория: длительные сцены, плавные переходы
▪Бенчмарки: превосходство в motion stability
▪ Кейсы: нарративные ролики, контент для соцсетей
▪ Ресурсы: 12–48 ГБ VRAM
🟡
Ссылка6)
CogVideo / CogVideoX (text-to-video)
▪Описание: трансформер на 9B/5B параметров от THU
▪Категория: стилизация, универсальность
▪ Бенчмарки: сильные CLIP/FVD, хорошая временная согласованность
▪ Кейсы: мультфильмы, обучающее видео, стилизованные ролики
▪Ресурсы: 20–24 ГБ VRAM, оптимизирован под FP8
🟡
Ссылка7)
Step-Video-TI2VМодель для генерации видео (до 102 кадров), производительностью SOTA.
Принимает на вход текстовые описания и изображения.
▪Бенчмарки: на VBench-I2V показывает лучшие результаты по сравнению с другими современными открытыми моделями для генерации видео из изображения и текста, а также лидирует в публичном рейтинге.
🟡
Ссылка8)
AnimateDiff Ветеран этого списка.
▪Категория: анимация, стилизация
▪Бенчмарки: высокая согласованность между кадрами
▪Кейсы: оживление арта, анимированные сцены
▪Ресурсы: от 8 ГБ VRAM, масштабируется до 24 ГБ для высокого качества
🟡
Ссылка9)
Easy Animate (image-to-video)▪Описание: генерация видео из одного кадра (Alibaba, EasyAnimate V5)
▪Категория: анимация изображения
▪Бенчмарки: стабильная идентичность объекта, плавность
▪Кейсы: оживление фото, персонажей, иллюстраций
▪Ресурсы: минимум 12–24 gb CPU
🟡
Ссылка10)
Open-Sora Plan (и связанные проекты)▪Описание: Это не одна конкретная модель, а скорее инициатива разработчиков (и несколько независимых проектов) по созданию и обучению open-source модели
▪Бенчмарки: Пока находятся в активной разработке. Сильная сторона - открытость и амбициозная цель. Результаты варьируются, но быстро улучшаются.
▪Ресурсы: Требования сильно зависят от конкретной реализации и этапа проекта.
📌
Подробное описание моделей Добавляйте в комментариях ссылки генераторы, которыми вы пользуетесь 👇
#ai #video #videogenerator #ml