Реально ли это лучшее, что сейчас есть на рынке видеогена?
Я про видео нейросеть VEO 2, которая наконец-то появилась в доступе
Пока не понимаю решения дать доступ к инструменту, через сторонние сервисы. Но понимаю, что это реально во многом лучшая сейчас модель и по реалистичной физике, освещении, весу, движениям. Качество уже хорошее, а если еще полернуть новым апскейлом от Topaz Starlight до 4K, будет 0 сомнений, что это синтетика, а не реальная съемка
Заметил, что с управлением движением камеры есть проблемы, через раз слушается. Промпт пишется по стандартной киношной структуре. Движение камеры нужно вписывать естественно в описание сцены, чтобы оно органично передавало динамику:
Где (среда, атмосфера, погода)
Кто и что делает (персонажи, действия)
Как снимается (ракурсы, движение камеры)
Свет, цвета, настроение
Доп. детали (туман, дождь, отражения, стиль)
Как вариант можно, что-то попридумывать в
VeoGPTsЧто касается генерации из изображений, то тут при генерации бывает, как в Sora, кадр может перескочить на другой ракурс или позу и поменять контекст, то есть используя изображение, как референс контекста, а не как начальный кадр. У меня такое случается, когда VEO 2 не понимает промпт и что вы от нее хотите. Результат очень хорош, когда все получается, но тот же Kling не сильно уступает при генерации из изображений
Нашел, где можно поиграться с VEO 2 и сравнил ценники:
36 евро за 45 генераций по 5 секунд
https://www.freepik.com/pikaso/ai-video-generator
2,5 доллара за 1 генерацию в 5 секунд или 4 доллара за 1 генерацию в 8 секунд
https://fal.ai/models/fal-ai/veo2
https://fal.ai/models/fal-ai/veo2/image-to-video — да тут уже есть I2V и оно работает (перестал работать)
23 евро за 86 генераций по 8 секунд (не актуально)
https://poe.com/Veo-2.0
1,25$ за 1 генерацию в 5 секунд
https://nim.video — у этих есть преимущество, что есть встроенный апскейл видео в 2-4х раз, который действительно норм работает
Пару месяцев и остальные модели подтянутся по уровню