Всем привет!🔥
📆В эту пятницу (21 февраля) в 16:00
Егор Черепанов разберёт статью
Flow Q-Learning
Рассмотрим Flow Matching в контексте Offline RL Q-Learning, обсудим трудности, которые могут возникнуть при наивном применении Flow Matching, и предложенное решение этой проблемы с помощью техники one-step guidance. Этот подход включает обучение отдельных one-step стратегий с использованием RL и потоковой стратегии с BC, что позволяет избежать сложных проблем, связанных с guiding итеративных генеративных моделей, таких как recursive backpropagation
Статья:
1.
Flow Q-Learning🍿
Ссылка на подключение
Подписаться⤵️
Embodied AI Reading Club