⚡️ Data Fusion Contest 2025: делимся кейсом
В этом году Артём Сахно и Иван Сергеев из нашей Лабы заняли 4 место в соревновании Data Fusion Contest 2025. Ребята участвовали в треке 4cast, где нужно было предсказать динамику платежей для ЮЛ ВТБ на горизонте 12 недель, при этом метрика учитывала не только точность, но и устойчивость модели к шумам.
Финал — 4 место среди топовых команд.
➡️ Кейс
Команда собрала сильный пайплайн из двух моделей:
-
Py-Boost - кастомный градиентный бустинг с ручной настройкой градиента и гессиана 💡
- AutoGluon — автоматизированный стек, который хорошо работал на отдельных юзерах
Две эти модели в итоге блендили.
Также пайплайн включал в себя предсказание маски, чтобы определить будет ли таргет ≥ 0, после этого применяли постпроцессинг для сглаживания переоценок модели.
➡️ Главный вызов — валидация: на приватной части были праздничные недели января, с аномалиями в транзакциях.
Чтобы справиться, ребята анализировали таргет на аналогичные недели в прошлые годы и корректировали прогнозы вручную.
📆 Иван Сергеев поделился фидбэком:
Наше решение хоть и не оказалось на призовых строчках приватного лидерборда, оказалось достаточно устойчивым, если судить по совокупности всех лидербордов. Вообще очень круто участвовать в таких соревнованиях, потому что они близки по специфике к рабочим задачам и дают много пищи для размышлений, и некоторые наработки, уверен, пригодятся и в наших задачках.
Кстати, делимся другими нашими open-source либами, которые можно юзать для решения схожих задач:
↗
pytotch - lifestream🦙
LightAutoML🕊
Tsururu🔗 Читайте о наших прошлых победах:
2024:
Второе место на Data Fusion Contest 20242022:
Как нейронка обогнала бустинг, а команда Сбера заняла 1 место в конкурсе Data Fusion Contest 2022#новости
❤ @sb_ai_lab