Your trial period has ended!
For full access to functionality, please pay for a premium subscription
Message
28
13
342
⚡️ Data Fusion Contest 2025: делимся кейсом

В этом году Артём Сахно и Иван Сергеев из нашей Лабы заняли 4 место в соревновании Data Fusion Contest 2025. Ребята участвовали в треке 4cast, где нужно было предсказать динамику платежей для ЮЛ ВТБ на горизонте 12 недель, при этом метрика учитывала не только точность, но и устойчивость модели к шумам.
Финал — 4 место среди топовых команд.

➡️ Кейс
Команда собрала сильный пайплайн из двух моделей:
- Py-Boost - кастомный градиентный бустинг с ручной настройкой градиента и гессиана 💡
- AutoGluon — автоматизированный стек, который хорошо работал на отдельных юзерах
Две эти модели в итоге блендили.
Также пайплайн включал в себя предсказание маски, чтобы определить будет ли таргет ≥ 0, после этого применяли постпроцессинг для сглаживания переоценок модели.

➡️ Главный вызов — валидация: на приватной части были праздничные недели января, с аномалиями в транзакциях.
Чтобы справиться, ребята анализировали таргет на аналогичные недели в прошлые годы и корректировали прогнозы вручную.

📆 Иван Сергеев поделился фидбэком:
Наше решение хоть и не оказалось на призовых строчках приватного лидерборда, оказалось достаточно устойчивым, если судить по совокупности всех лидербордов. Вообще очень круто участвовать в таких соревнованиях, потому что они близки по специфике к рабочим задачам и дают много пищи для размышлений, и некоторые наработки, уверен, пригодятся и в наших задачках.

Кстати, делимся другими нашими open-source либами, которые можно юзать для решения схожих задач:
↗ pytotch - lifestream
🦙 LightAutoML
🕊 Tsururu

🔗 Читайте о наших прошлых победах:
2024: Второе место на Data Fusion Contest 2024
2022: Как нейронка обогнала бустинг, а команда Сбера заняла 1 место в конкурсе Data Fusion Contest 2022


#новости
❤ @sb_ai_lab
04/17/2025, 14:48
t.me/sb_ai_lab/119
Similar message chronology:
Newest first
Similar messages not found