У вас закончился пробный период!
Для полного доступа к функционалу, пожалуйста, оплатите премиум подписку
Сообщение
UR
URBAN MASH
1 649 подписчиков
1.1 k
Зачем геоаналитикам ML и зачем ML-щикам Geo?

Часто слышу от "трушных" программистов, что геоаналитика — это просто добавить столбцы latitude и longitude в датасет и прогнать через sklearn. Но на практике всё чуть сложнее.

Почему геоаналитику недостаточно классического ML?
Когда я делала любую геомодель, которая по пространственным признакам предсказывает таргет, то я сталкивалась с несколькими проблемами:
- Пространственные данные автокоррелированы (значение в точке зависит от соседей) → обычные ML-модели дают смещённые предсказания.
- Координаты — это не просто два признака, а пространственная структура → нужны специальные методы (геостатистика, пространственные графы).
- В геоданных много шума (GPS-прыжки, ошибки картографирования) → без предобработки модели учатся на артефактах.

Почему ML-специалистам нужно понимание гео?
Когда мы с командой прогнозировали заказы в ПВЗ на хакатоне, мы увидели, что:
- Рядом с метро спрос выше в 1.5–3 раза → но если просто добавить distance_to_subway, модель не учтёт нелинейность (например, пешеходные маршруты через парки).
- Традиционные метрики (RMSE) не отражают географическую ошибку (промах на 500 м в центре Москвы ≠ 500 м в промзоне).
- Без понимания пространственных процессов (например, сезонной миграции) модель выдаёт "среднюю температуру по больнице".

Курсы, которые реально прокачали мои навыки
1. Working with Geospatial Data in Python (Datacamp) – лучший старт для работы с geopandas и shapely.
2. Spatial Data Science and Applications (Coursera) – более общий курс, где есть QGIS, PostGIS, R и инструменты Hadoop.
3. Курс Инессы Трегубовой – разбор реальных практических кейсов. Это курс, где я была на 1 потоке и который стал для меня вдохновением пойти работать геоаналитиком в Я.Лавку, т.к. на тот момент Инесса там работала.

P.S. Если хотите глубже разобрать какой-то кейс – пишите, расскажу про подводные камни (например, почему kNN для геоданных — плохая идея).

@urban_mash
22.04.2025, 21:43
t.me/urban_mash/241
Хронология похожих публикаций:
Сначала новые
Похожие публикации не найдены