Горячая тема сегодня обсуждалась на Data Fusion: где же тот самый злополучный datalake, и как нам развить рынок больших данных в РФ?
❓ Президент «Ассоциации больших данных» Анна Серебряникова констатировала, что открытый рынок данных в РФ не сформировался, и все остальные направления прошли в основном по «базовому сценарию», несмотря на надежды бизнеса. Как видно из её слайда ☝️, единственная область, в которой выполнены цели развитие рынка big data — это монетизация. В 2024 году он достиг 320 млрд руб. А вот в части обмена данными и выхода на внешние рынки, проекты либо только начаты, либо приостановлены.
Сейчас в Ассоциации разрабатывают новую стратегию развития до 2030 года и призывают государство к более активному вмешательству: правительство должно быть регулятором не только контролирующим, но и стимулирующим. Иначе у России есть риск серьёзно отстать от США и Китая, которые все проблемы на своей стороне решили.
📍 Сейчас же регуляторные рамки мешают открытости данных. У телеком операторов — тайна связи, у финансовых организаций — банковская тайна, заметил Вадим Кулик, зампредправления ВТБ. С прошлого года также
появились оборотные штрафы за утечку персональных данных: всё это создаёт негативные стимулы для рынка.
Вчера говорили про биржу данных, которая уже есть в Китае. Значит, этот путь рабочий, но пока закрытый из-за регуляторных вызовов. При этом пилотные проекты, вроде работы с Open API от ЦБ, приводят лишь к развитию новых продуктов в экосистемах. Например, когда у некоторых банков появилась возможность показывать в одном интерфейсе несколько счетов, это создало для них риски потери клиентов.
Отвечают на это соответственно: скоро на таких «витринах» у каждого банка появятся свои «антисоветчики»: они будут рассказывать, почему не нужно совершать покупку через другой банк, советовать выгодные предложения. Вот тебе и ещё одно применение ИИ. Но, опять же, это не путь к обмену данными.
✔️ Министр цифры Максут Шадаев отметил, что в России первоначальный период накопления капитала данных уже прошёл. Россия цифровизировалась, теперь настало время повысить эффективность использования уже собранной информации. Каждый работает с данными по разному, гармонизация не проведена.
Есть соблазн собрать все данные в одном месте, но это риск с точки зрения кибербезопасности. Поэтому формат «витрин», когда данные хранятся в ведомствах, а в приложении только отображаются, удобнее. Задача Госуслуг — к 2026 году отказаться от хранения любой информации, чтобы данные подгружались из баз ведомств. Ну и, естественно, властям интересны данные бизнеса.
А что касается инициатив про биржи данных... Шадаев отметил, что здесь, как и с ИИ, увлечение регуляторикой может иметь свои минусы. Пусть лучше бизнес самоорганизуется и принесёт свои предложения — например, на ЦИПР. Хочется от общих вещей перейти к конкретным проектам, понимать, что можно сделать.
🔤🔤Буквально вчера видели прекрасный пост о том,
как обстоят дела с открытостью данных в России. Если кратко: со стороны государства стимулов к развитию индустрии фактически нет. Дата-сеты публикует и обновляет в основном ЦБ и ФНС. В феврале представитель аппарата вице-премьера Дмитрия Григоренко
сообщил, что собранные властями данные будут передавать для обучения ИИ, но о практических результатах этого пока не слышно.
Конкретных действий мало, а те что есть ограничиваются взаимодействием властей и крупного финтех-бизнеса. Обсуждения сценариев выхода из этого тупика идут — даже сегодня после пленарки об этом с нервным смешком вновь заговорили на тематической дискуссии «Нужна ли России национальная биржа данных?». Но кажется, что всё упирается в регуляторику: кроме открытых данных государства на биржу пока ничего не положить.