Умерла ли ABBYY?
Наверное, многие помнят осенний скандал с увольнением практически всех русских программистов из ABBYY. Естественно, тут проглядывается политический подтекст. Но точно ли политика является основной причиной?
Давайте начнем с начала.
В 1989 году студент МФТИ сделал электронный словарь, чтобы сдать экзамены. Приложение выросло в словари Lingvo. Через несколько лет появилась система распознавания текста с фотографий FineReader. ABBYY была глобальным лидером распознавания текста до 2000ых. Компания активно росла и искала следующую большую цель. Логичным выглядел автоматический перевод. Это был следующий уровень понимания текста и он выглядел как интересный вызов для компании, у которой были деньги, экспертиза и заряд энтузиазма.
ABBYY создана выпускниками Физтеха — людьми с фундаментальным научным подходом. Поэтому к переводу подошли тоже фундаментально: начали выяснять у лингвистов, какие существуют теоретические подходы к моделированию языка. Описание языка в формальной модели требовало буквально человеко-столетий. Создание переводчика постоянно откладывалось. А тем временем технологии автоматической обработки языка ушли вообще в другую сторону.
Появление Google Translate полностью изменило рынок. В начале возникло множество проблем, но оставалось главное преимущество — масштабируемость. Не нужны были сотни лингвистов, чтобы по крошкам описывать правила перевода. Использовалось машинное обучение, и достаточно было добавить примеров перевода, и система переводила все лучше. А примеров одних и тех же текстов, написанных на разных языках, становилось все больше и больше - взять те же многоязычные этикетки на любом товаре. То есть даже переводчики не нужны были для создания Google Translate
1️⃣ ОШИБКА: ВКЛАДЫВАТЬСЯ В БИЗНЕС-МОДЕЛЬ, КОТОРУЮ НЕВОЗМОЖНО МАСШТАБИРОВАТЬ
В 2009 году исследователи из Google отрефлексировали успех data-driven подходов в статье «Необъяснимая эффективность данных». В ней посоветовали основываться не на ручном моделировании, а на подходах с возможностью использования больших данных. Дальнейшее развитие автоматической обработки текста (и в частности взлет GPT) происходил именно так. GPT модели пользуются возможностью обучаться на гигантских массивах неразмеченных данных.
К началу 2010-х затраты на разработку модели ABBYY достигли 80 миллионов долларов, а рынок был захвачен переводчиками с использованием машинного обучения.
2️⃣ ОШИБКА: ПРОДОЛЖАТЬ ТАЩИТЬ ПРОЕКТ ПО ПРИЧИНЕ "НУ МЫ СТОЛЬКО В НЕГО ВЛОЖИЛИ" ВМЕСТО ТОГО, ЧТОБЫ ПОСЧИТАТЬ ПОТЕНЦИАЛЬНУЮ ДОХОДНОСТЬ
В компании сделали
pivot. С перевода переключились на задачи поиска и извлечения информации в корпоративных архивах. Компания решила, что продвинутая лингвистическая модель, которая была у ABBYY, позволит обогнать конкурентов в областях, где с обучающими данными несладко.
3️⃣ ОШИБКА: ПРИВЕРЖЕННОСТЬ МЕТОДОЛОГИИ/ТЕХНОЛОГИИ, А НЕ ИДЕЕ
Вот тут спотыкаются очень многие компании. Да, во всех историях успешных бизнесов предприниматель горел "большой идеей" и и шел к ней, несмотря на сотни падений. Но не все идеи можно назвать "большими".
Вспоминаем принципы человекоцентричности. Задайте себе вопрос — в основе вашей "большой идеи" лежит проблема человека или конкретный способ решения проблемы? Если вы выбрали второй вариант, у меня для вас плохие новости.
Даже когда в 2017-2018 был совершен очередной прорыв в нейросетях, в ABBYY продолжали делать упор на формальную языковую модель, добавляя по минимуму нейросетей. И вероятно, продолжали бы и дальше, если бы не 2022 год.
4️⃣ ОШИБКА: НЕ ОБРАЩАТЬ ВНИМАНИЕ НА БОЛЕЕ ЛЕГКИЕ СПОСОБЫ РЕШИТЬ ВАШУ ЗАДАЧУ И НЕ СЛЕДИТЬ ЗА ТЕХНОЛОГИЯМИ