Ученые НОШ МГУ договорились о «честных» принципах моделирования биологических молекул
#наука_мгу
Авторитетный коллектив ученых, состоящий из ведущих мировых специалистов, включающих двух Нобелевских лауреатов и профессора
биофака МГУ, сформулировал принципы, которым должны соответствовать современные исследования в области молекулярного моделирования биологических систем в эпоху больших данных и искусственного интеллекта. Методы молекулярного моделирования являются незаменимым инструментом для изучения работы живых систем, понимания того, как генетическая информация определяет строение и свойства живых организмов, включая человека, разработки новых лекарств и биотехнологий. В мире 15% ресурсов суперкомпьютерных центров используется для решения подобных задач. Для того, чтобы получаемая информация о структуре и динамике биомолекул приносила максимальную пользу, необходимо создание общедоступных баз данных, подобных базам данных генетической информации, которые уже активно развиваются во всем мире. Основные идеи дальнейшего развития области биомолекулярного моделирования, накопления и обмена полученной информацией ученые изложили в статье,
опубликованной в апрельском выпуске престижного журнала Nature Methods.
Авторы отмечают, что громкие успехи методов искусственного интеллекта последних лет, например, предсказание структуры белков программой AlphaFold, стали возможными именно благодаря наличию общедоступных баз данных генетической информации и структур биомолекул, которые используются для тренировки алгоритмов. Создание систем обмена данным о динамике биомолекул позволит, вероятно, выйти на новый уровень в предсказании свойств биомолекул.
Разработку новых баз данных авторы предлагают вести учитывая четыре основных принципа. Согласно этим принципам необходимо стремиться к тому, чтобы нужные данные (i) можно было легко находить посредством сети Интернет, (ii) получать к ним доступ, (iii) обрабатывать с помощью различных программных продуктов, (iv) многократно использовать в различных задачах анализа. На английском языке подобные принципы обозначают аббревиатурой FAIR (Findable, Accessible, Interoperable, Reusable). Несмотря на то, что данные принципы сформулированы достаточно абстрактно, их конкретная реализация потребует изменения парадигмы, в которой до недавнего времен работали исследователи.