Mashkka про Data Science • @mashkka_ds • message №2305, 28 April 2025

Your trial period has ended!

For full access to functionality, please pay for a premium subscription

Message

3 800 subscribers

Repost

588

Сбер на конференции ICLR 🤖

Сейчас в Сингапуре проходит крупнейшая международная конференция по Data Science. На ней команда Сбера презентовала работу MMTEB (Massive Multilingual Text Embedding Benchmark) — мультиязычный бенчмарк по оценке текстовых эмбеддеров

Эмбеддеры — модели, которые переводят текст в векторы (т. е. сопоставляют каждому тексту набор чисел). Таким образом, дальше их можно использовать для самых разных задач, связанных с текстами: от поиска в интернете до классификаций и кластеризаций, поэтому оценка таких моделей крайне важна

MMTEB — крупный международный проект, который наши учёные дополнили частью для оценки русскоязычных моделей ruMTEB

Желаем коллегам ещё больше масштабных проектов и прорывных результатов 🔝

04/28/2025, 14:42

t.me/mashkka_ds/2305