Yandex for ML – @yandexforml • Seine.pro

Your trial period has ended!

For full access to functionality, please pay for a premium subscription

YA

Yandex for ML

https://t.me/yandexforml

Channel age

Created

Language

Russian

15.13%

ER (week)

6.24%

ERR (week)

Yandex for ML — канал для ML-сообщества от Яндекса, митапы, активности и место встречи специалистов в сфере анализа данных.

Чат → https://t.me/+OsKnLNG-7DE1ZTFi

Youtube → https://youtube.com/@YandexforML

Show more

Messages Statistics

Top categories

Main categories of messages will appear here.

Top mentions

The most frequent mentions of people, organizations and places appear here.

Found 146 results

13 574 subscribers

9

23

1.2 k

🧿 Анализируйте изображения с помощью опенсорсных нейросетей

Yandex B2B Tech открыл доступ к опенсорсным визуально-генеративным моделям (VLM). С ними бизнес-клиенты могут выстраивать свои сценарии обработки изображений — например, составлять описания товаров по фотографиям или быстро находить нужную информацию в документах.

Уже доступны около 20 VLM- и LLM-моделей. Среди них: DeepSeek-VL2 Tiny и Gemma 3 27b, Qwen 2.5, LLaMa 3.3 и рассуждающие нейросети QwQ 32b и DeepSeek-R1. Модели доступны в пакетном режиме: за один раз в них можно отправить множество запросов. В будущем мы будем разворачивать на платформе новые опенсорсные модели, а ещё вскоре добавим собственную VLM-модель Яндекса.

🔳 Попробовать их можно в Yandex Cloud AI Studio. А узнать подробности в статье на Хабре.

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

04/24/2025, 14:50

t.me/yandexforml/749

13 574 subscribers

32

2.0 k

04/22/2025, 16:03

t.me/yandexforml/742

13 574 subscribers

32

2.0 k

04/22/2025, 16:03

t.me/yandexforml/746

13 574 subscribers

28

32

2.0 k

🗺 Как устроен recsys мест и организаций в Яндекс Картах

В сервисе долгое время работали классические решения: коллаборативная фильтрация, матричная факторизация и градиентный бустинг. Но время не стоит на месте, и команда взялась за внедрение нейросети-трансформера. Это оказалось непросто, потому что специфика рекомендаций в картах сильно отличается от других приложений вроде стриминга музыки и маркетплейсов.

👷 В карточках рассказали, какие особенности несёт в себе концепция геосервиса и как несмотря на них сделать хорошие рекомендации.

🔳 А за подробностями переходите в статью на Хабре. В ней Владимир Жуков, руководитель группы магии рекомендаций (да, это настоящее название), рассказал о работе своей команды.

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

04/22/2025, 16:03

t.me/yandexforml/740

13 574 subscribers

32

2.0 k

04/22/2025, 16:03

t.me/yandexforml/741

13 574 subscribers

32

2.0 k

04/22/2025, 16:03

t.me/yandexforml/745

13 574 subscribers

32

2.0 k

04/22/2025, 16:03

t.me/yandexforml/743

13 574 subscribers

32

2.0 k

04/22/2025, 16:03

t.me/yandexforml/744

13 574 subscribers

32

2.0 k

04/22/2025, 16:03

t.me/yandexforml/748

13 574 subscribers

32

2.0 k

04/22/2025, 16:03

t.me/yandexforml/747

13 574 subscribers

58

2.0 k

04/21/2025, 13:01

t.me/yandexforml/735

13 574 subscribers

58

2.0 k

04/21/2025, 13:01

t.me/yandexforml/734

13 574 subscribers

58

2.0 k

04/21/2025, 13:01

t.me/yandexforml/738

13 574 subscribers

18

59

2.0 k

🧿 Как дообучать модели с помощью LoRA

Об этом рассказали ребята из Yandex Cloud: Дмитрий Рыбалко, продуктовый архитектор ML-сервисов, и Сергей Золотов, старший технический менеджер направления ML. Этот функционал как раз недавно появился в AI Studio — нашей единой платформе для разработки приложений на базе ИИ.

👷 Читайте наши карточки, чтобы узнать подробности

🔳 А для самых любопытных мы принесли ссылку на запись вебинара по теме

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

04/21/2025, 13:01

t.me/yandexforml/731

13 574 subscribers

58

2.0 k

04/21/2025, 13:01

t.me/yandexforml/739

13 574 subscribers

58

2.0 k

04/21/2025, 13:01

t.me/yandexforml/732

13 574 subscribers

59

2.0 k

04/21/2025, 13:01

t.me/yandexforml/737

13 574 subscribers

58

2.0 k

980х1280_3.mp4

04/21/2025, 13:01

t.me/yandexforml/733

13 574 subscribers

58

2.0 k

04/21/2025, 13:01

t.me/yandexforml/736

13 574 subscribers

19

2.0 k

04/18/2025, 12:32

t.me/yandexforml/728

13 574 subscribers

19

2.0 k

04/18/2025, 12:32

t.me/yandexforml/727

13 574 subscribers

30

19

2.0 k

🧿 Как нейросети помогают очищать побережья

Сергей Кукуруз, технический руководитель социально-стратегических проектов Yandex B2B Tech, рассказал нам о работе, которую проделали ML-разработчики Школы анализа данных вместе с командой Yandex Cloud и Дальневосточным федеральным университетом.

👷 Ребята создали и обучили нейросеть, которая уже сейчас помогает планировать уборку мусора на побережьях. В карточках Сергей рассказал о том, как всё работает.

🔳 А узнать подробности о проекте можно тут

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

04/18/2025, 12:32

t.me/yandexforml/722

13 574 subscribers

19

2.0 k

04/18/2025, 12:32

t.me/yandexforml/726

13 574 subscribers

19

2.0 k

04/18/2025, 12:32

t.me/yandexforml/724

13 574 subscribers

19

2.0 k

04/18/2025, 12:32

t.me/yandexforml/729

13 574 subscribers

19

2.0 k

04/18/2025, 12:32

t.me/yandexforml/723

13 574 subscribers

19

2.0 k

04/18/2025, 12:32

t.me/yandexforml/730

13 574 subscribers

19

2.0 k

04/18/2025, 12:32

t.me/yandexforml/725

13 574 subscribers

13

22

2.1 k

🛄 Привет, вы в канале Yandex for ML

Это приветственный пост для тех, кто впервые зашёл в наш канал, и подборка полезных ссылок для тех, кто с нами уже давно <3

↔️ В этом канале инженеры Яндекса раскрывают детали разработки YandexGPT и других сервисов компании с ML на борту, а ещё обсуждают новости индустрии и делятся нетривиальными советами по работе с ИИ. Приходите знакомиться с разработчиками и их командами.

Вот несколько интересных постов для начала:

⚪️ Как мы боремся с галлюцинациями нейросетей

⚪️ Мы создали YaFSDP — опенсорс-библиотеку Яндекса для ускорения обучения LLM

⚪️ Как тестировать беспилотные технологии в симуляции

⚪️ Помогаем астрофизикам искать вспышки на звёздах

⚪️ Складские роботы на ИИ: как мы это сделали

⚪️ Кто оценит оценщиков и как проверять качество ответов LLM

⚪️ Как мы масштабировали Геокодер на другие страны с помощью deep learning

⚪️ Эволюция диффузионных моделей: вспоминаем главные релизы

⚪️ Дайджест полезных материалов по ML — ссылки собрали наши инженеры

⚪️ Как устроена система рекомендаций в Алисе

⚪️ Шесть вопросов, на которые нужно ответить, перед тем как внедрять в проект ML

⚪️ Как делали SourceCraft, платформу для разработки от Yandex Cloud и Yandex Infrastructure

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

04/16/2025, 12:04

t.me/yandexforml/720

13 574 subscribers

24

24

2.6 k

🐚 Как мы научили Алису рассуждать

Теперь пользователи могут увидеть не только готовый ответ, но и все этапы мысли AI-ассистента, чтобы узнать, как он проверял себя и почему пришёл к определённому выводу. Это стало возможно благодаря внедрению бета-версии новой YandexGPT 5 с режимом рассуждений.

Немного о том, как мы её обучали:

⚪️ На претрейн-модели сделали SFT на ответах YandexGPT 5 Pro

⚪️ Экспериментировали с Online RL GRPO на реворде с однозначными ответами

⚪️ На стадии Offline RL попарно собирали запросы со стадии SFT и ответы к ним, которые сгенерировали с помощью YandexGPT 5 Pro

⚪️ Добавили в датасет не только задачи на математику, но ещё и B2B-сценарии: классификацию, извлечение информации из текста и суммаризацию

⚪️ Для ускорения процесса обучения использовали открытые решения Яндекса. Например, библиотека YaFSDP позволила нам быстрее проводить необходимые эксперименты

О других особенностях обучения и внедрения reasoning-модели читайте в новости на Хабре.

🔳 А попробовать новые функции можно в чате с Алисой с подпиской Про. Помимо рассуждений, среди них:

⚪️ Поиск в интернете, который позволит дополнить знания модели и укажет все ссылки на источники. Может работать вместе с функцией рассуждений

⚪️ Выбор между моделями: YandexGPT 5 с режимом рассуждений и опенсорсным решением, которое развёрнуто на инфраструктуре Яндекса

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

04/15/2025, 18:48

t.me/yandexforml/719

13 574 subscribers

10

34

2.6 k

🎼 Новый выпуск подкаста «Деплой» про рекламу

В гости к ребятам пришёл Антон Полднев, руководитель инфраструктуры рекламных технологий Яндекса.

Внутри подробно обсудили рекомендательные алгоритмы, ИИ, метрики и рабочие процессы в команде.

🌠 Если вам интересно узнать, как работает хайлоад ИИ под капотом Рекламы, то этот выпуск обязателен к просмотру!

🔳 Смотрите на ютубе, рутубе или в VK Видео.

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

04/14/2025, 16:02

t.me/yandexforml/718

13 574 subscribers

12

10

2.5 k

1920x1080 (1) (4).mp4

✨ Новый канал в сетке Yandex for Developers

Мы запустили Yandex for Teamleads — новое сообщество для тимлидов, техлидов и управленцев в IT.

Здесь мы поговорим о карьере, лидерстве, управлении командами и процессами. А ещё будем делиться полезными статьями, советами экспертов, рабочими кейсами и анонсами мероприятий. Все посты мы готовим вместе с лидами наших команд — чуть позднее вы сможете с ними познакомиться!

Уже сейчас ищите в канале:

⚪️ Как успешно НЕ выгореть на работе. Подробный гайд
⚪️ Что нужно спросить у нанимающего менеджера, чтобы найти работу лучше предыдущей
⚪️ Записи докладов с серии митапов для тимлидов Yet Another Level

🔳 Подписывайтесь на Yandex for Teamleads, чтобы не пропустить новые посты.

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

04/14/2025, 12:00

t.me/yandexforml/717

13 574 subscribers

9

13

2.0 k

🔗 Выставка ИИ-художников в Третьяковке, YandexGPT в опенсорсе, рекомендации в Картах и продуктовое применение RAG — обо всём этом в новом ML-дайджесте

📖 Почитать

⚪️ Instruct-версия YandexGPT 5 Lite в опенсорсе. В том числе в формате, совместимом с llama.cpp. Её уже сейчас можно дообучить под ваши задачи

⚪️ Яндекс Карты внедрили нейросеть-трансформер, чтобы прокачать recsys мест и организаций. В статье на Хабре ребята показали, как обучали модель и оценивали её качество

⚪️ Yandex B2B Tech создал и обучил нейросеть, которая находит и классифицирует мусор на труднодоступных побережьях. Технология помогает экологам и волонтёрам собирать данные и планировать работу заранее

⚪️ RAG в ИИ-ассистентах. Это новая фича для бизнеса в AI Studio, которая позволяет создать умную систему поиска по базам данных. Рассказали, как она работает

🚙 События

⚪️ Напоминаем про «Чинителей прекрасного». 25 и 26 апреля приходите на смесь IT-конференции и открытой мастерской, где можно починить сломанную технику и собрать что-нибудь интересное

⚪️ Школа анализа данных Яндекса открывает приём на двухгодичную программу. Предлагаем освоить востребованные направления Computer Science и получить знания из рук практикующих экспертов. Будет сложно, но оно того стоит!

🌎 Новости

⚪️ Пользователям доступна бета-версия Нейроэксперта. Это сервис по умному поиску информации в базах данных. Например, сервис может найти нужные цифры в горе документации, чтобы вам не пришлось просматривать каждый файл вручную

⚪️ Выставка совместных работ ИИ и художников. Это коллаборация Яндекса и Третьяковской галереи. В программе: кураторские и инклюзивные экскурсии, дискуссии, перформансы с художниками-участниками и публичные лекции

⚪️ «Охота за ошибками» на территории генеративных нейросетей Яндекса. Ищите баги в Нейро, Шедевруме, Алисе и других сервисах и получайте денежные призы от пятидесяти тысяч до миллиона рублей

⚪️ Учёные Яндекса прошли отбор на одну из крупнейших конференций по ИИ — NAACL. Статья посвящена новому методу сжатия LLM, который позволяет запускать нейросети на смартфонах и ноутбуках без дополнительного оборудования

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

04/11/2025, 19:01

t.me/yandexforml/716

13 574 subscribers

57

68

2.7 k

🧑‍🏫 Статья о новом методе сжатия LLM попала на NAACL

Исследователи из лаборатории Yandex Research, НИУ ВШЭ, MIT, ISTA и KAUST представили новый метод сжатия LLM под названием HIGGS (Hadamard Incoherence with Gaussian MSE-optimal GridS). Метод сжимает нейросети без использования дополнительных данных и без вычислительно сложной оптимизации параметров. Это позволяет запускать LLM на телефонах и компьютерах без дополнительного оборудования. Научную статью о HIGGS приняли на NAACL — одну из крупнейших в мире конференций по искусственному интеллекту.

Вот всего два факта (зато каких!) про новый метод:

⚪️ С помощью HIGGS можно эффективно сжать DeepSeek-R1 на 671 млрд параметров и Llama 4 Maverick на 400 млрд параметров. Раньше такие большие модели удавалось квантовать только самыми простыми методами со значительной потерей в качестве

⚪️ HIGGS экспериментально проверили на Llama 3 и Qwen 2.5 — оказалось, что он лучше всех существующих методов квантизации без использования данных, в том числе NF4 (4-bit NormalFloat) и HQQ (Half-Quadratic Quantization)

Мы надеемся, что HIGGS упростит тестирование и внедрение LLM, а ещё снизит порог входа в отрасль для некоммерческих лабораторий и институтов, индивидуальных разработчиков и исследователей.

🔳 Опробовать новый метод сжатия вы можете уже сейчас на Hugging Face и GitHub.

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

04/11/2025, 17:00

t.me/yandexforml/715

13 574 subscribers

24

53

2.6 k

🔍 Сможете найти баги в генеративных нейросетях Яндекса?

Тогда приглашаем на новый сезон «Охоты за ошибками». Ждём от вас отчёты об ошибках, которые могут повлиять на результаты работы и процесс обучения нейросетей: например, привести модель к сбою или изменить её поведение так, чтобы это затронуло работу других сервисов.

🛄 Успешным охотникам предоставим денежные призы: от пятидесяти тысяч до миллиона рублей.

Размер вознаграждения зависит от серьёзности ошибки, простоты её эксплуатации и воздействия на чувствительную информацию. Наиболее критичные уязвимости — это баги, которые позволяют раскрыть данные о внутренней конфигурации модели, её служебный промпт с техническими данными и так далее.

В программе участвуют все сервисы с YandexGPT или YandexART на борту:

⚪️ Алиса
⚪️ Поиск с Нейро
⚪️ Шедеврум

🌠 И другие, включая те, где ML-модель используется только для ранжирования и поиска.

🔳 Все подробности ищите здесь

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

04/10/2025, 14:04

t.me/yandexforml/714

13 574 subscribers

33

45

2.2 k

🗺 Как в Яндекс Картах прокачали recsys мест и организаций

Раньше ребята использовали только классические решения: коллаборативную фильтрацию, матричную факторизацию и градиентный бустинг. Сегодня они релизят большое обновление технологии: теперь к привычным рекомендательным инструментам добавилась нейросеть-трансформер, так что советы мест станут точнее и разнообразнее.

🔛 За подробностями переходите в статью на Хабре. В ней Владимир Жуков, руководитель группы магии рекомендаций (да, это настоящее название), подробно рассказал:

⚪️ Чем рекомендательная система Яндекс Карт отличается от технологий других сервисов
⚪️ По каким метрикам ребята оценивают её качество
⚪️ Как обучали базовую нейросеть-трансформер

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

04/09/2025, 12:00

t.me/yandexforml/713

13 574 subscribers

77

3.0 k

04/08/2025, 12:29

t.me/yandexforml/712

13 574 subscribers

20

78

2.9 k

🤖 RAG в ИИ-ассистентах для бизнеса: рассказываем про фичи нашей AI Studio

Ребята из Yandex Cloud показали AI Studio — новую среду для внедрения ИИ в продукты и бизнес-процессы. Одна из ключевых возможностей платформы — ИИ-ассистент. С его помощью можно быстро и просто создавать персонализированные версии LLM под конкретные задачи бизнеса. В первую очередь мы говорим о помощниках на основе умных поисковых систем. Они дают пользователю полноценный ответ на вопрос, а не просто показывают ссылки на источники.

LLM может работать со многими типами файлов: PDF, Word, TXT, Excel, CSV и другими. Узнать подробности и почитать документацию наших ИИ-ассистентов можно в ML SDK.

Почитать про ассистентов можно в документации, а больше примеров ищите в SDK.

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

04/08/2025, 12:29

t.me/yandexforml/707

13 574 subscribers

77

3.0 k

04/08/2025, 12:29

t.me/yandexforml/711

13 574 subscribers

78

2.9 k

04/08/2025, 12:29

t.me/yandexforml/708

13 574 subscribers

77

2.9 k

04/08/2025, 12:29

t.me/yandexforml/709

13 574 subscribers

77

3.0 k

04/08/2025, 12:29

t.me/yandexforml/710

13 574 subscribers

29

70

3.3 k

⚡️ Мы открываем новый набор в Школу анализа данных Яндекса

Это двухгодичная программа от Яндекса, на которой мы учим разрабатывать сервисы и приложения на базе ML, решать задачи анализа данных, создавать системы хранения и обработки больших данных и многому другому. Мы уже начали набор на новый поток.

Почему ШАД

ШАД даёт выпускникам глубокие фундаментальные знания и учит применять их на практике, поэтому для наших студентов открыты любые карьерные пути как в научной деятельности, так и в компаниях.

Программы разработаны экспертами Яндекса, преподавателями ведущих университетов и исследователями, работающими в современных областях компьютерных наук.

Мы учим студентов разрабатывать высокотехнологичные продукты на основе машинного обучения, применять ML-инструменты в науке и бизнес-задачах и создавать инфраструктуру для хранения больших данных. Посмотреть программу обучения можно здесь.

Можно поступить по одному из двух треков:

⚪️ Классическому для студентов старших курсов и выпускников технических вузов и СПО
⚪️ Альтернативному для разработчиков и аналитиков с высшим образованием и опытом работы более 3 лет после выпуска, а также выпускников аспирантуры

🔳 Подавайте заявку, если хотите учиться у лучших. До встречи в ШАД!

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

04/07/2025, 12:00

t.me/yandexforml/706

13 574 subscribers

21

2.0 k

04/04/2025, 13:01

t.me/yandexforml/703

13 574 subscribers

21

2.0 k

04/04/2025, 13:01

t.me/yandexforml/702

13 574 subscribers

21

2.0 k

04/04/2025, 13:01

t.me/yandexforml/705

13 574 subscribers

21

2.0 k

04/04/2025, 13:01

t.me/yandexforml/701

13 574 subscribers

4

21

2.1 k

🧿 Собрать, разобрать, починить, переделать, обменять, изобрести — и рассказать об этом

25 и 26 апреля в Москве пройдёт фестиваль «Чинители прекрасного». Программа насыщенная и разнообразная, легко растеряться. Поэтому мы подготовили краткий обзор того, как провести время на «Чинителях». Выбирайте самое интересное, регистрируйтесь на нужный слот — и до встречи на фестивале!

↔️ Зарегистрироваться

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

04/04/2025, 13:01

t.me/yandexforml/700

13 574 subscribers

21

2.0 k

04/04/2025, 13:01

t.me/yandexforml/704

13 574 subscribers

123

3.0 k

04/03/2025, 15:01

t.me/yandexforml/694

13 574 subscribers

123

3.0 k

04/03/2025, 15:01

t.me/yandexforml/696

13 574 subscribers

124

3.0 k

04/03/2025, 15:01

t.me/yandexforml/698

13 574 subscribers

123

3.0 k

04/03/2025, 15:01

t.me/yandexforml/697

13 574 subscribers

123

3.0 k

04/03/2025, 15:01

t.me/yandexforml/695

13 574 subscribers

123

3.0 k

04/03/2025, 15:01

t.me/yandexforml/699

13 574 subscribers

41

124

2.8 k

🔗 Пополнение в нейросемье Яндекса

Мы запускаем бета-версию Нейроэксперта — сервиса, который сам найдёт нужную информацию в файлах и ссылках пользователя. В бета-версии вы можете загрузить в него до 25 файлов разных форматов: от таблиц до аудиосообщений или ссылок. Нейроэксперт ответит на все вопросы по материалам и не добавит ничего от себя.

⚪️ Нейроэксперт подскажет, где найти нужные цифры в горе документации, чтобы вам не пришлось просматривать каждый файл вручную. Или поможет выбрать новый робот-пылесос, основываясь на мнении ваших любимых обзорщиков — достаточно только добавить ссылки на их статьи или видео.

⚪️ Ответ пользователю формирует YandexGPT 5 Pro, опираясь на свои знания о языке и мире. Однако модель не использует собственную память, а анализирует данные из загруженных документов. За объединение сведений из файлов, ссылок и знаний нейросети отвечает RAG-система (Retrieval Augmented Generation).

🔳 Воспользоваться сервисом можно по ссылке. Нейроэксперт доступен бесплатно всем пользователям, в том числе клиентам Яндекс 360.

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

04/03/2025, 15:01

t.me/yandexforml/693

13 574 subscribers

2

61

2.6 k

📪 Лето возможностей вместе с Яндексом

Young&&Yandex открыли набор сразу в семь Летних школ. Занятия начнутся в июне, но подать заявку и приступать к тестовому заданию можно уже сейчас.

Что такое Летние школы Яндекса?
Это бесплатные интенсивы, которые проходят в командах Яндекса и помогают участникам начать карьеру в IT. Больше половины выпускников получают офер — становятся стажёрами и сотрудниками компании.

Какие и для кого:
⚪️ Школа бэкенд-разработки
⚪️ Школа менеджеров Яндекса
⚪️ Школа аналитиков-разработчиков
⚪️ Школа мобильной разработки
⚪️ Школа разработки интерфейсов — для фронтендеров
⚪️ Школа обеспечения качества — для инженеров по тестированию
⚪️ Школа DevOps и SRE — КИТ

Формат обучения:
Каждая школа проходит в два этапа:
🔛 Онлайн — лекции и домашние задания
🔛 Офлайн — проектная работа в командах Яндекса

🔳 Регистрация открыта до 27 апреля

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

04/02/2025, 13:00

t.me/yandexforml/692

13 574 subscribers

25

32

2.8 k

🛄 Instruct-версия YandexGPT 5 Lite в опенсорсе!

Недавно мы выложили в опенсорс pretrain-версию маленькой модели из самого нового семейства наших LLM. За месяц её скачали более 15 тысяч раз, а энтузиасты уже создали на её основе более десятка квантизованных моделей.

Теперь мы идём дальше — и публикуем instruct-версию. В том числе в формате, совместимом с llama.cpp (как и просило сообщество).

⚪️ В статье на Хабре кратко рассказываем, как обучали и тестировали модель в бенчмарках.

⚪️ Разработчики и исследователи могут скачать нейросеть на Hugging Face. Протестировать модель можно локально в GGUF-формате.

⚪️ Пользователи могут попробовать модель онлайн в чате с Алисой, а бизнес — в Yandex Cloud через API и ML SDK.

⚪️ Модель будет полезна инженерам и исследователям, которые работают с AI-решениями и кастомизацией моделей.

⚪️ Мы также обновили лицензию — теперь можно использовать модель в любых целях, включая коммерческие, если объём выходных токенов не превышает 10 миллионов в месяц.

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

04/01/2025, 18:02

t.me/yandexforml/691

13 574 subscribers

6

21

1.9 k

🔗 Чат-бот на ИИ, картинки в 4K и списки фильмов, которые вам понравятся, — обо всём этом в новом ML-дайджесте

📖 Почитать

⚪️ ML-проекты полны сюрпризов. Мы собрали для вас чек-лист из 6 вопросов, на которые стоит ответить перед началом проекта, чтобы через полгода вся работа не пошла прахом

⚪️ Как сделать своего ИИ-бота в Телеграме. Рассказали эксперты из AI Studio

⚪️ Почему рекомендациями Алисы занимается отдельная команда. И как советовать музыку и фильмы, когда пользователь совсем ничего не лайкает

⚪️ Что значит быть тимлидом. Подробно рассказали об обязанностях руководителя, чтобы разработчики с амбициями менеджера задумались, нужно ли им такое счастье

⚪ Статья Scale-wise Distillation of Diffusion Models от Yandex Research про метод дистилляции в мультишаговую генерацию с поэтапным увеличением разрешения.

🚙 События

⚪️ Почти 160 человек пришли на ML Party в Санкт-Петербурге. Рассказываем, как это было, и делимся записями докладов

⚪️ 25 и 26 апреля приходите на «Чинителей прекрасного». Это смесь IT-конференции и открытой мастерской, где можно починить сломанную технику и собрать что-нибудь интересное

🌎 Новости

⚪️ Мы обновили линейку наших визуальных генеративных моделей. Самая мощная версия YandexART 2.5 Pro генерирует картинки в 4K и доступна владельцам новой подписки в Шедевруме

⚪️ Наша свежая текстовая модель YandexGPT 5 Pro появилась на LLM Арене на русском языке. Залетайте и сравните её с аналогами от других компаний в слепом тестировании

⚪️ Недавно Yandex B2B Tech открыл техническое превью SourceCraft — платформы для разработки IT-продуктов. А мы спросили у разработчиков, почему они решились сделать такой сложный продукт

⚪ Alibaba выпустила мультимодальную модель Qwen 2.5-Omni-7B, показывающую хорошие результаты в задачах с текстом, видео, звуком и генерацией речи.

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

03/28/2025, 17:01

t.me/yandexforml/690

13 574 subscribers

25

64

2.6 k

🧿 Тренировки — новый сезон и новое всё: темы, задачи и бонусы

Открываем набор на Тренировки — подтянем алгоритмы и прокачаем новую тему в ML.

↔️ В этом сезоне изучим фундаментальные алгоритмы и поговорим про Computer Vision. Решайте задачи, смотрите лекции и тренируйтесь вместе с Яндексом.

Тренировки пройдут онлайн, бесплатно и с бонусами для лучших участников:

⚪️ пробное собеседование и фаст-трек в Яндекс
⚪️ промокод в Маркет на 3000 ₽
⚪️ проходка на фест Young Con
⚪️ а ещё для самых активных проведём очную бонусную лекцию по ML

🔳 Выбирайте трек (можно оба) и регистрируйтесь!

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

03/27/2025, 13:00

t.me/yandexforml/689

13 574 subscribers

45

14

2.5 k

🛄 Спасибо, что были с нами на ML Party

Почти 160 участников присоединились к нам в Санкт-Петербурге, и мы подумываем о более крупных форматах в будущем. Следите за новостями, чтобы не пропустить новые анонсы!

↔️ Также мы провели 6 экскурсий по офису и надеемся, что вам было интересно заглянуть к нам «за кулисы».

Особая благодарность нашим спикерам за содержательные доклады! Если вы что-то пропустили или хотите пересмотреть, вот ссылки:

⚪️ Константин Кузнецов рассказал, как сделать из TTS настоящие аудиокниги. Смотрите на YouTube или в VK.

⚪️ Евгений Паринов поделился особенностями поискового аукциона Яндекс Маркета. Смотрите на YouTube или в VK.

⚪️ Антон Клочков продолжил рассказ о развитии картиночной мультимодальности в Яндексе. Смотрите на YouTube или в VK.

📷 Фотографии с мероприятия — ищите себя по ссылке

📪 До новых встреч!

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

03/26/2025, 13:31

t.me/yandexforml/688

13 574 subscribers

20

2.3 k

03/25/2025, 13:35

t.me/yandexforml/683

13 574 subscribers

20

2.3 k

03/25/2025, 13:35

t.me/yandexforml/684

13 574 subscribers

19

2.3 k

03/25/2025, 13:35

t.me/yandexforml/687

13 574 subscribers

20

2.3 k

03/25/2025, 13:35

t.me/yandexforml/685

13 574 subscribers

20

2.3 k

03/25/2025, 13:35

t.me/yandexforml/686

13 574 subscribers

20

2.3 k

03/25/2025, 13:35

t.me/yandexforml/682

13 574 subscribers

27

20

2.3 k

🛄 Как Алиса советует музыку и фильмы

В умных устройствах рекомендации работают иначе, чем в Яндекс Музыке и Кинопоиске. Разбираемся, почему это так и как мы учим ИИ понимать вас.

👷 Рассказывают Виктор Януш и Иван Артемьев из группы медиарекомендаций.

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

03/25/2025, 13:35

t.me/yandexforml/679

13 574 subscribers

20

2.3 k

03/25/2025, 13:35

t.me/yandexforml/680

13 574 subscribers

20

2.3 k

03/25/2025, 13:35

t.me/yandexforml/681

13 574 subscribers

24

82

2.8 k

AI-ассистент_small.mp4

🤖 Делаем чат-бота на ИИ

Yandex Cloud показал новую среду для внедрения ИИ-инструментов в продукты — AI Studio. Например, в ней можно создать умный поиск по базам данных и встроить его по API в оболочку чат-бота в мессенджере. И это только один пример продуктового применения LLM — всё остальное ограничено только вашим воображением.

🔳 На видео продуктовый архитектор наших ML-сервисов Дмитрий Рыбалко показал, как всё работает. Код для этого телеграм-бота вы можете найти на GitHub.

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

03/24/2025, 12:30

t.me/yandexforml/678

13 574 subscribers

12

2.1 k

03/21/2025, 14:01

t.me/yandexforml/676

13 574 subscribers

12

2.0 k

03/21/2025, 14:01

t.me/yandexforml/674

13 574 subscribers

12

2.1 k

03/21/2025, 14:01

t.me/yandexforml/677

13 574 subscribers

12

2.0 k

03/21/2025, 14:01

t.me/yandexforml/675

13 574 subscribers

12

2.0 k

03/21/2025, 14:01

t.me/yandexforml/672

13 574 subscribers

14

12

2.0 k

↔️ Как появился SourceCraft — новый продукт для разработчиков от команд Yandex Cloud & Yandex Infrastructure

Недавно Yandex B2B Tech открыл техническое превью платформы, в которой можно разрабатывать и сопровождать программные продукты.

📪 Мы пошли за подробностями к Сергею Бережному, директору по взаимодействию с разработчиками в Яндексе. А ещё Сергей рассказал, какие подходы применяли при разработке нашей платформы и при чём тут лошадь на колёсах. Подробности читайте в наших карточках!

🔳 Попробовать SourceCraft можно по ссылке.

А в новом выпуске подкаста «Как мы делаем Yandex Cloud» CEO и CTO SourceCraft Дима Иванов и Серёжа Захарченко рассказали, с каким бэкграундом они пришли в команду, как родилось название платформы, про стек технологий и SourceCraft Code Assistant, а ещё каково это — разрабатывать SourceCraft на SourceCraft.

🌠 Смотрите на YouTube, Rutube и VK Видео
🌠 Слушайте на Яндекс Музыке
🌠 Или на любой удобной подкаст-платформе

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

03/21/2025, 14:01

t.me/yandexforml/669

13 574 subscribers

12

2.0 k

03/21/2025, 14:01

t.me/yandexforml/673

13 574 subscribers

12

2.0 k

03/21/2025, 14:01

t.me/yandexforml/671

13 574 subscribers

12

2.0 k

03/21/2025, 14:01

t.me/yandexforml/670

13 574 subscribers

38

54

2.2 k

🔗 Работа над ML-проектами полна сюрпризов. Вот чек-лист вопросов, которые стоит задать себе ещё на берегу

Привет, я Даня Яковлев, руководитель разработки поиска Маркета. Я хочу помочь вам избежать авантюрных идей, которые в теории звучат хорошо, а на деле превращаются в тыкву по ходу проекта! Итак, начнём.

↔️ Какую задачу мы решаем на самом деле?

Расплывчатые цели редко приводят к хорошему результату. Например, как-то к нам пришли с запросом: сделайте выдачу релевантнее, пользователи жалуются, что им сложно искать товары. На деле оказалось, что трудности возникают не из-за релевантности (с ней как раз всё в порядке), а из-за слабой персонализации. Поэтому любые цели стоит сперва почелленджить, чтобы докопаться до сути. Вполне может оказаться, что задача на самом деле стоит другая, и понять это нужно как можно раньше.

↔️ Что будет критерием успеха?

Измеримые метрики — наше всё. Когда мы начинали заниматься персонализацией поиска, у нас не было способа оценить выдачу. Субъективные впечатления не сочетались с бизнес-метриками. Когда мы поднаторели в этой игре, то стали оптимизировать retention, повторные покупки и так далее. И дела сразу пошли в гору!

↔️ Какой у нас бейзлайн? Точно ли тут нужен ML?

Иногда простые эвристики могут дать результат не хуже сложных моделей. А их внедрение кратно дешевле и быстрее. Далеко не все ленты смогут одолеть простую советскую фичу «показать историю пользователя».

↔️ Как и на чём мы будем обучаться?

Когда мы запускали на Маркете fashion, у нас не было данных для этого среза поиска. Мы сформировали два подхода к решению этой проблемы. Во-первых, можно было обучить ранжирование по внешним источникам. Во-вторых, просто запуститься и отсортировать товары в выдаче по текстовым эвристикам и популярности, что намного проще. И уже дальше копить информацию, чтобы потом обучать по ней модели. Второй подход одержал верх. Хотя данных и было меньше, они оказались чистыми и попадали ровно в нужную задачу. Качество оказалось важнее количества!

↔️ Какие проблемы могут возникнуть в проде?

Важно не забывать про масштаб. Несколько лет назад мы внедряли новый класс нейронок в наш высоконагруженный поиск. На бумаге во время ресёрча всё было отлично. Но непосредственно при внедрении мы столкнулись с проблемами: не хватало GPU для инференса и памяти под полученные большие эмбеддинги. Пришлось делать шаг назад и начинать сначала с моделями поменьше.

Мы ловили и более сложные проблемы. Например, у нас есть классификатор категории запросов. После того как мы его обучили, он честно работал. Но со временем качество стало медленно деградировать. Оказалось, что категории на Маркете изредка меняются. Мы добавили регулярное переобучение, и всё стало хорошо.

↔️ Достаточно ли гибкое решение, которое мы выбрали?

Почти всегда в проектах возникают фичи за рамками первоначального плана. Нужно учитывать эти риски при проектировании.

Типичный кейс: приходит жалоба на то, что более дорогой товар в выдаче выше, чем дешёвый. С ним же приходит и решение скорить выше более дешёвые товары. Это даже может сработать без серьёзных поломок поиска — но вскоре к вам придут с предложением бустить товары с высоким рейтингом. После нескольких итераций ваша поисковая система начинает разваливаться из-за жадной оптимизации.

Правильным решением было бы все эти параметры складывать в ML-ранжирование, которое оптимизирует полезные действия пользователей, а не додумывать самим, что хорошо, а что плохо.

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

03/19/2025, 13:00

t.me/yandexforml/668

13 574 subscribers

15

34

2.9 k

🧑‍🏫 ML Party начнётся уже через час

Подключайтесь к трансляции в 19:00, чтобы послушать хардовые доклады и задать свои вопросы в прямом эфире.

⚪️ Константин Кузнецов, руководитель группы интонации в Поиске и рекламных технологиях, расскажет, как из простого TTS сделать настоящие аудиокниги

⚪️ Евгений Паринов, руководитель группы ранжирования поисковой выдачи в Екоме и Райдтехе, покажет, что такое поисковый аукцион Яндекс Маркета и как он работает

⚪️ Антон Клочков, руководитель подгруппы распознавания текста в VLM в Поиске и рекламных технологиях, продолжит серию рассказов про развитие картиночной мультимодальности в Яндексе

🔳 Смотрите трансляцию по ссылке на сайте. А ещё в VK и на YouTube.

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

03/18/2025, 18:02

t.me/yandexforml/667

13 574 subscribers

8

23

2.3 k

🔗 Нейросети делают подарки, любуются звёздами и читают книжки, к которым сами нарисовали обложки, — всё это в нашем ML-дайджесте

🚗 Куда сходить

⚪️ 18 марта встречаемся в Питере и онлайн на МL Party. В программе три хардовых доклада на темы VLM, RecSys и Speech

⚪️ 25 и 26 апреля загляните на «Чинителей прекрасного» в Москве. Это фестиваль инженерной мысли с настоящей мастерской, воркшопами и общением

⚪️ Приходите выступать на infra.conf’25 от Yandex Infrastructure. Конференция пройдёт в начале июня, а подать заявку на выступление можно до 5 апреля

📖 Почитать

⚪️ Как мы внедрили YandexGPT в Переводчик, чтобы учитывать контекст на уровне документов, а не отдельных предложений

⚪️ NeurIPS. Собрали для вас тренды, инсайты и самые интересные статьи главной ML-конференции года

⚪️ Как эволюционировали диффузионки: от каскадных моделей до генерации картинок в 4K

⚪️ Наш новый спецпроект о том, как технологии Яндекса живут после релиза: нейросети помогают изучать небо и за секунды обрабатывают медицинскую статистику

⚪️ На них можно запустить не только Doom: почему именно видеокарты помогают ИИ стать умнее

⚪️ Наш нейросетевой коллаб с Золотым Яблоком. Как мы учили YandexART создавать уникальные подарочные карты

🌎 Новости

⚪️ Ребята из Яндекс Книг нарисовали 10 тысяч обложек для классических произведений. Не обошлось без YandexGPT и YandexART

⚪️ Вышли модели Saiga и Vikhr, которые созданы на базе опенсорсной YandexGPT 5 Lite 8B Pretrain

▶️ Записи с ML-тренировки Data Dojo:

⚪ Как доставать ответы из финансовой отчётности с помощью мультимодального LLM-агента. Смотрите на ютубе или в VK.

⚪️ Обучаем трансформеры для дискриминативных задач. Смотрите на ютубе или в VK.

⚪️ Как использовать лик в данных и получить серебро на соревнованиях по ML. Смотрите на ютубе или в VK.

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

03/14/2025, 13:00

t.me/yandexforml/666

13 574 subscribers

3

25

2.4 k

↔️ Ищем спикеров на infra.conf’25 от Yandex Infrastructure

В июне мы соберём около 1000 разработчиков на офлайне infra.conf’25, чтобы обсудить инфраструктурные решения Яндекса и других компаний.

Как и в прошлый раз, ждём доклады про создание и эксплуатацию высоконагруженных систем и приложений, платформенную разработку, базы данных и облачные технологии, тестирование и безопасность, ML-инфраструктуру и опенсорс-решения.

🔳 Приём заявок уже открыт и продлится до 5 апреля включительно. На этом этапе нам не нужен полностью готовый доклад, достаточно черновых тезисов и общего плана. Финальное решение примем до 20 апреля.

🔛 Подать заявку и узнать подробности можно тут.

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

03/13/2025, 15:24

t.me/yandexforml/665

13 574 subscribers

24

2.1 k

03/11/2025, 12:32

t.me/yandexforml/659

13 574 subscribers

26

24

2.0 k

↔️ Путь от каскадных моделей до генерации изображений в 4K

Привет, это Сергей Кастрюлин. Я работаю в команде Yandex Research и занимаюсь исследованиями в области компьютерного зрения и генеративных нейросетей. В этом посте предлагаю вместе вспомнить главные релизы открытых картиночных моделей за последние два года.

А в статье на Хабре раскрываю подробности. Обсуждаем: борьбу каскадной и латентной парадигм, дилемму между свёрточными моделями и трансформерами и новые формулировки диффузии. А ещё там я рассказываю о дистилляции как о методе решения основной проблемы картиночных моделей — низкой скорости генерации.

🔳 Прочитать статью на Хабре

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

03/11/2025, 12:32

t.me/yandexforml/656

13 574 subscribers

24

2.1 k

03/11/2025, 12:32

t.me/yandexforml/661

13 574 subscribers

24

2.1 k

03/11/2025, 12:32

t.me/yandexforml/660

13 574 subscribers

24

2.1 k

03/11/2025, 12:32

t.me/yandexforml/663

13 574 subscribers

24

2.1 k

03/11/2025, 12:32

t.me/yandexforml/664

13 574 subscribers

24

2.1 k

03/11/2025, 12:32

t.me/yandexforml/662

13 574 subscribers

24

2.1 k

03/11/2025, 12:32

t.me/yandexforml/657

13 574 subscribers

24

2.1 k

03/11/2025, 12:32

t.me/yandexforml/658

13 574 subscribers

9

30

2.7 k

🦾 Докладчик рассказывает про разработку роботов для склада. У вас в руках паяльник, и вы меняете сломанный разъём для наушников. Вот такой концепт.

📆 25 и 26 апреля в Москве пройдут «Чинители прекрасного» — необычная смесь IT-конференции и открытой мастерской, где можно обменяться опытом, обсудить технологии, починить сломанную технику и собрать что-нибудь интересное.

Присоединяйтесь! Берите с собой сломанные гаджеты, любимую отвёртку и истории про инженерное мышление в неожиданных обстоятельствах. Не стесняйтесь, если у вас нет опыта, запчастей или инструментов, — научим, поделимся, поможем и поддержим.

⚪️ Выбирайте, в какой день вы хотите пойти. 25 апреля вас ждёт вечеринка с выступлениями, воркшопами, техносвопом и диджеем. Мастерская тоже будет работать, но со слотами по полтора часа и записью на месте. 26 апреля можно заранее записаться в мастерскую на 3 часа, а утром прийти с ребёнком и вместе сходить на мастер-класс.

🔳 По ссылке — все детали и кнопка «Регистрация». К заявке можно приложить свою историю про железки — это необязательно, но будет плюсом

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

03/10/2025, 14:34

t.me/yandexforml/655

13 574 subscribers

17

22

2.1 k

🔗 NeurIPS: тренды, инсайты и 15 километров статей на главной ML-конференции года

Conference on Neural Information Processing Systems всегда собирает огромное количество гостей и участников со всего мира, потому что здесь академия встречается с индустрией. Шесть дней конференции выдались очень насыщенными. Оцените масштаб:

⚪️ 4497 статей (из них 460 — по датасетам и бенчмаркам, 8 — от авторов из Yandex Research)
⚪️ 13 640 ревьюеров, которые эти статьи отбирали
⚪️ 15 километров постерных докладов: ширина каждого стенда — 2–3 метра, а постеров очень много
⚪️ 56 воркшопов
⚪️ 14 туториалов

Выбрать самое интересное и полезное среди такого объёма информации — задача, честно сказать, нетривиальная. В статье на Хабре рассказываем, как её решили наши коллеги: Настя Беззубцева из Алисы, Катя Серажим из Поиска и Алексей Друца из Yandex Cloud.

🔳 Читать статью

Подписывайтесь:
💬 @Yandex4ML
📹 @YandexML

03/07/2025, 15:02

t.me/yandexforml/654

13 574 subscribers

35

2.6 k

03/06/2025, 12:05

t.me/yandexforml/649

13 574 subscribers

35

2.6 k

03/06/2025, 12:05

t.me/yandexforml/651

13 574 subscribers

35

2.6 k

03/06/2025, 12:05

t.me/yandexforml/647

13 574 subscribers

35

2.6 k

03/06/2025, 12:05

t.me/yandexforml/650

13 574 subscribers

35

2.6 k

03/06/2025, 12:05

t.me/yandexforml/648

Search results are limited to 100 messages.

Some features are available to premium users only.

You need to buy subscription to use them.

Filter

Reset filters

Publication date

Search in file name

Message type

Repost

Original

Deleted message

Message is not deleted