Your trial period has ended!
For full access to functionality, please pay for a premium subscription
MA
Mashkka про Data Science
https://t.me/mashkka_ds
Channel age
Created
Category
Language
Russian
1.98%
ER (week)
6.79%
ERR (week)

Погружение в Data Science и технологии GenAI

Messages Statistics
Reposts and citations
Publication networks
Satellites
Contacts
History
Top categories
Main categories of messages will appear here.
Top mentions
The most frequent mentions of people, organizations and places appear here.
21
3
670
#пятничныемемасы
05/09/2025, 14:01
t.me/mashkka_ds/2337 Permalink
Repost
24
35
540
7 мая — день Радио. 📻
Админ канала @hukenovs однажды запилил большой бесплатный курс по цифровой обработке сигналов с примерами на python. 📡

Список лекций: 📖
— Сигналы: аналоговые, дискретные, цифровые. Z-преобразование,
— Преобразование Фурье: амплитудный и фазовый спектр сигнала, ДПФ и БПФ,
— Свертка и корреляция. Линейная и циклическая свертка. Быстрая свёртка
— Случайные процессы. Белый шум. Функция плотности вероятностей
— Детерминированные сигналы. Модуляция: АМ, ЧМ, ФМ, ЛЧМ. Манипуляция
— Фильтрация сигналов: БИХ, КИХ фильтры
— Оконная фильтрация. Детектирование слабых сигналов с помощью наложения окна,
— Ресемплинг: децимация и интерполяция. CIC-фильтры, фильтры скользящего среднего
— Непараметрические методы спектрального анализа
— Полифазные схемы преобразования Фурье — усреднение по частоте и по времени
— Банки фильтров в задачах аудиокодирования
— Фильтры Фарроу
— Мел-спектрограммы
— Кепстр и MFCC
— Вейвлет-преобразование
— Алгоритм Герцеля

В создании материалов принимали участие @karinakvanchiani @lizaforlizard и @vhs_glitch 💪
Для всех желающих курс доступен на гитхабе.

Предложения и замечания принимаются.

Stay discrete and quantized! 📶
05/07/2025, 22:11
t.me/mashkka_ds/2336 Permalink
Repost
21
6
692
Сбер на конференции NAACL’25 🎉

В Нью-Мексико проходит NAACL’25 — одна из крупнейших международных конференций по NLP (обработке естественного языка)

В этом году подали 3 246 научных работ и только 22% из них прошли отбор. Среди принятых — заявка от Сбера 🏆

Коллеги из двух научных команд представили работу по эмбеддерам — это продолжение исследования, с которым мы ранее выступали на ICLR

Пожелаем коллегам успехов и новых научных прорывов!
05/07/2025, 07:21
t.me/mashkka_ds/2335 Permalink
Repost
15
17
555
🔺 Тут коллеги недавно обновили аудиомодальность в Гигачате

🔸 Интересно это потому, что теперь работа с аудио идёт не через ASR (распознавание речи в текст) с передачей текста в обычную языковую модель, а через аудио-эмбеддинги, которые подаются в контекст LLM.

🔸 То есть все звуки, шумы, смех и пение птичек не теряются на этапе транскрибации, а обрабатываются наравне с текстовым промптом, позволяя модели "слышать" звуки.

🔸 Так как аудио-эмбеддинги предварительно сжимаются, то в контекст сейчас можно передать запись длиной более 2-х часов. Можно даже просто передать ссылку на YouTube и попросить пересказать или сделать конспект.

🔸 Попробовал сгенерить timestamp'ы по видео, но так пока не умеет. Надо, видимо, дополнительно добавлять временные метки вместе с аудио или обогащать SFT сет такими задачами.

🔸 Зато работает с любыми записями, пересказывает даже матерные стендапы.

С удовольствием почитал как ребята это сделали на уровне архитектуры и обучения, предлагаю и вам. У кого есть аккаунт, ставьте лайк.

👉 Хабр
05/05/2025, 20:50
t.me/mashkka_ds/2334 Permalink
#justaboutme Backstage NAACL из New Mexico

Альбукерке - уникальный во всех смыслах город, где так удивительно смешались Индейские, Мексиканские и Испанские культуры. Здесь суровый климат, дикая сухость и разреженный от высоты воздух, такой что первые дни кружится голова.
Здесь, выйдя на улицу ты попадаешь в сериал про провинциальную Америку, здесь советуют не гулять по ночам, не ездить в темноте на такси, на окнах везде решетки, а на заправках висят предупреждения "С оружием не входить".
Альбукерке - удивительный город, у которого при всем этом есть свой шарм. А еще рядом есть прекрасные горы и именно здесь проходит знаменитый фестиваль воздушных шаров.

#mashkka_usa #трудовыебудни #новостисполей
05/05/2025, 04:20
t.me/mashkka_ds/2324 Permalink
2
712
05/05/2025, 04:20
t.me/mashkka_ds/2333 Permalink
3
705
05/05/2025, 04:20
t.me/mashkka_ds/2328 Permalink
3
699
05/05/2025, 04:20
t.me/mashkka_ds/2326 Permalink
3
715
05/05/2025, 04:20
t.me/mashkka_ds/2332 Permalink
3
704
05/05/2025, 04:20
t.me/mashkka_ds/2330 Permalink
3
699
05/05/2025, 04:20
t.me/mashkka_ds/2327 Permalink
27
3
698
#justaboutme Backstage NAACL из New Mexico🇺🇸

Альбукерке - удивительный город. Здесь суровый климат, иссушающих кожу воздух, а от высоты первые дни кружится голова. Здесь на окнах везде решетки, туристам советуют не гулять по ночам, а на заправках висят объявления "С оружием не входить".

Здесь ты будто попадаешь в сериал про провинциальную Америку. И при всем этом у города есть свой шарм и неповторимый колорит из смеси мексиканской, испанской и индейской культур. А еще рядом есть горы и именно здесь проходит знаменитый фестиваль воздушных шаров.

❕#justaboutme - воскресная рубрика, в которой я делюсь яркими событиями из своей жизни, не связанными с DS и ИТ подобно тому, как я это делаю в соцсетях.

#mashkka_usa #новостисполей #трудовыебудни
05/05/2025, 04:20
t.me/mashkka_ds/2325 Permalink
3
703
05/05/2025, 04:20
t.me/mashkka_ds/2329 Permalink
2
711
05/05/2025, 04:20
t.me/mashkka_ds/2331 Permalink
14
33
689
👀А ты следишь за конференциями в области Data Science?
Попросили поделиться ресурсами, где можно следить за топовыми конференциями по Data Science и NLP.

My top 3:
1️⃣Основной сайт с дедлайнами конферениций (отдельно дедлайны по NLP). Выбираем нужные тэги и ищем.
2️⃣Основные мероприятия ACL, крупнейшей мировой ассоциации по NLPю
3️⃣Основной сайт с рангами конференций, который сегодня используют во всем мире.

@mashkka_ds

#mashkka_singapore
05/03/2025, 20:40
t.me/mashkka_ds/2323 Permalink
19
7
708
🎤Мы на NAACL'25

Представила наше исследование The Russian-focused embedders’ exploration: ruMTEB benchmark and Russian embedding model design на NAACL'25, которая сейчас проходит в New Mexico. Статья на NAACL посвящена новой русско-ориентированной модели для эмбеддингов текстов ru-en-RoSBERTA и оценке эмбеддеров на русском. Обучили и выложили в открытый доступ ru-en-RoSBERTA, которая с момента релизом стала почти стандартом в области русскоязычных эмбеддеров, а также сделали бенчмарк для оценки текстовых эмбеддингов на русском ruMTEB, который затем интегрировали в мультиязычный MMTEB.

ruMTEB включает 23 датасета, разделенных на 7 типов задач, а также имеет открытый leaderboard, на котором представлены основные современные модели текстовых эмбеддингов, поддерживающие русский язык.

Спасибо всем соавторам из команд AGI NLP и RnD для B2C, которые делали это исследование вместе со мной!

✔️Статья
✔️Модель ru-en-RoSBERTA
✔️Leaderboard
✔️Пост на хабр
✔️Постер
✔️Видео с докладом
✔️Презентация

@mashkka_ds

#mashkka_usa #новостисполей #трудовыебудни
05/03/2025, 19:19
t.me/mashkka_ds/2322 Permalink
27
4
809
Настроение #пятничныемемасы
05/03/2025, 05:10
t.me/mashkka_ds/2321 Permalink
41
4
812
Прямой эфир с NAACL, где я прямо сейчас презентую нашу работу по эмбедддингам текстов и их оценке. Пожелайте мне удачи, а детали расскажу чуть позже.


#трудовыебудни #mashkka_usa #новостисполей
05/02/2025, 19:38
t.me/mashkka_ds/2320 Permalink
25
2
842
🇺🇸NAACL: новости с NLP полей🇺🇸

NAACL'25, крупнейшая NLP конференция уровня A*, в самом разгаре В этом году на конференцию было подано 3246 работ, что гораздо больше, чем в прошлые года. А принято было лишь 719, что есть acceptance rate 22,15%, что даже меньше, чем на ICLR. Среди основных тем конференции в топе Resources&Evaluation, NLP Applications, Interpretability, Efficiency/Low-Resource.

А совсем скоро я от нашей команды буду представлять исследование, связанное с текстовыми эмбеддерами и их оценкой. Не переключайтесь!

#трудовыебудни #mashkka_usa #новостисполей
05/02/2025, 18:35
t.me/mashkka_ds/2319 Permalink
8
800
Пост с которым я согласна на 200%
05/01/2025, 15:07
t.me/mashkka_ds/2317 Permalink
Repost
48
15
655
Недавно на одной встрече, очень большой начальник заметил: с учётом того, что мы теперь много нанимаем по всему миру и в разных часовых зонах, умение писать становится критически важным.

Спорить с этим сложно, и переоценить важность тоже. К сожалению, многие люди катастрофически не умеют формулировать свои мысли — отсюда все эти «давай быстро созвонимся», «пересечёмся раз на раз» или голосовые сообщения. Не всегда, но очень часто это происходит не потому, что встреча действительно нужна, а потому что человек просто не в состоянии организовать свой словесный салат во что-то внятное. В итоге он выливает свои мысленные помои на собеседника в надежде, что тот переработает это во что-то осмысленное — вместо того чтобы самому потратить время и внимание.

Черчилль как-то написал: «Прости, времени было мало, поэтому письмо длинное». И почти все это понимают на подсознательном уровне — отсюда все мемы и приколы про голосовые сообщения. Сложно переоценить важность хорошей культуры письма: она не только экономит кучу времени и сил, позволяет работать асинхронно, но со временем ещё и учит человека мыслить собранно и чётко.

Возможно, не стоит доходить до пределов ребят из провинции Лакония с их «если», но пример с них брать точно стоит. В здоровом письме — здоровый дух. А лучшая встреча - это короткая встреча
05/01/2025, 15:07
t.me/mashkka_ds/2318 Permalink
33
5
765
Привет из New Mexico🇺🇸

Топовые конференции следуют одна за другой и сразу после ICLR в Сингапуре я отправляюсь в New Mexico на другой сторону Земли, где сегодня началась конференция NAACL'25, на которой я буду всего через пару дней презентую наш рисерч. Правила вы знаете, делюсь новостями под тэгом #новостисполей и #mashkka_usa.

#трудовыебудни
05/01/2025, 01:35
t.me/mashkka_ds/2316 Permalink
2
541
04/28/2025, 12:57
t.me/mashkka_ds/2315 Permalink
2
540
04/28/2025, 12:57
t.me/mashkka_ds/2314 Permalink
2
541
04/28/2025, 12:57
t.me/mashkka_ds/2312 Permalink
2
538
04/28/2025, 12:57
t.me/mashkka_ds/2308 Permalink
2
538
04/28/2025, 12:57
t.me/mashkka_ds/2309 Permalink
12
2
562
#justaboutme самые сочные краски Сингапура🇸🇬

Самые сочные фотографии из Сингапура в чуть запоздавшем воскресном посте.

❕#justaboutme - воскресная рубрика, в которой я делюсь яркими событиями из своей жизни, не связанными с DS и ИТ подобно тому, как я это делаю в соцсетях.

#mashkka_singapore #justaboutme #новостисполей
04/28/2025, 12:57
t.me/mashkka_ds/2307 Permalink
2
543
04/28/2025, 12:57
t.me/mashkka_ds/2310 Permalink
2
541
04/28/2025, 12:57
t.me/mashkka_ds/2313 Permalink
2
543
04/28/2025, 12:57
t.me/mashkka_ds/2311 Permalink
Repost
1
588
04/28/2025, 11:42
t.me/mashkka_ds/2306 Permalink
Repost
12
1
577
04/28/2025, 11:42
t.me/mashkka_ds/2304 Permalink
Repost
1
588
Сбер на конференции ICLR 🤖

Сейчас в Сингапуре проходит крупнейшая международная конференция по Data Science. На ней команда Сбера презентовала работу MMTEB (Massive Multilingual Text Embedding Benchmark) — мультиязычный бенчмарк по оценке текстовых эмбеддеров

Эмбеддеры — модели, которые переводят текст в векторы (т. е. сопоставляют каждому тексту набор чисел). Таким образом, дальше их можно использовать для самых разных задач, связанных с текстами: от поиска в интернете до классификаций и кластеризаций, поэтому оценка таких моделей крайне важна

MMTEB — крупный международный проект, который наши учёные дополнили частью для оценки русскоязычных моделей ruMTEB

Желаем коллегам ещё больше масштабных проектов и прорывных результатов 🔝
04/28/2025, 11:42
t.me/mashkka_ds/2305 Permalink
Repost
8
3
569
RuMTEB в составе  MMTEB на ICLR2025.

Мои тигриные львы и львухи (для олдов львицы) на ICLR2025. 💃🥳
Мы начали этот путь с работы по бенчмарку ruMTEB и вошли в состав авторов международного MMTEB (в части ру языка). 

Впереди нас ждет еще одна конференция по бенчмарку и ru-en-RoSBERTa. Но об этом позже.
04/26/2025, 16:23
t.me/mashkka_ds/2302 Permalink
Repost
3
601
04/26/2025, 16:23
t.me/mashkka_ds/2303 Permalink
6
2
616
✨Мы на ICLR✨

Хотела скромно написать, что мы поехали на ICLR со статьёй про MMTEB - большой международный коллаборативный проект по созданию бенчмарка для эмбеддингов текстов. В рамках коллаборации мы расширили этот бенчмарк на русский язык своей частью - ruMTEB. Но @dealerai описал наше достижение гораздо сочнее меня, поэтому просто репостну его пост.

⬇️Читай!⬇️
04/26/2025, 16:22
t.me/mashkka_ds/2299 Permalink
2
623
04/26/2025, 16:22
t.me/mashkka_ds/2300 Permalink
2
623
04/26/2025, 16:22
t.me/mashkka_ds/2301 Permalink
Repost
5
14
505
🌸Летняя школа LxMLS 2025🌸
#nlp #про_nlp

Небольшое объявление для тех, что ещё только начинает свой путь в машинном обучении и NLP: заканчивается подача заявок на обучение в 15-й Лиссабонской школе машинного обучения — LxMLS 2025.

Школа фокусируется на широком спектре тем по ML, от теории до практики, с уклоном в обработку естественного языка.

🟣Кому это подойдёт:
— студенты и аспиранты в области NLP и компьютерной лингвистики;
— начинающие индустриальные специалисты в ML, LLM
(Я сама ездила, будучи студентом, и было очень хорошо!)

• Срок подачи заявок: 28 апреля (осталось 2 дня)
• Уведомление о зачислении: 13 мая
• Летняя школа: с 19 по 25 июля

🟣Особенности LxMLS:

• Глубокие предварительные знания в области ML или NLP не требуются, но предполагается, что участники имеют базовые знания математики и программирования;

• Дни разделены на утренние лекции и послеобеденные лабораторные занятия и практические доклады;

• Будут и классические методы, и эти ваши трансформеры.

• Лекторы — ведущие исследователи в области машинного обучения и обработки естественного языка.

🟣Список лекторов:

  ADÈLE H. RIBEIRO Philipps-Universität Marburg | Germany
ANDRÉ MARTINS University of Lisbon & Unbabel | Portugal
BEIDI CHEN Carnegie Mellon University | USA
BHIKSHA RAJ Carnegie Mellon University | USA
DESMOND ELLIOTT University Of Copenhagen | Denmark
KYUNGHYUN CHO New York University | USA
LUCAS DIXON Google DeepMind
MÁRIO FIGUEIREDO University of Lisbon | Portugal
MAXIME PEYRARD Computer Science Laboratory of Grenoble | France
NOAH SMITH University of Washington & Allen Institute for Artificial Intelligence | USA
SARA HOOKER Cohere for AI | Canada
SWETA AGRAWAL Google

🟣Сайт летней школы: http://lxmls.it.pt/2025/ 
🟣Заявку подавать здесь: http://tiny.cc/apply-lxmls2025
04/26/2025, 16:12
t.me/mashkka_ds/2298 Permalink
Repost
8
11
598
До закрытия приёма заявок на школу по искусственному интеллекту «Лето с AIRI» в ТГУ — всего 4 дня!

Все лекции и семинары прошлого года доступны в VK Видео — загляните, чтобы почувствовать атмосферу Школы и вдохновиться на участие.

Подавайте заявки по ссылке до 29 апреля 23:59📌
04/25/2025, 15:52
t.me/mashkka_ds/2297 Permalink
17
8
678
#пятничныемемасы
04/25/2025, 15:31
t.me/mashkka_ds/2296 Permalink
20
6
766
🇸🇬Непрямой эфир с открытия ICLR

Конференция ICLR в Сингапуре самом разгаре.

🙀Ловите основные цифры и оцените масштаб:
✔️10k+ очных участников
✔️12k поданных работ
✔️3000+ принятых статей (Acceptance Rate = 25%)
✔️А среди основных топиков LLM, Diffusion Models, RL и бенчмарки.

👏В этот раз организаторы очень большое внимание уделили процессу ревью и привлекли огромное количество ревьюеров, чем добились того, что каждый ревьюил в среднем <2,5 работ. (Думаю, те кто участвовал в последних циклах ARR с жёсткой нехваткой ревьюеров и по 10-16 работами на ревьюера, сейчас апплодируют стоя).

🤖А еще впервые они ввели AI- помощника: ревьюеров оценивала LLM, которая давала советы, как можно улучшить ревью по структуре и сделать его более конструктивным.

@mashkka_ds

#трудовыебудни #llm #новостисполей #mashkka_singapore
04/25/2025, 06:54
t.me/mashkka_ds/2295 Permalink
27
5
712
Сингапурские новости с полей ICLR🇸🇬

Второй раз (про первый визит сюда на EMNLP'23 читай тут) в Сингапуре и второй раз приезжаю сюда на конференцию со статьёй. В этот раз, презентуем работу на ICLR - крупнейшей мировой конференции по Data Science.

Следите за новостями с ICLR под тегом #новостисполей.

#трудовыебудни #mashkka_singapore #новостисполей
04/24/2025, 07:08
t.me/mashkka_ds/2294 Permalink
1
675
04/22/2025, 20:22
t.me/mashkka_ds/2292 Permalink
1
678
04/22/2025, 20:22
t.me/mashkka_ds/2289 Permalink
19
1
684
04/22/2025, 20:22
t.me/mashkka_ds/2288 Permalink
1
678
04/22/2025, 20:22
t.me/mashkka_ds/2290 Permalink
1
677
#backstage глазами спикера🎤

На выходных участвовала в дискуссии про ИИ на ГЭС-2, проходившей здесь в честь университетской субботы. Отличный повод дойти до этого места, где я собиралась побывать с самого открытия.

Разговор про креативность вышел очень интересным, за полтора часа обсудили столько креативных идей и пришли к выводу, что у ChatGPT отлично развита дивергентная креативность. Спасибо за отличную дискуссию и за возможность поговорить на любимую тему с такими замечательными людьми.

#трудовыебудни #гэс2 #веснавгороде #ии
04/22/2025, 20:22
t.me/mashkka_ds/2293 Permalink
1
675
04/22/2025, 20:22
t.me/mashkka_ds/2291 Permalink
50
3
712
5️⃣Круглая отличница OTUS: 555 уроков за 5 лет5️⃣

Сегодня отмечаю отличную круглую цифру в Otus: 555 проведенных вебинаров за 5 лет! Для меня самой это неожиданный сюрприз - увидела цифру, случайно на платформе и поняла, что чуть не пропустила такой важный юбилей!

5 лет и 2000+ выпускников - приятно осознавать, что этим трудом ты помог стольким людим стать на шаг ближе к технологиям Data Science и ИИ!

#преподавание #отус #datascience #ai #трудовыебудни
04/21/2025, 14:00
t.me/mashkka_ds/2287 Permalink
04/20/2025, 20:40
t.me/mashkka_ds/2283 Permalink
1
851
04/20/2025, 20:40
t.me/mashkka_ds/2285 Permalink
29
843
👠#justaboutme человечки в моей голове, что пора танцевать high heels

Новая мистическая и такая французская хореография вышла просто 🔥 Не буду загадывать, что получится в итоге, но это точно были самые лучшие два часа этих выходных! Обожаю процесс съемок, а с танцами иду по жизни всегда!

❕#justaboutme - воскресная рубрика, в которой я делюсь яркими событиями из своей жизни, не связанными с DS и ИТ подобно тому, как я это делаю в соцсетях.
04/20/2025, 20:40
t.me/mashkka_ds/2278 Permalink
04/20/2025, 20:40
t.me/mashkka_ds/2280 Permalink
04/20/2025, 20:40
t.me/mashkka_ds/2279 Permalink
04/20/2025, 20:40
t.me/mashkka_ds/2281 Permalink
04/20/2025, 20:40
t.me/mashkka_ds/2284 Permalink
1
850
04/20/2025, 20:40
t.me/mashkka_ds/2286 Permalink
1
848
04/20/2025, 20:40
t.me/mashkka_ds/2282 Permalink
10
11
917
🎙Неизданные главы большого интервью для @kantor_ai (часть 2)

Наш разговор с @kantor_ai получился насколько насыщенным, что не уместился в один подкаст.

Встречайте вторую часть с самыми острыми темами про AI и работу в Data Science.

👀 Смотрим на YouTube
👉Первая часть тут

@mashkka_ds

#ai #datascience #agi
04/20/2025, 09:46
t.me/mashkka_ds/2277 Permalink
Repost
21
2
698
Сегодня у нас в гостях #Типичный_айтишник Маша. Не восхищаться Машей невозможно, поэтому мы просто оставим ее интервью вам, читайте и влюбляйтесь.

- Кто ты и чем занимаешься?

Я Маша Тихонова (aka @mashkka_ds), Руководитель Исследовательского направления команды AGI NLP в Сбере. Кандидат компьютерных наук, доцент ВШЭ, занимаюсь исследованиями в области обработки естественного языка и преподаю.

- В каких самых крутых проектах ты участвовала?

В создании бенчмарка MERA для оценки больших языковых моделей (LLM) на русском языке, разработке модели mGPT - мультиязычной LLM для 61 языка, бенчмарка ruMTEB для оценки русскоязычных эмбеддеров.

- Как ты начала заниматься тем что делаешь сейчас?

Высшее образование я получила на Мехмате МГУ по специальности «Фундаментальные математика и механика». Математика интересовала меня с детства, тут я пошла по стопам родителей, но я никогда не хотела быть тем ученым, который только на бумаге доказывает теоремы — мне это казалось скучным, хотелось делать что-то, что будет находить практическое применение и будет полезно людям.
Я всегда хотела найти прикладное применение математических знаний и на третьем курсе я, пройдя серьезный отбор, поступила в Школу Анализа Данных, где увлеклась машинным обучением и поняла, что это как раз то, с чем я хочу связать свою жизнь. Мои усилия определенного стоили того.

- Что самое интересное в работе?

Как я сказала, я всегда хотела найти прикладное применение математических знаний, а не просто быть ученым, который на бумаге доказывает теоремы и Data Science дает такую возможность. Здесь у меня есть возможность воплощать в жизнь свои идеи, применяя свои знания для создания крутых вещей на острие науки. Я люблю то, что я делаю, мне это интересно и атмосфера в нашей команде AGI NLP максимально заряжает тебя на новые идеи.

- Твой совет для тех, кто начинает путь в Data Science.

Область ИИ сегодня развивается с такой скоростью, что за событиями порой бывает сложно следить. Поэтому, вступая на путь DS, готовьтесь что постоянно придется изучать что-то новое: новые методы, модели, библиотеки. Data Science - область для креативных людей, которые не боятся изучать новые технологии в первых рядах
04/19/2025, 11:23
t.me/mashkka_ds/2276 Permalink
22
29
706
Уровень принятия рабочих неожиданностей - бесконечность
#пятничныемемасы
04/18/2025, 07:06
t.me/mashkka_ds/2275 Permalink
30
14
879
✨Уроки ИИ в школе

Сегодня увидела у коллег на столе Учебники по ИИ(!) за 5 и 9 классы. Так абалдела, что решила заглянуть внутрь... Ох, лучше бы не заглядывала.

Первое попавшееся задание в учебнике за 9й класс (уровень, когда школьники сдают ОГЭ и решают зубодробительную геометрию): зайдите в Яндекс.Браузер и изучите как работает автоматический переводчик (смотрите скрин, если не верите мне). Может еще зайти в поиск и попробовать загуглить там, например, ГДЗ!

Я абсолютно точно поддерживаю введение дисциплины с основами ИИ и машинного обучения в школе, но не в таком же формате. В 9ом классе ребята вполне способны освоить основы машинного обучения и программирования на Python. Дальше основ пойти сложно - для этого нужна высшая математика и линейная алгебра, но основные концепции - вполне. А преподавать, что умеет Яндекс.Браузер - это скорее для подготовишки, точно не для людей, которые изучают дисциплину с 5го класса.

❔Кстати, а есть среди вас школьники/родители школьников? Расскажите, вводят ли у вас этот предмет? И что преподают на нем? А то я совсем не в теме....
04/17/2025, 20:33
t.me/mashkka_ds/2273 Permalink
14
869
04/17/2025, 20:33
t.me/mashkka_ds/2274 Permalink
12
14
792
🐾По следам вебинара AI агенты на основе LLM: что нас ждет?

На открытом вебинаре от курса NLP.Advanced рассказала про новые перспективы, которые открывают перед нами агенты на основе LLM.

✅И да, вы не ослышались, это действительно наш новый продвинутый курс по LLM NLP.Advanced, в программу которого мы вложили самое крутое, что есть сегодня по LLM и трансформерам: от классической архитектуры трансформеров до современных мультимодальных моделей, современных библиотек типа vLLM и введения в LLM-агентов. Стартуем уже 30 апреля, вас ждет увлекательное погружение в мир LLM! А ты с нами?

👀Запись
💭Слайды
👩‍🏫Программа NLP.Adnvaced

🎚 @mashkka_ds

#ml #otus #nlp #datascience #llm #aiagents
04/17/2025, 06:18
t.me/mashkka_ds/2272 Permalink
4
880
04/16/2025, 19:13
t.me/mashkka_ds/2271 Permalink
28
4
884
✨МарьИванна идет на MERA meetup

Как вы знаете, наш основной проект - бенчмарк MERA, который содержит 23 задачи для LLM. Среди них набор вопросов из "Что?Где?Когда?", тесты на программирование и даже ЕГЭ.

Сложность в том, что модели стремительно умнеют, и тесты для них нужно делать все сложнее. А как правильно, какие именно навыки оценивать, и как сделать так, чтобы честно, непредвзято и чтобы задачи не были слиты в претрейн - непростые вопросы....

...которые мы собрались обсудить научным NLP-сообществом на MERA meetup. Новый формат "коллективного" брейншторма и обсуждения. Митап вышел продуктивным, почерпнули множество идей, теперь осталось воплотить их в жизнь!

#трудовыебудни #митап #llm #ai #ghibistyle #chatgpt
04/16/2025, 19:13
t.me/mashkka_ds/2270 Permalink
Repost
1
9
119
GPT 4.1 Prompting Guide

Помимо самой GPT 4.1, OpenAI выпустили большой гайд о том, как эту версию промптить.

Казалось, что мы уже немного ушли от необходимости писать длинные инструкции, но нет - опять возвращаемся к этому.

Настоятельно советуется использовать три типа напоминалок для модели:
• Persistence - напоминать модели, чтобы думала до конца решения проблемы, в не возвращала ответ слишком рано
• Tool-calling - напоминать использовать инструменты
• Planning - напоминать модели, что планировать и рефлексировать полезно.

Как-то мне кажется, что это шаг назад - модели вроде итак должны этому следовать. С другой стороны, почти весь Deep Learning - это шаманство, алхимия, махание руками и надежда на то, что очередной трюк успешно сработает. Или, как это называется по-умному - experimentation and trial and error :)

Кстати, их системный промтп на SWE-bench Verified занимает почти 80 строк.

#datascience
04/15/2025, 06:59
t.me/mashkka_ds/2269 Permalink
7
3
388
⚡Молния от OpenAI: GPT-4.1 уже в API

Только что OpenAI представили новую линейку GPT-4.1, в которой улучшена работа с кодом, следование инструкциям и расширен контекст:

GPT‑4.1 model family offers exceptional performance at a lower cost

OpenAI запустили в API 3 модели: GPT‑4.1, GPT‑4.1 mini и GPT‑4.1 nano, которые обходят GPT‑4o на основных задачах.

🖊Пост от OpenAI
👀Презентация на YouTube

@mashkka_ds

#chatgpt #gpt #gpt41 #gpt4.1 #openai #llm #nlp
04/14/2025, 17:46
t.me/mashkka_ds/2268 Permalink
Repost
1
1
Ощутите на себе ГИГА-эффект нового GigaChat 2.0 🔥

Новый GigaChat 2.0 теперь с вами! Встречайте нейросеть с крутыми возможностями и скорее пробуйте сами 👇

🟢найдёт актуальную информацию в интернете и даст ответы со ссылками на источники
Подбери крутой детектив на вечер

🟢проанализирует документы до 200 страниц
Сделай краткий обзор этой научной статьи и выдели главные открытия [приложить pdf-файл]

🟢создаст музыку и песни по вашему запросу
Сочини романтическую песню о весне в Петербурге в стиле джаз

🟢проанализирует голосовые сообщения и аудиофайлы длиной до 60 минут
Выслушай мою идею и составь по ней бизнес-план [ваша аудиозапись]

🟢распознает изображения — от расшифровки медицинских анализов до советов по стилю
Мне пришла квитанция ЖКХ. Объясни, за что я плачу? [фото квитанции]

🟢проанализирует ссылки
сравни основные идеи этих двух статей: [ссылка1] и [ссылка2]

🔘А умные колонки Sber теперь полностью под управлением GigaChat 2.0: обработка запросов станет ещё быстрее, а общение — ещё более естественным
Салют, объясни теорию относительности семилетнему ребёнку

➡️ Попробуйте на сайте, в телеграм-боте и в новом мессенджере MAX от VK и испытайте настоящий ГИГА-эффект

😎 Ваш помощник всегда рядом
04/14/2025, 16:12
t.me/mashkka_ds/2267 Permalink
1
14
04/13/2025, 20:23
t.me/mashkka_ds/2265 Permalink
💅Upacking куклы имени меня

Вдохновилась @complete_ai и сделала себе персональную куклу. Одно фото + три нейросети и теперь у меня есть ее unpacking в разрешении 4k.

Ставьте 🔥, если хотите узнать промпты или ищите их в канале у @complete_ai (все явки-пароли уже там).

👀Spoiler: для видоса достаточно и двух нейросетей, но я же фанат качества, мне подавай 4k.

#chagpt #genai
04/13/2025, 20:23
t.me/mashkka_ds/2266 Permalink
04/13/2025, 11:08
t.me/mashkka_ds/2264 Permalink
04/13/2025, 11:08
t.me/mashkka_ds/2261 Permalink
6
113
#justaboutme Марокко - с этого все и началось

Мое исследование Африки началось с Марокко🇲🇦 в далеком 2021 году. Сегодня пришла очередь вспомнить путешествие в эту невероятную страну:
✔️Ночёвка в пустыне и встреча рассвета в Сахаре
✔️Голубой город Шефшауэн
✔️Рынок и вонючие кожаные фабрики Феса
✔️Прекрасная Эссуэйра на океанском побережье
✔️Сады Мажорель в жарком Марракеше, где гулял Ив-Сен Лоран
✔️Необъятная мечеть Хассана II в Касабланке
✔️Крепость Айт-Бен-Хаду, где снимали Игру Престолов и это еще не все...

Марокко - это смесь Востока и Запада, пустыни и океана, традиций и современности... Марокко покоряет навсегда...

❕#justaboutme - воскресная рубрика, в которой я делюсь яркими событиями из своей жизни, не связанными с DS и ИТ подобно тому, как я это делаю в соцсетях.

#марокко #africe #турафрика #justaboutme #mashkka_morocco #mashkka_africa
04/13/2025, 11:08
t.me/mashkka_ds/2256 Permalink
04/13/2025, 11:08
t.me/mashkka_ds/2257 Permalink
04/13/2025, 11:08
t.me/mashkka_ds/2258 Permalink
04/13/2025, 11:08
t.me/mashkka_ds/2260 Permalink
04/13/2025, 11:08
t.me/mashkka_ds/2263 Permalink
04/13/2025, 11:08
t.me/mashkka_ds/2262 Permalink
04/13/2025, 11:08
t.me/mashkka_ds/2259 Permalink
1
1
132
#mashkka_reading Читай!📚

Прочитала книгу "Читай!" от Игоря Манна и Ивана Малина. Если честно, сама не очень знаю зачем, но книга была легкая, а мне было лень искать что-то лучше, вот и дочитала до конца.

"Читай!" - энциклопедия, или даже онтология всего, что есть в мире книг. В ней по главам аккуратно разложено на категории все, что связано с книгами:
✔️Как читать?
✔️Что читать?
✔️Зачем читать?
✔️На чем читать?
✔️Как найти время читать?
✔️Как убедить детей читать и т. п.

В каждой главе ее тема разложена по полочкам-пунктам и кратко комментируется каждый из них.

При этом сквозь всю книгу между строк красной нитью читается мысль: "Все, кто не читает - люди, так скажем, низшего звена", и явно прослеживается, что авторы смотрят на нечитающую серую массу немного свысока. Такие вещи я не одобряю и не люблю. Я сама поддерживаю чтение, но навязывать и делить людей по этому признаку (как и по любому другому) считаю too much.

Книга показалась больше похожей на агрессивный маркетинг книг - Читай или будешь низшим звеном. Мне такая навязчивая реклама воспринимается в штыки.

Не очень понравилось и то, что авторы уверенно используют ложные мифы, связанные с чтением, выдавая их за известный всем факт. Например, в одной из глав они пишут, что из-за чтения при плохом освещении портится зрение и снижается его острота. Однако по последним исследованиям чтение при слабом освещении не приводит к близорукости, хотя и вызывает временную усталость глаз и другие неприятные вещи вроде больной головы.

Вопросы вызывают и советы из книги. Например, в главе "Как найти время на чтение" автор приводит совет Просто спите на полчаса меньше как очень неплохой - no comments...

Резюме: не самая лучшая книга, хотя и может дать пинок побольше читать, а еще структурирует все о книгах. Только прошу, не верьте всему, что там написано, перепроверяйте хотя бы с помощью ChatGPT.

✔️11-я книга за 2025

#mashkka_reading #книжнаяполка #книга #book
04/12/2025, 21:03
t.me/mashkka_ds/2255 Permalink
1
19
331
🫥#paperwatch Обзор исследований по интерпретации «мыслительных» процессов LLM

В новом выпуске #paperwatch @doomgrad разбирает последние исследования о том, как мыслят LLM.

References:
✔️ Tracing the thoughts of a large language model
✔️On the Biology of a Large Language Model
✔️Circuit Tracing: Revealing Computational Graphs in Language Models

👀Запись

#paperwatch #llm #nlp #diffusionmodels
04/11/2025, 16:22
t.me/mashkka_ds/2254 Permalink
1
1
28
#пятничныемемасы
Как это жизненно для преподавателя=)
04/11/2025, 06:55
t.me/mashkka_ds/2253 Permalink
Search results are limited to 100 messages.
Some features are available to premium users only.
You need to buy subscription to use them.
Filter
Message type
Messages
Find similar avatars
Channels 0
High
Title
Subscribers
No results match your search criteria