Página do canal Telegram: asisakov • @asisakov_channel

Просто потерпеть

Мотивация на нуле, рутина в тягость, отдых не в радость. Дедлайн горит, начальство требует, заказчики недовольны - стиснем зубы и пашем на износ, ведь, продержаться осталось еще всего ничего, а потом будет хорошо.

Не спорю, иногда сделать сверхусилие полезно и даже необходимо. Временные трудности случаются почти в любом деле, и тем более в аналитике. Надо собраться, сфокусироваться и просто добить эту важную задачу, даже если от нее уже тошнит. А что было написано в вакансии? Стрессоустойчивость - то есть способность брать себя в руки, терпеть и превозмогать сложности (ценное качество для любого кандидата!)

Студент готовится к сессии, засиживаясь ночами над конспектами. Разработчик работает без выходных, чтобы выкатить ту самую фичу к такому важному релизу. Менеджер обзванивает клиентов с утра до ночи без обедов, стараясь выполнить завышенный план продаж. Они просто терпят, прикладывают максимум усилий в конкретный момент - и в итоге повышают вероятность достижения тех самых важных целей (чьих целей, мы проговорим когда-нибудь отдельно)!

Всегда тяжело прочувствовать ту грань, когда "просто потерпеть" становится привычным состоянием, фоново влияющим на нашу жизнь. Если каждый день что-то выжимает нашу энергию без остатка (стресс тоже), то никакое терпение долго не продлится. Стресс и хроническая усталость накапливаются и просто могут вылиться во что-то более тяжелое.

Люди выгорают профессионально и эмоционально, начинают болеть, срываться на близких. Кто-то находит утешение в алкоголе или впадает в депрессию. Кто-то по 12 часов вкалывает в душном офисе, лишь бы оплатить ипотеку, а потом валится без сил после домашних забот и не может даже спокойно пообщаться с детьми. Кто-то годами занимается тем, что ему совсем неинтересно, подавляет тоску и однажды понимает, что уже не получает удовольствие от жизни. Вместо этого хочется больше историй про коллег, кто после своевременного ухода на пенсию заводит гусиную ферму и живет счастливую жизнь, потому что позволял себе не выгорать и не терпеть.

Долго держать оборону и бесконечно терпеть невозможно. Если нелюбимая деятельность изо дня в день бьет по нашему здоровью и оставляет без жизненных сил, то это та самя киллер-фича, которая должна нас смотивировать на перемены. Необязательно искать другую сферу, компанию или должность. Можно поработать над своим восприятием и границами, или хотя бы попросить у начальства более приемлемых условий и распределить нагрузку.

Иногда потерпеть полезно - но нельзя терпеть постоянно! Важно беречь себя, прислушиваться к своим чувствам и вовремя понять что, что-то не приносит радости. Каждый новый прожитый день должен повышать уровень энергии, насыщать ей. Кратковременные перепады не страшны. Важно, что будет с нами в будущем.

Короче, заниматься тем, что по душе не всегда просто, но оно того стоит. Если каждый день с удовольствием ходить на любимую работу, то ведь по сути можно и не работать? Действительно ли мы хотим того, чем живем каждый день своей жизни? Это пост, о том, чтобы призадуматься и просто порефлекстировать о будущем. Если энергии мало, то давайте действовать по такому плану. А если много, то давайте мы ее сохраним.

Пишите в комментарии ваши мысли, надеюсь я кого-то вдохновил "терпеть" меньше!

#softskills

23.04.2025, 18:53

t.me/asisakov_channel/812

AS

asisakov

1 502 assinantes

10

2

286

🚀 Почему пользователи платят $30 за простой конвертер картинок? Давайте разберемся.

Кирилл из комьюнити создал простой продукт всего за один месяц, внедрив метод, которой уже принес результат.

Как он это сделал:
1️⃣ Анализ спроса: через поисковые запросы он увидел, что много людей ищут конвертацию «HEIC to JPG».
2️⃣ Фокус на главном: удалил всё лишнее, оставив только функцию конвертации в один клик.
3️⃣ Скорость внедрения: за 30 дней сделал запуск без перфекционизма.

Посты про конвертер (ч.1, ч.2)

Что из этого получилось:
— Доход $500 в месяц с тенденцией роста.
— Более $10K заработано на конвертере.
— $0 на рекламу, всего $40 в месяц на сервер.

Выводы:
— Люди платят за удобство, даже если есть бесплатные аналоги.
— Продукт функционирует автоматически с минимальной поддержкой.
— Быстрая и экономичная проверка идеи может быть успешной.

Результаты из комьюнити билдеров:
— Более 400 запусков по этой методике.
— Некоторые продукты уже набрали от 50К до 100К+ пользователей.

Присоединяйтесь к @its_capitan — следите за процессом разработки, продвижения и узнайте, сколько можно заработать на таких микро-продуктах.

Реклама: ИП Зуев Игорь Владимирович, ИНН: 360408359441, Erid: 2VtzqwCkdCN

22.04.2025, 16:51

t.me/asisakov_channel/811

AS

asisakov

1 502 assinantes

5

3

362

Интересное что-то от ребят, кого я читаю v0.11

Предыдущий пост тут
Интересное что-то тут

Погнали по классике:

1. Антон поделился статьей с самыми неожиданными выводами: оказывается (внезапно!), при многочисленных попытках, RL не докидывает к ризонингу. А вот дистилляция оказывается может. Тут скорее вопрос в том, хватит ли у вас токенов для 256 попыток, но говорят, что кажется пора искать новые пути улучшения моделек.

2. Павел собрал интересный сервер с API на основе Fish Audio, который работает на локалке. До этого у него кстати был публичный сервачок с распознаванием речи на основе Whisper. Кстати, как работать с Whisper’ом, я вам показывал вот тут

3. Рома (говорят, что по подсказке Валеры) приложил ссылочку от пацанов с OpenRouter с их исследованием про частоту применения моделей для определенных задач. Спойлер будет - программируем с Антропиками, все остальное делаем с Гуглом. Лично мне из всего остального еще нравится Перплексити, но это уже совсем другая история. Кстати, если вам хочется сделать свой опенроутер, то еще существует опенсурсная разработка LiteLLM, про которую писал Валерий

4. Егор коротко и понятно расписал, что такое Model Context Protocol (MCP) и чем это отличается от простого function call. Короче, это что-то типа снандартизации обращений к серверам и уже готовым инструментам (понимающие поправьте)

5. Арсений выдал базу и не только про вайбкодинг. Как обычно, инструмент показывает высокую эффективность при правильном его применении. Давайте декомпозировать задачи на простые, приводить примеры и начинать заново, если уводит куда-то не туда. Короче, как со стажерами!

UPD. 6. Раф снял рилс!

#interesting

21.04.2025, 21:07

t.me/asisakov_channel/810

AS

asisakov

1 502 assinantes

23

7

310

Все меняется

Раньше было проще: Вроде бы выучился на специалиста в одной области и работаешь себе спокойно. Кажется, что сейчас так не прокатит. И это отчетливо прослеживается: я и сам учился на инженера (и посещал те самые пары по информатике), потом на рисерчера, а сейчас вон настоящий датасаентист. Каждую неделю появляются новости о появлении новых ллмок или технологий. FOMO уже просто перекрывает кислород - хочется быть на острие всего, а для этого нужно постоянно учиться после работы и даже не спать.

Какая несколько лет назад была топ парадигма - так это «M-shaped» специалисты. Такие ребята, которые шарят и в своей теме, и в паре соседних (типа как нынешние синьоры, которые еще наполовину тимлиды). При этом не зацикливаются на одном, легко учатся и переключаются на новые области. Считалось (мб и до сих пор считается), что такие люди соображают, как из новых идей сделать что-то полезное для бизнеса на стыке своих знаний.

В чем проблема - всегда нужно делать выбор, в какую ветку вкачать свои Скиллы в свободное/вместо от работы время. Опять курсы, опять погружение с нуля, опять эти непонятные для чего домашки. А потом снова начинаешь ботать с нуля новое направление и так без конца.

Зачем?

Недавно я переосмыслил этот подход. Например, на работе у нас есть проект по ML, который очень сильно связан с геоаналитикой и пространственными данными. И, как оказалось, чтобы сделать крутой проект, не обязательно ботать эту дисциплину. По привычке я начал читать обзорные статьи и вдруг этого оказалось достаточно для легкого погружения! Достаточно понять базу, а дальше - погружаться по необходимости. Главное - быстро сделать прототип и протестировать, пока идея актуальна. Сейчас мы уже работаем над третьей итерацией, а я даже успел еще немного погрузиться в урбанистику.

Прикиньте сколько времени пришлось бы ждать, если бы мне нужно было сначала все заботать, а потом только делать?

Короче, раньше можно было не спеша пилить идеальный продукт. Сейчас это уже нас может тормозить. Пока мы медлим, кто-то уже тестирует гипотезы на реальных юзерах. Сейчас важна скорость: запустили MVP, собрали фидбек, подкрутили, что надо - и вперёд. Шаг за шагом, итерация за итерацией - так и рождаются мертвые пет-проекты крутые работающие продукты.

Конечно, чтобы так работать, нужно быть гибким и постоянно учиться, пробовать что-то новое. Недостаточно просто разбираться в технических деталях, надо видеть общую картину и понимать, куда движется бизнес (быть M-shaped?). Именно такие ребята становятся незаменимыми в команде.

В будущем будет еще меньше времени и свободного внимания. Сейчас - это то, когда нужно не бояться пробовать новое и быстро адаптироваться. Меняться, учиться, тестировать идеи. Мы хотим быть на гребне волны? Давайте развивать в себе эти навыки.

#softskills

18.04.2025, 21:49

t.me/asisakov_channel/809

AS

asisakov

1 502 assinantes

41

14

378

Сон внутривенно

В универе в те самые времена, когда хочется проживать каждую секунду жизни с максимальной отдачей и успевать все, я выработал для себя привычку поздно ложиться и поздно вставать. 10 лет назад это не кажется чем-то критичным, когда ты не спишь ночь, чтобы сдать в тот самый последний возможный день этот дурацкий курсач по Теории Машин и Механизмов. Все ставки на сейчас, другой возможности не будет. Не важно, какое состояние, не важны другие дела - есть цель, иду к цели. Да, это время максимального фокуса, это большие риски и большие ставки. И большая нагрузка на молодой организм, который все 17-18-19 лет до этого рос по одному режиму.

Во времена универа мы сбивали наши долгосрочные наработанные состояния для краткосрочных задач. Что мешает делать курсач каждую неделю по 2 часа и сдать вовремя? Ничего! Это просто неинтересно, наш фокус на другом.

Я и сейчас такой - засиживаюсь допоздна за ноутбуком, думая, что так смогу добиться большего. Держим фокус, не растрачиваем энергию на лишнее. И знаете, иногда на следующий день так не хватает этой драгоценной энергии.

Что мешает доделать свое дело не сейчас, а в другой день? Ничего! Но наш фокус на этом.

Вот если бы был сон в витаминах/порошке/капсулах? Внутривенно тоже нет? Не спал всю ночь, а с утра зарядился без последствий (не кофе и не энергетиком, etc.). Минус к утренней злости и разбитости, минус к постоянной усталости и апатии, плюс к заряженности и энергии. Мозг отдохнул, тело восстановилось, эффективность на все 100.

Мечтать не вредно!

Во сне происходят удивительные вещи - укрепляется память, проясняются мысли, восстанавливаются мышцы и кости. А мы порой относимся к этому так легкомысленно, гордимся своим недосыпом и литрами выпитого кофе, помогающим заглушить хронический недостаток сна. Мы все знаем, что это путь к серьезным проблемам со здоровьем.

Что будет написано на вашей могиле? "Он так упорно работал, спал по 4-5 часов, что в итоге получил сердечный приступ в 45 лет"

Мы можем все изменить? Очевидно, можем, и оттого тяжелее, что это просто, рутинно и скучно. Я знаю решение - нам достаточно лишь начать ценить свой сон. Отказаться от кофе во второй половине дня, не есть за 4 часа до сна, а ужинать соотвествующей этому периоду дня едой. Для тех, кто готов пойти дальше - спать в прохладной комнате с охладающейся простыней и тяжелым охлаждающимся одеялом.

Не забудьте про ледяную бочку!

Ну а по утрам - обязательно выходить на солнце, пусть даже на пару минут. Просто пройтись, просто походить, просто подышать свежим воздухом, желательно рядом с деревьями и подальше от машин. Иногда мне кажется, что это нереально - просто просыпаться бодрым и полным энергии, без мучительных "еще пять минуточек".

Предлагаю к нашему фокусу на достижениях включить еще фокус на хороший сон.

Это не просто время отключки, это наша энергия, это наше состояние, это наша эффективность. Хорошо спим - уже что-то. По классике полезные ссылочки на посмотреть/почитать/послушать: 1, 2, 3, 4, 5

@asisakov_channel

#life

17.04.2025, 21:54

t.me/asisakov_channel/808

AS

asisakov

1 502 assinantes

19

1

334

#meme

15.04.2025, 20:48

t.me/asisakov_channel/807

AS

asisakov

1 502 assinantes

5

7

342

Интересное что-то от ребят, кого я читаю v0.10

Предыдущий пост тут
Интересное что-то тут

Пока идет самый разгар трансляции про новые гпт-модельки от клозедэйай, давайте вспомним что-нибудь интересное:

1. Марина собрала список интересных ссылочек от Генриха, где есть модельки, связанные с causal inference и инструментами продуктовой аналитики. Например, там есть Meridian, который вроде бы помогает сделать Market Mix Modeling (сюда бы я еще добавил Robyn). Есть ссылочки на модели с CLTV и даже вероятностным CLTV. Короче, рекомендую ознакомиться.

2. Максим написал пост про retrievers в RAGах. В том числе сразу расписаны понятия про Sparse и Dense Retrieval. Кстати, мы с ребятами недавно заводили раги, и как раз в части ритривалов столкнулись с некоторым трейдоффом - а как же делать правильно? А никак, надо тестить все гипотезы!

3. Алексей поделился кажется важнейшим откровением (в его путешествии в СФ) о том, что при питчинге своих продуктов надо дарить не факты и знания, а эмоции. Важно продавать свою компанию таким образом, что вот это она одна та самая на один миллион, которая совершит прорыв! (возможно совет подействует не только на инвесторов)

4. Наш Тоха (дратути) недавно выступал на ML Party в Питере и приложил ссылочку на видео с его выступлением. Там он поделился челленджами, которые были, когда они заводили VLMки. Кстати, недавно у команды Антона был крупный релиз, в котором они участвовали, даже можно потыкать.

5. Просто офигенную ссылку на большой гайд по аудиомоделькам (TTS/STT/STS) нашел Андрей. Вы просто посмотрите, как там все структурированно написано про косты, хаки при обучении и подобное. Ну и страничку конечно вайбово оформили.

6*. Вишенка на торте - парой постов выше Андрей (да, который был в пункте 5 только что) выложил ссылочку на интересный скандал с Deel и корпоративным шпионажем. Самое смешное про топор, телефон и унитаз. Ну а дальше спойлерить не буду 😂

#interesting

14.04.2025, 21:31

t.me/asisakov_channel/806

AS

asisakov

1 502 assinantes

11

306

Почему комент важен - Валера уже достаточно долго занимается разработкой и сейчас лидит команду разработки безналичный платежей в финтехе Яндекса. Про работу безналичных карт даже есть доклад с его рассказом. Очевидно, что он в это погружен намного сильнее меня, так еще и бесплатно оставляет комментарии под постами💪🏿

Кстати, Валеру я читал еще даже до Интересного Что-то, когда он оставлял интересные комменты в ЦМФ и в квантовских чатиках (не зря же квант), а в блоге писал про чай и философию. Сейчас там больше постов про менеджерство и рациональный подход к этому (по классике репостится в мой второй канал). Короче, вот ссылка, если вам интересно.

13.04.2025, 13:06

t.me/asisakov_channel/805

AS

asisakov

1 502 assinantes

8

306

Ну вообще говоря здесь у тебя в списке код ревью решает вопросы, которые лучше решаются другими инструментами

1) код стиль и оформление — линтеры + форматтеры, всякие там цикломатические сложности и т.п.
2) чувствительная информация и токены должны отыскиваться автоматическими проверками, см. гитхаб секьюрити
3) покрытие тестами тоже автоматически можно проверять
4) инъекции тоже умеют искать статические анализаторы
^^^^^ вот это всё машины делают лучше людей, надо только в пацплайн сборки включить

Вот про логгер я не знаю, как автоматизировать, просто смотреть блейм и по рукам бить написать гайдлайн, одно правило можно запомнить

5) у тебя есть пояснительная записка к ПРу (некая форма технического дизайна), но при этом проверяется не там этот дизайн на этапе до написания кода, а уже написанный код, где дизайну отведена вспомогательная роль. Оптимальнее сделать наоборот: ревью дизайна, это легче, там человеческий язык, нет кучи файлов и всякого кодгена; а потом просто поглядеть, что в коде то же, что в дизайне (при наличии некоторого уровня доверия можно вообще не смотреть)
Иначе получается, что есть какой-то козёл отпущения, который должен все пры смотреть неделю, а те, кто эти пры заводят, должны ждать, пока их посмотрят. Они за время ожидания теряют контекст, берут другую задачу, потом пытаются восстановить контекст, чтобы поправить замечания к пру — теряем ресурс, короче.
И в этот же пункт можно отнести тест кейсы, их нужно прописать в дизайне, чтобы ДО написания кода понимать, как должно работать в итоге 😁
Я много раз ошибался пропуская этот этап, тратил время на написание того, что не нужно вообще

13.04.2025, 13:03

t.me/asisakov_channel/804

AS

asisakov

1 502 assinantes

4

286

Помните, я писал про 👀-ревью. Там в коменты пришел наш Валера (не крипто, а который квант) и дал очень достойный комментарий. Я его сейчас просто перешлю сюда, а вы почитайте.

13.04.2025, 13:03

t.me/asisakov_channel/803

AS

asisakov

1 502 assinantes

17

8

387

Никто:
Абсолютно никто:
Статья, где есть временные ряды: Давайте возьмем линейный клеточный автомат (ЛКА) для прогноза!

Короче, оказывается применение такого метода довольно распространено, и очень даже интересно с точки зрения оценки динамики изменения параметров в зависимости от параметров ряда. Что-то близкое к Markov chain, genetic algorithms, ant colony mechanisms. Очевидно, что все это разные модельки - жду специалистов по всем этим темам в комментариях, поясните пожалуйста 🤔

У меня в одно время были мысли рассмотреть возможность изменения параметров во времени для прогнозы путем введения некоторой динамики, а тут вдруг оказывается это широко распространено!

P.S. Все равно некоторые параметры конечно статичны - и эту статику надо как-то сделать динамикой (в том числе через частое переобучение)

Еще пара статей просто из выдачи: 1, 2, 3

#ml

12.04.2025, 19:24

t.me/asisakov_channel/802

AS

asisakov

1 502 assinantes

2

377

11.04.2025, 21:13

t.me/asisakov_channel/798

AS

asisakov

1 502 assinantes

3

407

11.04.2025, 21:13

t.me/asisakov_channel/801

AS

asisakov

1 502 assinantes

4

385

11.04.2025, 21:13

t.me/asisakov_channel/797

AS

asisakov

1 502 assinantes

3

380

11.04.2025, 21:13

t.me/asisakov_channel/800

AS

asisakov

1 502 assinantes

3

380

11.04.2025, 21:13

t.me/asisakov_channel/799

AS

asisakov

1 502 assinantes

2

377

11.04.2025, 21:13

t.me/asisakov_channel/795

AS

asisakov

1 502 assinantes

4

383

11.04.2025, 21:13

t.me/asisakov_channel/794

AS

asisakov

1 502 assinantes

3

380

11.04.2025, 21:13

t.me/asisakov_channel/796

AS

asisakov

1 502 assinantes

3

378

11.04.2025, 21:13

t.me/asisakov_channel/793

AS

asisakov

1 502 assinantes

17

2

377

Давно не было мемов, давайте исправлять!

#meme

11.04.2025, 21:13

t.me/asisakov_channel/792

AS

asisakov

1 502 assinantes

15

9

397

Рекомендации на 👀-ревью

Вспомнил тут, что у нас были обсуждения код-ревью, но каких-то итоговых экшенов мы не прописали. Давайте я попробую сформулировать некоторые стандарты, а вы накидайте улучшений в комментариях.

1️⃣Общие принципы

🔸Наличие обязательно как минимум одного аппрува от человека из пула проверяющих (список согласуется заранее). Без этого в прод катить нельзя.
🔸Назначить ответственного человека из команды, у которого в течение недели например освобождается некоторый ресурс на проведение ревью.
🔸Проводить ревью в промежуток до 2-3 дней после создания пулл-реквеста. Хотфиксы конечно лучше проверять сразу же и скорее выкатывать.
🔸Использовать конструктивные комментарии и без обращения к личностям: "Код содержит ошибку" вместо "Ты сделал ошибку".
🔸Перед тем как докопаться, лучше выяснить причины: "Почему здесь используется этот подход?" вместо "Переделай это"
🔸Избегаем попадания секретных ключей и токенов в код!
🔸В пулл-реквесте обозначена задача, которую решает код и по возможности приложена ссылочка на доп. материалы
🔸Чекаем, что код делает именно то, что заявлено
🔸Смотрим наличие логгера
🔸В коде отсутствует чувствительная информация

2️⃣Что по коду:

▫️Пишем читабельный(!) код
▫️Обязательно проверяем описание классов, функций и переменных
▫️Код естественно по PEP 8 и соответствует общекомандным принципам написания (типа SOLID)
▫️Убеждаемся, что нет неиспользуемых функций, переменных и закоментированных кусков кода
▫️Код разделен на логические модули и нет сильных нагромождений
▫️Есть аннотации типов, докстринги для всех функций и методов
▫️Параметры прописаны в отдельном конфиге, а не в коде

3️⃣Тесты, ошибки и исключения:

▪️Выводим конкретное исключение вместо общего Exception
▪️Пишем в логгер достаточно контекста для отладки
▪️Проверяем покрытие тестами критических моментов
▪️В тестах должны быть не только успешные, но и ошибочные сценарии

4️⃣Запросы и БД:

▫️Еще раз проверяем отсутствие ключей!
▫️Также проверяем соответствие одному стилю написания запросов
▫️Проверяем обработку SQL-инъекций
▫️В SELECT прописываем только необходимые столбцы, избегаем звездочек

Естественно, тут я пробежался по верхам, специально несколько раз упомянул про чувствительную информацию и ключи! Думаю, в больших командах разработки скорее даже есть жесткие регламенты по проведению код-ревью.

Если есть что добавить, welcome в комментарии!

#code

10.04.2025, 21:07

t.me/asisakov_channel/791

AS

asisakov

1 502 assinantes

37

5

271

Вдохновление вдохновленное

В мире сломано много копий в размышлениях о том, как важно найти в жизни самого нужного человека. Который не просто будет рядом, а станет частью тебя, будет не только единомышленником, но и источником вдохновения.

Если два человека объединяют свои усилия и стремятся к общим целям, они способны достичь гораздо большего, чем поодиночке 1+1=11. И это может не только изменить жизнь самих людей, но и всего окружения.

Мне невероятно повезло, что я встретил именно такую девушку и еще могу называть её своей женой. Сегодня у Насти День Рождения, и я хочу поделиться с вами тем, как много она значит для меня.

Моя жена - удивительный человек, который не только разделяет мои взгляды на жизнь, но и привносит в неё свои уникальные идеи и стремления. Вместе мы постоянно растём, развиваемся и поддерживаем друг друга в достижении наших общих целей. Глядя на неё, я понимаю, что рядом с ней я способен на многое.

Но помимо общих устремлений, нас объединяют и общие ценности. Для нас обоих важно не только личное благополучие, но и возможность привнести в наш мир что-то новое, менять его к лучшему. Я считаю, что именно в этом и заключается один из главных смыслов жизни.

Ее поддержка, любовь и мудрость помогают мне становиться лучше каждый день. Я благодарен судьбе за то, что мы вместе идём по жизни, разделяя наши радости и преодолевая трудности. Пусть впереди нас ждёт ещё много удивительных открытий, свершений и простого человеческого счастья.

Короче, давайте пожелаем нашей Имениннице Счастья, Здоровья, и Всего Накирасшего! Пусть все мечты исполняются, а неудачи обходят стороной!

❤️‍🔥

#life

8.04.2025, 21:19

t.me/asisakov_channel/790

AS

asisakov

1 502 assinantes

7

5

301

Интересное что-то от ребят, кого я читаю v0.9

Предыдущий пост тут
Интересное что-то тут

1. Тот самый Даниил (Red Powerful / ex - Блог о Data Science / ex - Per Second 300k) из Рисерчошной (не путаем с Сиолошной!) написал про интересное исследование в рекомендашках ютуба - типы взяли и заменили item ID на вектор айтема. Идея неплохая и к чему это привело, можно почитать там в посте. Сюда же в тему рекомендашек я бы докинул интересную ссылку на статью Олега про диверсификацию выдачи

2. В интернетах снова начали говорить про правильное ведение баз знаний (это примерно то, что я делаю в Интересном Что-то), и Алексей прямо сделал топовый выпуск про то, как он работает с Obsidian и прямо даже показывает, как это делать

3. Сабина в своем посте погрузила нас в автоэнкодеры (AE), конечно же с туториалами и извлечением признаков из ViT, а также сравнение Vit и PCA. Буквально в то же время Сергей выложил свою очередную лекцию, на сей раз посвященную (угадайте чему) - вариационным автокодировщикам VAE (почти угадали!)

4. Не могу не упомняуть пост от Димы про ML System Design секцию, коменты тоже рекомендую поглядеть. Ну и по классике, если вам вдруг понадобилось подготовиться/вспомнить материал по этой секции, то велком читать мои посты: 1, 2

5. Конечно же самая главная новость этих выходных - это релиз новых моделек от команды Татьяны. Изучать и погружаться очень много, но думаю для каждого найдется что-то интересное (я например до сих пор в шоке от длины контекста и размера Бегемота). На метриках все выглядит топ, и я надеюсь, что коллеги смогли избежать попадания теста в трейн. Но бурных обсуждений релиза в чатиках все выходные подряд избежать уж точно не смогли!

#interesting

7.04.2025, 21:06

t.me/asisakov_channel/789

AS

asisakov

1 502 assinantes

8

3

310

Тут товарищи рисечеры с американского Вконтакте бегемота на 2Т параметров выпустили.

Подглядел у Сиола

#llm #news

5.04.2025, 22:06

t.me/asisakov_channel/788

AS

asisakov

1 502 assinantes

7

316

37 vs 37

#meme

4.04.2025, 11:39

t.me/asisakov_channel/787

AS

asisakov

1 502 assinantes

8

1

327

Бэкапы

Не так давно я заменил рабочий комп на другой чуть поновее. Данные нехитрыми манипуляциями были перенесены, но потом случилось интересное событие: В процессе уже работы с новым коспом, он на ровном месте перестал включаться. Короче пришлось переустановить систему, и мне вообще повезло с тем, что мои данные где-то были сохранены!

Здесь возник типичный вопрос с тем, а что можно сделать такого, чтобы и данные постоянно обновлялись и хранились. Причем есть же еще не только рабочие проекты на рабочем компе, а есть и личное устройство, на котором есть и фотографии, и видео, и какие-то даже пароли - и вдруг внезапно это все может исчезнуть.

По классике я изучил вопрос и предлагаю рассмотреть разные варианты бэкапов наших данных:

1️⃣Полное резервное копирование (Full Backup) - сохраняем на внешний жесткий диск все файлы

🙂Все данные находятся в одном месте, записываем это один раз и забываем/кладем в недоступное место. При необходимости тупо все загружаем с этой сохраненной копии.

😡При большом объеме данных может занять продолжительное время, скорее всего мы сделаем это пару раз и потом забудем. Плюсом еще кто-то может случайно добраться до этого жесткого диска и что-то например перезаписать.

Очевидно, что это одна точка компрометации, которая дает доступ ко всем данным и при этом при ее утрате будет тяжеловато восстановить все - можно решить шифрованием + N копий. А если еще и архивировать, так вообще место даже сохраним!

2️⃣Дифференциальное резервное копирование (Differential Backup) - короче, почти то же самое, только мы берем наш старый жесткий диск и проверяем, что на нем есть. Далее загружаем на него то, чего на нем нет в отдельную папочку!

🙂Делается по времени намного быстрее полной перезаписи. Можно сохранить на диск/флешку/магнитную ленту и даже обеспечить версионирование изменений! Предполагаем, что это более надежно за счет возможности откатиться к старым коммитам

😡Обязательно наличие полной копии и ее поддержка. При проверке на наличие нфы слудет проверять всю доступную информацию по сохраненным данным, что может занять время.

Типа лучше, но вроде то же самое, что в пункте 1.

3️⃣Облачное резервное копирование (Cloud Backup) - тот же самый метод, только вместо жесткого диска имеем облако.

🙂Доступ из любой точки, нет ограничения вместимостью носителя, можно непрерывно обновлять информацию

😡Не защищает от утраты данных сторонним ресурсом, возможно отсутствие версионирования, за такую услугу надо платить денежку постоянно. А еще есть угроза доступа к нашим данным!

Можно настроить шифрование, сделать N копий на разных облаках, сделать такое же версионирование как в пункте 1.

Итого приходим к следующему: жесткий носитель vs. облако. Для себя я выбрал и то, и то, но блин все равно не сохранишь все данные на свете (а тем более пароли).

Ваши мнения?

3.04.2025, 21:56

t.me/asisakov_channel/785

AS

asisakov

1 502 assinantes

28

1

332

IMG_0524.MOV

Ребята, я давно хотел признаться, но все не было времени

1.04.2025, 15:30

t.me/asisakov_channel/784

AS

asisakov

1 502 assinantes

6

8

341

Интересное что-то от ребят, кого я читаю v0.8

Предыдущий пост тут
Интересное что-то тут

1. В этот раз интересным способом дебаггинга в питоне поделился Игорь Эр энд Ди. В чем суть: если мы до этого искали узкие места принтами, или приходилось запускать целый скрипт по-новой с дебаггером, то с легкой модификацией sys.excepthook получается договориться с дебаггером сразу запускаться с падением интерпретатора!

2. Наш слоняра Валера рассказал про очень важные вещи при проведении систем дизайн интервью. Потом после он еще накидал источников про перфоманс распределенных систем! Далее произошло занятное совпадение (не думаю) - Женя тоже выложил несколько источников по system design. В комментариях там же еще поделились хорошей ссылкой на курс по распределенным системам

3. Паша (который тоже Техник) подготовил огромную серию постов про блокчейн, где рассказал все с самых основ. Я приложил ссылку на первый пост, а дальше просто идите вниз. Выжимка неплохая.

4. АйТи пингвин рассказал про все основные типы джойнов. Дальше сразу же написал пост с основными вопросами на интервью про джойны. Но это еще не все, произошло совпадение (тут верю) - Анна выложила инфу про разные мощные виды джойнов, рекомендую изучить.

5. Ну и в конце снова хочется вернуться к питону. А именно к тому, что Никита в своих находках нашел, что теперь в Питоне пофиксили известную траблу с finally (в которую я почему то не попадал, потому что всегда стараюсь выводить return в конце), поэтому жить стало всем легче!

#interesting

31.03.2025, 21:15

t.me/asisakov_channel/783

AS

asisakov

1 502 assinantes

Repostar

6

5

203

ура, товарищи всё-таки выложили в hf русско чувашский корпус!

https://huggingface.co/datasets/alexantonov/chuvash_russian_parallel
https://huggingface.co/datasets/alexantonov/chuvash_voice

29.03.2025, 10:22

t.me/asisakov_channel/782

AS

asisakov

1 502 assinantes

270

IMG_1325.MOV

28.03.2025, 19:33

t.me/asisakov_channel/781

AS

asisakov

1 502 assinantes

270

IMG_1281.MOV

28.03.2025, 19:33

t.me/asisakov_channel/780

AS

asisakov

1 502 assinantes

268

28.03.2025, 19:33

t.me/asisakov_channel/777

AS

asisakov

1 502 assinantes

11

269

Те самые картинки

#life #travel

28.03.2025, 19:33

t.me/asisakov_channel/772

AS

asisakov

1 502 assinantes

269

28.03.2025, 19:33

t.me/asisakov_channel/776

AS

asisakov

1 502 assinantes

269

28.03.2025, 19:33

t.me/asisakov_channel/773

AS

asisakov

1 502 assinantes

269

28.03.2025, 19:33

t.me/asisakov_channel/775

AS

asisakov

1 502 assinantes

268

28.03.2025, 19:33

t.me/asisakov_channel/778

AS

asisakov

1 502 assinantes

268

28.03.2025, 19:33

t.me/asisakov_channel/779

AS

asisakov

1 502 assinantes

270

28.03.2025, 19:33

t.me/asisakov_channel/774

AS

asisakov

1 502 assinantes

6

268

Здания, бесконечный пляж, солнце и ветер

Пока что потрясающий опыт проживания отпуска в Дубае не случился, поэтому пост не будет полон ярких эмоций и незабываемых моментов. Конечно же тут стоит учитывать, что мы постарались не перетрачивать лишний раз, но за удельную стоимость дня отдыха есть возможность получить удовольствие с вариантов получше.

Я наверное вас не удивлю, если скажу, что с первых минут кайфанул с вайба высотных зданий и это ощущение до сих пор со мной. Также инфраструктура в городе довольно приятная: широкие улицы, удобные тротуары и реально чисто. В целом хорошо гулять по городу, смотреть на высотки и дорогие машины 🚗

Температура с солнцем показались оптимальными, но иногда этот ветер просто сдувал - идешь по мосту, а головной убор чуть не слетает, и так от каждого дуновения. Вечером даже доставляло дискомфорт и буквально приходилось укрываться куртками/толстовками 📱

Что еще очень интересно - это количество туристов и местных жителей. Кстати, почти каждый второй человек наверно, кого я видел, разговаривает на русском. Ходят слухи, что они приезжают сюда со всех уголков России, чтобы насладиться роскошью и красотой Дубая. Помимо этого довелось слышать дефолтную английскую речь, иногда французскую и даже испанскую! Про китайцев конечно молчу, но на улицах их было не так много, но в Музее Будущего они по ощущениям заполонили все возможное пространство😹

Единственное, к чему никогда невозможно подготовиться, так это к ценам. Бешеные цены за такси, аренду, рестораны и развлечения. Но, обычную еду из супермаркета можно закупать по околомосковским ценам. А фрукты так вообще намного дешевле! Особенно приятно поесть спелый сладкий арбуз в конце марта 🍉

Короче, роскошь и комфорт, но за ваши деньги 🤑

Кстати, еще порадовал пляж и была очень приятная температура воды, что конечно же докинуло плюсов, но с другой стороны на этом же пляже, который тянется почти по всей береговой линии, достаточно много народу.

Выводы оставлю на вас, лучше приложу картинки чуть ниже.

#life #travel

28.03.2025, 19:31

t.me/asisakov_channel/771

AS

asisakov

1 502 assinantes

15

12

294

IMG_1298.MP4

Зашел в рабочие чаты во время отпуска, а там

#meme

26.03.2025, 17:54

t.me/asisakov_channel/770

AS

asisakov

1 502 assinantes

1

319

25.03.2025, 22:01

t.me/asisakov_channel/767

AS

asisakov

1 502 assinantes

1

323

25.03.2025, 22:01

t.me/asisakov_channel/768

AS

asisakov

1 502 assinantes

1

322

IMG_1282.MOV

25.03.2025, 22:01

t.me/asisakov_channel/769

AS

asisakov

1 502 assinantes

1

313

25.03.2025, 22:01

t.me/asisakov_channel/766

AS

asisakov

1 502 assinantes

13

1

318

Немного красоты

#life #travel

25.03.2025, 22:01

t.me/asisakov_channel/764

AS

asisakov

1 502 assinantes

1

313

IMG_1254.MOV

25.03.2025, 22:01

t.me/asisakov_channel/765

AS

asisakov

1 502 assinantes

6

313

Ура, спать
Часть 2

⬆️ Начало выше ⬆️

Интересное случилось дальше - на обратном пути мы добрались до метро за минут 15 до закрытия, и заметили у входа толпу людей и множество машин типичного для Дубая цвета такси, и почему-то нам настойчиво предлагали воспользоваться услугой такси по fair/fixed price, что вызвало у меня такое удивление, что я буквально всем в лицо проговаривал: «No, thank you». На что почти все отвечали, что сейчас не ходит никакой транспорт, и придется все равно спускать обратно к ним. «Nobody believes, but then they come here again» - цитата одного из представителей. «No bus and metro available now» - цитата другого представителя.

Добравшись до турникетов, мы и вправду столкнулись с удивительной вещью - слышно проезжающие поезда, но к ним не пройти, потому что перед турникетами опущена решетка. Местные ребята школьного возраста, которые тоже не ожидали такого подвоха, даже пытались через нее пролезть, устроили переговоры с представителем трудового коллектива метро, но это не помогло хотя бы даже им.

Изучив примерные цены на весь транспорт от велосипедов и самокатов, которые тут же разобрали те самые ребята-школьники, от людей в метро (симку не меняли, поэтому были без связи), мы решили прогуляться немного по направлению в сторону Dubai Marina, где мы жили. Оффлайн карты показывали невероятные 6 часов ходьбы vs. 15 минут на машине, но легкая прогулка никогда не повредит.

Примерно через минут 50 пути мы зашли в один из круглосуточных супермаркетов и решили там в дорогу взять снеков перекусить. Там же мы переставили симку на телефон, чтобы изучить цены на такси в Yandex Go, и внезапно обнаружили возможность прокатиться на ночном автобусе почти до нашего отеля.

Так и сделали - дошли до остановки через жилой сектор, дальше немного подождали автобус, прокатились, и в конце концов немного прошлись до отеля. Всю дорогу шутили про мое умение притягивать приключения в самых неожиданных местах.

Добравшись до отеля примерно в 3 утра, мы решили по приколу загуглить цену на такси. По прикидкам вышло ~130 дирхам (3к рублей) за 15 минут езды. Выводы можно в комментарии, но кажется это приключение должно было случиться именно в этот день.

И все это не так важно, когда после такого насыщенного дня ложишься в свой выходной день в теплую мягкую постель и… Ура, спать

#life #travel

25.03.2025, 21:57

t.me/asisakov_channel/763

AS

asisakov

1 502 assinantes

5

304

Ура, спать
Часть 1

Путешествие началось с легкого ощущения усталости вследствие вылета ранним утром, из-за которого мы не спали в надежде набрать сил во время перелета.

Рандомайзер жизни распорядился таким образом, что буквально через ряд от нас летела семейная пара с маленьким ребенком, который весь полет радовал пассажиров рейса Москва-Дубай, и от преисполнения чувством радости не у всех получалось заснуть. Мне повезло - вздремнуть я смог, но немного - поэтому делюсь видением того дня с точки зрения этих ощущений.

Сразу про людей. С учетом предыдущих поездок в Египет и Турцию мы ожидали некоторого подвоха, но все оказывалось без этого подвоха, что просто разрывало шаблоны. Например, после проверки паспорта каждому из нас дали бесплатную симку на 10Gb трафика просто так. Или чел таксист на выходе из аэропорта по-честному показал, где стоит автобусная остановка и даже проводил до магазина внутри аэропорта, где можно купить проездной.

Так как в этот раз мы подобрали маршрут до отеля без трансфера, то была удобная возможность подремать еще почти час в автобусе до метро, который кружил по территории аэропорта почти наворачивая круги (это у него маршрут такой).

Набравшись сил, мы с Настей в метро успели посмеяться над тем, как на станции метро “Investment Park” мужики в костюмах и рубашках бегом влетают в полупустой общий вагон поезда (там еще есть женский и золотой вагоны) и занимают свободные места, почти не давая некоторым людям выйти - как оказалось, в Дубае это норма.

Очень интересно было видеть бесконечную «Москву-Сити» кругом при выходе из метро и еще в цветах, сильно сочетающихся с вайбом пустыни, моря и самого Дубая. На работе я уже вроде привык к этим видам, но тут просто бесконечные высотные здания рядами, и это конечно завораживает.

В отеле нам типа повезло, и наш стандартный номер с видом на город заменили на стандарт с видом на Marina. Вид определенно лучше, но вы сами можете оценить на фото. После быстрого перекуса (тоже на фото) мы решили остаток дня провести у башни и фонтанов, и поэтому сразу выдвинулись в сторону Дубай Молла.

ТЦ мне очень зашел - есть наверно все бренды/магазины, можно просто потеряться. Но все красиво, много, качественно. Ходят слухи, что это даже дешевле, чем в Москве, но я статзначимой разницы не заметил. Интересно было увидеть мини-океанариум в середине здания, но конечно Авиапарк со своим аквариумом выглядит помасштабнее.

Примерно в районе 23 часов вечера мы пошли посмотреть поющие фонтаны, чтобы потом успеть в метро, которое должно было закрываться в 12 ночи. Фонтаны очень понравились и кстати было много русскоговорящих людей.

⬇️ Продолжение ниже ⬇️

#life #travel

25.03.2025, 21:56

t.me/asisakov_channel/762

AS

asisakov

1 502 assinantes

17

1

286

video.mp4

24.03.2025, 05:56

t.me/asisakov_channel/761

AS

asisakov

1 502 assinantes

19

7

313

Меня тут попросили рассказать про применение сеточек для узкого круга начинающих людей (не айтишников).

План примерно вот такой:

1. Легкое введение в работу моделей через объяснение того, что алгоритм выучил большое количество информации и на этой основе может что-то понимать и даже выдавать что-то осмысленное

2. Далее смотрим популярные LLMки: ChatGPT, Claude, Gemini. Тестим их ответы на одинаковые запросы и пытаемся получить ответы на определенный кейс

3. Смотрим поисковые движки типа Perplexity и Нейро. Немного еще тыкаем бесплатный DeepResearch в Perplexity и Grok

4. Работаем с документами и суммаризациями в NotebookLM

5. Смотрим современные txt2img и txt2vid модельки. Обязательно тыкаем Fooocus, Midjourney, Kling, Runway и Veo. Возможно еще потыкать Dalle и Pika.

6. Работаем со звуком через Whisper, генерируем треки при помощи Suno

7. Ну и вишенка на торте - фишки промптинга и возможные варианты работы с сеточками.

Планирую уложиться в 2-3 часа.

Короче, вопрос к вам: что убавить, что прибавить?

UPD. Видео будет не для шеринга, но если вдруг будет бешеное желание, то подумаем над форматом.

22.03.2025, 21:19

t.me/asisakov_channel/760

AS

asisakov

1 502 assinantes

14

2

281

Счастливый день, полный встреч

Сегодня у меня был один из тех дней, в который буквально с утра и до вечера я не вылезал из зумов. Сначала одна большая встреча на полтора часа, потом 3 по полчаса, мини-перерывчик на полчаса. Опять небольшая серия, снова перерыв и снова встреча! Бошка под конец просто уже не варила после всех этих переключений между различными темами и контекстами. Вроде бы и день просто в созвонах (я даже покодить не успел, только запросики в sql погонял!), а голова под конец уже совсем чугунная.

Встречи по классике разные. Обсуждения по моделям, синк с командой, общение с коллегами из бизнеса (заказчиками) и классические 1-1. Короче, пишу пост и кайфую просто от концентрации на одной таске.

От слова к делу - быстрый гуглинг по постам от коллег с советами позволил собрать небольшой шорт-лист на будущее. Делюсь этими советами:

1️⃣Подготовка ко встрече

Перед каждой встречей пару минут можно уделить на изучение агенды, описания, посмотреть участников. Возможно уже на этом этапе мы сможем быстро погрузиться в проблему и фоново уже понимать общую задачу во время обсуждения. Мб и вопросы какие-нибудь схожу появятся, типа «Нафига меня сюда позвали?». Если у встречи нет агенды, то обязательно просим коллег заполнять всю эту инфу!

2️⃣Резервное время для перерывов

В течение дня очень круто в плотном списке встреч видеть ту самую, отведенную под обед. На самом деле это возможность не только утолить физический голод - это топовый релакс для мозга, потому что идет полное переключение контекста. А если воздержаться от ютуба, так вообще полное переключение с активного состояния в состояние наполнения энергией! Если мы вдруг стесняемся блокировать это время в календаре, то можно не переживать. Скорее всего после энного количества встреч, которые нам успеют поставить коллеги вместо нашего предполагаемого обеда, все стеснение испарится.

3️⃣Ведение заметок

Если во время встреч кратко фиксировать главные мысли, вопросы, договоренности, концепции, то внезапно начинаешь видеть в этом пользу. После нескольких встреч происходит полное размывание градиентов в памяти, поэтому записи позволяют это хоть немного восстановить. Ну и соответственно, мозгу проще переключаться между контекстами встреч, потому что не страшно потерять информацию. Иногда кстати записи со встреч двухнедельной давности очень помогают вспомнить вообще, что обсуждали.

4️⃣Своевременное завершение встреч

Почему нужна агенда из первого пункта? Потому что во время встречи стоит ее придерживаться, иначе есть все шансы не успеть обсудить до конца за отведенное время. А если не успеть, то придется снова восстанавливать весь контекст на следующей встрече и впихивать ее во время обеда, потому что остальное время все занято. Если не все вопросы успели обсудить - точно стоит зафиксировать их и назначить доп встречу в ближайшее время, лучше даже в тот же день.

5️⃣Deep work

Встречи встречами, но нужно беречь время для задач, требующих глубокой концентрации. И это нормальная тема блокировать для них отдельные часы. Видел кстати у коллег даже забитые полностью дни для времени под проекты. С точки зрения решения срочных вопроса можно если что просить дойти в личку.

Ну и конечно всегда надо следует фильтровать встречи - возможно на некоторых мы и не нужны, а подсказать по модели коллегам сможет уже и крутой мидл с команды.

Советы советами, но конечно важно соблюдать баланс, ведь мы уже движемся к глобальному оптимуму нашей жизни!

По классике, делитесь в комментариях вашими лайфхаками по продуктивному управлению встречами💪🏿

UPD. В коментах скинули годную статью по теме

@asisakov_channel

#softskills

19.03.2025, 21:21

t.me/asisakov_channel/759

AS

asisakov

1 502 assinantes

8

2

262

Интересное что-то от ребят, кого я читаю v0.7

Предыдущий пост тут
Интересное что-то тут

1. Илья рассказал про чемпионаты по аналитике. Например, ребята с бигтеха приносят задачку, а участники пытаются ее красиво решить. Например, я заценил вторую задачу про юнит-экономику стартапа. Дополнительно полазил по решениям из задачи с чат-ботами, тут конечно рекомендую все на свой страх и риск, потому что некоторые решения буквально сделаны на коленке.

2. Коллеги из чатика по подготовке к летней Школе Менеджеров Яндекса накидали лекций из прошлых сезонов. Ознакомиться можно не только с лекциями для менеджеров, но и для разработчиков на бекэнде, мобильных устройствам и даже для аналитиков-разработчиков. Кстати, говорят, что скоро набор.

3. Ребята поделились топовой подборочкой ИИ-каналов. Однозначно согласен с топом в виде Карпатого и Трех Синих Одного Коричневого. Для себя также выделил интересного Hamel Husain, который говорит про RAGи. Показалось, что в этой подборке очень не хватает канала @asisakov_channel. Ладно, шучу, я же не только про ИИ рассказываю.

4. Женя по классике принес полезности из своего тимлидского опыта. Второй доклад я кстати смог прослушать чуть раньше до появления поста, потому что мне повезло посетить Podlodka Teamlead Crew. Немного своих мыслей: кризис это не только про когда все плохо. Кризис, это когда мы через трансформации высвобождаем свою энергию из старого для новых свершений!

5. Саша раскрыл тайну правильного менеджерского подхода к поставленным задачам и поручил это делать гэпэтэхе. На самом деле мы на работе всегда неявно сталкиваемся с такой задачей и пытаемся мысленно интерпретировать ответы на эти вопросы. Для этого даже есть разные фреймворки, про которые я например писал тут, и сразу часть 2. Короче, можно даже попробовать отвечать на эти вопросы самому, без моделек.

6*. Не особо новый пост от Валерия, но я должен им поделиться. Чел просто собрал классных ботов, которые вполняют 1-3 важных функций, и ими пользуются! Если вы вдруг не знали, какой запилить проект с LLmками, то просто посмотрите на примерах: допустим, @VectorSagebot - RAG на постах из 3-ех каналов (вроде у него есть даже видео как это делать), либо бот с генерацией изображений - @fastpixel_bot. Не обязательно это должен быть полный Product Market Fit, но просто собрать такой проектик и поддерживать - это уже крутой результат!

#interesting

17.03.2025, 18:17

t.me/asisakov_channel/758

AS

asisakov

1 502 assinantes

14

3

327

video.mp4

17.03.2025, 11:19

t.me/asisakov_channel/757

AS

asisakov

1 502 assinantes

1

video.mp4

17.03.2025, 11:18

t.me/asisakov_channel/756

AS

asisakov

1 502 assinantes

4

300

Линия отреза внимания

✂️-----------------------------✂️

Тут коллеги поделились постом про найм и там есть вакансии к нам в Лавку, так что приходите!

14.03.2025, 15:21

t.me/asisakov_channel/754

AS

asisakov

1 502 assinantes

Repostar

7

9

295

Аналитика в Яндекс Лавке📦про команды, которые делают сервис лучше (и кого мы ищем)

Как вы помните, я работаю IT-рекрутером в Яндекс Еде и Яндекс Лавке. При выборе работы мне реально важно, что за сервисы надо "продавать" и как там что устроено. Походу я люблю e-com, потому что основной опыт у меня здесь🙂

Сегодня расскажу про Лавку. Когда я думаю о ней, как о сервисе, у меня куча вопросов:
Кто решает, сколько будет стоить доставка? Почему всё так быстро? Почему моя лента состоит из этих товаров?

За всем этим стоят наши аналитики, и если у вас есть опыт, вы владеете Python и SQL, то будет рады видеть вас в наших командах.

Расскажу чуть подробнее, что команды у нас есть и какие вакансии сейчас открыты:

1️⃣ Эффективность и логистика 🛴
Тут работают с алгоритмами, которые балансируют спрос и предложение, распределяют курьеров и определяют цены доставки. Если совсем просто – делают так, чтобы доставка работала быстро, выгодно и без сбоев.

Как мы прогнозируем спрос на заказы в Яндекс Лавке, чтобы эффективнее распределить нагрузку на курьеров

🔜 Кого ищем:
🔘Аналитик в группу офера в Яндекс Лавку — заниматься стоимостью доставки и развивать ML-модель ценовой эластичности.
🔘Аналитик операционной эффективности в Лавку — помогать сотрудникам склада работать быстрее и удобнее, оптимизируя алгоритмы распределения задач.
🔘Аналитик саппорта в Лавку — разбираться, почему пользователи пишут в саппорт, и находить точки роста для снижения обращений.

2️⃣ Продуктовая аналитика 📲
Эти ребята анализируют, как новые фичи влияют на сервис, делают эксперименты, тестируют выдачу, каталог. В общем, проверяют, что работает, а что – нет.

3️⃣ Маркетинговая аналитика 📉
Каналами привлечения клиентов тут занимаются не просто на уровне «пустили рекламу», а строят сквозную аналитику, делают A/B тесты и ищут самые эффективные механики.

🔜 Кого ищем:
🔘Аналитик-разработчик в Лавку – автоматизировать персонализированные предложения (скидки, промокоды, пуши), чтобы клиенты получали именно те офферы, которые им нужны.

4️⃣ Коммерческая аналитика 💸
Здесь думают над тем, какие товары добавить в ассортимент, как формировать цены, какие скидки работают лучше всего.

🔜 Кого ищем:
🔘Аналитик-разработчик в команду автозаказа Лавки — анализировать и прогнозировать спрос, чтобы нужные товары были в наличии в правильном количестве.

Если интересно узнать подробнее, то кидайте резюме мне в личку @margarita_krinitsyna

14.03.2025, 15:21

t.me/asisakov_channel/755

AS

asisakov

1 502 assinantes

20

3

362

Здоровье, или нематериальный капитал нашей жизни

В погоне за ежедневными достижениями есть вероятность позабыть о самом ценном ресурсе, которым обладаем и от которого буквально прямо зависим - это наше здоровье.

По себе я часто замечаю, что между какой-либо деятельностью и сном я в 99% случаев отодвигаю его (сон) на задний план. Словно этот ресурс имеет неисчерпаемый запас, который всегда будет с нами. Мне кажется у многих из нас эта привычка остается еще с универских времен, когда и хочется все успевать, и при этом есть много энергии на все свершения. Мне кажется, что каждый день мы делаем неосознанный выбор: сделать презентацию ночью или выспаться / получить топовый результат или отдохнуть на выходных / добить задачку до конца спринта или пойти на тренировку? 👋

Короче, наша жизнь — это непрерывная оптимизационная задача. Мы постоянно балансируем между карьерными амбициями, личными желаниями, временем с близкими и инвестициями в собственное здоровье. Еще на это все накладываются колоссальные ограничения по доступной информации. И в чем прикол - у этой задачи нет универсального решения. У нас у всех разные отправные точки, ограничения, приоритеты и даже активности, от которых мы получаем удовольствие.

Но я точно знаю, в чем мы похожи - мы все ищем свой "глобальный минимум" – то идеальное решение, которое принесет максимум пользы при минимальных потерях. И знаю, что у нас есть высокая вероятность застрять в локальных экстремумах, где мы, жертвуя долгосрочным благополучием, получаем удовлетворение от краткосрочных выгод 😔

А что дальше? Очевидно, что прогнозист предложит сделать прогноз. Не на следующий месяц или год, а на десятилетия вперед! Представить себя в 70, 80 или 90 лет – и предположить, а поблагодарит ли будущая версия нас за сегодняшние решения? Для тех, кто любит супер-длинные горизонты: «Поблагодарят ли меня мои потомки за мои действия?»

Когда мы оптимизируем нашу жизнь с учетом действительно долгосрочной перспективы, приоритеты часто меняются. Ночь без сна ради презентации кажется уже не таким разумным выбором, если подумать о кумулятивном эффекте сотен таких ночей на наше здоровье в будущем. Конечно у всех случаются форс-мажоры. Но если они случаются очень часто, то не повод ли подумать над причиной их появления? 💡

И речь не о том, чтобы отказаться от целей и амбиций. Напротив – это призыв включить здоровье в список приоритетов, вписать его в оптимизационную задачу. Потому что без здоровья все остальные достижения теряют смысл. И конечно же не забыть добавить в уравнение любовь! 💙

Возможно, истинная мудрость заключается не в том, чтобы достичь максимума во всем сегодня, а в том, чтобы найти долгосрочный тренд на баланс, который позволит нам и наслаждаться жизнью, и двигаться к реализации своих целей.

Что думаете об этом? Робота или поспать?

#life

13.03.2025, 21:21

t.me/asisakov_channel/753

AS

asisakov

1 502 assinantes

15

8

297

Топовая заявка на топовую конференцию

Допустим, мы нашли интересную конференцию и намерены выступить перед сообществом наших коллег с крутейшим по нашему мнению докладом. И я заметил, что этот процесс немного похож на собеседования. Потому что между нашей идеей и сценой стоит заявка, которая должна выделиться среди десятков или даже сотен других. Давайте попробуем сделать ее по-настоящему топовой.

🌟 Уникальность

За последний год в конференциях каждый второй доклад посвящен LLM или другим модным темам: «Что такое RAG и как его готовить», «Зачем вам покупать 8хH100, когда можно затюнить Llama 7B в колабе» или «Мы прикрутили LLM и что-то произошло».

Короче, здесь важно найти свежий угол. Вместо итак всем понятных выводов и рассуждений о том, что все знают, возможно у нас есть чем поделиться например про нестандартное применение известного инструмента. Или рассказать про кейс с неожиданными выводами.

Пример: Не "Внедрение LLM в бизнес-процессы", а "Как засунуть языковую модель в legacy-систему из 90-х и почему этого лучше не делать".

👋 Аудитория

Каждая конференция имеет свое распределение посетителей и слушателей, и наша цель здесь подготовить заявку, чтобы очень близко соответствовать языку наших зрителей. Как минимум, нерелевантную заявку не пропустят. А как максимум, доклад тупо может просто не заинтересовать коллег.

Допустим, мы знаем, то на конференции будет преобладать бизнес-аудитория:

- По возможности стоит упомянуть экономический эффект и влияние на финансовые метрики
- Рассказать не только про изменение метрик, но и связь с бизнесовыми показателями
- Если мы супер-крутаны, и смотрим долгосрочно, то можно даже упомянуть о стратегических преимуществах

Если аудитория более техническая:

- Побольше упора на архитектуру, модели и методы!
- Очень круто будет рассказать про челленджи в имплементации и их решения
- Если умеем, то можно в демонстрацию кода (но очень аккуратно!) или продемонстрировать дизайн схемы

В каждом случае конечно надо быть готовым говорить на языке коллег и вообще в любом из раскладов уметь поговорить как за бизнесовую составляющую, так и за техническую!

😈 Докладчик

Кто я? Чем могу быть полезен? Почему следует слушать именно меня? Выступающий - неотъемлемая часть контента. Потому и организаторы выбирают не только тему, но и человека.

И что нам следует здесь подсветить: обязательно релевантный опыт, соответствующий теме доклада, а также масштаб, на который мы влияем. То есть важно еще проекты/команды/бюджеты, с которыми мы работали. Будет топово сразу же объяснить, почему именно мы можем дать особый взгляд на проблему. А еще есть интересный хак: если у нас есть знакомые в ПК, то можно попросить их взять наш доклад если у нас есть опыт публичных выступлений, то обязательно нужно об этом рассказать!

😌 Структура

1. Цепляющий заголовок
2. Проблема
3. Ценность для аудитории
4. Краткое содержание
5. Наша экспертиза

Конкретно мне кстати очень понравились вопросы при заполнении заявки на AHA, рекомендовал бы заполнять ваши заявки в соответствии с их шаблоном. Вот их вопросы по порядку:

1. О чем вы хотите рассказать? Какая решалась задача?

2. Каковы ключевые идеи вашего выступления, что именно вы хотите раскрыть и подчеркнуть? Тезисы.

3. Какому треку/трекам наиболее релевантен ваш доклад?

4. Ключевая тема или название доклада

5. Уровень сложности

6. Кто идеальная целевая аудитория - для специалистов какого грейда из каких компаний он будет полезен?

7. Какую ценность получит аудитория от вашего выступления? Что слушатели после доклада будут делать иначе?

🦯 Легкие правки

Можно попросить вашего деврела или коллегу прочитать заявку и дать обратную связь. И конечно же важно не наобещать разного с три короба, а потом об этом не рассказать. Важно быть максимально честным и открытым. Конечно же, в идеальной картине мира хочется, чтобы не мы оставляли заявки, а к нам приходили с предложениями выступить, но для этого все же хоть где нужно продемонстрировать свои топовые навыки докладчика.

На этом все, надеюсь эта инфа поможет вам с заявками на конференции!

@asisakov_channel

#speaking

12.03.2025, 21:26

t.me/asisakov_channel/752

AS

asisakov

1 502 assinantes

8

5

281

Интересное что-то от ребят, кого я читаю v0.6

Предыдущий пост тут
Интересное что-то тут

1. Павел сделал коротенькие разборы статей, которые очень связаны с последними веяниями в LLM. Быстро, очень коротко, не всегда понятно, поэтому там же есть ссылочки на статьи, для тех, кто желает разобраться глубже. К примеру, сравнение SFT и RL, обзор всех шагов обучения ризонинг-модели и подобное. Кстати у поста есть вторая часть.

2. Дядя хорошо накинул на вентилятор по поводу применения LLMок в проде. Это когда идея звучит красиво и давайте идти в AIзацию компании, только вот как все это правильно и надежно настроить и с нуля встроить в рабочие процессы вместо старых моделей, никто не говорит. Суть в том, что и не надо менять то, что итак работает, можно просто это сделать еще лучше с легким применением тяжелых моделек.

3. Макс пересказал у себя в посте то самое видео от Саши Сахнова, где сравниваются частотный и Байесовский подходы к A/B-тестам. Не знаю, насколько очень круто применять байесовский подход к A/B, но в некоторых простеньких тестах это точно полный оверкилл. Валера даже вон заметку от Рони Кохави прикладывал, которую рекомендует смотреть каждый раз, когда рука к Байесу тянется.

4. Дима поделился ссылками на интересный блог с постами, где рассказывается, что происходит под капотом у пакетных менеджеров, когда мы их используем. Дополнительно накинул ссылочки разные топовые примеры и годную инфу. При этом я еще даже не успел пересесть с pyenv на uv - но возможно это и не нужно, а вот что происходит под капотом, понимать надо.

5. Ринат подвел итоги своего Enterprise RAG Challenge. И что самое важное (мы можем увидеть из следующего поста), то для наших RAG систем важно не только отличное разпознавание информации, но и также важен reasoning над structured output. Ну и вишенка на торте - локальные модельки тоже неплохо перформят, если выстроить норм архитектуру.

#interesting

10.03.2025, 19:40

t.me/asisakov_channel/751

AS

asisakov

1 502 assinantes

41

1

322

Дорогие девушки-датасаентистки, ML-энтузиастки и все, без кого наш мир был бы печально одномерным!

Поздравляю вас с 8 Марта!

Очень рад, что вы вдохновляете нас, доказываете, что женский ум столь же острый, как лезвие Оккама, а интуиция безошибочна, как лучшая ML-модель! Недаром говорят, что женщины как нейросети - загадочны, непредсказуемы и способны находить глубинные закономерности там, где мужской взгляд даже не поймет намек видит лишь признаки! 💫

Будьте счастливы, любимы и полны сил покорять новые высоты в нашей увлекательной вселенной! Пусть ваши гиперпараметры жизни будут оптимальны, градиентный спуск сразу будет попадать в глобальный минимум, а лосс на валидации всегда стремится к нулю!

Короче, С Праздником! 🌹

# Claude 3.8 Opus

8.03.2025, 17:12

t.me/asisakov_channel/750

AS

asisakov

1 502 assinantes

12

2

317

Товарищи, вопрос следующего характера.

Что бы вы хотели услышать от меня про прогноз в Яндекс Лавке? Пайплайны, хаки, мб какие вообще модели существуют?

Готовлю пару заявочек на I’ML и AHA’25 и очень хотелось бы от вас услышать, с какими проблемами вы сталкиваетесь при работе со своими проектами, связанными с прогнозированием. И что хотели бы узнать от меня например в первую очередь.

Не факт, что мне об этом можно будет рассказывать, но постараюсь по возможности учесть ваши боли и пожелания.

6.03.2025, 20:36

t.me/asisakov_channel/749

AS

asisakov

1 502 assinantes

12

3

280

Про монетки и информатику

Слушай, я расскажу, как я впервые столкнулся с программированием. Это было на первом курсе универа, на информатике. Мы такие сидим, ждем препода, и тут заходит этот дед. Неземский. Представляешь, первое, что он нам говорит: "Вы такие тупые, что до десяти небось посчитать не сможете!" Я такой сижу и думаю: "Ничего себе начало!". Конечно же в итоге кто-то из нас действительно не смог досчитать до десяти, но это было не важно.

Знаешь, что было самое интересное? Этот старикан умел объяснять так, что сложные темы казались простыми. Вот, например, про массивы рассказывал. Говорит: "Ребят, представьте, что у вас есть длинный коридор с комнатами, и в каждой комнате по человеку c разными номерами сидит. Как в тюрьме. Вот так и массивы работают". И ведь правда, сразу все понятно стало.

Но сдавать ему задания - это жесть была. Мы такие приносим флешки с программами, а они у него на компе не запускаются. А писали мы тогда на Delphi, ты прикинь! Он нас еще "корифеями" называл и все время про нашу тупость говорил. Видите ли, приносите снова свою программу, вы тупой. Типа, если логически думать не научимся, то ничего в жизни не добьемся. И давал нам задачки с монетками, над которыми мы потом часами париллсь.

Но вот лекции и семинары по теме самой информатики у него - это вообще ни о чем были. Приходилось самим инфу искать, как работает принтер или записывается информация на диск, чтобы к экзамену подготовиться. Хотя мне повезло, я за свои проекты автомат получил, хотя они не особо сложные были.

А потом, когда я уже из универа вышел, понял, что многому еще учиться надо. Но этот препод, Неземский, все равно запомнился. Методы у него, конечно, странные были, но он реально старался нас научить. Может, подход у него старомодный был, но он делал, что мог. Так что, несмотря ни на что, я ему благодарен за то, что мне хотя бы экзамен сдавать не пришлось. Вот такая вот школа жизни была, брат! И ничего вроде, научились!

А у вас были похожие истории во время учебы?

#life

4.03.2025, 19:46

t.me/asisakov_channel/748

AS

asisakov

1 502 assinantes

11

4

322

Интересное что-то от ребят, кого я читаю v0.5

Предыдущий пост тут
Интересное что-то тут

1. Антон рассказал как нюхать модели и сделал для этого небольшой сайт. По сути то самое исследование, которого мы давно ждали. Ато есть бенчмарки, есть куча направлений, и все равно из этого не до конца понятно, что юзать для своих проблем. Например я почти для всего раньше юзал Claude 3 Opus, пока он был доступен в бесплатной версии. Кстати, сюда же можно сразу приложить ссылку на видео от Андрея Карпаты про его опыт применения моделек.

2. Сергей написал пост про рассуждающие модельки (reasoning models), что совсем было диковинкой в середине прошлого года, когда появилась с o1-preview с chain-of-thought. Если вы как он думаете, что рассуждающие модели — это самое главное, что произошло в AI за последние несколько месяцев, то рекомендую к прочтению.

3. Валера расписал очередную итерацию по планированию сроков проектов. И внезапно оказалось, что чуйка (aka экспертное мнение) может неплохо так докинуть к прогнозированию трудозатрат на таску. Там же и про прошлые методики оценки (например, сторипоинты), и немного про метод MOVE.

4. Андрей нашел просто бриллиант - выжимка из всего процесса поиска работы от Mimansa Jaiswal (PhD CS), где было пройдено более 100 собеседований в различные компании (а подано было резюме в более, чем 200 компаний), что позволило собрать очень интересную статистику и разные кулстори по всем процессам. Самое крутое, что она даже приложила классные материалы для подготовки к интервью!

5. Ну и здесь я думаю точно не обойтись без опыта вайбкодинга от Бориса. В чем прикол: есть библиотека pycocotools, и Борис хотел немножечко ее улучшить. Дальше я не буду спойлерить. Произведение читается в нескольких постах и заканчивается вот тут. С удовольствием бы хотел провернуть похожий трюк, но мне слишком жаль времени и денег, поэтому подождем лучших времен. Кстати, есть пример от коллег у кого все получилось в немного другом кейсе.

- Что мы скажем LLMкам вместо программистов? Не сегодня!

#interesting

3.03.2025, 19:07

t.me/asisakov_channel/747

AS

asisakov

1 502 assinantes

11

2

266

Пусть в эту пятницу будет memes feed

#meme

28.02.2025, 17:29

t.me/asisakov_channel/737

AS

asisakov

1 502 assinantes

4

273

28.02.2025, 17:29

t.me/asisakov_channel/743

AS

asisakov

1 502 assinantes

4

270

28.02.2025, 17:29

t.me/asisakov_channel/740

AS

asisakov

1 502 assinantes

4

276

IMG_0986.MP4

28.02.2025, 17:29

t.me/asisakov_channel/746

AS

asisakov

1 502 assinantes

2

265

28.02.2025, 17:29

t.me/asisakov_channel/738

AS

asisakov

1 502 assinantes

2

266

28.02.2025, 17:29

t.me/asisakov_channel/739

AS

asisakov

1 502 assinantes

4

274

28.02.2025, 17:29

t.me/asisakov_channel/744

AS

asisakov

1 502 assinantes

2

268

28.02.2025, 17:29

t.me/asisakov_channel/742

AS

asisakov

1 502 assinantes

2

268

28.02.2025, 17:29

t.me/asisakov_channel/741

AS

asisakov

1 502 assinantes

3

273

28.02.2025, 17:29

t.me/asisakov_channel/745

AS

asisakov

1 502 assinantes

8

2

350

Нить + ножницы = нити

Саша взял кусок нити. Он сложил ее пополам, затем еще раз пополам, и так 10 раз. Затем он взял ножницы и разрезал полученную конструкцию в одном месте (таким образом, он перерезал нить в 1024 местах). В итоге нить распалась на куски. Оказалось, что длины этих кусков принимают лишь два различных значения, наименьшее из которых равно 10 см. Найдите все возможные значения длины исходной нити.

#problem

25.02.2025, 21:15

t.me/asisakov_channel/736

AS

asisakov

1 502 assinantes

12

5

394

Интересное что-то от ребят, кого я читаю v0.4

Предыдущий пост тут
Интересное что-то тут

1. Интереснейший разбор статьи с копированием поведения человека агентами от пацанов с gonzo ML. Как ребята упомянули, исследования ведутся еще с 2023 года, где до этого была выпущена статья про Generative Agents, которую ребята тоже разобрали. Что меня впечатлило, так это возможность просто за счет ответов на вопросы с интервью с 80% точностью моделировать поведение человека.

Представьте, мы тут напороходили психологических тестов на левом сайте, а потом по нам агента собрали 🤯

2. Не отходя от темы с агентами, Татьяна с коллегами по работе выпустили статью про бенчмаркинг агентов в едином фреймворке. А еще она собрала список опенсурс проектов от Обнимающих Лиц🤗 (HuggingFace)! Тут и со ссылками, и с лицензиями, и даже с краткими пояснениями. Например, там упоминаются: Open-R1, SmolAgents, SmolVLM, SmolLM , Zephyr Mixtral , Zephyr Gemma

3. Если мы вдруг начали надеяться, что в итоге агенты смогут решить большинство наших проблем, то Борис в своем посте хочет предупредить о рисках их применения. Если вы хотите чуть погрузиться в риски AI, то можно поглядеть этот пост со ссылкой на подборку от MIT

4. Никита очень доступно и понятно рассказал, что такое GIL в Python, что у него под капоптом, и как его вообще определяют. Туда же докидываем продолжение его поста. Также стоит упомянуть, что и у меня была попытка рассказать про GIL год назад (когда его еще не выпилили из питона), но конечно же не настолько глубоко и емко.

5. Анатолий написал про интересную статью с моделькой TabFPN, где она обучается на синтетических данных, а потом выдает почти топовые результаты на временных рядах. Конечно это пока меня не переубедило использовать классику (как когда-то нашумел TabNet, который в итоге не стали юзать), но есть о чем задуматься про zero-shot решения. Сюда для дополнительного знакомства с современными статьями во временных рядах я бы предложил вам посмотреть этот доклад.

P.S. Там же у Толи есть хорошая выжимка из The Kaggle Book, основные моменты приведены тут.

#interesting

24.02.2025, 15:58

t.me/asisakov_channel/735

AS

asisakov

1 502 assinantes

16

6

312

Какое направление выбрать и где развиваться сейчас в DS
Часть 2

⬆️Начало выше

📝 Natural Language Processing (NLP) - это направление, которое неожиданно занимается обработкой и анализом естественного языка: задачи анализа тональности текста, извлечения именованных сущностей, машинного перевода, генерации текста, создания чат-ботов и многого другого. Прикольно кстати, что тут можно зайти с двух сторон: и со стороны лингвистики, и со стороны машинного обучения. Также важны знания глубокого обучения, но уже в части рекуррентных сетей и трансформеров, а также очень важно понимание классических подходов (вспоминаем либы nltk, spacy и gensim)! Ведь tf-idf/word2vec всегда очень хороший бейзлайн.

🦯 Рекомендательные системы (RecSys) - тренируем модели персонализированных рекомендаций товаров, контента, услуг на основе предпочтений пользователя и его прошлых действий, что нужно в онлайн-ритейле, стриминговых сервисах, соцсетях, рекламе и многих других областях. Здесь кстати пригодятся знания алгоритмов классического машинного обучения, а также специализированного DL, ну и нужно уметь работать с данными о транзакциях и действиях. А что самое интересное - аналитики тоже тут нужно очень много.

😉 Reinforcement Learning (RL) - это когда берем и обучаем агентов в интерактивных средах. Создаем/оптимизируем/валидируем алгоритмы, позволяющие агентам обучаться на основе взаимодействия с окружающей средой и получения обратной связи в виде вознаграждений. Если мы интересуемся теорией игр, робототехникой или даже просто играми, то это нам подходит. RL требует знаний математики, и марковских цепей, а также точно важен опыт работы с фреймворками обучения с подкреплением. Если вы дошли до этой части, то настоятельно вам рекомендую сюда (в RL) не лезть.

🌟 Large Language Models (LLM) - это новое и быстро развивающееся направление, которое занимается созданием и обучением больших языковых моделей, способных генерировать человекоподобный текст и решать различные задачи NLP. Можно это назвать некоторой комбинацией NLP и RL, но это уже вылилось в отдельную дисциплину, где исследуют модели, которые могут генерировать связный и осмысленный текст. А также отвечать на вопросы, делать суммаризацию текста и даже написать симфонию. Если мы являемся энтузиастами искусственного интеллекта и хотим исследовать границы возможностей языковых моделей, то придется заботать дополнительно к NLP архитектуры типа GPT и T5, а также иметь хорошие навыки работы с фреймворками DL и большими текстовыми данными.

Несмотря на различия между этими направлениями, все они объединены общей идеей извлечения ценной информации из данных и создания интеллектуальных систем. Выбор конкретного направления зависит от личных интересов, навыков и карьерных целей.

Но независимо от выбранного пути, самое главное - это выбрать то, что действительно нравится и вдохновляет. Только занимаясь любимым делом, можно достичь настоящего успеха и реализовать свой потенциал.

Постоянное развитие и обучение - это неотъемлемая часть работы в DS. Технологии и методы в этой области быстро развиваются, и чтобы оставаться востребованным специалистом, необходимо постоянно следить за последними тенденциями, изучать новые инструменты и подходы, экспериментировать и работать над собственными проектами! Это сложно и требует больших усилий, но в то же время это невероятно увлекательно и приносит огромное удовлетворение, а значит точно стоит того!

Какое бы направление мы ни выбрали, будь то инженерия данных, аналитика, машинное обучение или более специализированные области, такие как CV, NLP или RL, мы станем частью сообщества, которое меняет мир к лучшему с помощью данных и технологий. По классике, очень важно найти то, что вас по-настоящему драйвит, и упорно трудиться для достижения своих целей. Тогда вероятность успеха будет выше.

Узнали? Согласны?

#career

21.02.2025, 19:34

t.me/asisakov_channel/734

AS

asisakov

1 502 assinantes

10

315

Какое направление выбрать и где развиваться сейчас в DS
Часть 1

Когда я вкатывался в Data Science - я думал, что правильно определиться в каком направлении развиваться, это самое важное решение, которое может определить весь дальнейший карьерный путь 😌. После нескольких месяцев собсесдований я понял, что направление не важно, а важно просто хотя бы пройти собес и уже начать получать опыт хоть где-то, но пост не об этом. Очевидно, что каждая область развития имеет свои особенности, задачи, подзадачи и даже внутренние узкие скиллы для развития (что конечно требует определенных навыков).

Давайте рассмотрим подробнее и поразмышляем, почему оно может быть интересным для нас. Все мои описания не претендуют на стопроцентную точность и могут быть очевидными, но все же давайте озвучим это.

😈Data Engineering - это направление, которое фокусируется на создании и поддержке инфраструктуры для работы с большими данными. Инженеры данных проектируют и разрабатывают системы хранения, обработки и анализа данных, обеспечивают их безопасность, надежность и конфиденциальность. Это может быть очень интересно для нас, если мы любим работать с жесткими фреймворками и решать сложные технические задачи. Тут недостаточно просто базового питона, тут нужны неплохие навыки программирования, и даже возможно легкое понимание Джавы, также важно понимание баз данных и даже распределенных систем с апишками.

💙 Аналитика - это 100 для тех, кто любит исследовать данные, находить закономерности и генерировать гипотезы. Аналитики данных помогают компаниям принимать обоснованные решения - проводят исследования, строят дашборды и отчеты, сегментируют клиентов, выявляют тренды и отклонения. Если мы обладаем пытливым аналитическим складом ума и любим решать бизнес-задачи, то возможно это нам может зайти. Как я писал ранее, в аналитике важны знания статистики, визуализации данных, SQL и программирования, а также умение работать с большими объемами структурированных и неструктурированных задач данных.

😂 Прикладное классическое машинное обучение - те самые табличные модельки, временные ряды и все вот это вот очень надежное, стабильное и интерпретируемое. Здесь решаются задачи классификации, регрессии, кластеризации, обнаружения мошенничества и многого другого. Вкатываемся, если мы обожаем математику и алгоритмы, любим находить закономерности в данных и делать end-to-end проекты. Звучит немного похоже на аналитику, и в целом так и есть, потому что это связано. Кроме глубоких знаний математики, алгоритмов и программирования, очевидно требуется понимание машинного обучения, фреймворков и даже немного дип лурнинга.

🚙 Computer Vision (CV) - это область, которая (как вы догадались) фокусируется на анализе и обработке изображений и видео. Тут имеют место быть задачи распознавания объектов, сегментации изображений, трекинга объектов, генерации и стилизации изображений и много еще разного вплоть до OCR. Если мы кайфуем от визуала и хотим научить компухтеры отличать кошечек от собачек, то следует заботать глубокое обучение особенно в части сверточных сеточек, а также плотно поработать с библиотеками обработки изображений, допустим OpenCV или Pillow.

⬇️Продолжение ниже

#career

21.02.2025, 19:34

t.me/asisakov_channel/733

AS

asisakov

1 502 assinantes

22

13

679

Парни со стволами блогами

Когда я начинал свой путь в DS (и даже не знал, что можно быстро вкатиться), я буквально днями зависал в слаке ODS’а и впитывал каждый пост и комментарии оттуда. Ребята всегда находили чем поделиться: успехами, поражениями, интересным опытом, или даже необычными ситуациями. Сейчас мои 90% источников знаний также остались в мессенджерах, но в телеге. По моим постам (0, 1, 2, 3) и Интересному Что-то вы наверно 💯 догадываетесь, что я читаю достаточно большое количество ML-блогов.

Для меня в первую очередь это новые знания, опыт, который я могу перенять и даже офигенные идеи. Я уверен, что вы подписаны не только на меня одного, и также учитесь у экспертов, которые щедро делятся своими знаниями и опытом.

Самое важное по моему мнению - это возможность увидеть, насколько разнообразной и многогранной может быть буквально одна и та же работа с моделями и сеточками. У каждого свои челленджи, перспектива, свой стиль и подход к решению задач - гуглить и копировать со стаковерфлоу, просить чатгпт или вообще делегировать джунам.

И в этом разнообразии кроется огромная ценность. Читая посты от разных авторов, мы расширяем свои горизонты, знакомимся с новыми идеями и подходами, которые могут вдохновить нас на собственные исследования и проекты. Мы учимся смотреть на проблемы с разных точек зрения и находить нестандартные решения. Мы начинаем понимать, что в ML нет единственно верного пути, а есть множество возможностей и путей к успеху.

Это не просто пассивное поглощение информации. Это активный процесс обучения и роста. Мы можем задавать вопросы, участвовать в дискуссиях, делиться своими мыслями и идеями. Мы можем учиться на опыте других и применять полученные знания в своей работе и проектах. А иногда мы можем даже вдохновиться на то, чтобы самим начать вести блог и делиться своими знаниями и опытом.

Го использовать эту удивительную возможность. Специально для вас мы с ребятами собрали небольшую папочку с ML-авторами: https://t.me/addlist/f8IcgSAaYok2ODMy

Если хотите рекомендаций, то вот например:

🔵Сергей вот (ага, тот самый, который написал одну из книг из этой подборки) недавно пустил в печать еще одну свою книгу
🔵Пост Захара про свой стартап
🔵Объяснение self-attention и multihead attention на пальцах от Димы
🔵Пост Антона про то, как учиться быть руководителем
🔵Никита расписал немного ML System Design Interview
🔵Пост Андрея про интерпретируемость моделей машинного обучения
🔵Денчик вон вообще статью в 16 лет написал
🔵Андрей (еще один) кстати выступал на том же DataFest’е, что и я
🔵А Николай хорошо раскидал оптимизационную задачу

#collaboration

20.02.2025, 18:58

t.me/asisakov_channel/732

AS

asisakov

1 502 assinantes

255

Товарищи знатоки
Вопрос к вам:

Как вкатиться в заботать аналитику?

UPD. Поправил

18.02.2025, 20:59

t.me/asisakov_channel/731

AS

asisakov

1 502 assinantes

6

4

251

Интересное что-то от ребят, кого я читаю v0.3

Предыдущий пост тут
Интересное что-то тут

1. Давно не видел такого материала, и вот Андрей и Ольга поделились целым пайплайном по погружению в диффузионки. Первый пост с гайдом, туториалами и фремворками вот тут, второй пост с дополнительными материалами идет сразу следующим вот тут. Аж вспомнил времена, когда мы с Купчанским тренировали ганы (iWGAN-GP) с нереальными лоссами для генерации логотипов.

2. Анатолий выложил TLDR статьи, где предлагают интересный метод построения ансамблей моделей через forward selection с применением байесовского усреднения, что показывает результаты покруче самой лучшей модели (спойлер: для этого и нужно ансамблирование). Есть только вопросики к тестовым данным - в целом, с комментариями Толи согласен.

3. Григорий как истинный enjoyer JAX'а решил не останавливаться только на своей книге, но и предложил крутой источник для его изучения. В один пост это не поместилось, поэтому вот еще ссылочка на продолжение.

4. Рома поделился роадмапом как вкатиться в NLP со ссылками на роадмапы про вкатывание в NLP. Интересно, что первой ссылочкой идет курс Лены Войты, а только потом появляются ссылки на роадмапы. На самом деле это намек - без базы никуда! Поэтому и классический ML тоже надо учить - ведь это база.

5. Ну раз начали про курсы - ребята со Сберлоги решили снова устроить марафон по прохождению Стэнфордского курса по графам. Пост находится тут. Как минимум рекомендую ознакомиться с приложенными в сообщении материалами. Ну а так кстати очень прикольный формат совместной ботки.

#interesting

17.02.2025, 13:28

t.me/asisakov_channel/730

AS

asisakov

1 502 assinantes

8

3

228

С Днем Всех Влюбленных!

В тот раз мы ходили на очень милый спектакль, а в этот раз захотелось как-то без суеты, поэтому просто прогулялись, приятно провели время и просто покайфовали.

Как раз на этой неделе произошел пожар с прогнозом, и я буквально дни и ночи сидел с тем, чтобы где-то подправить данные, где-то изменить способ расчетов, а где-то совсем быстро накостылить решение на коленке (причем неплохо работает). В итоге - вся подготовка к сюрпризам прошла мимо меня 🤯

❤️Спасибо любимой жене, что всегда привносит много романтики и сюрпризов в наши рутинные будни, и я очень ей за это благодарен ❤️

Кстати, угадайте что я еще не успел подарить жене в подарок?🎁

Если вдруг кто-то из вас не знает, что подарить своей второй половине с увлечениями в DS и у вас много денег, то подсказка на фото

14.02.2025, 21:14

t.me/asisakov_channel/729

AS

asisakov

1 502 assinantes

275

Кто сможет найти алгоритм решения за 3 взвешивания?

13.02.2025, 20:55

t.me/asisakov_channel/728

AS

asisakov

1 502 assinantes

2

270

Вот из одного видео (KaBhTMsn8Ao на ютубе) формулы для разных подвидов этой задачи.
Получается в нашем случае 13 монет - теоретический максимум.

13.02.2025, 20:55

t.me/asisakov_channel/727

AS

asisakov

1 502 assinantes

6

2

301

13 монет

У этой задачи есть интересная история, ее я расскажу чуть позже

За сколько взвешиваний на чашечных весах можно найти фальшивую монету среди тотал 13-ти монет?

HINT: Мы не знаем, фальшивая тяжелее настоящей, или нет.

#problem

12.02.2025, 21:06

t.me/asisakov_channel/726

AS

asisakov

1 502 assinantes

6

5

209

Интересное что-то от ребят, кого я читаю v0.2

Предыдущий пост тут
Интересное что-то тут

1. Ребята с с gonzo ML очень классно разобрали модели DeepSeek. Например, вот первый пост из серии про V3, и вот первый пост из серии про R1. Дополнительно к этому упомянул бы, что Антон выпустил целый пост на Хабре с разбором R1

2. Пока не отошли далеко от дипсиков, Саша поделился крутой статьей про генерацию N токенов трансформерами. Денчик в коментах верно подметил, что идея выглядит как продолжение Medusa. Причем, на это еще неделю назад обратил внимание Илья

3. Ваня накидал дофига ссылок по system design и подготовке к этим собесам. все источники к сожалению на ютубе, если вам интересны другие источники, то велком в мой пост с подборкой источников. Плюсом можно пробежаться по тегу #systemdesign в канале с репостами

4. Валера собрал неплохой лонгрид про то, как устроены LLM, GPT и чат-ботики под капотом.

5. Наш 17-летний Дмитрий на пальцах разобрал топ-1 решение на сореве Santa 2024, где надо было переставлять слова для минимизации перплексии. Вдогонку сразу объяснил, почему там не сработал BeamSearch. Дополнительно к этому рекомендую пост от дяди

#interesting

10.02.2025, 10:13

t.me/asisakov_channel/725

AS

asisakov

1 502 assinantes

16

1

274

IMG_1022.MP4

Пользуясь случаем , передаем привет Борису💪🏿

#meme

9.02.2025, 16:38

t.me/asisakov_channel/724

AS

asisakov

1 502 assinantes

8

5

209

400 тысяч оттенков AI

Обнимающие лица 🤗очень запарились и сделали буквально то, о чем я мечтал - собрали все доступные AI модельки и сервисы в одно место (ссылки про spaces вы наверно видели миллиард раз и в другом канале, потому что там публикуют веса и модельки, которые можно потыкать). Еще некоторое время назад мне казалось нереально поддерживать все это, потому что каждый день выходит что-то новое. А тем более масштаб с хорошим поиском был невообразим.

Причем, было много попыток от ребят это структурировать и собрать. Например тут и тут

Говорят, что доступно онлайн, без регистрации и смс

https://huggingface.co/spaces

#llm #interesting

7.02.2025, 18:43

t.me/asisakov_channel/723

AS

asisakov

1 502 assinantes

5

4

240

Код-ревью

Помните, я тут спрашивал вас о код-ревью, и решил накидать некоторое суммами из ваших ответов и моего видения. Так что ловите.

Для чего это делается:

1️⃣Поиск ошибок, уязвимостей и модельных рисков
2️⃣Улучшение качества кода и минимизация будущего технического долга
3️⃣Обмен знаниями в команде
4️⃣Поддержка единого стиля кода в команде

Количество ревьюеров:

1️⃣Минимум 1 человек
2️⃣В критичных изменениях нужны дополнительные ревьюеры
3️⃣Возможна кросс-проверка между разработчиками
4️⃣Но чаще всего один основной ревьюер и несколько опциональных в зависимости от нагрузки

В каких случаях можно обойтись без код-ревью:

1️⃣Срочные хотфиксы в продакшене и инциденты
2️⃣Легкие изменения (опечатки, документация)
3️⃣Временные экспериментальные проекты
4️⃣Повторное использование уже проверенного кода
5️⃣Полностью автоматизированные изменения (обновление кончина например)

Польза для команды:

1️⃣Передача знаний
2️⃣Совершенствование скиллов кодинга и формирование единой командной практики
3️⃣Минимизация модельных рисков
4️⃣Развитие критического мышления и улучшение коммуникативных навыков

Кто должен ревьюить:

1️⃣Техлид или тимлид
2️⃣Опытные разработчики
3️⃣Специалисты с релевантной экспертизой
4️⃣И вообще по-хорошему все члены команды, кому это будет полезно

Че по рекомендациям:

1️⃣Использовать автоматические проверки (линтеры, тесты)
2️⃣Писать понятный код и комментарии при ревью
3️⃣Фокусироваться на важном, а не на мелочах
4️⃣Если есть какие-то сложные моменты или концепции, оформить доку
5️⃣Учитывать все возможные сценарии, в том числе специфичные корнер-кейсы (например, системное время)

Потенциальные риски и возможные решения:

1️⃣Деградация процесса - дать ответственному человеку этот процесс и возможность наказывать за несоблюдение правил
2️⃣Затягивание процесса разработки излишней бюрократизацией при ревью - тут по-хорошему зависит от кейсов, но даже если подзатянется, продовый код все равно должен быть проревьюен
3️⃣Возможность конфликтов при недостаточной культуре обратной связи - рассмотреть как точку роста софтскиллов для коллег

Не сказал бы, что ответы на все эти пункты отражают нюансы на все 💯, но большую часть вопросов закрывают вполне себе. Надеюсь, что это подтолкнет вас на размышления не только о код-ревью, но и в целом об эффективности всех процессов, с которыми мы работаем.

Кто знает, может скоро за нас код-ревью уже будут проводить LLM-агенты?

#code

6.02.2025, 10:22

t.me/asisakov_channel/721