Telegram channel page: [27/100] Витя Тарнавский • @singularityfm

3 685 subscribers

79

22

1.0 k

Приехала кепка от самого Pieter Levels 🥳

Это тот чувак который навайбкодил себе бизнесов на $3M+/y. Писал про него тут

Я теперь настоящий вайб кодер 🌟

Взял тут

04/25/2025, 11:51

t.me/singularityfm/228

SI

[27/100] Витя Тарнавский

3 685 subscribers

59

2.0 k

metal crossword.mov

04/24/2025, 10:25

t.me/singularityfm/226

SI

[27/100] Витя Тарнавский

3 685 subscribers

58

62

1.9 k

Решил я загрузить в ChatGPT o3 вот этот потрясающий кроссворд с именами heavy metal групп. Посмотрите картинку, он хорош.

Думал, посмеюсь, как глупая машина эпично провалит это очевидно невозможное задание. Смеяться не получилось, получилось паниковать 😱

Эта консервная банка разгадала кроссворд (почти)

Я приложил видос с рассуждениями, и это объект искусства. Кропы, запуск кода, хождения в интернет - 😳. Суммарно эта шарманка работала минут 20, два раза пришлось подопнуть.

Отдельно заслуживают внимания вот такие попытки разобраться что же там написано:

The letters seem to spell "VULNARY" at first, but I’m noticing something that makes it look like "SVULCARY"—but I'm still not sure. The first letter looks like a "C" or "S," and the logo has that spiky look, so it’s hard to pinpoint. I’m thinking of trying to brighten the image a bit to make the letters pop. Maybe I should also zoom out to see better clarity before I continue making any decisions here. Gotta be more careful!

На выходе табличка с группами по номерам и ссылками на группу. Теперь я знаю что за группа DISEMBOWEL 🔥

Нам конец, машины победили 🤖

p.s. кому интересно, тред

p.p.s. меня быстро поправили что решено не особо правильно, я проверил по ВУЛЬВОДЫНЕ и успокоился, надо было внимательней 🤡

04/24/2025, 10:25

t.me/singularityfm/225

SI

[27/100] Витя Тарнавский

3 685 subscribers

59

2.0 k

Screen Recording 2025-04-23 at 18.41.58.mov

04/24/2025, 10:25

t.me/singularityfm/227

SI

[27/100] Витя Тарнавский

3 685 subscribers

38

128

1.9 k

CPO OpenAI в Lenny's podcast, оч интересно, всячески рекомендую. Да, это именно тот человек который виноват в o3-mini-high и других шедеврах нейминга )

Там есть супер красивая история как их HRD сама пошла и навайбкодила (!) внутренний инструмент которого ей не хватало. Я верю что компании будущего так и должны жить - любой человек может создавать нужные ему инженерные решения лично сам. Эй, HRD, берите пример )

Что ещё классного:

1. Evals - ключевой навык продакт менеджеров и инженеров. Если ты не можешь правильно проверить работу системы на llm, ты не продвинешься дальше прототипов. Что такое эвалы и почему они важны можно почитать например тут

2. Никаких роадмапов на 3 месяца. Ребята живут в мире где через пару месяцев выйдет очередная модель которая опять всё кардинально поменяет. Поэтому никаких долгих роадмапов, только гибкость и только хардкор. Сравните это с вашей компанией ))

3. Bottom-up company
Так как путь неизвестен, то стратегия OpenAI это иметь супер-дальний ориентир (e.g. создание AGI), а работу строить как набор bottom-up команд, каждая из которых к этому ориентиру двигается. Интересно; кажется, Илон Маск строит такие штуки иначе.

Смотреть подкаст тут, и в целом Lenny's podcast оч крутой

04/23/2025, 10:33

t.me/singularityfm/224

SI

[27/100] Витя Тарнавский

3 685 subscribers

46

54

1.9 k

viberacer 720.mov

Beer Vibe Coding

Оказывается, собраться толпой и вайб кодить на проекторе под пивко это потрясающий способ провести вечер!

Собрались вечером и навайбили в replit совместными усилиями вот такую всратую open world гоночную игру с медведями ) Базовую игру replit собрал с одного промпта, что вызвало у всех некоторый шок.

После этого я все выходные пытался её сделать лучше и убил на это несколько часов. Сравнение с результатом пивного вечера показало что стало хуже 🌟 типичный вайб кодинг

Погонять можно тут (десктоп): https://viberacing.replit.app/

04/20/2025, 16:47

t.me/singularityfm/223

SI

[27/100] Витя Тарнавский

3 685 subscribers

87

106

1.8 k

You don't clone greatness. You build it 🌟

Perplexity повесили ну очень наглую наружку напротив офиса Яндекса в Белграде 😅 респект за наглость

04/17/2025, 10:16

t.me/singularityfm/222

SI

[27/100] Витя Тарнавский

3 685 subscribers

Repost

22

180

1.3 k

У OpenAI вышел классный гайд для бизнеса, на тему того как внедрять GenAI в бизнесс процессы:
https://openai.com/business/guides-and-resources/

Внутри 3 части:
– АИ на предприятии: Опыт семи передовых компаний
– Практическое руководство по созданию агентов ИИ: Что агенты АИ могут сделать для ваших сотрудников?
– Определение и масштабирование сценариев применения АИ: На чём концентрируются компании, первыми внедрившие АИ

Я полистал и там внутри много вещей на которых лично я набивал шишки в практике с GenAI, очень рекомендую корпоративным менеджерам

04/16/2025, 19:23

t.me/singularityfm/221

SI

[27/100] Витя Тарнавский

3 685 subscribers

Repost

83

22

1.7 k

04/15/2025, 18:25

t.me/singularityfm/220

SI

[27/100] Витя Тарнавский

3 685 subscribers

Repost

59

38

1.4 k

Немного новостей!

В начале года я покинул Юду. Провел там почти 6.5 лет – целая эпоха! Пришел когда-то заниматься данными (Head of Data Science), потом рулил продуктом (CPO), был GM, а в прошлом году немного побыл даже и.о. CEO. Безмерно благодарен компании за рост, крутой опыт и возможность его получать! И лично Денису Кутергину за проявленное доверие, ибо без него этого всего бы не было 💪.

Но настало время двигаться дальше к новым вызовам! Теперь я в AI центре Т-Банка работаю директором по продукту в команде Вити Тарнавского. Делаем пользовательские продукты вокруг LLM, агентов и прочего ИИ добра, конвертируя современные достижения в вэлью для людей 🤖.

В последние пару лет много игрался с AI, пробовал всякое и использовал в работе. Наверное, это стало моим основным хобби. А теперь это и моя работа! Что может быть лучше?

В своё время мне удалось запрыгнуть в один из первых составов хайп-трейна дата сатанизма, поэтому не мог пропустить новую волну в AI. Считаю важным для себя быть там, где создаётся что-то новое и полезное, а мои навыки могут быть максимально полезны. Пришло время объединить мои продуктовую, техническую и ML экспертизы!

Заодно хочу рассказать, что у нас в AI центре много вакансий.

В команду Поиска ищем:
- Product Manager
- Lead Product Analyst

В команду "Умной Операционки" Даниэля:
- Lead Product Manager
- Product Manager
- Machine Learning Engineer

В команду "ML Platform" Жени Харитонюк:
- Lead Technical Product Manager в LLM Platform
- Lead Product Manager в CV Platform
- Lead Product Manager в Copilots Team

У нас очень крутая и драйвовая команда, частью которой вы можете стать! И мы делаем офигенские продукты, про которые обязательно буду писать! А в будущем их будет только больше 😐

04/11/2025, 17:12

t.me/singularityfm/219

SI

[27/100] Витя Тарнавский

3 685 subscribers

15

45

1.3 k

A2A_demo_v4.mp4

Google выкатил A2A - протокол для взаимодействия AI-агентов

Google выкатили интересный протокол для общения агентов. Посмотрите демо-видео, красивый пример как агент-клиент использует другие агенты в своей работе через A2A.

По бумажке, A2A дополняет MCP от Anthropic: A2A для agent-agent, MCP для agent-tool/agent-data. В документации они даже написали отдельный раздел A2A ❤️ MCP. На самом деле, MCP позволяет общаться и с агентами тоже, так что определенное перекрытие и конкуренция здесь есть.

В инженерной жизни вокруг LLM нам пригодятся сильные единые протоколы, так что хорошо что крупные компании их делают. LLM-миру нужен свой USB-C. Пока что, правда, получается USB-1 и USB-2 )

04/10/2025, 10:30

t.me/singularityfm/218

SI

[27/100] Витя Тарнавский

3 685 subscribers

7

5

1.3 k

👆как мы делаем детского ассистента с большими черными петухами

04/03/2025, 13:47

t.me/singularityfm/217

SI

[27/100] Витя Тарнавский

3 685 subscribers

Repost

37

27

1.1 k

Приветики всем любителям кеков и приколов от нейросеток ✌🏽
С вами снова Ксюша, продакт детского AI-ассистента.

Недавно мы запустили в Джуниор-ассистенте генерацию картинок по тексту, и этот опыт был тоталли анфоргетбл.

Несколько вводных:
- Дети супер вовлечены во все, что связано с AI. Около половины наших пользователей ответили в опросе, что часто заходят просто поболтать и задать вопросы
- Мировые тренды (Character.ai, Replica и тд) показывают, что активность детей с AI-продуктами сильно растет, а возвращаемость бешеная. У того же Character.ai 200М визитов в месяц при ~20М пользователей. Современные дети взрослеют сильно раньше, чем наше поколение: если мы в 10 лет играли в куклы и машинки, то они разбираются в инвестициях и лучше взрослых знают, откуда берутся дети

Опираясь на это, мы тоже решили похайпить и прикрутили нашу внутреннюю модель для генерации картинок — TFusion.
Поначалу все казалось очень простым и понятным: даешь детям генерацию картинок по тексту, они просят сгенерировать мам, пап, кошечек, собачек, а если попросят нарисовать дикпик, мы просто это отловим еще на этапе текста — и вот он успех!
Но когда мы начали тестировать весь процесс end-to-end, поняли, что нам предстоит новый раунд работы с безопасностью, тк генерация картинок ооочень отличается от генерации текста, и правила модерации там совсем другие.

Кейс 1: "Большой черный петух"
Многие модели (и наша в том числе) работает с генерацией картинок по тексту так, что изначальный запрос пользователя переводится на английский и только потом идет в генерацию.
Вопрос нэйтив спикерам: как вы думаете, как перевелся большой черный петух? А маленькие синицы?
Честно говоря, мы вычислили это абсолютно случайно. А за то, чтобы нагенерить еще похожих кейсов, меня чуть не забанил OpenAI.

Решили проблему довольно просто — добавили к модерации запросов пользователя еще и модерацию перевода на английский.

Кейс 2: "Нарисуй маму"
Вроде как с опасными запросами все понятно — прикручиваем максимальное количество проверок. Но как быть, если модель по запросу "нарисуй маму" отдает картинку кормящей женщины топлесс в трусах с надписью "mom"?
Тут в игру вступает модерация картинок. И здесь нам пришлось писать целый список небезопасных тематик и людей (туда даже входит Саша Грей и Лысый из Браззерс), ориентируясь на которые, модель выдает процент совпадения.

Кейс 3: "Нарисуй что-нибудь необычное"
Особенность работы с генерацией картинок в том, что чем больше контекста положишь в запрос на генерацию, тем детальнее, красочнее и точнее будет картинка. Поэтому для тех, кто немногословен в своих запросах, существует такая штука, как обогащение запроса пользователя.

Мы выбрали одну из таких оберток запросов, которая включала в себя что-то вроде "cinematic, photo on canon 35mm". И как только начались запросы формата "хочу что-то интересное", "нарисуй сусеки", модель с завидным постоянством выдавала разного рода фотоаппараты и камеры 🫠

Решили тем, что доправили эту обертку, но командный мем уже прижился)

Подытожить хочется рубрикой «Что чаще всего рисуют дети»:
- майнкрафт
- кошечки/собачки
- капибары
- тачки
- аниме персонажи
- и, внимание, какашки 💩

На этом все! А примеры генераций в комментах, велком ✨

04/03/2025, 13:47

t.me/singularityfm/216

SI

[27/100] Витя Тарнавский

3 685 subscribers

18

11

1.2 k

xAI купил X

Очень интересный мув

Данные

100+ TB твитов - это много. Это в ~200 раз больше чем вся Википедия, и сравнимо с месяцем дампа интернета (common crawl 200-300 TB/month zipped). А ещё это в два раза больше токенов чем было в обучении DeepSeek-V3.

Твиты это данные сомнительной интеллектуальной ценности )
Но явно лучше чем в среднем интернет.

Со стороны может казаться что твиты можно просто скачать. По факту это сложновато сделать, данные X защищены жесткими копирайтами. Особенно тяжело это для ребят вроде OpenAI которые сидят в соседнем здании и у всех на виду.

В дополнение к архивам это даёт доступ к срезу текущего контекста человечества практически в реальном времени. Зачем - непонятно, но интересно.

Объединенный продукт

Ждите Grok во всех дырках )
Он уже на главной, и ещё его можно тэгать с просьбой объяснить пост.

Неправильно это рассматривать как просто дистрибуцию Grok. Это создание единого продукта, где соцсеть пронизана генеративным интеллектом. Такое сложно делать без объединения компаний.

Например, Grok может сам создавать контент. Он уже встроен в создание постов. И страшно даже представить сколько в X полностью автоматических LLM-based аккаунтов. Это нельзя победить, можно только возглавить.

Интересно, что не только Илон Маск думает о таких мувах. Perplexity уже какое-то время пытается купить TikTok и написал про это интересную статью.

04/01/2025, 10:11

t.me/singularityfm/215

SI

[27/100] Витя Тарнавский

3 685 subscribers

30

10

1.1 k

Unbiased vs biased модели

Маск активно продает что Grok направлен на истину в отличие от других моделей. Называет он это anti-woke.

Действительно, Grok вроде бы меньше прогибается под "общепринятое мнение" и вообще от мнения отказывается. В полярных вопросах про аборты, однополые браки и смертную казнь мне не удалось выбить из него мнения. Он ссылается на разницу культур и норм.

Задача довольно сложная, так как истины, как известно, нет. В разных культурах один и тот же вопрос имеет разный ответ и не всегда прикроешься "в разных странах бла бла". Например, права женщин Grok считает равными правам мужчин, но это не во всех странах так, к сожалению.

Зависит это не только от постановки задачи, но и от количества и перекоса исходных данных. В интернете мало текстов из Северной Кореи.

Самый интересный дискурс для меня это будут ли базовые модели разные для разных стран или все-таки возможна гибкая базовая модель которую потом уже страны могут файнтюнить под свои культурные, политические и пропагандистские задачи. От этого многое зависит в технологической архитектуре будущего.

03/28/2025, 10:33

t.me/singularityfm/214

SI

[27/100] Витя Тарнавский

3 685 subscribers

27

49

1.4 k

Уровни автоматизации в AI

В системах управления автомобилем есть вот такой стандарт уровней автономности. Он измеряется от 0 до 5, где 0 это очень слабый уровень, а 5 - водит без человека где угодно.

В автоматизации цифровых работ есть очень похожие понятийные уровни. Можно выделять три:

1. Copilot, или AI помогает человеку

AI помогает делать работу, при этом рабочий процесс не меняется.

Сложность небольшая. Процесс не меняется, и требования к качеству не такие высокие.

Экономический эффект: 0-40% стоимости работ. В редких кейсах получится сделать больше.

2. Human in the loop, или AI работает, человек контролирует

Здесь рабочий процесс значимо меняется. Работу уже делает AI, человек подключается когда AI сомневается или нужно принять финальный результат. Важно, что ответственность лежит на человеке.

Реализовать довольно сложно, основные барьеры — построить заново рабочий процесс и сделать достаточно высокое качество работы AI.

Экономический эффект: варьируется и может быть выше 90% человеческой стоимости работ. Недооцененный уровень: многие пытаются сразу сделать полную автоматизацию, а это в разы сложнее.

3. Full Automation

Здесь человека в контуре нет. Это важно, ответственность полностью переходит на робота и это принципиальный момент доверия к системе и ответа на вопрос "кто виноват".

Рабочий процесс похож на процесс из пункта 2, но нет проверок. Вместо него создается контур проверки качества - например, каждый десятый результат в фоне проверяет человек.

Экономический эффект здесь максимальный. Сделать очень сложно, основной барьер - качество выполнения работ с помощью AI.

Большая часть автоматизации цифровых работ сейчас находится на нулевом и первом уровне. Основной фактор - сложно добиться качества работы AI-систем при текущем уровне моделей и технологий.

Но через 10 лет я бы ожидал значимых сдвигов вверх по уровням по всем цифровым работам которые делает человек.

Курьеры пока что могут спать спокойно, там сложно и дороговато получается :)

03/27/2025, 10:13

t.me/singularityfm/213

SI

[27/100] Витя Тарнавский

3 685 subscribers

65

21

1.5 k

Вот как я должен выбрать тут модель под свою задачу? )

Одна тупая, другая долго думает. Кто-то ходит в интернет, кто-то нет. Research preview это можно использовать или нет? ) ну и потрясающие mini и mini-high )

И ни одной подсказки!

Самый большой в мире пользовательский AI-продукт продолжает развиваться как демо площадка для моделей.

Perplexity тут молодцы: сделали Auto по-умолчанию которая сама разберется что тебе нужно.

03/21/2025, 10:33

t.me/singularityfm/212

SI

[27/100] Витя Тарнавский

3 685 subscribers

32

103

1.6 k

peter_levels.mp4

Питер Левелс продолжает штамповать в одно лицо странные бизнесы которые приносят много денег. На этот раз сделал вот такую всратую игру и гребёт за неё $87k/mo.

Игру написал классическим вайб кодингом: в Cursor, за три часа, используя голосовое управление и не поднимая жопы с дивана. Продает там самолеты, рекламу на дирижаблях и вообще хайпит как может.

Много и открыто рассказывает про свою работу в твитторе. Он там практически секту вайб кодинга открыл. Продаёт кепки vibe coder, купить можно тут. Я заказал синенькую 🥳

Поиграть можно прямо в браузере тут: https://fly.pieter.com/

03/20/2025, 10:22

t.me/singularityfm/211

SI

[27/100] Витя Тарнавский

3 685 subscribers

5

4

1.1 k

Вот это прям мощь, адаптивные интерфейсы можно будет совсем иначе делать.

03/18/2025, 10:16

t.me/singularityfm/209

SI

[27/100] Витя Тарнавский

3 685 subscribers

Repost

45

24

934

IMG_4160.MP4

Очередной интересный эксперимент совмещения языковой модели и интерфейса - хочется для ТГ постов в Сиолошной такое ☕️

Автор

03/18/2025, 10:16

t.me/singularityfm/210

SI

[27/100] Витя Тарнавский

3 685 subscribers

41

34

1.6 k

Topic Call: Приходите создавать Turbo ML Conf!

В прошлом году у нас получилась одна из лучших конференций по прикладному ML на рынке. Было очень насыщенно и очень солнечно 🌞

Этим летом мы хотим повторить успех. Готовим для вас отличную программу, нам есть что рассказать.

Но без вас - не получится. Это конференция для всей индустрии и мы хотим делать её вместе. Ждём вас с докладами!

https://mlconf.t-bank.ai/

03/17/2025, 13:31

t.me/singularityfm/208

SI

[27/100] Витя Тарнавский

3 685 subscribers

2

35

1.2 k

Composio подняли кучу MCP-серверов для разных сервисов и собрали из этого библиотеку интеграций.

Там есть Google Docs, Github, Perplexity, 11labs и много чего ещё. Есть готовые интеграции "по кнопке" в cursor, windsurf и так далее. Классно.

Напомню, MCP это протокол от Anthropic для подключения инструментов и источников данных к LLM. Если у сервиса существует MCP-сервер для интеграции, подключить к вашим агентам или просто LLM-пайплайнам будет очень легко. Компании такие сервера уже создают.

MCP пока не так хорошо приживается в комьюнити - мнения противоречивые. Например, мы у себя внутри на MCP переходить не стали, так как он переусложнен, довольно сырой, и больше подходит для стартапов.

Но какие-то единые протоколы и каталоги тут точно нужны. Надо же всем этим агентам уметь общаться с другими системами и друг с другом.

Кто пробовал MCP ручками? У кого какое мнение?

03/14/2025, 10:22

t.me/singularityfm/207

SI

[27/100] Витя Тарнавский

3 685 subscribers

72

65

1.6 k

(!) Подробный тех репорт про обучение T-lite/T-pro 🚀

Выложили ну очень подробный репорт про обучение наших моделей.

Простой файнтюн не решает наши задачи по адаптации моделей. Нам нужно обучать модель новым скиллам и глубоко адаптировать под доменные зоны и под язык.

Пришлось придумать гибридный подход: используются веса opensource модели, и потом мы повторяем почти все стадии обучения, добавляя правильные данные.

Много про подход и хаки. Очень много про данные: правильный микс данных оказался ключом к успеху. Отдельно рассказали про использования кода в датамиксе, много интересных штук. Например, мы перевели часть комментариев в коде на русский язык.

Фактически, это рецепт, как вам самим можно глубоко адаптировать готовые базовые модели под свои задачи. Используйте!

Горжусь ребятами 🥳 и результатами и подходом к шерингу деталей работы

Напомню, модели в опенсорсе, найти можно тут

03/13/2025, 10:19

t.me/singularityfm/206

SI

[27/100] Витя Тарнавский

3 685 subscribers

19

17

1.7 k

Думаю, все уже видели, что OpenAI выкатили целую батарею инструментов для построения агентских систем. Там всё очень интересно. Описывать их не буду, читайте сиолошную.

OpenAI старается быть вертикальной компанией - предоставлять не только модели, но по возможности максимальное количество слоёв пирога будущей инженерии. В выборе подходов "Android vs Apple" OpenAI делает как Apple: вертикальная закрытая экосистема.

Всё верно делают - сами модели, скорее всего, потеряют свой удельный вес в деньгах. Скорее всего, большую часть денег будут получать производители конечных бизнес-систем. Возможно, это будут AI-сотрудники, пока что мы не знаем.

03/12/2025, 11:50

t.me/singularityfm/205

SI

[27/100] Витя Тарнавский

3 685 subscribers

32

51

1.9 k

Рынок активно обсуждает утёкший ценник на AI-сотрудников от OpenAI.

$10k/mo за разработчика
$20k/mo за PhD-level research

Очень дорого, если сравнивать с моделями. Но если сравнивать с людьми, становится лучше: разработчик для компании по миру примерно так и стоит, при этом у него есть обед, work-life balance и весеннее обострение.

Мне очень нравится что OpenAI этим ценником делают заявление: работу AI-работников нужно сравнивать с работой людей. Ребята не размениваются на мнения, ребята показывают как будет выглядеть рынок. Devin за $500/mo уже выглядит дешевкой.

На самом деле, "AI Worker" это другой тип работника и в реальной жизни они скорее будут дополнять людей. На таких воркеров пойдет вся рутинная работа, это такие интеллектуальные 24/7 рабы.

Вопрос, как обычно, получится ли этим агентам давать результат сравнимый с такой стоимостью. Пока что агенты явно не там. Посмотрим что будет через год.

В следующем сезоне ждите: Профессионалы интеллектуального труда устраивают забастовки против AI-агентов

03/11/2025, 10:14

t.me/singularityfm/204

SI

[27/100] Витя Тарнавский

3 685 subscribers

34

22

1.7 k

Яндекс потихоньку отжал уже 67% поисковой доля в России.

Рынок классического поиска довольно удивительный. Качество продукта почти не помогает перетягивать аудиторию. Это война за поиск по-умолчанию на устройстве или в браузере. Людям, к сожалению, не так важно какой у них поиск, если он базово «нормальный».

Гугл потихоньку умирает, так как в привлечение не вкладывается. Напомню, там нет рекламы! Как видим, это не так уж и важно для пользователей.

66% это почти монополия. Это не очень хорошо: стимулов расти продуктам будет ещё меньше. Если посмотреть в прошлое, и Google и Yandex очень много сделали чтобы себя улучшить в своей конкуренции. Раньше у Google была большая команда в Москве, я был у них в офисе.

Часть трафика поиска оттекла в маркетплейсы. Чайники уже в поиске не ищут. Почему-то принято считать что это "смерть поиска", хотя на самом деле это только один из срезов. Когда-нибудь человечество придумает лучшие способы искать информацию для всех категорий, но пока что baseline в виде поиска в-основном побеждает.

Ответ может лежать в новых GPT-like поисках. Я мечтаю что появится аналог Perplexity но для поиска решения твоей задачи, т.е. поиска бизнеса/исполнителя. Сейчас эти задачи решаются ну очень плохо - что поиском, что картами. Тогда есть шансы поколебать классический поиск в важных для него нишах.

Но пока что весь этот GPT/Perplexity/Нейро на рынки поиска не влияет никак - что в мире, что в России.

03/06/2025, 10:27

t.me/singularityfm/203

SI

[27/100] Витя Тарнавский

3 685 subscribers

62

97

2.7 k

Проблема поискового оркестратора в Perplexity

Когда человек приходит в поиск с вопросом про погоду, он ожидает быстрый ответ. Не нужно разворачивать всю мощь лучших в мире LLM, парсить на лету 200 источников, делать три слоя реранкинга и ещё черт знает что. Это займет кучу времени.

Искусство понять сложность запроса, правильно выбрать из систем разной сложности и профиля, и собрать правильный каскад из систем - это задача оркестрации запроса. Она же - задача роутинга, она же - задача метапоиска. Одна из самых интересных задач в IT-инженерии.

CEO Perplexity Aravind Srinivas рассказывает в подкасте что самая сложная задача которую они сейчас решают это именно проблема оркестрации и создания правильного набора систем за оркестратором. С его слов, кто решит эту проблему в новом LLM-мире, сможет построить следующий Google.

Я помню свой разговор с одним из основателей ABBYY. Он рассказывал что их ключевой ноу-хау это не сами OCR-модели, а как раз правильный каскад из моделей. Лёгкая модель определяющая задачу, дальше в зависимости от результата выбор из путей, и так до 50 разных моделей в каскаде.

В текущих AI-системах вроде ChatGPT эта проблема тоже плохо решена. Пользователю самому приходится решать "достаточно ли моя задача сложная для o3 или можно в 4o сходить". Это, конечно, неудобно.

Кстати, рекомендую и конкретный подкаст, и всю серию подкастов How to Build Future от Y Combinator

03/05/2025, 10:27

t.me/singularityfm/202

SI

[27/100] Витя Тарнавский

3 685 subscribers

53

8

1.7 k

Про подписку на ChatGPT

Сейчас уже каждого уважающего себя человека из digital есть подписка на OpenAI. Некоторые платят и по $200 в месяц.

Подписка «на AI» претендует стать «дефолтной» подпиской современного человека - как на музыку, видео и так далее.

Теоретически, это рынок на миллиард (!) платящих подписчиков - примерно столько в сумме у всех музыкальных сервисов.

OpenAI имеет 2 миллиона платящих подписчиков сейчас (src). Это уже 1% от Spotify.

Но это если у обычных людей реально найдутся каждодневные задачи для такого компаньона. Это не факт - возможно, людям внешний интеллект не так уж и нужен.

Еще одна альтернатива - рекламная модель «как в поиске». Я надеюсь что так не будет, иначе это будет компаньон подталкивающий тебя в услуги более платящего рекламодателя.

Интересно что раньше такого рынка в принципе не было, а теперь есть. Через такие новые рынки растет мировая экономика.

03/04/2025, 10:27

t.me/singularityfm/201

SI

[27/100] Витя Тарнавский

3 685 subscribers

Repost

76

24

1.3 k

Привет, я Витя Тарнавский, директор по ИИ в Т-Банке.

Давайте-ка расскажу зачем вообще нужен директор по ИИ. Я себе сам частенько задаю такой же вопрос 😅

Я разделяю свою работу на такие столбы: технологии, внедрение, платформа, пользовательский опыт.

Технологии - это как сделать так чтобы лучшие технологии в индустрии были у нас. Для этого нужны топовые инженеры, конкретные RnD проекты, команда мотивированная на новизну, наука и так далее.

Внедрение - это как получить пользу от AI везде в компании. Для этого нужно обучать людей, строить команды под бизнесы, тащить руками самые большие ключевые проекты и искать новые большие темы.

Платформа - это как сделать из AI-решений переиспользуемую платформу, а не набор кастомных штук. Понятно, что синтез речи проще сделать один раз - но само это так не произойдет.

Пользовательский опыт - это как менять пользовательский опыт продуктов экосистемы за счет решений на базе AI. Наша сфера новая, и обычно задача как улучшить за счет AI пользовательский опыт - тоже на нас.

Вот, хожу эти четыре задачи по кругу делаю. Если упрощать :)

02/28/2025, 13:50

t.me/singularityfm/200

SI

[27/100] Витя Тарнавский

3 685 subscribers

81

61

1.9 k

Яндекс выпустил YandexGPT 5 Pro

Ребята написали подробную статью на Habr про реализацию. И даже выложили 8b претрейн в опенсорс.

Внимательный читатель может прочитать что ребята решили все-таки бросить затею обучать модель с нуля и инициализируют свой пайплайн весами от Qwen-2.5. Ну и правильно, бессмысленная трата денег. upd: только для большой модели

Замечу тут что это не файнтюн, ребята делают полный цикл обучения модели, но стартуют претрен этап не с нулевых весов. Собственно, похожий подход применяли мы в своих моделях T-Lite / T-Pro.

По выложенным бенчмаркам какие-то прям выводы делать сложно - вроде модели хорошие. Тут главное чтобы в продуктах классно работало (Алиса поумнеет наконец?) и b2b-пользователи довольны были.

Поздравляем!

02/25/2025, 10:56

t.me/singularityfm/199

SI

[27/100] Витя Тарнавский

3 685 subscribers

19

7

1.4 k

Вот сидишь такой думаешь «ну что эта машина может», кидаешь картинку, а там как будто автогонщик на телефоне 😳

Мощь картиночной модальности у 4o как-то незаметно для меня проскочила.

02/18/2025, 13:22

t.me/singularityfm/198

SI

[27/100] Витя Тарнавский

3 685 subscribers

34

48

1.6 k

Кто такие эти ваши AI-агенты

Начинается бездумный хайп вокруг AI-агентов. Я уже видел как некоторые компании ставят цели своим юнитам в духе "срочно проинтегрировать 10 AI-агентов" 🥴

Давайте немного разберемся что же такое агенты.

Существует два определения агентов - профессиональное и наивное. Оба сейчас широко используются. Оба в каком-то смысле верные.

Профессиональное определение берет свои корни в душных книгах по CS.

Я его суммаризовал примерно так:

AI-агент — это автономная система, способная решать сложные задачи требующих планирования и выполнения действий, с конкретной целью, но без заранее заданных инструкций.

То есть, это конкретный класс технических систем. Примерно такой смысл поддерживают Google, AWS, Github, OpenAI и так далее.

Наивное определение берет начало в обсуждениях в твиттере. Звучит примерно так:

AI-агент — это интеллектуальная система которая автономно выполняет конкретную задачу.

Например, саммари моей почты по утрам по такому определению тоже вполне себе агент. Там нет ни планирования ни инструментов, но это не очень важно - единица работы реально выполняется, интеллектуальная головная боль передана автономной системе.

Первые - очень сложно строить и работающих at scale агентов почти нет. Вторые - отлично существуют уже какое-то время.

Я надеюсь эти термины просто разойдутся по углам, потому что профессиональное - про инженерию, а наивное - про применимость решений. Но пока что всё в кучу.

02/18/2025, 10:36

t.me/singularityfm/197

SI

[27/100] Витя Тарнавский

3 685 subscribers

106

37

1.6 k

А Le Chat хорош 🥐

02/14/2025, 14:47

t.me/singularityfm/196

SI

[27/100] Витя Тарнавский

3 685 subscribers

50

23

1.6 k

Сделайте уже кто-нибудь гарнитуру с LLM, я вас умоляю!

Чтобы в ухе всегда была мощь лучших моделей и тулов, но чтобы не мешала говорить с людьми. Примерно как старые гарнитуры типа Plantronics были - просто на ухе висит, не мешает, звук пропускает. В них можно было сутки проходить и не заметить.

Nothing сделали подход к снаряду. Но сложновато настраивать и работает нестабильно. Как я вижу, упирается это в возможности платформ (iOS, Android) - при этом сами платформы как обычно тормозят и ничего не выпускают.

А как было бы круто всегда в ухе иметь личного LLM-ассистента полностью в твоём контексте и который может делать твои задачи!

Не нужна мне эта ваша дополненная реальность, хочу как в фильме Her 🌟

02/14/2025, 11:00

t.me/singularityfm/195

SI

[27/100] Витя Тарнавский

3 685 subscribers

40

19

1.7 k

Стартуем на лучшей LLM

Простая мысль при создании llm-based продуктов которую не все понимают.

Сначала стартуете с самой крутой моделью доступной вам, измеряете и добиваетесь качества, и уже потом оптимизируете стоимость / скорость.

Преждевременная оптимизация и раньше была грехом, но сейчас дело в другом.

Новые прорывы лежат в применении интеллекта LLM. Чем лучше эта LLM тем больше вероятность что у вас действительно получится результат.

Начинать с более слабой модели это как пытаться запустить ракету используя 95й бензин.

Так что не стесняемся использовать o1/o3-mini даже если вы список покупок делаете.

02/13/2025, 10:12

t.me/singularityfm/194

SI

[27/100] Витя Тарнавский

3 685 subscribers

28

71

1.5 k

У Anthropic вышел невероятно интересный отчет и вместе с ним целая инициатива Anthropic Economic Index.

Они берут реальные данные использования их claude.ai LLM API веб-интерфейса и строят агрегированную статистику поверх. Задача исследования - понять проникновение AI в реальные задачи людей.

Anthropic использует здесь очень правильный подход: смотрят в разрезе задач а не профессий. Каждая профессия это на самом деле комплекс разных задач. Усилять или автоматизировать нужно задачи, а не целиком профессии.

Огромное количество интересных данных и выводов, сравнения с зарплатами и распределением реальных работ. Например, на картинке видно дифф между использованием API и процентом людей в профессии.

Хайлайты:
1. Разработка софта занимает практически треть всех запросов;
2. Сильный перекос в digital работы;
3. 57% запросов это аугментация работы (т.е. "работаю вместе с AI"), 43% это AI полностью делает работу за человека;
4. Есть явный перекос в работы средней стоимости. Малооплачиваемые работы видимо трогать не интересно, а с дорогими профессиями всё сложновато получается.

Очень важно что это не какие-то опросы, а реальная статистика из боевого API сервиса. Они даже дают скачать датасет!

Bonus: интересная статья про Anthropic Clio, как они построили внутреннюю систему анализа запросов и как это им помогает

02/12/2025, 14:37

t.me/singularityfm/193

SI

[27/100] Витя Тарнавский

3 685 subscribers

63

61

1.7 k

Vibe coding

Это такой новый способ "писать" код, термин придумал Karpathy вот этим твитом

Представь: ты сидишь откинувшись в кресле, смотришь как агент работает, иногда пишешь ему команды, и просто жмешь accept all 😅

Пишешь туда самую мелкую чушь вроде «перекрась кнопку», наблюдая как вся мощь лучших моделей в мире меняет цвет твоей кнопки.

Bonus points если вы поставили SuperWhisper и делаете это голосом. Тогда даже писать буквы не надо: вбрасываешь ртом команды и агент батрачит.

Народ уже обсуждает “vibe design”, “vibe research” и так далее

Я уже проникся на 100%, зовите меня вайб кодер 🌟

Идеально вечером с чаем или пивком, очень рекомендую )

02/12/2025, 10:07

t.me/singularityfm/192

SI

[27/100] Витя Тарнавский

3 685 subscribers

31

153

2.1 k

IMG_9795.MP4

Посидел с replit.com

Replit это нашумевший AI-агент для разработки. Он за тебя и код напишет, и базы подключит, и задеплоит, и запустит. Разработка по описанию задачи под ключ. Посмотрите видос!

Интересно, что изначально фаундеры затевали проект как инструмент облачной разработки и деплоя. Строят его почти 10 лет! Год назад они пивотнулись в агента и на этом дико взлетели. Тут классный подкаст с ними на Y Combinator

Всем очень советую попробовать, опыт-восторг из будущего 🥳 🤖

Эта штука за тебя step-by-step делает архитектуру, сетапит среду, тащит зависимости, пишет код, подцепляет базы и так далее. Сидишь и смотришь )

- Шикарный агентский сплит-скрин UX
Отличные интеграции
- Классные до-запросы вида «вот это ли ты хочешь»
- Сам находит и пытается чинить ошибки
- Встроенный деплой топчик

Но на паре практических кейсов replit у меня довольно слабо себя показал. Слишком сложные задачи пытается брать, в результате ломается. Нужно самому определить уровень сложности и делать step-by-step над replit, тогда в целом работает, но медленно получается.

Для меня это скорее демо "как всё будет в будущем" и классный пример агентского продукта с точки зрения интерфейса.

Но помним, что модели улучшаются, а планирование (ключевая задача здесь) в принципе недавно появились как популярная задача для Llm. Завтра будет лучше.

02/11/2025, 10:23

t.me/singularityfm/191

SI

[27/100] Витя Тарнавский

3 685 subscribers

26

48

1.7 k

Cursor за два года вышел на $100M денег в год. Говорят, это быстрее любого другого B2B софта.

02/06/2025, 14:55

t.me/singularityfm/190

SI

[27/100] Витя Тарнавский

3 685 subscribers

50

140

2.4 k

Собрал для вас табличку сервисов и фреймворков для создания агентских систем по уровню абстракции - от высокого и простого к низкоуровневым инструментам.

Если хотите посмотреть что такое агенты или сделать простую штуку, начинайте сверху. На уровень 4 спускаться примерно никогда не требуется.

Го в комменты где что забыл и у кого какой опыт

02/06/2025, 09:40

t.me/singularityfm/189

SI

[27/100] Витя Тарнавский

3 685 subscribers

73

41

1.7 k

Telegram x LLM

Телеграм уже давно перестал быть ярким развивающимся продуктом, что расстраивает.

А прикиньте как можно было бы круто сделать мессенджер со всей мощью моделек?

Вот я придумал за 10 минут:

1. Омнимодальность голоса и текста: можно вводить голосом и будет текст, можно озвучить сообщение или чат, в любую сторону;
2. Поиск по смыслу, а не по словам рыжий с котом на аватарке, говорили про тачки. Поиск по медиа и файлам сквозной паспорт Маши;
3. Личный агент для структурирования информации и умеющий сканировать каналы/чаты вместо saved messages
4. Ассистент по-умолчанию в любом групповом чате;
5. Пуши с саммари iOS-style а не батарея бестолковых пушей;
6. Саммари-превью в списке чатов и автотреды по смыслу внутри чатов

Ребята, ну давайте там. 2025 год а у вас расшифровка голосовых кривая косая и по пять минут ждать 🌟

02/04/2025, 15:34

t.me/singularityfm/188

SI

[27/100] Витя Тарнавский

3 685 subscribers

77

75

1.9 k

LLM OS

Очень мощная и близкая мне концепция. Первый раз услышал от Andrej Karpathy тут

Идея такая.

Текущий мир в котором мы живем это мир иконок приложений в твоём iPhone. Есть потребность - есть приложение под него.

Эта концепция уже трещит по швам. Супераппы это порождение недостатков этой архитектуры.

Представим мир LLM OS:

1. Ядро системы это твоя личная LLM с которой ты ведешь диалог и которая делает за тебя фоновые задачи;
2. Система имеет длинную память про тебя: кто ты, что тебе интересно и так далее. Это твой по-настоящему личный партнёр;
3. Все потребности реализованы в виде LLM Tools: функциональных ручек, которые предоставляют компании. LLM умеет их искать и вызывать;
4. Интерфейсы, конечно, есть. И полностью настраиваются через LLM. Компоненты могут предоставляться компаниями в составе Tools; но это скорее конструктор из фиче-виджетов чем текущие приложения. Некоторые считают что всё вообще будет через генерацию видео, с этим я скорее не согласен.

Как будто очень легко верится в такое будущее, я хочу в нем жить. Надеюсь, кто-то уже строит новый Apple.

02/03/2025, 12:30

t.me/singularityfm/187

SI

[27/100] Витя Тарнавский

3 685 subscribers

63

76

1.6 k

No-code - всё!!111

(надо перестать читать бэкдор пхах)

Провел какое-то время с https://n8n.io/ - довольно популярной платформой для автоматизации с поддержкой агентов.

Она довольно классная - готовые интеграции, удобный дебаг и вообще. Можно быстро накидать бота или понятную автоматизацию. Сделали за пятнадцать минут с ребенком бота который генерит мемы для школьного проекта )

Разочарование приехало быстро. Как только я начал строить более сложное, стало там тесно. Ну, как обычно с такими платформами.

И тут я понял что в Cursor накидываю такое же буквально так же быстро. И без всяких глупых ограничений.

И не сказать что я там «пишу код» - я скорее говорю ей «допиши то», «допиши сё».

Новые инструменты разработки такие как Cursor и Replit настолько быстро позволяют создавать код, что изучение правил какой-либо no-code платформы уже того не стоит. И дальше это будет только обостряться.

Такие дела. Ставьте Cursor.

01/31/2025, 10:31

t.me/singularityfm/186

SI

[27/100] Витя Тарнавский

3 685 subscribers

49

60

1.5 k

За новостями про новые супер пупер модели мы часто упускаем более важные в прикладной работе новые строительные блоки.

Perplexity уже довольно давно запустил Sonar: API к поиску. Выглядит ровно как апишка OpenAI, но эта штука ходит в интернет.

Это сильно недооцененная вещь.

Вот пару примеров из моей головы:
- Прокачать все отели, для каждого собрать хорошее описание. Вместо отелей подставь что угодно;
- На лету подтягивать агрегат свежих новостей на конкретную тему
- Собирать преимущества и недостатки товаров из обзоров для вашего маркетплейса;
- Подтягивать на лету решения из интернетов для проблем с любым оборудованием.

По сути, нормальный умный агрегатор интернета завернутый в API. За несколько центов за запрос.

Используйте.

01/29/2025, 10:19

t.me/singularityfm/185

SI

[27/100] Витя Тарнавский

3 685 subscribers

59

57

1.9 k

IMG_9645.MP4

01/28/2025, 13:32

t.me/singularityfm/184

SI

[27/100] Витя Тарнавский

3 685 subscribers

20

17

1.7 k

Начались первые обещания закручивания гаек по GPU. Пока что в виде дополнительных тарифов на импортные GPU, призванных построить фабрики для производства чипов в США а не в Тайване.

Дальше будет веселее. США будет пытаться отобрать у Китая все потенциальные новые GPU. Для NVidia это порядка 20% бизнеса, между прочим.

И напомню про вот этот мой пост объясняющий ситуацию вокруг GPU и Тайваня.

01/28/2025, 13:25

t.me/singularityfm/183

SI

[27/100] Витя Тарнавский

3 685 subscribers

87

111

2.3 k

На фоне истории вокруг DeepSeek меня активно спрашивают «а почему не мы?» - имея в виду то рынок РФ, то конкретно Т-Банк

Действительно, сравнимый объём железа у нас есть, мозги - тоже. Казалось бы, все есть!

Ну, не совсем.

Возможность построить модели такого уровня это сочетание большой мотивации и ресурсов у достаточно большого количества компаний. Это лотерея - DeepSeek выиграл, ещё 100 лаб проиграли.

В США компании это делают ради денег. Если ты сделал топовую модель, твоя компания вошла в первые ряды и оценивается очень дорого. С инженерами, кстати, похожим образом работает. У нас такого нет, рынок не оценит.

Китай пронизан национальной идеей великости Китая и «порвем США». Там инженеры реально хотят обогнать OpenAI ради страны. У нас такого среди инженеров сильно меньше. Кроме того, есть как минимум десятки компаний у которых есть достаточные ресурсы. В РФ их строго меньше пяти штук.

В результате получаем то что получаем. Еще и модель в мире не примут, и железо (даже такое как у китайцев) не объяснишь.

01/28/2025, 12:44

t.me/singularityfm/182

SI

[27/100] Витя Тарнавский

3 685 subscribers

63

59

2.0 k

Маленькая зарисовка про жизнь с Cursor

Надо было тут картинки перевести из webp в jpg. Я знаю как на маке конвертнуть одну (хотя зачем мне это знание), но мне нужно было восемь.

Я открыл Cursor и сделал скрипт на питоне буквально за 15 секунд. Просто сказал «сделай вот такую программу» и потом «сделай ее запускабельной», и всё.

Запустил, конвертнул, пошел довольный дальше.

Киберпанк какой-то 🤖

01/27/2025, 14:18

t.me/singularityfm/180

SI

[27/100] Витя Тарнавский

3 685 subscribers

46

29

1.3 k

Что интересно про DeepSeek так это объем железа для обучения.

По официальному репорту, DeepSeek тренировался на кластере из 2k H800. Это смешной размер для таких задач. Это примерно в 50 раз меньше чем кластер для обучения любой большой модели в US.

Слухи ходят что они не раскрывают данные о реальном кластере. Китаю нельзя официально иметь кластера на H100 и других топовых картах любого крупного размера.

Я в Китае был сам и инженеры там лично говорят что кластера на 50-100к у них конечно есть. Раскрывать они их не могут.

С другой стороны, DeepSeek выпустили вместе с моделью подробный тех репорт с указанием размеров кластеров и так далее. И там все бьётся нормально - объёмы данных и времени вполне совпадают с объёмом железа, это подтвердили более-менее все лидеры индустрии.

Если это и правда возможно на кластере в 2k, значит и другие страны могут так же и стены в 100k кластера не существует.

01/25/2025, 10:15

t.me/singularityfm/179