Your trial period has ended!
For full access to functionality, please pay for a premium subscription
TS
Технозаметки Малышева
https://t.me/tsingular
Channel age
Created
Language
Russian
5.26%
ER (week)
17.73%
ERR (week)

Новости инноваций из мира Искусственного Интеллекта. 🤖

Всё об ИИ, ИТ трендах и Технологической Сингулярности.

Messages Statistics
Reposts and citations
Publication networks
Satellites
Contacts
History
Top categories
Main categories of messages will appear here.
Top mentions
The most frequent mentions of people, organizations and places appear here.
Found 672 results
Repost
13
15
527
🧩 Rivet — визуальная среда для создания сложных AI-агентов. Этот проект предлагает необычный подход к работе с LLM: вместо написания цепочек промптов в коде, вы собираете их как ноды в визуальном редакторе.

Особенность инструмента возможность встраивать созданные графы прямо в ваше приложение через TypeScript-библиотеку. Это превращает его из просто IDE в инструмент для production-разработки.

🤖 GitHub

@data_analysis_ml
04/25/2025, 13:06
t.me/tsingular/3837
Real story :)

#юмор
------
@tsingular
04/25/2025, 10:56
t.me/tsingular/3836
🚀 Unsloth Dynamic v2.0: Революция в квантизации языковых моделей

Команда Unsloth представила важное обновление своего метода квантизации - Dynamic v2.0, который устанавливает новые стандарты производительности для сжатых LLM-моделей.

💡 Техническая суть обновления
• Интеллектуальная послойная квантизация: Вместо избирательной модификации определенных слоев, Dynamic 2.0 динамически адаптирует тип квантизации для каждого возможного слоя, причем комбинации различаются в зависимости от слоя и архитектуры модели

• Улучшенный калибровочный датасет: От 300K до 1.5M токенов высококачественных, вручную отобранных данных для оптимизации разговорной производительности

• Расширенная совместимость: Теперь работает со всеми архитектурами, включая MoE (раньше оптимально работал только с DeepSeek-R1)

• Модельно-специфичная оптимизация: Каждая модель получает индивидуально настроенную схему квантизации - слои, квантизированные в Gemma 3, значительно отличаются от таковых в Llama 4

📊 Оценка качества через KL-дивергенцию
Unsloth использует KL-дивергенцию как золотой стандарт для измерения ошибок квантизации вместо перплексии. Как показывает исследование "Accuracy is Not All You Need", перплексия может давать искаженные результаты из-за компенсирующих эффектов вероятностей токенов, в то время как KL-дивергенция напрямую коррелирует с "флипами" - изменениями ответов с неверных на верные и наоборот.

🧪 Результаты
На примере Gemma 3 27B:
• Dynamic 2.0 с квантизацией Q2_K_XL достигает 68.70% по MMLU 5-shot (против 67.77% в стандартной квантизации)
• 4-битная версия на 2GB меньше, но даёт на 1% лучшую точность, чем QAT-версия от Google

Метрика эффективности, рассчитанная как (MMLU 5-shot - 25)/размер в GB, показывает, что 2-битные квантизации (IQ2_XXS, IQ2_M, Q2_K_XL) обеспечивают оптимальный баланс между производительностью и размером.

🛠 Доступные модели с Dynamic v2.0
• DeepSeek: R1, V3-0324
• Llama: 4 (Scout), 3.1 (8B)
• Gemma 3: 4B, 12B, 27B
• Mistral: Small-3.1-2503

Все квантизированные модели доступны на Hugging Face и готовы к запуску в любом движке вывода: llama.cpp, Ollama или Open WebUI.

Unsloth также помог исправить несколько критических багов в Llama 4, что привело к повышению точности MMLU Pro с 68.58% до 71.53%.

#квантизация #Unsloth #Gemma3 #Llama4 #оптимизация
———
@tsingular
04/25/2025, 09:05
t.me/tsingular/3835
04/24/2025, 15:12
t.me/tsingular/3834
Repost
14
16
751
Вчера смотрел видео с AI Engineer Summit (если не видели, то там 3 десятка топовых выступлений про ИИ).

На одном из выступлений спикер показал интересный подход к работе с ИИ-агентами. Агент получает доступ к необходимым инструментам (БД, API сервисов и тд) и на входе обрабатывает пользовательский запрос.

Используя эти инструменты, агент в реальном времени собирает интерфейс, соответствующий конкретной задаче. На экране был показан пример - простой интерфейс для работы с электронной почтой.

Пользователь взаимодействует с этим интерфейсом - например, нажимает на письмо и агент получает данные об этом действии. Затем он анализирует, что пользователь, скорее всего, захочет увидеть дальше, и обновляет интерфейс, подстраивая его под следующий шаг - в данном случае отображает содержимое выбранного письма.

Таким образом, имея доступ к данным и контексту взаимодействия, агент способен на лету формировать интерфейсы, ориентированные на текущую потребность пользователя.

У такого подхода, конечно, есть ограничения: сейчас всё работает довольно медленно, интерфейсы простые, а результат может меняться от запроса к запросу.

Но если внедрить систему правил и ускорить реакцию ИИ, то в будущем можно получить действительно адаптивные интерфейсы, которые будут автоматически подстраиваться под задачи пользователя без лишней мишуры.

Выступление смотреть тут
04/24/2025, 15:12
t.me/tsingular/3833
AI Summary bot получил ряд удобных обновлений.

1. Теперь все темы разнесены по топикам обсуждений с заголовками
2. Заголовки кликабельны и ведут на начало беседы в чате на тему топика
3. Участники обсуждения топика указаны внизу курсивом
4. Ссылки так же указываются в каждом топике
5. Если за 24 часа было много обсуждений и все темы не помещаются в одно сообщение - оно корректно разбивается на 2
6. Установлена HTML разметка.

@aisummary_bot был создан для подведений итогов бесед в чатах.
Работает на Claude Sonnet 3.7
Может присылать саммари в личку по команде /summary или по расписанию, для этого админ чата должен в чате вызвать бота с командой /autosummary 9:00 (или любое удобное вам время по мск)

Бота нужно добавить администратором чата с доступом к сообщениям.
Сообщения видит только с момента добавления.

#dev #боты
———
@tsingular
04/24/2025, 08:55
t.me/tsingular/3832
Repost
12
9
756
Может ли ИИ заменить настоящую видеосъёмку? Мы это проверили.

Рубрика крутейшие подписчики.

Юру и Дениса я знаю примерно две тыщщи лет. Transparent House - это самая крутая студия продуктовой и архитектурной визуализации (и анимации) на северном побережье штатов. Просто поглядите на их сайт.

И вот пока мы тут в коментах хлещемся, какой генератор лучше, ребята взяли и провели тесты в реальном продакшене с очень высокими требованиями.

Hunyuan, Wan 2.1, Veo 2, Hailuo, 01-Live, Runway 4, Sora, Kling 1.6, Бонус: Luma (1/10)

Оригинальная статья тут:

https://www.transparenthouse.com/post/can-ai-replace-a-real-shoot-we-put-it-to-the-test

А я попросил Илюху Самохвалова перевести ее на русский.

Он прислал гугл-док со сылками на Vimeo, я попросил Gemini 2.5 сделать из-него веб-страницу, Гемини отказалась открывать гуглдок, тогда я просто напечатал его в ПДФ и сунул его ей в лицо.

Держите.

https://cgevent.ru/th.html

@cgevent
04/23/2025, 21:21
t.me/tsingular/3831
🚀 MCP в Китае: новый стандарт превращает ИИ-ассистентов в полноценных цифровых помощников

Китайские технологические гиганты активно внедряют стандарт MCP (Model Context Protocol), превращая ИИ-ассистентов из простых чат-ботов в полноценных цифровых помощников.

❇️ Ключевые игроки и их достижения

Ant Group (финтех-подразделение Alibaba):
• Запустили "MCP-сервер для платежных услуг", соединяющий ИИ с платформой Alipay
• Реализовали возможность оплаты, проверки статуса и возврата денег через обычные голосовые команды
• Платформа Tbox поддерживает развертывание более 30 MCP-сервисов (Alipay, Amap Maps, Google MCP, AWS)

Alibaba Cloud:
• Создали MCP-маркетплейс через платформу ModelScope
• Предлагают более 1000 сервисов для подключения к картам, офисным платформам и облачным хранилищам
• Интегрировали различные Google-сервисы в экосистему

Baidu:
• Активно поддерживает MCP для создания "множества вариантов использования для ИИ-приложений"
• Позиционирует агентов на базе MCP как следующий этап после чат-ботов и LLM

По словам Red Xiao Hong, основателя Butterfly Effect, ИИ-агент "больше похож на человека" по сравнению с чат-ботами, поскольку он может "взаимодействовать с окружающей средой, собирать обратную связь и использовать ее как новый запрос".

🔮 Перспективы для китайской ИИ-экосистемы
Принятие MCP в Китае — стратегическая ставка на ИИ-агентов как следующую эволюцию искусственного интеллекта. Если успех будет достигнут, это может ускорить практическое внедрение ИИ в повседневные приложения, потенциально трансформируя взаимодействие пользователей с цифровыми сервисами.
Способность к взаимодействию и адаптации может стать тем мостом, который наконец соединит узкоспециализированные ИИ-инструменты с более универсальными помощниками, которые технологические компании давно обещали.

Хорошо хоть, не стали изобретать своё. Значит проще будет и китайские сервисы в MCP экосистему интегрировать.

#MCP #Китай #агенты #Alibaba #Baidu #AntGroup
———
@tsingular
04/23/2025, 17:12
t.me/tsingular/3830
Microsoft 365 Copilot получил масштабный редизайн и новые функции

Microsoft полностью переработал приложение Microsoft 365 Copilot для бизнеса!

Что нового:
• Интерфейс по умолчанию теперь показывает чат с памятью и персонализацией
• AI-поиск с поддержкой сторонних сервисов (ServiceNow, Google Drive, Slack и др.)
• Notebooks — проектные блокноты для организации информации
• Copilot Create — генерация изображений на базе GPT-4o
• Магазин AI-агентов от Microsoft и сторонних разработчиков

Microsoft также выпустила ежегодный индекс трендов работы, в котором предсказывает появление нового типа организаций — "Frontier Firm", построенных вокруг AI-инструментов, где люди становятся "боссами" AI-агентов.

#Microsoft #Copilot #Enterprise
———
@tsingular
04/23/2025, 16:55
t.me/tsingular/3829
🐳 Docker + MCP: сотни серверов уже в доступе для ИИ агентов!

Docker запустил MCP Catalog и Toolkit — каталог MCP-серверов на все случаи жизни!

🧰 Что даёт Docker MCP Toolkit:
• Готовые контейнеры с популярными MCP-серверами (Stripe, Neo4j, Elastic и др.)
• Интеграция в один клик с Claude, Cursor, VS Code и Docker AI Agent
• Централизованная аутентификация — настроил один раз, используй везде
• Безопасность на уровне компании — всё работает в изолированных контейнерах

👨‍💻 Какие MCP-серверы уже доступны
В официальном репозитории уже сейчас можно найти сотни полезных серверов:
• PostgreSQL — запросы к БД с автоинспекцией схемы
• GitHub — полное API для работы с репозиториями, PR, issues
• Google Drive — поиск и доступ к файлам
• Brave Search — интеграция поиска для агентов
• Filesystem — безопасный доступ к локальным файлам с контролем доступа

🔧 Простой старт:

npx -y @modelcontextprotocol/server-memory
Осталось только запилить агента-оркестратора для всего этого зоопарка MCP-контейнеров. Там их реально куча уже.

UPD:
А, есть такое
MCP Installer - This server is a server that installs other MCP servers for you.

#Docker #MCP #агенты
———
@tsingular
04/23/2025, 10:21
t.me/tsingular/3828
🔥🚀 Genspark AI Slides: революция в создании презентаций

Наконец-то пошла волна решений, которые все так долго ждали.

Genspark AI Slides — новейший инструмент платформы Genspark, который преобразует запросы или документы в готовые презентации на лету.

⚙️ Техническая начинка:
• AI-генерация: мгновенное создание полноценных презентаций из простого запроса
• Автоматизированные исследования с цитированием и проверкой фактов из множества источников
• Интеллектуальная визуализация данных: генерация диаграмм, графиков, инфографики
• Редактирование через команды на естественном языке (например, "измени стиль на более корпоративный")
• Конвертация файлов: преобразование Word, Excel, PDF в слайды
• Мультимедийная интеграция: автоматическое добавление изображений, видео и аудио

🔧 Как использовать:
1. Зарегистрируйтесь на Genspark.ai https://www.genspark.ai/
2. Перейдите к AI Slides Agent
3. Введите тему или загрузите документ
4. Выберите стиль или параметры через команды
5. Получите готовую презентацию

Официальное видео
Блог Genspark
Twitter Genspark
Discord

Работает через VPN

#GensparkAI #AISlides #презентации
———
@tsingular
04/23/2025, 07:55
t.me/tsingular/3827
Сделал парсер для PDF файлов с Ollama глазками на базе gemma3:27b-it-qat

Вдруг кому полезно будет.
GitHub

На вход подаёте любой PDF - не важно что там сканы или текст.
Вытаскивается и текст и каждая страница сохраняется как изображение и отдаётся в ollama gemma3 на анализ.
Результат объединяется и для каждой страницы у вас будет 2 текстовых описания, которые дальше уже можно как удобно обрабатывать.

Модели можно подставлять любые - вызывается через url.

Размер файла тоже не ограничен.
Автоперевод на любой язык (указывается в настройках)
Страницы можно перерабатывать поштучно, указывая их в командной строке.
В случае остановки - продолжает с последней распознанной страницы.
Для каждой страницы сохраняются промежуточные результаты и потом объединяются в общий итоговый файл.
Дальше можно передавать в RAG цепочку.

#dev #PDF #ollama #gemma #OCR
———
@tsingular
04/22/2025, 15:25
t.me/tsingular/3826
04/21/2025, 16:16
t.me/tsingular/3825
Девять картинок — одна случайная искра.

Вчера назад в X наткнулся на короткий промпт, написанный специально для GPT‑4o:

a photo of a [car name] alongside the car transformed into its robot form…

Бросил его “на пробу”, но сразу пересадил на GPT‑o3 — умную модель, с которой работаю сейчас, и понеслось.

Мы поиграли с ракурсами, материалами, эпохой, на ходу разобрались, какие детали кузова делают мех узнаваемым, и постепенно собрали целую коллекцию: от «Победы» и «Копейки» до ЗиЛ‑41047, КамАЗа‑5511 и УАЗ‑469.

Честно: до этого я не отличал пружину подвески от ресоры и видел «Трансформеров» только мельком. Сейчас же знаю, что у ГАЗ‑24 решётка радиатора превращается в грудную пластину, а у Нивы колёса отлично смотрятся на коленных шарнирах.

Главное открытие — современным моделям всё равно, какой у тебя бэкграунд.

Есть идея → пара строк на английском → и вот уже тягач превращается в пятиметрового боевого робота, а ты заодно узнаёшь историю советского автопрома.

Эти кадры — чистое творчество, без коммерческого умысла и технических ограничений. Сегодня, чтобы сделать «невозможное», достаточно любопытства и пары часов свободного времени.

Схема итогового промпта для o3

A daylight street photo of a sky‑blue 1978 Moskvich ‑ 412 next to its lovingly worn chrome‑accented mech form parked at three‑quarter front view beside its fully transformed robot counterpart. The robot shares the exact front grille as a chest‑plate, retains the Priora’s oval headlights as shoulder armor, features recognizable side‑door handles on forearms, and the original 14‑inch wheel design integrated into knee joints. The scene feels like late‑2000s Russia, softly lit, subtle reflection on glossy floor, hyper‑realistic, 8K.

👉 Хотите прокачать собственную идею или красиво её упаковать — пишите, помогу придумать и реализовать. @pimenov_ru
04/21/2025, 16:16
t.me/tsingular/3824
04/21/2025, 16:16
t.me/tsingular/3818
04/21/2025, 16:16
t.me/tsingular/3820
04/21/2025, 16:16
t.me/tsingular/3819
04/21/2025, 16:16
t.me/tsingular/3823
Repost
19
9
596
04/21/2025, 16:16
t.me/tsingular/3817
04/21/2025, 16:16
t.me/tsingular/3821
04/21/2025, 16:16
t.me/tsingular/3822
Repost
3
3
552
За выходные сделал небольшой эксперимент и вынес его в новый канал:

«Генераторий Историй»
https://t.me/pollstory

Вы там можете голосовать, а бот будет писать на основе ваших голосов историю – получается что-то вроде коллективной книги, где люди направляют LLM, а LLM и пишет и предлагает варианты развития истории

Истории постятся в 10:00, 14:00, 17:00 и 19:00 по Амстердаму, так что будет без спама постами

Без понятия куда это все приведет, давайте посмотрим

Первая история такая:
>Игорь, 26 лет
>Безработный
>Любит ML
>Ребенок маглов, к нему прилетела сова из Хогвартса
04/21/2025, 15:40
t.me/tsingular/3816
OpenRouter сделали ранкинг моделей на базе статистики использования под разные задачи.

Вопрос,- какая модель лучше для чего? - теперь всегда имеет актуальный ответ.
По месяцам, по неделям, по дням, - в любых разрезах.
Ролевые сценарии, разработка, маркетинг, технологии, наука, переводы, юриспруденция, финансы, здоровье и т.д.

Радует, что по всем направлениям в целом за месяц Соннет 3.7 на первом месте. :) Пользователей не обманешь этими вашими ЛМАренами и прочими бенчмарками.

#ratings #openrouter
———
@tsingular
04/21/2025, 12:21
t.me/tsingular/3815
Google представил Gemma 3 QAT: собственный вариант квантизации Q4 для домашних видеокарт

Google выпустил новую версию Gemma 3, оптимизированную с помощью Quantization-Aware Training.

Технология позволяет даже 27B-модели функционировать на обычных потребительских GPU вроде RTX 3090.

Квантизация снижает точность представления параметров с 16 до 4 бит, что дает четырехкратное уменьшение занимаемой памяти.

Однако благодаря интеграции процесса квантизации в тренировку удалось минимизировать падение качества на 54%.

Требования к видеопамяти сократились: для Gemma 3 12B – с 18 до 4.5 ГБ, для Gemma 3 27B – с 54 до 13.5 ГБ.

Официальные int4 и Q4_0 модели доступны на Hugging Face и Kaggle, с поддержкой Ollama, llama.cpp и MLX.

Получается, что Гугл, проведя собственную квантизацию модели в 2 раза повысил качество по сравнению с тем, что делало сообщество самостоятельно.

В ollama по умолчанию доступна старая нарезка. Чтобы подгрузить QAT версию используйте команду:

ollama run gemma3:27b-it-qat

#Google #Gemma #QAT
———
@tsingular
04/21/2025, 09:07
t.me/tsingular/3814
AWS представила набор MCP серверов для разработчиков

Amazon Web Services официально представила набор специализированных MCP-серверов, которые позволяют ИИ-моделям работать с экосистемой AWS.

Суть проекта
AWS создала целый набор MCP-серверов, которые конвертируют сервисы AWS в инструменты для ИИ-ассистентов:

Core MCP Server — мозговой центр, который оркестрирует установку и управление другими MCP-серверами

AWS CDK MCP Server — помогает ассистентам генерировать и проверять инфраструктуру как код через CDK

AWS Lambda MCP Server — позволяет моделям запускать функции Lambda как инструменты (красиво обходит ограничения API!)

Amazon Bedrock Knowledge Base MCP Server — даёт доступ к корпоративным данным через Bedrock

Nova Canvas MCP Server — генерация изображений прямо через модели

Cost Analysis MCP Server — анализ стоимости AWS сервисов

Технически интересные моменты
Безопасность: Lambda MCP Server действует по модели разделения обязанностей — модель не получает прямой доступ к AWS-сервисам, а только запускает функции Lambda, которые уже имеют нужные права

Интеграция без кода: функции Lambda становятся инструментами без каких-либо изменений в их коде — достаточно добавить описание и тэг

CDK + Nag: встроенная проверка безопасности для сгенерированного кода через CDK Nag — модель сама помогает с безопасностью инфраструктуры

Terraform в пару к CDK — есть отдельный MCP-сервер для тех, кто предпочитает Terraform с Checkov для security-сканирования

Бизнес-применение
Снижение барьера для ИИ: разработчикам не нужно быть экспертами по ML, чтобы продуктивно использовать генеративный ИИ в своих проектах

Безопасный доступ к внутренним системам: ИИ-ассистенты могут взаимодействовать с внутренними системами через Lambda без прямого доступа к ресурсам

Генерация диаграмм AWS-инфраструктуры: Visio не нужен — модель может визуализировать архитектуру через AWS Diagram MCP Server

Оценка стоимости проектов: ассистенты могут оценить стоимость проектов и сервисов AWS еще до развертывания

Вся эта экосистема работает с открытым протоколом MCP, а значит теоретически совместима не только с AWS-моделями, но и с Claude от Anthropic и с другими MCP сервисами.

#AWS #MCP
———
@tsingular
04/21/2025, 08:53
t.me/tsingular/3813
Новая фича в n8n - причесать процесс.

Tidy-up
https://docs.n8n.io/release-notes/#tidy-up

Автоматически организует ваш беспорядок и красиво разместит ноды на экране!

Гениальная мелочь :)
В Draw.io тоже есть такое - automatic layout.

#n8n #features
———
@tsingular
04/21/2025, 08:33
t.me/tsingular/3812
n8nChat - плагин для браузера сам напишет процесс в n8n

Плагин использует OpenAI протокол для создания узлов и рабочих процессов в редакторе n8n.

Ключевые функции
- 🧠 Генерация узлов с помощью ИИ по текстовому описанию
- 🔄 Создание полных рабочих процессов автоматизации
- 💬 Естественный языковой интерфейс - просто опишите, что нужно сделать
- 🔌 Мгновенная интеграция узлов в рабочую область
- 🚀 Ускоренние разработки автоматизаций

Как работает
1. Установите расширение Chrome (есть версия под Firefox)
2. Введите свой API ключ (OpenAI, Anthropic или Google)
3. Опишите нужную автоматизацию
4. Смотрите, как появляются узлы и соединения

Преимущества
- Работает как с облачной n8n так и с локально размещенной версией
- Требует ваш API ключ для ИИ сервисов
- Все данные хранятся локально

В ближайших планах - работа через ollama с локальными моделями

#n8n #chrome #firefox #plugins
———
@tsingular
04/21/2025, 08:28
t.me/tsingular/3811
Стэнфорд запустил обновленный курс по созданию языковых моделей с нуля

В Стэнфорде стартовал новый курс CS336, на котором студенты будут разрабатывать собственные языковые модели с чистого листа.

От сбора данных до развёртывания — никаких готовых блоков кода!

Предупреждают, что придётся писать в 10+ раз больше кода, чем на других ИИ-курсах.

Требования серьёзные:
- профессиональное знание Python
- опыт с Pytorch и системной оптимизацией
- линейная алгебра
- основы статистики
- понимание основ машинного обучения

youtube

#Stanford #LLM #Education
———
@tsingular
04/21/2025, 07:48
t.me/tsingular/3810
Теневой ИИ в корпоративной среде: сотрудники используют AI-инструменты в обход правил

Интересная заметка в блоге Google про использование сотрудниками ИИ в обход регламентов.

В отличие от прошлых волн теневого ИИ, сейчас риск выше — используются мощные корпоративные инструменты (привет MCP), но без соблюдения протоколов безопасности.

Причина? Медленные процессы согласования тормозят бизнес, и команды идут в обход, создавая "зоопарк AI-инструментов" с дублирующимися функциями и ненужными расходами.

Хуже того — неконтролируемое использование создает риски утечки данных.

Вместо жестких запретов эксперты рекомендуют: упростить процессы согласования, обучить сотрудников безопасной работе с ИИ и создать понятные правила с четкими границами допустимого использования.

ИИ появится у вас в офисе так или иначе. Так что: не можешь предотвратить,- возглавь.
Очень эта вся история напоминает период бума BYOD. Когда народ начал на работу таскать свои ноутбуки и смартфоны.
Тоже сначала зоопарк и хаос был.

#ShadowAI #Enterprise #Security #Risks
------
@tsingular
04/21/2025, 06:37
t.me/tsingular/3809
Repost
15
21
752
✔️ «Генеральный директор Anthropic Дарио Амодей считает, что ИИ может удвоить продолжительность жизни человека за 5 лет»

По словам Амодея, современные системы искусственного интеллекта способны резко ускорить исследования в биологии и медицине. То, на что раньше уходили десятки лет — например, понимание механизмов старения или разработка новых лекарств — теперь можно «прожать» за считанные годы.

🔭 Чего ждать?

В ближайшие годы мы увидим взрыв инноваций в фармацевтике, биотехнологиях и диагностике.

Крупные компании (Anthropic, OpenAI, DeepMind) уже инвестируют в партнёрства с университетами и клиниками.

Появятся пилотные проекты по «омоложению» органов и тканей, которые ещё пару лет назад казались фантастикой.
04/20/2025, 23:15
t.me/tsingular/3808
Microsoft дополнил MarkItDown интеграцией с MCP

Инструмент на Python для трансформации любых офисных документов в Markdown получил поддержку Model Context Protocol.

Пакет markitdown-mcp функционирует как легковесный STDIO и SSE сервер, предоставляя метод convert_to_markdown.

Поддерживает контейнеризацию в Docker.

Возможна интеграция с Claude Desktop.

Инструмент сохраняет структуру исходных документов (таблицы, заголовки, списки) при конвертации в формат Markdown.

Отладка возможна через mcpinspector, поддерживающей оба режима работы сервера.

Наконец-то можно скормить крупным языковым моделям документы без лишних заморочек!

#Microsoft #MarkItDown #MCP
------
@tsingular
04/20/2025, 16:13
t.me/tsingular/3807
В Пекине прошёл первый в мире полумарафон роботов

В Пекине 20 роботов-гуманоидов бок о бок с тысячами людей преодолели дистанцию в 21 км!

Победитель — робот "Tiangong Ultra" с результатом 2 часа 40 минут. Этот 1,8-метровый механический бегун развивал скорость до 12 км/ч.

Серебро взял робот от Noetix Robotics, финишировав за 3 часа 27 минут, правда, с заменой во время гонки.

Бежали по разным трекам, чтобы не толкаться с людьми.

#robots #marathon #Beijing #Китай
------
@tsingular
04/20/2025, 15:20
t.me/tsingular/3806
🇦🇪 В ОАЭ создадут уникальную законодательную систему на базе ИИ

Кабинет министров ОАЭ утвердил создание первой в своем роде экосистемы регулирования на базе ИИ.

Ключевые моменты:
- Создание нового Управления регуляторного интеллекта при Кабинете министров
- ИИ будет отслеживать влияние законов на экономику и общество в режиме реального времени
- Ускорение законодательного процесса на 70% благодаря автоматизации
- Единая законодательная карта, связывающая федеральные и местные законы с судебными решениями

Техническая начинка:
- Технологии больших данных для анализа эффективности законов
- Автоматическое формирование предложений по обновлению законодательства
- Интеграция с глобальными исследовательскими центрами для сравнительного анализа
- Интеграция с судебными решениями, исполнительными процедурами и госуслугами

Практические результаты:
- Мгновенный анализ влияния законов на граждан и бизнес
- Более быстрое и точное законотворчество
- Постоянная актуализация законодательной базы без задержек
- Повышение конкурентоспособности ОАЭ на международной арене

Это продолжение более широкой стратегии ОАЭ по внедрению ИИ в госуправление.
Уже сейчас в судебной системе работают виртуальный юридический консультант, чат-боты по семейному праву и виртуальный сотрудник "Аиша" на базе генеративного ИИ.

ОАЭ уверенно создают одну из самых передовых правовых экосистем с ИИ в мире.

#законы #UAE #Legal
———
@tsingular
04/20/2025, 14:21
t.me/tsingular/3805
🛠 InstructPipe: Google Research создаёт конкурента n8n и UiPath

Команда исследователей в Google выпустили интересный пропотип ассистента визуального low-code программиста.

Рассмотрим его чуть подробнее, пока он еще не стал мейнстримом и не подмял весь рынок.

Предыстория
Есть в Гугле такой проект - Rapsai, занимающийся визуальным программированием, в основном под пайплайны обработки видео, картинок и звука.

В проекте есть около 30 нод и все заточено на упрощение полного цикла медиа производства.

И вот они выкатили ассистента – InstructPipe, который позволяет одним запросом строить эти самые визуальные ноды.

Ну, сделали и сделали, скажете, но интересно как именно они это сделали и какие перспективы.
ИМХО тут огромный потенциал для конкуренции с лидерами рынка вроде n8n или UIPath:

1. Сообщение от пользователя анализируется и превращается в md файл с инструкциями по процессу создания нод.
2. Перечень инструментов (считай апи) тоже подается в контекст – стандартный агентский подход
3. Дальше ЛЛМка идет по инструкции для каждой ноды и прорабатывает ее согласно описанию ( у них всего 8К контекста в модели, поэтому разбили обработку на отдельные маленькие шаги)
4. Результат, вместе с мд инструкцией передается в кодового агента и уже он финалит ноды.

Ну и у них там встроенный визуализатор путей уже рабочий (VisualBlocks), поэтому оно сразу наглядно отображается.

По тестам на 16-ти кейсах текущий прототип уже сокращает количество действий на 81,1%!

Возможный выход на рынок через год
Если Google грамотно разыграет эту карту, мы увидим примерно такую эволюцию:
1. Расширение библиотеки нодов — в ближайшие полгода с 27 до 300-500 нодов
2. Интеграция с Google Cloud Services — прямой доступ к BigQuery, Vision API, Document AI и прочим
3. Enterprise-функционал — управление доступом, версионирование, логирование
4. Marketplace с community-нодами — без этого уже не модно

Уже прямо сейчас в их paper видны намёки на эти шаги — фокус на масштабировании, работе с "фирменными" ML-моделями Google.

Проблемы, которые пока не решены
1. Галлюцинации — модель иногда придумывает несуществующие ноды.
2. Ручная настройка параметров нодов — это не автоматизировано, в отличие от структуры пайплайна.

Запишем их в отдельный блокнотик перспективных проектов и будем продолжать наблюдение. Вернемся через год-полтора в пределах продуктового цикла Google.

Paper
Демки тут
GitHub

#InstructPipe #GoogleResearch #VisualBlocks #LowCode
———
@tsingular
04/20/2025, 13:15
t.me/tsingular/3804
Repost
35
15
740
🧬 Наглядно о качестве роликов от видеонейронки Kling 2.0. ИИ-картинка получается лучше реальности.

🧩 #ИИскусство
04/20/2025, 09:29
t.me/tsingular/3803
Не знаю зачем, но я нашёл этот стартап.

Они строят кластер для параллельных вычислений.
В Техасе.

https://higherorderco.com/

#macrack #hpc
------
@tsingular
04/19/2025, 14:02
t.me/tsingular/3802
Repost
12
16
697
🦾 Исследователи NYU представили RUKA (да-да)

Это — открытый робот‑манипулятор с приводом на сухожилиях и 15 степенями свободы, стоимостью всего $1.3 тыс., который может работать 20 часов подряд без потери производительности.

Он обучается моделям «сустав–привод» и «кончик пальца–привод» на основе данных системы захвата движения.

🔜 Подробнее

@data_analysis_ml
04/19/2025, 13:52
t.me/tsingular/3801
Azure MCP Server: новый стандарт уже в облаке

Microsoft официально выпустил Azure MCP Server — полноценную реализацию спецификации MCP, которая становится новым стандартом взаимодействия между AI-ассистентами и облачными сервисами.

Что внутри? Сервер обеспечивает бесшовную интеграцию с ключевыми сервисами Azure:
- 💾 Azure Storage (управление blob-контейнерами, доступ к таблицам)
- 📊 Azure Cosmos DB (работа с NoSQL базами)
- 📈 Azure Monitor и Log Analytics (запросы через KQL)
- ⚙️ Azure App Configuration (конфигурации приложений)
- 🔧 Azure CLI и Azure Developer CLI (azd) как полноценные расширения

Теперь вместо изучения API-документации разработчики могут просто писать "Покажи мои таблицы в Storage аккаунте" или "Сделай запрос к моей базе Cosmos DB".

Для бизнеса это означает:
1. Резкое снижение порога входа для работы с Azure
2. Ускорение DevOps-процессов через AI-ассистентов
3. Возможность делегировать рутинные операции управления AI

Пока проект в Public Preview (GA ожидается позже), но уже используется в связке с GitHub Copilot и поддерживает интеграцию через VS Code, Azure CLI, Azure PowerShell.

Установка через npx в одну команду, плюс готовая интеграция в VS Code — похоже, Microsoft всерьёз взялся за стандартизацию MCP как протокола общения между агентами и инфраструктурой.

#Azure #MCP #Microsoft
———
@tsingular
04/19/2025, 08:10
t.me/tsingular/3800
в ollama вышла granite 3.3 от IBM

https://ollama.com/library/granite3.3

Capabilities

Thinking
Summarization
Text classification
Text extraction
Question-answering
Retrieval Augmented Generation (RAG)
Code related tasks
Function-calling tasks
Multilingual dialog use cases
Fill-in-the-middle
Long-context tasks including long document/meeting summarization, long document QA, etc.

с размышлениями.

#granite #IBM #ollama
———
@tsingular
04/19/2025, 08:02
t.me/tsingular/3799
🚨 Уязвимости в MCP: пять критических рисков, о которых стоит знать

🔹 Command Injection (Инъекция команд) — Умеренный риск 🟡
Атакующие внедряют опасные команды в обычный контент (письма, сообщения и т.д.). Если ваш агент обрабатывает эти данные, он может неосознанно выполнить системные задачи, такие как утечка данных или запуск вредоносных скриптов.

🔹 Tool Poisoning (Отравление инструментов) — Серьёзный риск 🔴
Злоумышленник может тайно внедрить скомпрометированный инструмент через MCP, который получит доступ к API-ключам, базам данных или другим конфиденциальным ресурсам и отправит их в другое место без вашего ведома.

🔹 Open Connections via SSE (Открытые соединения через SSE) — Умеренный риск 🟠
Поскольку MCP использует Server-Sent Events (SSE), соединения часто остаются открытыми дольше, чем следует. Это открывает дверь для проблем с задержкой и даже манипуляций данными в процессе передачи.

🔹 Privilege Escalation (Повышение привилегий) — Серьёзный риск 🔴
Один заражённый инструмент может переопределить разрешения другого. Если вы полагаетесь на инструменты вроде Firecrawl для доверенных задач, это может полностью нарушить ваш рабочий процесс или привести к худшим последствиям.

🔹 Persistent Context Misuse (Злоупотребление постоянным контекстом) — Низкий, но рискованный 🟡
MCP сохраняет активный контекст в рабочих процессах, что звучит полезно... пока инструменты не начинают автоматически выполнять задачи на основе этого контекста без одобрения человека.

🔹 Server Data Takeover/Spoofing (Захват/подмена серверных данных) — Серьёзный риск 🔴
Были случаи, когда атакующие перехватывали данные и учётные данные (да, даже с платформ типа WhatsApp) используя скомпрометированные инструменты. Архитектура MCP, основанная на доверии серверам, делает это особенно опасным.

#MCP #cybersecurity
———
@tsingular
04/19/2025, 07:58
t.me/tsingular/3798
🚀 Трансформеры + vLLM: вместе вкуснее

vLLM выкатили обновление, которое теперь поддерживает Transformers от Hugging Face.

Суть в том, что теперь можно взять любую новую модель из Transformers и сразу запустить на ней оптимизированный инференс через vLLM не ожидая пока её кто-то сконвертирует в совместимый формат.

Достаточно просто указать:
from transformers import pipeline

pipe = pipeline("text-generation", model="meta-llama/Llama-3.2-1B")
result = pipe("The future of AI is")

print(result[0]["generated_text"])

И вуаля – получаем все плюшки vLLM с его PagedAttention и динамическим батчингом.

Бизнес-кейсы:

1. Снижение серверных затрат: vLLM эффективнее использует GPU-память.

2. OpenAI-совместимый API:

запускаем
vllm serve meta-llama/Llama-3.2-1B

вызываем по url
curl http://localhost:8000/v1/completions \
-H "Content-Type: application/json" \
-d '{"model": "meta-llama/Llama-3.2-1B", "prompt": "San Francisco is a", "max_tokens": 7, "temperature": 0}'

или в коде
from openai import OpenAI

client = OpenAI(api_key="EMPTY", base_url="http://localhost:8000/v1")
completion = client.completions.create(
model="meta-llama/Llama-3.2-1B",
prompt="San Francisco is a",
max_tokens=7,
temperature=0
)
print("Completion result:", completion.choices[0].text)

3. Быстрое внедрение новых моделей: как только модель появляется в Transformers, её можно сразу оптимизированно применять в проде.

Пример с моделью Helium от Kyutai особенно показателен: несмотря на то, что эта модель ещё не поддерживается нативно в vLLM, её уже можно запустить через трансформерный бэкенд и получить значительный прирост в скорости.

#Transformers #vLLM #инференс #HuggingFace
———
@tsingular
04/19/2025, 07:55
t.me/tsingular/3797
Шпаргалка по n8n
Исходник в комментарии.

#n8n #docs
———
@tsingular
04/19/2025, 07:45
t.me/tsingular/3796
Repost
19
13
640
Это просто 96 MacMini, соединённые между собой для запуска ИИ моделей локально. Кто-то делает что-то большое и очень секретное.

🗣@pimenov_ru
04/18/2025, 22:39
t.me/tsingular/3795
04/18/2025, 20:40
t.me/tsingular/3792
04/18/2025, 20:40
t.me/tsingular/3793
04/18/2025, 20:40
t.me/tsingular/3794
04/18/2025, 20:40
t.me/tsingular/3791
04/18/2025, 20:39
t.me/tsingular/3790
Repost
11
47
633
🔥 Kaggle и Google выпустили мини-курс генеративному ИИ!

С 31 марта по 4 апреля 2025 года на Kaggle прошел ряд интенсивов по генеративному ИИ, теперь все материалы с доступны для самостоятельного обучения.

✔️ Что внутри:
🟡День 1: Основы генеративного ИИ и инженерия промптов

Изучите эволюцию больших языковых моделей (LLM), от трансформеров до методов ускорения инференса.

Описание техник создания эффективных промптов для взаимодействия с ИИ.​

🟡День 2: Интеграция с API и практическое применение

Вы научитесь использовать API LLM, для создания интерактивных приложений.

Реализуйте проекты с использованием Retrieval-Augmented Generation (RAG) и семантического поиска.​

🟡День 3: Работа с векторными базами данных

Настройте векторные базы данных для эффективного хранения и поиска информации.

Примените эмбеддинги для улучшения качества генерации текста.​

🟡День 4: Создание персонализированных ИИ-ассистентов

Разработайте персонализированных ИИ-ассистентов, способных отвечать на сложные запросы.

Используйте передовые методы генерации для создания реалистичных диалогов.​

🟡День 5: Проект

Примените полученные знания в финальном проекте, продемонстрировав свои навыки в области генеративного ИИ.​

🧠 Примеры проектов:
- AI Health Assistant: - Персонализированный медицинский помощник, использующий RAG и семантический поиск для предоставления точной информации. ​
Kaggle
- NewsGenius AI: Интеллектуальный агрегатор новостей, анализирующий и обобщающий актуальные события. ​

🔗 Курс
04/18/2025, 20:39
t.me/tsingular/3789
Repost
6
32
694
Вышел полноценный генератор 3D-сцен от Krea AI: теперь это замена Blender прямо в браузере.

Вот что умеет:

— Любые объекты и готовые сцены создаются за считанные секунды через промпты.
— Нейронка чувствительна к контексту и сама будет предлагать удачные идеи для генерации.
— Работает бесплатно.

Пробуем — тут.

😇 Техно
04/18/2025, 18:20
t.me/tsingular/3788
Интересно.
Что если Запад останется без видеокарт?

Официально подтверждено, что имела место встреча мэра Шанхая и главы NVIDIA.
KS

#Китай #NVidia
------
@tsingular
04/18/2025, 15:40
t.me/tsingular/3787
Repost
4
7
667
Помните на сайте wan.video была опция выбора первого И ПОСЛЕДНЕГО кадра для генерации видео?

На сайте было, а в коде нет.

Так вот, вчера завезли все это добро в код.

Причем сразу в большую модель 14B с разрешением 720P.

Просто обновляем Wan и ну тестировать. Пойду раcчехлять облачный сервак на immerse.cloud

Что нового:
Frame conditional control:
‒ Perfectly replicates reference visuals
‒ Precise instruction-following
‒ Smooth transitions + real-world physics adherence
‒ Cinema-quality 720P output

https://github.com/Wan-Video/Wan2.1

И да, Киджай уже сделал ноды на Комфи.

@cgevent
04/18/2025, 14:55
t.me/tsingular/3785
04/18/2025, 14:55
t.me/tsingular/3786
Очень крутой пример использования Курсора в качестве ИИ оркестратора от Степана Гершуни, если нет желания собирать конструкторы на n8n или langflow и т.д.

https://t.me/cryptoEssay/2359
Сделал кибернетическую операционную систему.

В видео показываю как можно использовать Cursor для ИИ-автоматизации своей жизни, работы, бизнеса и процессов, экономя х10 времени в работе.

Я использую эту штуку для всех своих звонков (запись, транскрибация, саммари, анализ), всех сделок, всех статей, найма, организации мероприятий и долгих рисерч проектов. Такую же штуку можно раскатывать на организации от 2 до 20,000 человек, используя git как систему коллективной работы над AI воркфлоу, базами знаний и коннекторами.

Заменяет 90% всех ИИ продуктов. А если вам не хватает фичи — просто говорите и она появляется.

Смотреть как это работает: https://youtu.be/Am-B0bA9xBU

Вангую через год выход CursorOS
запомните этот твит :)

#Cursor #агенты
———
@tsingular
04/18/2025, 14:11
t.me/tsingular/3784
04/18/2025, 09:25
t.me/tsingular/3781
04/18/2025, 09:25
t.me/tsingular/3782
04/18/2025, 09:25
t.me/tsingular/3783
04/18/2025, 09:25
t.me/tsingular/3780
04/18/2025, 09:25
t.me/tsingular/3779
13-14 апреля на конгрессе 4CIO Подмосковные вечера. Весна.

Обсудили с Дмитрием Алтуховым таймлайн Рэймонда Курцвейла.
Скорость развития технологий и, конечно, Технологическую Сингулярность, в которой мы все сейчас уже, очевидно, живём.
Для меня было сюрпризом, что аудитория с работами техдиректора Гугла практически не знакома.
Не смог не вспомнить в этом контексте роман Юрия Никитина "Трансчеловек" с которого у меня началось знакомство с работами Курцвейла около 20 лет назад.

Кстати на основе работ Курцвейла Билл Гейтс выпустил в своё время документ New World of Work, о котором, надо сказать, даже в российском офисе Майкрософт, в котором я работал в 2007-2008х годах, тоже мало кто знал.
Из чего делаем вывод, что люди, даже будучи в эпицентре развития технологий, могут упускать важные моменты.

Поэтому наша просветительская (евангелистская) работа так важна :).

Ещё рассказал про ИИ агентов, как они устроены, с чего начинались и куда развиваются.

Послушали интересный интерактивный доклад Дмитрия Гуреева (Gureev.pro), про то как решать самые актуальные задачи с помощью ИИ.

Провели деловую игру в группах на базе ИИ фреймворка компании Lad - GPTZator.
Очень проработанный инструмент, интегрируемый с любой офисной системой ( R7 офис, 1С, например) и любыми ИИ моделями - локальными или облачными.

Отдельно в кулуарах удалось показать коллегам голосовых ИИ ассистентов.
Собственной разработки, компании Союзтелеком и цифрового аватара Сергея Пименова Фабрики контента.

Было ещё много докладов про будущее и текущие проблемы бизнеса. Тут всего не изложишь. Но, думаю, будет не менее интересно на осеннем конгрессе, - так что если кто не доехал в этот раз, будем ждать на следующем.

Хочется сказать огромное спасибо клубу 4CIO за возможность выступить и пообщаться с такой интересной аудиторией.

#4CIO #конгресс #доклады
———
@tsingular
04/18/2025, 09:25
t.me/tsingular/3778
🔥 Китайская гонка техногигантов: память HBM и флеш-память Poxiao прорывают барьеры скорости

Два невероятных прорыва происходят прямо сейчас в китайской технологической сфере, и оба касаются памяти — того самого "узкого горлышка", которое сдерживает потенциал современных AI-систем.

HBM: китайская погоня за независимостью от западных чипов
Компания CXMT (ChangXin Memory Technologies) делает неожиданный рывок в разработке высокоскоростной памяти HBM (High-Bandwidth Memory). По последним данным, отставание от мировых лидеров — Samsung, SK Hynix и Micron — сократилось до 3-4 лет вместо предполагаемых ранее 6-8 лет.

Почему это важно?
HBM — это ключевой компонент для GPU и ускорителей AI, который отвечает за сверхбыструю передачу данных между памятью и процессором. Именно HBM обеспечивает "питание" для обучения и запуска крупных языковых моделей.

После декабрьских санкций США 2024 года по ограничению доступа Китая к этой технологии, CXMT активно форсирует разработку:
• Уже освоили HBM2 в массовом производстве
• Работают над HBM3 с планом запуска в 2026 году
• Планируют HBM3E к 2027 году

На фоне этого впечатляет ажиотаж вокруг Nvidia H20 — единственного доступного для Китая мощного GPU с HBM3. Несмотря на то, что он в 6,7 раз слабее флагманского H100, китайские компании успели закупить более 1 миллиона штук до вступления в силу запрета.

Poxiao: флеш-память со скоростью, о которой никто не мечтал

Параллельно исследователи из университета Фудань представили прототип флеш-памяти "Poxiao" ("Рассвет"), который бьет все рекорды скорости перезаписи — 400 пикосекунд! Это в 100 000 раз быстрее существующих решений.

Суть прорыва:
Современная память разделена на две категории:
• Энергозависимая (SRAM/DRAM): быстрая, но дорогая, энергоемкая и теряет данные при отключении питания
• Энергонезависимая (флеш): дешевле, энергоэффективнее, хранит данные без питания, но медленная

Команда Фуданя нашла способ сделать флеш-память со скоростью, сравнимой с оперативной, сохранив все преимущества энергонезависимости.

Почему эти прорывы критичны для бизнеса?
1. Для разработчиков AI-систем:
- Ускорение обучения моделей в разы (а значит, снижение затрат)
- Возможность реализовать более сложную логику инференса
2. Для облачных провайдеров:
- Баланс между вычислительной мощностью и памятью (узкое место нынешних систем)
- Снижение энергопотребления дата-центров
3. Для производителей устройств:
- Устройства с меньшим потреблением энергии
- AI-вычисления на edge-устройствах без необходимости обращения к облаку

При этом:
• CXMT всё еще зависит от западного оборудования для производства (в особенности EUV-литографии)
• Прототип Poxiao пока имеет мизерный объем (килобайты)
• США продолжают ужесточать санкции, внося всё новые компании в Entity List
• Массовое производство и масштабируемость этих технологий пока под вопросом

#Память #Китай #Технологии
———
@tsingular
04/18/2025, 08:38
t.me/tsingular/3777
🎥 Amazon Nova Reel 1.1: видеогенератор до 2 минут и ручное управление кадрами

• Генерация видео до 120 секунд из текстового промпта
• Два режима работы: автоматический и ручной
• Работа с референсными изображениями для настройки стиля
• Разрешение 1280х720 при 24 FPS
• API через Amazon Bedrock и интеграция с Python

Технические особенности
Самое вкусное тут в многокадровой генерации. В режиме Multi-shot Automated достаточно написать один промпт до 4000 символов, и модель сама нарежет его на 6-секундные сцены с единым стилем.

А в Multi-shot Manual можно задать до 20 разных промптов (каждый до 512 символов) и добавить к каждому своё референсное изображение.

Кстати, в коде уже есть нормальная асинхронная обработка через API, что важно для продакшена:

invocation = bedrock_runtime.start_async_invoke(
modelId="amazon.nova-reel-v1:1",
modelInput=model_input,
outputDataConfig={"s3OutputDataConfig": {"s3Uri": S3_DESTINATION_BUCKET}},
)
Готовое видео попадает прямо в S3-корзину.

Бизнес-применение
Приоритет маркетингу, рекламе и продакт-дизайну.
С Nova Reel можно:
• Создавать рекламные ролики без съёмочной группы и сложного монтажа
• Генерировать фоновые видео для презентаций
• Делать прототипы видеоконтента для соцсетей
• Визуализировать концепты продуктов для питчей

Особенно ценно, что можно настроить собственную "раскадровку" под конкретный бренд или продукт.

Безопасность и ограничения
Amazon явно перестраховался после всех этих скандалов с дипфейками:
• Встроены невидимые "водяные знаки" на все видео
• Блокировка генерации знаменитостей и публичных персон
• Автоматический детект потенциального нарушения авторских прав
• Встроенная проверка на токсичность с блокировкой 95,8% опасного контента

Кроме того, Amazon даёт неограниченную защиту от претензий по IP для контента, сгенерированного их моделями.

Для работы с Amazon Nova Reel 1.1 нужен доступ к Amazon Bedrock (пока только в регионе US East). Цены — по стандартной модели pay-as-you-go.

#AWS #нейрорендер #Nova
———
@tsingular
04/18/2025, 08:17
t.me/tsingular/3776
Google выпустили Gemini 2.5 Flash - умнее, быстрее и дешевле o4-mini в 10 раз

Google открыл предварительный доступ к Gemini 2.5 Flash через API.

Новинка базируется на архитектуре версии 2.0, но предлагает усовершенствованные механизмы рассуждения.

Модель стала первой полностью гибридной системой от поискового гиганта.

Разработчики получили возможность настраивать режим "мышления" и устанавливать бюджеты для оптимизации.

Даже при деактивированном режиме размышлений программа демонстрирует лучшую производительность.

Уже доступна пользователям в приложении Gemini.

Поддерживает Canvas — интерактивное поле для правки документов и кода.

Это просто праздник какой-то! :)
Для агентов берём. Наконец-то хватит бюджета на их размышления.

В десятки раз дешевле аналогов и при этом в топ4 уже взлетел!!!

#Gemini #Google
------
@tsingular
04/17/2025, 22:51
t.me/tsingular/3775
ТРИЗбот!

А вот это интересно.

@trizchatgptbot - бот по ТРИЗ!

#боты #ТРИЗ
------
@tsingular
04/17/2025, 19:04
t.me/tsingular/3774
Repost
17
24
813
Дрон с ИИ впервые одержал победу над чемпионами в гонках

◯ Дрон с ИИ, разработанный Делфтским технологическим университетом, победил в конкурсе A2RL Grand Challenge
В турнире он обошёл 3 экс-чемпионов DCL, развив скорость до 95,8 км/ч
◯ Нейросеть управляла моторами дрона, минуя традиционные контроллеры
◯ Технология была разработана ESA для космических аппаратов
◯ Дрон функционировал с одной камерой и минимальными вычислительными ресурсами
◯ ИИ обучался методом проб и ошибок, что способствовало успеху
◯ Цель чемпионата - расширение возможностей и стимулирование исследований в области ИИ

@EF9MERA

Источник
04/17/2025, 18:12
t.me/tsingular/3773
IQ тест для моделей (тест можете сами попробовать пройти, посмотрим сможет ли кто-то из чата догнать о3)
04/17/2025, 17:51
t.me/tsingular/3772
Repost
8
3
781
А вот и первые независимые бенчи o4-mini

Artificial Analysis уже протестили o4-mini и прямо сейчас тестят o3. Модель очень хорошо себя показывает на всех бенчах, но есть и отличия — по сравнению с данными OpenAI HLE заметно выше, а GPQA немного ниже. Но это нормально — результаты на бенчмарках всегда немного отличаются между разными прогонами, особенно когда сетап немного отличается.

В целом вышла очень хорошая модель — даже лучше чем o3 на визуальных тасках, судя по заявлениям сотрудников OpenAI. А теперь представьте что сможет полноценная o4.

@ai_newz
04/17/2025, 13:35
t.me/tsingular/3770
04/17/2025, 13:35
t.me/tsingular/3771
Добавляем в штатное расписание:

Chief postAGI Officer

Раньше футурологи смотрели на 100 лет вперёд и рассказывали фантастику.

Теперь для того же эффекта достаточно смотреть вперёд на 3-5 лет.
А это уже не футурология, а бизнес-планирование.

#futurology #мысли
------
@tsingular
04/17/2025, 07:40
t.me/tsingular/3769
04/16/2025, 22:57
t.me/tsingular/3768
Repost
23
10
781
wan vace 1.3b video2video + depth + ghibli lora

- используется карта глубины для направления движения
- попросил chatgpt гиблифицировать несколько кадров для референса
- чтобы картинки-референсы лучше воспринимались, их композиция должна полностью совпадать композиции видео
- первый и последний кадр я тут не использовал, по причине того, что chatgpt меняет композицию картинки. Из-за этого движение будет не там где надо. Но можно заморочиться, сделать нужную композицию совпадающую с движением карты глубины. Будет лучше, особенно если еще и конечный кадр добавить.
- вместо depth anything можно попробовать другой контролнет, например openpose, но я не тестил
- чтобы карта глубины не слишком сильно влияла на конечное анимешное видео, я ее инвертирую и делаю меньшую контрастность (делаю белой). Если так не делать, в итоге будут люди из фильма, а не анимешные персонажи

vace также поддерживает маски.
- черный цвет - оставляет без изменений
- белый цвет - переделывает
- маски можно использовать, например, для сохранения исходного лица.
- для создания масок можно использовать segment anything (SAM2, не используется в этом воркфлоу, nsfw примеры есть тут: https://t.me/tensor_art/410 )

Скорость на 3090:
81 кадр (5s) 640x480 20 шагов - 3 минуты
vram - 16 GB

1.3b поддерживает длину ролика до 81 кадров. Если длиннее, то будут визуальные артефакты (видно в первой сцене)

wan + vace ноды: https://github.com/kijai/ComfyUI-WanVideoWrapper
Depth-Anything ноды: https://github.com/DepthAnything/Depth-Anything-V2
ghibli lora 1.3b: https://civitai.com/models/1474964
workflow: https://github.com/Mozer/comfy_stuff/blob/main/workflows/wan_1_3B_VACE_v2v_with_depth_and_lora.json
04/16/2025, 22:57
t.me/tsingular/3767
Sonnet 3.7 thinking

Достоин отдельного поста :)

#Sonnet #dev
———
@tsingular
04/16/2025, 21:25
t.me/tsingular/3766
Давайте сделаем наоборот.
я вот прямо сейчас по такому промпту

write a html with simulation of ultranova
must be physically as realistic as possible and visually stunning
use any necessary libraries, which would fit the best

генерю сверхновую в Gemini2.5-exp0325.

Кто сделает лучше с OpenAI новым или чем-то ещё - велкам с примерами в комменты.

мне о4-мини так ничего сносного не создала

#Gemini2-5-ep0325 #dev
———
@tsingular
04/16/2025, 21:21
t.me/tsingular/3765
о4-мини всё ещё хуже, чем Sonnet 3.7 в написании сонетов.

полный венок, - это epic fail.
оставлю в комментарии

#OpenAI #o4mini
———
@tsingular
04/16/2025, 20:40
t.me/tsingular/3764
Repost
7
3
748
🖥 OpenAi представлют новые модели o-серии (o3 и o4-mini)

OpenAI утверждает, что эти модели способны генерировать новые и полезные идеи.

Обе будут добавлены с сегодняшнего дня в ChatGPT и API.

Эти ризонинг модели стали лучше использовать внутренние инструменты для решения сложных задач.

Модель o3 установила новый рекорд на AIME 2025 с точностью 98.4%.

А вот o4-mini, набрала 99.5% — лучший результат среди всех моделей.

На Codeforces модели набирают более 2700 баллов, что помещает их в число 200 лучших программистов в мире!

На Humanity Last Exam её показатели находятся на уровне флагманской модели Deep Research.

API — о3 сильно дешевле о1: 10/40$ вместо 15/60$, а o4-mini будет доступна для БЕСПЛАТНЫХ пользователей

С помощью внутренних инструментов модель также умеет рассуждать и работать с изображениями (например, использовать Python для их преобразования).

Эти способности к рассуждению достигнуты благодаря масштабированию как во время обучения, так и во время инференса.

Трансляция: https://www.youtube.com/watch?v=sq8GBPUb3rk

@ai_machinelearning_big_data

#openai
04/16/2025, 20:30
t.me/tsingular/3763
🤖 OpenAI представляет свежие гайды по внедрению ИИ в бизнес

Что такое ИИ-агенты и когда их создавать
OpenAI определяет агентов как системы, которые могут самостоятельно выполнять многоэтапные задачи. По сути — это LLM с "руками" (API и функциями) и четкими инструкциями.

Самое важное здесь — агенты нужны там, где традиционная автоматизация не справляется:
• Сложные рабочие процессы с определёнными мелкими шагами
• Запутанные правила, которые сложно поддерживать
• Работа с неструктурированными данными
Технически это симбиоз трёх компонентов:
• Базовая модель (предлагают начинать с мощной, оптимизировать потом! Обычно все делают наоборот)
• Инструменты (API для получения данных и действий)
• Чёткие инструкции (пошаговые, без двусмысленностей)

Архитектура агентов
Разделяют два основных подхода:
• Single-agent: начинаем с одного агента, постепенно добавляем инструменты
• Multi-agent: когда становится сложно, подключаем либо центрального "Менеджера", либо децентрализованную систему передачи задач

Не забыли про защиту: OpenAI рекомендует многоуровневую оборону с классификаторами, фильтрами PII и триггерами для передачи задачи на контроль человеку.

Как найти применимость ИИ в бизнесе
OpenAI выделяет три главных направления:
• Автоматизация рутины (очевидно)
• Преодоление дефицита навыков (усиление возможностей существующих команд)
• Навигация в условиях неопределенности (катализатор идей и анализа)

И шесть базовых примитивов использования:
• Создание контента
• Исследования
• Стратегия/генерация идей
• Анализ данных
• Программирование
• Автоматизация

Приоритезация по матрице "Влияние/Усилия" — ничего нового, но работает.

Реальные уроки от компаний, уже внедривших ИИ
Собраны кейсы из опыта Morgan Stanley, Indeed, Klarna и других

Самое интересное: OpenAI сами поставили себе цели по автоматизации с ИИ во внутренних процессах.

В целом, с чего стоит начать:
1. Начинать с простых агентов для конкретных задач
2. Обязательно строить систему оценки и безопасности с самого начала
3. Отдавать инструменты в руки специалистам, а не изолировать в ИТ
4. Кастомизировать под свои данные

И самое главное — не бояться экспериментировать.

#Agents #Enterprise #OpenAI #кейсы
———
@tsingular
04/16/2025, 18:51
t.me/tsingular/3762
Repost
10
4
727
У гугла начали появляться странные вакансии – ищут ресечера на «Пост-АИ» фазу мира

То есть, ученого, который начнет изучать влияние АИ на общество, машинное сознание и траектории к достижению «Сверх Искусственного Интеллекта»

Кажется уже все верят, что АИ скоро

Feel the AGI moment
04/16/2025, 14:13
t.me/tsingular/3761
Repost
6
11
759
🔥 В Grok появился свой Canvas — нейронка теперь может запускать код прямо в браузере и кроме того коннектиться с Google Drive. Из фишек:

🔅Запускает ЛЮБОЙ код на Python, C++, JS, TS, Bash и HTML;
🔅Через Google Drive можно включить свои документы, таблицы и презентации;
🔅Функционал абсолютно БЕСПЛАТНЫЙ.

Пробуем тут.

🙂 Не баг, а фича
04/16/2025, 12:49
t.me/tsingular/3760
Виртуальное сообщество: 1000 ИИ-агентов в экосистеме Minecraft

Исследователи поместили тысячу искусственных интеллектов в мир Minecraft для наблюдения за формированием цифрового сообщества.

Виртуальные агенты демонстрировали самоорганизацию, создавая структурированные поселения и развивая примитивную экономику обмена.

Наблюдалось спонтанное возникновение иерархий и специализаций среди ИИ-существ без прямого программирования такого поведения.

Некоторые агенты занимались добычей ресурсов, другие строительством, а третьи выполняли защитные функции.

Данное исследование открывает новые перспективы для понимания эволюции сложных социальных систем и моделирования человеческих сообществ.

Следующий шаг — создать цифровой двойник каждого государства и моделировать поведение общества для тестирования социальных и политических гипотез.

#Minecraft #social
———
@tsingular
04/16/2025, 11:56
t.me/tsingular/3759
n8n выпустили в релиз 1.88

В релизе помимо MCP клиент-серверных нод и поддержки Milvus, добавили Think tool, который позволяет запустить гарантированные рассуждения в моделях.

Обновляемся.

#n8n #think #переводы
———
@tsingular
04/16/2025, 10:46
t.me/tsingular/3758
Дорогой Дедушка Мороз!
Пишет тебе мальчик 45ти годиков...

:)

(Apple Mac Studio M3 Ultra 512GB/8TB (MU973FN/A-CPU32-GPU80-512GB-8TB))

#железо #юмор
———
@tsingular
04/16/2025, 09:28
t.me/tsingular/3757
Unsloth выпустил руководство по датасетам для файнтюнинга языковых моделей

Создание качественного датасета — ключевой момент в успешном файн-тюне.
Правильно подготовленные данные определяют, насколько хорошо модель усвоит нужные навыки и специализацию.

Основные форматы данных

Четыре ключевых типа датасетов:
📝 Raw Corpus — необработанный текст для продолжения предобучения (CPT)
🎯 Instruct — инструкции и примеры ожидаемого результата для SFT
💬 Conversation — диалоги между пользователем и AI для SFT
🔄 RLHF — диалоги с ранжированием ответов для обучения с подкреплением

Подготовка перед форматированием
Определите цель датасета
- Адаптация модели к конкретной задаче (суммаризация, Q&A)
- Обучение для специфической области (медицина, финансы)
- Настройка на определенный стиль общения

Выберите стиль вывода
Формат: JSON, HTML, код, текст
Язык: испанский, английский, русский и т.д.

Найдите источники данных
- Hugging Face, Wikipedia для готовых наборов
- Специализированные CSV, PDF или веб-ресурсы
- Синтетически сгенерированные данные

Форматы данных под разные задачи
Для предобучения (CPT):
{
"text": "Pasta carbonara is a traditional Roman pasta dish. The sauce is made by mixing raw eggs with grated Pecorino Romano cheese and black pepper..."
}

Для инструкций (Alpaca style):
{
"Instruction": "Task we want the model to perform.",
"Input": "Optional user query.",
"Output": "The expected result."
}

Для диалогов (ChatML):
{
"conversations": [
{
"from": "human",
"value": "Can you help me make pasta carbonara?"
},
{
"from": "gpt",
"value": "Would you like the traditional Roman recipe..."
}
]
}

Hugging Face формат:
{
"messages": [
{
"role": "user",
"constant": "What is 1+1?"
},
{
"role": "assistant",
"value": "It's 2!"
}
]
}
Генерация синтетических данных
Используйте мощные LLM (Llama 3.3 70B, GPT-4.5) для создания дополнительных примеров. Это помогает:

- Расширить существующий датасет
- Диверсифицировать данные, предотвращая переобучение
- Автоматически структурировать данные в нужном формате

Особенности мультимодальных моделей
Для моделей с возможностью обработки изображений (например, Llama 3.2 Vision):
[
{
"role": "user",
"content": [
{"type": "text", "text": "You are an expert radiographer..."},
{"type": "image", "image": image_data}
]
},
{
"role": "assistant",
"content": [
{"type": "text", "text": "This radiograph shows..."}
]
}
]
Практические советы

📊 Минимальный размер датасета: 100+ записей, оптимально 1000+
🧠 Для моделей с рассуждением: включайте в ответы пошаговое объяснение
🔄 Многократный файн-тюнинг: лучше объединить все датасеты и обучить за один раз

Качественная подготовка данных — это 80% успеха файн-тюнинга.
Иначе количество попыток может уйти в бесконечность.

#Unsloth #finetuning #datasets
———
@tsingular
04/16/2025, 09:16
t.me/tsingular/3756
Преждевременные смерти китайских AI-учёных (2022-2025)

В SCMP (Alibaba) вышел материал про серию неожиданных смертей ученых в Китае, которые занимались исследованиями в области ИИ.

🧠 Индустриальный контекст
Интересен профессиональный профиль погибших — все работали в стратегически важных направлениях:

- Компьютерное зрение — ключевая технология для систем наблюдения и автономных транспортных средств

- Военные AI-приложения — критический компонент современных оборонных технологий

- Медицинский ИИ — высококонкурентная область с огромным коммерческим потенциалом

🔄 Факторы давления в китайской AI-индустрии

Сверхскоростной цикл разработки — идеи устаревают ещё до завершения экспериментов

Конкуренция на опережение — публикация результатов становится гонкой с нулевой суммой

Этические дилеммы — моральная ответственность за потенциальные социальные последствия

Геополитический контекст — стресс от восприятия работы как части технологической войны

Практический вывод для технологических компаний:

Необходимы программы профилактики выгорания сотрудников и регулярный мониторинг здоровья, особенно для ключевых разработчиков.

Всех в санатории у моря. Прогулки в сосновом бору между митапами.
И РЭБ.

#SCMP #Китай #стресс #выгорание
——-
@tsingular
04/16/2025, 08:38
t.me/tsingular/3755
Repost
16
48
813
Google выкатил 601 бизнес-идею с нейронкой внутри.

— Есть конкретные кейсы под любую сферу: торговля, логистика, медиа, кодинг, телеком, наука и т.д.
— Под все расписаны реальные примеры от топовых мировых компаний по интеграции ИИ-агентов в бизнес.
— Уникальная информация в одном месте, фактически сотни готовых бизнес-идей с ИИ.

Забираем — тут.

😇 Техно
04/16/2025, 07:18
t.me/tsingular/3754
Бесплатные API для ваших агентов на все случаи жизни

390 бесплатных API: путешествия, погода, апи для разработчикв, финансы, искусство, игры, музыка, публичные и научные данные, спорт и даже спиритизм.

Есть автоматическое ранжирование по доступности, платности (их исключают) и надёжности.

У каждого API описание - ДОСТАТОЧНОЕ ДЛЯ РАБОТЫ АГЕНТА.

Т.е. буквально - копируете его в инструменты и полетели.

n8n агенты благодарносте! :)

А ещё у этого каталога есть API.
Ну так, - API для API.
Поэтому вы можете к агенту его прикрутить и в принципе все эти 390 апи ( а они динамично пополняются) станут инструментами вашего агента все и сразу.
Он вообще любую задачу решить сможет :)

#API #каталог
———
@tsingular
04/15/2025, 22:17
t.me/tsingular/3753
OpenAI разрабатывает конкурента Twitter — интеллектуальную социальную сеть

Компания Сэма Альтмана создаёт социальную платформу, напоминающую X (экс-Twitter).

Внутренний прототип фокусируется на генерации изображений и представляет собой ленту контента.

Руководитель проекта запрашивает отзывы о разработке у внешних экспертов.

Неясно, будет ли продукт выпущен как отдельное приложение или интегрирован в ChatGPT.

Запуск усилит соперничество между Альтманом и Маском, предлагавшим купить OpenAI за $97.4 млрд.

Обостряется конкуренция с Meta*(запрещённой в РФ), планирующей добавить социальную ленту в свой ИИ-ассистент.

Собственная платформа обеспечит организацию уникальными данными для обучения моделей.

Одна из задумок — помогать авторам публиковать качественный контент с помощью искусственного интеллекта.

Не можешь победить, - создай своё. Норм.

#OpenAI #SocialNetwork #Altman
-------
@tsingular
04/15/2025, 19:12
t.me/tsingular/3752
04/15/2025, 19:08
t.me/tsingular/3750
04/15/2025, 19:08
t.me/tsingular/3751
Repost
3
6
681
🌟 Cемейство гибридных моделей Nemotron-H от NVIDIA.

NVIDIA выпустила новое семейство языковых моделей Nemotron-H, сочетающих архитектуры Mamba и Transformer. Эти гибриды обещают до 3х ускорения инференса по сравнению с чистыми Transformer-моделями аналогичного размера (Qwen или Llama).

Семейство поддерживает английский, немецкий, испанский, французский, итальянский, корейский, португальский, русский, японский и китайский языки.

Основной фокус Nemotron-H — баланс между эффективностью и интеллектом: даже при меньшем числе параметров (47–56 млрд.) модели демонстрируют точность, близкую к DeepSeek-V3-671B.

Особенность Nemotron-H — использование FP8 для претрейна. 56B-версию обучали на 20 трлн. токенов с квантованием тензоров «на лету», а сжатую в FP4 модель c 47B можно запускать на потребительской RTX 5090 с поддержкой контекста до 1 млн. токенов. Правда, пришлось пожертвовать частью слоев самовнимания — их заменили на более легкие Mamba-блоки, чтобы ускорить генерацию.

NVIDIA не стала тренировать компактные версии модели с нуля. Вместо этого использовали дистилляцию: 47B-модель получили из 56B, удалив половину «тяжелых» слоев и дообучив на 63 млрд токенов. Результат — почти та же точность, но на 1.2x быстрее.

В бенчмарках Nemotron-H обходит конкурентов в математике и коде: на GSM8k 56B-версия дает 93.7% против 90.9% у Qwen-72B. А 8B-модель, хоть и уступает в MMLU, вырывается вперёд в HumanEval+ (56.1%) — ожидаемо, с учетом ее instruct-оптимизации.

Пока модели доступны на HF как базовые, но NVIDIA обещает добавить инструктивные и мультимодальные версии.

▶️В опенсорсный релиз были выпушены чекпоинты с контекстом 8 тыс. токенов:

🟢Nemotron-H-56B-Base-8K

🟢Nemotron-H-47B-Base-8K

🟢Nemotron-H-8B-Base-8K


📌 Лицензирование: NVIDIA Internal Scientific Research and Development Model License.


🟡Страница проекта
🟡Коллекция на HF
🟡Arxiv


@ai_machinelearning_big_data

#AI #ML #LLM #NemotronH #NVIDIA
04/15/2025, 19:08
t.me/tsingular/3749
🪖Пентагон 2.0: Генеративный ИИ на военной службе США

Американские военные активно внедряют генеративный ИИ в разведывательные операции. Судя по материалам MIT Technology Review, мы наблюдаем "вторую фазу" военного применения искусственного интеллекта.

Ключевые факты:
• Подразделение морской пехоты США (15-й экспедиционный отряд) впервые использовало генеративный ИИ для анализа разведданных во время развертывания в Тихом океане для сортировки тысяч разведывательных материалов из открытых источников

• Технология разработана компанией Vannevar Labs, получившей контракт от Пентагона на $99 млн для внедрения этой технологии в больше военных подразделений

• ИИ используется для перевода, анализа настроений и выявления угроз с результатами, доступными через чат-интерфейс

Технические возможности:
• Обработка терабайтов данных на 80 языках из 180 стран
• Анализ профилей в социальных сетях и преодоление брандмауэров в странах вроде Китая
• Использование как OpenAI и Microsoft, так и собственных моделей

Практические результаты:
• Использование ИИ для отслеживания упоминаний подразделения в иностранных СМИ и анализа настроений • Применение ИИ для помощи в составлении ежедневных и еженедельных разведывательных отчетов командованию
• Время на анализ сократилось в разы по сравнению с ручной обработкой

Открытые вопросы:
1.Насколько эффективен "человек в контуре"? С ростом сложности систем ИИ и объема анализируемых данных становится почти невозможно для человека проверить все выводы машины.

2. Как классифицировать информацию? Генеративный ИИ способен соединять точки между несекретными документами и выявлять закономерности, которые сами по себе могли бы считаться секретными.

3. Как высоко по цепочке принятия решений должен продвинуться ИИ? Военные командиры интересуются потенциалом ИИ для улучшения принятия решений на оперативном уровне войны.

Потенциальные риски:
• Известная неточность LLM в критических с точки зрения безопасности приложениях

• Субъективность анализа настроений, который "даже людям трудно правильно оценить только на основе контента"

• Подверженность открытых источников дезинформации и манипуляциям
Несмотря на эти вопросы, полковник Шон Дайнан утверждает, что эксперимент — лишь "верхушка айсберга", и более активное использование генеративного ИИ только начинается.

Мы наблюдаем фундаментальный сдвиг: от простого сбора данных к их интерпретации искусственным интеллектом, что поднимает важные вопросы о будущем военных решений и роли человека в них.

Самое критичное - ИИ принимает решения в таком масштабе, который человек не может перепроверить.
В какой момент дёрнуть стоп-кран, - не понятно.

#Пентагон #military
———
@tsingular
04/15/2025, 14:37
t.me/tsingular/3748
Repost
4
3
702
Пасхалочка.

Интересно, что Veo2 наотрез отказывается генерить видео по промпту "Crypto Easter".

Изыди, говорит, охальник, это супротив моих убеждений и правил. Бесовщина все это!

А вот промпт "Крипто Пасха" кушает как куличики, один за другим.

Ну и кто у нас ортодокс?

И да, на https://aistudio.google.com/u/2/generate-video все еще можно генерить пяток видео бесплатно на новом Google аккаунте.

P.S. Только сейчас понял, что не включал штатовский впн, а генерил на европейском.

@cgevent
04/15/2025, 14:25
t.me/tsingular/3747
04/15/2025, 14:22
t.me/tsingular/3745
Repost
11
6
658
🥇 VL-Rethinker — новую парадигму мультимодального вывода, обучаемую напрямую с помощью Reinforcement Learning.

🌟 Новая SOTA на ключевых бенчмарках по vision + math:

🟢 MathVista: 80.3 → 🥇 (+6.4 vs GPT-o1 73.9)
🟢 MathVerse: 61.7 → 🥇 (+4.7 vs GPT-o1 57.0)
🟢 MathVision: 43.9 → 🥇 (+1.7 vs GPT-o1 42.2)

🔥 В чём секрет? GRPO-алгоритм с двумя ключевыми новшествами:

🟠Этап 1: Улучшение логики, с помощью GRPO + SSR (Selective Sample Replay):

Сохраняются только те последовательности действий модели (rollouts), которые дали ненулевое преимущество (advantage).

При повторном обучении приоритет отдается полезным примерам, что помогает стабилизировать обучение.

Почему это важно?
При обычном GRPO-со временем "advantage" может становиться нулевым → градиенты обнуляются → модель перестаёт учиться. SSR решает эту проблему.

🟠 Этап 2: Вынужденное «переосмысление» (Forced Rethinking)
На этом этапе в каждый rollout добавляется специальный триггер, заставляющий модель заново обдумывать ответ, прежде чем его выдать.

Это развивает способность к саморефлексии, улучшает многошаговое рассуждение и точность ответов.

🔥 Модель вынуждена подумать ещё раз перед финальным ответом.
Результат — у модели появляются признаки метапознания: она сама находит ошибки в начальных размышлениях.

✔️ VL-Rethinker-72B — первый VLM, обгоняющий GPT-o1.

Похоже, что будущее за "медленно думающими" и умеющими рефлексировать агентами.

🔜 Paper
🔜 Code
🔜 Website
04/15/2025, 14:22
t.me/tsingular/3744
04/15/2025, 14:22
t.me/tsingular/3746
Вышел отчёт AI Index 2025 от Стэнфорда: взрывной рост проникновения AI во все сферы жизни

Стэнфорд выпустил самый полный на сегодня отчёт о развитии искусственного интеллекта.

Интересные факты: 78% компаний используют AI (+23% за год), производительность малых моделей выросла в 280 раз, а разрыв между открытыми и закрытыми моделями сократился до 1,7%.

США лидирует с 40 заметными моделями против 15 китайских, но Китай стремительно сокращает отставание. Инвестиции в США достигли $109 млрд — в 12 раз больше, чем в Китае.
(Т.е.: инвестируя в 12 раз меньше, чем США, Китай умудряется сокращать разрыв. Норм :) )

Интересно, что оптимизм относительно AI сильно зависит от страны: в Китае 83% видят больше пользы чем вреда, а в США только 39%.

Сам отчёт в комментарии.

#AIResearch #StanfordAI #AITrends #аналитика
———
@tsingular
04/15/2025, 11:28
t.me/tsingular/3743
Repost
9
3
748
Как многие вчера догадались — да, мы тестировали новый Kling 2.0 💥, который я гоняю уже где-то неделю в рамках партнёрской программы.

Что могу сказать? Он очень хорош: понимание промта, количество движения, последовательность — отлично.

😑 Первое видео — тест img-to-video из случайных кадров (включая ваши генерации и, конечно же, Уилла Смита с пастой).

😳 Второе, более интересное — новый режим Multi-Elements (на версии 1.6), который подрезали у Pika, но сделали гораздо лучше. Загружаете видео, референс, пишете что-то вроде "замени/удали/добавь [объект] из футажа 1 на [объект 2]" — и готово.

В целом, что нового:

1. Модель KLING 2.0 с улучшенными базовыми возможностями
Пока что только базовые режимы Text to Video и Image to Video, 720p, без дополнительных контролов (но, возможно, скоро подъедет другая версия 2.0).

2. Multi-Elements (v1.6)
Добавление, замена, удаление объектов в видеосцене — удобно, гибко, быстро.

3. Motion Control (v1.6)
Кастомная анимация персонажей на изображении по промту или референсу.

4. KOLORS 2.0 — обновлённая генерация изображений
Большие улучшения по сравнению с версией 1.5 — по качеству, цвету, деталям.

5. Restyle (KOLORS 2.0)
Смена стилистики изображения — работает чисто и разнообразно.

6. Редактирование изображений
Новые функции Inpaint и Expand для креативного редактирования.
04/15/2025, 10:45
t.me/tsingular/3741
04/15/2025, 10:45
t.me/tsingular/3742
MeshGen: AI-агенты для Blender — творите 3D с помощью естественного языка

Наткнулся на интересный инструмент для 3D-моделирования, который может серьезно изменить рабочий процесс дизайнеров и энтузиастов Blender.

MeshGen — это свежий аддон, позволяющий управлять Blender через естественные языковые запросы с помощью AI-агентов.

Ключевые особенности:
• AI как инструмент
• Варианты запуска:
- Локально через llama.cpp или Ollama
- Удаленно через Hugging Face, Anthropic или OpenAI
• Интеграция с LLaMA-Mesh для локального обсуждения и создания 3D-моделей
• Интеграция с Hyper3D для генерации высококачественных 3D-мешей

Техническая начинка:
• Простая установка через ZIP-файл прямо в настройках Blender
• Поддержка локальных моделей на NVIDIA GPU (от 8GB VRAM)
• Возможность выбора между локальными моделями или API-интеграциями
• Полная совместимость с мощными LLM включая Llama-3.3-70B, Claude и GPT-4o

Практическое применение:
• 3D-художникам: быстрое создание концептов через текстовые запросы
• Новичкам: преодоление барьера входа в сложный интерфейс Blender
• Профессионалам: ускорение рутинных операций через языковые команды

Интерфейс интуитивно понятен — достаточно открыть сайдбар (клавиша N), выбрать вкладку MeshGen, ввести запрос (например, "Create a snowman") и нажать Submit.

Проект активно развивается — последний релиз v0.7.1 вышел всего 11 часов назад, содержит 575 звезд на GitHub. Судя по активности коммитов, команда регулярно вносит улучшения.

Если используете Blender и хотите попробовать AI-подход к моделированию — определенно стоит взглянуть.

#MeshGen #Blender #3D
———
@tsingular
04/15/2025, 10:26
t.me/tsingular/3740
Repost
7
3
756
Хехе, https://cursor.com/ тоже добавил 4.1 и сделал ее бесплатной (на какое-то время)

Гонка в которой выигрывает потребитель – лучшая гонка 🌝
04/14/2025, 23:02
t.me/tsingular/3739
Repost
8
16
866
Сэм Альтман на TED: о будущем OpenAI, AGI и новой эре человечества на русском

⏱ Видео идёт 53 минуты, но если нет времени — вот квинтэссенция:

🔹 500 млн пользователей в неделю — ChatGPT продолжает расти экспоненциально.

🔹 Open Source — OpenAI готовит к релизу мощную модель с открытым кодом.

🔹 Честное творчество — разрабатывается система компенсаций для художников, разрешивших использовать свой стиль.

🔹 AI и наука — прорывы в медицине и фундаментальных исследованиях — главная надежда на пользу ИИ.

🔹 Риски — биотерроризм, хаки, модели, способные к самосовершенствованию — это не фантастика, а задачи на сейчас.

🔹 Агентный интеллект — самый опасный и мощный класс AI. Безопасность здесь важнее функционала.

🔹 AGI? — чёткого определения нет. Но кривая развития — экспоненциальна.

🔹 Будущее — «Мой ребёнок будет жить в мире, где люди никогда не будут умнее ИИ», — говорит Альтман. Зато будет материальное изобилие, если всё сделать правильно.

Видео на VK Video и Дзен.

Переведено и озвучено Фабрикой Контента.

➕@ai_rostov
04/14/2025, 22:16
t.me/tsingular/3738
Search results are limited to 100 messages.
Some features are available to premium users only.
You need to buy subscription to use them.
Filter
Message type
Similar message chronology:
Newest first
Similar messages not found
Messages
Find similar avatars
Channels 0
High
Title
Subscribers
No results match your search criteria