У вас закончился пробный период!
Для полного доступа к функционалу, пожалуйста, оплатите премиум подписку
VI
Искусственный интеллект. Высокие технологии
https://t.me/vistehno
Возраст канала
Создан
Язык
Русский
2.61%
Вовлеченность по реакциям средняя за неделю
4.05%
Вовлеченность по просмотрам средняя за неделю

Наука, технологии, изобретения и урбанистика — прямо сейчас говорим о том, что уже скоро повлияет на каждого.

админ - @workakkk

Сообщения Статистика
Репосты и цитирования
Сети публикаций
Сателлиты
Контакты
История
Топ категорий
Здесь будут отображены главные категории публикаций.
Топ упоминаний
Здесь будут отображены наиболее частые упоминания людей, организаций и мест.
Найдено 292 результата
🚀 Новые модели OpenAI: какую выбирать под ваши задачи?

В экосистеме OpenAI появилось сразу несколько «звёзд» — разберёмся, какая модель подойдёт именно вам.

🧭 o3 — ежедневный помощник
Идеален для: планирования дня, быстрых справок, рутинных задач.

Что делает: отвечает развернуто, но не уходит в слишком детальные рассуждения. Поможет составить список дел, напомнит про важные мелочи и подскажет идеи для привычных процессов.

🖋️ GPT-4.5 — долгие тексты и редактура
Идеален для: написания статей, отчётов, эссе, глубокого анализа.

Что делает: создаёт связные, структурированные тексты на 30+ страниц, заботится о стиле, логике и аргументации. Отлично справляется с редактированием, устранением повторов и улучшением читаемости.

⚡ GPT-4o — быстрые вопросы и мозговые штурмы
Идеален для: экспресс-ответов, идейных сессий, креативных зарисовок.

Что делает: мгновенно предлагает варианты, отвечает на простые и сложные вопросы «на лету», помогает найти десятки идей и инсайтов в режиме реального времени.

Как выбрать?

Нужен надёжный «ежедневник» — берите o3.

Пишете или правите крупный текст — ваш выбор GPT-4.5.

Требуются мгновенные решения и много идей — оформляйте сеанс с GPT-4o.

🔥 Попробуйте все три модели и поделитесь в комментариях, какая подошла вам лучше всего!

@Chatgpturbobot
25.04.2025, 12:03
t.me/vistehno/4248
🔁 дублируем видосы бесплатно на любой язык — вышла новая нейронка Vozo и это просто подарок.

Это целый мультитул: перевод видео с сохранением голоса, можно сделать липсинк и субтитры. Из интересных фишек: поддерживает перевод сразу нескольких спикеров!

Внутри 39+ языков, среди которых и русский — делает как перевод с великого и могучего, так и на него. После регистрации отсыпают 30 кредитов, это где-то 3 минуты дублированного видео, что очень много.

Попробовать — здесь.
23.04.2025, 18:34
t.me/vistehno/4247
⭐️ Используйте ИИ, чтобы превратить детские рисунки в красивые анимации.

Все бы ничего, но такие видео точно будут снятся детям в кошмарах по ночам

@vistehno
22.04.2025, 10:49
t.me/vistehno/4246
✔️ Модели Stable Diffusion получили оптимизацию для AMD.

Stability AI совместно с AMD оптимизировали линейку моделей Stable Diffusion для работы на GPU Radeon и APU Ryzen AI. Инженеры использовали ONNX-формат, чтобы повысить скорость генерации без потери качества изображений.

Оптимизация SD3.5 и SDXL и их Turbo-версий показала прирост производительности до 2,6x и 3,8x соответственно — по сравнению с базовыми реализациями на PyTorch. Обновленные модели совместимы со средами, поддерживающими ONNX Runtime, имеют суффикс amdgpu в названии и доступны на Hugging Face.
stability.ai

✔️ Intel презентовала техпроцесс 18A.

Intel представила долгожданный техпроцесс 18A, который может стать поворотным моментом для ее foundry-подразделения. Согласно техотчету, новинка обходит Intel 3 по ключевым параметрам: прирост плотности на 30%, повышение скорости на 25% и сокращение энергопотребления на 36% для ядер Arm. Основой успеха стали RibbonFET (транзисторы с gate-all-around) и PowerVia — технология обратного питания, которая стабилизирует подачу напряжения и освобождает место для компактного размещения элементов.

18A демонстрирует плотность SRAM, аналогичную TSMC N2, что выводит Intel в прямые конкуренты тайваньскому гиганту. Уже в 2025 году процесс планируют использовать в SoC Panther Lake, а к 2026-му — в серверных Xeon Clearwater Forest. Пока же инженеры и аналитики ждут первых образцов — проверить, оправдаются ли заявленные характеристики в реальных продуктах.
wccftech.com

✔️ Apple представила функцию Clean Up для удаления объектов на фото.

Несмотря на перенос части функций Apple Intelligence, компания активно продвигает готовые решения. В новом рекламном ролике Apple показала работу инструмента Clean Up в приложении Photos: он позволяет убрать элементы фона, сохранив основной объект.

Функция уже доступна на iPhone 16, 15 Pro/Pro Max, iPad с чипами A17 Pro/M1 и новее, а также Mac на M1 и позднее. Требуются iOS 18.1, iPadOS 18.1 или macOS Sequoia 15.1.
9to5mac.com

✔️ ОАЭ будут использовать ИИ для законотворчества.

Объединенные Арабские Эмираты (ОАЭ) станут первой страной в мире, где ИИ будет использоваться для разработки новых и пересмотра существующих законов. Ожидается, что эта инициатива повысит эффективность законодательного процесса на 70 %.

Правительство ОАЭ одобрило создание Управления по регулированию и интеллекту - нового органа, которому поручено использовать ИИ для анализа существующих федеральных и местных законов, судебных решений, исполнительных процедур, государственных услуг и социально-экономических последствий законодательства.
ft.com

✔️ Magi-1: модель генерации полнометражного видео с 24B параметров.

Sand AI выпустила Magi-1, первую в истории Text-to-Video модель с 24 млрд. параметров, разработанную специально для создания видео. Magi-1 опубликована в открытом доступе и позволяет создавать высококачественные полнометражные видеоролики с исключительной реалистичностью, плавностью и тонким контролем над видеосценами.
Черрипики и результаты тестов в популярных бенчмарках превосходны. Попробовать можно в демо-спейсе.
sand.ai


@ai_machinelearning_big_data

#news #ai #ml
22.04.2025, 09:24
t.me/vistehno/4245
📢 Google выпустил масштабное руководство по промпт-инжинирингу

Команда Google опубликовала первую часть цикла статей о работе с языковыми моделями — «Prompt Engineering: основы и базовые техники». Это не просто краткий гайд, а полноценный 68-страничный документ от инженеров Office of the CTO.

Хотя статья фокусируется на Gemini и Vertex AI, описанные принципы универсальны: они применимы к GPT, Claude, Llama и другим LLM. Авторы разбирают ключевые параметры вроде температуры, Top-K и Top-P, а также базовые техники — от zero-shot промптинга до ролевых и контекстуальных сценариев.

🔗 Ссылка на статью - *клик* @vistehno
21.04.2025, 15:04
t.me/vistehno/4244
✨ Робот шпионит за дикой природой! 🐘🤖

В круто эксперименте BBC робот с камерой замаскировали под кучу слоновьего навоза. Этот колесный «походный стул» незаметно вписывается в окружающую среду, позволяя снимать животных вблизи без какого‑либо вмешательства. В одном из кадров замаскированный робот бесшумно катится рядом с юным слонёнком, на мгновение отделившимся от матери.

Это эффективный инструмент для наблюдения за дикой природой: он открывает новый ракурс съёмки, сохраняя при этом уважительную дистанцию! 🐾

Гениально, эффективно и слегка… отвратительно! 😅

#ДикаяПрирода #BBCNature
21.04.2025, 12:29
t.me/vistehno/4243
✔️ «Генеральный директор Anthropic Дарио Амодей считает, что ИИ может удвоить продолжительность жизни человека за 5 лет»

По словам Амодея, современные системы искусственного интеллекта способны резко ускорить исследования в биологии и медицине. То, на что раньше уходили десятки лет — например, понимание механизмов старения или разработка новых лекарств — теперь можно «прожать» за считанные годы.

🔭 Чего ждать?

В ближайшие годы мы увидим взрыв инноваций в фармацевтике, биотехнологиях и диагностике.

Крупные компании (Anthropic, OpenAI, DeepMind) уже инвестируют в партнёрства с университетами и клиниками.

Появятся пилотные проекты по «омоложению» органов и тканей, которые ещё пару лет назад казались фантастикой.
20.04.2025, 20:13
t.me/vistehno/4242
🧠 Даже Барак Обама говорит: ИИ фундаментально изменит рынок труда.

Рабочие места — и хорошо оплачиваемые в том числе — будут исчезать.
Мир изменится навсегда. Это уже не прогноз, а реальность, к которой мы стремительно приближаемся.

❗️Но до сих пор не началось широкое обсуждение этой темы в обществе.

Сколько еще можно игнорировать то, что уже стоит у двери?
20.04.2025, 11:54
t.me/vistehno/4241
⚡️ Krea запустила новую фичу: создание виртуальных миров с добавлением 3D-объектов 💃

ИИ генерирует базовое пространство и предлагает подходящие объекты, подсказывая промты для генерации.

Плюс — всё бесплатно!

Попробовать можно здесь.

#Krea #AI #3Dworlds #free
18.04.2025, 18:12
t.me/vistehno/4240
15 бесплатных книг по Data Science (часть 1)*

1. *Veridical Data Science*
👩‍🔬 Авторы: Bin Yu & Rebecca L. Barter
Описание: Введение в науку о данных (data science): как область возникла, как она развивается и какую роль играет в современном мире.
🔗 https://vdsbook.com/

2. *Data Science: Theories, Models, Algorithms, and Analytics*
📘 Автор: Sanjiv Ranjan Das
Описание: Учебник по DS с упором на алгоритмы и аналитику.
🔗 https://srdas.github.io/Papers/DSA_Book.pdf

3. *Think Python 3E*
🐍 Автор: Allen B. Downey
Описание: Современное введение в Python с нуля.
🔗 https://greenteapress.com/wp/think-python-3rd-edition/

4. *Python Data Science Handbook*
📊 Автор: Jake VanderPlas
Описание: Практика работы с NumPy, pandas, sklearn и визуализациями.
🔗 https://jakevdp.github.io/PythonDataScienceHandbook/

5. *R for Data Science*
📈 Авторы: Hadley Wickham и др.
Описание: Современный подход к анализу данных в R.
🔗 https://r4ds.hadley.nz/

6. *Think Stats 3E*
📐 Автор: Allen B. Downey
Описание: Статистика через Python и практику.
🔗 https://allendowney.github.io/ThinkStats/

7. *Statistics and Prediction Algorithms Through Case Studies*
📙 Автор: Rafael A. Irizarry
Описание: Кейсы по статистике и прогнозированию с кодом на R.
🔗 https://rafalab.github.io/dsbook/

8. *Bayesian Methods for Hackers*
🧠 Автор: Cameron Davidson-Pilon
Описание: Визуальное введение в байесовский анализ с PyMC.
🔗 https://github.com/CamDavidsonPilon/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers

9. *Think Bayes 2E*
🔢 Автор: Allen B. Downey
Описание: Пошаговый байесовский подход на Python.
🔗 https://allendowney.github.io/ThinkBayes2/

10. *Data Science at the Command Line*
💻 Автор: Jeroen Janssens
Описание: Unix-инструменты как основа для анализа данных.
🔗 https://datascienceatthecommandline.com/

Математика и теория вероятностей:
11. Теория вероятностей
👩‍🔬 Автор: Чернова Н. И.
Описание: Понятное введение в теорию вероятностей, основа для изучения математической статистики.
🔗 http://www.nsu.ru/mmf/tvims/chernova/tv/tv_nsu07.pdf

12. * Математическая статистика*
👩‍🔬 Автор: Чернова Н. И.
Описание: Продолжение курса по теории вероятностей (НГУ), покрывающее основы математической статистики: оценки параметров, проверка гипотез, регрессионный анализ.
🔗 http://www.nsu.ru/mmf/tvims/chernova/ms/ms_nsu07.pdf

13. * Курс дифференциального и интегрального исчисления (Том 1)*
👩‍🔬 Автор: Фихтенгольц Г. М.
Описание: Фундаментальный и классический учебник по основам математического анализа.
🔗 http://math.ru/lib/book/djvu/fichtengolz/f_1.djvu

14.*Векторные исчисления для инженеров*
👩‍🔬 Автор:Jeffrey R. Chasnov
🔗 http://math.ru/lib/book/djvu/fichtengolz/f_1.djvu

15 .*Theory—Theoretical & Mathematical Foundations ;
👩‍🔬Daniel A. Roberts, Sho Yaida, Boris Hanin
Описание: Эта книга предлагает теоретический подход к анализу глубинных нейросетей с практической значимостью
🔗https://arxiv.org/abs/2106.10165

📘 Еще больше книг здесь

Сохраняйте себе, чтобы не потерять

@ai_machinelearning_big_data

#books #opensource #freebooks
18.04.2025, 14:00
t.me/vistehno/4239
⚡️Строим рекомендательную систему фильмов на Kaggle

Вы когда-нибудь хотели сделать свою собственную систему рекомендаций фильмов? 🎬

Приходите на бесплатный вебинар, где Савелий Батурин, Senior ML-Engineer и преподаватель курса по ML школы Simulative в прямом эфире покажет как построить рекомендательную систему фильмов на Kaggle.

Что будем делать на вебинаре:
🟠Разберем имеющиеся данные фильмов с их оценками
🟠Проведем предобработку данных
🟠Построим рекомендательную систему на основе машинного обучения
🟠Проведем расчет и анализ метрик на основе результатов работы модели

Вебинар будет интересен как новичкам, так и уже опытным специалистам

😶Зарегистрироваться на бесплатный вебинар
18.04.2025, 12:05
t.me/vistehno/4238
🦾 Руки — это мост к возникновению интеллекта.

DM‑Hand1, разработанная Shenzhen DaimonRobotics, представляет собой гуманоидную руку с визуальными и тактильными сенсорами, позволяющую роботам воспринимать любые объекты и их изменения и адекватно на них реагировать.

Это означает, что гуманоидные роботы, оснащённые этой рукой, обладают большим потенциалом для точных операций, сортировки скопившихся предметов и особенно для сервисных задач, таких как уход за пожилыми людьми.

@vistehno
18.04.2025, 09:51
t.me/vistehno/4237
17.04.2025, 22:58
t.me/vistehno/4236
🔥 Google только что выпустил Gemini 2.5 Flash

Ключевые особенности:

В 25 раз дешевле, чем Claude Sonnet 3.7 и Grok-3 и в 5–10 раз дешевле, чем Gemini‑2.5‑Pro.

Новая функция динамического «размышления» над сложными задачами.

Настраиваемый «бюджет мышления» (вы сами решаете, сколько токенов выделить на этап «размышлений»)

Делит #2, место на Арене вместе с GPT 4.5 Preview и Grok‑3.

🏆 Делит первое место в задачах Hard Prompts, Coding и Longer Query
💠 Входит в топ‑4 по всем категориям

Gemini Flash 2.5 — это лучшее соотношение цена/производительность. Google снова на высоте.

Бегом тестить

@ai_machinelearning_big_data

#Gemini
17.04.2025, 22:58
t.me/vistehno/4235
🎮 VideoGameBench — первый в своём роде бенчмарк, который проверяет возможности VLM в реальном времени играть в 20 классических игр для Game Boy и MS‑DOS:

В списке есть: Doom II и Quake до Pokemon Red и Super Mario Land и другие.

Например, при игре в Doom. Sonnet 3.7 прошёл дальше всех и даже нашёл «синюю комнату»!

Режим реального времени: агент получает только raw‑фреймы и контролирует игру «на ходу» в режиме реального времени.

VideoGameBench‑Lite: среда автоматически ставит игру на паузу, пока модель думает, чтобы убрать задержки инференса и дать время на обдуманные действия
vgbench.com
.
Единый интерфейс: абстрагируем эмуляторы (PyBoy для Game Boy, DOSBox для MS‑DOS) и предоставляем API для передачи изображений, нажатий кнопок и проверки завершения игры
vgbench.com

Open‑source: код и примеры агентов доступны на GitHub — клонируйте, форкайте и тестируйте свои LLM/VLM‑агенты!
vgbench.com


📂 Репозиторий: https://github.com/alexzhang13/videogamebench
🔗 Документация и примеры агентов: https://www.vgbench.com/

#VideoGameBench #VLM #AI #ReinforcementLearning #AIGC
17.04.2025, 20:03
t.me/vistehno/4234
🔮 Что ждёт российский ИТ‑рынок в 2025‑м и какую роль сыграет ИИ?
Коротко о самом важном из выступления Сергея Голицына, руководителя направления Т1 ИИ (ИТ‑холдинг Т1) на конференции Data Fusion.

Тренды‑2025
🤖 Генеративный ИИ — как самостоятельные сервисы и в связке с классическими ML‑моделями.

🎛 Мультимодальность — работа сразу с текстом, изображениями, аудио и видео.

⚙️ Гиперавтоматизация бизнес‑процессов — от кол‑центров до цепочек поставок.

Деньги и масштабы
📈 Рынок ИИ в 2025 году может достичь ₽ 800 млрд (до 2 % ВВП).

🇷🇺 Россия входит в ТОП‑лигу по внедрению ИИ; нацпроект «Экономика данных» обещает совокупный эффект ₽ 11 трлн.

Big Data в облаках
🌥 Российский рынок Big Data растёт на 25–35 % в год (глобальный — ≈ 12 %).

Облачные решения ускоряются ещё сильнее — 30–40 % ежегодно.

Главные драйверы — оптимизация затрат и управление данными.

ИИ‑оптимизация как must‑have
Компании, внедрившие ИИ, снижают:
• расходы на обслуживание клиентов — до ‑30 %;
• затраты на обработку звонков — до ‑60–70 %.

Где уже лидируют
🏦 Банки, ⚡️ ТЭК, 📡 телеком и 🛒 ритейл — в первой тройке по применению ИИ.

К 2025‑му 60–70 % российских компаний планируют активно использовать интеллектуальные решения.

Главный фокус — Gen AI 2.0
Инвестируют уже не в «технологию ради технологии», а в полноценные бизнес‑продукты, которые seamlessly встраиваются в корпоративные экосистемы.

💡 TL;DR: 2025 станет годом масштабного «приземления» ИИ — от генеративных моделей до end‑to‑end автоматизации. Рынок растёт взрывными темпами, а компании, которые уже сегодня инвестируют в интеллектуальные решения, получают ощутимые конкурентные преимущества.

#AI #GenAI
17.04.2025, 16:34
t.me/vistehno/4233
🔐 CSGHub — open-source платформа для управления LLM-проектами с возможностью локального развёртывания.

CSGHub позиционируется как корпоративная замена Hugging Face с поддержкой приватных репозиториев, верификацией файлов и контролем доступа.

Особый акцент в сервисе сделан на безопасность — есть встроенная синхронизация данных из разных источников, сквозное шифрование и отказоустойчивая архитектура. Уже поддерживаются модели вроде DeepSeek и Llama, а в дорожной карте — инструменты для аннотации данных и тонкой настройки LLM.

🤖 GitHub

@vistehno
16.04.2025, 18:20
t.me/vistehno/4232
🤖 Машинный перевод seq2seq: и как обучить модель понимать языки 

🗓 21 апреля в 20:00 МСК
🆓 Бесплатно. Урок в рамках старта курса «NLP / Natural Language Processing».

На данном открытом уроке мы:
✔️Познакомимся с архитектурой seq2seq и ее применением в задачах машинного перевода
✔️Разберем архитектуру энкодер-декодер, её основные компоненты и как она используется для перевода текста.
✔️Изучим концепцию attention mechanism и его влияние на повышение качества машинного перевода.

В результате вебинара слушатели:
-Узнают, как работает архитектура seq2seq и как она решает задачи машинного перевода.
-Поймут, как attention mechanism улучшает качество перевода и как его можно применить в своих проектах.

🔗 Ссылка на регистрацию: https://otus.pw/38G6/

#реклама
О рекламодателе
16.04.2025, 17:31
t.me/vistehno/4231
🤖 Машинный перевод seq2seq: и как обучить модель понимать языки 

🗓 21 апреля в 20:00 МСК
🆓 Бесплатно. Урок в рамках старта курса «NLP / Natural Language Processing».

На данном открытом уроке мы:
✔️Познакомимся с архитектурой seq2seq и ее применением в задачах машинного перевода
✔️Разберем архитектуру энкодер-декодер, её основные компоненты и как она используется для перевода текста.
✔️Изучим концепцию attention mechanism и его влияние на повышение качества машинного перевода.

В результате вебинара слушатели:
-Узнают, как работает архитектура seq2seq и как она решает задачи машинного перевода.
-Поймут, как attention mechanism улучшает качество перевода и как его можно применить в своих проектах.

🔗 Ссылка на регистрацию: https://otus.pw/38G6/

#реклама
О рекламодателе
16.04.2025, 17:19
t.me/vistehno/4230
💥 Исследователи поместили 1000 агентов ИИ на сервер Minecraft.

Агенты создали собственную цивилизацию с правительством, культурой и экономикой, а священники использовали веру, чтобы убеждать других вступить к ним.

https://www.reddit.com/r/Amazing/comments/1iqdhxv/researchers_placed_1000_ai_agents_in_a_minecraft/
16.04.2025, 11:50
t.me/vistehno/4229
🔝 Создай сайт за 1 минуту — без кода и дизайна

Readdy — это сервис, который превращает текстовое описание в готовый веб-проект с кодом и UI.
Не нужно быть разработчиком или дизайнером — всё работает автоматически.

🔹 Просто опиши идею — через минуту получишь макет и исходный код
📝 Экспортируй в Figma в один клик
🔌 Запусти сайт сразу из сервиса
💸 Полностью бесплатно

🚀 Попробовать можно — тут.
15.04.2025, 23:53
t.me/vistehno/4228
⚡️ Composio MCP — удобный инструмент для подключения AI-агентов к более чем 100 популярных сервисов

Интересно, что вместо написания кастомных адаптеров для каждого API разработчики получают единый интерфейс с поддержкой OAuth, JWT и API-ключей. Особый акцент сделан на точности вызовов инструментов — заявлено улучшение до 40% по сравнению с ручными реализациями.

Composio не ограничивается стандартным набором SaaS-продуктов. В арсенале есть даже низкоуровневые инструменты для работы с файловой системой и shell-командами, что расширяет сценарии использования за пределы типичных CRM и задач автоматизации.

🔗 Ссылка - *клик*

@vistehno
15.04.2025, 19:04
t.me/vistehno/4227
Вы никогда не задумывались, как «Самокат» доставляет заказы за 15 минут?

Это не иллюзия, не фокус и не магия вне Хогвартса — это аналитика данных.

И 17 апреля в 19:00 мск онлайн-школа Data Science karpovꓸcourses приглашает заглянуть за кулисы и узнать, как это работает на самом деле на бесплатном вебинаре «Продуктовая аналитика „под капотом“ сервиса быстрой доставки „Самокат“».

Роман Стрекалов, руководитель аналитики операционных продуктов в ecom.tech (Самокат), расскажет какие инструменты помогают курьерам и партнерам сервиса доставлять заказы за минуты, и какие навыки нужны для того, чтобы создать что-то подобное в любом другом проекте.

Вы еще совсем новичок в сфере аналитики? Или уже в теме, но стремитесь к более масштабным задачам?

Встреча в любом случае будет полезной! А в конце все участники получат скидку на обучение аналитике в karpovꓸcourses и карьерный гайд.

Регистрация по ссылке: https://clck.ru/3LMH8J/?erid=2VtzqxhsRyB

Реклама. ООО «Карпов Курсы», ИНН: 7811764627, erid: 2VtzqxhsRyB
15.04.2025, 17:00
t.me/vistehno/4226
✔️ Kling AI 2.0 — теперь видео не отличить от реальности!

ИИ генерирует целые клипы, рекламу и мультики — идеально сохраняет контекст и справляется даже с самыми быстрыми движениями.

Multy-Elements 1.6 — редактирует всё в кадре: добавляй, удаляй, заменяй и трансформируй объекты как угодно.

Motion Control 1.6 — анимирует персонажей по одному промпту, как магией.

KOLORS 2.0 — генератор картинок с фотореалистичной детализацией. Настолько чётко, что не верится, что это ИИ.

Пробуем — здесь.

@vistehno
15.04.2025, 12:43
t.me/vistehno/4225
Как разобраться в нейросетях раз и навсегда?! 

🚀 Хотите понять, как искусственный интеллект может упростить вашу жизнь или вывести ваш бизнес на новый уровень?

🤖 Авторский канал "ИИчко" — место, где ИИ становится доступным, понятным и невероятно полезным для всех, кто интересуется технологиями.

🔍 Что вас ждет:
• Образовательный контент;
• Простые объяснения сложных тем ИИ;
• Инсайты для профессионалов;
• Практические советы;
• Тренды и вдохновение;

Подписывайтесь на "ИИчко" и откройте для себя ИИ с новой стороны!

👉 https://t.me/+GgmqRlKrxII5YzQ6
15.04.2025, 11:43
t.me/vistehno/4224
🔥 OpenAI представили сразу три новые модели — 4.1, 4.1 mini и 4.1 nano!

📏 Контекст — до миллиона токенов
💡 Обещают значительные Улучшения в коде
⚡Модели уже доступны через API

💬 На презентации одним промптом собрали веб-приложение для изучения языков.

Честно говоря, выглядит не супер. Практически та же цена, что у Gemini 2.5 Pro (у Gemini дешевле входные токены, что важно), и, насколько мне известно, она не превосходит модели Гугла ни на одном бенчмарке.

Попробовать бесплатно можно здесь

Подробнее

@ai_machinelearning_big_data

#openai #chatgpt
14.04.2025, 20:31
t.me/vistehno/4223
🧠 MineWorld — интерактивная AI-модель мира внутри Minecraft от Microsoft

MineWorld — open-source проект, встраивающий генеративную модель мира прямо в Minecraft. Он создан для тестирования и обучения ИИ в реалистичных виртуальных средах.

🔧 Что умеет:
– Генерация мира в реальном времени
– Обработка Minecraft-данных (блоки, действия, агент)
– Использует токенизированное представление сцен и действий
– Обучается предсказывать будущее состояние мира на основе текущего

⚙️ Используемые технологии:
→ VQ-VAE токенизация визуальных сцен
→ Action tokens (действия игрока)
→ Transformer с автокоррекцией и декодером на несколько кадров вперёд

🧪 Подходит для исследований в области RL, generative world models и интерактивных сред

🔗 Репозиторий: https://github.com/microsoft/MineWorld
14.04.2025, 13:52
t.me/vistehno/4222
🤖 Fourier Intelligence выпустила Fourier N1 — первого полностью open-source гуманоидного робота!

Fourier N1 — это компактный робот ростом 1.3 м и весом 38 кг, способный развивать скорость до 3.5 м/с.

За плечами более 1000 часов полевых испытаний.

🌟 Всё открыто: → список комплектующих (BOM)
→ CAD-чертежи и 3D-модели
→ спецификации приводов
→ управляющий код — на GitHub

⚙️ В основе робота — фирменные приводы FSA 2.0, обеспечивающие высокую устойчивость и манёвренность даже на пересечённой местности.

🔜 Github
🔜Документация (включайте автоперевод)

#ai #robots #opensource
14.04.2025, 13:12
t.me/vistehno/4221
🧼 Убираем вотермарки бесплатно и незаметно — прямо в браузере!

💡 Нейросеть аккуратно стирает всё лишнее и сохраняет изображение в максимальном качестве.

✅ Без регистрации, без ограничений — просто загрузи и забери результат.

https://dewatermark.ai/ru

@vistehno
14.04.2025, 00:17
t.me/vistehno/4220
11.04.2025, 21:56
t.me/vistehno/4219
🌟 Pusa-VidGen — новый подход к генерации видео с точным управлением движением

Обычно в генерации видео модели обрабатывают весь ролик "размазанным" шумом — как бы в целом.

А тут модель управляет шумом отдельно для каждого кадра, и делает это с помощью векторизованных "timesteps" (временных шагов) — более гибко, точно и эффективно.

Новая модель генерации видео на базе Mochi1-Preview и поддерживает:

🔹 Text-to-Video
🔹 Image-to-Video
🔹 Frame Interpolation
🔹 Video Transitions
🔹 Looping, удлинение видео и многое другое

⚡ Эффективность:
▪ 16× H800 GPU
▪ 0.1k GPU-часов
▪ Обучение: 500 итераций, batch size 32
▪ По заявления разработчиков - стоимость обучения всего 100$ 🤯

Github
Paper
Dataset
Model

#diffusion #videogen #pusa #opensource #AI #text2video #mochi1 #fvdm

@vistehno
11.04.2025, 21:56
t.me/vistehno/4218
🎞 На YouTube появился генератор музыки для видео — теперь блогерам будет проще обходить копирайт-проблемы.

Достаточно описать желаемый стиль, и сервис сгенерирует мелодию (пока без вокала).

Функция доступна пользователям, у которых появилась вкладка Music Assistant в YouTube Studio.

@vistehno
11.04.2025, 17:57
t.me/vistehno/4217
🖥 Начиная с сегодняшнего дня, память в ChatGPT стала намного продвинуть — теперь она может учитывать все прошлые чаты, чтобы давать более персонализированные ответы.

• Помнит все интересы и стиль общения пользователя
• Подстраивается под цели: учёба, код, тексты, советы
• Работает незаметно, но помогает как будто «знает пользователя давно»

Это новый уровень взаимодействия с ИИ — теперь он не просто отвечает, а действительно работает как личный ассистент.

Улучшенная память в ChatGPT доступна с сегодняшнего дня всем пользователям Plus и Pro, за исключением Великобритании, Швейцарии, Норвегии, Исландии и Лихтенштейна.

Пользователи Team, Enterprise и Edu получат доступ через несколько недель.

P.S. Память можно настраивать и полностью отключать👌

https://x.com/OpenAI/status/1910378768172212636

@ai_machinelearning_big_data
10.04.2025, 20:22
t.me/vistehno/4216
🎥 ReCamMaster — это передовая система генеративного рендеринга видео, разработанная центром визуальной генерации и взаимодействия компании Kuaishou (KwaiVGI). Она позволяет изменять траектории камеры в существующих видеороликах, создавая новые ракурсы сцены без необходимости повторной съемки. ​

Основные особенности ReCamMaster:

Изменение траектории камеры: Система позволяет перегенерировать видео с новыми движениями камеры, сохраняя исходное содержание и динамику сцены.​

Использование предварительно обученных моделей: ReCamMaster использует возможности предварительно обученных текст-видео диффузионных моделей, что обеспечивает высокое качество генерируемых видео.​

Создание обучающего набора данных: Для обучения модели был создан крупномасштабный синхронизированный видеодатасет с использованием Unreal Engine 5, включающий разнообразные сцены и движения камеры. ​

Применения ReCamMaster:
- Стабилизация видео: Система может сглаживать дрожание камеры в видеороликах, создавая более плавные и стабильные кадры.​

- Суперразрешение и расширение сцены: ReCamMaster способна повышать разрешение видео и расширять границы сцены за пределы исходного кадра.​

- Дополнение данных для ИИ: Система может генерировать видео с различными ракурсами, что полезно для обучения моделей искусственного интеллекта, особенно в области робототехники и автономного вождения. ​

🟡Github: https://github.com/KwaiVGI/ReCamMaster
🟡Paper: https://arxiv.org/abs/2503.11647
🟡Project: https://jianhongbai.github.io/ReCamMaster/
10.04.2025, 14:04
t.me/vistehno/4214
10.04.2025, 14:04
t.me/vistehno/4215
Как сократить расходы на инфраструктуру с GPU?

23 апреля в 12:00 Selectel проведет вебинар для DevOps- и Data-инженеров, техлидов и менеджеров ML-проектов.

Приходите, чтобы обсудить возможности доступных GPU-карт, узнать о кейсах подбора инфраструктуры с GPU и шести способах сократить на неё расходы.

Вебинар бесплатный. Посмотрите полную программу и зарегистрируйтесь по ссылке: https://slc.tl/894wd

Чтобы не пропустить встречу и узнавать о других митапах, воркшопах и бесплатных курсах Selectel, подписывайтесь на @selectel_events

Реклама. АО «Селектел», ИНН 7810962785, ERID: 2VtzqvzgyAR
10.04.2025, 12:04
t.me/vistehno/4213
⚡️ MatMul-Free LM — языковая модель, предлагающая архитектуру, полностью исключающую операции матричного умножения. Этот проект бросает вызов традиционным представлениям, показывая, что LM могут работать на тернарных весах и альтернативных математических операциях.

Интригуют предварительные результаты: согласно данным, модель демонстрирует более крутую кривую масштабируемости по сравнению с обычными трансформерами. Совместимость с Hugging Transformers делает её удобным инструментом для экспериментов в области энергоэффективного ИИ.

🤖 GitHub

@vistehno
9.04.2025, 13:04
t.me/vistehno/4212
В CapCut появилась фича: оживление фото — изображения теперь шевелят губами и показывают эмоции 😱

Тест бесплатный. Работает через IP США.

#CapCut #photoanimation #AI

📌 Попробовать

@vistehno
8.04.2025, 22:29
t.me/vistehno/4211
🎥 Минутное видео по тексту? Новый подход к генерации от исследователей!

Генерация длинных видео — всё ещё вызов для ИИ. Self-attention не тянет по скорости, Mamba — по сложности сюжета. Но тут на сцену выходят TTT-слои (Test-Time Training) — и делают шаг вперёд.

🧠 В чём суть: — TTT-слои умеют использовать выразительные скрытые состояния, которые сами являются нейросетями.
— Их добавляют в уже обученный трансформер — и он начинает генерировать минутные видео по текстовому сценарию с плавным движением и логичной историей.
— Проверяли на мультстиле Tom & Jerry — и получили +34 Elo-балла в человеческой оценке по сравнению с Mamba 2 и другими сильными базовыми методами.

ИИ уже близок к тому, чтобы полностью воспроизводить стили старых мультфильмов или аниме. Это может кардинально изменить производство анимации — вместо создания вручную, студии смогут "дообучать" модель и просто писать сценарии.

Прикрепленное минутное видео, было создано с помощью промпта и обучено на сотнях часов Тома и Джерри.

Вот его полный промпт.

⚠️ Да, пока есть артефакты и ограничения — модель на 5B параметров и только минутные ролики. Но подход уже выглядит перспективным.

Следим за развитием.

📌Demos: http://test-time-training.github.io/video-dit/
📌Paper: http://test-time-training.github.io/video-dit/assets/ttt_cvpr_2025.pdf
📌Github: https://github.com/test-time-training/ttt-video-dit

@data_analysis_ml
8.04.2025, 10:23
t.me/vistehno/4208
8.04.2025, 10:23
t.me/vistehno/4210
8.04.2025, 10:23
t.me/vistehno/4209
🔥 Microsoft запускает бесплатные курсы по ИИ для всех.

Microsoft представила масштабную образовательную инициативу — AI Skills Fest, где каждый может бесплатно освоить навыки работы с ИИ. Программа подходит как новичкам, так и опытным специалистам — от основ ML до работы с Azure и Copilot.

Обучение доступно на 40+ языках, включая русский, а материалы разбиты на модули: введение в ИИ, CV, NLP и создание приложений. Участники, прошедшие курс, получат бейдж для LinkedIn и шанс выиграть один из 50 тысяч сертификационных ваучеров. GitHub также предлагает скидку 50% на экзамен по Copilot для тех, кто завершит их модуль.

Чтобы присоединиться, достаточно зарегистрироваться на сайте Microsoft и выбрать подходящий уровень сложности. Помимо основного блока, доступны хакатоны, форумы и самообучение в удобном темпе.

🟡 microsoft.com

@ai_machinelearning_big_data

#course #ai #ml #freeeducation
8.04.2025, 09:17
t.me/vistehno/4207
😖 Новость дня: учёные из стартапа Colossal воскресили лютоволков из «Игры престолов», живших 12'000 лет назад.

Они собрали ДНК из зуба (13 000 лет) и черепа (72 000 лет), отредактировали 14 генов серого волка и имплантировали эмбрионы суррогатным матерям. Через 65 дней родились три щенка — Ромул, Рем и Дейенерис, которые на 25% крупнее обычных волчат.

В планах Colossal также воскрешение мамонтов, додо, саблезубых тигров и гигантских ленивцев.

#science #cloning #клонирование
7.04.2025, 22:40
t.me/vistehno/4206
⚡️ Я рекомендую вам не ронять ничего перед этим зарядным устройством.

@vistehno
7.04.2025, 14:10
t.me/vistehno/4205
🎮 Microsoft представила нейро-версию Quake II на базе Muse и WHAMM.

Microsoft Research представила WHAMM — новую систему или технологию, предназначенную для моделирования окружающего мира в реальном времени, с особым акцентом на интерактивные среды.

Это означает, что WHAMM способна быстро создавать и постоянно обновлять цифровую 3D-модель физического пространства, учитывая изменения, которые происходят в нем, в том числе в результате взаимодействия пользователя или других динамических событий.

▪ ИИ генерирует кадры в реальном времени, анализируя действия игрока.

▪Старая WHAMM — 1 fps, новая — 10 fps при 640×360, почти играбельно.

Модель помнит последние 0,9 секунды, что добавляет случайности.

Ключевая особенность — система работает достаточно быстро, чтобы обновлять модель мира практически мгновенно по мере поступления новых данных от сенсоров (вероятно, камер, датчиков глубины и т.д.). Это критически важно для плавного взаимодействия.

🔗 Играть в ИИ-версию Quake II можно здесь.

@vistehno

#microsoft #ai #quake #muse
6.04.2025, 12:16
t.me/vistehno/4202
6.04.2025, 12:16
t.me/vistehno/4204
6.04.2025, 12:16
t.me/vistehno/4203
🤖 Новое видео NEO от 1X: полностью автономный робот.

ИИ выполняет различные задачи, а также координирует движения всего тела.

Вместо того чтобы решать одну задачу за раз, 1X тренируется для общей автономности в различных неструктурированных домашних бытовых задачах.
5.04.2025, 13:23
t.me/vistehno/4201
🖥 ​OpenAI меняют планы выпуска моделей: o3 и o4-mini выйдут раньше GPT-5​

Компания планирует выпустить o3 и o4-mini в ближайшие недели, а релиз GPT-5 ожидается через несколько месяцев. ​

По словам Альтмана, это решение обусловлено несколькими факторами:​

- Дополнительное время позволит значительно повысить качество и возможности модели GPT-5. ​

- Компания столкнулась с трудностями при попытке плавно интегрировать различные компоненты, что потребовало пересмотра первоначальных планов. ​

OpenAI пытаются подготовить достаточные мощности для поддержки предполагаемого беспрецедентного спроса на новые модели.

@vistehno
4.04.2025, 18:42
t.me/vistehno/4200
✔️ VideoScene (CVPR'25) — это проект, представляющий собой значительное усовершенствование предыдущей разработки под названием ReconX.

Это модель диффузии видео, которая работает в один шаг и позволяет преобразовывать видео в 3D.

Основное преимущество VideoScene заключается в том, что она превосходит по скорости традиционные многоэтапные процессы, делая переход от видео к трехмерным моделям более эффективным.

▪️Paper: https://arxiv.org/abs/2504.01956
▪️Project Page: https://hanyang-21.github.io/VideoScene
▪️Code: https://github.com/hanyang-21/VideoScene

@vistehno
3.04.2025, 14:31
t.me/vistehno/4199
🤖 Используем BERT для решения NLP задач 

🗓 07 апреля в 18:00 МСК
🆓 Бесплатно. Урок в рамках старта курса «NLP / Natural Language Processing».

Вебинар посвящен такой классической трансформерной модели BERT, которая в свое время совершила революцию в мире Natural Language Processing. На вебинаре вы узнаете, что представлет из себя модель BERT. И как с ее помощью можно легко и эффективно решать разнообразные NLP задачи.

Данный вебинар будет особенно интересен:
- Практикующим Data Scientist и ИТ-специалистам, которые хотят глубже погрузиться в область NLP
- Тем, кто хочет узнать, что делает ChatGPT такой умной
- Людям, освоившими основы машинного обучения, но желающими развиваться в области DS

В результате урока вы:
- Узнаете, устройство модели BERT
- Научитесь дообучать предобученные трансформерные модели
- Научитесь дообучать BERT и работать с ним на практике.

🔗 Ссылка на регистрацию:  https://otus.pw/I62M/?erid=2W5zFGdASGG

#реклама
О рекламодателе
3.04.2025, 13:28
t.me/vistehno/4198
✔️ Google обновляет ряды руководителей ИИ-проектов.

Google объявила о смене руководства в подразделении потребительских приложений искусственного интеллекта: Josh Woodward сменил Sissie Hsiao на посту главы этого подразделения.

Hsiao, который возглавлял потребительские приложения ИИ, в том числе проект Gemini, покидает свой пост с сегодняшнего дня. Согласно инсайду, Sissie возьмет небольшой перерыв, после чего перейдет на новую должность в компании. Woodward, который ранее возглавлял Google Labs и контролировал запуск NotebookLM, продолжит проекты в Google Labs, одновременно взяв на себя новые обязанности. Это изменение происходит по мере того, как в гонке ИИ основное внимание уделяется не базовым моделям, а продуктам, созданным на их основе.
semafor.com

✔️ Nomic выпустила мультимодальные эмбединги для визуального поиска.

Nomic представила Nomic Embed Multimodal — набор опенсорсных эмбединг-моделей для создания векторных представлений текста, изображений, PDF и графиков. Флагманская модель ColNomic Embed Multimodal 7B показала 62.7 NDCG@5 на бенчмарке Vidore-v2, опережая предыдущие решения на 2.8 пункта.

Модели Nomic обрабатывают текст и изображения совместно, избегая сложных пайплайнов с OCR. Это особенно полезно для научных статей, технической документации или мультиязычных документов, где важен контекст.

Модели доступны в двух вариантах: ColNomic (многокомпонентные векторы) для максимальной точности и Nomic (одновекторные) для экономии ресурсов. Модели доступны на Hugging Face, а разобраться помогут гайды и ноутбуки Google Colab.
nomic.ai

✔️ Китайские ИТ-гиганты заказали чипов Nvidia на 16 млрд. долларов в первом квартале 2025 года.

ByteDance, Alibaba Group и Tencent Holdings разместили заказы на общую сумму более 16 миллиардов долларов на серверные чипы H20 AI от Nvidia в первом квартале 2025 года. Такой резкий рост спроса происходит на фоне опасений, что администрация США может наложить запрет на продажу этих чипов в Китай, ссылаясь на вопросы национальной безопасности.

H20 - самый доступный чип Nvidia для продажи в рамках действующих экспортных ограничений, которые запрещают передачу более мощных моделей китайским компаниям. Значительные заказы из Китая ставят Nvidia в сложное положение, поскольку она лавирует между возможностями для бизнеса и потенциальными геополитическими рисками.
theinformation.com

✔️ Google DeepMind опубликовали 145-страничный документ об ответственном развитии ИИ.

Google DeepMind выпустила подробный документ "Ответственный путь к AGI", в котором излагается технический план безопасного развития искусственного интеллекта общего назначения.

В документе подчеркивается важность устранения потенциальных рисков неправильного использования и несоответствия, связанных с технологией AGI. Несмотря на детальный подход, некоторые аналитики полагают, что документ может не полностью убедить скептиков в надежности и безопасности разработки AGI.
deepmind.google

✔️ Epic Games купит стартап Loci чтобы автоматизировать разметку 3D-контента.

Epic Games объявила о приобретении стартапа Loci, чья ИИ-платформа упрощает работу с 3D-ассетами. Технология автоматически генерирует теги для моделей, экономя время создателей на ручную разметку. Это особенно актуально для проектов с тысячами объектов — например, в Fortnite, где игроки добавляют элементы из популярных франшиз, провоцируя споры об авторских правах.

ИИ Loci не только ускоряет поиск и организацию контента, но и помогает выявлять нарушения интеллектуальной собственности. Loci будет интегрирован в экосистему Epic, в том числе в Unreal Editor для Fortnite и маркетплейс Fab, где продаются цифровые активы. Таким образом, разработчики получат инструменты для предотвращения юридических конфликтов и упрощения рабочих процессов.
epicgames.com

@ai_machinelearning_big_data

#news #ai #ml
3.04.2025, 09:48
t.me/vistehno/4197
«Бегущий по лезвию 2049»: BYD и DJI запустили продажи системы для запуска дронов с крыши автомобилей. Дрон снимает пейзажи, делает эффектные пролёты рядом с машиной и помогает на бездорожье. Взлёт — прямо с крыши.

@vistehno
2.04.2025, 14:47
t.me/vistehno/4196
🎲 OPPO X³ — первый в мире смартфон в форме кубика-кубика!

Вы готовы мыслить нестандартно?
1.04.2025, 15:19
t.me/vistehno/4195
🤖 У робота Unitree появились очень ловкие руки.

Прогресс в робототехнике невероятно стремительный.
1.04.2025, 14:52
t.me/vistehno/4194
Пользователь искал кемпинги на берегу озера в пределах 150 км от Вены и хотел проверить близость к полям для гольфа, где имелись скидочные купоны и забил запрос в manus

ИИ создал веб-сайт со списком вариантов, интерактивной картой и ссылками для бронирования!

@vistehno
31.03.2025, 17:11
t.me/vistehno/4193
Топ-100 нейросетей для любых задач — откопали на Reddit таблицу с самыми свежими инструментами.

Пост

@vistehno
31.03.2025, 15:12
t.me/vistehno/4192
⚡️ 10 open-source генераторов видео достойных вашего внимания (text-to-video и image-to-video)

1) HunyuanVideo (text-to-video)

Флагманская модель от Tencent (~13B параметров), обеспечивает высокое качество качество и реализм.

Категория: подходит для генерации реалистичных видео

▪Ресурсы: 45–80 ГБ VRAM, A100/H100, поддержка FP8

🟡Ссылка

2) Mochi (text-to-video)

Описание: модель от Genmo (~10B параметров), быстрая и мощная

▪Категория: реализм + плавность движения

▪Бенчмарки: качество почти на уровне Hunyuan, 30 FPS

▪Кейсы: реклама, креативы, short-видео

▪Ресурсы: Для работы модели требуется не менее 4 GPU H100., поддержка LoRA, FP8

🟡Ссылка

3) Wan2.1 (text/image-to-video)

▪Описание: универсальный генератор от Alibaba (до 14B параметров)

▪Категория: синтез движений, анимация изображения

▪Бенчмарки: высокая стабильность, особенно в SkyReels.

▪Кейсы: оживление изображений, видеопрототипы

▪Ресурсы: 12–24 ГБ VRAM (1.3B и 14B версии)

🟡Ссылка

4)​LTX-Video-Trainer

Проект, предоставляющий инструменты и скрипты для обучения и дообучения модели LTX-Video от компании Lightricks.

▪Категория: с его помощью можно обучать адаптеры LoRA поверх LTX-Video, а также выполнять полное дообучение модели на ваших датасетах.

▪Ресурсы: не менее 12 ГБ GPU для эффективного обучения и дообучения модели. RaM: Минимум 16 ГБ;

🟡Ссылка


5) Pyramid Flow (text/image-to-video)

▪Описание: модель на базе Flux для генерации длинных видео (до 10 сек, 768p)

▪Категория: длительные сцены, плавные переходы

▪Бенчмарки: превосходство в motion stability

▪ Кейсы: нарративные ролики, контент для соцсетей

▪ Ресурсы: 12–48 ГБ VRAM

🟡Ссылка

6) CogVideo / CogVideoX (text-to-video)

▪Описание: трансформер на 9B/5B параметров от THU

▪Категория: стилизация, универсальность

▪ Бенчмарки: сильные CLIP/FVD, хорошая временная согласованность

▪ Кейсы: мультфильмы, обучающее видео, стилизованные ролики

▪Ресурсы: 20–24 ГБ VRAM, оптимизирован под FP8

🟡Ссылка

7) Step-Video-TI2V

Модель для генерации видео (до 102 кадров), производительностью SOTA.
Принимает на вход текстовые описания и изображения.

▪Бенчмарки: на VBench-I2V показывает лучшие результаты по сравнению с другими современными открытыми моделями для генерации видео из изображения и текста, а также лидирует в публичном рейтинге.

🟡Ссылка

8) AnimateDiff

Ветеран этого списка.

▪Категория: анимация, стилизация

▪Бенчмарки: высокая согласованность между кадрами

▪Кейсы: оживление арта, анимированные сцены

▪Ресурсы: от 8 ГБ VRAM, масштабируется до 24 ГБ для высокого качества

🟡Ссылка

9) Easy Animate (image-to-video)

▪Описание: генерация видео из одного кадра (Alibaba, EasyAnimate V5)

▪Категория: анимация изображения

▪Бенчмарки: стабильная идентичность объекта, плавность

▪Кейсы: оживление фото, персонажей, иллюстраций

▪Ресурсы: минимум 12–24 gb CPU

🟡Ссылка

10) Open-Sora Plan (и связанные проекты)

▪Описание: Это не одна конкретная модель, а скорее инициатива разработчиков (и несколько независимых проектов) по созданию и обучению open-source модели

▪Бенчмарки: Пока находятся в активной разработке. Сильная сторона - открытость и амбициозная цель. Результаты варьируются, но быстро улучшаются.

▪Ресурсы: Требования сильно зависят от конкретной реализации и этапа проекта.

📌 Подробное описание моделей

Добавляйте в комментариях ссылки генераторы, которыми вы пользуетесь 👇

#ai #video #videogenerator #ml
30.03.2025, 20:13
t.me/vistehno/4191
Мобильный робот, который может летать! 🐝

DoubleBee — новый робот, разработанный в Наньянском технологическом университете в Сингапуре, который может как летать, так и передвигаться по земле, используя два наклонных пропеллера и два колеса.

В воздухе он летает эффективно, как бикоптер, а на земле он балансирует, как двухколесный робот, экономя энергию. На земле пропеллеры помогают контролировать его равновесие, а колеса управляют движением, облегчая управление.

DoubleBee может перемещаться в сложных условиях, перелетать через препятствия, проползать под ограждениями и взбираться на крутые склоны.

@vistehno
30.03.2025, 13:12
t.me/vistehno/4190
✔️ DeepSite на базе DeepSeek-V3-0324, позволяет генерировать, код, приложения или игры прямо в браузере и хостить их.

Сгенерировал парочку простеньких HTML-игр с интерфейсом, работает годно.

😶 По сути это Сursor в браузере.

🟡Попробовать: https://huggingface.co/spaces/enzostvs/deepsite

@ai_machinelearning_big_data


#deepseek #vibecoding #app
28.03.2025, 22:10
t.me/vistehno/4189
🖥 «Синьхо» (Xinghuo) – это амбициозный китайский проект экспериментальной электростанции, которая совмещает термоядерный синтез и ядерное деление в одном реакторе. Идея гибридного реактора заключается в том, что нейтроны от реакции синтеза запускают реакцию деления, объединяя преимущества обоих процессов​.

Такой подход позволяет:
Получить высокий выход энергии: за счёт дополнительной энергии деления реактор рассчитан на рекордный коэффициент усиления Q > 30, то есть вырабатывать энергии в 30 раз больше, чем затрачивается на нагрев плазмы​

Сократить ядерные отходы: использование нейтронов синтеза позволяет более полно «сжигать» ядерное топливо. Ожидается, что это увеличит энергоотдачу и уменьшит количество долгоживущих радиоактивных отходов по сравнению с обычными АЭС​.

Применить новые технологии: реактор проектируется на базе высокотемпературных сверхпроводящих магнитов для магнитного удержания плазмы​

Это новейший подход в термоядерной энергетике, позволяющий создавать более сильное магнитное поле с меньшими энергопотерями.
Название «Синьхо» переводится с китайского как «Искра», отсылая к известной цитате Мао Цзэдуна: «от одной искры вспыхнет степь»​

«Синьхо» расширит границы исследований в физике плазмы, материаловедении и реакторостроении. Сам факт запуска такого комплекса предоставит уникальные данные о поведении плазмы в длительном режиме, о взаимодействии нейтронов синтеза с топливом деления и материалами конструкции. Этот проект послужит испытательным полигоном для новых технологий (сверхпроводники, новые топливные циклы), знания с которого смогут использовать ученые и инженеры по всему миру. Успешная работа «Синьхо» подтвердит принципиальную реализуемость гибридного подхода, что повлияет на дизайн будущих крупномасштабных термоядерных проектов во всём мире​

Это важный, но промежуточный этап в развитии термоядерной энергетики. Речь идёт не о совершившейся научной сенсации, а о начале строительства уникального реактора.

Сам по себе запуск проекта «Синьхо» – значимое событие: Китай официально приступил к реализации первой в мире гибридной термоядерной электростанции. Это свидетельствует о серьёзном прогрессе и намерениях, однако до настоящего прорыва ещё предстоит путь. Впереди годы инженерных работ и испытаний: только после 2030 года станет ясно, оправдаются ли высокие ожидания. Таким образом, новость скорее подчеркивает тенденцию и лидерство Китая в этой сфере, чем сообщает о готовом технологическом чуде.
Если «Синьхо» успешно заработает, это станет поворотным моментом для науки и энергетики. Но пока это смелый эксперимент – этап на пути к цели, за ходом которого будет внимательно следить весь мир.

🔗 Статья

@vistehno
28.03.2025, 20:23
t.me/vistehno/4188
✔️ R²D²: набор решений для робототехники от NVIDIA.

NVIDIA Research предлагает 4 решения: MobilityGen генерирует синтетические данные в Isaac Sim, экономя время на сбор реальных данных, COMPASS создаёт универсальные алгоритмы передвижения для роботов любого типа — от двуногих до колесных, обеспечивая мгновенное внедрение из симуляции в реальность.

Для гуманоидов важен контроль всего тела: HOVER объединяет управление балансом, движением и манипуляциями в единую нейросеть, а ReMEmbR добавляет «память» — робот анализирует окружение с помощью ИИ-моделей (LLM, VLM) и действует на основе контекста.

Уже сейчас эти решения тестируют компании Under Control Robotics и Advantech: роботы собирают данные, перемещают грузы и избегают препятствий в динамичных условиях. Для разработчиков доступны исходники на GitHub и набор учебных материалов.
developer.nvidia.com

✔️ Google анонсировала ИИ-инструменты для планирования путешествий.

Google тизернула набор функций с ИИ для организации летних поездок. В Поиске теперь доступны AI Overviews — сводки, которые генерируют маршруты по запросам вроде «создать план поездки в Коста-Рику с акцентом на природу». В Gemini появился инструмент, позволяющий настраивать «экспертов» под конкретные задачи — например, для подбора направлений или списка вещей в дорогу. Отдельное внимание уделили отслеживанию цен: теперь, кроме авиабилетов, система уведомит о снижении стоимости отелей через email.

Обновление коснулось и Google Maps: приложение научилось анализировать скриншоты с сохраненными локациями. Достаточно открыть доступ к фото — и ИИ автоматически распознает места, предложив добавить их в список.

Пока функция доступна в США на iOS, версия для Android ожидается в ближайшее время.
techcrunch.com

✔️ Garmin запустил платный сервис с ИИ-аналитикой.

Garmin открыла платную подписку Connect+ за $7 в месяц, предлагающую ИИ-функции для анализа тренировок - персонализированные рекомендации, дашборд эффективности и советы для бегунов и велосипедистов. Сервис использует историю активности, чтобы оптимизировать прогресс и уведомления LiveTrack для безопасности.

В отличие от Strava (от $12/месяц), Garmin сохраняет доступную цену, делая AI-инструменты привлекательнее для любителей и профи. Хотя часть пользователей критикует переход на монетизацию, 30-дневный тест-период позволяет оценить новинку.
gizmodo.com

✔️ Vamba: новая архитектура для анализ длинных видео.

Vamba — гибридная архитектура на основе Mamba и Transformer для обработки длинных видео. Она позволяет анализировать до 100 тыс. видеотокенов без сжатия, сохраняя ключевые сцены и действия. За счёт замены части операций на модули Mamba-2, сложность вычислений снижается с квадратичной до линейной, что ускоряет обучение в 2 раза и сокращает потребление памяти на 50%.

В тестах На LVBench Vamba обошла конкурентов по точности (плюс 4,3%) и по стабильности обработки: даже при 512 кадрах потребление памяти не превышала 12 ГБ. Дополнительные тесты на датасетах с шумом и динамичными сценами доказали, что архитектура сохраняет детализацию без «провалов» в сложных условиях. Модель уже доступна в открытом доступе — код, веса.
tiger-ai-lab.github.io

✔️ Apple обновила Final Cut: поддержка Apple Intelligence и новые инструменты.

Apple выпустила обновления для Final Cut Pro на Mac, iPad и приложения Final Cut Camera. Главным новшеством стала интеграция Apple Intelligence: теперь в Image Playground можно быстро генерировать стилизованные изображения на основе описаний или фото из библиотеки.

Для Mac добавлены коррекция цвета, аудиоэффект Quantec QRS и улучшенный Magnetic Mask. На iPad появилась портретная ориентация и хоткеи для монтажа. Final Cut Camera обзавелась переключением на 48-мм телеобъектив (для iPhone 14 Pro и новее), поддержкой Apple Log LUT и записью в Spatial Audio (требуется iPhone 16).

Технические требования: macOS 15.2 и новее для Mac на M1+, iOS 18.2 для устройств с A17 Pro/M1.
9to5mac.com

@ai_machinelearning_big_data

#news #ai #ml
28.03.2025, 10:51
t.me/vistehno/4187
Робот Unitree демонстрирует свои возможности на показе мод в Шанхае, знаменуя наступление будущего.

@vistehno
27.03.2025, 17:40
t.me/vistehno/4186
🤖 ChatGPT VS DeepSeek

Приглашаем на открытый урок.

🗓 01 апреля в 18:00 МСК
🆓 Бесплатно. Урок в рамках старта курса «NLP. Advanced».

ChatGPT, DeepSeek, Gemini… Что у них внутри и какие технологии их создают?

На открытом уроке разберем архитектуру современных LLM, методы их обучения и принципы, которые двигают индустрию NLP вперед.

Спикер Мария Тихонова – PhD Computer Science, Senior Data Scientist в SberDevices и преподаватель ВШЭ.

Если вы хотите глубже понять работу LLM, разобраться в ключевых концепциях DeepSeek и узнать о будущих трендах, этот вебинар для вас.

Участвуйте и получите скидку для обучения на курсе «NLP. Advanced».

🔗 Ссылка на регистрацию: https://otus.pw/ATev/
27.03.2025, 15:40
t.me/vistehno/4185
📹 Топ-15 технических YouTube-каналов для изучения ИИ с нуля:

1) Andrej Karpathy — сочетание общего и технического контента, плейлист "Zero to Hero" обязателен к просмотру

2) Uproger — доступные уроки по программированию и ИИ, идеально для начинающих и тех, кто хочет углубить свои знания.

3) Umar Jamil — технический блог, где автор реализует методы ML и LLM с нуля

4) Simon Oz — технические видео по низкоуровневому машинному обучению

5) Tunadorable — отличные обзоры научных статей, реализация

6) GPU Mode — технические интервью и разборы всего, что связано с GPU

7) AI Jason — эксперименты с ИИ, дизайн ПО и новые модели, с понятным и полным разбором.

8) Ferdinand Mom — всё о распределённом обучении и выводах

9) Welch Labs — уникальный глубокий взгляд на комплексность алгоритмов машинного обучения.

10) Artem Kirsanov — нейронаука и машинное обучение с необычного авторского взгляда + отличная визуализация контента.

11) David Ondrej — новые модели, создание приложений с ИИ, практично для разработчиков https://t.co/BEOr0MgHag @DavidOndrej1

12) 3Blue1Brown
Потрясающие визуализации, которые делают абстрактные математические концепции понятными и интуитивными.

13) Lex Fridman
Глубокие беседы с лидерами индустрии ИИ, позволяющие получить широкий взгляд на современные тенденции.

14) Machine Learning Street Talk
Технические погружения и обсуждения с ведущими исследователями в области ИИ и машинного обучения.
Ссылка:

15) StatQuest with Joshua Starmer PhD
Доступные и понятные объяснения основ машинного обучения и статистики для начинающих.

Этот список для технической аудитории. Очень сложно выбрать всего 15 каналов, ведь есть множество других, создающих отличный контент.

Если знаете ещё каналы, дайте пишите в комментариях!

@vistehno
27.03.2025, 14:53
t.me/vistehno/4184
⚡️ ​Ideogram 3.0 — это последняя версия генеративной модели от компании Ideogram AI.

Генератор обеспечивает высокий реализм изображений, креативность и поддерживает качество рендеринга текста.

Согласно внутренним оценкам, Ideogram 3.0 превосходит другие текст-изображение модели по широкому спектру задач.

Одной из ключевых фишек Ideogram 3.0 является "Style References", позволяющая пользователям загружать до трех референсных изображений для генерации контента в заданном стиле.

ЭТО упрощает создание изображений с трудноописуемой текстом эстетикой, ускоряя и делая более выразительным творческий процесс.

Для вдохновения доступна функция случайного выбора стиля из библиотеки из 4,3 миллиарда пресетов, а понравившиеся стили можно сохранить и повторно использовать с помощью их уникальных кодов.

Кроме того, Ideogram 3.0 предлагает расширенные возможности генерации текста и макетов для графического дизайна, рекламы и маркетинга. Модель способна создавать стилизованный и точный текст с высокой точностью, включая сложные и длинные композиции, с которыми другие модели испытывают трудности. Созданный текст отличается красотой и художественностью, превосходя возможности традиционных дизайнерских платформ.

Ideogram 3.0 доступна для всех пользователей на платформе ideogram.ai и в приложении для iOS. Доступно 2 генерации на бесплатном тарифе, $20/мес.

🎯 Блог
26.03.2025, 19:52
t.me/vistehno/4183
26.03.2025, 12:39
t.me/vistehno/4181
26.03.2025, 12:39
t.me/vistehno/4182
🎮 DOOM запустили на советском трамвае — настоящий гений оживил классику на модели ЛМ-68М2 «Ретро»: теперь демоны из ада атакуют прямо в кабине водителя.

USB, конечно, не завезли, так что клавиатуру пришлось подключать через старый PS/2.

Дед точно оценит!

@vistehno
26.03.2025, 12:39
t.me/vistehno/4180
⚡️ Google представил свою самую мощную нейросеть — новая «думающая» Gemini 2.5 Pro опережает всех конкурентов.

🚀 Пишет код на уровне сеньора с 10-летним опытом, решает любые математические задачи и, что самое главное, бесплатна.

Пробуем можно в AI Studio.
25.03.2025, 21:18
t.me/vistehno/4177
25.03.2025, 21:18
t.me/vistehno/4179
25.03.2025, 21:18
t.me/vistehno/4178
✔️ Ant Group использует китайские чипы для снижения стоимости обучения моделей на 20%

Ant Group успешно использовала хардверные решения от Alibaba и Huawei для обучения своих моделей, что позволило сократить затраты примерно на 20%. Результаты тестов показали, что китайские чипы сопоставимы по производительности с Nvidia H800. Хотя Ant Group пока полностью не отказывается от Nvidia для разработки ИИ, ее последние разработки в основном полагаются на альтернативные решения - AMD и чипы китайского производства.

Это свидетельствует о том, что китайские компании ускоряют локализацию технологий искусственного интеллекта, чтобы сократить затраты и уменьшить зависимость от американских чипов.
bloomberg.com

✔️ В Италии запущена первая в мире газета, созданная ChatGPT.

Итальянская газета Il Foglio начала месячный эксперимент, опубликовав первый в мире газетный выпуск, сгенерированный искусственным интеллектом. Цель эксперимента - изучить влияние ИИ на журналистику, используя ChatGPT для создания контента.

Редактор газеты Клаудио Сераса заявил, что ИИ использовался на всех этапах создания - от написания текстов и заголовков до цитат и резюме, при этом журналисты редакции участвуют в создании промптов для ИИ и проверке сгенерированных текстов.
asianfin.com

✔️ ARC Prize запускает бенчмарк ARC-AGI-2 с призовым фондом в 1 миллион долларов.

Команда ARC Prize запустила 2 этап бенчмарка ARC-AGI-2 для оценки «гибкости мышления» ИИ через задачи, которые человек решает за секунды, а алгоритмы — с трудом. Как и в прошлой версии, система проверяет способность к обобщению знаний, но теперь барьер выше: на нем базовые LLM набирают 0%, а продвинутые — меньше 4%. Призовой фонд бенчмарка -1 млн. долларов, главный приз получит разработка, которая сможет превысить 85% выполнения бенчмарка.

Решение задач ARC-AGI-2 требует интуиции и адаптивности — того, что в людях заложено природой. «Это не тест на эрудицию, а проверка умения мыслить вне данных», — поясняют разработчики.
arcprize.org

✔️ Поисковая система Atlantic позволит проверить, использовалась ли ваша работа для обучения моделей.

Компания The Atlantic разработала поисковый инструмент, позволяющий пользователям проверить, не фигурирует ли их работа в LibGen - архиве книг, научных работ и статей, который, как сообщается, использовался для обучения популярных языковых моделей.

Согласно судебным документам, набор данных LibGen использовался для обучения моделей Llama. OpenAI уже публично сообщила, что контент LibGen не включен в текущие версии ChatGPT или в API OpenAI. Другие компании, занимающиеся разработкой ИИ, пока не комментировали, использование LibGen в своем обучении.
theatlantic.com

✔️ OceanDS: 1,8 млрд. данных об океане стали основой первой океанографической LLM.

Китайская модель OceanDS, созданная для морских исследований, опирается на уникальную базу из 1,8 млрд токенов данных. В неё вошли оцифрованные научные работы, книги и отчёты — всё, что касается океана.

По тестам OceanDS обходит топовые LLM в точности ответов на профильные запросы — разрыв достигает 25%. Это первый в мире ИИ, заточенный под океанографию. Уже сейчас его тестируют в управлении природными ресурсами Китая, а в будущем — внедрят в другие отрасли.
news.cgtn.com

@ai_machinelearning_big_data

#AI #ML #Research #NLP
25.03.2025, 13:04
t.me/vistehno/4176
«Ошибка на миллиард» в ИИ

«Ошибка на миллиард долларов» — это популяризованное ученым Чарльзом Э. Хоаром название для null pointer exception. В большинстве классических языков программирования переменная, якобы содержащая объект какого-то класса, на самом деле может ничего не содержать.

В мире генеративных нейросетей «ошибкой на миллиард» можно назвать галлюцинации LLM. «Творческая натура» больших языковых моделей играет со строгими задачами злую шутку: в любой непонятной ситуации модель принимается фантазировать на основе претрейна.

Старший инженер по разработке ПО искусственного интеллекта в YADRO описал метод, который использовал, чтобы значительно снизить галлюцинации в выдаче модели.

Читать статью →
25.03.2025, 11:07
t.me/vistehno/4175
🧠 Neuralink с открытым исходным кодом с использованием активности мозга обезьяны для управления роботизированными руками 🙉

Проект Jenkins исследует интерфейсы мозг-компьютер путем декодирования нейронной активности в движения роботов и генерации синтетических мозговых данных.

Используя нейронные записи мозговой активности обезьяны по имени Дженкинс, исследователи разработали модели для преобразования мозговых сигналов в движения роботизированной руки.

В проекте используются роботизированные руки и интерактивная веб-консоль для генерации данных о работе мозга в режиме реального времени с помощью джойстика.

Исследование открывает путь к созданию адаптивных интерфейсов «мозг-компьютер» за счет гибкого моделирования активности мозга.

Github

@vistehno
24.03.2025, 13:00
t.me/vistehno/4174
Сотрудники Авито ведут свой telegram-канал ⭐️

И знаете, получается мега-лампово и увлекательно. Всего через несколько постов начинаешь уже чувствовать себя частью их уютного офиса: рядом — знакомые весёлые коллеги из постов, и вам точно есть что обсудить.

А вообще хвалим и одобряем. Во-первых, смело и интересно. Во-вторых, для тех, кто рассматривает работу в компании, это возможность изучить культуру и вайб команды ещё до трудоустройства.

🔥 Однозначно подписка — @avito_life
🔥🔥 Если думаешь о работе в Авито, то добавляй сразу — @avito_career
24.03.2025, 11:02
t.me/vistehno/4173
🌟 Интересная визуализация для быстрого запоминания азбуки Морзе!

@vistehno
23.03.2025, 17:05
t.me/vistehno/4172
🌅 HunyuanVideo-I2V

HunyuanVideo-I2V – это модель с открытым исходным кодом, предназначенная для создания видео на основе изображений, разработанная с активным участием сообщества.

В репозитории доступны реализации на PyTorch, предобученные веса и код для инференса. Для стабильной работы модели требуется NVIDIA GPU с поддержкой CUDA и не менее 80 ГБ видеопамяти. Кроме того, модель оснащена широким спектром настроек, позволяющих повысить качество генерируемого видео.

📌 Github

@vistehno
22.03.2025, 19:02
t.me/vistehno/4171
22.03.2025, 15:04
t.me/vistehno/4168
22.03.2025, 15:04
t.me/vistehno/4170
22.03.2025, 15:04
t.me/vistehno/4169
📌Ученые обнаружили сходство между мозгом человека и нейросетями в принципах обработки языка.

Совместное исследование Google Research, Принстонского университета, NYU и Еврейского университета в Иерусалиме нашло параллели в обработке естественного языка человеческим мозгом и большими языковыми моделями.

Используя внутричерепные электроды, ученые зафиксировали нейронную активность во время спонтанных диалогов и сравнили ее с внутренними представлениями модели Whisper, разработанной для преобразования речи в текст. Оказалось, что речевые эмбеддинги Whisper коррелируют с активностью в слуховых зонах мозга, а языковые — с областями, ответственными за семантику.

Эксперименты подтвердили догадки: при восприятии речи сначала активируется верхняя височная извилина (STG), обрабатывающая акустические сигналы, а через несколько сотен миллисекунд включается зона Брока (IFG), связанная с декодированием смысла. При воспроизведении речи последовательность обратная: IFG активируется за 500 мс до артикуляции, затем моторная кора планирует движение, а после произнесения слова STG «проверяет» результат. Эти паттерны совпали с динамикой эмбедингов Whisper, хотя модель не обучалась на нейробиологических данных.

Другое интересное совпадение - мозг и LLM используют предсказание следующего слова как ключевую стратегию. Как показали опыты, слушатель бессознательно предугадывает следующие слова, а ошибка предсказания вызывает «нейронное удивление» — механизм, аналогичный обучению с подкреплением в ML. Но архитектурные механизмы у мозга и LLM разные: трансформеры обрабатывают сотни слов параллельно, тогда как мозг анализирует информацию последовательно.

Несмотря на общую «мягкую иерархию» обработки (например, смешение семантических и акустических признаков в IFG и STG), биологические структуры мозга принципиально отличаются от нейронных сетей.

Исследователи подчеркивают: языковые модели (типа ChatGPT) не понимают, как люди общаются в реальной жизни (например, не чувствуют эмоций или культурных особенностей), и не учатся так, как это делает мозг человека с детства. Однако их эмбединги оказались очень полезными для изучения того, как мозг обрабатывает речь.

Ученые надеются, что эти открытия помогут создать нейросети, которые смогут обучаться как люди — медленно, шаг за шагом. А пока Whisper, неожиданно стал «зеркалом» принципов нашего мышления. Кто знает, может, через пару лет ИИ начнёт шутить с нами за чашкой кофе — как друг или коллега по работе.

🟡Статья
🟡Исследование


@ai_machinelearning_big_data

#AI #ML #Research #NLP
22.03.2025, 15:04
t.me/vistehno/4167
Трамп очень высоко оценил IT-навыки своего сына Бэррона

«Я выключаю его компьютер, а через 5 минут он снова работает! Как он это делает? У него потрясающие отношения с технологиями!» - заявил Трамп.

Мальчику всего 19 годиков.

@vistehno
21.03.2025, 19:43
t.me/vistehno/4166
😞 А ведь он просто хотел завести новых друзей...

@vistehno
21.03.2025, 12:16
t.me/vistehno/4165
💬 OPEN AI добавили API 3 новых SOTA аудио-модели.

🗣️ Две модели преобразования речи в текст, которые, как заявляют разработчики, превосходят Whisper.

💬 1 Новая модель TTS - которой можно указать *как* ей говорить.
Поддерживает функцию задания интонации, тона, тембра голоса и еще множества других параметров с помощью промпта.

🤖 Еще OpenAi выпустили Agents SDK, который для создания голосовых агентов.

Через час состоится стрим, где покажут примера создания голосовых агентов с новыми аудиомоделями.

📌 Потестить можно здесь: https://www.openai.fm/

🔥 Стрим Open AI - Создание голосовых агентов с новыми аудиомоделями

https://openai.com/live/
20.03.2025, 21:56
t.me/vistehno/4164
📡 Запущен первый спутник FireSat, который поможет раньше обнаруживать небольшие лесные пожары.

FireSat, новый прототип спутника обнаружения лесных пожаров, запущен на Falcon 9 компании SpaceX! Высококачественные изображения, обновляемые каждые 20 минут, скоро помогут обнаруживать лесные пожары размером 5x5 м по всему миру.

📌 Читать

#news #ai #ml
20.03.2025, 17:04
t.me/vistehno/4163
Хотите получить много практики на реальных задачах, собрать портфолио и узнать как выглядит рабочий день аналитика?

CEO Simulative и эксперт с большим опытом в аналитике, Андрон Алексанян организовал бесплатный интенсив, где вы будете решать реальные задачи, с которыми аналитики сталкиваются на работе

На прямых эфирах вы сделаете:
🟠Анализ активности пользователей с помощью SQL
🟠Анализ маркетинговых активностей с помощью Python
🟠ABC анализ ассортиментной матрицы в Excel (уже прошел, но вам будет доступна запись)

Во время эфиров вы узнаете много лайфхаков, а также будете получать полезные материалы для развития в аналитике на протяжении всего интенсива

❗️Знать Python и SQL не обязательно — все будем разбирать с нуля

🕗 Встречаемся на новом эфире уже сегодня, 20 марта в 19:00 по мск

😶Участвовать в бесплатном интенсиве
20.03.2025, 15:04
t.me/vistehno/4162
20.03.2025, 14:07
t.me/vistehno/4161
🌟 KBLaM: новая архитектура интеграции знаний для языковых моделей от Microsoft Research.

Microsoft Research представила KBLaM - архитектуру, которая решает ключевую проблему LLM — добавление новых внешних знаний. В отличие от традиционных методов файнтюна и RAG, KBLaM кодирует новые для LLM структурированные данные в виде векторных пар «ключ-значение», встраивая их напрямую в слои внимания модели. Это позволяет избежать дорогостоящего дообучения и построение дополнительных модулей, сохраняя линейную масштабируемость даже для баз знаний в 10 000 триплетов.

В KBLaM триплет — это структурированный элемент знания, состоящий из трех компонентов: сущности, свойства и значения. Например, в утверждении «Москва — столица России» сущностью выступает «Москва», свойством — «столица», а значением — «Россия».

В основе KBLaM - «прямоугольный механизм внимания»: языковые токены взаимодействуют с токенами знаний, но не наоборот. Такая структура сокращает вычислительные затраты до линейных, позволяя обрабатывать эквивалент 200 тыс. токенов на одном GPU. При этом модель динамически обновляет знания без пересчёта всей базы — достаточно изменить один триплет.

Эксперименты с KBLaM показали, что он не только эффективен, но и прозрачен: веса внимания визуализируют, какие факты использует модель. Например, при запросе о медицинском диагнозе высокие оценки внимания к соответствующим триплетам снижают риск «галлюцинаций», при этом, если ответ на запрос лежит вне базы знаний, модель отказывается на него отвечать.

Как заявляют авторы, KBLaM — не просто шаг к умным LLM, а мост между обученными на базовых знаниях моделями и реальным миром, где знания постоянно обновляются.

В опубликованном на Github коде для применения KBLaM поддерживаются модели с HF:

🟢Llama-3-8B-Instruct;
🟢Llama-3.2-1B-Instruct;
🟢Phi-3-mini-4k-instruct.

и эмбединги для генерации базы знаний:

🟠text-embedding-ada-002;
🟠all-MiniLM-L6-v2.

⚠️ Чтобы добавить поддержку других моделей, необходимо отредактировать скрипты обработки моделей и включить в них адаптер, подобный llama_model.py в src/kblam/models.


📌Лицензирование: MIT License.


🟡Статья
🟡Arxiv
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #LLM #MicrosoftResearch #KBLaM
20.03.2025, 14:07
t.me/vistehno/4157
20.03.2025, 14:07
t.me/vistehno/4160
20.03.2025, 14:07
t.me/vistehno/4159
20.03.2025, 14:07
t.me/vistehno/4158
20.03.2025, 12:40
t.me/vistehno/4155
20.03.2025, 12:40
t.me/vistehno/4156
🔥 Claude теперь интегрирован в Unity, Blender и Unreal Engine — MCP-плагины остаются в центре внимания! Теперь для создания игры достаточно лишь клавиатуры.

Claude в Unity— генерирует геймплейные механики (физику, цели, таймеры), окружение, эффекты, интерфейсы, миникарты и многое другое.

Claude в Blender — мгновенно создаёт 3D-модели и сцены, превращает фотографии в игровые локации и редактирует их по вашим командам.

Claude в Unreal Engine — создаёт объекты, задаёт им форму и разрабатывает их логику всего за несколько минут.

Сохраняйте и пробуйте в деле! 🚀
20.03.2025, 12:40
t.me/vistehno/4154
🤖 Новые тренды среди последних LLM

🗓 24 марта в 18:00 МСК
🆓 Бесплатно. Урок в рамках старта курса «NLP / Natural Language Processing».

LLM и трансформерные модели такие как ChatGPT, GPT4, GigaChat стали не только стандартом в области языкового моделирования, но и незаменимыми помощниками для решения огромного числа задач: от написания кода, до генерации сказок.
На вебинаре мы расскажем про последние тренды в этой области: чего уже достигли современные LLM сегодня и что нас ждет в ближайшем будущем.

Данный открытый урок будет особенно интересен:
- IT-специалистам, которые хотят расширить свои знания в Data Science
- Дата-сайентистам, желающим углубить свои знания по автоматической обработке текстов
- Тем кто самостоятельно изучает Data Science

В результате вебинара вы:
- поймете основные технологии за современными LLM сегодня
- узнаете про основные тренды в области больших языковых моделей
- узнаете, что ждет область LLM в ближайшие годы

🔗 Ссылка на регистрацию: https://otus.pw/DSIV/
20.03.2025, 10:40
t.me/vistehno/4153
🔥 Сравнение 4 генераторов изображений на основе ИИ 🎨

Было протестировано 4 модели ИИ с 5 различными промптами, по 4 попытки на каждую модель.

🔹 Google Imagen 3
🔹 Mystic 2.5
🔹 Photon
🔹Frames

Каждая модель интерпретировала промпты по-своему, выдавая уникальные результаты. Как вы думаете, какая из них сделала это лучше всего? Промпты ниже:

Cinematic shot, a futuristic astronaut gazing at an alien planet's horizon, wide shot, reflective visor catching a distant sun, detailed rocky alien landscape, soft glowing atmospheric haze, breathtaking and otherworldy, photorrealistic, sci-fi, highly-detailed

2. Macro shot of a honeybee collecting pollen from a sunflower, delicate pollen grains visible on its fuzzy body, golden sunlight enhancing the textures, 90mm macro lens, vibrant warm tones

3. A vintage 1970s car driving along a winding road surrounded by a dense autumn forest, golden and crimson leaves covering the ground, soft sunlight filtering through the trees, motion blur on the background, nostalgic and cinematic atmosphere, warm and earthy tones

4. Full body portrait, a striking woman with high cheekbones and deep brown eyes, dressed in a bold, She stands against a dramatic desert backdrop, the warm earth tones contrasting with her vibrant outfit, Shot with a Leica, editorial composition

@vistehno
19.03.2025, 17:01
t.me/vistehno/4152
🤖 NVIDIA, Google DeepMind и Disney Research сотрудничают над созданием домашнего дроида в стиле R2D2.

@vistehno
18.03.2025, 23:08
t.me/vistehno/4151
🔍 Так вот от чего отталкивается цена на эту монету на самом деле...

@vistehno
18.03.2025, 17:22
t.me/vistehno/4150
✔️ Factorio стала новым бенчмарком для ИИ.

Factorio привлекла внимание ресерчеров в качестве инструмента для оценки возможностей ИИ. Игра измеряет способность языковых моделей планировать и создавать сложные системы, одновременно управляя ресурсами и производственных цепочек.

Для этих целей была разработана среда Factorio Learning Environment (FLE) c двумя режимами: "Lab-Play" (24 структурированные задачи) и "Open Play", где агенты исследуют процедурно сгенерированные карты с целью построить максимально большую фабрику. В процессе тестирования модели взаимодействуют с Factorio через Python API и получают обратную связь через игровой сервер. Оцениваются параметры "Производственный показатель" и достижение ключевых "Вех".

Создатели протестировали 6 LLM, включая Claude 3.5 Sonnet и GPT-4o. Результаты показали, что модели испытывают серьезные трудности с пространственным мышлением, долгосрочным планированием и исправлением ошибок. Лучшие результаты у Claude 3.5 Sonnet, которая успешно справилась с 15 из 24 задач в режиме "Lab Play".
jackhopkins.github.io

✔️ Американцы все чаще считают, что искусственный разум превосходит их интеллект.

Исследование, проведенное Университетом Элона, выявило, что почти половина пользователей (49%) полагает, что LLM превосходят их собственный интеллект. Из отчета следует, что женщины чаще мужчин считают LLM "значительно умнее" (30% против 20%), а половина взрослого населения США уже использует языковые модели, лидирует ChatGPT с долей в 72%. Также выяснилось, что большинство пользователей (51%) применяют LLM в личных целях для обучения и планирования, в то время как для работы их используют лишь 24%. 65% пользователей взаимодействуют с ИИ-системами посредством голосовых команд.

Несмотря на высокий показатель общей удовлетворенности (76%), значительная часть пользователей сталкивается с проблемами: 23% совершали серьезные ошибки из-за галлюцинаций моделей в ответах, а 21% чувствовали себя манипулируемыми.
imaginingthedigitalfuture.org

✔️ ReasonGraph: инструмент для анализа ризонинга LLM.

ReasonGraph - опенсорсная веб-платформа, разработанная Кембриджским университетом, для визуализации и анализа процессов рассуждений LLM. Она поддерживает как последовательные, так и древовидные методы рассуждений, легко интегрируясь с основными провайдерами LLM и более чем 50 языковыми моделями.
Платформа построена на модульном каркасе и имеет выбор метода мета-рассуждения и настраиваемые параметры визуализации.

ReasonGraph улучшает обнаружение ошибок в логических процессах и способствует более эффективной разработке приложений на основе LLM. Оценка платформы показала практически 100% точность rule-based XML-парсинга при извлечении и визуализации путей рассуждений.
Репозиторий проекта на Github. Демо на HuggingFace.
arxiv.org

✔️ MEGA mini: концепт архитектуры для универсальных NPU.

На конференции по твердотельным схемам (ISSCC) была представлена архитектура MEGA.mini, позиционируемая как универсальный процессор для генеративного ИИ.

MEGA.mini использует парадигму Arm big.LITTLE и предлагает использование двухъядерной концепции в NPU. Предполагается, что высокомощные ядра "Mega" будут задействоваться для выполнения ресурсоемких задач, а облегченные ядра "Mini" будут использоваться для рутинных операций. Архитектура разрабатывается как универсальный процессор, в отличие от CPU, чтобы разработчики могли применять его в разных сценариях - от NLP-задач до мультимодальных ИИ-систем.
techradar.com

✔️ Deepseek R1 671B запустили локально на новом Mac Ultra M3.

YouTube-блогер Дейв Ли провел эксперимент по локальному запуску 4-bit версии Deepseek R1 с 671B параметров. Она может работать локально, но требует 512 ГБ RAM, 404 ГБ хранилища и принудительного выделения 448 ГБ видеопамяти через терминал.

Несмотря на незначительное снижение точности, скорость инференса составила 17-18 токенов в секунду, при этом энергопотребление находилось в пределах 200 Вт. Для сравнения: ПК с аналогичной производительностью потребовал бы в 10 раз больше электричества.
macrumors.com

@ai_machinelearning_big_data

#news #ai #ml
18.03.2025, 09:21
t.me/vistehno/4149
Результаты поиска ограничены до 100 публикаций.
Некоторые возможности доступны только премиум пользователям.
Необходимо оплатить подписку, чтобы пользоваться этим функционалом.
Фильтр
Тип публикаций
Хронология похожих публикаций:
Сначала новые
Похожие публикации не найдены
Сообщения
Найти похожие аватары
Каналы 0
Высокий
Название
Подписчики
По вашему запросу ничего не подошло