У вас закончился пробный период!
Для полного доступа к функционалу, пожалуйста, оплатите премиум подписку
DA
Математика Дата саентиста
https://t.me/data_math
Возраст канала
Создан
Язык
Русский
0.94%
Вовлеченность по реакциям средняя за неделю
2.6%
Вовлеченность по просмотрам средняя за неделю

@notxxx1 - админ

@data_analysis_ml - ds

Сообщения Статистика
Репосты и цитирования
Сети публикаций
Сателлиты
Контакты
История
Топ категорий
Здесь будут отображены главные категории публикаций.
Топ упоминаний
Здесь будут отображены наиболее частые упоминания людей, организаций и мест.
Найдено 96 результатов
🖥 Задача: "Оптимизация вероятности успеха в стохастической системе"

📌 Условие:

Вы работаете над системой, где каждый эксперимент (тест, запуск модели, продукт) может быть успешным или неуспешным.
Результат одного запуска — 1 (успех) или 0 (провал).

Известно:

- Вероятность успеха одного эксперимента — неизвестна, обозначим её как p.
- У вас есть N исторических наблюдений: x1, x2, ..., xN, где каждое xi равно 0 или 1.

Вопросы:

1. Построить оценку вероятности успеха p и доверительный интервал на уровне 95%.
2. Рассчитать, сколько экспериментов нужно запустить, чтобы вероятность выхода в прибыль была выше 95%, учитывая:
- стоимость одного запуска C;
- прибыль от одного успешного эксперимента R.

---

▪️ Подсказки:

- Для оценки p используйте биномиальную модель.
- Для доверительного интервала:
- Можно использовать нормальное приближение (если выборка большая),
- Или Wilson-интервал для аккуратности.

---

▪️ Что оценивается:

- Правильная работа с вероятностями и доверием.
- Способность адекватно аппроксимировать биномиальные распределения.
- Чистота и практичность вычислений.

---

▪️ Разбор возможного решения:

▪️ 1. Оценка вероятности успеха:


# p_hat - оценка вероятности успеха
p_hat = sum(xi_list) / N


где xi_list — список из 0 и 1 (результаты экспериментов).

▪️ 2. Доверительный интервал через нормальное приближение:


import math
z = 1.96 # для 95% доверия
std_error = math.sqrt(p_hat * (1 - p_hat) / N)
lower_bound = p_hat - z * std_error
upper_bound = p_hat + z * std_error


▪️ 3. Wilson-интервал (более аккуратный):


z = 1.96 # для 95% доверия
center = (p_hat + z**2 / (2 * N)) / (1 + z**2 / N)
margin = (z * math.sqrt((p_hat * (1 - p_hat) / N) + (z**2 / (4 * N**2)))) / (1 + z**2 / N)
lower_bound = center - margin
upper_bound = center + margin


---

▪️ 4. Прибыльность эксперимента:

Формула прибыли при n экспериментах:


profit = successes * R - n * C


Требуется:


P(profit > 0) >= 0.95


Число успехов должно быть больше определённой границы:


min_successes = (n * C) / R


Если n велико, количество успехов приближается к нормальному распределению:


mean_successes = n * p_hat
std_successes = math.sqrt(n * p_hat * (1 - p_hat))


Для нормального приближения можно написать:


# Вероятность успешности через нормальное распределение
from scipy.stats import norm

# Вероятность, что количество успехов больше нужного
prob = 1 - norm.cdf(min_successes, loc=mean_successes, scale=std_successes)


Тогда перебором или через уравнение ищем минимальное n, чтобы prob >= 0.95.

---

▪️ Возможные подводные камни:

- Нельзя использовать нормальное приближение при малом N — нужна биномиальная модель.
- Неверное задание границ доверительного интервала может привести к неправильной стратегии запуска.
- Плохое понимание соотношения C и R приводит к ошибочным выводам об окупаемости.

---

📌Дополнительные вопросы:

- Как бы вы учли, что прибыль от успеха — случайная величина?
- Как пересчитать стратегии, если вероятность успеха зависит от времени (`p = f(t)`)?
- Как применить байесовский апдейт для оценки вероятности успеха?

---
27.04.2025, 15:03
t.me/data_math/761
1
4
442
⚡️Легкий способ получать свежие обновления и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь:

Python: t.me/pythonl
Linux: t.me/linuxacademiya
Собеседования DS: t.me/machinelearning_interview
Нерйросети t.me/ai_machinelearning_big_data
C++ t.me/cpluspluc
Docker: t.me/DevopsDocker
Хакинг: t.me/linuxkalii
Devops: t.me/DevOPSitsec
Data Science: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_ci
Java: t.me/javatg
Базы данных: t.me/sqlhub
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: https://t.me/gamedev
Haskell: t.me/haskell_tg
Физика: t.me/fizmat

💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://t.me/addlist/mzMMG3RPZhY2M2Iy

😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://t.me/addlist/BkskQciUW_FhNjEy
27.04.2025, 13:46
t.me/data_math/760
Репост
4
7
666
✔️ OpenAI добавила в API модель генерации изображений GPT-Image-1.

OpenAI открыла доступ к GPT-Image-1 через API — ранее она работала только в ChatGPT.
Стоимость генерации тарифицируется по токенам: текст ($5/млн), ввод изображений ($10/млн), вывод ($40/млн). Одно изображение обходится в $0,02–0,19. Например, картинка 1024×1024 в высоком качестве «съест» 4160 токенов. Модель превосходит Midjourney-v7 в точности следования запросам, но имеет ограничения: плохо распознаёт мелкий текст, нелатинские шрифты, медицинские данные.

Изображения можно загружать через URL или Base64 (PNG, JPEG до 20 МБ). Максимальное разрешение — 768×2000 пикселей. API анализирует объекты, цвета, текст, но не подходит для задач с высокой точностью. Для безопасности добавлены фильтры контента и метаданные C2PA. Тестировать модель можно в Playground OpenAI — подробности в гайдах по работе с API.
openai.com

✔️ Kortix AI выпустила Suna — первый в мире опенсорсный ИИ-агент общего назначения.

Suna — открытый ИИ-агент, способный выполнять реальные задачи через чат-интерфейс. В отличие от закрытых коммерческих моделей, Suna работает офлайн, бесплатен и доступен для самостоятельного хостинга.

Suna не просто отвечает на вопросы: он автоматизирует рутину — от парсинга сайтов и генерации отчетов до развертывания веб-приложений. В основе лежит изолированная Docker-среда, React/Next.js для интерфейса и интеграция с LiteLLM, Supabase и Redis. Помимо исходного кода, есть подписка на развернутый у Kortix AI сервис: бесплатно 10 минут в месяц, за 29$ - 4 часа, а за 199\мес - 40 часов работы Suna.
suna.so

✔️ Firefox анонсировал предпросмотр ссылок с локальным ИИ.

Пользователи Firefox теперь могут заглянуть в содержимое ссылки, не открывая ее. Экспериментальная функция в Firefox Labs 138 показывает карточку с заголовком, описанием, временем чтения и тремя ключевыми пунктами, сгенерированными локальной языковой моделью. Все работает через HTTPS-запросы без загрузки страницы или выполнения скриптов — данные парсятся из метатегов Open Graph и Reader View.

Приватность в приоритете: модель SmolLM2-360M (369 МБ) запускается на устройстве через WebAssembly (wllama), избегая передачи данных в облако. Функция пока в тесте: разработчики ждут фидбека об опыте использования от пользователей.
blog.mozilla.org

✔️ xAI добавила 3 новые функции в Grok.

xAI расширила возможности голосового ассистента Grok: Grok Vision, поддержка многоязыкового аудио и поиск в реальном времени в голосовом режиме. Все это уже доступно пользователям iOS, а для Android-устройств две последние опции открыты только с подпиской SuperGrok. Grok Vision, как заявляют разработчики, позволяет ассистенту анализировать экран смартфона и комментировать происходящее «здесь и сейчас» — например, распознавать объекты или текст.
Ebby Amir (xAI) в X (ex-Twitter)

✔️ BMW внедрит ИИ DeepSeek в свои автомобили для Китая .

BMW объявил о партнерстве с DeepSeek для интеграции ИИ-технологий в машины, продаваемые в Китае. Сотрудничество, представленное на Шанхайском автосалоне, направлено на улучшение «Умного персонального ассистента» — система получит новые функции и расширенный доступ к данным.

Интеграция ИИ DeepSeek ускорит переход BMW к «программно-определяемым» автомобилям. Ожидается, что обновления затронут не только ассистента, но и улучшат интерфейсы, а также поддержат более сложные сценарии автономного управления.
bmwblog.com

@ai_machinelearning_big_data

#news #ai #ml
24.04.2025, 13:04
t.me/data_math/759
4
2
1.1 k
Если хочется влюбиться в профессию заново, разработайте курс вместе с Яндекс Практикумом!

Яндекс Практикум — сервис онлайн-образования, где реально освоить востребованную цифровую профессию. Сейчас есть возможность присоединиться к команде в качестве автора.

Автор готовит тексты уроков, тесты, памятки и прочие материалы, упаковывает свой опыт в учебные кейсы и в буквальном смысле влияет на развитие индустрии.

Что ожидают от кандидата:
▪︎ Техническое образование (преимущественно в области ML).
▪︎ Опыт работы Data scientist или на смежных позициях от 3-х лет.
▪︎ Непреодолимое желание делиться знаниями и опытом, рассказывать сложное доступно и понятно. Так, чтобы вас поняли люди без опыта в этой сфере.

Почему это интересно:
▪︎ удалёнка и дополнительный доход,
▪︎ благодарная аудитория, возможность самореализации,
▪︎ энергичное комьюнити и коллеги, с которыми не скучно.

Узнать подробности и откликнуться
24.04.2025, 11:04
t.me/data_math/758
37
43
1.4 k
@data_math
21.04.2025, 12:33
t.me/data_math/757
15
20
1.3 k
💫 How to build a neutron star — from scratch» с блога James' Space Blog представляет собой подробное руководство по численному моделированию нейтронной звезды с нуля на С++.​

🧠 Основные идеи статьи

🔬 Что такое нейтронная звезда?
Нейтронная звезда — это сверхплотный объект, образующийся после коллапса массивной звезды. Под действием огромного давления протоны и электроны объединяются в нейтроны. Из-за экстремальных условий внутри нейтронной звезды невозможно точно определить её внутреннюю структуру:​

Невозможно создать нейтронную материю в лаборатории.

Объединение общей теории относительности и квантовой механики при таких масштабах остаётся нерешённой задачей.

Существующие модели вращающихся жидкостей в ОТО являются приближёнными.​

⭐️ Этапы моделирования
Построение статической нейтронной звезды: Рассматривается как самогравитирующаяся жидкость в гидростатическом равновесии.

Решается уравнение Толмана–Оппенгеймера–Волкова (TOV), описывающее структуру звезды.​

Добавление вращения и движения: Переход от статической модели к вращающейся и движущейся звезде с использованием дополнительных уравнений.​

Коррекция модели: Внесение поправок для удовлетворения физическим ограничениям, аналогично процессу для чёрных дыр.​

Построение переменных: Вычисление таких параметров, как плотность, энергия и скорость, необходимых для дальнейшего моделирования.​

⚙️ Уравнение состояния (EOS)
Для моделирования используется уравнение состояния, связывающее давление, плотность и внутреннюю энергию.

🧪 Практическая реализация
Автор предоставляет код для реализации модели, разделённый на две части:​

Первая часть: библиотека для моделирования статической нейтронной звезды.

Вторая часть: расширение модели для вращающейся и движущейся звезды.​

Цель — подготовка начальных условий для численного моделирования столкновений нейтронных звёзд.​

🔜 Полный текст статьи доступен по ссылке

@data_math
20.04.2025, 16:27
t.me/data_math/756
8
51
1.1 k
🔥 Пределы. Предел последовательности
Альсевич Л.А.

Пособие содержит основные теоретические сведения о последовательностях и их свойствах и предлагает основные приемы нахождения пределов последовательностей.
Изложение материала иллюстрируется подробно разобранными примерами. В пособие включены упражнения, снабженные ответами. Кроме того, приводятся начальные понятия о методе математической индукции и формула бинома Ньютона.
Предназначено для студентов факультета прикладной математики и информатики; оно будет также полезным для всех студентов, изучающих начальный курс высшей математики.

@data_math
17.04.2025, 19:20
t.me/data_math/755
1
8
1.2 k
⚡️Строим рекомендательную систему фильмов на Kaggle

Вы когда-нибудь хотели сделать свою собственную систему рекомендаций фильмов? 🎬

Приходите на бесплатный вебинар, где Савелий Батурин, Senior ML-Engineer и преподаватель курса по ML школы Simulative в прямом эфире покажет как построить рекомендательную систему фильмов на Kaggle.

Что будем делать на вебинаре:
🟠Разберем имеющиеся данные фильмов с их оценками
🟠Проведем предобработку данных
🟠Построим рекомендательную систему на основе машинного обучения
🟠Проведем расчет и анализ метрик на основе результатов работы модели

Вебинар будет интересен как новичкам, так и уже опытным специалистам

😶Зарегистрироваться на бесплатный вебинар
17.04.2025, 17:19
t.me/data_math/754
10
40
1.2 k
🌟 DeepMath-103K — датасет для прокачки LLM в продвинутой математике

DeepMath-103K — это новый мощный набор задач для обучения больших языковых моделей (LLMs) математическому рассуждению на высоком уровне сложности с помощью reinforcement learning (RL).

📦 Что в наборе?
103 000+ задач уровня сложности 5–9 (от среднего до продвинутого уровня).

Каждая задача включает:

📌 Верифицируемый ответ — важно для обучения с подкреплением.

🧪 3 решения, сгенерированных моделью R1 — для обучения с учителем или дистилляции.

Полная очистка от утечек данных (decontaminated) — можно безопасно использовать на бенчмарках.

📊 Почему это важно?
Модели, обученные на DeepMath-103K, показывают существенный прирост точности на сложных математических задачах и бенчмарках (MATH, GSM8K, MiniF2F и др.).

🛠 Применение:
Fine-tuning моделей (например, GPT, LLaMA) для математического reasoning.

RLHF (reinforcement learning with human feedback) и self-improvement.

Дистилляция сильных моделей в более компактные.

🔜PAPER: https://arxiv.org/abs/2504.11456
🔜CODE: https://github.com/zwhe99/DeepMath
🔜 SET: https://huggingface.co/datasets/zwhe99/DeepMath-103K

@data_math
16.04.2025, 19:45
t.me/data_math/753
Репост
10
10
764
🔥 Короткое видео от
Hunyuan, которое объясняет архитектуру гибридного трансформера Mamba, лежащего в основе моделей Hunyuan T1 и Turbo S.

🔜 Оригинал

#mamba #Hunyuan
14.04.2025, 19:04
t.me/data_math/752
Присоединяйтесь к дискуссии — задавайте свои вопросы в комментариях к посту

Рекламодатель БАНК ВТБ (ПАО), ИНН 7702070139, Генеральная лицензия банка России №1000. Реклама, erid: 2SDnjf11Zk8. 0+
https://t.me/Data_fusion/152
14.04.2025, 16:54
t.me/data_math/751
6
50
965
Theory—Theoretical & Mathematical Foundations

📓 Book

@data_math
11.04.2025, 21:20
t.me/data_math/750
Репост
5
12
690
🌟 Kimi-VL: VLM с MoE, ризонингом и контекстом 128K.

Moonshot AI опубликовала веса Kimi-VL — открытой VLM, которая объединяет обработку текста, изображений и видео. Благодаря архитектуре MoE модель активирует всего 2.8 млрд. параметров в языковом декодере, обеспечивая скорость, сопоставимую с компактными аналогами, и результативность флагманских решений.

Главное преимущество Kimi-VL — способность анализировать длинные контексты до 128 тыс. токенов, что делает её идеальной для работы с объемными документами, длинными видео или сложными мультимедийными задачами.

Основу модели составляет визуальный энкодер MoonViT, оптимизированный для нативной обработки изображений любого разрешения без необходимости разбивать их на части. Это позволяет точно распознавать текст, графики или UI-интерфейсы даже в высокодетализированных скриншотах.

Например, на бенчмарке InfoVQA модель показывает точность 83.2%, обходя даже GPT-4o. В задачах OCR Kimi-VL достигает 86.7% на OCRBench, что ставит её в ряд лучших в индустрии.

Разработчики также представили Kimi-VL-Thinking — версию с расширенными возможностями CoT. Благодаря использованным RL и длительному CoT-тюнингу она демонстрирует впечатляющие результаты в математических и академических задачах: на MathVista точность составила 71.3%, а на MMMU — до 61.7%, что лучше, чем у Gemma-3-12B-IT.

В тестах Kimi-VL превосходит конкурентов в работе с агентами: на OSWorld её результат 8.22% выше, чем у GPT-4o (5.03%), а на WindowsAgentArena — 10.4%. Для длинных видео модель набирает 64.5% на LongVideoBench, подтверждая способность анализировать часовые записи без потери ключевых деталей.

Модели доступны на Hugging Face в двух вариантах:

🟢Kimi-VL-A3B-Instruct для стандартных задач;

🟠Kimi-VL-Thinking для сложных рассуждений.

▶️ Инференс через Transformers занимает несколько строк кода — достаточно загрузить изображение, задать запрос и получить подробный ответ.


📌Лицензирование: MIT License.


🟡Набор моделей
🟡Техотчет
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #VLM #KimiAI #MoonShotAI
10.04.2025, 16:33
t.me/data_math/746
Репост
1
10.04.2025, 16:33
t.me/data_math/747
Репост
1
10.04.2025, 16:33
t.me/data_math/748
Репост
1
10.04.2025, 16:33
t.me/data_math/749
4
1.0 k
Data Fusion 2025 — место встречи тех, кто работает с данными, ИИ и машинным обучением

⌛️Уже 16 и 17 апреля в Москве пройдет масштабная конференция, посвященная последним трендам в мире данных и ИИ. 70+ сессий и 250+ спикеров поделятся реальными кейсами и передовыми исследованиями, которые будут двигать индустрию.

В программе:

📊 Сессия о промышленных данных: как развивается инфраструктура их обмена в России, примеры сбора, обработки и вопросы безопасности.
🧠 Жаркие дебаты: Сколько данных осталось до предела? Обсудим, что мешает нам работать с данными на полную мощность.
🎬 Эксклюзивный показ фильма «Влюбленные в математику» Александра Гасникова — о том, как развивается наука прямо сейчас.

🔗Полная программа конференции

Хотите узнать, какие DS-решения эффективны для бизнеса и государства?
Тогда переходите прямо сейчас, регистрация закроется уже завтра — https://data-fusion.ru/.

📌16-17 апреля, Москва, технопарк «Ломоносов». Участие бесплатное.

Мы заботимся о безопасности участников на мероприятии, поэтому для доступа на конференцию просим заполнить развернутую онлайн-форму. Благодарим за понимание.


*DS — Data Science — наука о данных
10.04.2025, 12:00
t.me/data_math/745
Репост
10
704
9.04.2025, 11:25
t.me/data_math/742
Репост
10
730
9.04.2025, 11:25
t.me/data_math/743
Репост
10
729
9.04.2025, 11:25
t.me/data_math/744
Репост
10
712
9.04.2025, 11:25
t.me/data_math/741
Репост
10
696
9.04.2025, 11:25
t.me/data_math/740
Репост
7
10
708
✔️ Релиз весов HiDream-I1: 17B параметров и превосходство над GPT-4o по качеству генерации изображений.

HiDream-I1 - генеративная модель text-to-imаge, разработанная китайской компанией HiDream, которая работает под брендом vivagoAI.

Модель получила 17 млрд. параметров и показывает высочайшее качество генерации изображений в фотореализме, анимационном и художественном стилях. Представлено 3 версии модели: Dev, Full и Fast.

Модель выпущена под лицензией MIT и уже заняла 1 место в GenAI-бенчмарках, обогнав предыдущего лидера, GPT-4o.

🟡Попробовать
🟡Github
🟡HidreamAi в X (ex-Twitter)


@ai_machinelearning_big_data

#news #ai #ml #HiDream #AImodel
9.04.2025, 11:25
t.me/data_math/739
7
5
1.1 k
Сейчас информация для тех, кто еще учится в вузе

Мы собрали большое комьюнити умных и образованных людей, среди которых точно есть те, кому нравится обучать точным наукам и программированию. И на своём опыте знаю, чего стоит поиск учеников, особенно если нет ресурсов, какими обладают онлайн-школы. А так как я придерживаюсь стратегии win-win, с радостью готов поделиться ресурсом, который поможет вам найти учеников уже сейчас:

Последний в этом году 3-х дневный концентрат от репетитора и студента факультета компьютерных наук из ВШЭ

За 5 лет репетиторства он разработал систему, которой пользуются все начинающие репетиторы, а действующие с её помощью сокращают время работы и увеличивают доход.

Его советам точно можно доверять. Не упустите эту возможность учиться у лучших в своем деле.

УЧАСТВОВАТЬ
8.04.2025, 19:19
t.me/data_math/738
11
34
1.3 k
🧮 Модели решают математику… но не совсем

Исследователи предложили новый бенчмарк — MATH-Perturb, чтобы проверить: языковые модели действительно "умеют" решать задачи по математике или просто запоминают шаблоны?

📌 Что сделали: Они взяли 279 самых сложных задач из датасета MATH (уровень 5) и создали две версии для каждой:

MATH-P-Simple — простая пертурбация (вопрос формулируется иначе, но суть и метод решения не меняется).

MATH-P-Hard — сложная пертурбация (незаметное изменение, которое требует другого метода решения и более глубокого понимания).

🧠 Что показали тесты: Модели легко решают оригинальные и "простые" пертурбированные задачи — даже если используют "шорткат-решения" (по сути, угадывают по шаблону).
Но на сложных пертурбациях они резко проваливаются. Шорткат больше не работает, и модель теряется.

📊 Вывод: Многие языковые модели, включая самые продвинутые, не понимают математику в глубоком смысле. Они подбирают шаблон, а не рассуждают.

MATH-Perturb — отличный способ отделить память от мышления.

🔗 Подробнее: https://arxiv.org/abs/2404.01649
🔗 Бенчмарк: https://math-perturb.github.io/

@data_math
8.04.2025, 13:02
t.me/data_math/736
34
1.3 k
8.04.2025, 13:02
t.me/data_math/737
7
2
1.2 k
Растите сильную команду. Топ-5 курсов Яндекс Практикума для IT

👾 Технологии меняются каждый день — проверено Яндексом.

Мы ощущаем перемены на своих проектах. Постоянные вызовы, новые инструменты, штормы на рынках. Знаем, как важно, чтобы команда быстро развивалась и адаптировалась к изменениям. Поэтому создаём актуальное обучение, которое соответствует реальным задачам IT-сферы.

Нам доверяют: 5000+ компаний уже обучили 36 000+ сотрудников в Яндекс Практикуме.

👉 Вот топ-5 курсов, которые выбирали компании для развития IT-команд в 2025 году:

— SQL для работы с данными и аналитики
— DevOps для эксплуатации и разработки
— Python-разработчик
— Архитектура программного обеспечения
— Управление командой разработки
— Навыки аргументации

👉Подобрать курс

Реклама, АНО ДПО “Образовательные технологии Яндекса”, ИНН 7704282033, erid: 2VtzqwTEKDb
8.04.2025, 11:02
t.me/data_math/735
14
67
1.3 k
🔥 Математический анализ для решения физических задач
М. А. Шубин

Материал основананный на лекциях, дважды прочитанных автором в Красноярской краевой летней школе по естественным
наукам школьникам

В нем кратко объясняются основные понятия математического анализа (производная и интеграл) и даются простейшие приложения к физическимзадачам, основанные на составлении и решении дифференциальных уравнений.

Материал рассчитанана широкий круг читателей: школьников, студентов, учителей.
7.04.2025, 15:50
t.me/data_math/734
2
8
1.4 k
Model Context Protocol – незаменимый инструмент для ML-соревнований, где нужно использовать всю мощь LLM. С помощью нового стандарта подключения AI-ассистентов к бизнес-приложениям от Anthropic ты сможешь интегрировать ИИ в свой проект – идеальное решение для хакатона, где время ограничено.

В новой статье разбираемся, как устроен протокол, как поднять собственный MCP-сервер и использовать его в IT-соревнованиях. Ты узнаешь про:
🔤 Архитектуру Model Context Protocol.
🔤 Основные возможности стандарта.
🔤 Примеры реализации: от простых к сложным.

Сосредоточься на создании уникального AI-ассистента. Как это сделать? Ответ в статье: https://cnrlink.com/mcpitonecupdatamath

А проверить всю мощь MCP можно на IT_ONE Cup. ML Challenge. Зарегистрируйся, выбери один из трех треков и раздели призовой фонд в 1 500 000 рублей.

MCP станет одним из важных инструментов для разработки ИИ-помощников в задачах соревнования:
🔤 Динамические контекстные подсказки для системного аналитика.
🔤 AI-генератор дизайн-макетов по описанию требований.
🔤 Система визуализации BPMN-диаграмм.

MCP позволит использовать локальные модели, которые сделают решения более автономными и безопасными – их будет легче адаптировать под задачи соревнования.

Регистрация открыта до 13 апреля включительно: https://cnrlink.com/itonecupmldatamathmcp
7.04.2025, 13:48
t.me/data_math/733
9
169
1.5 k
📚 «Линейная алгебра»

Вторая лучшая книга по линейной алгебре с ~1000 практических задач.

Идеально для ИИ и машинного обучения.

Книга полностью бесплатна .

Прекрасно подходит для новичков.

📌 Книга

@data_math
2.04.2025, 15:07
t.me/data_math/732
Репост
5
6
682
🔥 ​Hugging Face выпустила версию 0.30.0 библиотеки huggingface_hub - это самое крупное обновление за два года!

Представлены значительные улучшения, особенно в области хранения и обработки больших моделей и датасетов.​

✔️ Основные нововведения:

Интеграция с Xet: Внедрена поддержка Xet — передового протокола для хранения крупных объектов в Git-репозиториях, призванного заменить Git LFS.

В отличие от LFS, который выполняет дедупликацию на уровне файлов, Xet работает на уровне фрагментов данных, что особенно полезно для специалистов, работающих с массивными моделями и датасетами.

Для интеграции с Python используется пакет xet-core, написанный на Rust, который обрабатывает все низкоуровневые детали.​

Чтобы начать использовать Xet, установите дополнительную зависимость:​
pip install -U huggingface_hub[hf_xet]

После установки вы сможете загружать файлы из репозиториев, поддерживающих Xet.​

Доплнительно:
😶 Расширен InferenceClient:
😶 Добавлена поддержка новых провайдеров для инференса: Cerebras и Cohere.
😶 Внедрены асинхронные вызовы для задач инференса (например, text-to-video), что повышает стабильность и удобство работы.
😶 Улучшен CLI
😶 Команда huggingface-cli upload теперь поддерживает wildcards (шаблоны) прямо в пути к файлам (например, huggingface-cli upload my-model *.safetensors вместо опции --include).
😶 Команда huggingface-cli delete-cache получила опцию --sort для сортировки кэшированных репозиториев (например, по размеру: --sort=size).

✔️ Полный список обновлений
✔️Блог
✔️Документация по Xet

@ai_machinelearning_big_data


#huggingface #release #xet
31.03.2025, 19:05
t.me/data_math/731
6
9
1.1 k
🚀Прими участие в ML Cup 2025 от Авито и выиграй 1,2 миллиона рублей!

Ты — специалист в области машинного обучения? Хочешь проверить свои силы в реальных задачах, с которыми ежедневно сталкиваются 1000+ специалистов Авито? Тогда не упусти шанс стать частью крупнейшего соревнования в этой области!

Что тебя ждет:

☑️Денежный призовой фонд
☑️Автоматизированная оценка решений
☑️2 практические задачи:

1️⃣Персональные рекомендации — предскажи, какие товары вызовут интерес у миллионов пользователей → ссылка на регистрацию.

2️⃣Поиск дублей — как с помощью CV находить похожие объявления даже при разных текстах и ракурсах фото → ссылка на регистрацию.

Выбирай одну или обе задачи, показывай лучшие результаты и получай шанс на победу! Участвовать можно как индивидуально, так и в команде до 4 человек. Загружай до 5 решений в день.

Регистрация уже открыта! Подробности и анкета по ссылкам выше.
31.03.2025, 17:05
t.me/data_math/730
13
95
1.2 k
Mathematics for Computer Science

Бесплатный учебник от CRC Press объемом 547 страниц.

📚 Книга


@data_math
29.03.2025, 22:05
t.me/data_math/728
95
1.2 k
29.03.2025, 22:05
t.me/data_math/729
9
53
979
⚡️ Это увлекательный интерактивный гайд, объясняющий интуицию, лежащую в основе гауссовых процессов.

Гауссовские процессы позволяют построить распределение функций с непрерывной областью определения.

🔗 Гайд

@data_math
28.03.2025, 13:04
t.me/data_math/727
2
4
1.5 k
Как ИИ помогает компаниям принимать умные решения и развивать разные индустрии?

15-16 апреля пройдет Весенний онлайн-лекторий, посвященный влиянию ИИ на индустрии. Разберемся в технологиях вместе с ФКН НИУ ВШЭ, Яндекс, Сбер, Авито, МТС и другими лидерами рынка.

Программа Лектория обширна:
— Вебинары про ИИ и ML в банках, бигтехе и e-com
— Мастер-классы и кейсы по Data Science, Data Analytics и Data Engineering
— Круглый стол по разработке и применению ИИ-агентов
— Прожарка резюме и карьерная лекция

Вы сможете разобраться в ключевых трендах и возможностях в IT, а также погрузиться в Data Science, Data Analytics и Data Engineering, изучение инструментов и реальных задач каждого направления.

Лекторий организуют эксперты факультета компьютерных наук НИУ ВШЭ, онлайн-магистратур ФКН и Центра непрерывного образования, а также ведущие компании индустрии. Поэтому вас ждут глубокие инсайты из мира IT.

Когда: 15-16 апреля в 16:00
Где:онлайн

🔗 Зарегистрироваться

Реклама: НИУ ВШЭ
ИНН: 7714030726
Erid: 2SDnjcrGUXe
28.03.2025, 11:03
t.me/data_math/726
32
27
1.5 k
@data_math
22.03.2025, 17:02
t.me/data_math/725
Репост
17
77
1.0 k
🤖 Modern Robotics Course: Открытый курс по современной робототехнике.

Курс сочетает теорию (математика, физика) и практику (код, симуляторы), помогая разработчикам научиться создавать и программировать роботов.

🌟 Что внутри?
▪ Лекции: От основ робототехники, математики и физики до пространственных преобразований, обратной кинематике и более продвинутым концепциям .
▪ Практика: Примеры кода на Python и C++ для управления роботами.
▪Симуляторы: Интеграция с стимуляторами Gazebo и ROS ( операционная система для робото) для тестирования алгоритмов.
▪Задания: Реальные практические задачи (например, управление манипулятором робота).

🌟 Для кого?
▪ Начинающие робототехники: Освоить кинематику, динамику, управление.
▪ Программисты: Интегрировать алгоритмы в ROS, Gazebo, Python/C++.
▪ Инженеры: Возможность Научиться разрабатывать автономные системы и манипуляторы.
▪Технологические энтузиасты

С курсом можно пройти путь от нуля до создания рабочего прототипа.

С курсом у вас будет возможность проектировать роботов, не имея железа под рукой (через симуляторы).

✔️ Готовые решения: Внутри вы найдете библиотеки для работы с преобразованиями, датчиками, движением.

✔️Карьера в робототехнике: Курс даст возможность получить базовые навыки, востребованные в Bosch, Boston Dynamics, Tesla.

⭐️ Преимущества перед другими открытыми курсами
🟠 Акцент на практике: Минимум абстракций — максимум кода.
🟠Совместимость с ROS: Стандарт для промышленной робототехники.
🟠 Современные алгоритмы: Не только классика, но и нейросетевые подходы.

➡️ Cовет: Для погружения в курс, вам поможет книга Robotics, Vision and Control: Fundamental Algorithms in Python, Peter Corke, вот ее репозиторий с примерами кода.

P.S. Для тех, кто любит формат «сделай сам»: Курс научит вас собирать робота виртуально, а потом переносить решения на реальные устройства. 🤖💡

✔️ Github
✔️ Введение в курс

#course #ai #ml #robots #education #курс #робототехника
22.03.2025, 13:41
t.me/data_math/724
7
20
1.2 k
🔥 The Project Gutenberg EBook of First Course in the Theory of Equations,

Этой классической книге по математике 100 лет.

📚 Book

@data_math
21.03.2025, 19:03
t.me/data_math/723
27
1.1 k
20.03.2025, 14:08
t.me/data_math/722
14
27
1.1 k
⭐️ Разложение на простые дроби при интегрировании

Неопределенный интеграл от рациональной функции: разложение на простые дроби
Неопределенный интеграл от дробно-рациональной функции
Неопределенный интеграл от дробно-рациональной функции x/(x+1)(1+x^2)
Неопределенный интеграл от дробно-рациональной функции 1/(x+1)(x+2)(x+3)
Неопределенный интеграл. Разложение на простые дроби

⚡️ источник
20.03.2025, 14:08
t.me/data_math/718
27
1.1 k
20.03.2025, 14:08
t.me/data_math/720
27
1.1 k
20.03.2025, 14:08
t.me/data_math/719
27
1.1 k
20.03.2025, 14:08
t.me/data_math/721
2
1.1 k
Хотите получить много практики на реальных задачах, собрать портфолио и узнать как выглядит рабочий день аналитика?

CEO Simulative и эксперт с большим опытом в аналитике, Андрон Алексанян организовал бесплатный интенсив, где вы будете решать реальные задачи, с которыми аналитики сталкиваются на работе

На прямых эфирах вы сделаете:
🟠Анализ активности пользователей с помощью SQL
🟠Анализ маркетинговых активностей с помощью Python
🟠ABC анализ ассортиментной матрицы в Excel (уже прошел, но вам будет доступна запись)

Во время эфиров вы узнаете много лайфхаков, а также будете получать полезные материалы для развития в аналитике на протяжении всего интенсива

❗️Знать Python и SQL не обязательно — все будем разбирать с нуля

🕗 Встречаемся на новом эфире уже сегодня, 20 марта в 19:00 по мск

😶Участвовать в бесплатном интенсиве
20.03.2025, 12:08
t.me/data_math/717
8
25
1.3 k
🎯 Coq-of-Rust — это инструмент для формальной верификации кода на Rust. Он преобразует подмножество Rust в спецификации на языке Coq, позволяя доказывать корректность программ математическими методами.

Проект разработан для повышения надежности критических систем (например, блокчейнов, embedded-решений), где ошибки недопустимы.

🔥 Основные функции
Трансляция Rust → Coq:
Конвертирует структуры, перечисления (enum), трейты (trait), методы и выражения в эквивалентный код на Coq.

Поддержка системы владения:
Учитывает правила заимствования и времени жизни (lifetimes), сохраняя семантику Rust на уровне спецификаций.

Генерация теорем:
Автоматически создает условия для доказательства свойств (например, отсутствие паник, корректность алгоритмов).

Coq-of-Rust — это шаг к математически верифицируемому Rust. Если вы разрабатываете системы, где цена ошибки высока, этот инструмент поможет превратить код в набор теорем, которые можно строго доказать.

Совет: Начните с примеров из репозитория, чтобы понять, как транслируются типичные Rust-конструкции.

https://github.com/formal-land/coq-of-rust

@data_math
19.03.2025, 19:15
t.me/data_math/716
14
28
1.6 k
⭐️ Статья профессора Мэтта Страсслера "Did the Particle Go Through the Two Slits, or Did the Wave Function?" посвящена анализу классического квантовомеханического эксперимента с двумя щелями. В этом эксперименте частицы, проходя через две щели, создают на экране интерференционную картину, что вызывает вопросы о природе их прохождения через щели.

Основные моменты статьи:

Отрицание традиционных представлений: Страсслер утверждает, что в рамках квантовой физики 1920-х годов ни частица, ни её волновая функция не проходят через обе щели одновременно. Это противоречит распространённому мнению о том, что частица ведёт себя как волна и проходит через обе щели, интерферируя сама с собой.
PROFMATTSTRASSLER.COM

Суперпозиция состояний: Автор подчёркивает, что частица находится в состоянии суперпозиции — то есть, она имеет вероятность пройти через одну или другую щель, но не через обе одновременно. Это состояние суперпозиции приводит к наблюдаемой интерференционной картине.
PROFMATTSTRASSLER.COM

Аналогия с экспериментом с двумя дверями: Для упрощения понимания Страсслер предлагает мысленный эксперимент с двумя дверями, где частица может пройти либо через одну, либо через другую дверь, но не через обе одновременно. Это помогает иллюстрировать принцип суперпозиции и его последствия.
PROFMATTSTRASSLER.COM

Интерес статьи заключается в следующем:

Переосмысление квантовых концепций: Статья предлагает иной взгляд на интерпретацию эксперимента с двумя щелями, бросая вызов традиционным представлениям о поведении частиц на квантовом уровне.

Углубление понимания суперпозиции: Автор подробно объясняет принцип суперпозиции состояний и его роль в квантовых явлениях, что способствует более глубокому пониманию фундаментальных аспектов квантовой механики.

Образные объяснения: Использование аналогий, таких как эксперимент с двумя дверями, делает сложные квантовые концепции более доступными для широкой аудитории.

В целом, статья Страсслера предоставляет свежий взгляд на классический квантовый эксперимент, стимулируя читателей к переосмыслению устоявшихся представлений и углублению в фундаментальные принципы квантовой физики.

Читать

@data_math
17.03.2025, 10:04
t.me/data_math/715
6
32
1.5 k
Problems In Differential Geometry And Topology

📚 Книга

@data_math
7.03.2025, 19:31
t.me/data_math/714
Репост
4
19
877
📌 PyTorch: новые инструменты для для экономии памяти при обучении моделей.

PyTorch представил усовершенствованные методы Activation Checkpointing (AC), цель которых - снижение потребления памяти при обучении.

Традиционный подход в eager mode сохраняет промежуточные активации для обратного прохода, что зачастую приводит к значительному расходу ресурсов. AC позволяет не сохранять эти тензоры, а вычислять их заново при необходимости, тем самым жертвуя вычислительным временем ради экономии памяти.

Новая техника – Selective Activation Checkpoint (SAC). В отличие от обычного AC, который затрагивает всю выбранную область, SAC дает гранулярный контроль над тем, какие операции следует пересчитывать, а какие – сохранять. Это достигается за счет использования policy_fn, определяющей, нужно ли сохранять результаты конкретной операции. SAC будет полезен для избегания перевычисления ресурсоемких операций, например, матричных умножений.

Для torch.compile стала доступна Memory Budget API. Эта функция автоматически применяет SAC с оптимальной политикой, исходя из заданного пользователем бюджета памяти (от 0 до 1). Бюджет 0 соответствует обычному AC, а 1 – поведению torch.compile по умолчанию.

🔜 Читать подробную статью в блоге Pytorch


@ai_machinelearning_big_data

#AI #ML #Pytorch
6.03.2025, 14:35
t.me/data_math/712
Репост
19
892
6.03.2025, 14:35
t.me/data_math/713
2
3
1.2 k
Хотите получить много практики на рельных задачах анализа данных, начать эффективнее работать с данными и освоить новые инструменты с нуля?

CEO Simulative и эксперт с большим опытом в аналитике, Андрон Алексанян организовал бесплатный интенсив, где в течение 3 недель вы будете решать реальные задачи, с которыми аналитики сталкиваются на работе

На прямых эфирах вы сделаете:
🟠ABC анализ ассортиментной матрицы в Excel
🟠Анализ активности пользователей с помощью SQL
🟠Анализ маркетинговых активностей с помощью Python

Во время эфиров вы узнаете много лайфхаков, а также будете получать полезные материалы для развития в аналитике на протяжении всего интенсива

❗️Знать Python и SQL не обязательно — все будем разбирать с нуля. Для тех, кто сейчас работает с Excel, интенсив — особенно классная возможность выйти на новый уровень работы с данными

🕗Встречаемся на первом эфире уже сегодня, 6 марта в 19:00 по мск

Участвовать в бесплатном интенсиве
6.03.2025, 12:28
t.me/data_math/711
2
25
1.3 k
🎲 Условная вероятность: как обновлять знания с появлением новых данных

Во время того, кк мы получаем новую информацию, наши представления о вероятностях событий меняются.

Это фундаментальный принцип условной вероятности, который применяется в машинном обучении, медицине, финансах и других областях.

💡 Вот Простые примеры:
🔹 Шанс вытянуть короля из колоды – 4/52. Если известно, что карта — картинка, вероятность повышается до 4/12.
🔹 Вероятность выпадения 6 на кубике — 1/6. Если сказано, что выпало четное число, шанс уже 1/3.

💡 Практическое применение:
✅ Медицина: анализ точности тестов (чувствительность, специфичность, ложноположительные результаты).
✅ Финансы: оценка риска падения рынка, вероятность дефолта заемщика.
✅ Машинное обучение: фильтрация спама, диагностика заболеваний, кредитный скоринг.

📌 Байесовская теорема помогает обновлять вероятности по мере поступления новых данных. Например, положительный тест на редкое заболевание не всегда означает, что пациент болен – вероятность зависит от распространенности болезни и точности теста.

Подробнее об этом читайте в статье: 👉 Conditional Probability
6.03.2025, 10:04
t.me/data_math/710
11
7
1.3 k
✔️ OpenAI запускает программу NextGenAI.

OpenAI запускает NextGenAI — совместную программу с 15 НИИ, направленную на ускорение научных прорывов и трансформацию образования с использованием ИИ. OpenAI планирует выделить на финансирование исследований 50 млн. долларов.

Программа объединяет институты в США и за рубежом. Среди партнеров Калифорнийский технологический институт, Гарвардский университет и Массачусетский технологический институт, а также Бостонская детская больница и Бостонская публичная библиотека.

Цель NextGenAI — укрепить связи между академическими кругами и реальным сектором, гарантируя, что преимущества ИИ будут распространены на научные лаборатории и социально значимые проекты.
openai.com

✔️ Китай планирует запустить новую политику по продвижению архитектуры RISC-V.

Китай разрабатывает новую политику по расширению применения архитектуры микросхем с открытым исходным кодом RISC-V в попытке снизить свою зависимость от западных технологий микросхем.

В настоящее время многие учреждения разрабатывают чипы на базе RISC-V, а компании, например, Qualcomm уже создали специальные подразделения для популяризации этой архитектуры. Ожидается, что политика будет представлена ​​в этом месяце, а RISC-V станет альтернативой архитектурам x86 и ARM.
reuters.com

✔️ Stability AI и Arm: генеративный звук теперь на смартфонах и без интернета.

Stability AI в сотрудничестве с Arm представила возможность генерации высококачественных звуковых эффектов и аудиосэмплов прямо на мобильных устройствах, без необходимости подключения к интернету. Это стало возможным благодаря использованию библиотек Arm KleidiAI и технологии Stable Audio Open от Stability AI.

Так время генерации аудио на ARM-устройствах сократилось в 30 раз, с 240 до 8 секунд на процессорах Armv9. Увидеть демонстрацию работы Stable Audio Open можно будет на выставке MWC в Барселоне 3 марта 2025 года.
stability.ai

✔️ Operator от Opera: AI-агенты в браузере.

Opera анонсировала браузер Operator, который сам выполняет задачи пользователя в интернете. Он содержит встроенный ИИ-агент, способный покупать товары, искать информацию и выполнять другие действия по запросу пользователя. Operator также способен управлять подписками и онлайн-аккаунтами - он найдет все активные подписки и предложит отменить ненужные. Operator может автоматически оплачивать счета и загружать банковские выписки.

В отличие от обычных браузеров, Operator анализирует DOM Tree и структуру страницы, чтобы быстро и эффективно выполнять задачи. Пользователь может видеть весь процесс и контролировать его.
Operator скоро станет доступен в рамках программы Opera Feature Drop.
blogs.opera.com

✔️ Amazon готовится выпустить конкурента GPT-o

Amazon разрабатывает новую модель ризонинга - Nova, которая должна составить конкуренцию OpenAI и Anthropic. Релиз Nova запланирован в июне этого года и будет отличаться высокой производительностью и экономической эффективностью.

Amazon ставит перед собой цель войти в топ-5 лучших ИИ-моделей по результатам внешних оценок, с фокусом в задачах, связанных с разработкой программного обеспечения и математическим мышлением. Разработкой занимается команда AGI под руководством Rohit Prasad.
businessinsider.com

@ai_machinelearning_big_data

#news #ai #ml
5.03.2025, 19:00
t.me/data_math/709
1
2
1.4 k
Что отличает успешного IT-специалиста от того, кто годами остается на одном уровне?

Чтобы достигать новых высот в IT нужно не просто идти в ногу со временем, а буквально бежать.

🔥 IT мероприятия России - канал, который поможет получать новые знания от гигантов индустрии и топовых специалистов как онлайн, так и оффлайн.

👥 Подписывайся!
📆 Получай актуальные анонсы форумов, конференций, митапов, вебинаров, хакатонов, олимпиад!
📚 Развивай свои навыки!

Присоединяйся к IT-мероприятия России / ITMeeting / IT events и прокачивай свой навыки и нетворкинг с лучшими спецами!
5.03.2025, 16:58
t.me/data_math/708
Репост
16
110
1.3 k
🔥 MIT обновил свой знаменитый курс 6.S191: Introduction to Deep Learning.

Программа охватывает темы NLP, CV, LLM и применение технологий в медицине, предлагая полный цикл обучения – от теории до практических занятий с использованием актуальных версий библиотек.

Курс рассчитан даже на новичков: если вы умеете брать производные и перемножать матрицы, все остальное будет разъяснено в процессе.

Лекции выходят бесплатно на YouTube и на платформе MIT по понедельникам, первая уже доступна.

Все слайды, код и дополнительные материалы можно найти по указанной ссылке.

📌 Свежая лекция: https://youtu.be/alfdI7S6wCY?si=6682DD2LlFwmghew

Разбор мл-собеседований
5.03.2025, 12:15
t.me/data_math/707
21
23
3.1 k
@data_math
3.03.2025, 16:32
t.me/data_math/706
Репост
3
2
691
✔️ Deepseek FlashMLA: ядро ​​декодирования MLA, оптимизированное для GPU Hopper.

В первый день анонсированного на прошлой неделе мероприятия "5 дней опенсорс-проектов" Deepseek опубликовала проект FlashMLA. Это ядро оптимизировано для последовательностей переменной длины, поддерживает BF16 и использует страничный KV (с размером блока 64). Вся эта совокупность позволяет значительно повышать эффективность вычислений.

На H800 FlashMLA показал пропускную способности памяти до 3000 ГБ/с и вычислительную производительность в 580 терафлопс. FlashMLA ускорит процесс рассуждений ИИ и обеспечит более эффективные решения в сфере обработки естественного языка.
Deepseek в X (Twitter)

✔️ Alibaba объявила об инвестициях в размере 53 млрд долларов в создание облачной и аппаратной инфраструктуры ИИ.

Alibaba Group планирует инвестировать более 380 миллиардов юаней (около 53 миллиардов долларов США) в развитие облачной инфраструктуры и технологий ИИ в течение следующих 3 лет. Объем этой инвестиция превышает все предыдущие вложения Alibaba в облачные технологии и ИИ за последнее десятилетие и является крупнейшей инвестицией частной китайской компании в эту сферу. Решение об инвестировании было принято на фоне бурного роста индустрии ИИ в Китае и после совещания с участием высших китайских руководителей, посвященного частным предприятиям.
english.news.cn

✔️ Google опубликовала тарифы на Veo 2: 50 центов за секунду.

Согласно информации на странице проекта, каждая секунда сгенерированного видео обойдётся пользователям в 50 центов. Это означает, что минута видео будет стоить $30, а час — $1800. Для сравнения, инженер Google DeepMind Джон Бэррон привёл пример с бюджетом фильма «Мстители: Финал», где стоимость одной секунды составила около $32 000.

Veo 2 пока не способен генерировать длинные видеоролики, модель ориентирована на продолжительность генерации до двух минут. Тем не менее, такие цены вызывают вопросы о доступности технологии для широкого круга пользователей.
techcrunch.com

✔️ MongoDB приобретает компанию Voyage AI для борьбы с галлюцинациями.

MongoDB приобрела компанию Voyage AI за 220 млн. долларов, чтобы помочь своим клиентам создавать более качественные приложения на основе ИИ. Сделка направлена на обеспечение высокоточной и релевантной выдачи информации, тесно интегрированной с операционными данными.

Технология Voyage AI позволяет извлекать смысл из специализированных текстов и неструктурированных данных: юридических и финансовых документов, изображений и корпоративных баз знаний. Объединение этих технологий с инфраструктурой MongoDB позволит создать максимально надежное решение для разработчиков ИИ.
bloomberg.com

✔️ Perplexity анонсировала собственный AI-браузер Comet.

Perplexity AI готовится к запуску собственного веб-браузера под названием Comet. Компания заявила, что Comet "переосмыслит" сам подход к веб-серфингу, подобно тому, как Perplexity изменила представление о поиске информации. Этот анонс может стать прямым вызовом Google, доминирующим в сфере браузеров. Дата релиза пока неизвестна, но доступна запись в лист ожидания по ссылке.
zdnet.com

@ai_machinelearning_big_data

#news #ai #ml
25.02.2025, 11:25
t.me/data_math/705
2
10
993
Победи DeepFake!

Участвуй в Kryptonite ML Challenge и создай решение для распознавания лиц. Призовой фонд – 600 000 рублей.

Регистрация до 28 февраля: https://cnrlink.com/kryptonitemldsmath

Приглашаем молодых специалистов и профессионалов в областях Data Science, Machine Learning и Computer Vision.

Тебе предстоит создать модель, которая умеет:
🔹 распознавать фальшивые изображения;
🔹 сравнивать реальные фотографии одного и того же человека;
🔹 различать снимки разных людей.

Участвуй и ты сможешь:
🔸 получить шанс разделить призовой фонд в 600 000 рублей;
🔸 разработать решения в области Machine Learning и Computer Vision;
🔸 прокачать скиллы в Computer Vision, Metric Learning и Face Recognition.

Этапы Kryptonite ML Challenge:
▪️ 1-28 февраля. Регистрация участников
▪️ 1 марта. Открытие хакатона
▪️ 1-9 марта. Работа над проектами
▪️ 16 марта. Питчинг и награждение победителей

Зарегистрируйся сейчас: https://cnrlink.com/kryptonitemldsmath?erid=2W5zFHXEQDe

Реклама. АО "НПК "КРИПТОНИТ". ИНН 9701115253.
25.02.2025, 10:23
t.me/data_math/704
Репост
21
839
21.02.2025, 12:55
t.me/data_math/702
Репост
21
843
21.02.2025, 12:55
t.me/data_math/703
Репост
5
21
711
🌟 ReasonFlux: математические рассуждения для LLM.

ReasonFlux - методика, которая используется как для обучения, так и для инференса, чтобы повысить способность LLM к сложному логическому мышлению. Применение метода позволяет превосходить OpenAI o1-preview и DeepSeek V3 в задачах математического рассуждения.

При использовании в обучении ReasonFlux использует иерархическую структуру с подкреплением на последовательности высокоуровневых шаблонов мышления. Это позволяет базовой LLM научиться планировать оптимальную траекторию шаблонов для решения сложных задач. В процессе обучения ReasonFlux анализирует и обобщает информацию о решении задач, выявляя общие закономерности, и на основе этого создает шаблоны мышления.

Во время инференса ReasonFlux автоматически извлекает релевантные шаблоны мышления и масштабирует их для достижения превосходной производительности в сложных задачах рассуждения. Он динамически выбирает наиболее подходящий шаблон высокого уровня для каждой подзадачи, упрощая поиск путей рассуждений. ReasonFlux использует новую систему масштабирования во время вывода, которая адаптирует шаблоны мышления.

В экспериментальных тестах ReasonFlux-32B достиг 91,2% точности на MATH benchmark, опередив o1-preview на 6,7%. На AIME benchmark модель решила в среднем 56,7% задач, превзойдя o1-preview и DeepSeek-V3 на 27% и 45% соответственно.

Практическая реализация метода доступна в репозитории проекта, в нем cодержится необходимый код и описание для файнтюна LLM на примере SFT-датасета решений GaoKao Bench.

⚠️ Для трейна моделей на SFT-сете проект использует фреймворк LLaMA-Factory.

▶️ Локальная установка и запуск:

# Clone the repository
git clone https://github.com/ReasonFlux
cd ReasonFlux

# Create a Conda venv
conda create -n ReasonFlux python==3.9
conda activate ReasonFlux

# Install dependencies
pip install -r requirements.txt

# When you complete your first-stage training, you can try to use simple inference
from reasonflux import ReasonFlux

reasonflux = ReasonFlux(navigator_path='path-to-navigator',
template_matcher_path='jinaai/jina-embeddings-v3',
inference_path='path-to-infernece-model',
template_path='template_library.json')
problem = """Given a sequence {aₙ} satisfying a₁=3, and aₙ₊₁=2aₙ+5 (n≥1), find the general term formula aₙ"""

📌Лицензирование: Apache 2.0 License.


🟡Arxiv
🟡SFT Датасет (на китайском)
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #LLM #ReasonFlux
21.02.2025, 12:55
t.me/data_math/701
Репост
5
14
849
⚡️ Microsoft создала первый в мире квантовый чип на основе топологических кубитов.

Microsoft совершила прорыв в области квантовых вычислений, представив чип Majorana 1, который использует новую архитектуру Topological Core. Чип создан с применением уникального материала — топологического сверхпроводника и позволяет управлять частицами Майораны, делая кубиты более стабильными и масштабируемыми.

Основное преимущество новой технологии — её устойчивость к ошибкам на аппаратном уровне. В отличие от существующих аналогов, Majorana 1 позволяет контролировать кубиты цифровым способом, делая процесс вычислений более надёжным. Учёные Microsoft разместили 8 топологических кубитов на чипе, который в будущем сможет масштабироваться до миллиона.
news.microsoft.com

⚡️ Microsoft представляет Muse: первый генеративный ИИ для игровой индустрии.

Muse — первая в мире модель, способная генерировать визуальные элементы и игровые действия. Разработанная в сотрудничестве с Xbox Game Studios и Ninja Theory, модель Muse использует данные из игры Bleeding Edge, чтобы предсказывать и создавать последовательности игрового процесса.

Muse показала впечатляющие возможности, генерируя сложные сцены, которые остаются согласованными на протяжении нескольких минут. Модель обучалась на более чем миллиарде изображений и действий ( это примерно 7 лет непрерывного игрового процесса). Уникальность Muse заключается в её способности не только воспроизводить, но и предсказывать развитие игровых событий.

Microsoft также представила WHAM Demonstrator — инструмент для взаимодействия с Muse и экспериментировать с её возможностями.
Muse и WHAM Demonstrator доступны на платформе Azure AI Foundry.
microsoft.com

✔️ Физики приблизили ИИ к "бесконтрольному обучению".

Исследователи из Университета технологий Сиднея представили новый алгоритм Torque Clustering (TC), который умеет находить закономерности в данных без участия человека. Вдохновленный процессом слияния галактик, этот метод позволяет ИИ учиться самостоятельно, кратно сокращая необходимость в ручной разметке данных. Алгоритм уже показал высокие результаты, достигнув точности в 97,7% на 1 тыс. датесетах.

В отличие от традиционного ИИ, который требует огромного количества размеченных данных, TC работает по принципу естественного наблюдения, подобно тому, как животные изучают окружающий мир.
studyfinds.org

✔️ DeepSeek рассматривает возможность внешнего финансирования.

DeepSeek объявил о намерениях привлечения дополнительного внешнего финансирования, поскольку планирует трансформироваться из исследовательской лаборатории в коммерческую организацию.
Первой выразила намерение инвестировать Alibaba Group, на запрос также откликнулись китайские компании и фонды с государственным участием : China Investment Corporation, National Sovereign Wealth Fund и National Social Security Fund.

Помимо инвестиций, DeepSeek рассматривает варианты использования ЦОД в Юго-Восточной Азии для расширения ресурсов и доступа к дополнительными GPU Nvidia.
theinformation.com

✔️ Google создает ИИ-ассистента для ускорения научных исследований.

"Со-ученый" на базе ИИ от Google ускоряет биомедицинские исследования, помогая исследователям находить пробелы в знаниях и предлагать новые идеи. По словам Алана Картикесалингама, старшего научного сотрудника Google, цель проекта — дать ученым "суперспособности" для более быстрого достижения научных открытий.

Инструмент уже прошел первые испытания с участием экспертов из Стэнфордского университета, Колледжа Лондона и больницы Houston Methodist. В одном из случаев ИИ смог за несколько дней прийти к тем же выводам, что и команда ученых из Лондона, которые потратили на исследование несколько лет.

Архитектура построена на нескольких ИИ-агентов, каждый из которых выполняет свою роль: один генерирует идеи, другой анализирует и оценивает их. Модель способна извлекать информацию из научных статей и специализированных баз данных, а затем предлагать исследователям ранжированный список гипотез с объяснениями и ссылками на источники.
research.google

@ai_machinelearning_big_data

#news #ai #ml
20.02.2025, 15:45
t.me/data_math/700
8
1.3 k
career_06 ОШ Т1 это(2) (1).mp4
Что такое Открытые школы Т1?

Отвечают выпускники, которые уже прошли обучение и присоединились к команде ИТ-холдинга Т1 — смотри и вдохновляйся на собственный карьерный рост 💡

🎯 Готов к переменам?

Открытые школы Т1 — это:

📌 бесплатный ИТ-интенсив для системных аналитиков с годом опыта

📌 гибкий формат, практические навыки и поддержка экспертов для подготовки к работе мечты

📌 возможность оффера в аккредитованный ИТ-холдинг с масштабными проектами и классными бонусами

Сделай 2025 год началом новой карьерной главы! Регистрируйся до 14 марта, старт обучения — 17.03! 🚀

Информация о рекламодателе
20.02.2025, 13:43
t.me/data_math/699
16
84
1.4 k
🧠 Современные методы статистической теории в машинном обучении

- Видео
- Colab
- Полный курс

@data_math
19.02.2025, 09:42
t.me/data_math/698
Репост
10
54
1.0 k
📚 "Painful intelligence: What AI can tell us about human suffering

Эта бесплатная книга — путеводитель по миру машинного обучения!

Основное, что в ней рассматривается:
• Базовые концепции: Алгоритмы, математические основы и принципы построения моделей.
• Глубокое обучение: Нейронные сети, методы оптимизации и регуляризация для повышения качества моделей.
• Практические кейсы: Реальные примеры применения ML в различных отраслях, от анализа данных до прогнозирования.
• Современные методики: Настройка гиперпараметров, интерпретация результатов и стратегии улучшения производительности.

Для специалиста по машинному обучению эта книга станет полезным ресурсом, помогая углубить знания, найти новые подходы и повысить эффективность проектов.

📚 Книга

@data_analysis_ml


#freebook #book #ai #ml #machinelearning #opensource
18.02.2025, 14:29
t.me/data_math/697
13
67
1.2 k
🔥 Большой бесплатный курс по работе с блокчейном от MIT!

🔗 Ссылка: *клик*

#курс #blockchain
16.02.2025, 15:27
t.me/data_math/696
Репост
10
33
1.0 k
🔥 Microsoft только что выпустила впечатляющий инструмент - OmniParser V2, который может превратить любого LLM в агента, способного использовать компьютер.

Он решает две ключевые проблемы GUI-автоматизации:

- Обнаружение интерактивных элементов.
Традиционно LLM испытывают трудности с определением мелких иконок и других элементов пользовательского интерфейса. OmniParser V2 «токенизирует» скриншоты – переводит изображение экрана из пиксельного пространства в структурированные данные, представляющие интерактивные объекты.

Понимание семантики интерфейса.
Инструмент структурирует информацию так, чтобы LLM могли проводить поиск по элементам и предсказывать следующее действие на основе полученной информации.

Плюсы OmniParser V2
- Повышенная точность:
Благодаря обучению на большем объеме данных для обнаружения интерактивных элементов и функциональных описаний иконок, OmniParser V2 существенно улучшает точность даже для очень маленьких элементов по сравнению с предыдущей версией .

Сокращение задержки:
- Оптимизация размера изображения в модели описания иконок позволила снизить задержку на 60% по сравнению с предыдущей версией, что делает его более оперативным в реальном времени.

Гибкость и интеграция:
- OmniParser V2 легко интегрируется с современными LLM, такими как GPT-4o, DeepSeek, Qwen и Anthropic Sonnet. Это позволяет комбинировать распознавание интерфейса, планирование действий и их исполнение в одном конвейере.

Поддержка тестов через OmniTool:
- Для быстрого тестирования различных настроек агентов разработана платформа OmniTool – docker-решение на базе Windows, содержащее все необходимые инструменты для экспериментов.

Минусы и ограничения
- Требования к техническим навыкам:
Для развертывания и интеграции OmniParser V2 требуется определённый уровень технической подготовки, особенно если вы планируете экспериментировать с настройками через OmniTool.

Ограничения в безопасности:
- Из соображений ответственного использования (Responsible AI), рекомендуется применять OmniParser V2 только к скриншотам, не содержащим чувствительной или личной информации. Это помогает минимизировать риски утечки данных , .

Исследовательская стадия:
На данный момент инструмент ориентирован на исследовательские и экспериментальные задачи, и его коммерческое использование может требовать доработок или адаптации под конкретные задачи.

Как пользоваться OmniParser V2:

Развертывание через OmniTool:
Для упрощения экспериментов Microsoft разработала OmniTool – dockerизированную систему на базе Windows. Запустив OmniTool, вы получите преднастроенную среду, в которой OmniParser V2 может работать с различными LLM.

Подготовка скриншотов:
Сделайте скриншоты пользовательского интерфейса, которые хотите автоматизировать. OmniParser V2 обработает изображение, преобразовав его в структурированные данные, где каждому интерактивному элементу будет присвоен уникальный токен.

Интеграция с LLM:
Передайте полученные данные выбранной языковой модели. LLM, получив «токенизированный» интерфейс, сможет проводить retrieval-based next action prediction, то есть предсказывать следующее действие пользователя на основе распознанных элементов.

Исполнение действий:
После того как LLM определит, какое действие следует выполнить (например, нажатие на кнопку или выбор меню), система может автоматизированно выполнить это действие в графическом интерфейсе.

OmniParser V2 существенно расширяет возможности LLM, превращая их в эффективных агентов для работы с графическими интерфейсами.

▪GitHub → https://github.com/microsoft/OmniParser/tree/master

▪Official blog post → https://microsoft.com/en-us/research/articles/omniparser-v2-turning-any-llm-into-a-computer-use-agent/

▪Hugging Face → https://huggingface.co/microsoft/OmniParser-v2.0

@data_analysis_ml
15.02.2025, 14:11
t.me/data_math/695
16
13
1.1 k
Евгений Разинков – преподаватель ML в Казанском университете с многолетним стажем, руководитель собственной команды ML-инженеров и автор популярного канала по машинному обучению на YouTube

приглашает вас в свою AI-школу.

Особенности:
• теория и практика
• акцент на самостоятельную реализацию архитектур с нуля
• полное понимание того, что происходит внутри нейронной сети
• архитектуры от сверточных нейронных сетей до трансформеров и языковых моделей.

Регулярные живые QA-сессии, дружное комьюнити, а также компетишены, где можно будет посоревноваться (в командах и поодиночке) в решении ML задач.

От вас: владение Python и знание основ классического ML (регрессия, классификация, градиентный спуск).
Если классический ML не знаете - есть базовые курсы по ML.

7 месяцев, 4 курса:
• AI: от основ до языковых моделей
• Math for AI - необходимый математический бэкграунд
• MLOps - всё про жизненный цикл модели, логирование, версионирование, docker
• Decision making in AI - управление AI-проектом и стратегия

В рамках Capstone Project вы с нуля реализуете и обучите небольшую языковую модель для генерации простых историй, а также выведете ее в продакшн.

Полная стоимость за 7 месяцев (все 4 курса):
• 112 000 рублей (единоразово)
или
• 17 000 рублей в месяц
Если материалы вам не понравятся, мы вернем деньги за текущий оплаченный месяц (и последующие при единоразовой оплате)!

Старт уже 17 февраля, скорее регистрируйтесь здесь!

Еще больше подробностей о курсе ищите в видео и на странице с отзывами участников.

Кстати, теоретические видео курса AI: от основ до трансформеров находятся в открытом доступе на канале Евгения!

ООО «Лаборатория Евгения Разинкова», ИНН: 5043088023, erid: 2VtzqxKcuC1
15.02.2025, 12:11
t.me/data_math/694
Репост
1
18
882
🌟 Oumi: опенсорс-фреймворк полного цикла для LLM.

Oumi - открытая платформа для разработки, файнтюна, оценки и экспериментов с языковыми и мультимодальными моделями, созданная совместными усилиями исследователей из 13 ведущих университетов.

Oumi предоставляет инструменты и рабочие процессы для разработки и запуска масштабных экспериментов на кластере, развертывания моделей в рабочей среде и поддерживает методы распределенного обучения (FSDP, DDP):

🟢обучение и файнтюн моделей от 10M до 405B параметров методами SFT, LoRA, QLoRA и DPO;
🟢поддержку популярных семейств моделей: Llama, DeepSeek, Qwen и Phi;
🟢синтез и курирование обучающих данных с использованием LLM-judge;
🟢быстрое развертывание моделей в средах vLLM и SGLang;
🟢проведение комплексного бенчмаркинга моделей по стандартным тестам;
🟢возможность подключения по API OpenAI, Anthropic и Vertex AI;
🟢интеграция с библиотекой Transformers.

В репозитории проекта собраны готовые ноутбуки и скрипты для каждого из этапов жизненного цикла моделей, а подробная документация по использованию поможет легко освоить эту платформу.

📌Лицензирование: Apache 2.0 License.


🟡Статья
🟡Документация
🟡Сообщество в Discord
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #Oumi #Framework
14.02.2025, 18:03
t.me/data_math/692
Репост
18
906
14.02.2025, 18:03
t.me/data_math/693
4
10
1.4 k
Авито нанимает!

Ускоренный отбор за выходные и возможность попасть в одну из пяти DS-команд: автомодерация, монетизация, поисковое ранжирование, AI Lab и вертикальные команды DS.

Вас ждет:
➡️ конкурентная зарплата и удаленка по всей России;
➡️ реальные задачи на большом масштабе — разработка алгоритмов для проверки объявлений, внедрение ML-моделей, оптимизация процессов и DS-поддержка;
➡️ участие в разработке новых продуктов — предлагаем для этого мощное железо и бюджет на обучение;
➡️ сильное IT-комьюнити, которое любит опенсорс.

Регистрируйтесь по ссылке до 27 февраля и развивайте крупнейший в мире сервис объявлений.
14.02.2025, 16:01
t.me/data_math/691
31
37
1.7 k
13.02.2025, 15:22
t.me/data_math/690
Репост
13
52
1.3 k
Mathematics for Machine Learning

📚 Book

@datascienceiot
13.02.2025, 12:46
t.me/data_math/689
Репост
8
4
1.0 k
✔️ Apple нашла партнера для развертывания ИИ в Китае.

Apple разрабатывает и запускает Apple Intelligence AI в Китае в партнерстве с Alibaba. Ранее компания тестировала различные модели ИИ от китайских разработчиков и выбрала Baidu в качестве основного партнера, но затем отказалась от этого соглашения из-за несоответствия стандартам Apple. Среди других рассматриваемых партнеров были Tencent, ByteDance и DeepSeek. Apple отказалась от сотрудничества с DeepSeek из-за недостатка опыта и персонала для поддержки компании масштаба Apple.

В последнем квартале продажи Apple в Китае упали на 11,1%, что является самым большим падением доходов с аналогичным кварталом 2024 года. Инструменты Apple Intelligence стимулируют спрос на устройства, но правительство Китая требует от от Apple сотрудничества с местными разработчиками.
theinformation.com

✔️ CEO Google выступил на Саммите по ИИ в Париже.

Сундар Пичаи заявил, что ИИ — технология, которая появляется раз в жизни, способная демократизировать доступ к информации в большей степени, чем интернет. Он отметил, что за 18 месяцев стоимость обработки одного токена снизилась на 97%. Google уже более 10 лет инвестирует в ИИ, чтобы систематизировать мировую информацию, делая ее доступной для всех.

Гендир Google рассказал о прогрессе в области квантовых вычислений и автономных автомобилей, расширении доступа к информации через возможности Google Translate, а AlphaFold уже используется 2,5 миллионами исследователей для создания вакцин против малярии, методов лечения рака и ферментов, перерабатывающих пластик.

В конце выступления, Сундар поделился планами об инвестициях 75 млрд. долл. в капитальные затраты в 2025 году и призвал к созданию глобальной политики, которая поддержит инновации и согласованность между странами в регулировании ИИ.
blog.google

✔️ Цукерберг активизирует наем инженеров машинного обучения для свое компании, сокращая тысячи сотрудников.

IT-гигант планирует ускорить наем ML-инженеров в ближайшие недели, несмотря на сокращение 5% штата( это примерно 4000 рабочих мест). Компания начала уведомлять своих сотрудников о сокращении в США, Европе и Азии.

Марк Цукерберг заявил о намерении повысить требования к управлению производительностью и быстрее избавляться от низкоэффективных сотрудников. Его компания планирует провести собеседования в формате ML Batch Day с 11 февраля по 13 марта.
HR-департамент ищет сотрудников, имеющих опыт проведения собеседований, для помощи в проведении 420 собеседований с инженерами-программистами, 225 поведенческих собеседований и 50 собеседований по проектированию систем машинного обучения.
businessinsider.com

✔️ Google добавила NotebookLM Plus в план One AI Premium.

Подписчики One AI Premium получат доступ к NotebookLM Plus без дополнительной платы с повышенными лимитами использования и премиальные функции настройки ответов сервиса NotebookLM.
Сейчас Google предлагает One AI Premium за 19,99 долларов в месяц с 2 ТБ хранилища и доступом к Gemini Advanced и Gemini в приложениях Workspace (Gmail и Docs). Студенты старше 18 лет в США могут получить One AI Premium за 9,99 долларов в месяц в течение 1 года.

NotebookLM Plus имеет расширенные интерактивные функции: видео на YouTube в качестве источника и преобразование в подкаст с двумя AI-ведущими, с которыми также можно общаться.
theverge.com

✔️ ByteDance анонсировала Goku: модели генерации изображений и реалистичного видео.

ByteDance представила новые модели Goku, которые генерируют реалистичные видеоролики с участием людей, взаимодействующих с предметами. В отличие от других видеомоделей, Goku может создавать как статичные изображения, так и видео из текстовых описаний. По тестам ByteDance, Goku превосходит Kling и Pika в бенчмарках генерации изображений и видео.

Goku+, специальная версия, ориентирована на создание рекламного контента. ByteDance утверждает, что она сможет снизить затраты на продакшен видеорекламы на 99%. Компания планирует использовать TikTok для предоставления сервиса рекламодателям.
saiyan-world.github.io

@ai_machinelearning_big_data

#ainews #news #ml
12.02.2025, 13:17
t.me/data_math/688
1
14
1.3 k
Изучите Computer Vision за 3 занятия

Как искусственный интеллект опознает объекты? Что такое Deep Learning? Какие задачи может решать компьютерное зрение? Как обучить нейросеть, чтобы она могла различить схожие объекты?

На все эти вопросы вы узнаете ответы на зимнем онлайн-буткемпе «Мир глазами машины: классификация и детекция»:

👨🏼‍🏫 Интенсив // 3 занятия на погружение в Computer Vision: обзор задач области, решение задач классификации и детекции
👩🏻‍💻 Практика // домашние задания для отработки полученных навыков
🏆 Соревнование // задача детектирования объектов на изображениях.

Когда: 15-26 февраля
Формат: онлайн

🔗 Зарегистрироваться

Буткемп организует онлайн-магистратура «Искусственный интеллект» факультета компьютерных наук НИУ ВШЭ.
11.02.2025, 12:03
t.me/data_math/687
8
59
1.4 k
🧠 Разбираем Функцию Радемахера. Машинное обучение Курс математики

- Видео
- Урок 1 / Урок2 / Урок3 / Урок4 / Урок5 /
- Урок6/ Урок7/ Урок8 / Урок9
- Colab
-Полный курс

@data_math
11.02.2025, 10:02
t.me/data_math/686
Репост
20
194
1.3 k
👨‍🎓 Algorithmica

Это бесплатный учебник с открытым доступом, посвященная изучению алгоримтов.

В нем можно найти абсолютно любой алгоритм с кодом и хорошим объяснением.

Учебник на русском
На английском
Github

@golang_google
10.02.2025, 12:03
t.me/data_math/681
Репост
195
1.3 k
10.02.2025, 12:03
t.me/data_math/685
Репост
194
1.3 k
10.02.2025, 12:03
t.me/data_math/682
Репост
195
1.3 k
10.02.2025, 12:03
t.me/data_math/683
Репост
194
1.3 k
10.02.2025, 12:03
t.me/data_math/684
Репост
10
78
1.4 k
Mathematical Foundations of Reinforcement Learning

📚 Книга

@datascienceiot
9.02.2025, 11:22
t.me/data_math/680
19
189
1.6 k
🔥 math - учебный план для самостоятельного изучения математики, разработанный Open Source Society University (OSSU)!

💡 Он предназначен для тех, кто хочет получить фундаментальные знания в области математики, используя онлайн-материалы. Курсы, включенные в программу, соответствуют требованиям бакалавриата по математике, за исключением общих (не математических) дисциплин, и часто предоставляются такими ведущими университетами, как Гарвард, MIT и Стэнфорд.

🖥 Github

@data_math
8.02.2025, 14:18
t.me/data_math/679
4
9
1.7 k
⚡️Легкий способ получать свежие обновления и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь:

МАШИННОЕ ОБУЧЕНИЕ: t.me/ai_machinelearning_big_data
C++ t.me/cpluspluc
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Хакинг: t.me/linuxkalii
Devops: t.me/DevOPSitsec
Data Science: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_ci
Java: t.me/javatg
Базы данных: t.me/sqlhub
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Docker: t.me/DevopsDocker
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
Собеседования МЛ: t.me/machinelearning_interview
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: https://t.me/gamedev
Haskell: t.me/haskell_tg
Физика: t.me/fizmat

💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://t.me/addlist/mzMMG3RPZhY2M2Iy

😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://t.me/addlist/BkskQciUW_FhNjEy
8.02.2025, 13:03
t.me/data_math/678
45
69
3.3 k
@data_math
6.02.2025, 19:35
t.me/data_math/677
13
84
1.3 k
⭐️ Мичиганский курс «Робототехника 501: Математика для робототехники».

📽️ Лекции: https://youtube.com/playlist?list=PLdPQZLMHRjDIzO99aE7yAtdOHSVHMXfYH
🗒️ Github: https://github.com/michiganrobotics/rob501

@data_math
4.02.2025, 08:35
t.me/data_math/676
34
36
1.8 k
Геометрия за 1 минуту

@data_math
3.02.2025, 20:48
t.me/data_math/675
16
39
1.9 k
Рекомендую посмотреть на возможность повышения квалификации по теме "Машинное обучение. Искусственные нейронные сети и генетические алгоритмы"! Эти курсы организует НИИ ядерной физики имени Д.В.Скобельцына при Московском Государственном Университете имени М.В.Ломоносова.

Занятия проходят дважды в неделю вечером, начиная с 25 февраля 2025 года.

После успешного завершения программы можно получите официальное удостоверение от МГУ 😎

Начало 25 февраля, по 2 занятия в неделю (посещать можно очно на территории университета, а также подключаться онлайн через zoom).


Подробнее

@data_math
3.02.2025, 18:44
t.me/data_math/674
36
32
1.6 k
@data_math
1.02.2025, 18:32
t.me/data_math/673
8
42
1.2 k
Видеолекции, UC Berkeley CS 194-196 / 294-196 Large Language Model Agents fall 2024, by Dawn Song & Xinyun Chen

https://rdi.berkeley.edu/llm-agents/f24

@data_math
28.01.2025, 10:17
t.me/data_math/672
Репост
36
978
27.01.2025, 19:02
t.me/data_math/671
Репост
35
972
27.01.2025, 19:02
t.me/data_math/670
Репост
14
35
895
⚡️ Мл сообщество активно обсуждает успехи Китая и DeepSeek-R1, в частности, в гонке за доминирование на рынке ИИ.

Релиз R1 и новости об инвестировании в развитие отрасли, вызвали падение акций американских ИТ-гигантов на бирже NASDAQ.

Но помимо R1 в этом месяце разработчики из Китая выпустили еще очень много интересных моделей 🔥 Китай набирает очень серьезные обороты,

Давайте посмотрим на список самых ярких релизов из Поднебесной за январь:

LLM:
InternLM3-8B-Instruct
MiniMax-Text-01
RWKV-7 RNN + трансформер 👀
Собственно сам DeepSeek-R1
Baichuan-M1-14B медицинский LLM 🩺
Qwen2.5-Math-PRM от Alibaba
Qwen2.5 -1M


Модели кодинга:
Tare от BytedanceTalk

TTS модели синтеза и генерации речи:
T2A-01-HD от MiniMax AI
LLaSA

МЛЛМ:
Kimi k1.5 от Moonshot AI
MiniCPM-o-2_6 от OpenBMB
Sa2VA-4B от ByteDanceOSS
VideoLLaMA 3 от Alibaba DAMO
LLaVA-Mini от Китайской академии наук

Hunyuan-7B от TXhunyuan
Hunyuan 3D 2.0

ИИ-агенты:
UI-TARS от ByteDanceOSS
✨ GLM-PC

Датасеты:
Fineweb-Edu-Chinese-V2.1
Multimodal_textbook от Alibaba
MME-Finance от Hithink AI
GameFactory от KwaiVGI

📌 Полный список Релизов

@ai_machinelearning_big_data


#ai #ml #digest #china #deepseek #Alibaba
27.01.2025, 19:02
t.me/data_math/669
6
2
1.3 k
Ваши задачи требуют мощных вычислительных ресурсов? Локальные мощности не справляются с обучением нейросетей?

immers.cloud предлагает решение:

💰 Экономия: тарифы от 23 рублей/час, оплата только за фактическое время использования
⚡️ Быстрый старт: видеокарты и серверы готовы к работе за пару минут.
📈 Гибкость и масштабируемость: 11 видеокарт на выбор, быстрый старт и масштабирование 
🔧 Удобство: готовые образы для ML задач, чтобы не тратить время на настройку

Платформа также предлагает образ Ubuntu 22.04 с предустановленными драйверами, библиотеками CUDA 12.3 и CudNN: с ним можно развернуть поверх него необходимые инструменты для обучения, разработки или работы с нейросетями.

🎁 Для наших подписчиков действует бонус: +20% бонус к пополнению баланса
27.01.2025, 16:22
t.me/data_math/668
9
52
1.4 k
Lots of math for CS & ML. Looks pretty interesting.

📚 Book
27.01.2025, 14:04
t.me/data_math/667
3
1.4 k
Как построить витрину данных, как в крупной IT-компании?

Объединение данных из разных источников — то, с чем в какой-то момент сталкиватся каждый аналитик или дата-инженер.

Представьте, что вы тренер футбольной команды. И у вас есть витрина данных, которая собирает информацию о каждом игроке, включая количество забитых голов, ассистов, время на поле и количество проведенных матчей. Такая витрина помогает выявить слабые места в команде и сфокусироваться на их улучшении.

Как строить витрину данных разберём в прямом эфире нашего бесплатного вебинара в режиме решения реальной рабочей задачи📊. Спикер вебинара — Айгуль Сибгатуллина, Data Engineer в Сбер.

Что будет на вебинаре:
• Построим воркфлоу от этапа получения ТЗ до создания полноценной витрины;
• Разберемся с методологией на разных диалектах;
• Узучим Spark в работе дата-инженера: преобразования, оптимизации, планы запросов;
• Используем AI для ускорения процессов.

🕗Встречаемся 28 января 19:00 по мск

Зарегистрироваться на бесплатный вебинар
27.01.2025, 12:04
t.me/data_math/666
Результаты поиска ограничены до 100 публикаций.
Некоторые возможности доступны только премиум пользователям.
Необходимо оплатить подписку, чтобы пользоваться этим функционалом.
Фильтр
Тип публикаций
Хронология похожих публикаций:
Сначала новые
Похожие публикации не найдены
Сообщения
Найти похожие аватары
Каналы 0
Высокий
Название
Подписчики
По вашему запросу ничего не подошло