Telegram channel page: AI Safety. Основы • @alignmentbasics

Your trial period has ended!

For full access to functionality, please pay for a premium subscription

AI Safety. Основы

https://t.me/alignmentbasics

Channel age

Created

Language

Russian

ER (week)

ERR (week)

@anton_zheltoukhov , @monoid_center и друзья готовят к ai safety

Messages Statistics

Top categories

Main categories of messages will appear here.

Top mentions

The most frequent mentions of people, organizations and places appear here.

Found 4 results

AI Safety. Основы

164 subscribers

133

до нашего следующего запуска еще достаточно много времени. пока, можно податься на похожий курс от Коллаба

03/13/2025, 17:51

t.me/alignmentbasics/11

AI Safety. Основы

164 subscribers

180

Набор групп в рамках AI Safety Collab 2025

Для желающих пройти вводный курс по AI safety, появилась возможность присоединиться к набору AI Safety Collab 2025.

Программа: AI Alignment от AI Safety Atlas. Как пишут создатели, курс создан в сотрудничестве с экспертами из OpenAI, Кембриджа и CeSIA.

Даты: 31 марта – 23 июня 2025 (8 недель основного курса + 4 недели дополнительной проектной фазы)

Формат: онлайн или очно (если будет такой фасилитатор)
Языки: будет минимум одна группа на русском, вообще в проекте есть и англоязычные группы, можно присоединиться к одной из них (напишите это в анкете в примечаниях)

Стоимость: Бесплатно

Преимущества: сертификат LinkedIn по завершении

А если вы уже не новичок в вопросах AI safety и хотите стать фасилитатором:
1) вам вот в эту форму,
2) можете написать мне в ЛС если у вас есть вопросы.

Возможно будет фасилитатор только на одну русскоязычную группу, так что не затягивайте с подачей заявки.

Подробности программы описаны в самой форме заявки.
Дедлайн: 23 марта 2025
Подать заявку!

03/13/2025, 17:51

t.me/alignmentbasics/12

AI Safety. Основы

164 subscribers

960

Команда курса. Менторы

Лена Еричева
Приглашенный ментор. li. @eericheva

ML исследователь с 10-летним опытом в биотехнологиях и медтехе. В METR занимается AI Alignment и AI Safety: исследует возможности ИИ-моделей, разрабатывает бенчмарки и проводит Blue Teaming с фокусом на безопасности. Специализируется на компьютерном зрении, NLP и эффективном применении современных LLM и VLLM. А еще ведет канал Mrs Wallbreaker about AI Risk, AI Alignment, AI Safety, AI Ethics, AGI

Миша Селезнёв
Ментор. @exxxplainer

Исследователь в AIRI, работает над PhD, был в AI safety Camp, MATS, CHAI. Соавтор Obfuscated Activations Bypass LLM Latent-Space Defenses. Сейчас исследует высокоуровневые вопросы: Чему должна удовлетворять сильная AI система, чтобы мы могли назвать ее достаточно безопасной? Как связаны сложность/нечеткость постановки задачи с тем, насколько агентным должен быть тот, кто может ее решить? Что такое интерпретируемость? Что такое генерализация?

Настя Гайдашенко
Приглашенный ментор. li. @avgaydashenko

В прошлом датасаентистка. Училась в Академическом Университете в Питере. Закончила Technical University of Munich по AI Governance. Контрибьютила в технические стандарты для EU AI Act и AI Risk Management Standards Profile для NIST. Сейчас работает проджектом в FAR.AI. Работает с idais.ai. Член совета директоров ashgro.org

Артем Карпов
Приглашенный ментор. cv. @vpktra

Исследователь в Apart Research. На текущем проекте пытается выявить скрытые reasoning возможности llm (стеганография) с помощью RL. Прошел через MATS, ARENA, MLSS. Соавтор NeurIPS статьи Inducing Brain Bias. До сейфти занимался разработкой софта

Игорь Иванов
Приглашенный ментор. li. @baceolus

Исследователь в Oxford Biosecurity Group, где занимается бенчмарками и ред-тимингом с фокусом на оценку биологических рисков. Сейчас занимается оценками рисков от ИИ агентов, способных лгать и скрывать свои цели. Автор бенчмарка BioLP-bench. До этого работал 8 лет в биотехе и медицине. Готов вести проекты, как связанные с биологическими evals, так и с любыми другими, в зависимости от бекграунда и интересов студентов

Антон Желтоухов
Организатор курса. Ментор. li. @anton_zheltoukhov

Рисеч лид проекта Accounting for Capability Overhang. A step towards new evals в AI Safety Camp. Сейчас фокусируется на evals и промт оптимизиторах. Работал над аджендой Positive Attractors. Выпускник ARENA. В свободное время переносит инсайты из developmental psychology в safety, Narrative Theory. До сейфти 6 лет работал в it: qa, dev. MS системного анализа в питерском политехе. Ведет блоги the hard bits и you can (not) advance

Денис Моисеенко
Приглашенный ментор. li. @culpritgene

Независимый исследователь; 4.5 года в RnD - биоинформатика, графы знаний, NLP. Сейчас занимается агентными LLM системами для healthcare. Глубокие знания в области Geometric Deep Learning / Knowledge Graphs. Плавно переходит в AI Safety, участвует в проекте SPAR по autoregressive conditioning hypothesis. Основной интерес – нести геометрическую перспективу в MechInterp. MSc Skoltech (Life Science)

Антон Чайников
Ментор. @mx_xun

В рабочее время пишет компиляторы на хаскеле. В прошлом промышленный ML инженер. В свободное время рассказывает про высокую математику. Исследует Agent Foundations. Ищет ответы на вопросы: Каким образом градиентный спуск превращает случайные веса и данные в алгоритмы? Есть ли внутри нейросетей модели предметных областей? Как их найти и что-то с ними сделать? Как связать абстрактную теорию Agent Foundations с практикой ML / RL / MechInterp?

+ приглашенные менторы из Palisade Research

02/17/2025, 11:51

t.me/alignmentbasics/9

AI Safety. Основы

164 subscribers

11 k

📣 Open-call: Курс по основам AI Safety

ИИ меняет мир с безумной скоростью, но вместе с этим несет в себе серьезные риски. Задача AI Safety – позаботиться, чтобы эти изменения были положительными

Цель курса – дать базу для начала карьеры в AI Safety. Программа знакомит с основными концепциями, ландшафтом исследований и работами Anthropic, Redwood Research, MIRI

Этим курсом мы готовим людей себе в команды и в команды наших друзей из сейфти лаб. Поэтому курс бесплатный. По этой же причине делаем серьезный отбор кандидатов

Для кого?
➕Будущие рисечеры: ml'щики, физики, математики, программисты
➕Будущие фаундреры интересующиеся AI Safety

Программа из двух треков:
➕Учебный (4 недели): Знакомство с материалами в фасилитируемых группах
➕Проектный (7 недель): Работа с ментором нацеленная на публикацию

Экспертиза менторов покрывает: evals, agent foundations, adversarial attacks, representation engineering, safety field building, mechanistic interpetability

Сертификат и карьерная консультация по окончанию курса
Менторское сопровождение лучших проектов до публикации после курса

Детали:
➕Онлайн или в Москве в центре Моноид
➕Регистрация открыта до 21 февраля
➕Даты: 2 марта – 20 апреля
➕Нагрузка: 10-15 часов в неделю

По вопросам пишите @anton_zheltoukhov

➡️ Зарегистрироваться

02/08/2025, 19:05

t.me/alignmentbasics/7

Search results are limited to 100 messages.

Some features are available to premium users only.

You need to buy subscription to use them.

Filter

Reset filters

Publication date

Search in file name

Message type

Repost

Original

Deleted message

Message is not deleted