Стажировка в Т Банк
(ML-инженер, зима-весна 2025)
Дедлайн: 30 января
тапай и проходи отборна прохождения теста даётся 20 минут🖤
Условия и ответы ниже👇
1. Какой вид имеет функция регрессии, формируемая классическим регрессионным деревом?
Линейной
Кусочно-постоянной
Кусочно-линейной
Полиномиальной
2. Выберите верные утверждения о числе решающих и терминальных вершин дерева решений
Число решающих вершин всегда меньше числа терминальных вершин
Число решающих вершин всегда больше числа терминальных вершин
Число решающих вершин равно числу терминальных вершин
Число терминальных вершин не больше числа решающих вершин
3. Зачем нужно проводить обрезку дерева?
Для повышения точности дерева на обучающей выборке
Для повышения обобщающих способностей дерева
Для увеличения однородности терминальных вершин
Для увеличения степени гладкости модельной функции регрессии или границ классов
4. Если для некоторого обучающего примера отношение вероятностей бинарного классификатора оказалось близким к 0, что это говорит о вероятности принадлежности этого примера к положительному классу?
Вероятность близка к 0
Вероятность близка к 1
Вероятность близка к 0.5
Ничего нельзя сказать о принадлежности
5. Мы обучаем дерево решений
При увеличении глубины дерева у модели
bias растёт, variance снижается
bias снижается, variance растёт
bias не изменяется, variance снижается
bias не изменяется, variance растёт
bias снижается, variance не изменяется
bias растёт, variance не изменяется
6. Что будет со значением roc-auc, если все предсказанные значения разделить на 2?
Увеличится на 2
Увеличится на 4
Уменьшится на 4
Не изменится
7. Что работает о быстрее на большом датасете k-Fold cv или LOO CV?
k-fold CV
LOO CV
Одинаково быстро
Одинаково медленно
8. В алгоритме бэггинга над решающими деревьями нужно брать
Большой глубины
Малой глубины
9. Для регрессии с MAE какая модель даст наименьшее значение лосса на обучающем датасете?
Ответ модели, которой является минимумом по таргету в обучающем датасете
Ответ по таргету, который является среднее по таргету в обучающем датасете
Ответ модели, который является медианой по таргету в обучающем датасете
Ответ модели, который является модой по таргету в обучающем датасете
10. Какую задачу решает логистическая регрессия?
Классификация
Регрессия
Кластеризация
Поиск аномалий
11. Пусть x- точка, лежащая на границе между классами, формируемыми логистической регрессией
Чему равно отношение шансов для этой точки?
0
1
0.5
Бесконечность
12. Значение логит-функции для некоторого примера оказалось равным 0
Что можно сказать о вероятности принадлежности этого примера к позитивному классу
logit(p)=sigma^(-1)(p)=ln(p/(1-p))
Равна 0
Равна 1
Равна 0.5
Ничего нельзя сказать
13. Чему равно отношение шансов для бинарного классификатора?
Отношению апостериорных вероятностей классов
Отношению априорных вероятностей классов
Отношению функций правдоподобия классов
Отношению линейных комбинаций признаков
14. Если мы хотим отобрать признаки нам стоит использовать L_1 или L_2 регуляризацию?
L_1
L_2
Любой из вариантов
15. Какова вероятность ошибки модели, являющейся голосованием трёх алгоритмов, ошибки которых 0.1 0.2 0.3 соответственно?
0.2
0.099
0.006
0.098
(считаем вероятность ошибки всех троих, затем только двоих из трёх: 1-го и 2-го, 2-го и 3-го, 1-го и 3-го ->вероятности суммируем)
P.s. помимо ML-part, обязательна к прохождению секция алгоритмов, не забудьте
Подготовка к ML@zadachi_ds