#28 Собеседование Data Scientist в Т-Банк | Теория + Лайфкодинг

Vadim Novoselov

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 4 лют 2025

КОМЕНТАРІ • 81

@XR0M 3 місяці тому ⁺⁸
спасибо за видос, нужно больше таких видео!)
забавная тенденция - чем выше грейд, тем проще вопросы
@wad881988 3 місяці тому ⁺¹⁰
Про интерпретацию ROC-AUC Дьяконов у себя в блоге хорошо написал. Это вероятность того, что два случайно взятых из выборки объекта разных классов будут упорядочены моделью корректно, то есть уверенность модели на объекте класса 1 будет выше, чем на объекте класса 0.
@prorider3424 3 місяці тому ⁺¹⁷
Собеседовался в т банк неделю назад, вопросы почти 1 в 1 были такие же 😂
@АртёмЮрченко-ж8ъ 3 місяці тому ⁺¹
+
@alevadnaya 3 місяці тому
Да, у них процесс собеседований сиандартизированный
@stanislav8566 2 місяці тому
Метишь на место Никиты? Ай-ай-ай
@bolshoy_brat9093 2 місяці тому
Очень круто! Спасибо!
@IDBaron Місяць тому
Очень круто 👏🏽
@irvi6552 3 місяці тому ⁺¹
ребят я поражаюсь что вы такие умные. это мне не на с++ фигнюшки писать..
@lerosh7894 3 місяці тому ⁺⁸
Кажется, это собес на стажера/джуна, на сеньорскую нлп позицию совсем другие вопросы)
@noname-bi7ve 3 місяці тому
какие?
@lerosh7894 3 місяці тому
@@noname-bi7ve обсуждали архитектуры современных языковых моделек, разные жадные алгоритмы кнн типа как устроен annoy, hnsw + задачка на мл дизайн
@noname-bi7ve 3 місяці тому ⁺¹
@@lerosh7894 ну про архитектуры моделек кажется релевантный вопрос, а вот про методы поиска ближайших соседей как будто бы излишне, это как с алгоритмами сортировки, ты просто их используешь) какие архитектуры обсуждали? что задизайнить задали?
@lerosh7894 3 місяці тому
@@noname-bi7ve там про методы поиска было в тему задачки на дизайн как раз, архитектуры энкодера, подробнее раскрывать задачу не хочу, некрасиво как по мне)
@alexanderyurchenko7022 2 місяці тому
Какую ЗП предложили?
@aleksandr7432 3 місяці тому
лайк за видео, коммент для алгоритмов ютуба
@sdeth9558 3 місяці тому
Я делал бустинг над линейными моделями с слоями активации. Норм работает но деревья будут лучше.😅
@Pizza-And-Cheese 3 місяці тому ⁺⁵
вообще не айтишник, не знаю зачем это включил и посмотрев хочу сказать одно - вы на каком языке говорите вообще и откуда его знаете? здесь же просто 0 чего-то известного и понятного обывателю, ужас)
@naumtsevalex 3 місяці тому ⁺¹
Кайф🎉
@ochiru8802 2 місяці тому ⁺¹
Блин гойс объясните а смысл учить ответы на вопросы собесов если можно просто разобраться + выучить саму теорию? Это как будто бы по времени быстрее (особенно если в базе >200 вопросов) и больше понимания предметной области даст не?). Я к тому что если вы знаете саму теорию хорошо вы и так на все вопросы ответите. А так контент в кайф, мои любимые видео это хамский собес и трэш собес в стиле азазина.
@fivel6436 3 місяці тому ⁺²
Вообще это точно т-банк судя по табличке. Но слишком лайт какой-то. Меня гораздо жеще спрашивали. Мейби позиция стажер-джун
@gernar228 3 місяці тому
Сеньоская позиция
@arti5946 3 місяці тому ⁺¹
А че у тебя спрашивали в кратце?
@fivel6436 3 місяці тому
@@gernar228 Явно тип немного напутал задания либо ему лень было что-то сложное спрашивать
@fivel6436 3 місяці тому
@@arti5946 Гораздо жеще за классику было. Скажем так не дефолтные вопросы
@misunderstood5622 3 місяці тому
@@fivel6436 А можешь поделиться конкретными вопросами?
@puser-42 3 місяці тому
Поставил поставил я лайк, хватит держать этот неловкий зрительный контакт
@viviandamorblok 3 місяці тому ⁺¹
У них задача на дебаггинг одна и та же уже 3 года 🥴
@ИванКутиков-з8и 3 місяці тому ⁺¹⁶
Бессмысленно использовать линейне модели в бустинге, потому что комбинация линейных моделей линейна
@arti5946 3 місяці тому ⁺³
Тогда Вадимыч тут просчитался чутка, он также включил туда же логистическую регрессию, а там есть сигмоида, которая как раз таки и добавляет этой самой нелинейности. По сути бустинг лог регресси это и есть нейронка
@gernar228 3 місяці тому ⁺²
ты прав, бессмысленно только для линейной регрессии
но на логистической не запускал, интересно что будет
@vanerk_ 3 місяці тому ⁺¹
@@gernar228 бустинг на каждой итерации учится на mse на градиент по предыдущей комбинации, поэтому туда никак нельзя запихнуть логистическую регрессию.
@dmitrywadokai 3 місяці тому ⁺¹
Логистические регрессии бустить можно т.к. сигмоида даст нелинейность.
В xgboost можно использовать линейную модель как базовый алгоритм через параметр booster:’gblinear’. (Но это уже не чистый бустинг, там нет ансамбля моделей). На практике это может быть полезно для прогнозирования временных рядов т.к. линейная модель умеет экстраполировать.
@rtgiyrefbgowigi3406 3 місяці тому
любая комбинация линейных моделей линейна?
@Амир-д5р 3 місяці тому ⁺¹
Го пайтон бэкенд
@mikyouber 3 місяці тому
Можно, пожалуйста, пояснительную бригаду на подсчёт ROC-AUC, и других метрик по табличке?
@tihnik 3 місяці тому ⁺¹
Для ROC-AUC:
Ось Ox разбиваешь на такое кол-во равных интервалос, сколько объектов 0 класса в выборке, ось Oy - сколько объектов 1 класса. Сортируешь выборку по предсказаниям модели от большего к меньшему. Идешь сверху вниз и смотришь на колонку таргет. Если встретил объект 1 класса шаг вверх, объект 0 класса - вправо, если объекты 1 и 0 класса имеют одинаковое предсказание - по диагонали. Зачастую на собесе получается трапеция или трапеция и треугольник, у которых легко посчитать площадь.
Остальные метрики легко загуглить.
@artemiy568 3 місяці тому ⁺¹
@@tihnikroc auc не так строится. Для каждого порогового значения ищется tpr и fpr и отмечается координата на графике. Через все полученные координаты проводится линия (roc). Задача с собеса сводится к тому чтобы найти координату для одного порога
@tihnik 3 місяці тому ⁺¹
@@artemiy568 Алгоритм, который я описал также корректно посчитает roc-auc
@noname-bi7ve 3 місяці тому
@@artemiy568 ты бы не позорился, @tihnik все правильно написал, это и есть roc кривая в координатах fpr-tpr
@ymao1234 3 місяці тому
Как думаете дадут оффер если мне 17 и пройду собес хорошо ?
@gernar228 3 місяці тому ⁺¹
когда 18 исполнится дадут
@liberal_democrat_usa7921 15 днів тому
брооо ты офигеешь но мне тож 17 и я завтра в тинькофф иду на собес,надеюсь получится
@НиколайБезмен 3 місяці тому ⁺¹
А его взяли в итоге?
@tihnik 3 місяці тому ⁺²
были финалы в две команды, предложили пойти в команду, которая меньше понравилась по задачам. В итоге вышел работать в другое место
@чел-в1ц3т 3 місяці тому
@@tihnikподскажи, какие разделы математики нужны для data science?
@tihnik 3 місяці тому ⁺¹
@@чел-в1ц3т в основном теор вер нужен для построения доверительных интервалов, проверке гипотез. Из матана для работы в классическом МЛ сложнее градиентного спуска в большинстве случаев ничего не требуется
@MrRazgildyai 3 місяці тому ⁺¹
ROC-AUC=0.5 верный ответ, в питоне проверить можно. На пальцах если объяснять - инверсия предсказаний никак не поменяет сортировку таргетов, это возможно только в том случае, когда рок-аук=0.5
@wad881988 3 місяці тому
Не, там еще два нулевых элемента внизу таблицы, просто их не видно. Их же 10, судя по описанию, 6 из них единичные. У меня 3/4 (или 18/24) ROC-AUC получился, не понимаю , откуда у собеседующего 19/24 вышло.
@gernar228 3 місяці тому ⁺²
Но если судить по тому что видно, то он прав. И это достаточно элегантный способ дать ответ без рисования графика
@saitaro 3 місяці тому
@@gernar228 Спасибо, я чуть не ёбнулся, пытаясь понять, где я был неправ, и почему рок-аук не 1/2 :)
@katiegalaeva Місяць тому
@@wad881988 объясни, пожалуйста, как посчитать по данным без построения
@josefkerr4124 3 місяці тому
Это видимо собес на стажера на обычную тинькофовскую позицию data science, в тинькофф AI вопросы поинтереснее
@Esseker 3 місяці тому
это и близко не стажер
@kentiy1 3 місяці тому ⁺²
У меня был в жизни 1 вводный курс ML, я и то ответил бы почти все вопросы, наверное. Странно, что на сеньора такие вопросы на собесе.
@floydic8632 3 місяці тому ⁺²
А какой курс ты проходил
@kentiy1 Місяць тому
@@floydic8632 Я имею в виду курс в университете (Высшая Школа Экономики в Санкт-Петербурге, ОП Экономика)
@antonio.revazov 3 місяці тому ⁺²
А на какую зарплату собеседовался? Это вообще джун или мидл позиция?
@RibaKit-d7c 3 місяці тому ⁺²
Скорее стажер
@mathmode3190 3 місяці тому
@@RibaKit-d7c как же дрочат стажёров нынче...
@gernar228 3 місяці тому ⁺²
Собес был на сеньора
@arti5946 3 місяці тому
Так стажер или сеньор ?😂😂😂
@tihnik 3 місяці тому
@@arti5946 это синьорская позиция, запрашивал оклад 400-500к на руки
@natttttaaa 3 місяці тому
какие курсы по ds рекомендуете?
@gernar228 3 місяці тому
Оффер под ключ, конечно
А курсы тебе зачем?
Хард мл вроде норм на карпов курсес
@НиколайБезмен 3 місяці тому ⁺¹
А у нас же вроде глубина дерева является гиперпараметром, то есть мы сами определяем сложность (частично). Но вообще наверно N * M * (количество вершин)?
@gernar228 3 місяці тому ⁺¹
А количество вершин какое может быть?
@НиколайБезмен 3 місяці тому
В зависимости от того какую модель мы строим, как мне кажется. То есть мы же можем построить супер тупую модель которая всегда будет просто выдавать константу => количество вершин равно 1. Но при этом можем и обучить такую модель которая будет максимально переобучена и у неё будет столько листовых вершин, сколько данных в обучающей выборке,то есть N.
???
@Leha_from_Zavod 3 місяці тому ⁺¹
@@НиколайБезмен O(m*n*log(n))) - ответ
@wad881988 3 місяці тому ⁺³
Именно, там в самом начале нужно отсортировать элементы по значению каждого признака и выбрать оптимальное разбиение. Это N*logN*M. Потом тоже самое надо повторить для двух поддеревьев, у которых N/2 элементов. Для каждого из них это займет N/2*M (поскольку до этого уже все отсортировали), в сумме будет N*M. Для следующего уровня нужно проделать тоже самое с 4мя деревьями по N/4 элементов в каждом, получим ту же сложность N*M. В дереве logN уровней, поэтому в итоге получим все те же N*M*logN. Итого общая сложность О(N*logN*M)
@ФдрФфф 3 місяці тому ⁺¹
Дизлайк за поарошайничество лайков.
@ИванКрузенштерн-ц3ь 3 місяці тому
Как можно засрать удивительно простое и ясное явление как нейросеть ? Отдайте ее описание принципа работы не инженерам .

Наступне

Автоматичне відтворення