#28 Собеседование Data Scientist в Т-Банк | Теория + Лайфкодинг

Поділитися
Вставка
  • Опубліковано 4 лют 2025

КОМЕНТАРІ • 81

  • @XR0M
    @XR0M 3 місяці тому +8

    спасибо за видос, нужно больше таких видео!)
    забавная тенденция - чем выше грейд, тем проще вопросы

  • @wad881988
    @wad881988 3 місяці тому +10

    Про интерпретацию ROC-AUC Дьяконов у себя в блоге хорошо написал. Это вероятность того, что два случайно взятых из выборки объекта разных классов будут упорядочены моделью корректно, то есть уверенность модели на объекте класса 1 будет выше, чем на объекте класса 0.

  • @prorider3424
    @prorider3424 3 місяці тому +17

    Собеседовался в т банк неделю назад, вопросы почти 1 в 1 были такие же 😂

    • @АртёмЮрченко-ж8ъ
      @АртёмЮрченко-ж8ъ 3 місяці тому +1

      +

    • @alevadnaya
      @alevadnaya 3 місяці тому

      Да, у них процесс собеседований сиандартизированный

    • @stanislav8566
      @stanislav8566 2 місяці тому

      Метишь на место Никиты? Ай-ай-ай

  • @bolshoy_brat9093
    @bolshoy_brat9093 2 місяці тому

    Очень круто! Спасибо!

  • @IDBaron
    @IDBaron Місяць тому

    Очень круто 👏🏽

  • @irvi6552
    @irvi6552 3 місяці тому +1

    ребят я поражаюсь что вы такие умные. это мне не на с++ фигнюшки писать..

  • @lerosh7894
    @lerosh7894 3 місяці тому +8

    Кажется, это собес на стажера/джуна, на сеньорскую нлп позицию совсем другие вопросы)

    • @noname-bi7ve
      @noname-bi7ve 3 місяці тому

      какие?

    • @lerosh7894
      @lerosh7894 3 місяці тому

      @@noname-bi7ve обсуждали архитектуры современных языковых моделек, разные жадные алгоритмы кнн типа как устроен annoy, hnsw + задачка на мл дизайн

    • @noname-bi7ve
      @noname-bi7ve 3 місяці тому +1

      @@lerosh7894 ну про архитектуры моделек кажется релевантный вопрос, а вот про методы поиска ближайших соседей как будто бы излишне, это как с алгоритмами сортировки, ты просто их используешь) какие архитектуры обсуждали? что задизайнить задали?

    • @lerosh7894
      @lerosh7894 3 місяці тому

      @@noname-bi7ve там про методы поиска было в тему задачки на дизайн как раз, архитектуры энкодера, подробнее раскрывать задачу не хочу, некрасиво как по мне)

  • @alexanderyurchenko7022
    @alexanderyurchenko7022 2 місяці тому

    Какую ЗП предложили?

  • @aleksandr7432
    @aleksandr7432 3 місяці тому

    лайк за видео, коммент для алгоритмов ютуба

  • @sdeth9558
    @sdeth9558 3 місяці тому

    Я делал бустинг над линейными моделями с слоями активации. Норм работает но деревья будут лучше.😅

  • @Pizza-And-Cheese
    @Pizza-And-Cheese 3 місяці тому +5

    вообще не айтишник, не знаю зачем это включил и посмотрев хочу сказать одно - вы на каком языке говорите вообще и откуда его знаете? здесь же просто 0 чего-то известного и понятного обывателю, ужас)

  • @naumtsevalex
    @naumtsevalex 3 місяці тому +1

    Кайф🎉

  • @ochiru8802
    @ochiru8802 2 місяці тому +1

    Блин гойс объясните а смысл учить ответы на вопросы собесов если можно просто разобраться + выучить саму теорию? Это как будто бы по времени быстрее (особенно если в базе >200 вопросов) и больше понимания предметной области даст не?). Я к тому что если вы знаете саму теорию хорошо вы и так на все вопросы ответите. А так контент в кайф, мои любимые видео это хамский собес и трэш собес в стиле азазина.

  • @fivel6436
    @fivel6436 3 місяці тому +2

    Вообще это точно т-банк судя по табличке. Но слишком лайт какой-то. Меня гораздо жеще спрашивали. Мейби позиция стажер-джун

    • @gernar228
      @gernar228  3 місяці тому

      Сеньоская позиция

    • @arti5946
      @arti5946 3 місяці тому +1

      А че у тебя спрашивали в кратце?

    • @fivel6436
      @fivel6436 3 місяці тому

      @@gernar228 Явно тип немного напутал задания либо ему лень было что-то сложное спрашивать

    • @fivel6436
      @fivel6436 3 місяці тому

      @@arti5946 Гораздо жеще за классику было. Скажем так не дефолтные вопросы

    • @misunderstood5622
      @misunderstood5622 3 місяці тому

      @@fivel6436 А можешь поделиться конкретными вопросами?

  • @puser-42
    @puser-42 3 місяці тому

    Поставил поставил я лайк, хватит держать этот неловкий зрительный контакт

  • @viviandamorblok
    @viviandamorblok 3 місяці тому +1

    У них задача на дебаггинг одна и та же уже 3 года 🥴

  • @ИванКутиков-з8и
    @ИванКутиков-з8и 3 місяці тому +16

    Бессмысленно использовать линейне модели в бустинге, потому что комбинация линейных моделей линейна

    • @arti5946
      @arti5946 3 місяці тому +3

      Тогда Вадимыч тут просчитался чутка, он также включил туда же логистическую регрессию, а там есть сигмоида, которая как раз таки и добавляет этой самой нелинейности. По сути бустинг лог регресси это и есть нейронка

    • @gernar228
      @gernar228  3 місяці тому +2

      ты прав, бессмысленно только для линейной регрессии
      но на логистической не запускал, интересно что будет

    • @vanerk_
      @vanerk_ 3 місяці тому +1

      @@gernar228 бустинг на каждой итерации учится на mse на градиент по предыдущей комбинации, поэтому туда никак нельзя запихнуть логистическую регрессию.

    • @dmitrywadokai
      @dmitrywadokai 3 місяці тому +1

      Логистические регрессии бустить можно т.к. сигмоида даст нелинейность.
      В xgboost можно использовать линейную модель как базовый алгоритм через параметр booster:’gblinear’. (Но это уже не чистый бустинг, там нет ансамбля моделей). На практике это может быть полезно для прогнозирования временных рядов т.к. линейная модель умеет экстраполировать.

    • @rtgiyrefbgowigi3406
      @rtgiyrefbgowigi3406 3 місяці тому

      любая комбинация линейных моделей линейна?

  • @Амир-д5р
    @Амир-д5р 3 місяці тому +1

    Го пайтон бэкенд

  • @mikyouber
    @mikyouber 3 місяці тому

    Можно, пожалуйста, пояснительную бригаду на подсчёт ROC-AUC, и других метрик по табличке?

    • @tihnik
      @tihnik 3 місяці тому +1

      Для ROC-AUC:
      Ось Ox разбиваешь на такое кол-во равных интервалос, сколько объектов 0 класса в выборке, ось Oy - сколько объектов 1 класса. Сортируешь выборку по предсказаниям модели от большего к меньшему. Идешь сверху вниз и смотришь на колонку таргет. Если встретил объект 1 класса шаг вверх, объект 0 класса - вправо, если объекты 1 и 0 класса имеют одинаковое предсказание - по диагонали. Зачастую на собесе получается трапеция или трапеция и треугольник, у которых легко посчитать площадь.
      Остальные метрики легко загуглить.

    • @artemiy568
      @artemiy568 3 місяці тому +1

      @@tihnikroc auc не так строится. Для каждого порогового значения ищется tpr и fpr и отмечается координата на графике. Через все полученные координаты проводится линия (roc). Задача с собеса сводится к тому чтобы найти координату для одного порога

    • @tihnik
      @tihnik 3 місяці тому +1

      @@artemiy568 Алгоритм, который я описал также корректно посчитает roc-auc

    • @noname-bi7ve
      @noname-bi7ve 3 місяці тому

      ​@@artemiy568 ты бы не позорился, @tihnik все правильно написал, это и есть roc кривая в координатах fpr-tpr

  • @ymao1234
    @ymao1234 3 місяці тому

    Как думаете дадут оффер если мне 17 и пройду собес хорошо ?

    • @gernar228
      @gernar228  3 місяці тому +1

      когда 18 исполнится дадут

    • @liberal_democrat_usa7921
      @liberal_democrat_usa7921 15 днів тому

      брооо ты офигеешь но мне тож 17 и я завтра в тинькофф иду на собес,надеюсь получится

  • @НиколайБезмен
    @НиколайБезмен 3 місяці тому +1

    А его взяли в итоге?

    • @tihnik
      @tihnik 3 місяці тому +2

      были финалы в две команды, предложили пойти в команду, которая меньше понравилась по задачам. В итоге вышел работать в другое место

    • @чел-в1ц3т
      @чел-в1ц3т 3 місяці тому

      ​@@tihnikподскажи, какие разделы математики нужны для data science?

    • @tihnik
      @tihnik 3 місяці тому +1

      @@чел-в1ц3т в основном теор вер нужен для построения доверительных интервалов, проверке гипотез. Из матана для работы в классическом МЛ сложнее градиентного спуска в большинстве случаев ничего не требуется

  • @MrRazgildyai
    @MrRazgildyai 3 місяці тому +1

    ROC-AUC=0.5 верный ответ, в питоне проверить можно. На пальцах если объяснять - инверсия предсказаний никак не поменяет сортировку таргетов, это возможно только в том случае, когда рок-аук=0.5

    • @wad881988
      @wad881988 3 місяці тому

      Не, там еще два нулевых элемента внизу таблицы, просто их не видно. Их же 10, судя по описанию, 6 из них единичные. У меня 3/4 (или 18/24) ROC-AUC получился, не понимаю , откуда у собеседующего 19/24 вышло.

    • @gernar228
      @gernar228  3 місяці тому +2

      Но если судить по тому что видно, то он прав. И это достаточно элегантный способ дать ответ без рисования графика

    • @saitaro
      @saitaro 3 місяці тому

      @@gernar228 Спасибо, я чуть не ёбнулся, пытаясь понять, где я был неправ, и почему рок-аук не 1/2 :)

    • @katiegalaeva
      @katiegalaeva Місяць тому

      @@wad881988 объясни, пожалуйста, как посчитать по данным без построения

  • @josefkerr4124
    @josefkerr4124 3 місяці тому

    Это видимо собес на стажера на обычную тинькофовскую позицию data science, в тинькофф AI вопросы поинтереснее

    • @Esseker
      @Esseker 3 місяці тому

      это и близко не стажер

  • @kentiy1
    @kentiy1 3 місяці тому +2

    У меня был в жизни 1 вводный курс ML, я и то ответил бы почти все вопросы, наверное. Странно, что на сеньора такие вопросы на собесе.

    • @floydic8632
      @floydic8632 3 місяці тому +2

      А какой курс ты проходил

    • @kentiy1
      @kentiy1 Місяць тому

      @@floydic8632 Я имею в виду курс в университете (Высшая Школа Экономики в Санкт-Петербурге, ОП Экономика)

  • @antonio.revazov
    @antonio.revazov 3 місяці тому +2

    А на какую зарплату собеседовался? Это вообще джун или мидл позиция?

    • @RibaKit-d7c
      @RibaKit-d7c 3 місяці тому +2

      Скорее стажер

    • @mathmode3190
      @mathmode3190 3 місяці тому

      @@RibaKit-d7c как же дрочат стажёров нынче...

    • @gernar228
      @gernar228  3 місяці тому +2

      Собес был на сеньора

    • @arti5946
      @arti5946 3 місяці тому

      Так стажер или сеньор ?😂😂😂

    • @tihnik
      @tihnik 3 місяці тому

      @@arti5946 это синьорская позиция, запрашивал оклад 400-500к на руки

  • @natttttaaa
    @natttttaaa 3 місяці тому

    какие курсы по ds рекомендуете?

    • @gernar228
      @gernar228  3 місяці тому

      Оффер под ключ, конечно
      А курсы тебе зачем?
      Хард мл вроде норм на карпов курсес

  • @НиколайБезмен
    @НиколайБезмен 3 місяці тому +1

    А у нас же вроде глубина дерева является гиперпараметром, то есть мы сами определяем сложность (частично). Но вообще наверно N * M * (количество вершин)?

    • @gernar228
      @gernar228  3 місяці тому +1

      А количество вершин какое может быть?

    • @НиколайБезмен
      @НиколайБезмен 3 місяці тому

      В зависимости от того какую модель мы строим, как мне кажется. То есть мы же можем построить супер тупую модель которая всегда будет просто выдавать константу => количество вершин равно 1. Но при этом можем и обучить такую модель которая будет максимально переобучена и у неё будет столько листовых вершин, сколько данных в обучающей выборке,то есть N.
      ???

    • @Leha_from_Zavod
      @Leha_from_Zavod 3 місяці тому +1

      @@НиколайБезмен O(m*n*log(n))) - ответ

    • @wad881988
      @wad881988 3 місяці тому +3

      Именно, там в самом начале нужно отсортировать элементы по значению каждого признака и выбрать оптимальное разбиение. Это N*logN*M. Потом тоже самое надо повторить для двух поддеревьев, у которых N/2 элементов. Для каждого из них это займет N/2*M (поскольку до этого уже все отсортировали), в сумме будет N*M. Для следующего уровня нужно проделать тоже самое с 4мя деревьями по N/4 элементов в каждом, получим ту же сложность N*M. В дереве logN уровней, поэтому в итоге получим все те же N*M*logN. Итого общая сложность О(N*logN*M)

  • @ФдрФфф
    @ФдрФфф 3 місяці тому +1

    Дизлайк за поарошайничество лайков.

  • @ИванКрузенштерн-ц3ь
    @ИванКрузенштерн-ц3ь 3 місяці тому

    Как можно засрать удивительно простое и ясное явление как нейросеть ? Отдайте ее описание принципа работы не инженерам .