ТОП вопросов на собеседовании Data Scientist: разбор ответов

Поділитися
Вставка
  • Опубліковано 8 чер 2024
  • Курс по Data Science clck.ru/37CP5Z
    Разбор ML-алгоритмов в Telegram t.me/pymagic/266
    Видео с разбором градиентного бустинга • Градиентный бустинг с ...
    00:00 Общие вопросы. Как проверяют кандидата?
    00:53 Линейные модели
    01:12 Как обучаются линейные модели?
    02:17 Оптимизаторы
    03:39 Переобучение. Как бороться с переобучением
    05:20 Ансамбли и их алгоритмы
    06:45 Bias-Variance tradeoff
    07:48 Рекомендации по избранию факапов
    08:29 Дополнительные вопросы на примере NLP-направления
    Instagram* / miracl6_
    ВКонтакте pymagic
    Telegram t.me/pymagic
    *Компания Meta - организация, деятельность которой запрещена на территории Российской Федерации
    #datascience #ityoutubersru #собеседование
  • Наука та технологія

КОМЕНТАРІ • 21

  • @pavlovn
    @pavlovn 3 місяці тому +6

    Спасибо Вам! отлично, ценные знания - очень доступным языком!!

  • @annasimonova5304
    @annasimonova5304 3 місяці тому +2

    спасибо за видео!

  • @Inter8529
    @Inter8529 3 місяці тому +4

    Умная девушка. Молодец

  • @user-ju5ir5fc8m
    @user-ju5ir5fc8m 3 місяці тому +2

    Анастасия помнит нейросети, как я помню имена своих собак. 8:57 Глоф, Фасттекст, Элма...🙂

  • @MrBolat777
    @MrBolat777 3 місяці тому +2

    В будущем будет проблема управления большими данными. Интересно, какие эффективные способы существуют уже сейчас?

  • @user-kt4sp5il7i
    @user-kt4sp5il7i 3 місяці тому +2

    Лучшая😊

  • @RCdrifttt
    @RCdrifttt 3 місяці тому +2

    Спасибо за видео! Но я так и не понял, а что не так с картинкой с мишенями? Почему по этой логике плохо описывать разброс и смещение?

    • @Abingusus
      @Abingusus 2 місяці тому

      В мл:
      Смещение - матожидание ошибки
      Разброс - дисперсия ответов разных моделей при изменении в данных, типа 10 моделей для 1 сэмпла дают разные предсказания - считай дисперсию.
      На картинке:
      Смещение - в целом тоже самое, если точки - это предсказания модели (но вообще-то должно быть одним числом - матожиданием, но тут возникакт костыль что мы потом посчитаем ошибку и найдем матожиданте)
      Разброс - дисперсия ответов одной модели (а не разных моделей)
      Т.е. ключевое это разница в понимании разброса. В мл разброс происходит от одной модели к другой. Чтобы исправить, к этой картинке надо дать тогда пояснения, что каждая точка - это среднее выстрелов некоторой пушки, а все пушки разные. Тогда у нас точки будут показывать не ответы модели, а средние одной модели (но тут костыли в том, что вообще-то это должно быть ошибкой а не ответом, и это надо пересчитать в ошибку отдельно, а зачем мы считаем средние ответов каждой пушки непонятно) В итоге с оговорками что точка это среднее одной пушки, это может и имеет какой-то смысл, но без кучи пояснений картинка не передает смысл.
      Короче лучше почитать от чего матожидание берется, и от чего дисперсия. Тогда станет ясно

  • @flatmapper
    @flatmapper 3 місяці тому +2

    Важно ли решать литкод? Именно те задачи, которые НЕ на SQL и Pandas?

    • @user-qj8jd9nn1k
      @user-qj8jd9nn1k 3 місяці тому +1

      Да DA и DS стажер должен уметь решать letcode уровня middle. Кроме алгосов могут и за ООП спросить.

    • @flatmapper
      @flatmapper 3 місяці тому +1

      @@user-qj8jd9nn1kсомневаюсь, что прям Medium. Ну да ладно

    • @user-qj8jd9nn1k
      @user-qj8jd9nn1k 3 місяці тому +1

      @@flatmapper И сейчас мы ищем к себе в команду стажера - DS'а.
      Мы ожидаем: Высокую мотивацию, готовность быстро учиться и применять навыки на практике; Знание pytorch; Знакомство с Golang или готовность быстро его изучить; Понимание алгоритмов ML и DL; Умение решать leetcode-medium; Умение «на пальцах» объяснить устройство self-atention, Bert4REC и тд будет значительным плюсом; Наличие фундаментальной математической базы, знание алгоритмов; Базовое понимание SQL, Hadoop стэка;

    • @NickCapitan
      @NickCapitan 3 місяці тому +4

      ​@@user-qj8jd9nn1kнадеюсь это прикол такой

    • @user-qj8jd9nn1k
      @user-qj8jd9nn1k 3 місяці тому

      @@NickCapitan нет что бы сейчас претендовать на позицию стажера DA DS в крупную компанию Cбер,МТС, Озон нужно уметь уверенно ботать на python. Уверенно ботать это написать связанный список,алгоритм Дейкстеры что-то на 30-40 строк кода,или уровень middle letcode. с print("hello") сейчас подают резюме подростки 13-14 лет причем те которые за матрицы,векторы шарят в отличии от многих вкатышей в айти. Такие сейчас реалии рынка. 3-4 года назад с условным print hello рассматривали. И не удвилюсь если зп на вышеуказанную вакансия будет 40-60 так как стажер,стажеров дофига по 1000 откликов на вакансию. Требования растут каждый год,роботодатели фигеют и повышают требования условный DA DS желают что бы еще обладал знаниямия DE, бизнес аналитика и хотят брать желательно из топ вузов.

  • @ahliddinnuraliyev
    @ahliddinnuraliyev Місяць тому

    it is great.

  • @JohnyK019
    @JohnyK019 3 місяці тому +6

    Я ни одного знакомого слова не услышал😂😂😂😢😢😢

    • @MrBolat777
      @MrBolat777 3 місяці тому +1

      Опаздываете дядюшка, прогресс так далеко ушел, что мы уже скоро станем чипированными, с целью управления объектами силой одной лишь мысли.😁

    • @JohnyK019
      @JohnyK019 3 місяці тому +1

      @@MrBolat777 Силой одной лишь мысли. Чужой мысли😂

  • @andreykomyagin5556
    @andreykomyagin5556 3 місяці тому +2

    +