ТОП вопросы с СОБЕСЕДОВАНИЯ на Data Science / Дисбаланс классов, ROC-AUC, Градиентный бустинг

Поділитися
Вставка
  • Опубліковано 4 чер 2024
  • Разбор популярных вопросов с собеседований на позицию Data Scientist
    Таймкоды:
    00:00 Топ-вопросы на собеседовании Data Scientist
    04:45 Дисбаланс классов
    02:30 Oversampling
    03:14 Undersampling
    04:25 Встроенные методы стратификации
    04:39 Cross-validation (кросс-валидация)
    06:45 Критерии для применения t-Стьюдента для аб тестирования
    07:53 Градиентный бустинг и случайный лес, отличия
    09:05 ROC-AUC
    13:40 SQL разбор вопроса с собеседования
    Отличная статья про различные виды кросс-валидации:
    towardsdatascience.com/unders...
    Clubhouse miracl6
    Группа в ВКонтакте pymagic
    Telegram t.me/pymagic
    #DataScience

КОМЕНТАРІ • 46

  • @evgheniigaisinschii3106
    @evgheniigaisinschii3106 2 роки тому +4

    Спасибо вам!
    Это и другие ваши видео помогли мне пройти первое собеседование))

  • @seregapetrov6848
    @seregapetrov6848 3 роки тому +1

    Спасибо за твои труды:)

  • @paljm345
    @paljm345 3 роки тому +1

    Смотреть, одно наслаждение)))

  • @user-sd4pu2tz6d
    @user-sd4pu2tz6d 3 роки тому +2

    Отличное видео 👍👍👍👍

  • @rustamquliyev1304
    @rustamquliyev1304 3 роки тому +4

    Классное видео!
    Какие утилиты, программы и библиотеки вы используете при работе? Инересно было бы узнать так как недавно рашил использовать tableau и понял сколько лишнего времени я тратил на визуализацию в Питоне. Может еще пару находок услышу)

  • @OlegDavydov1
    @OlegDavydov1 3 роки тому +2

    Анастасия, спасибо за ваши труды!
    Интересно было бы послушать про калибровки моделей и про стекинг/блендинг, особенно их практическое применение

  • @thampasaurusrex3716
    @thampasaurusrex3716 3 роки тому +1

    Супер видос! Перешёл по рекламе в инсте, вообще не пожалел. Давай видос про трансформеры в nlp)

  • @dmitriykalashnikov85
    @dmitriykalashnikov85 3 роки тому +1

    Очень интересно, спасибо. Было бы еще здорово узнать какие задачки по питону дают на собесах, какие библиотеки в приоритете

  • @mafioznik-mg5zq
    @mafioznik-mg5zq 3 роки тому +1

    очень интересно

  • @denischo2133
    @denischo2133 3 роки тому

    Очень интересно, а применяют аналитики данных (data analyst) машинное обучение? Я обучаюсь на данном направлении и в основном учу мат. Статистику и теорвер, надо ли изучать мл и используется ли оно в аб тестах? Если да, то какие именно? Регрессиям, случайные леса?

  • @user-qp6rm3bb7t
    @user-qp6rm3bb7t 3 роки тому +1

    Не могли бы помочь? Рассматриваю для себя сферу Big Data(не обязательно Data Science) и хотел спросить, имеет ли смысл развиваться в этой сфере если в моем регионе эта сфера не развита и переезжать нет большого желания?

  • @gienek_mscislawski
    @gienek_mscislawski 3 роки тому +2

    где такое худи брала?)

  • @nikitanatalin1882
    @nikitanatalin1882 5 місяців тому +1

    Не совсем понял про дисбаланс классов. Название для тайм кода стоит «Дисбаланс классов», а говорится про перекрестную проверку…

  • @dannydies4304
    @dannydies4304 3 роки тому +3

    Миниатюра видео выглядит отлично. Хорошо выделяется и стиль подобран подходящий. Лучше чем раньше.

  • @programisli
    @programisli 3 роки тому +1

    Понятно даже программисту и очень интересно.

    • @harutmargaryan9980
      @harutmargaryan9980 3 роки тому

      Ого кого я вижу. Решили выучить DS ?)

  • @user-eg1vy8pk1v
    @user-eg1vy8pk1v 3 роки тому +1

    Джунам, конечно надо структурировать инфу, алгоритм что и когда применять.

  • @user-gs6of5vv6r
    @user-gs6of5vv6r 3 роки тому

    сними видео или курс про pyspark

  • @artemsivtsov6876
    @artemsivtsov6876 3 роки тому

    Меня вот сегодня спрашивали на тему нейронных сетей следующее: всем известно что сверточные нейронки лучше различают картинки, но в 2016-2017 году на наборе данных mnist полносвязная нейронка смогла достичь результата практически как у сверточной (отличие в тысячных accuracy). Почему это произошло и почему прошло так много времени? (Ресурсы компьютеров не изменились значительно, т.е. причина в самой сети, а не во внешних факторах)

  • @user-py8iz3sd1v
    @user-py8iz3sd1v 3 роки тому

    Насть, привет. Скажи, а от тебя будет туториал по scikit?))
    P.s. сейчас в тытубе только в английской версии в более менее нормальном формате

    • @user-py8iz3sd1v
      @user-py8iz3sd1v 3 роки тому

      @@miracl6 да, желательно конечно с объяснением основных отличий в методах

    • @user-py8iz3sd1v
      @user-py8iz3sd1v 3 роки тому

      @@miracl6 что-то вроде этого ua-cam.com/video/M9Itm95JzL0/v-deo.html

    • @user-py8iz3sd1v
      @user-py8iz3sd1v 3 роки тому

      @@miracl6 ну или конкретно про библиотеку)

    • @user-py8iz3sd1v
      @user-py8iz3sd1v 3 роки тому

      @@miracl6 Насть привет) с праздником тебя) ты делаешь очень крутое и полезное дело, желаю тебе продолжать в том же духе.

  • @Egor-sm4bl
    @Egor-sm4bl 3 роки тому +1

    Можете рассказать пример из практики, когда применяется t-критерий(и подобные)?

    • @Egor-sm4bl
      @Egor-sm4bl 3 роки тому

      @@miracl6 параллель с А/Б тестированием? Это оно и есть?

    • @Egor-sm4bl
      @Egor-sm4bl 3 роки тому

      @@miracl6 спасибо!

  • @user-ei2oo5oh9s
    @user-ei2oo5oh9s Рік тому

    В t-тесте требуется нормальность t-статистики, а не исходных данных, насколько помню). Просто с нормальным распределением исходных данных ЦПТ для t-статистики работает быстрее)

  • @zaharyanq8340
    @zaharyanq8340 3 роки тому +1

    Го рум тур

  • @SkySystems
    @SkySystems 3 роки тому

    Привет! Ты радикально поменяла стиль? :)

    • @SkySystems
      @SkySystems 3 роки тому

      @@miracl6 раньше классические рубашки были, а теперь usa-camp))

  • @user-sx3lu6dx1z
    @user-sx3lu6dx1z 6 місяців тому

    Я хотя бы понимаю о чем речь в видео, учеба прошла не зря)

  • @havemerc
    @havemerc 3 роки тому

    Я бы на вашем месте рассказал почему НЕ НАДО гуглить ответы на вопросы на собеседовании, если ты недостаточно знаешь, чтобы пройти собеседовании, то ты как собрался работать то?! Пройди оплавчиваемую стажировку, набей опыт, так думаю будет лучше

    • @havemerc
      @havemerc 3 роки тому

      @@miracl6 о , я в это охотно верю, я с каким уже только идиотизмом не встречался , работаю инженером, как-то приходил на собеседование в аутсорс-компанию по обслуживанию серверов (опять же некорректно была составлена вакансия на хх.ру), я - инженер по наладке и испытаниям, а требовался по факту сисадмин, так ещё и требования там : знать полный стек сетевых технологий , программирование на 1с, администрирование в Линукс, уметь паять, чинить технику , производить монтаж , общаться с клиентами с графиком работы с 9 до 18 5 через 2, с испытательным сроком в 3 месяца с зп в 25 тысяч рублей, никогда так в жизни не смеялся ))

    • @havemerc
      @havemerc 3 роки тому

      @@miracl6 а это, печально, проводит собеседование не непосредственный начальник , а кадровик, который не знает что вообще такое дата саенс и вообще этот совдеповский формат собеседования меня смешит, возьмите человека на испытательный срок и посмотрите что он умеет, ну зачем испытательный срок ещё нужен ?! Чтобы в первые месяцы меньше зп платить , чем положено ?)

  • @maratimus
    @maratimus 3 роки тому

    *Задай нам домашние задания по какой-нибудь задаче на платформе kaggle, типа конкурса среди подписчиков📯, а потом разбери решение, заодно и у там свою учётку прокачаешь🚀🚀🚀. Просмотрел несколько выпусков, все становится как-то однообразно, теряется интерес.*

  • @user-hqgh
    @user-hqgh 3 роки тому +1

    Красивая девочка 👧❤️

  • @MrBlack-cv8qn
    @MrBlack-cv8qn Рік тому

    фэлс)

  • @egor_andryushchenko
    @egor_andryushchenko 3 роки тому

    Можно выражаться чуть-чуть попроще, более обобщенно(желательно вообще обощить по максимуму) , вдаваться в подробности вообще желания нет.

    • @Egor-sm4bl
      @Egor-sm4bl 3 роки тому +1

      Куда уж обобщеннее?! 😂

    • @egor_andryushchenko
      @egor_andryushchenko 3 роки тому

      @@miracl6 Мне трудно привести пример по той причине, что Data Science не моя, скажем так, компетенция, и мне как простому человеку(тоже айтишнику, если это простой человек) трудно понять о чем речь в видео в общем(и причём тут код на фоне видео...)

    • @egor_andryushchenko
      @egor_andryushchenko 3 роки тому

      @@miracl6 думаю что все-таки не надо)

    • @Egor-sm4bl
      @Egor-sm4bl 3 роки тому

      @@egor_andryushchenko 😂😂😂👍🏻👍🏻👍🏻