ТОП вопросов на собеседовании Data Scientist: разбор ответов
Вставка
- Опубліковано 8 чер 2024
- Курс по Data Science clck.ru/37CP5Z
Разбор ML-алгоритмов в Telegram t.me/pymagic/266
Видео с разбором градиентного бустинга • Градиентный бустинг с ...
00:00 Общие вопросы. Как проверяют кандидата?
00:53 Линейные модели
01:12 Как обучаются линейные модели?
02:17 Оптимизаторы
03:39 Переобучение. Как бороться с переобучением
05:20 Ансамбли и их алгоритмы
06:45 Bias-Variance tradeoff
07:48 Рекомендации по избранию факапов
08:29 Дополнительные вопросы на примере NLP-направления
Instagram* / miracl6_
ВКонтакте pymagic
Telegram t.me/pymagic
*Компания Meta - организация, деятельность которой запрещена на территории Российской Федерации
#datascience #ityoutubersru #собеседование - Наука та технологія
Спасибо Вам! отлично, ценные знания - очень доступным языком!!
спасибо за видео!
Умная девушка. Молодец
Анастасия помнит нейросети, как я помню имена своих собак. 8:57 Глоф, Фасттекст, Элма...🙂
В будущем будет проблема управления большими данными. Интересно, какие эффективные способы существуют уже сейчас?
Лучшая😊
Спасибо за видео! Но я так и не понял, а что не так с картинкой с мишенями? Почему по этой логике плохо описывать разброс и смещение?
В мл:
Смещение - матожидание ошибки
Разброс - дисперсия ответов разных моделей при изменении в данных, типа 10 моделей для 1 сэмпла дают разные предсказания - считай дисперсию.
На картинке:
Смещение - в целом тоже самое, если точки - это предсказания модели (но вообще-то должно быть одним числом - матожиданием, но тут возникакт костыль что мы потом посчитаем ошибку и найдем матожиданте)
Разброс - дисперсия ответов одной модели (а не разных моделей)
Т.е. ключевое это разница в понимании разброса. В мл разброс происходит от одной модели к другой. Чтобы исправить, к этой картинке надо дать тогда пояснения, что каждая точка - это среднее выстрелов некоторой пушки, а все пушки разные. Тогда у нас точки будут показывать не ответы модели, а средние одной модели (но тут костыли в том, что вообще-то это должно быть ошибкой а не ответом, и это надо пересчитать в ошибку отдельно, а зачем мы считаем средние ответов каждой пушки непонятно) В итоге с оговорками что точка это среднее одной пушки, это может и имеет какой-то смысл, но без кучи пояснений картинка не передает смысл.
Короче лучше почитать от чего матожидание берется, и от чего дисперсия. Тогда станет ясно
Важно ли решать литкод? Именно те задачи, которые НЕ на SQL и Pandas?
Да DA и DS стажер должен уметь решать letcode уровня middle. Кроме алгосов могут и за ООП спросить.
@@user-qj8jd9nn1kсомневаюсь, что прям Medium. Ну да ладно
@@flatmapper И сейчас мы ищем к себе в команду стажера - DS'а.
Мы ожидаем: Высокую мотивацию, готовность быстро учиться и применять навыки на практике; Знание pytorch; Знакомство с Golang или готовность быстро его изучить; Понимание алгоритмов ML и DL; Умение решать leetcode-medium; Умение «на пальцах» объяснить устройство self-atention, Bert4REC и тд будет значительным плюсом; Наличие фундаментальной математической базы, знание алгоритмов; Базовое понимание SQL, Hadoop стэка;
@@user-qj8jd9nn1kнадеюсь это прикол такой
@@NickCapitan нет что бы сейчас претендовать на позицию стажера DA DS в крупную компанию Cбер,МТС, Озон нужно уметь уверенно ботать на python. Уверенно ботать это написать связанный список,алгоритм Дейкстеры что-то на 30-40 строк кода,или уровень middle letcode. с print("hello") сейчас подают резюме подростки 13-14 лет причем те которые за матрицы,векторы шарят в отличии от многих вкатышей в айти. Такие сейчас реалии рынка. 3-4 года назад с условным print hello рассматривали. И не удвилюсь если зп на вышеуказанную вакансия будет 40-60 так как стажер,стажеров дофига по 1000 откликов на вакансию. Требования растут каждый год,роботодатели фигеют и повышают требования условный DA DS желают что бы еще обладал знаниямия DE, бизнес аналитика и хотят брать желательно из топ вузов.
it is great.
Я ни одного знакомого слова не услышал😂😂😂😢😢😢
Опаздываете дядюшка, прогресс так далеко ушел, что мы уже скоро станем чипированными, с целью управления объектами силой одной лишь мысли.😁
@@MrBolat777 Силой одной лишь мысли. Чужой мысли😂
+