Собеседование Data Science: Артур Кузин/Sber Devices vs Сергей Колесников/Tinkoff |
Вставка
- Опубліковано 23 тра 2024
- Заскакивай на телегу: t.me/flesspro .
В этом эпизоде насладитесь смесью шуток за 300 из "что было дальше" и турнира по пощечинам - Артур Кузин из Sber Devices и Сергей Колесников из Tinkoff собеседуют друг друга. Тематика по большей части Computer Vision (вселенная Артура), так что Сергею пришлось выступать "в гостях". Впрочем, в конце он-таки отыгрался на Артуре чатботами.
Смотрите по тайм-тегам. А у кого сразу есть 2 часа времени - запасайтесь попкорном и готовьтесь к действу. И ещё - уберите ваших детей от наших голубых экранов, ибо без мата не обошлось.
Ну и disclaimer: мы, конечно, старались снять близко к реальности. Но на реальных интервью у обоих участников есть ещё вопросы, которые тут не стали спойлерить. Так что если придете, например, к Артуру, а он будет вас глубже гонять - не удивляйтесь, мы предупреждали.
[ТАЙМ-ТЕГИ]
00:00:00 Интро
00:01:02 Как Артур попал в data science
00:03:50 Как Сергей попал в data science
00:13:20 Артур: вопросы по метрикам
00:21:00 Сергей: вопросы по метрикам
00:29:55 AUC за один твит
00:31:45 Артур: деревья
00:34:25 Сергей: "задача на рисование"
00:36:35 Сергей: вопрос про нейронки за 140 символов (полином третьей степени и перцептрон)
00:38:55 Артур: параметры свёртки
00:42:00 Артур: как работает batch norm
00:46:00 Сергей: можно ли тьюнить только batch norm?
00:46:50 Сергей: что такое регуляризация. Какие регуляризации ты знаешь
00:49:50 Артур: какие есть attentions в нейросетях
00:53:30 Артур: обучение на кропнутых изображениях
00:57:10 Сергей: бинарная кросс-энтропия
01:00:55 Сергей: новые альтернативы IoU метрики
01:02:35 Артур: детекция - архитектуры и детекторы
01:08:50 Артур: anchor-free детекторы
01:10:30 Сергей: как мониторить качество сетки
01:17:30 Артур: методы ускорения нейросетей
01:25:15 Артур: задача про бинарную маску
01:33:05 Сергей: бот-ассистент и sensitive cases
01:43:00 Артур: софт скилы, "странные вопросы" по мотивации
01:50:40 Сергей: что мотивирует тебя
[ССЫЛКИ]
FLESS fless.pro
Instagram / flesspro
Facebook / flesspro
VK flesspro
Telegram t.me/flesspro
#WillYouHireMe #Нанято
Тайм-теги
00:00:00 Интро
00:01:02 Как Артур попал в data science
00:03:50 Как Сергей попал в data science
00:13:20 Артур: вопросы по метрикам
00:21:00 Сергей: вопросы по метрикам
00:29:55 AUC за один твит
00:31:45 Артур: деревья
00:34:25 Сергей: "задача на рисование"
00:36:35 Сергей: вопрос про нейронки за 140 символов (полином третьей степени и перцептрон)
00:38:55 Артур: параметры свёртки
00:42:00 Артур: как работает batch norm
00:46:00 Сергей: можно ли тьюнить только batch norm?
00:46:50 Сергей: что такое регуляризация. Какие регуляризации ты знаешь
00:49:50 Артур: какие есть attentions в нейросетях
00:53:30 Артур: обучение на кропнутых изображениях
00:57:10 Сергей: бинарная кросс-энтропия
01:00:55 Сергей: новые альтернативы IoU метрики
01:02:35 Артур: детекция - архитектуры и детекторы
01:08:50 Артур: anchor-free детекторы
01:10:30 Сергей: как мониторить качество сетки
01:17:30 Артур: методы ускорения нейросетей
01:25:15 Артур: задача про бинарную маску
01:33:05 Сергей: бот-ассистент и sensitive cases
01:43:00 Артур: софт скилы, "странные вопросы" по мотивации
01:50:40 Сергей: что мотивирует тебя
Офигенная прививка от синдрома самозванца, спасибо )
Это точно! Оказывается, не все знать - это нормально, и не так страшно) и допустимо для ребят даже такого уровня!
Почему ребята из Тинькова и Сбера общаются о каких-то стажерских вещах, а меня на собеседовании в неоплачиваемый проект спрашивали обо всем, будто я сеньор....
Когда собеседую -- задаю вопросы по базовым концепциям, в моем случе языка, паттернам и многопоточности, и по ответам понимаю, какой уровень у кандидата
я замечал такой парадокс, часто чем меньше компания, тем более претензионное собеседование. Видимо страх ошибиться в найме (для них 1 твоя месячная ЗП это серьезная сумма) и проекция каких-то комплексов руководства (есть даже известный совет "Вы не Гугл" с месседжем не пытайтесь строить у себя процессы будто вы Гугл)
@@vladislavgusak2309 дата саентистам?
@@NoName-iy5ih C++
Показательные собесы всегда такие. Видел видео гугла и яндекса по поводу подготовки к их собеседованиям. Там тоже полный детский сад. Это связано с тем, что эти видео делаются на широкую аудиторию. Если в них задавать настоящие вопросы и задачи, то 95% потенциальной аудитории ничего не поймут и будут думать, что они очень глупые. А когда смотрящий видео человек знает все ответы, то ему и смотреть интересно, и самооценка повышается
Ребят, ну это пушка )) спасибо, было весело и интересно
Топовый контент!!!
Смотрел на одном дыхании.
Определенно нужна 2-ая часть по алго, system design, управлению командой ...
Было очень интересно!
Очень крутой формат. Жду новые выпуски
Многие эти вопросы мне задавали на собеседовании... Спасибо большое за видео) Жалко, что увидел его уже после собеса)
Блин, таких крутых людей пригласили, круто!
Они даже внешне отождествляют Сбер и Тинькофф)
Вот кумиры молодёжи;)
Спасибо, очень интересно)
Просто топ!
Еее, когда даже ты шаришь за регуляризацию L1 и L2 )))
Ага, только я обычно спрашиваю на собеседованиях "Какое априорное распределение надо задать в Баясовской регресии, что бы получить еквивалент MHK регрессии с L1 L2 регуляризацией?" Ответ "Очевидно что L2 - нормальное распределение, L1 - распределение Лапласа".
Знаешь как народ валится? На отличнинько ))))
@@oleksitkachenko4747 я на самом деле удивляюсь, как. Ибо Бишоп это пишет на первых 12 страницах. Обычно до них дочитывают)
Когда то запоминал пресиж, что он начинается на п. Поэтому у всего в формулах должна быть буква п. ТП на ТП+ФП
воу у тебя уже почти 17к сабов . !!!! Респект и роста !
Почему не через смысл precision?
Суммируя мой опыт работы и собеседований, и это видео: нужно избавиться от терминов precision и recall потому что абсолютно ВСЕ дс-ники в них путаются)))
Когда опытные решают теоритические задачи с практической стороны.
😏👍
39:28 так, а единичка же не там прибавлена, мы bias накидываем на выход каждого фильтра, то есть (3 * 3 * 3 + 1) * 64, разве нет?
Ааааа какие красивые парни! Особенно тот что помоложе с хвостиком! Не привыкли мы видеть таких в айтишке)
Спасибо большое
Internal covariate shift не про то, что сказали( там проблема, что слой обновляется в ожидании того, что распределение выхода предыдущих не изменится.
Фризить батчнорм - это активации загонять в распределении со среднтм 0 и дисперсией 1.
Интересно, но что-то от людей на топ позициях ожидаешь больше вопросов про бизнес-кейсы, архитектуру (system design) и менеджмент в целом - тема совсем не раскрыта:(
ох уж эти вопросы про roc auc
Нет желания сделать у себя на канале видео про то, что должен знать дата саентист?
@@maxoun7126 Думаю можно будет что то про вопросы на собеседованиях сделать
Нейронки круто, конечно, а про обычные алгоритмы машинного обучения мало раскрыто.
там далеко не разгонишься, в то время как тема DL куда более обширная, используемая и c большим кол-вом подводных камней
@@ac130kz да я бы не сказал)) просто парни всё забыли, в работе только нейронки используют
На канале будут собеседования только про ДС? Или другие направления ИТ тоже будут?
Разные будут
формат топ
Вот главное, чтобы интервьюер на собеседовании понимал, что какие-то вещи можно забыть.. ) вот, напрример, с 4 года опыта чисто в DL/CV, я вот сейчас хрен вспомню сходу какой-нибудь тер вер, или что-то такое. А формулы метрик зачем деражать в голове? Главное понимать их смысл. Но формулу можно посмотреть либо в блокнотике, либо загуглить. Главное знать, что такая метрика существует, и знать, что она оценивает)) на собесаз я встречал случаи, когда кандидат знал формулу (прото зазубрил), но вообще не понимал, почему она именно такая и что она делает)
Странно конечно, метрик всего там несколько, можно было за это время выучить ...
Кайфы 👌
На каком языке говорят эти почтенные мужи?😁
@@SuperEuro узкий специализированный
Коллега, мы ошиблись дверью.
Скорость точнее, ну, ты понял
26:00 В ситуации серьезного дисбаланса классов ситуация будет в точности обратная: micro-усреднение покажет, что всё хорошо, т.к. классификатор уверенно предсказывает бОльший класс и, следовательно, угадывает больше отдельных сэмплов. А macro считается сначала для классов, а потом усредняется. И это как раз подсветит, что есть проседающий (или проседающие) классы, которые плохо предсказываются классификатором и снижают общую оценку после усреднения
Если взять четыре класса три из них по 1 ТР и 1 FP, а четвёртый 10 ТР и 90 FP, то макро средняя точность будет 0.4, а микро средняя точность ≈0.12 что куда лучше отражает действительную картину
Обычно при дисбалансем наоборот бывает - в четвёртом классе к примеру 90 TP и 10 FP
повысить бы немного качество звука. иногда плохо слышно собеседников
подскажите пожалуйста тайм код если не затруднит
Рекламы мало, надо чаще вставлять
31:22 мне кажется, или вместо multilabel они имеют в виду multiclass?
Мальчики симпотяжки😊
Нихйя не понял, но очень интересно)
о, Декстер в DS пошел.
Ждал новый сезон осенью, а он вышел летом
контент супер но со звуком пипец какой-то
то одного не слышно то другого, то качество звука резко падает, то мыло какое-то
:(
метрики при несбалансированных выборках и сразу сложности. Это же база.
Тупо битва титанов
а мне нравится пороги нелдером мидом подбирать
Неужели вот так просто можно попасть к вам на этот формат, просто написав на почту? Блин, круто если так, но неужели там не поток желающих?
Оба утверждения верны
почему scitator и почему n01z3?
ники github или kaggle или и то и другое
Сидят два взрослых мужика и понтуются перед другом
Угар и садамия :)) 58:30 :)))
Идея для видео: провести собеседование на джуна в дс (желательно, чтобы он был с гуманитарным бэкграундом)
какая разница с каким бэкграундом? знания то на позицию джуна одни и те же нужны
@@daniilzoque1193 При приёме на работу учитываются не только сухие знания. Да и сам факт что человек с гуманитарным бэкграундом может настолько кардинально сменить сферу деятельности может вдохновить многих
Слишком сильно ускоряешь время видеозаписи во время интро
В этом не было ускорений
Было
оба ребята известные, крутые и толковые специалисты...но ошибок в данном общении/блиц-собесе просто море.
Не разобрать, что говорит Артур 🙈
А почему все это должен знать джун/интерн, если даже такие люди не все помнят?!
И тут приплели игру в кальмара на 1:25:50
Лень смотреть. До армрестлинга-то скатились или нет?
вот
Data Scientist в Тинькофф не знает, откуда 2 в F1-мере? Мощно
Начиная с какого-то уровня, это норм ))
@@ra1618 ну нет, не согласен. Это не те вещи, которые забываются от недостатка практики. Если человек знает, что такое f1 мера вывести формулу - вопрос 2 секунд.
Заставка прикольная, идея красивая, но слишком много слова "типа"
Парень с челкой видно, что волнуется и тупит
два джуна яйками меряются, сидя на ресепшне, перед собесом.