Собеседование Data Science: Артур Кузин/Sber Devices vs Сергей Колесников/Tinkoff |
Вставка
- Опубліковано 15 чер 2024
- Заскакивай на телегу: t.me/flesspro .
В этом эпизоде насладитесь смесью шуток за 300 из "что было дальше" и турнира по пощечинам - Артур Кузин из Sber Devices и Сергей Колесников из Tinkoff собеседуют друг друга. Тематика по большей части Computer Vision (вселенная Артура), так что Сергею пришлось выступать "в гостях". Впрочем, в конце он-таки отыгрался на Артуре чатботами.
Смотрите по тайм-тегам. А у кого сразу есть 2 часа времени - запасайтесь попкорном и готовьтесь к действу. И ещё - уберите ваших детей от наших голубых экранов, ибо без мата не обошлось.
Ну и disclaimer: мы, конечно, старались снять близко к реальности. Но на реальных интервью у обоих участников есть ещё вопросы, которые тут не стали спойлерить. Так что если придете, например, к Артуру, а он будет вас глубже гонять - не удивляйтесь, мы предупреждали.
[ТАЙМ-ТЕГИ]
00:00:00 Интро
00:01:02 Как Артур попал в data science
00:03:50 Как Сергей попал в data science
00:13:20 Артур: вопросы по метрикам
00:21:00 Сергей: вопросы по метрикам
00:29:55 AUC за один твит
00:31:45 Артур: деревья
00:34:25 Сергей: "задача на рисование"
00:36:35 Сергей: вопрос про нейронки за 140 символов (полином третьей степени и перцептрон)
00:38:55 Артур: параметры свёртки
00:42:00 Артур: как работает batch norm
00:46:00 Сергей: можно ли тьюнить только batch norm?
00:46:50 Сергей: что такое регуляризация. Какие регуляризации ты знаешь
00:49:50 Артур: какие есть attentions в нейросетях
00:53:30 Артур: обучение на кропнутых изображениях
00:57:10 Сергей: бинарная кросс-энтропия
01:00:55 Сергей: новые альтернативы IoU метрики
01:02:35 Артур: детекция - архитектуры и детекторы
01:08:50 Артур: anchor-free детекторы
01:10:30 Сергей: как мониторить качество сетки
01:17:30 Артур: методы ускорения нейросетей
01:25:15 Артур: задача про бинарную маску
01:33:05 Сергей: бот-ассистент и sensitive cases
01:43:00 Артур: софт скилы, "странные вопросы" по мотивации
01:50:40 Сергей: что мотивирует тебя
[ССЫЛКИ]
FLESS fless.pro
Instagram / flesspro
Facebook / flesspro
VK flesspro
Telegram t.me/flesspro
#WillYouHireMe #Нанято
Тайм-теги
00:00:00 Интро
00:01:02 Как Артур попал в data science
00:03:50 Как Сергей попал в data science
00:13:20 Артур: вопросы по метрикам
00:21:00 Сергей: вопросы по метрикам
00:29:55 AUC за один твит
00:31:45 Артур: деревья
00:34:25 Сергей: "задача на рисование"
00:36:35 Сергей: вопрос про нейронки за 140 символов (полином третьей степени и перцептрон)
00:38:55 Артур: параметры свёртки
00:42:00 Артур: как работает batch norm
00:46:00 Сергей: можно ли тьюнить только batch norm?
00:46:50 Сергей: что такое регуляризация. Какие регуляризации ты знаешь
00:49:50 Артур: какие есть attentions в нейросетях
00:53:30 Артур: обучение на кропнутых изображениях
00:57:10 Сергей: бинарная кросс-энтропия
01:00:55 Сергей: новые альтернативы IoU метрики
01:02:35 Артур: детекция - архитектуры и детекторы
01:08:50 Артур: anchor-free детекторы
01:10:30 Сергей: как мониторить качество сетки
01:17:30 Артур: методы ускорения нейросетей
01:25:15 Артур: задача про бинарную маску
01:33:05 Сергей: бот-ассистент и sensitive cases
01:43:00 Артур: софт скилы, "странные вопросы" по мотивации
01:50:40 Сергей: что мотивирует тебя
Офигенная прививка от синдрома самозванца, спасибо )
Это точно! Оказывается, не все знать - это нормально, и не так страшно) и допустимо для ребят даже такого уровня!
Почему ребята из Тинькова и Сбера общаются о каких-то стажерских вещах, а меня на собеседовании в неоплачиваемый проект спрашивали обо всем, будто я сеньор....
Когда собеседую -- задаю вопросы по базовым концепциям, в моем случе языка, паттернам и многопоточности, и по ответам понимаю, какой уровень у кандидата
я замечал такой парадокс, часто чем меньше компания, тем более претензионное собеседование. Видимо страх ошибиться в найме (для них 1 твоя месячная ЗП это серьезная сумма) и проекция каких-то комплексов руководства (есть даже известный совет "Вы не Гугл" с месседжем не пытайтесь строить у себя процессы будто вы Гугл)
@@vladislavgusak2309 дата саентистам?
@@NoName-iy5ih C++
Показательные собесы всегда такие. Видел видео гугла и яндекса по поводу подготовки к их собеседованиям. Там тоже полный детский сад. Это связано с тем, что эти видео делаются на широкую аудиторию. Если в них задавать настоящие вопросы и задачи, то 95% потенциальной аудитории ничего не поймут и будут думать, что они очень глупые. А когда смотрящий видео человек знает все ответы, то ему и смотреть интересно, и самооценка повышается
Определенно нужна 2-ая часть по алго, system design, управлению командой ...
Было очень интересно!
Ребят, ну это пушка )) спасибо, было весело и интересно
Топовый контент!!!
Смотрел на одном дыхании.
Очень крутой формат. Жду новые выпуски
Они даже внешне отождествляют Сбер и Тинькофф)
Когда то запоминал пресиж, что он начинается на п. Поэтому у всего в формулах должна быть буква п. ТП на ТП+ФП
воу у тебя уже почти 17к сабов . !!!! Респект и роста !
Почему не через смысл precision?
Многие эти вопросы мне задавали на собеседовании... Спасибо большое за видео) Жалко, что увидел его уже после собеса)
Суммируя мой опыт работы и собеседований, и это видео: нужно избавиться от терминов precision и recall потому что абсолютно ВСЕ дс-ники в них путаются)))
Блин, таких крутых людей пригласили, круто!
Еее, когда даже ты шаришь за регуляризацию L1 и L2 )))
Ага, только я обычно спрашиваю на собеседованиях "Какое априорное распределение надо задать в Баясовской регресии, что бы получить еквивалент MHK регрессии с L1 L2 регуляризацией?" Ответ "Очевидно что L2 - нормальное распределение, L1 - распределение Лапласа".
Знаешь как народ валится? На отличнинько ))))
@@oleksitkachenko4747 я на самом деле удивляюсь, как. Ибо Бишоп это пишет на первых 12 страницах. Обычно до них дочитывают)
Спасибо, очень интересно)
Ааааа какие красивые парни! Особенно тот что помоложе с хвостиком! Не привыкли мы видеть таких в айтишке)
Internal covariate shift не про то, что сказали( там проблема, что слой обновляется в ожидании того, что распределение выхода предыдущих не изменится.
Фризить батчнорм - это активации загонять в распределении со среднтм 0 и дисперсией 1.
39:28 так, а единичка же не там прибавлена, мы bias накидываем на выход каждого фильтра, то есть (3 * 3 * 3 + 1) * 64, разве нет?
Вот кумиры молодёжи;)
Когда опытные решают теоритические задачи с практической стороны.
😏👍
Интересно, но что-то от людей на топ позициях ожидаешь больше вопросов про бизнес-кейсы, архитектуру (system design) и менеджмент в целом - тема совсем не раскрыта:(
Просто топ!
ох уж эти вопросы про roc auc
Нет желания сделать у себя на канале видео про то, что должен знать дата саентист?
@@maxoun7126 Думаю можно будет что то про вопросы на собеседованиях сделать
Нейронки круто, конечно, а про обычные алгоритмы машинного обучения мало раскрыто.
там далеко не разгонишься, в то время как тема DL куда более обширная, используемая и c большим кол-вом подводных камней
@@ac130kz да я бы не сказал)) просто парни всё забыли, в работе только нейронки используют
Спасибо большое
На канале будут собеседования только про ДС? Или другие направления ИТ тоже будут?
Разные будут
Вот главное, чтобы интервьюер на собеседовании понимал, что какие-то вещи можно забыть.. ) вот, напрример, с 4 года опыта чисто в DL/CV, я вот сейчас хрен вспомню сходу какой-нибудь тер вер, или что-то такое. А формулы метрик зачем деражать в голове? Главное понимать их смысл. Но формулу можно посмотреть либо в блокнотике, либо загуглить. Главное знать, что такая метрика существует, и знать, что она оценивает)) на собесаз я встречал случаи, когда кандидат знал формулу (прото зазубрил), но вообще не понимал, почему она именно такая и что она делает)
Странно конечно, метрик всего там несколько, можно было за это время выучить ...
На каком языке говорят эти почтенные мужи?😁
@@SuperEuro узкий специализированный
Коллега, мы ошиблись дверью.
метрики при несбалансированных выборках и сразу сложности. Это же база.
Рекламы мало, надо чаще вставлять
Скорость точнее, ну, ты понял
повысить бы немного качество звука. иногда плохо слышно собеседников
подскажите пожалуйста тайм код если не затруднит
26:00 В ситуации серьезного дисбаланса классов ситуация будет в точности обратная: micro-усреднение покажет, что всё хорошо, т.к. классификатор уверенно предсказывает бОльший класс и, следовательно, угадывает больше отдельных сэмплов. А macro считается сначала для классов, а потом усредняется. И это как раз подсветит, что есть проседающий (или проседающие) классы, которые плохо предсказываются классификатором и снижают общую оценку после усреднения
Если взять четыре класса три из них по 1 ТР и 1 FP, а четвёртый 10 ТР и 90 FP, то макро средняя точность будет 0.4, а микро средняя точность ≈0.12 что куда лучше отражает действительную картину
Обычно при дисбалансем наоборот бывает - в четвёртом классе к примеру 90 TP и 10 FP
31:22 мне кажется, или вместо multilabel они имеют в виду multiclass?
формат топ
контент супер но со звуком пипец какой-то
то одного не слышно то другого, то качество звука резко падает, то мыло какое-то
:(
Нихйя не понял, но очень интересно)
а мне нравится пороги нелдером мидом подбирать
Кайфы 👌
о, Декстер в DS пошел.
Ждал новый сезон осенью, а он вышел летом
Идея для видео: провести собеседование на джуна в дс (желательно, чтобы он был с гуманитарным бэкграундом)
какая разница с каким бэкграундом? знания то на позицию джуна одни и те же нужны
@@daniilzoque1193 При приёме на работу учитываются не только сухие знания. Да и сам факт что человек с гуманитарным бэкграундом может настолько кардинально сменить сферу деятельности может вдохновить многих
Неужели вот так просто можно попасть к вам на этот формат, просто написав на почту? Блин, круто если так, но неужели там не поток желающих?
Оба утверждения верны
Мальчики симпотяжки😊
Тупо битва титанов
почему scitator и почему n01z3?
ники github или kaggle или и то и другое
Сидят два взрослых мужика и понтуются перед другом
Не разобрать, что говорит Артур 🙈
Угар и садамия :)) 58:30 :)))
Слишком сильно ускоряешь время видеозаписи во время интро
В этом не было ускорений
Было
оба ребята известные, крутые и толковые специалисты...но ошибок в данном общении/блиц-собесе просто море.
И тут приплели игру в кальмара на 1:25:50
А почему все это должен знать джун/интерн, если даже такие люди не все помнят?!
Data Scientist в Тинькофф не знает, откуда 2 в F1-мере? Мощно
Начиная с какого-то уровня, это норм ))
@@ra1618 ну нет, не согласен. Это не те вещи, которые забываются от недостатка практики. Если человек знает, что такое f1 мера вывести формулу - вопрос 2 секунд.
Заставка прикольная, идея красивая, но слишком много слова "типа"
вот
Лень смотреть. До армрестлинга-то скатились или нет?
Парень с челкой видно, что волнуется и тупит
два джуна яйками меряются, сидя на ресепшне, перед собесом.