Тайм-теги 00:00:00 Интро 00:01:02 Как Артур попал в data science 00:03:50 Как Сергей попал в data science 00:13:20 Артур: вопросы по метрикам 00:21:00 Сергей: вопросы по метрикам 00:29:55 AUC за один твит 00:31:45 Артур: деревья 00:34:25 Сергей: "задача на рисование" 00:36:35 Сергей: вопрос про нейронки за 140 символов (полином третьей степени и перцептрон) 00:38:55 Артур: параметры свёртки 00:42:00 Артур: как работает batch norm 00:46:00 Сергей: можно ли тьюнить только batch norm? 00:46:50 Сергей: что такое регуляризация. Какие регуляризации ты знаешь 00:49:50 Артур: какие есть attentions в нейросетях 00:53:30 Артур: обучение на кропнутых изображениях 00:57:10 Сергей: бинарная кросс-энтропия 01:00:55 Сергей: новые альтернативы IoU метрики 01:02:35 Артур: детекция - архитектуры и детекторы 01:08:50 Артур: anchor-free детекторы 01:10:30 Сергей: как мониторить качество сетки 01:17:30 Артур: методы ускорения нейросетей 01:25:15 Артур: задача про бинарную маску 01:33:05 Сергей: бот-ассистент и sensitive cases 01:43:00 Артур: софт скилы, "странные вопросы" по мотивации 01:50:40 Сергей: что мотивирует тебя
Почему ребята из Тинькова и Сбера общаются о каких-то стажерских вещах, а меня на собеседовании в неоплачиваемый проект спрашивали обо всем, будто я сеньор....
Когда собеседую -- задаю вопросы по базовым концепциям, в моем случе языка, паттернам и многопоточности, и по ответам понимаю, какой уровень у кандидата
я замечал такой парадокс, часто чем меньше компания, тем более претензионное собеседование. Видимо страх ошибиться в найме (для них 1 твоя месячная ЗП это серьезная сумма) и проекция каких-то комплексов руководства (есть даже известный совет "Вы не Гугл" с месседжем не пытайтесь строить у себя процессы будто вы Гугл)
Показательные собесы всегда такие. Видел видео гугла и яндекса по поводу подготовки к их собеседованиям. Там тоже полный детский сад. Это связано с тем, что эти видео делаются на широкую аудиторию. Если в них задавать настоящие вопросы и задачи, то 95% потенциальной аудитории ничего не поймут и будут думать, что они очень глупые. А когда смотрящий видео человек знает все ответы, то ему и смотреть интересно, и самооценка повышается
Ага, только я обычно спрашиваю на собеседованиях "Какое априорное распределение надо задать в Баясовской регресии, что бы получить еквивалент MHK регрессии с L1 L2 регуляризацией?" Ответ "Очевидно что L2 - нормальное распределение, L1 - распределение Лапласа". Знаешь как народ валится? На отличнинько ))))
Суммируя мой опыт работы и собеседований, и это видео: нужно избавиться от терминов precision и recall потому что абсолютно ВСЕ дс-ники в них путаются)))
Интересно, но что-то от людей на топ позициях ожидаешь больше вопросов про бизнес-кейсы, архитектуру (system design) и менеджмент в целом - тема совсем не раскрыта:(
Internal covariate shift не про то, что сказали( там проблема, что слой обновляется в ожидании того, что распределение выхода предыдущих не изменится. Фризить батчнорм - это активации загонять в распределении со среднтм 0 и дисперсией 1.
Вот главное, чтобы интервьюер на собеседовании понимал, что какие-то вещи можно забыть.. ) вот, напрример, с 4 года опыта чисто в DL/CV, я вот сейчас хрен вспомню сходу какой-нибудь тер вер, или что-то такое. А формулы метрик зачем деражать в голове? Главное понимать их смысл. Но формулу можно посмотреть либо в блокнотике, либо загуглить. Главное знать, что такая метрика существует, и знать, что она оценивает)) на собесаз я встречал случаи, когда кандидат знал формулу (прото зазубрил), но вообще не понимал, почему она именно такая и что она делает)
26:00 В ситуации серьезного дисбаланса классов ситуация будет в точности обратная: micro-усреднение покажет, что всё хорошо, т.к. классификатор уверенно предсказывает бОльший класс и, следовательно, угадывает больше отдельных сэмплов. А macro считается сначала для классов, а потом усредняется. И это как раз подсветит, что есть проседающий (или проседающие) классы, которые плохо предсказываются классификатором и снижают общую оценку после усреднения
Если взять четыре класса три из них по 1 ТР и 1 FP, а четвёртый 10 ТР и 90 FP, то макро средняя точность будет 0.4, а микро средняя точность ≈0.12 что куда лучше отражает действительную картину
@@daniilzoque1193 При приёме на работу учитываются не только сухие знания. Да и сам факт что человек с гуманитарным бэкграундом может настолько кардинально сменить сферу деятельности может вдохновить многих
@@ra1618 ну нет, не согласен. Это не те вещи, которые забываются от недостатка практики. Если человек знает, что такое f1 мера вывести формулу - вопрос 2 секунд.
Тайм-теги
00:00:00 Интро
00:01:02 Как Артур попал в data science
00:03:50 Как Сергей попал в data science
00:13:20 Артур: вопросы по метрикам
00:21:00 Сергей: вопросы по метрикам
00:29:55 AUC за один твит
00:31:45 Артур: деревья
00:34:25 Сергей: "задача на рисование"
00:36:35 Сергей: вопрос про нейронки за 140 символов (полином третьей степени и перцептрон)
00:38:55 Артур: параметры свёртки
00:42:00 Артур: как работает batch norm
00:46:00 Сергей: можно ли тьюнить только batch norm?
00:46:50 Сергей: что такое регуляризация. Какие регуляризации ты знаешь
00:49:50 Артур: какие есть attentions в нейросетях
00:53:30 Артур: обучение на кропнутых изображениях
00:57:10 Сергей: бинарная кросс-энтропия
01:00:55 Сергей: новые альтернативы IoU метрики
01:02:35 Артур: детекция - архитектуры и детекторы
01:08:50 Артур: anchor-free детекторы
01:10:30 Сергей: как мониторить качество сетки
01:17:30 Артур: методы ускорения нейросетей
01:25:15 Артур: задача про бинарную маску
01:33:05 Сергей: бот-ассистент и sensitive cases
01:43:00 Артур: софт скилы, "странные вопросы" по мотивации
01:50:40 Сергей: что мотивирует тебя
Офигенная прививка от синдрома самозванца, спасибо )
Это точно! Оказывается, не все знать - это нормально, и не так страшно) и допустимо для ребят даже такого уровня!
Определенно нужна 2-ая часть по алго, system design, управлению командой ...
Было очень интересно!
Почему ребята из Тинькова и Сбера общаются о каких-то стажерских вещах, а меня на собеседовании в неоплачиваемый проект спрашивали обо всем, будто я сеньор....
Когда собеседую -- задаю вопросы по базовым концепциям, в моем случе языка, паттернам и многопоточности, и по ответам понимаю, какой уровень у кандидата
я замечал такой парадокс, часто чем меньше компания, тем более претензионное собеседование. Видимо страх ошибиться в найме (для них 1 твоя месячная ЗП это серьезная сумма) и проекция каких-то комплексов руководства (есть даже известный совет "Вы не Гугл" с месседжем не пытайтесь строить у себя процессы будто вы Гугл)
@@vladislavgusak2309 дата саентистам?
@@NoName-iy5ih C++
Показательные собесы всегда такие. Видел видео гугла и яндекса по поводу подготовки к их собеседованиям. Там тоже полный детский сад. Это связано с тем, что эти видео делаются на широкую аудиторию. Если в них задавать настоящие вопросы и задачи, то 95% потенциальной аудитории ничего не поймут и будут думать, что они очень глупые. А когда смотрящий видео человек знает все ответы, то ему и смотреть интересно, и самооценка повышается
Они даже внешне отождествляют Сбер и Тинькофф)
Ребят, ну это пушка )) спасибо, было весело и интересно
Еее, когда даже ты шаришь за регуляризацию L1 и L2 )))
Ага, только я обычно спрашиваю на собеседованиях "Какое априорное распределение надо задать в Баясовской регресии, что бы получить еквивалент MHK регрессии с L1 L2 регуляризацией?" Ответ "Очевидно что L2 - нормальное распределение, L1 - распределение Лапласа".
Знаешь как народ валится? На отличнинько ))))
@@oleksitkachenko4747 я на самом деле удивляюсь, как. Ибо Бишоп это пишет на первых 12 страницах. Обычно до них дочитывают)
Вот кумиры молодёжи;)
Суммируя мой опыт работы и собеседований, и это видео: нужно избавиться от терминов precision и recall потому что абсолютно ВСЕ дс-ники в них путаются)))
Когда то запоминал пресиж, что он начинается на п. Поэтому у всего в формулах должна быть буква п. ТП на ТП+ФП
воу у тебя уже почти 17к сабов . !!!! Респект и роста !
Почему не через смысл precision?
Топовый контент!!!
Смотрел на одном дыхании.
Блин, таких крутых людей пригласили, круто!
39:28 так, а единичка же не там прибавлена, мы bias накидываем на выход каждого фильтра, то есть (3 * 3 * 3 + 1) * 64, разве нет?
Многие эти вопросы мне задавали на собеседовании... Спасибо большое за видео) Жалко, что увидел его уже после собеса)
Интересно, но что-то от людей на топ позициях ожидаешь больше вопросов про бизнес-кейсы, архитектуру (system design) и менеджмент в целом - тема совсем не раскрыта:(
ох уж эти вопросы про roc auc
Нет желания сделать у себя на канале видео про то, что должен знать дата саентист?
@@maxoun7126 Думаю можно будет что то про вопросы на собеседованиях сделать
Нейронки круто, конечно, а про обычные алгоритмы машинного обучения мало раскрыто.
там далеко не разгонишься, в то время как тема DL куда более обширная, используемая и c большим кол-вом подводных камней
@@ac130kz да я бы не сказал)) просто парни всё забыли, в работе только нейронки используют
Очень крутой формат. Жду новые выпуски
Когда опытные решают теоритические задачи с практической стороны.
😏👍
Просто топ!
Internal covariate shift не про то, что сказали( там проблема, что слой обновляется в ожидании того, что распределение выхода предыдущих не изменится.
Фризить батчнорм - это активации загонять в распределении со среднтм 0 и дисперсией 1.
Вот главное, чтобы интервьюер на собеседовании понимал, что какие-то вещи можно забыть.. ) вот, напрример, с 4 года опыта чисто в DL/CV, я вот сейчас хрен вспомню сходу какой-нибудь тер вер, или что-то такое. А формулы метрик зачем деражать в голове? Главное понимать их смысл. Но формулу можно посмотреть либо в блокнотике, либо загуглить. Главное знать, что такая метрика существует, и знать, что она оценивает)) на собесаз я встречал случаи, когда кандидат знал формулу (прото зазубрил), но вообще не понимал, почему она именно такая и что она делает)
Странно конечно, метрик всего там несколько, можно было за это время выучить ...
метрики при несбалансированных выборках и сразу сложности. Это же база.
повысить бы немного качество звука. иногда плохо слышно собеседников
подскажите пожалуйста тайм код если не затруднит
На каком языке говорят эти почтенные мужи?😁
@@SuperEuro узкий специализированный
Коллега, мы ошиблись дверью.
Спасибо, очень интересно)
Нихйя не понял, но очень интересно)
Тупо битва титанов
Спасибо большое
26:00 В ситуации серьезного дисбаланса классов ситуация будет в точности обратная: micro-усреднение покажет, что всё хорошо, т.к. классификатор уверенно предсказывает бОльший класс и, следовательно, угадывает больше отдельных сэмплов. А macro считается сначала для классов, а потом усредняется. И это как раз подсветит, что есть проседающий (или проседающие) классы, которые плохо предсказываются классификатором и снижают общую оценку после усреднения
Если взять четыре класса три из них по 1 ТР и 1 FP, а четвёртый 10 ТР и 90 FP, то макро средняя точность будет 0.4, а микро средняя точность ≈0.12 что куда лучше отражает действительную картину
Обычно при дисбалансем наоборот бывает - в четвёртом классе к примеру 90 TP и 10 FP
контент супер но со звуком пипец какой-то
то одного не слышно то другого, то качество звука резко падает, то мыло какое-то
:(
Идея для видео: провести собеседование на джуна в дс (желательно, чтобы он был с гуманитарным бэкграундом)
какая разница с каким бэкграундом? знания то на позицию джуна одни и те же нужны
@@daniilzoque1193 При приёме на работу учитываются не только сухие знания. Да и сам факт что человек с гуманитарным бэкграундом может настолько кардинально сменить сферу деятельности может вдохновить многих
о, Декстер в DS пошел.
Ждал новый сезон осенью, а он вышел летом
На канале будут собеседования только про ДС? Или другие направления ИТ тоже будут?
Разные будут
Сидят два взрослых мужика и понтуются перед другом
Скорость точнее, ну, ты понял
Ааааа какие красивые парни! Особенно тот что помоложе с хвостиком! Не привыкли мы видеть таких в айтишке)
формат топ
Мальчики симпотяжки😊
Угар и садамия :)) 58:30 :)))
почему scitator и почему n01z3?
ники github или kaggle или и то и другое
Data Scientist в Тинькофф не знает, откуда 2 в F1-мере? Мощно
Начиная с какого-то уровня, это норм ))
@@ra1618 ну нет, не согласен. Это не те вещи, которые забываются от недостатка практики. Если человек знает, что такое f1 мера вывести формулу - вопрос 2 секунд.
31:22 мне кажется, или вместо multilabel они имеют в виду multiclass?
Кайфы 👌
Рекламы мало, надо чаще вставлять
Неужели вот так просто можно попасть к вам на этот формат, просто написав на почту? Блин, круто если так, но неужели там не поток желающих?
Оба утверждения верны
а мне нравится пороги нелдером мидом подбирать
оба ребята известные, крутые и толковые специалисты...но ошибок в данном общении/блиц-собесе просто море.
А почему все это должен знать джун/интерн, если даже такие люди не все помнят?!
Слишком сильно ускоряешь время видеозаписи во время интро
В этом не было ускорений
Было
Не разобрать, что говорит Артур 🙈
И тут приплели игру в кальмара на 1:25:50
Заставка прикольная, идея красивая, но слишком много слова "типа"
вот
Парень с челкой видно, что волнуется и тупит
Лень смотреть. До армрестлинга-то скатились или нет?
два джуна яйками меряются, сидя на ресепшне, перед собесом.