Никита Маршалкин: A/B-тесты сложнее, чем кажется | Интервью | karpov.courses

Поділитися
Вставка
  • Опубліковано 19 чер 2024
  • Симулятор A/B-тестов: bit.ly/40uPpjt
    У нас гостях Никита Маршалкин, Data Scientist Вконтакте. Мы обсудили, как устроены A/B-тесты в компании, а именно:
    ● как работают системы сплитования;
    ● работают ли обычные статистические тесты на Big Data и какие подводные камни там есть;
    ● особенности A/B-тестов в социальных сетях;
    ● где научиться мастерски проводить A/B-тестирование.
    А/Б-тесты, подборка от Никиты:
    1. Бомбическая книжка: experimentguide.com
    2. Кладезь информации про А/Б в индустрии: exp-platform.com
    3. Practitioner’s Guide to Statistical Tests: / practitioners-guide-to...
    4. Пуассоновский бутстрап и бакетизация: research.google/pubs/pub43157/
    5. Эксперименты в соцсетях: arxiv.org/abs/1404.7530
    6. Заметки с саммита по экспериментам на KDD’19: research. publications/...
    7. Туториал по построению оптимизации в b2c продуктах: onlineuserengagement.github.io/
    Учитесь Data Science с нами: karpov.courses/
    00:00 Что такое A/B-тесты
    03:02 Системы сплитования
    12:55 Экосистема A/B-тестов ВКонтакте
    16:50 Тонкости тестирования на проде
    18:55 Проверка гипотез на Big Data
    23:25 Bootstrap
    27:34 A/B-тесты без A/B-тестов
    30:10 Ухудшающие A/B-тесты
    31:55 Можно ли принимать решения без A/B-тестов ?
    33:38 Кто те люди, которые занимаются A/B-тестами?
    34:55 Материалы и знания, которых нигде нет!

КОМЕНТАРІ • 67

  • @user-er3gp7uu8z
    @user-er3gp7uu8z 2 роки тому +90

    Кто из курса основы статистики? 👋

    • @user-pt2rw8xo8n
      @user-pt2rw8xo8n 10 місяців тому +1

      Мне кажется больше половины. У меня с Толиных курсов начался карьерный трек в анализ данных

    • @123-ix4fg
      @123-ix4fg 6 днів тому

      Я

  • @ya_mi_ya
    @ya_mi_ya Місяць тому +1

    Какие же вы офигенные и ПОНЯТНЫЕ! Обожаю)

  • @DmitryTsarev
    @DmitryTsarev 3 роки тому +29

    Огонь интервью - очень интересно и структурированно рассказали! Всё чётко, без воды, и с примерами.

  • @lykov.nikolay
    @lykov.nikolay 3 роки тому +2

    Анатолий, Никита, спасибо, очень круто! И книжку почитаю, тоже начинаю тонуть в статьях)

  • @bilenjka1
    @bilenjka1 3 роки тому +1

    Спасибо за интересное видео и ценнейшие ссылки! Буду изучать)

  • @arthurkhachatryan1302
    @arthurkhachatryan1302 3 роки тому +46

    Толя, если этот канал не взлетит, я разочаруюсь в аналитиках 😁

  • @Time_Machine_Teleport
    @Time_Machine_Teleport 2 роки тому +2

    Ребята, классно рассказываете! Спасибо! Очень четко и структурировано !

  • @annapogadaeva9411
    @annapogadaeva9411 3 роки тому +8

    очень крутое интервью, получила ответы на все свои вопросы относительно того "а как в индустрии" ) спасибо 🙏

  • @mariadergausova2066
    @mariadergausova2066 2 роки тому

    так живо и интересно. Спасибо за выпуск!

  • @user-xb8uj9xs3m
    @user-xb8uj9xs3m 3 роки тому

    Интересный материал, спасибо за видео!

  • @Revixit
    @Revixit Рік тому +1

    Бесподобное интервью! 37 минут бесконечно полезной информации. Подача на высоте - простыми словами о сложном. Спасибо!

  • @just_funk8923
    @just_funk8923 3 роки тому +1

    Спасибо, мега полезно. За линки отдельный респект, ребята.

  • @Asylum_M
    @Asylum_M 3 роки тому

    Спасибо, было очень интересно послушать.

  • @denistalko6585
    @denistalko6585 Рік тому

    Спасибо огромное! Очень интересное интервью!

  • @Gudvinkun
    @Gudvinkun 3 роки тому +1

    Спасибо за видео!

  • @andrewostrovsky9417
    @andrewostrovsky9417 3 роки тому

    Полезно, интересно. Большое спасибо)

  • @MsGleaming
    @MsGleaming 11 місяців тому

    Отличное интервью🍄🍒

  • @MS-fu3zf
    @MS-fu3zf 3 роки тому +12

    Очень крутой контент. Спасибо ребята. Было бы ещё интересно послушать как происходит взаимодействие с разработчиками во время A/B тестирования. Понимаю, что канал больше с аналитическим уклоном, но ведь в организации и проведении исследовательской работы участвует много людей и это накладывает дополнительные сложности.

  • @Kira90ika
    @Kira90ika 2 роки тому

    Спасибо, было интересно!

  • @enable4
    @enable4 2 місяці тому +2

    Проклятый мир который мы сами и создали - специалист по DS изучает что лучше: сердечко или палец вверх.

  • @Yanpile
    @Yanpile 3 роки тому +1

    Очень тонкий момент про подглядывание. Про него точно стоит почитать/поговорить отдельно

  • @system29a
    @system29a 3 роки тому +6

    Не знал про пуасонновский бутстрап, клевый трюк, спасибо вам :)

    • @karpovcourses
      @karpovcourses  3 роки тому +4

      На нашем канале и не такое узнаете! Привет Артем! :)

  • @vaaaaaaaaaanjkeeeeeeeeee
    @vaaaaaaaaaanjkeeeeeeeeee 2 роки тому +1

    хитрый ход по продвижению ролика) размещение ссылки на него на степике)) лайк!

    • @Kira90ika
      @Kira90ika 2 роки тому

      Ну а почему нет? Инфа то полезная и из первых рук по сути

  • @ilyin_sergey
    @ilyin_sergey 3 роки тому +1

    сравнение линеечкой - это про Эвклидово расстояние и DTW (в случае временных рядов)?

  • @romanlisyukov6787
    @romanlisyukov6787 3 роки тому +1

    профессионал поясняет за вещи, кайф

  • @user-ob1xj3kb5e
    @user-ob1xj3kb5e 11 місяців тому

    бомба

  • @VakaramGolang
    @VakaramGolang 2 роки тому +2

    Зрители дайте книгу на скачивание или на покупку. Зрители пожалуйста 😫🙏🙏💓

  • @romanlisyukov6787
    @romanlisyukov6787 3 роки тому +2

    о по вэб-аналитике есть видосы? Или, может быть, будут?..

    • @karpovcourses
      @karpovcourses  3 роки тому +1

      Будут! Следите за анонсами!

  • @user-um8gg8lg3m
    @user-um8gg8lg3m 5 місяців тому

    Не совсем понятно, как бутстрэп поменять на глобальном CR. Если мы сравниваем всего две группы пользователей, то будет два соотношения клики к просмотрам в одной и клики к просмотрам в другой. Что там бутстрэпить?

  • @user-pc8nl8xq2m
    @user-pc8nl8xq2m 2 роки тому

    Что мешает проводить тесты независимых гипотез только на двух группах, когда пользователей мало? В перекрытии все равно будет часть таких пользователей. Ну или группы можно случайным образом набирать из одних и тех же людей.

  • @andreykozik253
    @andreykozik253 3 роки тому +1

    Подскажите пжл: у меня контроль и тест(менеджер - продажи, по 57 менеджеров в каждой выборке), распределенные ненормальное. Правильно ли я понимаю, что у меня 2 пути проверки стат. значимости:
    1) Смотреть абсолютные значения продаж и тогда использовать Манна-Уитни
    2) Смотреть среднее значение продаж по каждой из групп и тогда можно использовать Т-критерий?
    Вопрос возникает по второму пути: Т-критерий требует подсчета среднего квадратичного отклонения. Однако, распределение ненормальное. Значит и считать среднее квадратичное отклонение будет не уместно?

    • @TheJosebaxter
      @TheJosebaxter 3 роки тому +2

      Даже если распр ненорм, то применить т-тест можно, просто могут возникнуть нежелательные спецэффекты, но считать при этом нужно все по той же оригинальной формуле без изменений.
      В вашем случае можно сделать:
      1) Понять насколько сильно распределение отклоняется от нормального, если отклонение несильное, то можно спокойно применять т-тест
      2) Трансформировать распределение, то есть привести к нормальному и затем применить т-тест
      + как вариант еще можно использовать бутстрап

    • @andreykozik253
      @andreykozik253 3 роки тому +1

      @@TheJosebaxter спасибо за ответ!
      У меня что-то ближе к Пуссоновскому распределению, если на глаз смотреть.
      Проверял критерий нормальности для выборки - распределение ненормально:(
      Бутстреп хочу попробовать как раз в ближайшее время.

    • @bokshalex
      @bokshalex Рік тому

      @@andreykozik253 и что вы в итоге сделали?)

    • @andreykozik253
      @andreykozik253 Рік тому

      @@bokshalex сейчас уже не особо помню, но вроде бы бутстрепом

  • @mykolakislitsyn3207
    @mykolakislitsyn3207 3 роки тому +2

    Можно ссылку на статью о методах в А/Б тестах?

    • @mikhailgerasimov2199
      @mikhailgerasimov2199 3 роки тому +1

      Большое спасибо за ролик! Подскажите, пожалуйста, когда будут ссылки на упомянутые в ролике материалы? Заранее благодарю.

    • @karpovcourses
      @karpovcourses  3 роки тому +14

      @@mikhailgerasimov2199
      АБ тесты подборка от Никиты Маршалкина
      1. Бомбическая книжка: experimentguide.com
      2. Кладезь информации про А/Б в индустрии: exp-platform.com
      3. Practitioner’s Guide to Statistical Tests: medium.com/@vktech/practition...
      4. Пуассоновский бутстрап и бакетизация: research.google/pubs/pub43157/
      5. Эксперименты в соцсетях: arxiv.org/abs/1404.7530
      6. Заметки с саммита по экспериментам на KDD’19: research.fb.com/publications/...
      7. Туториал по построению оптимизации в b2c продуктах: onlineuserengagement.github.io/

    • @vasiliidovedov3675
      @vasiliidovedov3675 3 роки тому

      @@karpovcourses ссылка по номеру (3) умерла. Есть ли возможность её оживить?

    • @karpovcourses
      @karpovcourses  3 роки тому

      @@vasiliidovedov3675 вы о Practitioner’s Guide to Statistical Tests?
      Проверил, открывается

    • @Andruxa100
      @Andruxa100 2 роки тому +1

      @@karpovcourses Подскажите пож-та, помимо 1-й книги, Анатолий упомянул, что от этих ребят имеется плейлист с видео, можете поделиться?

  • @zencrazycat
    @zencrazycat 3 роки тому +4

    Ничего не понятно, но очень интересно)

    • @zencrazycat
      @zencrazycat 3 роки тому +3

      А Если серьезно, то очень круто! Огромное спасибо! Гость шикарен, про Анатолия вообще даже говорить не буду, все супер) Мне как новичку, было достаточно понятно, кроме понятия Bootstrap и еще одной аббревиатуры, которая "глобальный чет там") но как бы никто мне мешает загуглить) подписался и буду смотреть другие видосы.

    • @karpovcourses
      @karpovcourses  3 роки тому +1

      глобальный CTR!

    • @zencrazycat
      @zencrazycat 3 роки тому

      @@karpovcourses он самый)

  • @igoriakubovskii1958
    @igoriakubovskii1958 3 роки тому +1

    Что значит для t-теста не нужна нормальность данных, а нужна нормальность среднего ? У нас в предпосылках должно выполняться именно нормальность распределения данных. Нормальность среднего - это если мы генерируем много выборок новых и смотрим на то, как оно распределено. Можно пояснить этот момент, пожалуйста

  • @user-th6oi8pg4n
    @user-th6oi8pg4n 2 роки тому

    27:38

  • @leprotta88
    @leprotta88 4 місяці тому

    Сначала все было понятно, а потом "бутстреп на спарке", и я такая "чтооо" (п.с. я с курса статистики)

  • @user-im3wj3dc2o
    @user-im3wj3dc2o Рік тому

    Всего 7 мес обучения на курсах и понял, в принципе, всё, о чём они говорят))

  • @expertpromo
    @expertpromo 4 місяці тому

    Как-то много о процессе и очень мало о сути. Видимо поэтому Никита уже не работает в VK :)
    1. Не сказано о необходимости измерять прокси метрики - как изменения, внедренные по итогам A/B тестов могут негативно повлиять на метрики других фич.
    2. Не сказано о необходимости рассчитывать размер сэмпла и продолжительность теста.
    3. Не сказано о необходимости оценки вероятности того, что полученные статистические данные валидны (P-Value, A/A тест и т.п.)

    • @Dikobrazs
      @Dikobrazs 4 місяці тому

      Посоветуете что-то конкретное и понятное?

  • @gillan11
    @gillan11 2 роки тому +1

    А почему не применяются байесовские тесты на практике?

    • @karpovcourses
      @karpovcourses  2 роки тому +1

      На самом деле применяются. towardsdatascience.com/bayesian-a-b-testing-and-its-benefits-a7bbe5cb5103

  • @user-hp3dp2sz2b
    @user-hp3dp2sz2b 8 місяців тому

    Я одно только не пойму, кто все эти люди, которые добавляют друзей ВК))Я уже много лет никого не добавляю, я думала большинство так))

  • @user-zl2uf4rk1g
    @user-zl2uf4rk1g 6 місяців тому

    .

  • @01sver4OK
    @01sver4OK 2 роки тому

    бесит только "то, что", никак не могут привыкнуть, ЧТО молодежь теперь так говорит(((

    • @karpovcourses
      @karpovcourses  2 роки тому +1

      Что говорит?)

    • @01sver4OK
      @01sver4OK 2 роки тому

      @@karpovcourses , "подумал ТО, что", "увидел ТО, что", "узнал ТО, что" вместо
      "подумал, что"; "увидел, что"; "узнал, что".. Непонятно, когда это началось и почему.. невозможно от этого абстрагироваться, смотришь же и вникаешь в смысл, а вот это все время сбивает))) Понятно. что что это мой бзик, но вот так))

    • @karpovcourses
      @karpovcourses  2 роки тому +1

      @@01sver4OK понятно!