Интервью с Максимом Стаценко и Татьяной Колмаковой, Яндекс

Митап NoML Community Павел Снурницын: Feature Store как ключевая компонента современной ML платформы

Введение в основы Feature Store и MLOPS на примере Feast

Симбу закрыли дома?! 🔒 #симба #симбочка #арти

When Cucumbers Meet PVC Pipe The Results Are Wild! 🤭

БОЕВИК! СПЕЦНАЗОВЕЦ ДОЛЖЕН ВЫВЕСТИ ДЕВОЧКУ ИЗ ЭПИЦЕНТРА ВОЕННЫХ ДЕЙСТВИЙ! Уцелевший! Русский фильм

Андрей Кузнецов - Распределенный высоконагруженный feature store ОК

SmartData

Переглядів 1 005

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 18 лис 2024

КОМЕНТАРІ • 2

@AlexanderSergeenko Рік тому
Спасибо за интересный доклад.
- Почему выбрали именно Samza для стриминга? Насколько сложно было масштабировать его под такой продакшн?
- Какая семантика поддерживается для доставки ивентов в слой кеширования (topic -> fetcher -> cache)? Не сталкивались ли с проблемами нарушения, например, целостности флагов кэше (в вашем примере - dirty) при обработке потоков из топиков (например, если нет гарантированного exactly once)? Как в целом обеспечивается целостность write-through кэша в сценариях: событие прочтено, офсет записали в Cassandra, в этот момент кэш упал. Событие прочтено, офсет зафиксирован, записали в кэш, но в этот момент Cassandra упала. И т. д. Нет ли потерянных или дуплицированных ивентов?
- В вашем подходе кэш - какую реализацию использует? Redis? В чем именно польза такого кэша и почему не писать стримы топиков сразу в Cassandra - это попытка избежать частого чтения/записи и губительных tombstone в C*, работая с быстрым кэшем? Cassandra гарантировано не обеспечивала нужных latency при работе без кэширующего слоя?
- Как в таком подходе работает сквозная schema evolution: от событий стриминга/батч до фичей? Как вы сохраняете прямую/обратную совместимость при эволюции схем событий? Не пробовали ли вы другие форматы сериализации, например Avro?
- Вы говорите о highload в "горячем feature store" и высоких требованиях к его отказоустойчивости, при этом используя однонодную конфигурацию Cassandra без кластера и multi-DC, этот момент не совсем понятен. Правильно ли я понимаю, что однонодная Cassandra - это только часть одного экземпляра feature store, который по факту и является атомарной единицей отказоустойчивости и масштабирования? То есть одна партиция топика = один узел feature store = один шард чтения для клиентов?
- Как вы инвалидируете кэш при наступлении TTL в Cassandra?
@netcitizenrus1 Рік тому
Привет!
1) Выбрали Самзу давно, так как это быстрый и хорошо зарекомендовавший себя фреймворк от линкедин
2) Целостность поддерживаем на всех уровнях. Мы еще коммитим оффсеты в кассандру, что уберечься от незафлашенных из кэша записей. Если падает и корраптится Кассандра (очень редкое явление), то восстанавливаем с живой реплики.
3) Кэш свой. Написан для демпфирования нагрузки на Кассандру
4) Обычно разные версии разводим по разным топикам. Авро не заводили, так как это лишний оверхед.
5) Однонодная кассандра в нескольких репликах. На одну ноду заводятся несколько партиций топика. Правила распределения партиций по ключу распостраняются и на клиентов.
6) В кэше реализованы несколько стратегий чистки, но они не синхронизированы с Кассандрой. Ситуация когда в Кассандре данные почистились по TTL, а в кэше остались супер редкая + при чтении из Кассандры мы проверяем что данные не протухли.

Наступне

Автоматичне відтворення

Интервью с Максимом Стаценко и Татьяной Колмаковой, Яндекс

Интервью с Максимом Стаценко и Татьяной Колмаковой, Яндекс

Митап NoML Community Павел Снурницын: Feature Store как ключевая компонента современной ML платформы

Митап NoML Community Павел Снурницын: Feature Store как ключевая компонента современной ML платформы

Введение в основы Feature Store и MLOPS на примере Feast

Введение в основы Feature Store и MLOPS на примере Feast

Симбу закрыли дома?! 🔒 #симба #симбочка #арти

Симбу закрыли дома?! 🔒 #симба #симбочка #арти

When Cucumbers Meet PVC Pipe The Results Are Wild! 🤭

When Cucumbers Meet PVC Pipe The Results Are Wild! 🤭

БОЕВИК! СПЕЦНАЗОВЕЦ ДОЛЖЕН ВЫВЕСТИ ДЕВОЧКУ ИЗ ЭПИЦЕНТРА ВОЕННЫХ ДЕЙСТВИЙ! Уцелевший! Русский фильм

БОЕВИК! СПЕЦНАЗОВЕЦ ДОЛЖЕН ВЫВЕСТИ ДЕВОЧКУ ИЗ ЭПИЦЕНТРА ВОЕННЫХ ДЕЙСТВИЙ! Уцелевший! Русский фильм

Incredibox Sprunki vs Inside Out 2 - Which team will win? #shorts #animation

Incredibox Sprunki vs Inside Out 2 - Which team will win? #shorts #animation

Алексей Даньшин - Методы обезличивания данных

Алексей Даньшин — Методы обезличивания данных

Зачем нужны даталейки (Data Lake)

Зачем нужны даталейки (Data Lake)

Внутренний сервис-провайдер. Как ИТ стать партнером бизнеса?

Внутренний сервис-провайдер. Как ИТ стать партнером бизнеса?

Семинар: Константин Липилин - Feast - Open Source Feature Store

Семинар: Константин Липилин - Feast - Open Source Feature Store

Стивен Уильям Хокинг. Теория всего. Происхождение и судьба Вселенной.

Стивен Уильям Хокинг. Теория всего. Происхождение и судьба Вселенной.

Анализ потребности бизнеса в использовании Feature Store

Анализ потребности бизнеса в использовании Feature Store

ML System Design: Feature Store

ML System Design: Feature Store

Биология поведения человека: Лекция #9. Этология [Роберт Сапольски, 2010. Стэнфорд]

Биология поведения человека: Лекция #9. Этология [Роберт Сапольски, 2010. Стэнфорд]

Зачем учить язык Си в 2024 году | Как выбрать между C или C++ или Rust | Podlodka Podcast #387

Зачем учить язык Си в 2024 году | Как выбрать между C или C++ или Rust | Podlodka Podcast #387

От первого лица: Школа 7😡 ПОТЕРЯЛ ДРУГА 💔НОЧЕВКА с ДЕВУШКОЙ 🤯ДОВЕЛ УЧИТЕЛЯ ДО СЛЕЗ ГЛАЗАМИ ШКОЛЬНИКА

От первого лица: Школа 7😡 ПОТЕРЯЛ ДРУГА 💔НОЧЕВКА с ДЕВУШКОЙ 🤯ДОВЕЛ УЧИТЕЛЯ ДО СЛЕЗ ГЛАЗАМИ ШКОЛЬНИКА

ЭТО ОЧЕНЬ ПРИЯТНОЕ ВИДЕО! #Shorts #Глент

ЭТО ОЧЕНЬ ПРИЯТНОЕ ВИДЕО! #Shorts #Глент

МЕНЯ УКУСИЛ ПАУК #shorts

МЕНЯ УКУСИЛ ПАУК #shorts

БОЙ: Майк Тайсон - Джейк Пол | БОКС

БОЙ: Майк Тайсон - Джейк Пол | БОКС

Players vs Pitch 🤯

Players vs Pitch 🤯

ОБМЕНЯЛА КВИНКУ НА…😱(смотрите до конца😂)#роблокс #игры #смешное #интересное #квинка

ОБМЕНЯЛА КВИНКУ НА…😱(смотрите до конца😂)#роблокс #игры #смешное #интересное #квинка

⚡️ МАЙК ТАЙСОН ОФІЦІЙНО ПОВЕРНУВСЯ! Огляд бою Джейк Пол - Майк Тайсон

⚡️ МАЙК ТАЙСОН ОФІЦІЙНО ПОВЕРНУВСЯ! Огляд бою Джейк Пол - Майк Тайсон

НОВЫЙ AMONG US в РЕАЛЬНОЙ ЖИЗНИ - Масленников, Егорик, Милана Хаметова, Супер Стас

НОВЫЙ AMONG US в РЕАЛЬНОЙ ЖИЗНИ - Масленников, Егорик, Милана Хаметова, Супер Стас