Проектируем доставку 100 млн сообщений в секунду

Поділитися
Вставка
  • Опубліковано 5 січ 2025

КОМЕНТАРІ • 12

  • @avraamiy
    @avraamiy 2 місяці тому

    было очень интересно и полезно спасибо!

  • @konstantinvolkov2629
    @konstantinvolkov2629 3 місяці тому +1

    Спасибо

  • @maflend2762
    @maflend2762 2 місяці тому +1

    Почему ограничитель трафика работает после публикации сообщения в очередь?
    Разве в данном схеме не возникнет гонка? "ограничитель трафика" должен успеть отработать и поменять "состояние источника" прежде чем прилетит следующее сообщение. Если не успеет (тормоз/задержка), то в очередь попадет сообщение которое не должно было попасть.
    Не лучше ли поставить "ограничитель трафика" до публикации в очередь?

    • @roadofbugs
      @roadofbugs  2 місяці тому

      Если топик в кафке партицирован и ключ - идентификатор клиента, то все сообщения клиента попадут в один и тот же инстанс-кэнсьюмер ограничителя. Он читает топик пачками - скорость чтения высокая. Задержка обработки, конечно, есть, но она регулируется количеством партиций и количеством кэнсьюмеров в группе ограничителя. Да, регулировка трафика получается приближенная.
      Разбираем вариант с ограничителем до очереди. Приемник сообщений запущен в нескольких экземплярах. Один и тот же клиент может прислать свои сообщения в разные инстансы приемника. Как при приеме сообщения считать общее количество сообщений по клиенту? Придется при обработке каждого сообщения читать БД Состояния источников. Это замедлит обработку. В моем варианте обращение к БД происходит раз в какое-то время для обновления кеша в оперативной памяти. А при обработке сообщения достаточно этого кеша.
      Вывод. Противоречие между скоростью приема сообщений и точностью регулировки трафика. Мой вариант (ограничитель после кафки) дает максимальную скорость ценой приближенной регулировки. + есть способ настроить погрешность тестированием вариации числа кэнсьюмеров. В вашем варианте (ограничитель до кафки) регулировка точная, но будет ниже скорость приема сообщений.
      Видим частный случай CAP теоремы, когда приходится выбирать между доступностью и согласованностью. Если скорость приема низкая, то отсутствие ответа на какой-то запрос клиент может расценить, как недоступность системы. Если регулировка приближенная, то это несогласованность между сервисами (ограничитель знает, что уже достигнут лимит, а приемник еще не знает). То есть, мой вариант архитектуры про высокую доступность ценой уменьшения согласованности. А ваш вариант противоположный.

  • @Jawafv
    @Jawafv 2 місяці тому

    Классный канал! На одном дыхании посмотрел про оптимизацию запросов, много нового для себя взял имея за плечами 12 лет опыта галер. Подписался бы бусти но я с Украины.

  • @Владимир-ц3л5ц
    @Владимир-ц3л5ц 2 місяці тому

    Клево, спасибо!

  • @ouruniverse225
    @ouruniverse225 2 місяці тому +1

    спасибо

    • @MultiBanduk
      @MultiBanduk 2 місяці тому

      Это не data science

  • @alexharitonov672
    @alexharitonov672 4 місяці тому +2

    Каждое твоё видео это просто золото, не ожидал что выкладывают видео на все эти темы. Есть ли у тебя советы что можно почитать?

    • @roadofbugs
      @roadofbugs  4 місяці тому

      Почитать на какие именно темы?

  • @pitaki
    @pitaki 3 місяці тому

    а что за прикольный рисователь схемок?