Оптимизируем код на Go в 10 раз | False sharing

Vladimir Balun - Programming

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 8 чер 2024
Курсы по программированию: clck.ru/37iG2b
Потренироваться проходить собеседования: it-interview.io
Консультации:
getmentor.dev/mentor/vladimir...
solvery.io/ru/mentor/vladimir...
Таймкоды:
00:00 - Введение
00:17 - Подход с RWMutex
01:40 - Подход с Mutex
02:10 - Подход с Atomic
03:39 - Подход с шардированием
04:36 - Подход с выравниванием при шардировании
05:42 - False sharing
08:13 - Заключение
VK: vladimir_balun_program...
Telegram: t.me/vladimir_balun_programming
Instagram: / vladimir_balun_program...
UA-cam: / @vladimir_balun_progra...
YandexZen: zen.yandex.ru/id/623b6c964da9...
RuTube: rutube.ru/channel/25079714/
Оптимизация кода. Golang оптимизации. True sharing. False sharing. Concurrency в Go. Кэши процессора. Мьютексы. Атомики.
#айти #программирование #программист #concurrency #golang

КОМЕНТАРІ • 67

@denissemikin2683 Місяць тому ⁺²¹
Данная логика с оптимизацией хорошо рассписана в книжке «100 ошибок Go и как их избежать» в последней главе.
@user-gx8gk9ur1n 13 днів тому ⁺²
Да, Балун реально шарит, мощь. Нетривиальный ролик. И классный пример того как понимание подкапотной работы помогает реально оптимизировать код...
@viktorkram2531 Місяць тому ⁺¹²
Крайне интересная информация, спасибо! Коротко и очень необычно) Спасибо!
@vladimir_balun_programming Місяць тому ⁺³
Спасибо!
@azizmavlyanov3145 Місяць тому ⁺⁷
Владимир, как обычно, топ-темы рассматриваешь. Очень хочется увидеть и поработать с такими необычными темами и на твоем курсе по concurreny в go. За данный видос огромный респект!
@vladimir_balun_programming Місяць тому ⁺¹
Спасибо, курс как раз будет 2 мая - там в том числе и это разбирается)
@martirosharutunyan6572 Місяць тому ⁺³
Ну брат ну ты даёшь это всё очень круто. Думаю всем будет уроком немножко процессор и память изучить.
@vladimir_balun_programming Місяць тому ⁺¹
Спасибо!
@AleksandrRasskazov Місяць тому ⁺¹
Приятненько. Это похоже как и на порядок полей в структурах
@beast0608dihdbdn Місяць тому ⁺⁶
Вова, ты крут, очень понравилась данная рубрика, спасибо!)
@vladimir_balun_programming Місяць тому ⁺¹
Спасибо!
@user-zg8ij3kt1h Місяць тому ⁺²
Супер! Респект и удачи тебе!
@vladimir_balun_programming Місяць тому
Спасибо!
@theprogrammer256 Місяць тому ⁺¹
Круто! Вы фокусник! ))
@henrytavilla Місяць тому ⁺²
Спасибо за крутой лайфхак! Полезно 😊
@vladimir_balun_programming Місяць тому ⁺²
Спасибо!
@nikolaykozlov4888 Місяць тому ⁺²
Млин, Вов, как всегда - огонь!!!
@vladimir_balun_programming Місяць тому ⁺¹
Спасибо!
@sovrinfo Місяць тому ⁺²
Спасибо, очень интересное видео!
@vladimir_balun_programming Місяць тому
Спасибо!
@kostya7469 Місяць тому ⁺²
Очень интересно! спасибо
@vladimir_balun_programming Місяць тому
Спасибо!
@itkrasavchik Місяць тому ⁺²
Прикольно ) Красавчик! ;)
@lmorozkol Місяць тому ⁺³
чудеса на виражах прям какие-то)
@vladimir_balun_programming Місяць тому
Магия)
@alekseevserge Місяць тому ⁺³
Осталось только коммент в коде написать, чтобы другой программист не грохнул неиспользуемую память)
@vladimir_balun_programming Місяць тому
Хорошее замечание)
@dobermangood Місяць тому
Круто! Не думал попробовать решить 1 billion row challenge на golang?
@rasZam Місяць тому
Привет. Не подскажешь какой у тебя доп. монитор стоит?
@amb7048 Місяць тому ⁺¹
Какие вы ресурсы изучали чтобы знать тонкости всего процессора и библиотек языка? Вы настолько детально все изучили, что как будто бы вы с другой планеты) Было очень интересно!
@vladimir_balun_programming Місяць тому ⁺¹
Я не знаю очень много всего все еще - а то, что знаю, просто последовательный путь изучения тем, которые постепенно друг с другом переплетаются)
@unlite2896 6 днів тому
Спасибо! Правда нет комментария, почему переход на атомики дал прирост в два раза. Просто потому что мьютексы медленнее атомиков? И по итогу нужно ли проводить шардирование для такой оптимизации, или достаточно просто выравнивания?
@roman_zh1 Місяць тому ⁺²
Пушка. Наконец-то я понял зачем нужно знать устройство памяти и всего прочего, прям конкретный кейс, спасибо)
@vladimir_balun_programming Місяць тому
Нужно не всегда, но иногда эти знания бывают очень полезными)
@nikmy_ Місяць тому
Очень известная штука в профессиональных c++ кругах. Если вместо sequential consistency бахнуть acquire-release семантику, вы ускорите ещё раза в 3-4) Но в го отказались от такого для простоты (см. go memory model).
Очень подойдёт тем, кто занимается разработкой чего-то низкоуровнего, я сам был в шоке когда увидел в первый раз такие оптимизации)
@profered Місяць тому ⁺³
ниче не понятно, но очень интересно
@billjohnes9380 Місяць тому
Попробуйте почитать мой большой комментарий-ответ другому собеседнику ниже про 64-байтные блоки адресного пространства.
Возможно, что-то прояснится.
@nickolaizein7465 Місяць тому
Так выравнивание получается как бы "растягивает" счётчик на какое-то кол-во байт, хотя по факту их не использует, чтоб другой счётчик гарантировано попал в другую кэш линию ?
@sfdb97fsasdfasrewerwerzgdfgsda Місяць тому
Желательно выравнивать к длине кешлинии архитектуры на которой запускается код, иначе оптимизации не будет, т.к значения будут затирать друг друга.
@io0312 Місяць тому
Можно исходники?
@unciauncia Місяць тому ⁺¹
А какие минусы у такой оптимизации? Получается, что мы резервируем себе участок памяти кэша в котором полезных данных 4 байта, а всё остальное не используется никак? Как будто это оптимизация будет сильно отъедать память, когда количество горутин будет значительно больше, чем число ядер, и тогда относительно не быстрая зашаренные данные, будут эффективнее по памяти, но медленнее исполняться. Вопрос какой баланс в итоге лучший, всегда по ситуации?
@stupnum8764 Місяць тому
Нуу, 64 байта это очень немного. L1 кеш на большинстве современных процессоров имеет объем 32kb, соответственно туда поместится 512 таких переменных на одно ядро, но насолько я понимаю при работе в одном потоке процессор не будет загружать в себя данные всех переменных, хотя это под вопросом. Я думаю если протестировать данный лайфхак на большом количестве корутин, то получится что он все равно будет значительно быстрее, чем без этого приема. Хотя не уверен, надо бы протестировать.
@timurakhalaya6289 Місяць тому ⁺²
alignment это выравнивание , offset смещение)
годный контент
@vladimir_balun_programming Місяць тому
Все так)
@jin_x_ Місяць тому
Если уж придираться к неймингу, то такой заполнитель обычно называют padding.
@user-qc2um7sn1y Місяць тому
это называется wet blanket) а если серьезно, то везде используется именно field alignment. учите матчасть!)
@denyskanunnikov7521 Місяць тому
добрый вечер, а есть ли публичный репозиторий с примером данного кода для более внимательного изучения? в записанном видео быстрое перемещение по коду и тем речи высокий, не всегда удобно для моментального восприятия
@user-bl2tu5ur6g Місяць тому
Есть курс по concurrency МФТИ , можешь посмотреть его , там 20+ часов :)
@denyskanunnikov7521 Місяць тому
@@user-bl2tu5ur6g а ссыль можно, пожалуйста?
@mordva756 Місяць тому ⁺¹
Это решение будет ускорять в 10 раз и при наличии другой работы в коде? Помимо инкрементирования счетчика, приложение делает ещё что-то и переменные тоже могут попадать в кэш. Возможно не очень понял, но мы как будто затрем весь кэш при инкрементироварии счётчика таким способом и это замедлит код вокруг
@billjohnes9380 Місяць тому ⁺¹
Это если счётчик будет разбит на 1024 shard'а для 64K cache'а L1 или на 4096 shard'а для 256К.
Пока на shard'ы тратится малый процент cache'а, такой опасности нет.
@user-jf3iu8vi7k Місяць тому
ШИКАААРРРРРРНООО!!! брат давай такие видео по всем темам и ты ТОП! такой шикраный контент и на русском
@user-ex3cx7jx6o 13 днів тому
Я так понял у Вас intel. Вот не могу, сколько не пробую, на M1 хак повторить, максимальной производительности добиваюсь при атомиках и дальше никак.
Не получилось нагуглить как с кэш линией работает М1 Pro. Если у кого-то есть инфа, буду благодарен, потому что интересно повторить выравнивание на своем компе.
@sergiocoder Місяць тому
В самом начале у нас вроде как у каждого ядра свой кэш, а после последней версии у всех ядер один кэш(-линия)? Или это разные кэши?
В целом прикольная оптимизации, но насколько понял, ее эффективность зависит от конкретной архитектуры/модели процоессора, т.е. где-то можно не сработать. Хотя, если дело доходит до такой низкоуровневой ерунды, то наверное заранее известно, на каких процессорах будет запускаться код в проде )
@alexandrlapin3641 Місяць тому ⁺¹
Подскажите , а на плюсах такие проблемы возникают?
@dmikoss Місяць тому ⁺¹
Это актуально для всех языков, так как проблема завязана на принципах работы cpu
@vladimir_balun_programming Місяць тому
@@dmikoss плюсую)
@user-uq5zi4xp7u Місяць тому
Коротко о том как увеличить использование памяти приложения в 16 раз )
@user-uq5zi4xp7u Місяць тому
@@doingwell5629 я имел ввиду в структуре 🙂
@vladimir_balun_programming Місяць тому ⁺⁴
@@user-uq5zi4xp7u это почти всегда компромисс - что-то получаем, чем-то жертвуя при этом
@silentroach Місяць тому
Жаль что go не оптимизирует это сам на этапе компиляции
@XpIOHdeJIb3000 Місяць тому
зачем мьютекс на чтение? Какаю то ересь прочитать невозможно, либо текущее значение, либо текущее + 1
@__kawaii 4 дні тому
Как ты вообще додумался до этого? Мозг капитальный. Постфактум, конечно, кажется очевидным, но изначально к этой мысли бы никогда в жизни не пришел самостоятельно
@vladimireliseev7602 Місяць тому ⁺¹
Забавно, возможно я что-то делаю ни так, но у меня все варианты не сильно друг от друга отличаются по производительности:
BenchmarkAtomicCounter-10 10 1538 ns/op
BenchmarkMutexCounter-10 10 412.5 ns/op
BenchmarkRWMutexCounter-10 10 658.3 ns/op
BenchmarkShardedAtomicCounter-10 10 570.9 ns/op
BenchmarkAtomicCounterOptimize-10 10 775.0 ns/op
@MIRISU2 Місяць тому
я тоже попробовал проделать всё тоже самое. ShardedAtomic c alignment не сильно ушёл от Atomic и ShardedAtomic. 349.7 ns/op, 455.7 ns/op, 385.9 ns/op соответственно.

Наступне

Автоматичне відтворення

Ужасный Golang. Как потерять 100млн / Юрий Бедарев (Утконос ОНЛАЙН)