Павел Новиков - Конструкторы и деструкторы: Несколько вещей, которые вы, возможно, захотите узнать

Илья Мещерин - Улучшенные версии STL-контейнеров из библиотеки Boost

Степан Артемьев - SIMD в .NET: Обработка изображений на интринсиках

"Бажано відбити посадку без втрат": військовий розповів, як загибель побратимів впливає на психіку

Анна Трінчер - Треш (Official Music Video)

МІША ЛЕБІГА і АНДРІЙ ЛУЗАН в СРАЧІ #32

Ашот Варданян - SIMD. Производительность, за которую вы уже заплатили

C++ Russia — Конференция по разработке на Cpp

Переглядів 2 378

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 16 січ 2025

КОМЕНТАРІ • 5

@xintreavideo 3 роки тому ⁺¹¹
Из-за того, что голос прерывался в самые неподхо м ен, по ть о ем рил ав о ень сложно.
@intelceleron8960 3 роки тому ⁺³
шикарно. было очень интересно, жаль времени не хватило
@niklkelbon3662 3 роки тому
Возник вопрос, как известно производительность зависит от частоты процессора линейно, а вот выделение тепла квадратично. Не получится ли при использовании AVX512 в таком случае повысить энергоэффективность, про которую так парится рассказывающий?
@ashvardanian 3 роки тому ⁺⁴
That's a great question. The answer is - very much depends on the task and exact implementation of AVX-512 in hardware.
In our case (with identical tasks across all the CPU cores) it's pretty easy to estimate the energy efficiency. Server CPUs are relatively constant in their power consumption under sustained load. So you can estimate Bytes/Joule using the GB/s numbers and reference TDP of the CPU used. When we went from AVX-2 to AVX-512 we jumped roughly from 9 GB/s to 10 GB/s in terms of speed, while the energy consumption remained more or less the same. So with those specific mnemonics/operations you are not going to get a lot more efficient when switching from AVX-2 to AVX-512.
The devil is in the details. AVX-512 added not only new register sizes, but also all new kinds of operations. Some forms of compression/encryptions may not be easily expressible in AVX-2 set of operations, but can be elegantly mapped into just a couple of AVX-512. In that case you may get A LOT more energy-efficient and fast.
PS: Sorry for replying in English, I don't have a Russian keypad.
@dat_21 2 роки тому ⁺¹
Можно избавиться от split loads, если хранить в регистрах побайтно-сдвинутые haystack, а пересечение со следующей линией собрать в регистр двумя шафлами - _mm256_shuffle_epi8 и _mm256_permute. Будет раза в полтора быстрее.

Наступне

Автоматичне відтворення

Павел Новиков - Конструкторы и деструкторы: Несколько вещей, которые вы, возможно, захотите узнать

Павел Новиков — Конструкторы и деструкторы: Несколько вещей, которые вы, возможно, захотите узнать

Илья Мещерин - Улучшенные версии STL-контейнеров из библиотеки Boost

Илья Мещерин — Улучшенные версии STL-контейнеров из библиотеки Boost

Степан Артемьев - SIMD в .NET: Обработка изображений на интринсиках

Степан Артемьев — SIMD в .NET: Обработка изображений на интринсиках

"Бажано відбити посадку без втрат": військовий розповів, як загибель побратимів впливає на психіку

"Бажано відбити посадку без втрат": військовий розповів, як загибель побратимів впливає на психіку

Анна Трінчер - Треш (Official Music Video)

Анна Трінчер - Треш (Official Music Video)

МІША ЛЕБІГА і АНДРІЙ ЛУЗАН в СРАЧІ #32

МІША ЛЕБІГА і АНДРІЙ ЛУЗАН в СРАЧІ #32

Психіатр Глузман УПЕРШЕ сканує Зеленського, Путіна й Трампа

Психіатр Глузман УПЕРШЕ сканує Зеленського, Путіна й Трампа

Антон Полухин - Грязные C++ трюки из userver и Boost

Антон Полухин — Грязные C++ трюки из userver и Boost

Парсим числа через SIMD, Сергей Слотин

Парсим числа через SIMD, Сергей Слотин

Денис Ярошевский - Первые шаги в SIMD. Реализация STL-алгоритмов с помощью AVX2 vector extensions

Денис Ярошевский — Первые шаги в SIMD. Реализация STL-алгоритмов с помощью AVX2 vector extensions

ПРОЦЕССОРЫ ARM vs x86: ОБЪЯСНЯЕМ

ПРОЦЕССОРЫ ARM vs x86: ОБЪЯСНЯЕМ

Pure Virtual Cast / Компиляторный выпуск

Pure Virtual Cast / Компиляторный выпуск

Соболь НН 4х4 -мы его разберем полностью.

Соболь НН 4х4 -мы его разберем полностью.

Масштабируемая векторизация в RISCV, Константин Владимиров

Масштабируемая векторизация в RISCV, Константин Владимиров

Дмитрий Нестерук - Использование SIMD в .NET Core

Дмитрий Нестерук — Использование SIMD в .NET Core

КАК РАБОТАЕТ КЭШ ПРОЦЕССОРА | ОСНОВЫ ПРОГРАММИРОВАНИЯ

КАК РАБОТАЕТ КЭШ ПРОЦЕССОРА | ОСНОВЫ ПРОГРАММИРОВАНИЯ

МІША ЛЕБІГА і АНДРІЙ ЛУЗАН в СРАЧІ #32

МІША ЛЕБІГА і АНДРІЙ ЛУЗАН в СРАЧІ #32

КТО НЕ ДВИНЕТСЯ, ПОЛУЧИТ МАШИНУ!

КТО НЕ ДВИНЕТСЯ, ПОЛУЧИТ МАШИНУ!

Женская супер-сила 😂 #ComedyClub #КамедиКлаб #харламов #тнт4 #тнт #демискарибидис #богатство #кравец

Женская супер-сила 😂 #ComedyClub #КамедиКлаб #харламов #тнт4 #тнт #демискарибидис #богатство #кравец

до конца, там самая счастливая табалапка🐾🐾 #тикток #табалапка

до конца, там самая счастливая табалапка🐾🐾 #тикток #табалапка

😳Трамп ПОТІШИВ Скабєєву, але одразу РОЗЧАРУВАВ #shorts

😳Трамп ПОТІШИВ Скабєєву, але одразу РОЗЧАРУВАВ #shorts

ЧТО ОПАСНЕЕ? ОТВЕТЫ ВАС ШОКИРУЮТ... (1% ОТВЕЧАЮТ ПРАВИЛЬНО) #Shorts #Глент

ЧТО ОПАСНЕЕ? ОТВЕТЫ ВАС ШОКИРУЮТ... (1% ОТВЕЧАЮТ ПРАВИЛЬНО) #Shorts #Глент

Перший наступ КНДРівців

Перший наступ КНДРівців