Оптимизации уровня CPU / Андрей Акиньшин (JetBrains)

Поділитися
Вставка
  • Опубліковано 5 лис 2024

КОМЕНТАРІ • 16

  • @z140140
    @z140140 2 роки тому

    на самом деле тут надо сделать pmovmskb+popcnt+add, суммировать в две независимые переменные и на alder lake выйдет 96 байт/такт, может даже 112 байт/такт если popcnt может выполняться в Port 6. можно использовать для собесов :)

  • @Stashchenko
    @Stashchenko 5 років тому

    Распараллелить, можно пачками считать. Например высота картинки делится на количество CPU = 1280 высота / 8 ядер. И получится 160 строчек на 1 ядро. По окончанию потока нужно атомарно записать каунт в черные и белые. Всего будет 16 мютексов на уровне CPU, должен работать быстро. На ГО к примеру atomic.AddUint64(&white, 100) и т.д.

    • @МересбеС
      @МересбеС 4 роки тому

      Тоже об этом подумал, странно, что никто не сказал про распараллеливание, но там позже говорилось про распараллеливание

  • @9.NULL.0
    @9.NULL.0 4 роки тому

    Ну здравствуй Андрей Акиньшин, серийный программист...

  • @bigtown2012
    @bigtown2012 Рік тому

    Очень много сказано правильного. Но при чем здесь с-забор? Вы упираетесь в инструкции ВМ и на этом конец! Это все действительно для нормальных языков.

  • @Денис-л4з2ю
    @Денис-л4з2ю 4 роки тому

    14:35 разве там n^2? n - константа (4096) и сложность О(1)

    • @porterkylo8604
      @porterkylo8604 3 роки тому

      Dunno if anyone gives a damn but if you're stoned like me during the covid times then you can stream all the latest movies on instaflixxer. Have been binge watching with my gf for the last few days =)

    • @connerjairo7492
      @connerjairo7492 3 роки тому

      @Porter Kylo yea, I have been watching on instaflixxer for since november myself =)

  • @FF-ne2qz
    @FF-ne2qz 7 років тому +2

    Отличнейшая книга по теме и шире www.amazon.com/Computer-Systems-Programmers-Perspective-2nd/dp/0136108040

  • @МихаилРоманов-б2ь
    @МихаилРоманов-б2ь 5 років тому +7

    Убери плиз высокие ноты из концовок фраз

  • @zergon321
    @zergon321 6 років тому

    В случае с изображением можно достигнуть большей оптимизации, если заменить вложенные циклы на один foreach: pastebin.com/bqL23q7N

  • @barkalov
    @barkalov 6 років тому +14

    Физически не могу слушать голос выступающего. Как пенопластом по стеклу.