Во-первых большой респект за тесты в Ансисе! Найти результаты для не серверных процессоров в интернете практически невозможно. По тестам: прочностные нелинейные статические расчеты (Ansys Mechanical) параллелятся не на 100%, часть алгоритма насколько я знаю выполняется последовательно... Наличие в задаче сложных контактов также может значительно ухудшать масштабирование. В целом важно чтобы задача целиком умещалась в оперативной памяти, если это так, то дальнейшее увеличение объема ОЗУ существенного эффекта уже не даст. Требуемое количество ОЗУ зависит от объема задачи. Частота и ПСП памяти влияют, но не прямо пропорционально и не всегда существенно. По поводу уменьшения времени расчета при уменьшении количества ядер: Ansys Mechanical не может нормально задействовать виртуальные потоки, поэтому для полной картины их лучше отключать через биос (это рекомендация разработчиков). В прочих расчетах предполагаю, что могла сказаться более высокая пропускная способность памяти у Зеонов и Тредрипперов. У сборки на Зеонах в общей сложности 8 каналов ddr3, у Тредрипперов 4 канала ddr4, что как я понимаю дает примерно равную общую пропускную способность памяти. Это объясняет почему при многопоточной нагрузке Зеоны на равне с Тредрипперами, а при однопоточной сильно проигрывают. Вообще многие расчеты в частности CFD упираются в ПСП памяти и реализовать полную вычислительную мощность процессоров становится невозможно. У линейки Ryzen 9 всего 2 канала, что существенно ограничивает масштабирование в таких задачах. При этом софт для мониторинга все равно может показывать загрузку процессора под 100%, без прироста производительности. В будущем если возможно, хотелось бы увидеть сравнение серии R9 и Тредрипперов c Core x серией интел в динамических расчетах с использованием явного решателя (Ansys ls-dyna или Abaqus Explicit). Будет ли ПСП памяти ограничением в этих случаях?
Еще нюанс - многие решатели эффективнее работают с физическими ядрами, а не с виртуальными потоками. В частности, в рекомендациях к Star-CCM и Nastran прямо написано, что HT и аналогичные технологии лучше отключать в биосе, а количество потоков в расчете не должно превышать количества физических ядер процессора. В этом плане бенчмарк того же Star-CCM информативнее, позволяет прогнать одну и ту же задачу на разном количестве потоков и получить наглядное сравнение. Собственно, когда на работе выбирали рабочие станции на замену 2670v3, в бенчмарке Star-CCM и сравнивали. Результаты получились примерно такие же - TR 2950X в однопотоке примерно в два раза быстрее, чем 2670v3. Как и мой домашний 3900Х. А в многопоточности такой просадки у АМД по эффективности не было, как здесь в ролике, и в целом производительность зависила от количества ядер с учетом производительности на ядро. Т.е. TR2950X и R3900X и тут были быстрее, чем 2670v3. График производительности по количеству потоков был у всех примерно одинаковый и показывал максимум на количестве потоков примерно на 80-90% от количества физических ядер. Т.е. если в TR 2950X 16 физ. ядра, то минимум времени на расчет получалось на 14 потоках. На количестве потоков выше 16 время на расчет было выше примерно на 10-15% от минимума и практически не менялось вплоть до 28 потоков. Потом росло и на 32 потоках соответствовало расчету на примерно 8-10 ядрах. Для R3900X и 2670v3 соотношения были примерно такими же. P.S. TR2950X работал со 128Gb, 2670v3 и R3900X со 64Gb ram
Проверял отключение HT в ANSYS CFX -разницы нуль, зато это позволяет экономить лицензии. Выводы у бородачей странные. В эксплуатации два E5-2683v3. Решение тестовой задачи газовой динамики занимает 2 часа 45 минут (правда работаю через Virtual Box (он просаживает производительность где-то на 5-10%). А ryzen 2700@3.8 эту же задачу решает за 3 часа и 5 минут. Так что TR явно должны быть шустрее старых xeon-ов.
Ой, как актуально! Работаю в области квантовой химии. Не то чтобы в отечественной науке много денег, особенно для аспиранта. Поэтому рабочую станцию собирал на зионах: 2х2690v2, 128 Gb. Большое спасибо за тест, теперь подожду обновляться на всякие эти тредрипперы без выяснения реального ускорения в моих программах моделирования вещества. На зионах задачи действительно отлично параллелятся, прирост практически пропорционален числу потоков. Работаю в линукс, под винду нужного софта тупо нет.
Тема с тестами процессоров в вычислительном ПО (таком, как Ansys) очень актуальна, спасибо. Она - ахиллесова пята и тема для споров в инженерном сообществе
Ребят, что вы про V3 все заладили? В ролике же ясно сказано, что изучается вопрос целесообразности замены старой сборки на Зеонах на современную AMD. Это не про сборку с нуля на основе Б/У комплектующих с Али. Это именно про смысл (затраты/эффект) замены старой рабочей системы, собранной лет 7-8 назад на актуальную сегодня. Спасибо каналу.
С одной стороны правильно говориш, НО... Когда стоит вопрос денег и потребления енергии есть смысл купить 2х2678-3 и вагон памяти ddr3(128+ ГБ) за копейки(по сравнению с ddr4) и иметь результат не сильно хуже Тредрипера при том что весь комплект Зеонов будет немногим дороже самого Тредрипера
@@dearteam1755 Ну если ты такой хитрожопый, и у тебя явно есть 3К бачей на станцию- тогда у меня нет мозга(и да, у меня 2678-3, малому своему 2700Х сложил, а какая между ними разница можеш сказать?)Если человек умеет соразмерять цену, энергопотребление и производительность его називают-"зеонщиком мозга"... БРАВО
Большое спасибо!!! Очень хочется побольше такой информации, кроме ансиса есть много других пк для расчётов, очень хочется, чтобы вы продолжили работу в этом направлении👍👍
@@ista011 v3 по отношению к v1 (v2) имеют +25...30 в сравнимом по цене конфиге (2678v3 / 2689v1 например) в задачах компиляции/сборки/подписи (я кодер, у меня такие машинки на CI/CD). И в этом видео тредриперам пришлось бы нелегко :)
@@draackul почему нет, зависит от задачи (проекта в ансис), 2678в3 22нм в рендере уже не держит максимальный турбобуст по всем ядрам упирается в тдп 120Вт, у 2699в3 ядер в 1.5 раза больше, а тдп увеличен только до 145Вт, 2699в4 тдп тоже 145Вт, но тех.процесс меньше 14нм, т.е. потребляет меньше, так что большой вопрос насколько просядут частоты под тяжелой многопоточной нагрузкой....это в игрушках анлок хорошо работает, а в проектах где процы будут долбить avx`ом/fma3 инструкциям?
За CFD и Mechanical в ANSYS, ОГРОМНОЕ СПАСИБО!!!❤️ Побольше бы таких видео😌😌😌 P.S. Студент 4 курса, Прикладная математика в строительном вузе, ANSYS - программа по моей профессии)))
Наконец-то тесты, ради которых и придумали ЭВМ! Кстати говоря, к расчётам можно добавить видеокарту, даже не из серии проф. карт, создав системную переменную "ANSGPU_OVERRIDE" и присвоив значение "1" (хочу знать, что может предложить рынок не из проф. карт, которые смогут справится с проф.* задачами). Так же, заранее можно добавить "ANS_ALLOW_HYPER_THREADING" со значением "1", - FPU с разрядностью 256 бит делится на два 128 битных канала. Их включение в расчёт не даст значительного прироста, но их работа по «обслуживанию», создаст заметный эффект.. И ещё кучу всего... Время решения зависит и от того последовательно или параллельно решается задача, используется NVME с хорошим I\O или обычный SSD... Я даже в диплом не постеснялся включить всё, чем я свёл решение задачи с почти 23 часов, до часа. В общем, могу как нибудь скинуть, если надо будет. Если я там всё указал, могу и не помнить. Могу и задачу скинуть. Там дерево модулей: Static structural -> Topology Optimization -> Static structural -> eigenvalue buckling * - любительскими.
Там может быть вопрос в перераспределении ресурсов. Я крутил тяжёлую задачу, при условии что памяти был практически вагон, были ситуации, процессор был нагружен только на 1-5%. При 12 ядрах начинаешь думать, а чем вообще занимается система, если расчет может продолжаться не один день. Прям тяжёлые философские вопросы.
Спасибо огромное за тесты! Как при прошлых тестах процессоров, снова хочу обратить внимание: в тестах ANSYS Mechanical качество распаралеливания очень сильно зависит от конкретной расчетной модели. Контролируйте параметр Load Balance Ratio, он выводится в консоли Slover Output и отображает на насколько равномерные блоки поделилась матрица уравнений (должен быть близким к единице, больше двух - плохо). Плюс сокращайте ввод/вывод на диск уменьшением колличества шагов/подшагов и отключением сохранения данных на подшагах
Спасибо большое за обзор! Все-таки есть часть аудитории, который используют пк для работы, а не для игр,и такой обзор как "глоток свежего воздуха" среди игровых бесконечных тестов!
v3 с али - выбор профессионалов. +30% к производительности, цена всей сборки 1/10 от цены тредрипперов. Даже девопсы берут себе в контору эти сборки на китайских материнках. Был шокирован, когда сказали, что это быстрее и сильно дешевле. С такими ценами можно свой подпольный дата-центр открыть за недорого.
За Xeon спасибо. Народные процессоры которые по карману каждому. Я считаю свою нишу они имеют. Дёшево и сердито. А главное не сильно уступают в некоторых задачах за свой прайс.
smt Нужно отключать. без него ансис считает побыстрей чем с ним. местами зеонам мог помочь avx512 (если он там был), местами 5000 серия могла упираться всего в 2 канала памяти, ну и базово тестировать нужно было 1-2-4-8-16 по всем процессорам, без smt - тогда было бы понятно, какая реальная масштабируемость решений. Ну и еще - на зеоне расчеты может и будут на уровне, а однопоточная работа (кручение сборок, работа модификаторов и все такое) - будет менее комфортной чем на 5000 серии, да даже чем на 3000 рипперах - т.к. герц на ядро меньше.
Классная тема. Спасибо, что затронули) Сам работаю в Ансис, хоть и не профессионально пока что, но хочу этим заняться в будущем А пока считаю модели для ВКР на 60 млн ячеек на своем домашнем ПК на Ryzen 2600))))
Спасибо за видос, наконец то про ансис отдельно разговор пошёл. Также было бы интересно узнать, каким образом можно ускорить расчеты с помощью видеокарт, и соответственно сравнить разные карты. Также интересно было увидеть подробности задачи, количество элементов сетки, количество узлов
Вам также необходимо включить в тесты задачи с различными решателями потому, что один и тот же процессор может себя по различному показывать с разными решателями. К примеру термостатические задачи, задачи на модальный анализ с различными настройками решателя, контактные задачи, задачи с различным числом узлов, задачи с динамически перестраиваемой сеткой, задачи на построение самой сетки, задачи на явную динамику. Плюс еще будет играть роль ссд потому, что если задача большая то она будет много писать на жесткий диск, у меня файлы результатов легко доходили до 100гб . В ансис вы любую задачу можете выгрузить как скрипт APDL, затем написать скрипт на bash для последовательного запуска задач, время расчета будет писаться в файле с ходом решения, можно его брать от туда и записывать сразу в таблицу. Таким образом вы создадите свой бэнчмарк и его можно будет относительно быстро прогонять на разных машинах. Плюс учесть замечания что написал krew. Ну и если речь зашла о профессиональном применении, то нужно еще протестировать как это все будет паралелиться между двумя процессорами одного узла сервера и между различными узлами, это особенно актуально для газовой динамики. Там люди могут десятки узлов занимать на несколько недель чтобы провести расчеты. И есть еще отдельная тема по рендерингу геометрии и сетки большого объема. Тут надо тестировать в паре с видеокартой. У меня бывали сетки в меканикл которые по 100гб были и еле ворочались.
Отличное видео! При подобных обзорах обязательно указывайте сложность задачи (гидро- газодинамика), количество элементов, режим расчета (стационарный, не стационарный).
как владелец E5-2683V3 с турбобустом на всех ядрах и 3970X, хоть и занимаюсь графикой, могу сказать о другом. Если сравнивать эти системы то банально производительность ~2 раза больше почти при том же потреблении мощности. Да общий ценник системы на треадрипере намного больше чем на Xeon, но на длительных рендерах (в неделю минимум) общее потребление да и занимаемый объем здесь не на стороне Xeon-ов. Сравнивать надо много факторов, а не только производительность. ИМХО
«4 планки и 8 планок на TR» - планок надо 8, иначе квада не будет «Просаживается на потоках» - потому что на TR играет огромную роль пропускная способность памяти, а не тайминги. 4 ГБ не обязательно на поток, лучше выше частота. Лучшие результаты я получал при 3600 16-16-16-16-32 (3990x 128 ГБ)
Если есть такой прирост при урезании потоков, то кажется очевидным следующий шаг - отключить hyper threading\SMT и провести тест на физических ядрах. Многие задачи в таком режиме покажут производительность выше, чем в многопоточности на каждое ядро.
Есть один момент. Поскольку в базе ANSYS Mechanical лежит компилятор для Fortran от Intel, то при компиляции код под AMD возможно делался менее эффективным за счет ключей компиляции, чем под собственные процессоры Intel. Подобная тема с компиляцией всплывала в прошлые годы, и возможно, что она тут проявилась. Тут может стоит сравнить еще различные версии ANSYS, если на это есть возможность.
на АМД 8000 серии я в 12-13 году делала много расчётов в Mechanical версию не помню(12 или 13), так была проблема в том что все ядра были нагружены ровно на 50%(все 8шт), но я запускал 2 решателя одновременно(и тогда загрузка 100%) и время вычисления было одно и то же. На ноуте на интеле грузились все ядра на 100%(i7-2670q).
Имею сборку на китайской материнке с двумя Е5-2667 v2 и 128ГБ ОЗУ. Было любопытно увидеть работу в Ансис с похожими процессорами в сравнении с тредрипером. Спасибо за видео.
Мне кажется они неплохо себя показывают. Меня мучает вопрос, пробовали ли вы переходить грань в 128гб на китайской матери. Я толкался на 96гб. И ещё не использовал большую память.
@@Barmaley80x у китайской материнки проблема - не поддерживает даже штатный разгон (турбобуст). А оперативку забивал при работе полностью - с этим проблем не было. Более 128 не устанавливал.
Ну если такие системы собираете для задач, то и задачи простыми не являются. Я не в Ansys, Star CCM+ работаю. Но все рекомендации которые к Ansys относятся, применимы и к CCM+. Этот софт меня заставил раскошелится на 96гигабайт ОЗУ. Но конечно же это не предел.
@@foxmulder4999 я использовал кит.материнку для обсчета, после зависания отвис, и продолжил считать. Остановился на 4 день из-за ошибки. Плюс что отвис, минус что не всегда предсказуем...
Друган работал в ансис еще в 2005-7м гг. Купленный в рознице комп считал неделями одну задачу. Потом ему собрали машину за дохулион рублей, сроки сократились с нескольки недель до нескольких часов-дней . . . а еще были большие проблемы с ОСями, сложно было тогда с 64бит
Лучшая производительность при уменьшении количества ядер получилась благодаря балансу, между количеством задач на ядро и количеству информации, которое надо передать от одного ядра, к другому. Если будет слишком много задействованых ядер, упор будет в скорость передачи данных от ядра к ядру.
Справедливости ради, на ютубе уже почти год есть сравнение с оверпрайсным Зионом. В поиске наберите "Intel 28-Core W-3175X Revisit vs. Threadripper 3970X, 3960X: Power, OC, & Benchmarks"
Самый популярный среди "Xeon" это "2678v3"(2680v3), думаю большинство согласиться с этим, тем более нужно тестить на односоккетных материнских платах с "Xeon". Тем более распараллеливание задач на двухсоккетных системах, очень примитивное, их даже не спасает 8-ми поток, на оперативную память.
2011 уже не тот, только если на время а другого нет ничего или нет денег. А вот 2011-v3 уже куда интересней. Тот же e5 2678v3 стоимостью в районе 7000 рублей показывает отличные результат, а если сделать анлок турбобуста то ещё поинтереснее. Конечно не сравнить с процессорами за 130 000)) на за 7к у него хорошие результаты)) Подешевеют v4 и их можно будет брать. Там есть достойные экземпляры. Но на текущий момент очень дорого)
В видео конечно стоило v3 проверить, там всетаки уже есть новые инструкции , которые в некоторых программах дают очень заметный прирост по сравнению с v2 , например vray. Работаю на 2x зеонах начиная с х5650 , потом 2670, 2696v2 и сейчас перехожу на 2680v3. Мат. Платы всегда supermicro
Думаю у вас в vray задачи, у меня часть задач крутилась ansys, крутил ещё пару софтов тяжёлых. Хотя крутил на последних процессорах, собрав отдельно на старой сборке зеон, мне он показал хороший по скорости результат счета.
Ну чтож, у меня threadripper 1920x. Ради хобби работаю в cinema4d, иногда играю. Установлено 4 плашки по 8гб памяти, работает на частоте 3200. Скорость записи/чтения 100/85 в четырехканале. На проце водянка, фикс частоты - 4 ггц. Память дополнительно охлаждается воздухом. Считаю идеальным процем - для симуляций в синьке , где используется однопоток и конечного рендера, где задействуются все ядра. Брал проц за 12тыс., плюс материнку за 17.
UPD. Какие настройки солвера использовали для платформы на Интеле? Благодаря вашему недавнему ролику, где вы тестировали новые Рязани 5-ти тысячной серии и сравнивали их, в том числе с Интелами, я еще раз убедился, что в Ансис до сих пор не умеют работать с виртуальными потоками (гипертрединг). Более того, в последних версиях софта они почему то добавляют еще два потока к заданному пользоателем значению. Таким образом моя задача в Icepak (насколько известно, использует тот же solver, что и Fluent) на 2670v1 (8/16) была посчитана за чуть меньше 24 минут на 6(настройки)+2(довесок от производителя) потоках, тогда как на любом большем количестве потоков это время только росло (!) и составило в максимуме около 30минут (от 12 до 16 потоков, разницы во времени почти не было). При уменьшении количества потоков скорость расчетов тоже ухудшалось. Забавно, что на 4 потоках задача была расчитана все равно быстрее чем на 16! Таким образом эффективно Ансис работал только на реальных ядрах. Так что на 40 потоках я бы не рекомендовал запускать Ансис на вашей платформе от Интел. 20 потоков суммарно должно быть в вашем случае, иначе результат только хуже!
Интересный обзор, интересное сравнения процессоров нового и старого поколения , но цена производительность и энергоэффективность в теплопакете процессора, будет решать для потребителя главное значение при выборе центрального процессора для рабочей станции...
Собрал комп на топовом Ryzen 9 7950x. 128ГБ ОЗУ четырьмя планками. 3600МГц DDR5 (проц не позволяет работать выше с 4 планками). В сравнении с моей старой двухпроцессорной сборкой с али на Е5-2667v2 (128ГБ DDR3 1866МГц) прирост производительности в среднем в 2-2,3 раза. В ansys maxwell в 2 раза, а в hfss в 2,3раза. Всё бы ничего, но разница между процессорами 10 лет! Это же целая эпоха! А прирост всего в 2 раза. И это при том, что частота у 2667 3,3ГГц, а у 7950х 5,4ГГц на все ядра! Т.е. прирост производительности за счёт архитектуры за 10 лет какие-то жалкие 20%. Ну вот вообще не ожидал такого. Может внатуре следовало взять 13900 вместо 7950. Может есть у кого возможность сравнить в ansys эти два проца?
Благодарю! Интересно!!!
Самый интересный ИТ канал, остальные такие идиоты что ппц
Привет GECID! Хочу пожелать хорошего дня и желаю счастья)!
Не ожидал вас здесь увидеть, но желаю удачи!
Будет видео про сравнение дешевых и народных бп, а то их много а обзоров мало или им 5 лет
Ооо, Привет😉👍
Борода крутые темы поднимает!)
Классную кликуху ты придумал)
@@_WAR_LOCK_ Это попытка в сарказм у тебя? Кликуха эта давнишняя в рамках комментариев этого канала
@@loam ну значит просто классная
Борода просто сам классный. Потому что с бородой.
надо было брать v3 для теста, стоят столько же а производительность выше, и турбобуст анлок есть..
в любом случае, спасибо за проделанную работу!
Я бы поглядел на 2 2678v3 с анлоком.
@@Fessanist Есть такой тест.
@@vaasmontenegro6243 можно ссылку?
можно даже и с v4, цены устремились вниз
@@ymusclecode на v4 нет анлока и они получаются чуть менее производительными (если смотреть модели за адекватную цену)
Во-первых большой респект за тесты в Ансисе! Найти результаты для не серверных процессоров в интернете практически невозможно.
По тестам: прочностные нелинейные статические расчеты (Ansys Mechanical) параллелятся не на 100%, часть алгоритма насколько я знаю выполняется последовательно... Наличие в задаче сложных контактов также может значительно ухудшать масштабирование. В целом важно чтобы задача целиком умещалась в оперативной памяти, если это так, то дальнейшее увеличение объема ОЗУ существенного эффекта уже не даст. Требуемое количество ОЗУ зависит от объема задачи.
Частота и ПСП памяти влияют, но не прямо пропорционально и не всегда существенно.
По поводу уменьшения времени расчета при уменьшении количества ядер: Ansys Mechanical не может нормально задействовать виртуальные потоки, поэтому для полной картины их лучше отключать через биос (это рекомендация разработчиков).
В прочих расчетах предполагаю, что могла сказаться более высокая пропускная способность памяти у Зеонов и Тредрипперов. У сборки на Зеонах в общей сложности 8 каналов ddr3, у Тредрипперов 4 канала ddr4, что как я понимаю дает примерно равную общую пропускную способность памяти. Это объясняет почему при многопоточной нагрузке Зеоны на равне с Тредрипперами, а при однопоточной сильно проигрывают.
Вообще многие расчеты в частности CFD упираются в ПСП памяти и реализовать полную вычислительную мощность процессоров становится невозможно. У линейки Ryzen 9 всего 2 канала, что существенно ограничивает масштабирование в таких задачах. При этом софт для мониторинга все равно может показывать загрузку процессора под 100%, без прироста производительности.
В будущем если возможно, хотелось бы увидеть сравнение серии R9 и Тредрипперов c Core x серией интел в динамических расчетах с использованием явного решателя (Ansys ls-dyna или Abaqus Explicit). Будет ли ПСП памяти ограничением в этих случаях?
Привет! А нельзя с тобой связаться по поводу консультации? Хотел бы освоить абакус. Спасибо
Еще нюанс - многие решатели эффективнее работают с физическими ядрами, а не с виртуальными потоками. В частности, в рекомендациях к Star-CCM и Nastran прямо написано, что HT и аналогичные технологии лучше отключать в биосе, а количество потоков в расчете не должно превышать количества физических ядер процессора. В этом плане бенчмарк того же Star-CCM информативнее, позволяет прогнать одну и ту же задачу на разном количестве потоков и получить наглядное сравнение. Собственно, когда на работе выбирали рабочие станции на замену 2670v3, в бенчмарке Star-CCM и сравнивали. Результаты получились примерно такие же - TR 2950X в однопотоке примерно в два раза быстрее, чем 2670v3. Как и мой домашний 3900Х. А в многопоточности такой просадки у АМД по эффективности не было, как здесь в ролике, и в целом производительность зависила от количества ядер с учетом производительности на ядро. Т.е. TR2950X и R3900X и тут были быстрее, чем 2670v3. График производительности по количеству потоков был у всех примерно одинаковый и показывал максимум на количестве потоков примерно на 80-90% от количества физических ядер. Т.е. если в TR 2950X 16 физ. ядра, то минимум времени на расчет получалось на 14 потоках. На количестве потоков выше 16 время на расчет было выше примерно на 10-15% от минимума и практически не менялось вплоть до 28 потоков. Потом росло и на 32 потоках соответствовало расчету на примерно 8-10 ядрах. Для R3900X и 2670v3 соотношения были примерно такими же.
P.S. TR2950X работал со 128Gb, 2670v3 и R3900X со 64Gb ram
Хуже того, многие производители САЕ рекомендую виртуальные потоки отключать в биосе.
Проверял отключение HT в ANSYS CFX -разницы нуль, зато это позволяет экономить лицензии. Выводы у бородачей странные. В эксплуатации два E5-2683v3. Решение тестовой задачи газовой динамики занимает 2 часа 45 минут (правда работаю через Virtual Box (он просаживает производительность где-то на 5-10%). А ryzen 2700@3.8 эту же задачу решает за 3 часа и 5 минут. Так что TR явно должны быть шустрее старых xeon-ов.
Тесты:
Threadripper:
2:33 - 3970X
3:03 - 5950X
3:28 - Общий тест
Xeon:
6:42 - 2670V2 x2
Тест на одно ядро:
7:25
Спс тебе
Ой, как актуально! Работаю в области квантовой химии. Не то чтобы в отечественной науке много денег, особенно для аспиранта. Поэтому рабочую станцию собирал на зионах: 2х2690v2, 128 Gb. Большое спасибо за тест, теперь подожду обновляться на всякие эти тредрипперы без выяснения реального ускорения в моих программах моделирования вещества. На зионах задачи действительно отлично параллелятся, прирост практически пропорционален числу потоков. Работаю в линукс, под винду нужного софта тупо нет.
Зеон: фигурирует в видео.
Зеонщики: Позвольте заметить, ...
Ну так правда есть что заметить.
за цену тредрипера можно вагон зионов взять .. и где тут блин альтернатива мм не слышу?? так это не самый лучший зеон что они взяли..
@@bingo2828 они ещё голд и платиновые зионы не видели)
@@user-FREESHOOTER Посмотрел ваши тесты.Просто окуенные!
@@user-FREESHOOTER прайс на 2670в2+ддр3 раза в 2 ниже, чем на 2678в3+ддр4\ддр3 с особой материнкой с ддр3 слотами и прочую клоунаду с 2011-3 сокета
Спасибо! Инженеры благодарны)
Тема с тестами процессоров в вычислительном ПО (таком, как Ansys) очень актуальна, спасибо.
Она - ахиллесова пята и тема для споров в инженерном сообществе
Есть там место и Xeonам, есть свое место и у AMD.
Ребят, что вы про V3 все заладили? В ролике же ясно сказано, что изучается вопрос целесообразности замены старой сборки на Зеонах на современную AMD. Это не про сборку с нуля на основе Б/У комплектующих с Али. Это именно про смысл (затраты/эффект) замены старой рабочей системы, собранной лет 7-8 назад на актуальную сегодня. Спасибо каналу.
С одной стороны правильно говориш, НО... Когда стоит вопрос денег и потребления енергии есть смысл купить 2х2678-3 и вагон памяти ddr3(128+ ГБ) за копейки(по сравнению с ddr4) и иметь результат не сильно хуже Тредрипера при том что весь комплект Зеонов будет немногим дороже самого Тредрипера
Надо закрепить этот комментарий, а то 90% людей пишут про зионы в3-в4 не понимая суть видео
Это не ребята - это зевонщики...)
@@mammotha9921 да не стоит вопрос денег стоит вопрос перехода с мертвой платформы на новую, хотя у вас зеонщиков мозга нет все равно не поймёте
@@dearteam1755 Ну если ты такой хитрожопый, и у тебя явно есть 3К бачей на станцию- тогда у меня нет мозга(и да, у меня 2678-3, малому своему 2700Х сложил, а какая между ними разница можеш сказать?)Если человек умеет соразмерять цену, энергопотребление и производительность его називают-"зеонщиком мозга"... БРАВО
Наконец-то, как долго я ждал именно этих тестов, спасибо!
Большое спасибо!!! Очень хочется побольше такой информации, кроме ансиса есть много других пк для расчётов, очень хочется, чтобы вы продолжили работу в этом направлении👍👍
СПАСИБО ЗА ВАШ НЕБЛАГОДАРНЫЙ ТРУД ))
Неблагодарный? Труд кого-то не отблагодарил?
Ничего не понял, но очень интересно. Лайк однозначно.
не понял но и не интересно
фонит пока ем и ладно)
Огромное спасибо! Тема рабочих станций сейчас очень актуальна!
Пригодилось. Спасибо за сравнение. Жирный лайк. Интерес правда 2678v3x2 но суть я в общем понял.
v3 на другой архитектуре, они немного пошустрее будут.
@@ista011 v3 по отношению к v1 (v2) имеют +25...30 в сравнимом по цене конфиге (2678v3 / 2689v1 например) в задачах компиляции/сборки/подписи (я кодер, у меня такие машинки на CI/CD). И в этом видео тредриперам пришлось бы нелегко :)
Классный видос, жаль, что не в сравнении с 2011 v3, они в Китае по адекватной цене...
Они в Китае вообще копейки))
2 2678 в3 показали бы неожиданный результат)
Видит уже тесты на v4
Michail по адекватной только б/у и то, китайский мусор
@@Tyson2211 этот мусор нагибает райзен 2700
Спасибо за тест, б/у Зеоны сейчас топ за свои деньги.
Б/у зеоны через грант не купить
@@leoned1797 ну так то да что обидно
Ещё бы посмотреть в сравнении с E5-2678V3 и E5-2699V4 (12/24 и 22/44 соответственно), должны чуть ли не кратно выигрывать у v2
@@draackul почему нет, зависит от задачи (проекта в ансис), 2678в3 22нм в рендере уже не держит максимальный турбобуст по всем ядрам упирается в тдп 120Вт, у 2699в3 ядер в 1.5 раза больше, а тдп увеличен только до 145Вт, 2699в4 тдп тоже 145Вт, но тех.процесс меньше 14нм, т.е. потребляет меньше, так что большой вопрос насколько просядут частоты под тяжелой многопоточной нагрузкой....это в игрушках анлок хорошо работает, а в проектах где процы будут долбить avx`ом/fma3 инструкциям?
вот, вот чего я ждал эти годы. Благодарю, есть об чем теперь поразмыслить для сборки.
Очень давно ждал этого ролика. Спасибо большое))
Так, Так Так)) Ждем тесты 6900XT))
О драсте а я жду тести realmi v3
Знакомые люди))) держи лайк )))
@@fsepr так он уже давно на канале))))
@@VOLbnyy и Вам привет!))
@@chinagadgetsofficial извиняюсь) Привет !!!
За CFD и Mechanical в ANSYS, ОГРОМНОЕ СПАСИБО!!!❤️
Побольше бы таких видео😌😌😌
P.S. Студент 4 курса, Прикладная математика в строительном вузе, ANSYS - программа по моей профессии)))
1:32 Ребята из g-skill напряглись... :D И поставили пометку "бороде больше не наливать" :D
Когда сами налажали...Г-Скилл, название говорит само за себя.. А впрочем, чего это я, патчик выпустят и порядок :)
Однозначрт нужны такие тесты!
Далеко не все играют :)
Только нужно что бы тесты были и в других рабочих программах.
Очень интересная, но очень отвлеченная тема. Это как лекцию по астрофизике послушать. Квазары, магнетары, тредриперы, зеоны...
Наконец-то тесты, ради которых и придумали ЭВМ!
Кстати говоря, к расчётам можно добавить видеокарту, даже не из серии проф. карт, создав системную переменную "ANSGPU_OVERRIDE" и присвоив значение "1" (хочу знать, что может предложить рынок не из проф. карт, которые смогут справится с проф.* задачами).
Так же, заранее можно добавить "ANS_ALLOW_HYPER_THREADING" со значением "1", - FPU с разрядностью 256 бит делится на два 128 битных канала. Их включение в расчёт не даст значительного прироста, но их работа по «обслуживанию», создаст заметный эффект.. И ещё кучу всего... Время решения зависит и от того последовательно или параллельно решается задача, используется NVME с хорошим I\O или обычный SSD... Я даже в диплом не постеснялся включить всё, чем я свёл решение задачи с почти 23 часов, до часа. В общем, могу как нибудь скинуть, если надо будет. Если я там всё указал, могу и не помнить. Могу и задачу скинуть. Там дерево модулей:
Static structural -> Topology Optimization -> Static structural -> eigenvalue buckling
* - любительскими.
Я пытался...
удивительный в хорошем смысле тест от техноблогера на Ютьюбе )
Спасибо за вашу работу! )
Борода как всегда хорош.
Спасибо, очень интересно по урезанию ядер, вероятно есть зависимость от кэша процессора, либо кому то надо переписывать движок)
Там может быть вопрос в перераспределении ресурсов. Я крутил тяжёлую задачу, при условии что памяти был практически вагон, были ситуации, процессор был нагружен только на 1-5%. При 12 ядрах начинаешь думать, а чем вообще занимается система, если расчет может продолжаться не один день. Прям тяжёлые философские вопросы.
Хоть сам не пользуюсь и не знаком с программой, но всегда интересно смотреть подобные тесты.
Благодарю, очень интересно. Вы удивительные молодцы, делаете тесты под заказ, причем интересные.
Спасибо огромное за тесты!
Как при прошлых тестах процессоров, снова хочу обратить внимание: в тестах ANSYS Mechanical качество распаралеливания очень сильно зависит от конкретной расчетной модели. Контролируйте параметр Load Balance Ratio, он выводится в консоли Slover Output и отображает на насколько равномерные блоки поделилась матрица уравнений (должен быть близким к единице, больше двух - плохо). Плюс сокращайте ввод/вывод на диск уменьшением колличества шагов/подшагов и отключением сохранения данных на подшагах
Как по мне 2011v3 это живая и производительная платформа
Да у меня e5 2678 v3
@Шамиль Юсупов видео Постучал снизу тредриперщик.
Круть, спасибо. Узкие темы - это всегда интересно.
Как же вы вовремя, я именно сейчас и думал над сборкой под похожие задачи!)
Спасибо большое за обзор! Все-таки есть часть аудитории, который используют пк для работы, а не для игр,и такой обзор как "глоток свежего воздуха" среди игровых бесконечных тестов!
Замечательный полноценный обзор! Столько различных деталей важных. Огромные молодцы, как всегда великолепную работу проделали!
v3 с али - выбор профессионалов. +30% к производительности, цена всей сборки 1/10 от цены тредрипперов.
Даже девопсы берут себе в контору эти сборки на китайских материнках. Был шокирован, когда сказали, что это быстрее и сильно дешевле.
С такими ценами можно свой подпольный дата-центр открыть за недорого.
Воу воу, неужели я дождался это видео. Спасибо вам!
Полезное видео, осталось лишь узнать, что такое Ansys)
Добро пожаловать на наш канал. Мы расскажем)
За Xeon спасибо. Народные процессоры которые по карману каждому. Я считаю свою нишу они имеют. Дёшево и сердито. А главное не сильно уступают в некоторых задачах за свой прайс.
Приветствую Вас! Как всегда, спасибо за видео и за ваши труды и старания!
smt Нужно отключать. без него ансис считает побыстрей чем с ним. местами зеонам мог помочь avx512 (если он там был), местами 5000 серия могла упираться всего в 2 канала памяти, ну и базово тестировать нужно было 1-2-4-8-16 по всем процессорам, без smt - тогда было бы понятно, какая реальная масштабируемость решений.
Ну и еще - на зеоне расчеты может и будут на уровне, а однопоточная работа (кручение сборок, работа модификаторов и все такое) - будет менее комфортной чем на 5000 серии, да даже чем на 3000 рипперах - т.к. герц на ядро меньше.
Классная тема. Спасибо, что затронули)
Сам работаю в Ансис, хоть и не профессионально пока что, но хочу этим заняться в будущем
А пока считаю модели для ВКР на 60 млн ячеек на своем домашнем ПК на Ryzen 2600))))
Сколько идёт один расчет. Ибо тоже задачки на 70-90млн ячеек имею. Третий раз уже расчет запускаю.
Вывод из видео уже неактуальный V2 не хуже Тедриппера)))
Спасибо за видос, наконец то про ансис отдельно разговор пошёл. Также было бы интересно узнать, каким образом можно ускорить расчеты с помощью видеокарт, и соответственно сравнить разные карты. Также интересно было увидеть подробности задачи, количество элементов сетки, количество узлов
Здравствуйте. Вы написали вопрос 2 года назад. Случайно за это время не нашли ответа на свой вопрос. Спасибо.
Спасибо за тесты в рабочем ПО
Интересно. Хочу ещё подобных видосиков.
Огромное спасибо! Юзаю cfx и расчеты на прочность. Как раз ищу новый проц.
Вам также необходимо включить в тесты задачи с различными решателями потому, что один и тот же процессор может себя по различному показывать с разными решателями. К примеру термостатические задачи, задачи на модальный анализ с различными настройками решателя, контактные задачи, задачи с различным числом узлов, задачи с динамически перестраиваемой сеткой, задачи на построение самой сетки, задачи на явную динамику. Плюс еще будет играть роль ссд потому, что если задача большая то она будет много писать на жесткий диск, у меня файлы результатов легко доходили до 100гб . В ансис вы любую задачу можете выгрузить как скрипт APDL, затем написать скрипт на bash для последовательного запуска задач, время расчета будет писаться в файле с ходом решения, можно его брать от туда и записывать сразу в таблицу. Таким образом вы создадите свой бэнчмарк и его можно будет относительно быстро прогонять на разных машинах. Плюс учесть замечания что написал krew. Ну и если речь зашла о профессиональном применении, то нужно еще протестировать как это все будет паралелиться между двумя процессорами одного узла сервера и между различными узлами, это особенно актуально для газовой динамики. Там люди могут десятки узлов занимать на несколько недель чтобы провести расчеты. И есть еще отдельная тема по рендерингу геометрии и сетки большого объема. Тут надо тестировать в паре с видеокартой. У меня бывали сетки в меканикл которые по 100гб были и еле ворочались.
Спасибо за интересное сравнение процессоров!
Спасибо Сергей
Очень интересный обзор, спасибо!
Тредрипет,зеон....нафига они мне...
Но приятно видеть "бороду",спасибо за материал
п.с: Подбрил бороду, постригся - помолодел!!!Так держать!)))
Как всегда лайк а потом просмотр)
Отличное видео! При подобных обзорах обязательно указывайте сложность задачи (гидро- газодинамика), количество элементов, режим расчета (стационарный, не стационарный).
Очень полезный разбор. Спасибо!
Думаю, ни когда не пригодится... но очень интересно. 👍
Лучший канал! Очередное Спасибо!
как владелец E5-2683V3 с турбобустом на всех ядрах и 3970X, хоть и занимаюсь графикой, могу сказать о другом. Если сравнивать эти системы то банально производительность ~2 раза больше почти при том же потреблении мощности. Да общий ценник системы на треадрипере намного больше чем на Xeon, но на длительных рендерах (в неделю минимум) общее потребление да и занимаемый объем здесь не на стороне Xeon-ов. Сравнивать надо много факторов, а не только производительность. ИМХО
В поддержку видоса
Ничего не понял,но очень интересно 🤔
Спасибо за работу!
«4 планки и 8 планок на TR» - планок надо 8, иначе квада не будет
«Просаживается на потоках» - потому что на TR играет огромную роль пропускная способность памяти, а не тайминги. 4 ГБ не обязательно на поток, лучше выше частота. Лучшие результаты я получал при 3600 16-16-16-16-32 (3990x 128 ГБ)
Если есть такой прирост при урезании потоков, то кажется очевидным следующий шаг - отключить hyper threading\SMT и провести тест на физических ядрах. Многие задачи в таком режиме покажут производительность выше, чем в многопоточности на каждое ядро.
Так и есть для cfx гипертрейдинг отключают.
А тесты ларки в след видео? ))
Это та, что Щадов оф зэ томб рэйда?)))
@@ВасилийПупкин-ъ3щ именно
Есть один момент. Поскольку в базе ANSYS Mechanical лежит компилятор для Fortran от Intel, то при компиляции код под AMD возможно делался менее эффективным за счет ключей компиляции, чем под собственные процессоры Intel. Подобная тема с компиляцией всплывала в прошлые годы, и возможно, что она тут проявилась. Тут может стоит сравнить еще различные версии ANSYS, если на это есть возможность.
на АМД 8000 серии я в 12-13 году делала много расчётов в Mechanical версию не помню(12 или 13), так была проблема в том что все ядра были нагружены ровно на 50%(все 8шт), но я запускал 2 решателя одновременно(и тогда загрузка 100%) и время вычисления было одно и то же. На ноуте на интеле грузились все ядра на 100%(i7-2670q).
хочу добавить, что 3 поколение Xeon вроде как еще производительнее было бы..
И стоит вся сборка на 2х топовых зеонах как один тредрипер))
@@geraappolonov дичь говоришь, материнка под них 10к, два проца 2678v3 12/24 с локом буста на 3.1, по 7к, тут тредрипером и не пахнет даже еще
@@geraappolonov Неа, Xeon E5 2678 v3, 12 ядер 24 потоков, частота 3,4 ghz, цена 6500 рублей.
@@anwaralkanov2391 ого, чел сверху написал цену 7к, а ты нашел на 500р дешевле, какая огромная разница, шок
@@thevico только отвечал он челу который про тредриппер писал,так что ты обосрался
Всем троим профи это понравилось) спасибо за труд)
Когда тест М1?
В работе.
+3% производительности за цену 3х этажного дома в Зажопинске
как всегда круто и по теме!
я за Xeon, цена распологает закупить2+ проца в сборку а это намного сильнее Ryzen
нож в печень - зион вечен xD
Продам почку - куплю зион сыночку.
@@ВасяПупкинд продам две - куплю еще жене
@@ВасяПупкинд ты че тезка мои фразы копируешь
Зион на 775
ЗИОН - вечен. Китайские материнки - нет.
Имею сборку на китайской материнке с двумя Е5-2667 v2 и 128ГБ ОЗУ.
Было любопытно увидеть работу в Ансис с похожими процессорами в сравнении с тредрипером. Спасибо за видео.
Мне кажется они неплохо себя показывают. Меня мучает вопрос, пробовали ли вы переходить грань в 128гб на китайской матери. Я толкался на 96гб. И ещё не использовал большую память.
@@Barmaley80x у китайской материнки проблема - не поддерживает даже штатный разгон (турбобуст). А оперативку забивал при работе полностью - с этим проблем не было. Более 128 не устанавливал.
Ну если такие системы собираете для задач, то и задачи простыми не являются. Я не в Ansys, Star CCM+ работаю. Но все рекомендации которые к Ansys относятся, применимы и к CCM+. Этот софт меня заставил раскошелится на 96гигабайт ОЗУ. Но конечно же это не предел.
@@foxmulder4999 я использовал кит.материнку для обсчета, после зависания отвис, и продолжил считать. Остановился на 4 день из-за ошибки. Плюс что отвис, минус что не всегда предсказуем...
Классно!!!
Тема огонь пока ещё не занимался ей но понял что буду собирать сборку на зеонах. А ну лайк как всегда за качество контента.
Друган работал в ансис еще в 2005-7м гг. Купленный в рознице комп считал неделями одну задачу. Потом ему собрали машину за дохулион рублей, сроки сократились с нескольки недель до нескольких часов-дней . . . а еще были большие проблемы с ОСями, сложно было тогда с 64бит
КРАСАВА!!! СПАСИБО ЗА ВИДЕО!!!
Лучшая производительность при уменьшении количества ядер получилась благодаря балансу, между количеством задач на ядро и количеству информации, которое надо передать от одного ядра, к другому. Если будет слишком много задействованых ядер, упор будет в скорость передачи данных от ядра к ядру.
2678v3 бы надо
да да с анлоком турбобуста
тогда канал закроют с формулировкой: доведение до самоубийства сектантов АМД )
@@pavelk.s.4969 ну как минимум из-за амд зион на алике из заоблачных цен спустились в адекватный прайс
Справедливости ради, на ютубе уже почти год есть сравнение с оверпрайсным Зионом. В поиске наберите "Intel 28-Core W-3175X Revisit vs. Threadripper 3970X, 3960X: Power, OC, & Benchmarks"
@@ymusclecode и как максимум амуде начала загибать цены, как тот же интол. единственная надежда на 11 поколение лейков
Весьма интересно и познавательно.
P.S. Картинка какая-то замыленная сегодня
Самый популярный среди "Xeon" это "2678v3"(2680v3), думаю большинство согласиться с этим, тем более нужно тестить на односоккетных материнских платах с "Xeon". Тем более распараллеливание задач на двухсоккетных системах, очень примитивное, их даже не спасает 8-ми поток, на оперативную память.
совсем это мне не понадобится, но оч интересно, лайк крч
Ура, инженерная тематика пошла!
2011 уже не тот, только если на время а другого нет ничего или нет денег. А вот 2011-v3 уже куда интересней. Тот же e5 2678v3 стоимостью в районе 7000 рублей показывает отличные результат, а если сделать анлок турбобуста то ещё поинтереснее. Конечно не сравнить с процессорами за 130 000)) на за 7к у него хорошие результаты))
Подешевеют v4 и их можно будет брать. Там есть достойные экземпляры. Но на текущий момент очень дорого)
Отличный ролик, спасибо
В видео конечно стоило v3 проверить, там всетаки уже есть новые инструкции , которые в некоторых программах дают очень заметный прирост по сравнению с v2 , например vray. Работаю на 2x зеонах начиная с х5650 , потом 2670, 2696v2 и сейчас перехожу на 2680v3. Мат. Платы всегда supermicro
Думаю у вас в vray задачи, у меня часть задач крутилась ansys, крутил ещё пару софтов тяжёлых. Хотя крутил на последних процессорах, собрав отдельно на старой сборке зеон, мне он показал хороший по скорости результат счета.
Нихрена себе... Как вы, с параноидальной скрупулёзностью проводите тесты, не тестит никто. Респект вам и уважуха 👍
Ну чтож, у меня threadripper 1920x. Ради хобби работаю в cinema4d, иногда играю. Установлено 4 плашки по 8гб памяти, работает на частоте 3200. Скорость записи/чтения 100/85 в четырехканале. На проце водянка, фикс частоты - 4 ггц. Память дополнительно охлаждается воздухом.
Считаю идеальным процем - для симуляций в синьке , где используется однопоток и конечного рендера, где задействуются все ядра. Брал проц за 12тыс., плюс материнку за 17.
UPD. Какие настройки солвера использовали для платформы на Интеле? Благодаря вашему недавнему ролику, где вы тестировали новые Рязани 5-ти тысячной серии и сравнивали их, в том числе с Интелами, я еще раз убедился, что в Ансис до сих пор не умеют работать с виртуальными потоками (гипертрединг). Более того, в последних версиях софта они почему то добавляют еще два потока к заданному пользоателем значению. Таким образом моя задача в Icepak (насколько известно, использует тот же solver, что и Fluent) на 2670v1 (8/16) была посчитана за чуть меньше 24 минут на 6(настройки)+2(довесок от производителя) потоках, тогда как на любом большем количестве потоков это время только росло (!) и составило в максимуме около 30минут (от 12 до 16 потоков, разницы во времени почти не было). При уменьшении количества потоков скорость расчетов тоже ухудшалось. Забавно, что на 4 потоках задача была расчитана все равно быстрее чем на 16! Таким образом эффективно Ансис работал только на реальных ядрах.
Так что на 40 потоках я бы не рекомендовал запускать Ансис на вашей платформе от Интел. 20 потоков суммарно должно быть в вашем случае, иначе результат только хуже!
ansys рекомендует вырубить HT и решать без него.
Вот за такие выпуски мне и нравится
PRO Hi-Tech.
Интересный обзор, интересное сравнения процессоров нового и старого поколения , но цена производительность и энергоэффективность в теплопакете процессора, будет решать для потребителя главное значение при выборе центрального процессора для рабочей станции...
Ваши рубашки съедают 80% времени рендеринга, наверное.😀
Помимо этого, еще и ужасный выбор расцветки рубашки для видео, раздражает глаза зрителя как минимум.
Собрал комп на топовом Ryzen 9 7950x. 128ГБ ОЗУ четырьмя планками. 3600МГц DDR5 (проц не позволяет работать выше с 4 планками). В сравнении с моей старой двухпроцессорной сборкой с али на Е5-2667v2 (128ГБ DDR3 1866МГц) прирост производительности в среднем в 2-2,3 раза. В ansys maxwell в 2 раза, а в hfss в 2,3раза. Всё бы ничего, но разница между процессорами 10 лет! Это же целая эпоха! А прирост всего в 2 раза. И это при том, что частота у 2667 3,3ГГц, а у 7950х 5,4ГГц на все ядра! Т.е. прирост производительности за счёт архитектуры за 10 лет какие-то жалкие 20%. Ну вот вообще не ожидал такого. Может внатуре следовало взять 13900 вместо 7950. Может есть у кого возможность сравнить в ansys эти два проца?
Тигр братан.
Сергей привет с наступающим
Спасибо 😉
Спасибо большое!