Интересный материал вышел в блоге Nvidia.
В нем сравнивается производительность специализированных ускорителей, которые ориентированы на сегмент высокопроизводительных вычислений HPC.
Обычно нам доступны только технические характеристики и цифры «сырой» производительности для таких устройств.
В данном случае специалисты Nvidia попытались сравнить потенциал ускорителей в реальных условиях при популярных нагрузках в ЦОД, включая LAMMPS, NAMD, openMM, GROMACS и AMBER.
Сравнивались Nvidia A100 и AMD Instinct MI250 в конфигурациях с одним и четырьмя ускорителями.
Разница между ускорителями зависит от задач, где-то это 10%, а где-то Nvidia A100 в два раза быстрее конкурента.
Ниже на графиках показаны коэффициенты эффективности ускорителей при разной нагрузке.
Также решение Nvidia выигрывает в энергоэффективности.
Для рабочих нагрузок LAMMPS выигрыш в соотношении производительность на ватт до 2,8 раз лучше в пользу Nvidia A100.
Ускоритель Nvidia A100 впервые был анонсирован еще в 2020 году.
Он использует массивный GPU Ampere с 54 миллиардами транзисторов.
У A100 6912 потоковых процессоров, 432 тензорных ядра и 40 ГБ памяти HBM2 с шиной 5120 бит.
В основе ускорителя AMD Instinct MI250 графический процессор под кодовым названием Aldebaran c 13312 потоковыми процессорами, плюс 128 ГБ памяти HBM2E.
У AMD есть еще топовая модель AMD Instinct MI250X с большим количеством вычислительных блоков.
Но результаты более старого ускорителя Nvidia A100 все равно впечатляющие.
При этом Nvidia уже анонсировала ускоритель нового поколения H100 на архитектуре Hopper.