Під час презентації Advancing AI компанія AMD офіційно анонсувала новий прискорювач обчислень штучного інтелекту Instinct MI325X.
Він забезпечить якісне зростання продуктивності та отримає рекордний об'єм пам'яті HBM3e для роботи з великими обсягами даних.
Instinct MI325X є розвитком наявної серії MI300X і використовує процесор на актуальній архітектурі CDNA 3.
Основні зміни пов'язані з апгрейдом підсистеми пам'яті.
Новий графічний чип отримає 256 ГБ швидкої пам'яті HBM3e з пропускною здатністю 6 ТБ/с.
Усе це упаковано в продукт, який налічує 153 мільярди транзисторів.
Заявлена пікова продуктивність 2,6 PFLOPS в обчисленнях формату FP8 та 1,3 PFLOPS в обчисленнях FP16.
Енергоспоживання одного такого прискорювача понад 750 Вт.
Сервери AI Instinct підтримують конфігурації до 8 пристроїв MI325X зі спільною пам'яттю HBM3e об'ємом 2 ТБ за пропускної здатності 48 ТБ/с.
Обмін даними буде проводитися по шині Infinity Fabric 896 ГБ/с.
Пікова продуктивність такого сервера складе 20,8 PFLOPS у FP8 і 10,4 PFLOPS у FP16.
Постачання серверних рішень з Instinct MI325X розпочнеться в четвертому кварталі поточного року.
У компанії AMD зазначають, що актуальні прискорювачі MI300X уже демонструють перевагу відносно рішень Nvidia в певних навантаженнях.
Нові прискорювачі Instinct MI325X AI GPU мають бути на 40% швидшими за Nvidia H200 в роботі з мовною моделлю Mixtral 8x7B, на 30% швидшими в Mistral 7B та на 20% швидшими в Meta Llama 3.1 70B LLM.
Наступного року компанія виведе на ринок ще більш продуктивний продукт для обчислень ШІ.
Це прискорювач Instinct MI355X, який отримає неймовірні 288 ГБ пам'яті HBM3e.
В основі його буде графічний чип на новій архітектурі CDNA 4, яка запропонує суттєвий стрибок у продуктивності.
У CDNA 4 з'явиться підтримка обчислень у форматах FP4/FP6, зростання місткості та пропускної здатності пам'яті складе 50%.
Обіцяно зростання продуктивності в окремих навантаженнях ШІ до 7 разів.
Instinct MI355X отримає 288 ГБ пам'яті HBM3e з пропускною здатністю 8 ТБ/с.
Потенціал у FP8 оцінюють у 4,6 PFLOPS, а в FP16 до 2,3 PFLOPS.
Відносно Instinct MI325X це зростання швидкодії до 80%.
Чип вироблятиметься за технологією 3 нм.
Енергоспоживання одного пристрою буде на рівні кіловата.
Серверні системи з восьми Instinct MI355X запропонують 2,3 ТБ пам'яті з пропускною здатністю 64 ТБ/с за пікової продуктивності 37 PFLOPS у FP8, 18,5 PFLOPS у FP16 та 74 PFLOPS у нових форматах FP4/FP6.
У 2026 році прискорювачі Instinct MI355X змінять нові графічні процесори сімейства MI400.