Уже несколько поколений игровых и специализированных GPU NVIDIA имеют специальные тензорные блоки для работы с матричными данными.
Эти блоки позволяют ускорить вычисления, связанные с глубоким обучением, что расширяет возможности решений NVIDIA в специализированных задачах.
Нашлось применение этим блокам и в игровом сегменте, поскольку технология интеллектуального масштабирования Deep Learning Super Sampling (DLSS) использует вычисления с применением тензорных блоков.
Теперь подобные блоки могут получить графические процессоры AMD нового поколения.
На это указывают данные в обновленных библиотеках LLVM драйвера AMDGPU.
Для архитектуры с кодовым названием GFX11 (RDNA3) добавлена технология Wave Matrix Multiply-Accumulate (WMMA) с поддержкой специальных инструкций для матричных вычислений.
WMMA поддерживает матрицы 16x16x16 и может выводить данные в форматах FP16 и BF16.
Это не первая архитектура с поддержкой матричных операций.
В архитектуре CDNA для ускорителей вычислений Instinct MI200 уже реализована поддержка инструкций Matrix-Fused-Multiply-Add (MFMA).
Но ускорители Instinct являются продуктом для центров обработки данных, а в случае RDNA3 речь идет о массовых решениях.
С таким аппаратным апгрейдом может получить развитие технология FidelityFX Super Resolution, которая станет прямым аналогом NVIDIA DLSS.