Компания IBM официально анонсировала собственные чипы для работы с искусственным интеллектом.
Это процессор Telum II и ускорители искусственного интеллекта Spyre для мэйнфреймов серии IBM Z.
Данные чипы ускорят традиционные нагрузки ИИ вместе с большими языковыми моделями LLM на серверных системах IBM.
Процессор Telum II получил восемь высокопроизводительных ядер, работающих на частоте 5,5 ГГц.
На каждое ядро приходится 36 МБ кэш-памяти L2, а общий объем встроенной кэш-памяти составляет 360 МБ.
Кэш-память виртуального четвертого уровня поддерживает объем 2,88 ГБ на каждый процессорный блок, что на 40% больше относительно первого поколения Telum.
Новые ядра имеют улучшенное предсказание ветвлений и 160 регистров при уменьшении энергопотребления на 15%.
Процессор получил встроенный ускоритель искусственного интеллекта для быстрых операций вывода ИИ с малыми задержками и высокой пропускной способностью.
Такой ускоритель обеспечивает производительность 24 TOPS на один процессор, 192 TOPS на блок и 768 TOPS на систему.
Также в процессор встроен новый блок ускорения ввода-вывода DPU, который увеличивает плотность передачи данных на 50%.
Telum II производится по технологии Samsung 5HPP и содержит 43 миллиарда транзисторов на кристалле площадью 600 мм2.
Ускорители Spyre являются решением корпоративного уровня.
Они обеспечивают производительность в задачах ИИ более 300 TOPS при объеме памяти LPDDR5 128 ГБ.
В конфигурации из 8 таких ускорителей в системе IBM общая память достигает 1 ТБ.
Каждый ускоритель Spyre AI имеет 32 вычислительных ядра, которые поддерживают типы данных INT4, INT8, FP8 и FP16.
TDP такого устройства составляет скромные 75 Вт.
IBM планирует поставлять готовые решения с процессорами Telum II корпоративным клиентам уже в 2025 году.
Ускоритель Spyre еще находится в статусе ранней технической версии, но его поставки тоже должны начать в следующем году.