Разработчики и производители процессоров и другой сложной микроэлектроники понимают всю важность сферы искусственного интеллекта и машинного обучения и активно состязаются в том, кто наделит своё новое детище большими возможностями в этой сфере.
Заявку на первенство подал стартап Groq, анонсировавший тензорный процессор с невиданным прежде уровнем производительности.
Их новый чип, Tensor Streaming Processor (TSP), стал первым в мире, способным достичь планки 1 Петаопс (PetaOPS, 1015 операций в секунду, обычно целочисленных).
Один из основателей стартапа Джонатан Росс (Jonathan Ross) заявил, что разработанная Groq архитектура является быстрейшей на рынке, поскольку даже производители графических процессоров говорили о таких цифрах лишь в будущем времени.
Новый процессор создавался с прицелом на максимизацию вычислительных возможностей, поэтому его архитектура имеет ряд любопытных особенностей.
Groq делает ставку на компилятор и этим экономит транзисторный бюджет.
Главная из этих особенностей заключается в том, что Groq решила не расходовать драгоценный транзисторный лимит на кеши, планировщики заданий и т.
п., поэтому за планирование и реализацию параллелизма отвечает компилятор.
Этим TSP напоминает Intel IA64 (Itanium).
Разработчики заявляют, что их архитектура обеспечивает полностью детерминированную работу TSP, что немаловажно для задач реального времени, таких как машинное зрение в системах автопилотов.