Технология чиплетов помогает обойти физические ограничения полупроводниковых чипов и скоро может стать новым стандартом для производителей.
Хотя чиплеты существуют уже несколько десятилетий, их использование исторически ограничивалось специализированными приложениями. Но сегодня они находятся на переднем крае технологий, обеспечивая работу миллионов настольных ПК, рабочих станций, серверов, игровых консолей, телефонов и даже носимых устройств по всему миру. Фокус перевел статью журналиста Ника Эвансона для Techspot о том, что такое чиплеты, почему так важны и как они изменят работу электронных устройств в ближайшем будущем.
Что такое чиплеты?
Чиплеты — это сегментированные процессоры. Вместо того, чтобы объединять каждую часть в один чип (специалисты называют это монолитным подходом), определенные секции производятся как отдельные чипы. Эти отдельные чипы затем монтируются вместе в один пакет с использованием сложной системы соединений.
Такая компоновка позволяет уменьшить размеры деталей, при изготовлении которых можно использовать новейшие методы, что повышает эффективность процесса и позволяет разместить больше компонентов.
Части микросхемы, которые не могут быть существенно уменьшены или не требуют уменьшения, могут быть изготовлены с использованием старых и более экономичных методов.
Хотя процесс производства таких процессоров сложен, общая стоимость обычно ниже. Кроме того, это предлагает компаниям-производителям процессоров более управляемый путь для расширения ассортимента своей продукции.
Всего за несколько лет большинство ведущих производителей микросхем приняли технологию чиплетов для внедрения инноваций. Теперь очевидно, что чиплеты готовы стать отраслевым стандартом.
Наука о кремнии
Чтобы полностью понять, почему производители процессоров обратились к чиплетам, мы должны сначала разобраться, как изготавливаются эти устройства. Процессоры и графические процессоры начинают свою жизнь как большие диски из сверхчистого кремния, обычно диаметром чуть менее 12 дюймов (300 мм) и толщиной 0,04 дюйма (1 мм).
Эта кремниевая пластина проходит ряд сложных этапов, в результате чего получается несколько слоев различных материалов – изоляторов, диэлектриков и металлов. Шаблоны этих слоев создаются с помощью процесса, называемого фотолитографией, где ультрафиолетовый свет просвечивается через увеличенную версию шаблона (маску), а затем сжимается с помощью линз до требуемого размера.
Рисунок повторяется с заданными интервалами по всей поверхности пластины, и каждый из них в конечном итоге станет процессором. Поскольку чипы прямоугольные, а пластины круглые, узоры должны перекрывать периметр диска. Эти перекрывающиеся части в конечном итоге удаляются, поскольку они нефункциональны.
После завершения пластина тестируется с помощью зонда, приложенного к каждому чипу. Результаты электрической проверки информируют инженеров о качестве процессора по длинному списку критериев. Этот начальный этап, известный как сортировка чипов, помогает определить "класс" процессора.
Например, если чип должен стать центральным процессором, каждая часть должна функционировать правильно, работая в заданном диапазоне тактовых частот при определенном напряжении. Затем каждая секция пластины классифицируется на основе результатов этих тестов.
После завершения пластина разрезается на отдельные части, или "кристаллы", которые пригодны для использования. Затем эти кристаллы монтируются на подложку, похожую на специализированную материнскую плату. Процессор проходит дальнейшую упаковку (например, с помощью теплоотвода) перед тем, как он будет готов к продаже.
Вся последовательность производства может занять несколько недель, а такие компании, как TSMC и Samsung, взимают высокую плату за каждую пластину — от 3000 до 20 000 долларов США в зависимости от используемого технологического узла.
"Технологический узел" — это термин, используемый для описания всей системы изготовления. Исторически они назывались по длине затвора транзистора. Однако по мере совершенствования производственных технологий и появления все более мелких компонентов номенклатура больше не следовала ни одному физическому аспекту кристалла, и теперь это просто маркетинговый инструмент.
Тем не менее, каждый новый узел процесса приносит преимущества по сравнению со своим предшественником. Он может быть дешевле в производстве, потреблять меньше энергии при той же тактовой частоте (или наоборот) или иметь более высокую плотность. Последний параметр указывает, сколько компонентов может поместиться в заданной области кристалла. На графике ниже вы можете увидеть, как это развивалось с годами для графических процессоров (самых больших и сложных чипов, которые вы найдете в ПК.
Улучшения в узлах процесса предоставляют инженерам возможность увеличить возможности и производительность своих продуктов без необходимости использования больших и дорогих чипов. Однако приведенный выше график показывает только часть истории, поскольку не каждый аспект процессора может выиграть от этих усовершенствований.
Схемы внутри микросхем можно отнести к одной из следующих широких категорий:
- Логические – обрабатывает данные, математику и принимает решения.
- Память – обычно SRAM, в которой хранятся данные для логики.
- Аналоговые – схемы, управляющие сигналами между чипом и другими устройствами.
К сожалению, в то время как логические схемы продолжают уменьшаться с каждым крупным шагом вперед в технологии узлов процесса, аналоговые схемы практически не изменились, а SRAM также начинает приближаться к пределу.
Хотя логические схемы по-прежнему составляет большую часть кристалла, объем SRAM в современных ЦП и ГП значительно вырос за последние годы. Например, чип Vega 20 от AMD, используемый в видеокарте Radeon VII (2019), имел в общей сложности 5 МБ кэша L1 и L2. Всего два поколения графических процессоров спустя чип Navi 21, используемый в серии Radeon RX 6000 (2020), включал более 130 МБ объединенного кэша — впечатляющее увеличение в 25 раз.
Можно ожидать, что этот показатель будет продолжать расти по мере разработки новых поколений процессоров, но поскольку объем памяти не уменьшается так же, как объем логических схем, производство всех схем на одном технологическом узле будет становиться все менее рентабельным.
В идеальном мире можно было бы спроектировать кристалл, в котором аналоговые секции изготавливаются на самом большом и дешевом узле, детали SRAM на гораздо меньшем, а логика зарезервирована для абсолютно передовой технологии. К сожалению, это практически недостижимо. Однако существует альтернативный подход.
Разделяй и властвуй
В 1995 году Intel представила Pentium II, преемника своего оригинального процессора P5. Что отличало его от других процессоров того времени, так это дизайн, скрытый под пластиковым щитком: печатная плата, вмещающая два чипа. Основной чип содержал всю логику обработки и аналоговые системы, в то время как один или два отдельных модуля SRAM служили кэшем 2-го уровня.
В то время как Intel производила основной чип, кэш-память закупалась у внешних поставщиков. Этот подход стал довольно стандартным для настольных ПК в середине-конце 1990-х годов, пока достижения в производстве полупроводников не позволили полностью интегрировать логику, память и аналоговые системы в один кристалл.
В то время как Intel продолжала баловаться с несколькими чипами в одном корпусе, она в основном придерживалась так называемого монолитного подхода к процессорам – т. е. один чип для всего. Для большинства процессоров не было необходимости в более чем одном кристалле, поскольку технологии производства были достаточно совершенными (и доступными), чтобы сделать это простым.
Однако другие компании были более заинтересованы в использовании многочипового подхода, в первую очередь IBM. В 2004 году можно было приобрести 8-чиповую версию серверного ЦП POWER4, которая включала четыре процессора и четыре кэш-модуля, все смонтированные в одном корпусе (известный как многочиповый модуль или подход MCM).
Примерно в это же время начал появляться термин "гетерогенная интеграция" , отчасти из-за исследовательской работы DARPA. Гетерогенная интеграция направлена на разделение различных секций системы обработки, изготовление их по отдельности на узлах, наиболее подходящих для каждой, а затем объединение их в один пакет.
Сегодня это более известно как система-в-корпусе (SiP) и является стандартным методом оснащения смарт-часов чипами с момента их появления. Например, Apple Watch Series 1 содержат ЦП, немного DRAM и NAND Flash, несколько контроллеров и другие компоненты в одной структуре.
Аналогичная установка может быть достигнута путем размещения различных систем на одном кристалле (известном как SoC или система на кристалле ). Однако этот подход не позволяет воспользоваться преимуществами различных цен на узлы, и не все компоненты могут быть изготовлены таким образом.
Для поставщика технологий использование гетерогенной интеграции для нишевого продукта — это одно, а применение ее для большей части своего портфолио — совсем другое. Именно это и сделала AMD со своей линейкой процессоров. В 2017 году полупроводниковый гигант представил свою архитектуру Zen , выпустив однокристальный настольный процессор Ryzen. Всего несколько месяцев спустя AMD дебютировала с двумя многокристальными линейками продуктов: Threadripper и EPYC, причем последняя имела конфигурации до четырех кристаллов.
С запуском Zen 2 два года спустя AMD полностью приняла HI, MCM, SiP — называйте как хотите. Они вынесли большую часть аналоговых систем из процессора и поместили их в отдельный кристалл. Они были изготовлены на более простом и дешевом технологическом узле, в то время как более продвинутый использовался для оставшейся логики и кэша.
И вот "чиплеты" стали модным словом.
Меньше — лучше
Чтобы понять, почему AMD выбрала именно это направление, давайте рассмотрим изображение ниже. На нем показаны два старых процессора серии Ryzen 5 — 2600 слева, использующий так называемую архитектуру Zen+, и 3600 на базе Zen 2 справа.
Теплораспределители на обеих моделях были удалены, а фотографии сделаны с помощью инфракрасной камеры. Один кристалл 2600 вмещает восемь ядер, хотя два из них отключены для этой конкретной модели.
То же самое касается и 3600, но здесь мы видим, что в корпусе имеется два кристалла — кристалл Core Complex Die (CCD) вверху, содержащий ядра и кэш, и кристалл Input/Output Die (IOD) внизу, содержащий все контроллеры (для памяти, PCI Express, USB и т. д.) и физические интерфейсы.
Поскольку оба процессора Ryzen подходят к одному и тому же разъему материнской платы, два изображения по сути масштабированы. На первый взгляд может показаться, что два кристалла в 3600 имеют большую общую площадь, чем один кристалл в 2600, но внешность бывает обманчивой.
Если напрямую сравнить чипы, содержащие ядра, то становится ясно, сколько места в старой модели занимает аналоговая схема – это все сине-зеленые цвета, окружающие золотистые ядра и кэш. Однако в Zen 2 CCD очень мало площади кристалла отведено под аналоговые системы; она почти полностью состоит из логики и SRAM.
Чип Zen+ имеет площадь 213 мм² и был изготовлен GlobalFoundries с использованием своего 12-нм технологического узла. Для Zen 2 AMD сохранила услуги GlobalFoundries для 125 мм² IOD, но использовала превосходный узел N7 от TSMC для 73 мм² CCD.
Общая площадь чипов в новой модели меньше, и она также может похвастаться вдвое большим кэшем L3, поддерживая более быструю память и PCI Express. Однако лучшая часть подхода с чиплетами заключалась в том, что компактный размер CCD позволил AMD разместить еще один в упаковке. Эта разработка дала жизнь серии Ryzen 9, предлагающей 12-ти и 16-ядерные модели для настольных ПК.
Еще лучше, используя два меньших чипа вместо одного большого, каждая пластина может потенциально производить больше кристаллов. В случае Zen 2 CCD одна 12-дюймовая (300 мм) пластина может производить до 85% больше кристаллов, чем для модели Zen+.
Чем меньше кусок пластины, тем меньше вероятность обнаружения производственных дефектов (поскольку они, как правило, случайным образом распределены по диску), поэтому, принимая все это во внимание, подход на основе чиплетов не только дал AMD возможность расширить свое портфолио, но и сделал это гораздо более экономически эффективно — одни и те же ПЗС-матрицы можно использовать в нескольких моделях, и каждая пластина производит сотни таких матриц!
Но если этот выбор дизайна настолько выгоден, почему Intel его не использует? Почему мы не видим его использования в других процессорах, например, в графических процессорах?
Следуя за лидером
Чтобы ответить на первый вопрос, Intel также постепенно внедряет технологию чиплетов. Первая потребительская архитектура ЦП, которую они поставили с использованием чиплетов, называется Meteor Lake. Однако подход Intel в некоторой степени уникален, поэтому давайте рассмотрим, чем он отличается от подхода AMD.
Используя термин "модули" вместо "чиплеты", это поколение процессоров разделило ранее монолитную конструкцию на четыре отдельных чипа:
- Вычислительный модуль: содержит все ядра и кэш L2
- Модуль GFX: содержит интегрированный графический процессор.
- SoC-модуль: включает кэш L3, PCI Express и другие контроллеры
- Модуль ввода-вывода: обеспечивает физические интерфейсы для памяти и других устройств.
Высокоскоростные соединения с низкой задержкой присутствуют между SoC и тремя другими модулями, и все они подключены к другому кристаллу, известному как интерпозер. Он подает питание на каждый чип и содержит дорожки между ними. Затем интерпозер и четыре модуля монтируются на дополнительную плату, чтобы можно было упаковать всю сборку.
В отличие от Intel, AMD не использует какой-либо специальный монтажный кристалл, но имеет собственную уникальную систему соединения, известную как Infinity Fabric, для обработки транзакций данных чиплетов. Подача питания осуществляется через довольно стандартный пакет, и AMD также использует меньше чиплетов. Так почему же дизайн Intel таков?
Одна из проблем подхода AMD заключается в том, что он не очень подходит для ультрамобильного сектора с низким энергопотреблением. Вот почему AMD до сих пор использует монолитные процессоры для этого сегмента. Дизайн Intel позволяет им смешивать и подбирать различные плитки для удовлетворения конкретных потребностей. Например, бюджетные модели для доступных ноутбуков могут использовать гораздо меньшие плитки везде, в то время как у AMD есть только один размер чиплета для каждой цели.
Недостатком системы Intel является то, что она сложна и дорога в производстве (что привело к различным проблемам ). Однако обе компании, производящие процессоры, полностью привержены концепции чиплетов. Как только каждая часть производственной цепочки будет спроектирована вокруг нее, затраты должны снизиться.
Что касается графических процессоров, они содержат относительно мало аналоговых схем по сравнению с остальной частью кристалла. Однако объем SRAM внутри неуклонно растет. Эта тенденция побудила AMD использовать свой опыт в области чиплетов в серии Radeon 7000, а графические процессоры Radeon RX 7900 имеют конструкцию с несколькими кристаллами. Эти графические процессоры включают один большой кристалл для ядер и кэша L2, а также пять или шесть меньших кристаллов, каждый из которых содержит часть кэша L3 и контроллер памяти.
Переместив эти компоненты из основного кристалла, инженеры смогли значительно увеличить объем логики, не полагаясь на новейшие, самые дорогие узлы процесса, чтобы сохранить размеры чипов управляемыми. Хотя это нововведение, вероятно, помогло снизить общие затраты, оно не значительно расширило широту графического портфолио AMD.
В настоящее время потребительские графические процессоры Nvidia и Intel не демонстрируют никаких признаков принятия чиплетного подхода AMD. Обе компании полагаются на TSMC для всех производственных задач и, похоже, довольны тем, что производят чрезвычайно большие чипы, перекладывая расходы на потребителей.
Тем не менее, известно, что обе компании активно изучают и внедряют архитектуры на основе чиплетов в некоторые из своих проектов GPU. Например, GPU Blackwell от Nvidia для центров обработки данных используют дизайн чиплетов с двумя большими кристаллами с высокоскоростным соединением, способным передавать данные со скоростью 10 терабайт в секунду, эффективно функционируя как один GPU.
Исполнение "закона Мура" с помощью чиплетов
Независимо от того, когда происходят эти изменения, фундаментальная истина заключается в том, что они должны произойти. Несмотря на колоссальные технологические достижения в производстве полупроводников, существует определенный предел того, насколько каждый компонент может быть уменьшен.
Чтобы продолжить повышение производительности чипа, у инженеров по сути есть два пути — добавить больше логики с необходимой памятью для ее поддержки и увеличить внутреннюю тактовую частоту. Что касается последнего, то средний ЦП не претерпел существенных изменений в этом аспекте за последние годы. Процессор AMD FX-9590 , выпущенный в 2013 году, мог достигать 5 ГГц при определенных рабочих нагрузках, в то время как максимальная тактовая частота в его текущих моделях составляет 5,7 ГГц (с Ryzen 9 9950X).
Самый высокочастотный потребительский процессор Intel — Core i9-14900KS , максимальная частота турбо составляет 6,2 ГГц на двух ядрах. Этот процессор "специального выпуска" удерживает рекорд по самой высокой тактовой частоте "из коробки" среди настольных процессоров.
Однако изменилось количество схем и SRAM. Упомянутый выше AMD FX-9590 имел 8 ядер (и 8 потоков) и 8 МБ кэша L3, тогда как 9950X может похвастаться 16 ядрами, 32 потоками и 64 МБ кэша L3. Процессоры Intel аналогичным образом расширились с точки зрения ядер и SRAM.
Первый унифицированный шейдерный GPU Nvidia, G80 2006 года, состоял из 681 миллиона транзисторов, 128 ядер и 96 КБ кэша L2 в чипе площадью 484 мм2. Перенесемся в 2022 год, когда был выпущен AD102 , и теперь он включает 76,3 миллиарда транзисторов, 18 432 ядра и 98 304 КБ кэша L2 в пределах 608 мм2 площади кристалла.
В 1965 году соучредитель Fairchild Semiconductor Гордон Мур заметил, что в первые годы производства чипов плотность компонентов внутри кристалла удваивалась каждый год при фиксированной минимальной стоимости производства. Это наблюдение стало известно как закон Мура и позже было интерпретировано как "количество транзисторов в чипе удваивается каждые два года", на основе производственных тенденций.
Закон Мура служил достаточно точным представлением прогресса полупроводниковой промышленности на протяжении почти шести десятилетий. Огромный прирост логики и памяти как в центральных, так и в графических процессорах в значительной степени был обусловлен постоянными улучшениями в узлах процесса, при этом компоненты становились все меньше с течением времени. Однако эта тенденция не может продолжаться вечно , независимо от того, какие новые технологии появятся.
Вместо того чтобы ждать, пока будут достигнуты эти физические пределы, такие компании, как AMD и Intel, взяли на вооружение технологию чиплетов, исследуя инновационные способы объединения этих модульных компонентов для поддержки создания все более мощных процессоров.
Через несколько десятков лет среднестатистический ПК, возможно, будет обителью для ЦП и ГП размером с вашу ладонь. Но снимите теплоотвод, и вы увидите множество крошечных чипов — не три или четыре, а десятки, все искусно собранные и упакованные вместе. Господство чиплетов только началось.