Недостаток дизайна графического процессора NVIDIA Blackwell, повлекший за собой задержку поставки чипов ИИ, был исправлен. Усовершенствованные B100 / B200 вот-вот поступят в массовое производство.
Генеральный директор Дженсен Хуанг признал, что недостаток был полностью вызван NVIDIA, отрицал вину TSMC, о которой ходили слухи, и подчеркнул, что тайваньский производитель помог исправить ее вовремя.
«У нас был недостаток дизайна Blackwell, он был функциональным, но недостаток дизайна привел к низкому выходу. Это была 100% вина NVIDIA» это 100% вина NVIDIA.
Когда появились первые сообщения о недостатке дизайна, некоторые СМИ сообщили, что виновата TSMC, и предположили, что это может вызвать напряжение между NVIDIA и ее партнером. По словам Хуанга, это не так, и проблема возникла из-за собственных просчетов NVIDIA. Он отверг сообщения о напряженности между двумя компаниями как «фейковые новости».
«Для того, чтобы компьютер Blackwell работал, семь различных типов чипов были разработаны с нуля, и их нужно было одновременно запустить в производство.
….
То, что TSMC сделала, это помогла нам исправить эту проблему с выходом [рабочих чипов] и возобновить производство Blackwell невероятными темпами».
Графические процессорыNVIDIA Blackwell B100 и B200 соединяют два чиплета с помощью технологии упаковки CoWoS-L от TSMC, которая опирается на интерпозер RDL с локальными кремниевыми мостами (LSI). Размещение этих мостов является критическим. Однако предполагаемое несоответствие в свойствах теплового расширения между чиплетами GPU, мостами LSI, промежуточным блоком RDL и подложкой вызвало деформацию системы и сбой. NVIDIA была вынуждена модифицировать верхние металлические слои и неровности кремния GPU, чтобы улучшить производительность.
Для решения таких проблем обычно требуется около 10 степпингов, каждый занимает около трех месяцев. Поэтому поражает скорость, с которой NVIDIA и TSMC исправили GPU Blackwell. Исправленные графические процессоры Blackwell для искусственного интеллекта и суперкомпьютеров поступят в массовое производство в конце октября, а поставки должны начаться в начале следующего года.
Однако еще в начале этого года NVIDIA предупредила, что для удовлетворения спроса на ее графические процессоры Blackwell среди основных поставщиков облачных услуг, таких как AWS, Google и Microsoft, все равно приведет к поставке какого-то количества начальных низкопроизводительных процессоров в 2024 году.
Источники: Reuters, Tom’s Hardware