В плане по 2025 год Nvidia пообещала перейти на ежегодный цикл выпуска ускорителей ИИ

В плане по 2025 год Nvidia пообещала перейти на ежегодный цикл выпуска ускорителей ИИ
План развития на 2023–2025 года́

В начале этого месяца в презентации для инвесторов компания Nvidia рассказала о планах развития устройств для дата-центров. За последний год производитель игровых видеокарт заработал подавляющую долю рынка ускорителей искусственного интеллекта. Дорожная карта по 2025 год указывает, что Nvidia пытается сохранить свой уверенный отрыв от конкурентов.

В последние месяцы наблюдается всплеск внимания к больши́м языковым моделям для текста и диффузионным моделям для генерации изображений. Многим таким инструментам меньше года. При этом в опросе McKinsey треть респондентов отвечает, что в их организациях уже пользуются генеративным ИИ.

Для инференса и, особенно, обучения нейросетей нужно специализированное аппаратное обеспечение. Чтобы обучить модели с миллиардами параметров, нужны видеокарты, если точнее — специализированные ускорители с больши́м объёмом памяти и широкой шиной данных для объединения в мощный вычислительный кластер. Лидирует в этой отрасли Nvidia, из-за чего стоимость производителя игровых видеокарт за год утроилась. Несколько компаний закупили десятки тысяч ускорителей A100 и H100 производства Nvidia, инвентарь игроков помельче и небольших исследовательских команд исчисляется сотнями и тысячами единиц. При этом стоимость каждого из таких устройств достигает $30 тыс. (флагманская модель H100 с 80 ГиБ памяти HBM3).

Лидер отрасли занимает доминирующую позицию. Как утверждает аналитика, в этом году больше $1 млрд на поставках оборудования для искусственного интеллекта получит только Nvidia. Чипы именно этой компании упоминают 19 из 20 исследовательских работ сферы ИИ.

Впрочем, конкуренты не дремлют и уже этой весной начали сокращать отставание. Никуда не делась AMD и её попытки продвигать ускорители MI300, Google добавила в портфолио TPU v5 и v5e для собственных нужд и для аренды сторонним партнёрам, Meta представила устройства MTIA, утечки говорят про ускоритель Athena у Microsoft, второе поколение Gaudi выпустила Intel. Некоторые из грядущих соперников (в частности, семейство MI300 от AMD и Gaudi 3 от Intel) превосходят ставшие стандартом в индустрии ИИ ускорители H100 компании Nvidia. Разрыв же в программном обеспечении играет уже не такую сильную роль.

В начале октября в презентации Nvidia успокоила инвесторов планами по дальнейшему развитию. Как правило, объявления такого калибра остаются на GPU Technology Conference. В этот раз информацию впервые раскрыли в нескольких слайдах [дорожная карта из презентации размещена до ката].

Обычно новые архитектуры у Nvidia выходили раз в два года. К примеру, так выглядели планы 2021 и 2022 годов:

В плане по 2025 год Nvidia пообещала перейти на ежегодный цикл выпуска ускорителей ИИ
Презентация GTC 2021, апрель 2021 года. Next Platform

В плане по 2025 год Nvidia пообещала перейти на ежегодный цикл выпуска ускорителей ИИ
Выставка Computex, май 2022 года. Next Platform

Со следующего года Nvidia хочет перейти на практику ежегодных обновлений модельного ряда. В 2024 году ускоритель H200 заменит своего предшественника H100, хотя архитектура останется той же — Hopper. Также в следующем году выйдет ускоритель B100, где B — указание на архитектуру Blackwell. Издание Next Platform связывает подобную торопливость с желанием отвлечь внимание от устройств MI300X компании AMD, выход которых ожидается в декабре.

Заметное нововведение: разные ускорители для платформ c процессорами x86 и отдельные суперчипы с ядрами Arm на борту. Как рассказывает издание CRN, во время закрытых обсуждений с инвесторами Nvidia раскрыла планы развить идею Grace Hopper Superchip, то есть продолжать создавать комбинацию ядер процессора и видеоускорителя на одной плате. Эти устройства на схеме обозначены суффиксом NVL. В 2024 запланированы GH200NVL и GB200NVL на основе, соответственно, H200 и B100.

В марте этого года Nvidia уже представила устройство с NVL в названии (H100 NVL), но это была просто спаренная четырёхслотовая карта для двух портов PCIe 5.0. Суперчип же содержит ядра центрального процессора и видеоускоритель, он специально создан для обработки больших моделей ИИ. Один Grace Hopper Superchip может объединяться с другими экземплярами, с которыми он общается по шине NVLink.

Вероятно, что фокус на суперчипах — реакция на представленный в июне AMD Instinct MI300A, гибридный ускоритель с 24 встроенными ядрами Zen 4 (x86). Очевидно, что просто спаренные карты H100 NVL — ответ так себе, считает Next Platform.

В плане по 2025 год Nvidia пообещала перейти на ежегодный цикл выпуска ускорителей ИИ
Grace Hopper Superchip. Nvidia

Хотя даже сама Nvidia обещала выпустить карту L40S на архитектуре Ada Lovelace этой осенью, в плане ускоритель почему-то вынесен на следующий год. Если судить по названию B40 — замена для L40S — в 2024 году планируется также на архитектуре Blackwell.

План обрывается 2025 годом и выходом ускорителя под, возможно, вре́менным именем GX200. Для модели также готовится вариант GX200NVL. Кстати, именно в 2025 году Samsung ожидает появление памяти HBM4. Скорость Infiniband и Ethernet в устройствах Nvidia обещают удваивать ежегодно: с 400 Гбит/с до 800 Гбит/с в 2024, а затем до 1600 Гбит/с в 2025 году.

Слайдов с планами развития NVSwitch и NVLink почему-то нет. Блоки обработки данных BlueField или хоть какие-либо игровые устройства также не упоминаются. Издание Tom's Hardware считает, что обновление четырёхтысячной серии GeForce выйдет не скоро, где-нибудь в 2025 году. Пока что искусственный интеллект приносит компании слишком много денег, чтобы волноваться о геймерах.

Источник: habr.com