AWS приглашает заказывать кластеры с ускорителями NVIDIA H100

Новости о мире нейросетей и ИИ

Облачный провайдер Amazon Web Services (AWS) объявил о запуске новой модели потребления EC2 Capacity Blocks for ML, разработанной для предприятий, желающих заказать доступ к вычислительным ускорителям для обработки краткосрочных рабочих нагрузок искусственного интеллекта.

Решение Amazon EC2 Capacity Blocks for ML позволяет клиентам заказывать доступ к сотням ускорителей NVIDIA H100 в кластерах EC2 UltraClusters, предназначенных для высокопроизводительных рабочих нагрузок машинного обучения. Клиенты просто указывают желаемый размер кластера и даты начала и окончания доступа. Это увеличивает предсказуемость доступности ресурсов для искусственного интеллекта и устраняет необходимость платить за доступ к ресурсам, когда они не используются. AWS также выигрывает, так как этот подход позволяет более эффективно использовать имеющиеся ресурсы.

EC2 Capacity Blocks предлагает кластеры от 1 до 64 экземпляров EC2 P5 с соединением Elastic Fabric Adapter (EFA) второго поколения. Кластеры можно заказать на период от 1 до 14 дней, но не позднее чем за восемь недель вперед. Это делает их идеальными для обучения и настройки моделей искусственного интеллекта, краткосрочных экспериментов или обработки пиковых объемов спроса, например, при запуске нового продукта, как отмечает аналитик Constellation Research Inc. Хольгер Мюллер.

Покупатели могут использовать консоль AWS, CLI или SDK для поиска и заказа доступных кластеров. С EC2 Capacity Blocks клиенты платят только за заказанное время. Решение доступно в регионе AWS US East (Ohio), и планируется расширение доступности в других регионах AWS в будущем.