Управляемые инстансы Amazon ECS теперь поддерживают AWS Trainium и AWS Inferentia
Управляемые инстансы Amazon Elastic Container Service (Amazon ECS) теперь поддерживают AWS Trainium и AWS Inferentia – специализированные ускорители ИИ, разработанные для обеспечения масштабируемой производительности и экономичности обучения и вывода в широком спектре рабочих нагрузок генеративного искусственного интеллекта. Управляемые инстансы Amazon ECS – это полностью управляемый вычислительный ресурс, который упрощает контроль над инфраструктурой и предоставляет доступ ко всему спектру возможностей Amazon EC2. Перекладывая задачи по эксплуатации инфраструктуры на AWS, управляемые инстансы ECS помогают быстро запускать и масштабировать рабочие нагрузки с одновременным повышением производительности и снижением совокупной стоимости владения.
Используя управляемые инстансы ECS, вы получаете требуемую производительность приложений и простоту. Теперь вы можете создать поставщик ресурсов для управляемых инстансов ECS и выбрать нужные типы инстансов с ускорением, включая Inferentia2, Trainium1 и Trainium2, а затем добавить конфигурацию NEURON_CORE=all в раздел ResourceRequirement определения задачи. Таким образом вы предписываете Amazon ECS запустить указанные инстансы и выполнить по одной задаче на каждый инстанс с автоматическим распределением всех ресурсов ускорителя по рабочей нагрузке для достижения оптимальной производительности.
Чтобы начать работу с управляемыми инстансами ECS, используйте Консоль AWS, сервер MCP Amazon ECS или свой любимый инструмент «инфраструктура как код» для их включения в новый или существующий кластер Amazon ECS. В дополнение к обычным расходам на Amazon EC2 с вас будет взиматься плата за управление выделенными вычислительными ресурсами. Подробную информацию об управляемых инстансах ECS см. на странице функций, в документации и статье о запуске в блоге AWS News.