Instans Amazon EC2 Inf2 sekarang tersedia di Korea

Dikirim di: 7 Mei 2025

Mulai hari ini, instans Amazon Elastic Compute Cloud (Amazon EC2) Inf2, yang dioptimalkan untuk AI generatif, umumnya tersedia di Wilayah AWS Asia Pasifik (Seoul). Instans Amazon EC2 Inf2 memberikan biaya inferensi hingga 40% lebih rendah dibandingkan instans Amazon EC2 yang sebanding.

Anda dapat menggunakan instans Inf2 untuk menjalankan aplikasi populer seperti peringkasan teks, pembuatan kode, pembuatan video dan gambar, pengenalan ucapan, personalisasi, dan banyak lagi. Instans Inf2 adalah instans pertama yang dioptimalkan inferensi di Amazon EC2 yang memperkenalkan inferensi terdistribusi skala keluar yang didukung oleh NeuronLink, interkoneksi non-pemblokiran berkecepatan tinggi. Instans Inf2 menawarkan hingga 2,3 petaflops dan memori akselerator total hingga 384 GB dengan bandwidth 9,8 TB/dtk.

AWS Neuron SDK terintegrasi secara native dengan kerangka kerja machine learning populer, sehingga Anda dapat terus menggunakan kerangka kerja yang ada untuk diterapkan di Inf2. Pengembang dapat memulai dengan instans Inf2 menggunakan AMI AWS Deep Learning, AWS Deep Learning Containers, atau layanan terkelola seperti Amazon Elastic Container Service (Amazon ECS), Amazon Elastic Kubernetes Service (Amazon EKS), dan Amazon SageMaker.

Instans Inf2 sekarang tersedia dalam empat ukuran: inf2.xlarge, inf2.8xlarge, inf2.24xlarge, inf2.48xlarge di 14 AWS Region sebagai Instans Sesuai Permintaan, Instans Cadangan, dan Instans Spot, atau sebagai bagian dari Paket Penghematan.

Untuk mempelajari lebih lanjut tentang instans Inf2, lihat halaman web Instans Inf2 Amazon EC2 dan Dokumentasi AWS Neuron.