Deep Learning dengan PyTorch

Deep learning mudah digunakan dan berperforma tinggi di AWS

PyTorch adalah kerangka kerja sumber terbuka deep learning yang dibuat oleh Facebook yang memudahkan pengembangan model machine learning dan melakukan deployment-nya ke produksi. Menggunakan TorchServe, pustaka penyajian model PyTorch dibangun dan dikelola oleh AWS dalam kemitraan dengan Facebook, developer PyTorch dapat dengan cepat dan mudah melakukan deployment model ke produksi. PyTorch juga menyediakan grafik dan pustaka komputasi dinamis untuk pelatihan terdistribusi, yang disesuaikan untuk performa tinggi di AWS.

Anda dapat memulai dengan PyTorch di AWS menggunakan Amazon SageMaker, layanan machine learning terkelola penuh yang mudah dan hemat biaya untuk membangun, melatih, dan melakukan deployment model PyTorch dalam skala besar. Jika Anda lebih suka mengelola infrastruktur sendiri, Anda dapat menggunakan AWS Deep Learning AMI atau AWS Deep Learning Containers, yang dibangun dari sumber dan dioptimalkan untuk performa dengan versi terbaru PyTorch guna melakukan deployment lingkungan machine learning kustom dengan cepat.

Manfaat

Mudah digunakan

PyTorch di AWS dirancang untuk menggunakan instans Amazon EC2, Elastic Fabric Adapter, dan teknologi penyimpanan, jaringan, serta infrastruktur lainnya. Lakukan deployment model Anda dengan mudah ke produksi menggunakan TorchServe, pustaka penyajian model PyTorch sumber terbuka yang dibangun dan dikelola oleh AWS dalam kemitraan dengan Facebook. Gunakan TorchScript untuk beralih dengan mudah antara mode eager (digunakan untuk pengembangan model berulang) dan mode grafik (digunakan untuk pelatihan yang efisien setelah model dibuat).

Dibangun untuk performa tinggi

Latih model Anda dengan cepat menggunakan backend pelatihan terdistribusi yang memanfaatkan klaster instans GPU yang andal, dan pustaka seperti TorchElastic yang memberikan toleransi kesalahan dan elastisitas agar Anda dapat melakukan iterasi lebih cepat serta membawa model ke pasar lebih cepat.

Ekosistem yang kaya

Ekosistem yang kaya alat dan model, meliputi torchvision, torchaudio, torchtext, torchelastic, torch_xla, perluasan PyTorch dan dukungan pengembangan dalam penglihatan komputer, pemrosesan bahasa alami, ML yang menjaga privasi, interpretabilitas model, dan banyak lagi.

Cara kerjanya

Cara kerjanya - PyTorch di AWS

Kontribusi Sumber Terbuka AWS untuk PyTorch

TorchServe

TorchServe adalah kerangka kerja penyajian model sumber terbuka untuk PyTorch yang memudahkan untuk melakukan deployment model PyTorch terlatih secara performa dalam skala besar tanpa harus menulis kode kustom. TorchServe memberikan penyajian ringan dengan latensi rendah, agar Anda dapat melakukan deployment model untuk inferensi performa tinggi. TorchServe menyediakan handler default untuk penerapan yang paling umum seperti deteksi objek dan klasifikasi teks, jadi Anda tidak perlu menulis kode kustom untuk melakukan deployment model. Dengan fitur TorchServe yang andal, meliputi penyajian multi-model, versioning model untuk pengujian A/B, metrik untuk pemantauan, dan titik akhir RESTful untuk integrasi aplikasi, Anda dapat mengambil model dari penelitian ke produksi dengan cepat. TorchServe mendukung lingkungan machine learning apa pun, yang meliputi Amazon SageMaker, Kubernetes, Amazon EKS, dan Amazon EC2. Untuk memulai dengan TorchServe, lihat dokumentasi dan posting blog kami.

TorchElastic Controller for Kubernetes

TorchElastic adalah pustaka untuk pelatihan model deep learning skala besar yang sangat penting untuk menskalakan sumber daya komputasi secara dinamis berdasarkan ketersediaan. Pelatihan yang elastis dan toleransi kesalahan dengan TorchElastic dapat membantu Anda mengambil model ML ke produksi dengan lebih cepat dan mengadopsi pendekatan canggih untuk eksplorasi model karena arsitektur terus meningkat dalam ukuran dan kompleksitas. TorchElastic Controller for Kubernetes adalah implementasi Kubernetes asli untuk TorchElastic yang secara otomatis mengelola siklus hidup pod dan layanan yang diperlukan untuk pelatihan TorchElastic. TorchElastic Controller for Kubernetes memungkinkan Anda untuk memulai tugas pelatihan dengan porsi dari sumber daya komputasi yang diminta, dan nantinya secara dinamis akan menskalakan saat lebih banyak sumber daya yang tersedia, tanpa harus menghentikan dan memulai kembali tugas tersebut. Selain itu, tugas dapat pulih dari simpul yang diganti karena kegagalan simpul atau reklamasi. Dengan TorchElastic Controller for Kubernetes, Anda dapat mengurangi waktu dan biaya pelatihan terdistribusi dengan membatasi sumber daya klaster yang tidak aktif dan pelatihan di Instans Spot Amazon EC2. Untuk memulai dengan TorchElastic Controller di klaster Kubernetes Anda, lihat tutorial.

Testimoni Pelanggan

Toyota Research Institute (TRI)

Toyota Research Institute Advanced Development, Inc. (TRI-AD) menerapkan kecerdasan buatan untuk membantu Toyota memproduksi mobil masa depan yang lebih aman, mudah diakses, dan ramah lingkungan. Menggunakan PyTorch pada instans P3 Amazon EC2, TRI-AD mengurangi waktu pelatihan model ML dari hitungan hari menjadi jam. “Kami terus mengoptimalkan dan meningkatkan model penglihatan komputer kami, yang sangat penting bagi misi TRI-AD untuk mencapai mobilitas yang aman bagi semua orang dengan mengemudi secara otonom. Model kami dilatih dengan PyTorch di AWS, tetapi sampai sekarang PyTorch tidak memiliki kerangka kerja penyajian model. Akibatnya, kami menghabiskan upaya rekayasa yang signifikan dalam membuat dan memelihara perangkat lunak untuk melakukan deployment model PyTorch ke armada kendaraan dan server cloud kami. Dengan TorchServe, kami sekarang memiliki server model yang berperforma dan ringan yang secara resmi didukung serta dikelola oleh AWS dan komunitas PyTorch,” Yusuke Yachide, Lead ML Tools di TRI-AD.

Matroid

Matroid, pembuat perangkat lunak penglihatan komputer yang mendeteksi objek dan peristiwa dalam rekaman video, mengembangkan sejumlah model machine learning yang berkembang pesat menggunakan PyTorch di AWS dan lingkungan on-premise. Model di-deploy menggunakan server model kustom yang memerlukan pengonversian model ke format yang berbeda, yang memakan waktu dan memberatkan. TorchServe memungkinkan Matroid untuk menyederhanakan deployment model menggunakan file tunggal yang dapat diservis yang juga berfungsi sebagai sumber kebenaran tunggal, serta mudah untuk dibagikan dan dikelola.

Pinterest

Pinterest memiliki 3 miliar gambar dan 18 miliar asosiasi yang menghubungkan gambar tersebut. Perusahaan telah mengembangkan model deep learning PyTorch untuk mengontekstualisasikan gambar ini dan memberikan pengalaman pengguna yang dipersonalisasi. Pinterest menggunakan instans P3 Amazon EC2 untuk mempercepat pelatihan model dan memberikan inferensi latensi rendah untuk pengalaman pengguna yang interaktif. Baca lebih lanjut.

Blog dan artikel

Blog: Menyajikan Model PyTorch dalam Produksi dengan Integrasi TorchServe Asli Amazon SageMaker
Agustus 2020
oleh Todd Escalona

Blog: Menjalankan TorchServe di Amazon Elastic Kubernetes Service
Agustus 2020
oleh Josiah Davis, Charles Frenzel, dan Chen Wu

April 2020
oleh Shashank Prasanna dan Manoj Rao

Blog: Cinnamon AI menghemat 70% biaya pelatihan model ML dengan Pelatihan Spot Terkelola Amazon SageMaker
Januari 2020
oleh Sundar Ranganathan dan Yoshitaka Haribara

Artikel: Dengan deep learning, Disney menyortir milyaran konten
Desember 2019
The Wired

Standard Product Icons (Features) Squid Ink
Pelajari cara memulai dengan PyTorch di AWS

Kunjungi halaman memulai.

Pelajari selengkapnya 
Sign up for a free account
Daftar untuk akun gratis

Dapatkan akses secara instan ke AWS Tingkat Gratis. 

Daftar 
Standard Product Icons (Start Building) Squid Ink
Mulai membangun di konsol

Mulai membangun di Konsol Manajemen AWS.

Masuk