Amazon EC2 P3-Instances

Beschleunigen Sie Machine-Learning- und High-Performance-Computing-Anwendungen mit leistungsstarken GPUs

Führende Unternehmen wie Airbnb, Salesforce und Western Digital nutzen Amazon EC2 P3-Instances zur Unterstützung ihrer Machine-Learning- und High-Performance-Computing-Anwendungen.
Amazon EC2 P3-Instances bieten die höchste Rechenleistung in der Cloud, sind kostengünstig, unterstützen alle wichtigen Machine-Learning-Frameworks und sind global verfügbar.
Mit bis zu acht NVIDIA Tesla V100-GPUs der neuesten Generation bieten Amazon EC2 P3-Instances bis zu 1 Petaflop Mixed-Precision-Leistung pro Instance und beschleunigen Machine-Learning- und High-Performance-Computing-Anwendungen so in erheblichem Maße. Amazon EC2 P3-Instances haben bewiesen, dass sie nicht nur die Machine-Learning-Trainingszeiten von Tagen auf Minuten, sondern auch die Zeit bis zur Ausgabe von Ergebnissen beim High Performance Computing reduzieren.

ReInvent_HA_P3_EDITORIAL
88 % der TensorFlow-Projekte in der Cloud werden in AWS ausgeführt.
In diesem Bericht zeigt Nucleus Research fünf Gründe auf, warum Deep-Learning-Nutzer AWS für Deep Learning im Vergleich zu anderen Cloud-Anbietern wählen.

VIDEO: Erfahren Sie mehr über Amazon EC2 P3-Instances und sehen Sie sich an, wie Airbnb damit seine Machine-Learning-Anwendungen unterstützt (48:08 min).
AWS re:Invent 2017: Einführung in Amazon EC2 P3-Instances

Vorteile

VERKÜRZUNG DER MACHINE-LEARNING-TRAININGSZEIT VON TAGEN AUF MINUTEN

Für Datenwissenschaftler, Forscher und Entwickler, die ML-Anwendungen beschleunigen müssen, sind Amazon EC2 P3-Instances die leistungsstärksten GPUs, die in der Cloud verfügbar sind. Amazon EC2 P3-Instances besitzen bis zu acht NVIDIA Tesla V100-GPUs der neuesten Generation, die bis zu 1 Petaflop Mixed-Precision-Leistung bieten und ML-Workloads erheblich beschleunigen. Ein schnelleres Modelltraining ermöglicht Datenwissenschaftlern und Machine-Learning-Ingenieuren schnellere Iterationen, Training von mehr Modellen und höhere Genauigkeit.

 

KOSTENGÜNSTIGSTE LÖSUNG DER BRANCHE

Amazon EC2 P3-Instances bieten verschiedene Preismodelle, damit Sie abhängig von Ihren Anforderungen in den Genuss von Kosteneinsparungen kommen. Zusätzlich zu On-Demand-Instances, bei denen Sie für die von Ihnen gestarteten Instances bezahlen, können Sie Reserved Instances (Instances, die immer verfügbar sind) für einen Zeitraum von einem bis drei Jahren zu einem deutlich ermäßigten Preis kaufen. Zudem können Sie Spot-Instances verwenden, die nicht genutzte EC2-Instances einsetzen, wodurch sich Ihre Amazon EC2-Kosten erheblich senken lassen.

FLEXIBLES, LEISTUNGSSTARKES HIGH PERFORMANCE COMPUTING

Anders als interne Systeme, bietet High Performance Computing auf Amazon EC2 P3-Instances nicht nur praktisch unbegrenzte Kapazität zum Skalieren Ihrer Infrastruktur, sondern auch die entsprechende Flexibilität, um Ressourcen problemlos und so oft zu ändern, wie Ihr Workload dies erfordert. Sie können Ihre Ressourcen so konfigurieren, dass Sie die Anforderungen Ihrer Anwendung erfüllen, und ein HPC-Cluster innerhalb von Minuten starten, wobei Sie nur für das bezahlen, was Sie nutzen.

INTEGRATION IN AWS MACHINE LEARNING-SERVICES

Amazon EC2 P3-Instances arbeiten optimal mit Amazon SageMaker zusammen und bieten so eine leistungsstarke und intuitive, umfassende Machine-Learning-Plattform. Amazon SageMaker ist eine komplett verwaltete Machine-Learning-Plattform, mit der Sie Machine-Learning-Modelle schnell und problemlos erstellen, trainieren und bereitstellen können. Zudem lassen sich Amazon EC2 P3-Instances in AWS Deep Learning Amazon Machine Images (AMIs) integrieren, die in gängigen Deep-Learning-Frameworks vorinstalliert sind, um Training und Rückschlüsse zu erleichtern.

UNTERSTÜTZUNG ALLER WICHTIGEN MACHINE-LEARNING-FRAMEWORKS

Amazon EC2 P3-Instances unterstützen alle wichtigen Machine-Learning-Frameworks, darunter TensorFlow, PyTorch, Apache MXNet, Caffe, Caffe2, Microsoft Cognitive Toolkit (CNTK), Chainer, Theano, Keras, Gluon und Torch. Benutzer können das Framework wählen, das sich für ihre Anwendung am besten eignet.

Skalierbares Machine-Learning-Training mit mehreren Knoten

Kunden können mehrere EC2 P3-Instances nutzen, um Machine-Learning-Modelle schnell zu trainieren. Ein Speicher-Cluster und ein Rechen-Cluster können konfiguriert werden, sodass das Speicher-Cluster die Trainings- und Validierungsdatensätze speichert und für die Übertragung von Daten an das Rechen-Cluster zuständig ist, während das Rechen-Cluster Vorwärtsrechnung, Rückwärtspropagierungen und Gewichtungsaktualisierungen durchführt.

Kundenerfahrungen

200x100_AirBNB_Logo

Airbnb setzt Machine Learning ein, um Suchempfehlungen zu optimieren und die dynamische Preisgestaltung für die Gastgeber zu verbessern, was zu mehr Buchungen führt. Mit Amazon EC2 P3-Instances hat Airbnb die Möglichkeit, Trainings-Workloads schneller auszuführen, mehr zu iterieren, bessere Modelle für das Machine Learning zu entwickeln und die Kosten zu senken.

salesforce_logo_200x100

Salesforce nutzt Machine Learning für Einstein Vision und ermöglicht Entwicklern damit, die Leistung der Bilderkennung für Anwendungsfälle wie visuelle Suche, Markenerkennung und Produktidentifizierung zu nutzen. Amazon EC2 P3-Instances ermöglichen es Entwicklern, Deep-Learning-Modelle schneller zu trainieren, sodass sie ihre Machine-Learning-Ziele schnell erreichen.

western-digital_200x100

Western Digital nutzt High Performance Computing (HPC) zur Durchführung zehntausender Simulationen für Materialwissenschaften, Wärmeströme, Magnetik und Datenübertragung, um die Leistung und Qualität von Festplatten- und Speicherlösungen zu verbessern. Durch frühzeitige Tests bieten Amazon EC2 P3-Instances Entwicklungsteams die Möglichkeit, Simulationen mindestens drei Mal schneller als mit älteren Lösungen durchzuführen.  

schrodinger-200x100

Schrödinger nutzt High Performance Computing (HPC) zur Entwicklung von Vorhersagemodellen, um den Erkenntnis- und Optimierungsumfang zu erweitern und Kunden die Möglichkeit zu geben, lebensrettende Arzneimittel schneller auf den Markt zu bringen. Mit Amazon EC2 P3-Instances kann Schrodinger vier Mal so viele Simulationen an einem Tag durchführen wie mit P2-Instances.  

Amazon EC2 P3-Instances und Amazon SageMaker

Die schnellste Art, Machine-Learning-Modelle zu trainieren und auszuführen

Amazon SageMaker ist ein komplett verwalteter Service zum Erstellen, Trainieren und Bereitstellen von Machine-Learning-Modellen. In Verbindung mit Amazon EC2 P3-Instances können Kunden problemlos auf dutzende, hunderte oder tausende von GPUs skalieren, um ein Modell schnell in einem beliebigen Umfang zu trainieren, ohne sich Gedanken über die Einrichtung von Clustern und Data Pipelines machen zu müssen. Sie können auch auf Ressourcen von Amazon Virtual Private Cloud (VPC) zugreifen, um Workflows in Amazon SageMaker zu schulen und zu hosten. Mit dieser Funktion können Sie Amazon Simple Storage Service-(S3)-Buckets verwenden, auf die nur über Ihre VPC zugegriffen werden kann, um Schulungsdaten zu speichern und die aus dem Schulungsprozess abgeleiteten Modellartefakte zu speichern und zu hosten. Zusätzlich zu S3 können Modelle auf alle anderen in der VPC enthaltenen AWS-Ressourcen zugreifen. Weitere Informationen.

Entwicklung

Mit Amazon SageMaker ist es ganz einfach, Machine-Learning-Modelle zu erstellen und für das Training vorzubereiten, weil es alles bietet, was Sie benötigen, um eine schnelle Verbindung zu Ihren Trainingsdaten einzurichten und den besten Algorithmus und das beste Framework für Ihre Anwendung auszuwählen und zu optimieren. Amazon SageMaker beinhaltet gehostete Jupyter-Notebooks, mit denen Sie Ihre in Amazon S3 gespeicherten Trainingsdaten einfach sondieren und visualisieren können. Sie können außerdem die Notebook-Instance zum Schreiben von Code verwenden, um Modell-Training-Jobs zu erstellen, Modelle auf Amazon SageMaker-Hosting bereitzustellen und Ihre Modelle zu testen oder zu validieren.

Trainieren

Sie können mit einem einzigen Klick in der Konsole oder mit einem einfachen API-Aufruf damit beginnen, Ihr Modell zu trainieren. Zur Leistungsoptimierung mit NVIDIA-GPUs sind in Amazon SageMaker die aktuellen Versionen von TensorFlow und Apache MXNet sowie Unterstützung für CUDA9-Bibliotheken vorkonfiguriert. Außerdem kann Ihr Modell mit Hyperparameter-Optimierung durch eine intelligente Abstimmung verschiedener Kombinationen von Modellparametern automatisch angepasst werden, um möglichst genaue Vorhersagen zu erhalten. Bei umfangreicheren Anforderungen können Sie dutzende von Instances nutzen, um eine schnellere Modellerstellung zu unterstützen.

Bereitstellen

Nach dem Training können Sie Ihr Modell mit einem Klick in verschiedenen Availability Zones auf sich automatisch skalierenden EC2-Instances bereitstellen. In der Produktion übernimmt Amazon SageMaker die Verwaltung der Datenverarbeitungsinfrastruktur (Zustandsprüfungen durchführen, Sicherheitspatches einspielen und andere routinemäßige Wartungsaufgaben). Dabei sind die Überwachungs- und Protokollierungsfunktionen von Amazon CloudWatch integriert.

 

Amazon EC2 P3-Instances und AWS Deep Learning-AMIs

Vorkonfigurierte Entwicklungsumgebungen, um schnell mit dem Erstellen von Deep-Learning-Anwendungen beginnen zu können

Eine Alternative zu Amazon SageMaker für Entwickler mit einem größeren Anpassungsbedarf sind AWS Deep Learning-AMIs, die Machine-Learning-Nutzern und -Forschern die Infrastruktur und Tools bereitstellen, mit denen sich Deep Learning in der Cloud beliebig beschleunigen lässt. Sie können schnell Amazon EC2 P3-Instances mit vorinstallierten, gängigen DL-Frameworks wie TensorFlow, PyTorch, Apache MXNet, Microsoft Cognitive Toolkit, Caffe, Caffe2, Theano, Torch, Chainer, Gluon und Keras starten, um komplexe, individuelle KI-Modelle zu trainieren, mit neuen Algorithmen zu experimentieren oder neue Fähigkeiten und Techniken zu lernen. Weitere Informationen.

Amazon EC2 P3-Instances und High Performance Computing

Lösen Sie umfangreiche Rechenprobleme, und erhalten Sie neue Einblicke mit der Leistung von HPC auf AWS

Amazon EC2 P3-Instances sind die ideale Plattform für technische Simulationen, Computational Finance, seismische Analysen, molekulare Modellierung, Genomik, Rendering und andere GPU-Rechen-Workloads. High Performance Computing (HPC) ermöglicht Wissenschaftlern und Technikern das Lösen dieser komplexen, rechenintensiven Probleme. HPC-Anwendungen benötigen häufig eine hohe Netzwerkleistung, schnelle Speicherung, viel Arbeitsspeicher, sehr hohe Datenverarbeitungskapazitäten oder alles gleichzeitig. AWS ermöglicht Ihnen die Beschleunigung der Forschung und die Verkürzung der Ergebniszeit durch Ausführung von HPC in der Cloud und Skalieren auf eine größere Anzahl paralleler Aufgaben als in den meisten lokalen Umgebungen sinnvoll wäre. AWS reduziert die Kosten durch Bereitstellung von Lösungen, die für bestimmte Anwendungen optimiert sind, ohne dass große Kapitalinvestitionen erforderlich sind. Weitere Informationen.

Amazon EC2 P3-Instance – Produktdetails

Instance-Größe GPUs – Tesla V100 GPU-Peer-to-Peer GPU-Speicher (GB) vCPUs Speicher (GB) Netzwerkbandbreite EBS-Bandbreite On-Demand-Preis/Std.* 1 Jahr lang Reserved Instance pro Stunde* 3 Jahre lang Reserved Instance pro Stunde*
p3.2xlarge 1 16 8 61 Bis zu 10 GBit/s 1,5 GBit/s

3,06 USD

1,99 USD

1,23 USD

p3.8xlarge 4 NVLink 64 32 244 10 GBit/s 7 GBit/s

12,24 USD

7,96 USD

4,93 USD

p3.16xlarge 8 NVLink 128 64 488 25 GBit/s 14 GBit/s

24,48 USD

15,91 USD

9,87 USD

*Die angegebenen Preise gelten für Linux/Unix in der AWS-Region US Ost (Nord-Virginia). Vollständige Preisdetails finden Sie auf der Seite der Amazon EC2-Preise

P3-Instances sind verfügbar in den Regionen AWS USA Ost (Nord-Virginia), USA Ost (Ohio), USA West (Oregon), EU (Irland), Asien-Pazifik (Seoul), Asien-Pazifik (Tokio), AWS GovCloud (USA) und China (Peking). Kunden können P3-Instances als On-Demand-Instances, Reserved Instances, Spot Instances und Dedicated Hosts erwerben.

SEKUNDENGENAUE ABRECHNUNG

Einer der vielen Vorteile des Cloud Computings besteht in der Elastizität der bedarfsabhängigen Bereitstellung und Rückgabe von Ressourcen. Durch eine sekundengenaue Abrechnung können Kunden zum Erreichen ihrer Machine-Learning-Ziele ihre Elastizität angleichen, Geld sparen und ihre Ressourcenzuweisung optimieren.

RESERVED INSTANCE – PREISE

Reserved Instances bieten im Vergleich zu den Preisen von On-Demand-Instances einen beachtlichen Rabatt (bis zu 75 %). Wenn Reserved Instances einer bestimmten Availability Zone zugewiesen werden, stellen sie außerdem eine Kapazitätsreservierung bereit, sodass Sie Instances bei Bedarf problem- und bedenkenlos starten können.

SPOT-PREISE

Für die Dauer der Ausführung der Instances zahlen Sie bei Spot-Instances den bei der Anforderung angegebenen Stundensatz. Die Spot-Instance-Preise werden von Amazon EC2 festgelegt und ändern sich schrittweise entsprechend der langfristigen Trends beim Angebot von und der Nachfrage nach Spot-Instance-Kapazitäten. Spot-Instances sind mit einem Rabatt von bis zu 90 % im Vergleich zum On-Demand-Preis verfügbar.

Umfassendste globale Verfügbarkeit

1856-Updated Map Image-P3 Instances-transparentBG_1024x543

Amazon EC2 P3-Instances sind in 8 AWS-Regionen in 18 Availability Zones (AZs) verfügbar, sodass Kunden ihre Modelle überall dort trainieren und bereitstellen können, wo ihre Daten gespeichert sind. EC2 P3 sind in den folgenden Regionen verfügbar: USA Ost (Nord-Virginia), USA West (Oregon), USA Ost (Ohio), EU West (Irland), Asien-Pazifik (Tokio), Asien-Pazifik (Peking), Asien-Pazifik (Seoul) und GovCloud (US).

Erste Schritte mit Amazon EC2 P3-Instances beim Machine Learning

Beginnen Sie innerhalb von Minuten und erfahren Sie mehr über Amazon SageMaker oder verwenden Sie das AWS Deep Learning AMI, das auf gängigen Deep-Learning-Frameworks wie Caffe2 und Mxnet vorinstalliert ist. Sie können alternativ auch das NVIDIA-AMI mit vorinstalliertem GPU-Treiber und CUDA-Toolkit verwenden.

Weitere Informationen über Amazon SageMaker

Klicken Sie hier, um weitere Informationen anzuzeigen

Weitere Informationen zu Deep Learning auf AWS

Klicken Sie hier, um weitere Informationen anzuzeigen

Weitere Informationen über High Performance Computing (HPC)

Klicken Sie hier, um weitere Informationen anzuzeigen
Sind Sie startbereit?
Registrieren
Haben Sie Fragen?
Kontakt