Veröffentlicht am: Jun 30, 2023

Amazon SageMaker Canvas unterstützt jetzt das Dateiformat Apache Parquet und ermöglicht zusätzliche Dateiformate für Tabellen-, Zeitreihenprognosen- und NLP-Datensätze. Amazon SageMaker Canvas ist eine visuelle Point-and-Click-Benutzeroberfläche, mit der Geschäftsanalysten eigenständig genaue ML-Prognosen erstellen können – ohne Erfahrung mit Machine Learning zu haben oder Code schreiben zu müssen.

Ab heute unterstützt Canvas Apache Parquet – ein spaltenorientiertes Open-Source-Datendateiformat, das für das effiziente Speichern und Abrufen von Daten entwickelt wurde. Mit dieser neuen Funktion können Sie Daten im Parquet-Dateiformat zusätzlich zu CSV-Dateien für tabellarische Zeitreihenprognosen und NLP-Anwendungsfälle importieren, was Ihnen mehr Flexibilität bietet. Beim Erstellen eines Datensatzes in Canvas können Sie mehrere Parquet-Dateien von Ihrer lokalen Festplatte oder Ihrem Amazon-S3-Bucket auswählen. Jede Parquet-Datei kann bis zu 5 GB groß sein. Mit effizienten Komprimierungs- und Kodierungsschemata maximieren Parquet-Dateien die Effektivität der Datennutzung in Canvas, um Daten zu importieren, ML-Modelle zu erstellen und Vorhersagen zu generieren.

Unterstützung für Apache Parquet ist in allen AWS-Regionen verfügbar, in denen SageMaker Canvas derzeit unterstützt wird. Weitere Informationen finden Sie in der Produktdokumentation.