Publié le: Jun 30, 2023

Amazon SageMaker Canvas prend désormais en charge le format de fichier Apache Parquet, ce qui permet d'ajouter des formats de fichier supplémentaires pour les jeux de données tabulaires, de prévisions chronologiques et de NLP. SageMaker Canvas est une interface visuelle qui permet aux analystes métier de générer seuls des prédictions de ML précises, sans avoir besoin d'expérience dans le machine learning (ML) ou d'écrire la moindre ligne de code.

À compter d'aujourd'hui, Canvas prend en charge Apache Parquet, un format de fichier de données open source en colonne conçu pour un stockage et une récupération efficaces des données. Grâce à cette nouvelle fonctionnalité, vous pouvez importer des données au format Parquet en plus de fichiers CSV pour des cas d'utilisation tabulaires, de prévisions chronologiques et de NLP, ce qui vous offre une plus grande flexibilité. Lorsque vous créez un jeu de données dans Canvas, vous pouvez sélectionner plusieurs fichiers Parquet depuis votre disque local ou votre compartiment Amazon S3. Chaque fichier Parquet peut avoir une taille maximale de 5 Go. Grâce à des schémas de compression et de codage efficaces, les fichiers Parquet optimisent l'efficacité de l'utilisation des données dans Canvas pour importer des données, créer des modèles de machine learning et générer des prédictions.

La prise en charge d’Apache Parquet est disponible dans toutes les régions AWS où SageMaker Canvas est actuellement pris en charge. Pour en savoir plus, consultez la documentation relative au produit.