Publicado: Jun 30, 2023
O Amazon SageMaker Canvas agora oferece suporte ao formato de arquivo do Apache Parquet, permitindo formatos de arquivo adicionais para conjuntos de dados tabulares, de previsão de séries temporais e de PNL. O SageMaker Canvas é uma interface visual que permite que os analistas de negócios gerem suas próprias previsões precisas de ML, sem precisar ter experiência de machine learning e sem ter que escrever nenhuma linha de código.
A partir de hoje, o Canvas oferece suporte ao Apache Parquet, um formato de arquivo de dados de código aberto orientado por colunas, projetado para armazenamento de dados e recuperação eficientes. Com esse novo recurso, você pode importar dados usando o formato de arquivo Parquet, além de arquivos CSV para casos de uso tabulares, de previsão de séries temporais e de PNL, oferecendo maior flexibilidade. Ao criar um conjunto de dados no Canvas, você pode escolher vários arquivos do Parquet do seu disco local ou do seu bucket do Amazon S3. Cada arquivo do Parquet pode ter até 5 GB de tamanho. Com esquemas eficientes de compactação e codificação, os arquivos do Parquet maximizam a eficácia do uso de dados no Canvas para importar dados, criar modelos de ML e gerar previsões.
O suporte para o Apache Parquet está disponível em todas as regiões da AWS nas quais o SageMaker Canvas é oferecido atualmente. Para saber mais, consulte a documentação do produto.