Publicado: Aug 21, 2023
O Amazon SageMaker Data Wrangler agora oferece suporte a pontos de acesso S3 para visualizar e importar dados para o SageMaker Data Wrangler e como destino para dados exportados do SageMaker Data Wrangler. A preparação de dados de alta qualidade para ML geralmente é complexa e demorada, pois requer a agregação de dados em várias fontes e formatos usando ferramentas diferentes. Com o SageMaker Data Wrangler, você pode explorar e importar dados de várias fontes populares, como Amazon S3, Amazon Athena, Amazon Redshift, Snowflake, Databricks e mais de 40 fontes de dados do SaaS. Cada vez mais, os clientes usam o Amazon S3 para armazenar conjuntos de dados compartilhados, onde os dados são agregados e acessados por diferentes aplicações, equipes e indivíduos. Os pontos de acesso S3 permitem que as organizações concedam controle de acesso refinado em um nível granular. Em vez de modificar uma única política de bucket, as organizações podem criar vários pontos de acesso com políticas individuais adaptadas a casos de uso específicos, reduzindo o risco de configuração incorreta ou acesso não intencional a dados confidenciais. A partir de hoje, o SageMaker Data Wrangler está facilitando para os clientes a preparação de dados de conjuntos de dados compartilhados armazenados no S3, permitindo que as organizações controlem com segurança o acesso aos dados em sua organização.
Depois que os dados são importados, você pode entender rapidamente a qualidade dos dados, limpá-los e criar atributos com mais de 300 transformações de dados e análises integradas. Você também pode treinar e implantar modelos com o SageMaker Autopilot e operacionalizar o processo de preparação de dados em uma engenharia de atributos, no treinamento ou nos pipelines de implantação usando a integração ao SageMaker Pipeline do SageMaker Data Wrangler.
O SageMaker Data Wrangler oferece suporte aos Pontos de Acesso Amazon S3 em todas as regiões atualmente com suporte pelo Data Wrangler. Para obter mais informações, acesse a documentação técnica da AWS.