Geral

P: O que é o Amazon SageMaker?

O Amazon SageMaker é um serviço totalmente gerenciado que permite que cientistas de dados e desenvolvedores criem, treinem e implantem de modo rápido e fácil modelos de Machine Learning.

P: O que posso fazer com o Amazon SageMaker?

O Amazon SageMaker permite que os desenvolvedores e cientistas criem modelos de Machine Learning para uso em aplicativos inteligentes e preditivos.

P: Como posso começar a usar o Amazon SageMaker?

Para começar a usar o Amazon SageMaker, faça login no console do Amazon SageMaker, inicie uma instância de notebook com um notebook de exemplo, modifique-o para conexão às fontes de dados, siga o exemplo para criar/treinar/validar modelos e implante o modelo resultante em produção com apenas algumas entradas.

P: Em quais regiões o Amazon SageMaker está disponível?

Para ver uma lista das regiões da AWS em que o Amazon SageMaker está disponível, acesse a tabela de regiões da AWS de toda a infraestrutura global da AWS. Para obter mais informações, consulte as regiões e os endpoints na referência geral da AWS.

P: Posso obter um histórico das chamadas de API do Amazon SageMaker realizadas na minha conta para fins de análise de segurança ou solução de problemas operacionais?  

Sim. Para receber um histórico das chamadas de API do Amazon SageMaker efetuadas na sua conta, basta ativar o AWS CloudTrail no Console de Gerenciamento da AWS. As seguintes chamadas de API no Amazon SageMaker Runtime *não* são gravadas e entregues: InvokeEndpoint.

P: Qual a disponibilidade dos serviços do Amazon SageMaker?

O Amazon SageMaker foi projetado para oferecer alta disponibilidade. Não há janelas de manutenção nem tempos de inatividade programados. As APIs do Amazon SageMaker são executadas nos datacenters comprovados e de alta disponibilidade da Amazon, com replicação da pilha de serviços configurada em três unidades em cada região da AWS para proporcionar tolerância a falhas em caso de falha de servidor ou interrupção de zona de disponibilidade.

P: Quais as medidas de segurança implementadas no Amazon SageMaker?

O Amazon SageMaker garante que os artefatos de modelos de Machine Learning e outros artefatos de sistema sejam criptografados quando em trânsito e quando ociosos. As solicitações para a API e o console do Amazon SageMaker são efetuadas em uma conexão segura (SSL). Você passa funções do AWS Identity and Access Management ao Amazon SageMaker para fornecer permissões para acessar recursos em seu nome para fins de treinamento e implantação. Você pode usar buckets do S3 criptografados para modelar artefatos e datas, bem como passar uma chave do KMS a notebooks, trabalhos de treinamento e endpoints do Amazon SageMaker para criptografar o volume associado de armazenamento de Machine Learning.

P: Como o Amazon SageMaker protege meu código?

O Amazon SageMaker armazena código em volumes de armazenamento de Machine Learning, protegidos por security groups e, opcionalmente, criptografados quando ociosos.

P: Como sou cobrado pelo uso do Amazon SageMaker?

Você paga pelos recursos de computação, armazenamento e processamento de dados de Machine Learning usados para hospedar o notebook, treinar o modelo, executar previsões e registrar as saídas. O Amazon SageMaker permite selecionar o número e o tipo de instâncias usadas para o notebook hospedado, para treinamento e para hospedagem de modelos. O pagamento é feito conforme o uso. Não há taxas mínimas nem compromissos antecipados.

P: E se eu tiver o meu próprio ambiente de notebook, treinamento ou hospedagem?

O Amazon SageMaker oferece um fluxo de trabalho completo e abrangente, mas você pode continuar a usar suas ferramentas atuais com o Amazon SageMaker. É possível transferir facilmente os resultados de cada fase para dentro e para fora do Amazon SageMaker para atender a requisitos de negócios.

Notebooks Jupyter hospedados

P: Quais tipos de notebooks têm suporte?

No momento, os notebooks Jupyter têm suporte.

P: Como persistir arquivos de notebook quando paro a minha área de trabalho?

Você pode persistir arquivos do notebook no volume de armazenamento de Machine Learning associado. O volume de armazenamento de Machine Learning será desassociado quando a instância do notebook for desligada. Quando a instância for reiniciada, o volume será associado novamente. Os itens armazenados na memória não serão persistidos.

P: Como posso aumentar os recursos disponíveis para um notebook?

Você pode modificar a instância do notebook e selecionar um perfil maior por meio do console do Amazon SageMaker após salvar os arquivos e os dados no volume de armazenamento de Machine Learning associado. A instância do notebook será reiniciada com mais recursos disponíveis, com os mesmos arquivos de notebook e bibliotecas instaladas.

P: Como posso treinar um modelo de um notebook do Amazon SageMaker?

Após iniciar um notebook de exemplo, você poderá personalizá-lo de acordo com a fonte de dados e o schema, e executar as APIs da AWS para criar um trabalho de treinamento. O progresso ou a conclusão do trabalho de treinamento estão disponíveis no console do Amazon SageMaker ou por meio das APIs da AWS.

Treinamento de modelos

P: Há limite para o tamanho do conjunto de dados que posso usar para treinamento?

Não há limites fixos para o tamanho do conjunto de dados que pode ser usado para modelos de treinamento com o Amazon SageMaker.

P: Quais fontes de dados posso usar facilmente com o Amazon SageMaker?

Você pode especificar o local dos dados de treinamento no Amazon S3 como parte da criação de um trabalho de treinamento.

P: Quais algoritmos são usados pelo Amazon SageMaker para gerar modelos?

O Amazon SageMaker inclui algoritmos incorporados para regressão linear, regressão logística, agrupamentos k-means, análise de componente principal, máquinas de fatorização, modelagem de tópicos neural, alocação latente de dirichlet, árvores reforçadas com gradiente, sequence2sequence, previsão de séries temporais, word2vec e classificação de imagens. O Amazon SageMaker também disponibiliza contêineres otimizados do Apache MXNet, do Tensorflow, do Chainer e do PyTorch. Além disso, o Amazon SageMaker oferece suporte a algoritmos de treinamento personalizados fornecidos por meio de uma imagem de Docker de acordo com a especificação documentada.

P: O que é o ajuste automático de modelos?

A maioria dos algoritmos de machine learning expõe diversos parâmetros que controlam a operação do algoritmo subjacente. Normalmente, esses parâmetros são mencionados como hiperparâmetros e seus valores afetam a qualidade dos modelos treinados. O ajuste automático de modelos é o processo de encontrar um conjunto de hiperparâmetros de um algoritmo que gera um modelo ideal.

P: Quais modelos podem ser ajustados com o ajuste automático de modelos?

Você pode executar o ajuste automático de modelos no Amazon SageMaker para qualquer algoritmo, desde que cientificamente viável, incluindo algoritmos incorporados do SageMaker, redes neurais profundas ou algoritmos arbitrários a serem incorporados ao Amazon SageMaker na forma de imagens de Docker.

P: Posso usar o ajuste automático de modelos fora do Amazon SageMaker?

Não neste momento. A performance e a experiência do ajuste de modelos são melhores dentro do Amazon SageMaker.

P: Qual é o algoritmo de ajuste subjacente?

No momento, o nosso algoritmo de ajuste de hiperparâmetros é uma implementação personalizada da otimização bayesiana. Essa implementação pretende otimizar uma métrica de objetivo especificada pelo cliente durante todo o processo de ajuste. Especificamente, a implementação verifica a métrica do objeto para trabalhos de treinamento concluídos e usa esse conhecimento para inferir a combinação de hiperparâmetros para o próximo trabalho de treinamento.

P: A AWS recomenda hiperparâmetros específicos para ajuste?

Não. O impacto de determinados hiperparâmetros na performance do modelo depende de vários fatores. É difícil afirmar com certeza se um hiperparâmetro é mais importante que os demais e, portanto, precisa de ajuste. Para algoritmos incorporados ao Amazon SageMaker, informamos se um hiperparâmetro é ajustável.

P: Quanto tempo demora o trabalho de ajuste de um hiperparâmetro?

A duração do trabalho de ajuste de um hiperparâmetro depende de vários fatores, incluindo o tamanho dos dados, o algoritmo subjacente e os valores dos hiperparâmetros. Além disso, os clientes podem escolher o número de trabalhos de treinamento simultâneos e o seu número total. Todas essas escolhas afetam a duração do trabalho de ajuste de hiperparâmetros. 

P: Posso otimizar simultaneamente vários objetivos como, por exemplo, a velocidade e a precisão de um modelo?

Não neste momento. Por enquanto, é necessário especificar uma única métrica de objetivo a ser otimizada, ou alterar o código do algoritmo para emitir uma nova métrica (que é uma média ponderada entre duas ou mais métricas úteis) e fazer o processo de ajuste otimizar considerando essa nova métrica de objetivo.

P: Quanto custa o ajuste automático de modelos?

O trabalho de ajuste de hiperparâmetros não é cobrado. Serão cobrados os trabalhos de treinamento iniciados pelo trabalho de ajuste de hiperparâmetros, de acordo com a definição de preço de treinamento dos modelos.

P: Quanto custa o ajuste automático de modelos?

O trabalho de ajuste de hiperparâmetros não é cobrado. Serão cobrados os trabalhos de treinamento iniciados pelo trabalho de ajuste de hiperparâmetros, de acordo com a definição de preço de treinamento dos modelos.

Implantação de modelo

P: Posso acessar a infraestrutura em que o Amazon SageMaker executado?

Não. O Amazon SageMaker opera a infraestrutura de computação em seu nome, o que permite executar verificações de integridade, aplicar patches de segurança e realizar outras manutenções de rotina. Você também pode implantar os artefatos do modelo do treinamento com código de inferência personalizado no seu próprio ambiente de hospedagem.

P: Como posso escalar o tamanho e a performance de um modelo do Amazon SageMaker após implantá-lo em produção?

A hospedagem do Amazon SageMaker escala automaticamente a performance necessária para o aplicativo usando Application Auto Scaling. Além disso, você pode alterar manualmente o número e o tipo de instâncias sem causar tempo de inatividade por meio da modificação da configuração do endpoint.

P: Como posso monitorar o ambiente de produção do Amazon SageMaker?

O Amazon SageMaker emite métricas de performance para o Amazon CloudWatch Metrics para que você possa rastrear métricas, definir alarmes e reagir automaticamente a mudanças no tráfego de produção. Além disso, o Amazon SageMaker escreve logs para o Amazon Cloudwatch Logs, o que permite monitorar e solucionar problemas do ambiente de produção.

P: Que tipos de modelos podem ser hospedados com o Amazon SageMaker?

O Amazon SageMaker pode hospedar qualquer modelo que siga a especificação documentada para imagens de Docker de inferência. Isso inclui os modelos criados de artefatos de modelo e código de inferência do Amazon SageMaker.

P: A quantas solicitações de API concorrentes em tempo real o Amazon SageMaker consegue oferecer suporte?

O Amazon SageMaker foi criado para escalar para um grande número de transações por segundo. O número preciso varia em função do modelo implantado e do número e do tipo de instâncias nas quais o modelo é implantado.


P: O que é o Batch Transform?

O Batch Transform permite que você execute previsões em dados em lotes grandes ou pequenos. Não há necessidade de dividir o conjunto de dados em diversas partes nem gerenciar endpoints em tempo real. Com uma API simples, você pode solicitar previsões para um grande número de registros de dados e transformar os dados de maneira rápida e fácil.

 

Saiba mais sobre a definição de preço do Amazon SageMaker

Acesse a página de definição de preço
Pronto para começar?
Cadastrar-se
Mais dúvidas?
Entre em contato conosco