Instâncias P3 do Amazon EC2

Acelere o machine learning e os aplicativos de computação de alta performance com poderosas GPUs

Empresas líderes, como a Airbnb, a Salesforce e a Western Digital, usam as instâncias P3 do Amazon EC2 para impulsionar seu machine learning e aplicativos de computação de alta performance.
As instâncias P3 do Amazon EC2 oferecem a computação de melhor performance na nuvem, são econômicas, oferecem suporte a todas as principais estruturas de machine learning e estão disponíveis globalmente.
Equipadas com até oito GPUs NVIDIA Tesla V100 de última geração, as instâncias P3 do Amazon EC2 fornecem até 1 petaflop de performance de precisão mista por instância para acelerar significativamente o machine learning e os aplicativos de computação de alta performance. Foi comprovado que as instâncias P3 do Amazon EC2 reduzem os tempos de treinamento de machine learning de dias para minutos, além de reduzir o tempo para resultados da computação de alta performance.

ReInvent_HA_P3_EDITORIAL
88% dos projetos do TensorFlow na nuvem são executados na AWS.
Neste relatório, a Nucleus Research revela cinco motivos pelos quais os profissionais de aprendizado profundo preferem a AWS para suas iniciativas nessa área em vez de outros provedores de nuvem.

ASSISTA: saiba mais sobre as instâncias P3 do Amazon EC2 e veja como o Airbnb as utiliza para potencializar seus aplicativos de machine learning (48min8s).
AWS re:Invent 2017: apresentando as instâncias P3 do Amazon EC2

Benefícios

REDUZIR O TEMPO DE TREINAMENTO DE MACHINE LEARNING DE DIAS PARA MINUTOS

Para cientistas de dados, pesquisadores e desenvolvedores que precisam acelerar os aplicativos de ML, as instâncias P3 do Amazon EC2 são as mais poderosas que qualquer computação de GPU disponível na nuvem. As instâncias P3 do Amazon EC2 apresentam até oito GPUs NVIDIA Tesla V100 de última geração e fornecem até 1 petaflop de performance de precisão mista para acelerar significativamente as cargas de trabalho do ML. O treinamento de modelo mais rápido permite que os cientistas de dados e os engenheiros de machine learning façam iterações mais rápidas, treinem mais modelos e aumentem a precisão.

 

A SOLUÇÃO MAIS ECONÔMICA DO SETOR

As instâncias P3 do Amazon EC2 oferecem diferentes planos de definição de preço para oferecer redução de custos dependendo das suas necessidades.  Além das instâncias sob demanda, em que você paga pelas instâncias executadas, é possível comprar instâncias reservadas com um desconto significativo, sempre disponíveis, por um período de vigência de um a três anos. Você também pode usar instâncias spot, que aproveitam instâncias do EC2 não utilizadas e que podem reduzir significativamente os custos do Amazon EC2.

COMPUTAÇÃO DE ALTA PERFORMANCE FLEXÍVEL E EFICIENTE

Ao contrário dos sistemas locais, a execução de computação de alta performance em instâncias P3 do Amazon EC2 oferece capacidade praticamente ilimitada para escalar sua infraestrutura e a flexibilidade para alterar recursos com facilidade e com a mesma frequência que sua carga de trabalho exige. Você pode configurar seus recursos para atender às demandas de seu aplicativo e executar uma HPC de cluster em minutos, pagando apenas pelo que você usa.

INTEGRAÇÃO COM SERVIÇOS DE MACHINE LEARNING DA AWS

As instâncias P3 do Amazon EC2 funcionam perfeitamente com o Amazon SageMaker para fornecer uma plataforma de machine learning completa eficiente e intuitiva. O Amazon SageMaker é uma plataforma de machine learning gerenciada que permite que você construa, treine e implante de forma rápida e fácil modelos de machine learning. Além disso, as instâncias P3 do Amazon EC2 podem ser integradas às imagens de máquina da Amazon (AMIs) do AWS Deep Learning que são pré-instaladas com estruturas populares de aprendizado profundo para facilitar o treinamento e as inferências.

SUPORTE PARA TODAS AS PRINCIPAIS ESTRUTURAS DE MACHINE LEARNING

As instâncias P3 do Amazon EC2 oferecem suporte a todas as principais estruturas de machine learning, incluindo o TensorFlow, PyTorch, Apache MXNet, Caffe, Caffe2, Microsoft Cognitive Toolkit (CNTK), Chainer, Theano, Keras, Gluon e Torch. Os usuários podem escolher a estrutura que funciona melhor para seus aplicativos.

Treinamento escalável de machine learning de vários nós

Os clientes podem usar várias instâncias P3 do EC2 para treinar rapidamente os modelos de machine learning. Um cluster de armazenamento e um cluster de computação podem ser configurados para que o cluster de armazenamento armazene os conjuntos de dados de treinamento e validação e seja responsável por transmitir dados ao cluster de computação, enquanto o cluster de computação realiza as atualizações de encaminhamento, propagação reversa e peso.

Histórias de clientes

200x100_AirBNB_Logo

A Airbnb está usando o machine learning para otimizar recomendações de pesquisa e aprimorar a orientação para a definição de preço dinâmica aos anfitriões. Como resultado, ela aumentou as conversões das reservas. Com as instâncias P3 do Amazon EC2, a Airbnb pode agilizar a execução de cargas de trabalho de treinamento, passar por melhores iterações, criar melhores modelos de machine learning e reduzir custos.

salesforce_logo_200x100

A Salesforce está usando o machine learning para impulsionar o Einstein Vision, permitindo que os desenvolvedores aproveitem o poder do reconhecimento de imagens para casos de uso, como pesquisa visual, detecção de marca e identificação de produto. As instâncias P3 do Amazon EC2 permitem que os desenvolvedores treinem modelos de aprendizado profundo com mais rapidez para que possam atingir rapidamente suas metas de machine learning.

western-digital_200x100

A Western Digital usa a Computação de alta performance (HPC) para executar dezenas de milhares de simulações de ciências de materiais, fluxos de calor, magnetismo e transferência de dados para melhorar a performance e a qualidade das unidades de disco e armazenamento. Com base nos testes iniciais, as instâncias P3 do Amazon EC2 permitem que as equipes de engenharia executem simulações pelo menos três vezes mais rápido do que as soluções implantadas anteriormente.  

schrodinger-200x100

A Schrodinger usa a computação de alta performance (HPC) para desenvolver modelos preditivos a fim de ampliar a escala da descoberta e da otimização e oferecer aos clientes a capacidade de acelerar a disponibilização no mercado de medicamentos que salvam vidas. As instâncias P3 do Amazon EC2 permitem que a Schrodinger realize quatro vezes mais simulações em um dia do que com instâncias P2.  

Instâncias P3 do Amazon EC2 e Amazon SageMaker

A maneira mais rápida de treinar e executar modelos de machine learning

O Amazon SageMaker é um serviço gerenciado para criar, treinar e implantar modelos de machine learning. Quando usado em conjunto com as instâncias P3 do Amazon EC2, os clientes podem facilmente escalar para dezenas, centenas ou milhares de GPUs a fim de treinar um modelo rapidamente em qualquer escala, sem se preocupar com a configuração de clusters e pipelines de dados. Agora você também pode acessar facilmente os recursos do Amazon Virtual Private Cloud (VPC) para fluxos de trabalho de treinamento e hospedagem no Amazon SageMaker. Com esse recurso, você pode usar os buckets do Amazon Simple Storage Service (S3) que só podem ser acessados ​por meio de seu VPC para armazenar dados de treinamento, bem como para armazenar e hospedar os artefatos de modelo derivados do processo de treinamento. Além do S3, os modelos podem acessar todos os outros recursos da AWS contidos no VPC. Saiba mais.

Crie

O Amazon SageMaker facilita a criação e a preparação de modelos de machine learning para treinamento, fornecendo tudo o que você precisa para se conectar com rapidez aos dados de treinamento, além de selecionar e otimizar o melhor algoritmo e a melhor estrutura para o seu aplicativo. O Amazon SageMaker inclui blocos de anotações Jupyter hospedados que facilitam a exploração e visualização dos dados de treinamento armazenados no Amazon S3.  Você também pode usar a instância do bloco de anotações para escrever código para criar trabalhos de treinamento de modelo, implantar modelos no Amazon SageMaker e testar ou validar seus modelos.

Treine

Você pode começar a treinar um modelo com apenas um clique no console ou com uma simples chamada de API. O Amazon SageMaker é pré-configurado com as versões mais recentes do TensorFlow e do Apache MXNet, além de oferecer suporte à biblioteca CUDA9 para proporcionar a performance ideal em GPUs NVIDIA. Além disso, a otimização de hiperparâmetros pode ajustar automaticamente seu modelo ajustando de forma inteligente diferentes combinações de parâmetros do modelo para chegar rapidamente às previsões mais precisas. Para necessidades de escala maiores, você pode escalar para dezenas de instâncias a fim de oferecer suporte à criação de modelo mais rápida.

Implante

Após o treinamento, clique uma vez para implantar seu modelo em instâncias do EC2 de escalabilidade automática em várias zonas de disponibilidade. Uma vez em produção, o Amazon SageMaker gerencia a infraestrutura de computação por você para fazer verificações de integridade, aplicar patches de segurança e realizar manutenções de rotina, tudo com o monitoramento e o registro em logs do Amazon CloudWatch.

 

Instâncias P3 do Amazon EC2 e AMIs do AWS Deep Learning

Ambientes de desenvolvimento pré-configurados para iniciar rapidamente a criação de aplicativos de aprendizado profundo

Uma alternativa ao Amazon SageMaker para desenvolvedores que tenham requisitos mais personalizados, as AMIs do AWS Deep Learning fornecem aos profissionais e pesquisadores de machine learning a infraestrutura e as ferramentas para acelerar o aprendizado profundo na nuvem, em qualquer escala. Você pode executar rapidamente instâncias P3 do Amazon EC2 que já contenham estruturas de aprendizado profundo comuns como TensorFlow, PyTorch, Apache MXNet, Microsoft Cognitive Toolkit, Caffe, Caffe2, Theano, Torch, Chainer, Gluon e Keras para treinar modelos de IA sofisticados e personalizados, experimentar novos algoritmos ou aprender novas habilidades e técnicas. Saiba mais.

Instâncias P3 do Amazon EC2 e computação de alta performance

Resolva problemas computacionais de grande porte e obtenha novos insights usando os recursos avançados de HPC na AWS

As instâncias P3 do Amazon EC2 são uma plataforma ideal para executar simulações de engenharia, finanças computacionais, análise sísmica, modelagem molecular, genômica, renderização e outras cargas de trabalho de computação de GPU. A Computação de alta performance (HPC) permite que cientistas e engenheiros solucionem esses problemas complexos e que fazem uso intensivo de computação. Geralmente, os aplicativos de HPC exigem redes de alta performance, armazenamento rápido, grandes quantidades de memória, recursos muito elevados de computação ou todos esses itens. A AWS permite aumentar a velocidade da pesquisa e reduzir o tempo para a obtenção de resultados executando HPC na nuvem e ajustando a escala para comportar uma quantidade de tarefas em paralelo maior que a que seria possível em ambientes no local. A AWS ajuda a reduzir custos fornecendo soluções otimizadas para aplicativos específicos e sem a necessidade de grandes investimentos de capital. Saiba mais.

Detalhes do produto da instância P3 do Amazon EC2

Tamanho de instância GPUs – Tesla V100 Peer-to-peer de GPUs Memória de GPU (GB) vCPUs Memória (GB) Largura de banda de rede Largura de banda do EBS Preço sob demanda/hora* Instância reservada por 1 ano – por hora* Instância reservada por 3 anos – por hora*
p3.2xlarge 1 N/D 16 8 61 Até 10 Gbps 1,5 Gbps

3,06 USD

1,99 USD

1,23 USD

p3.8xlarge 4 NVLink 64 32 244 10 Gbps 7 Gbps

12,24 USD

7,96 USD

4,93 USD

p3.16xlarge 8 NVLink 128 64 488 25 Gbps 14 Gbps

24,48 USD

15,91 USD

9,87 USD

*Os preços mostrados são para Linux/Unix na região Leste dos EUA (Norte da Virgínia) da AWS. Para obter detalhes de preço completos, consulte a página de definição de preço do Amazon EC2

Os clientes podem adquirir instâncias P3 como instâncias sob demanda, instâncias reservadas, instâncias spot ou hosts dedicados.

FATURAMENTO A CADA SEGUNDO

Uma das muitas vantagens da computação em nuvem é a natureza elástica do provisionamento ou do desprovisionamento de recursos conforme necessário. Ao reduzir o uso do faturamento a cada segundo, habilitamos os clientes a aumentar a elasticidade, economizar dinheiro e permitir que otimizem a alocação de recursos para atingir suas metas de machine learning.

DEFINIÇÃO DE PREÇO DE INSTÂNCIA RESERVADA

As instâncias reservadas proporcionam um desconto significativo (até 75%) em comparação com a definição de preço das instâncias por demanda. Além disso, quando as instâncias reservadas são atribuídas a uma zona de disponibilidade específica, elas disponibilizam uma reserva de capacidade, proporcionando a você uma segurança adicional com relação à sua capacidade de executar instâncias quando for necessário.

DEFINIÇÃO DE PREÇO DO SPOT

Com as instâncias spot, você paga o preço spot em vigor pelo período da execução das instâncias. Os preços de instância spot são definidos pelo Amazon EC2 e são ajustados gradualmente de acordo com tendências de longo prazo da oferta e da demanda de capacidade de instância spot. As instâncias spot estão disponíveis com um desconto de até 90% em comparação à definição de preço das instâncias sob demanda.

A maior disponibilidade global

1856-Updated Map Image-P3 Instances-transparentBG_1024x543

As instâncias P3 do Amazon EC2 estão disponíveis em 14 regiões da AWS para que os clientes tenham a flexibilidade de treinar e implantar modelos de machine learning onde quer que os dados estejam armazenados. A instância P3 do EC2 está disponível nas regiões da AWS Leste dos EUA (Norte da Virgínia), Leste dos EUA (Ohio), Oeste dos EUA (Oregon), Canadá (Central), Europa (Irlanda), Europa (Frankfurt), Europa (Londres), Ásia-Pacífico (Tóquio), Ásia-Pacífico (Seul), Ásia-Pacífico (Sydney), Ásia-Pacífico (Cingapura), China (Beijing), China (Ningxia) e GovCloud (EUA).

Comece a usar as instâncias P3 do Amazon EC2 para machine learning

Para começar a usar em poucos minutos, saiba mais sobre o Amazon SageMaker ou use a AMI do AWS Deep Learning, que contém estruturas comuns de aprendizado profundo pré-instaladas, como Caffe2 e Mxnet. Como alternativa, você também pode usar a AMI NVIDIA com o driver da GPU e o toolkit do CUDA pré-instalados.

Saiba mais sobre o Amazon SageMaker

Clique aqui para saber mais

Saiba mais sobre o aprendizado profundo na AWS

Clique aqui para saber mais

Saiba mais sobre Computação de Alta Performance (HPC)

Clique aqui para saber mais
Pronto para começar?
Cadastrar-se
Mais dúvidas?
Entre em contato conosco