- Machine Learning›
- AWS Trainium›
- Pesquisa do AWS Trainium
Crie no Trainium
Um programa de investimento de 110 milhões de dólares para acelerar a pesquisa e a capacitação em IA com o AWS Trainium
O que é o Build on Trainium?
Cluster de pesquisa do AWS Trainium
Prêmios da Amazon Research
Neuron Kernel Interface
Benefícios
Universidades participantes
Veja como as principais universidades estão se beneficiando do programa Build on Trainium.
Massachusetts Institute of Technology
No Device Realization Lab do MIT, estamos usando o AWS Trainium para ultrapassar os limites da pesquisa médica de IA. Nossos modelos de segmentação de ultrassom 3D e estimativa da velocidade do som treinam com mais rapidez e eficiência do que nunca, reduzindo o tempo experimental em mais da metade e alcançando precisão de última geração. O AWS Trainium nos permitiu escalar nossa pesquisa de maneiras que eram inviáveis com sistemas de GPU tradicionais. Ao treinar nossas redes neurais 3D totalmente convolucionais no AWS Trainium (trn.32xlarge), alcançamos um desempenho de última geração com throughput 50% maior e menor custo em comparação com as instâncias NVIDIA A100. Usando um cluster Trainium de 32 nós, conduzimos mais de 180 experimentos de ablação de forma eficiente, reduzindo o tempo total de treinamento de meses para semanas e acelerando a inovação da IA médica no MIT. No futuro, planejamos usar o Trainium para treinar modelos de agentes de IA que possam operar e automatizar o fluxo de trabalho de ultrassom digital, economizando tempo significativo do médico e oferecendo melhores cuidados aos pacientes. “
Carnegie Mellon University
“O grupo de pesquisa CMU Catalyst trabalha na otimização de sistemas de ML. Nosso projeto visa a facilitar a otimização de diferentes sistemas de ML. O Trainium é único a fornecer controle de baixo nível e uma interface de programação acessível por meio da Neuron Kernel Interface (NKI).
com o apoio da AWS por meio do programa Build on Trainium, nosso pesquisador conseguiu explorar otimizações avançadas em um kernel crítico: o FlashAttention. O que mais nos surpreendeu foi a velocidade com que conseguimos iterar: alcançamos melhorias significativas além do estado da arte anterior em apenas uma semana usando o NKI, o Neuron Profiler e a documentação de arquitetura disponíveis publicamente. A combinação de ferramentas poderosas e insights claros sobre o hardware tornou a otimização sofisticada de baixo nível acessível à nossa equipe.
O AWS Trainium e a Neuron Kernel Interface (NKI) capacitam pesquisadores como nós para inovar mais rapidamente, removendo barreiras que normalmente retardam o trabalho de otimização específico para o hardware. “
Universidade da Califórnia Berkeley
“Por meio do programa Build on Trainium, sua equipe obteve acesso total à nova pilha de compiladores de código aberto NKI da AWS Neuron, incluindo visibilidade direta do ISA e das APIs do Trainium para agendamento preciso e alocação de memória. Esse nível de visibilidade e controle permite que seus alunos analisem com mais facilidade as oportunidades de otimização e descubram implementações de alto desempenho com mais eficiência. “
Christopher Fletcher, professor associado de ciência da computação, University da California, Berkeley
Universidade de Illinios Urbana/Champaign
“O acesso ao AWS Trainium e ao Inferentia tem sido fundamental para o avanço de nossa pesquisa e capacitação em sistemas de IA eficientes e de grande escala. Usamos essas plataformas para treinamento misto de especialistas e otimizações de inferência, prototipando novas técnicas de runtime e agendamento que melhoram a escalabilidade, a eficiência e a portabilidade em arquiteturas de aceleradores emergentes. Ao utilizar a pilha Neuron Developer, os pesquisadores da UIUC estão desenvolvendo novas técnicas de runtime e agendamento que aumentam a eficiência e a portabilidade dos workloads de IA. A equipe está particularmente impressionada com a abertura da pilha Neuron Developer, a qual torna essas plataformas valiosas para pesquisas de runtime e permitem inovações em dispersão, hierarquias de memória e eficiência de comunicação que vão além das arquiteturas tradicionais de GPU. “
University da California, Extensão Los Angeles
“Ao utilizar o AWS Trainium e o programa Build on Trainium, meus alunos e eu conseguimos acelerar significativamente nossas simulações de circuitos quânticos. O projeto reuniu um sólido grupo de estudantes que construíram colaborativamente um simulador de alto desempenho, possibilitando uma experimentação mais profunda e o aprendizado prático em uma escala que simplesmente não era possível antes. “
University of Technology Sydney
“Nossa equipe de pesquisa na UTS está explorando a integração de algoritmos de marca d'água em anéis de árvores desenvolvendo kernels NKI personalizados do Neuron. Ter acesso à pilha Neuron de código aberto por meio do programa Build on Trainium foi transformador. Ele nos dá uma visibilidade sem precedentes da arquitetura Trainium e a capacidade de trabalhar diretamente no nível do hardware. O acesso ao Trainium possibilitou que nossa equipe acelerasse significativamente o workload de marca d'água, reduzindo os ciclos de iteração e permitindo que explorássemos modelos e técnicas mais complexos. Essa profundidade de acesso possibilita que nossos pesquisadores criem novas ideias prototípicas, experimentem otimizações de baixo nível e ultrapassem os limites do que os sistemas de marca d'água podem alcançar nos aceleradores de IA modernos. “